Einstellung Zwangsausgleichung

by Micha ⌂, Thursday, September 12, 2019, 07:59 (69 days ago) @ gf

Hallo gf,

Ich habe z.B. ca. 150 Beobachtungen, darin sind 3 Ausreißer enthalten. Mit 0.1% werden diese gerade noch nicht als solche klassifiziert, mit >=1% aber schon.

Ja, da Du mit der Erhöhung auf 1 % die Grenze nach unten verschiebst. Oder anderes ausgedrückt: Von 100 Beobachtungen wirst Du bei 1 % genau eine Beobachtung als Ausreißer einstufen, die kein Ausreißer war (Fehler 1. Art). Ob es also drei Ausreißer waren (oder vielleicht sogar keiner) wirst Du nicht erkennen. Ein kleineres α verringert demnach das Risiko, einen Fehler 1. Art zu machen (fehlerfreie Messungen als falsch einzustufen).

Wenn ich alle drei Ausreißer entferne, dann verbessert sich der Gesamtvarianzfaktor um Faktor 2 (von ca. 1.2 auf ca. 0.6).

Bitte beachte, dass Du dies konsekutiv machen musst. Die Hypothese ist so formuliert, dass es nur eine falsche Beobachtung im Datenbestand gibt. Werden mehrere angezeigt, könnte es sich um eine Verschmierung handeln. In diesem Fall wird empfohlen, nur die Beobachtung mit der größten Teststatistik zu eliminieren. Anschließen die Ausgleichung wiederholen und wiederum nur die größte Teststatistik bewerten (und ggf. eliminieren).

Das sich die Varianz verringert ist naheliegend. Du entfernst Daten, die eine große Verbesserung hatten, wodurch sich ohne diese Messungen natürlich eine kleinere Verbesserungsquadratsumme einstellt. Dies wird mit jeder Reduktion des Datenbestandes passieren, bis irgendwann ein widerspruchsfreies Set an Messungen vorliegt und keine Verbesserungen mehr bestimmbar sind.

Dann war es m.E. doch wert, diese Ausreißer zu entfernen, denn die verbleibenden 147 Beobachtungen passen nun doch wesentlich besser zueinander?

Du kannst abschätzen, ob sich die Eliminierung gelohnt hat. Die Redundanz zeigt an, wie gut eine Beobachtung durch die übrigen kontrolliert wird. Ein r=0,9 bedeutet, dass diese Messung zu 90 % von den übrigen Messungen kontrolliert wird. Gleichzeitig kann man aber auch den Anteil der Beobachtung auf die Schätzung mit der Redundanz ausrechnen, dieser beträgt (1 - r) % = 10 %. Bedeutet also, dass lediglich 10 % der Information, die diese Beobachtung mitbringt, in die finale Lösung einfließt. (Kleines Beispiel: Ein Mittelwert aus 10 Messungen bedeutet, dass jede Messung einen Anteil von 1/10 auf den geschätzten Mittelwert besitzt. Die anderen 9/10 werden durch die anderen Messungen beigesteuert.)

Der Anteil, den die Beobachtung auf die Schätzung hat, kann auf den möglichen groben Fehler übertragen werden. In JAG3D wird diese Störgröße als (Nabla) ausgegeben. Nehmen wir an, ∇ = 10 mm und r = 0,9, dann geht diese vermutete Störgröße auch nur zu (1 - r) 100 % = 10 % in den Schätzwerten auf, hier also 1 mm. In JAG3D wird dieser Wert als EP (Einfluss auf die Punktlage) bezeichnet. Bitte beachte, dass die Formeln dort etwas komplexer sind, da die o.g. Rechnung nur gilt, wenn die Beobachtungen keine Zusatzunbekannten haben. Für Richtungsmessungen muss bspw. die Orientierung noch berücksichtigt werden.

Du könntest so also überschlagen, ob sich das Eliminieren tatsächlich gelohnt hat oder ob es eher einen akademischen Wert besitzt.

Die Ellipsen möchte ich aber dennoch gerne aus den verbleibenden 147 Beobachtungen nicht für 1%, sondern für 0.1% Irrtumswahrscheinlichkeit berechnen

Dies bedeutet, bei der Punktlage würdest Du extremere Ausprägungen akzeptieren als bei Deinen Messungen? Ich stelle mir eine Deformationsanalyse vor. Sowohl eine Höhenmessung (Nivellement) als auch ein Höhenpunkt besitzen die selbe Varianz und das selbe . Die Messung würdest Du also verwerfen mit 1 %, die Deformation aber mit 0,1 % akzeptieren.

Um Deinen Wunsch aber zu entsprechen, müsstest Du tatsächlich noch eine zusätzliche Auswertung ganz am Ende machen. In der ersten Analyse bewertest Du dann ausschließlich die Beobachtungen mit einem gewünschten α = 1 %. Anschließend müsstest Du das α = 0,1 % neu festlegen, damit Du für die Koordinaten die gewünschten Intervalle erhältst. Bitte beachte, dass Du hierfür auf eine Abstimmung der Teststatistiken verzichten musst, da sonst das abgestimmte α verwendet wird, welches Du bei den globalen Ergebnissen siehst.

Viele Grüße
Micha

--
applied-geodesy.org - OpenSource Least-Squares Adjustment Software for Geodetic Sciences


Complete thread:

 RSS Feed of thread