Estymacja przedziałowa i weryfikacja hipotez
Artur Wilkowski
27 maja 2014
Jak określać macierze kowariancji pomiarów i kofaktorów?
Jak określać macierze kowariancji pomiarów i
kofaktorów?
A. Wilkowski
Jak określać macierze kowariancji pomiarów i kofaktorów?
Do realizacji wyrównania (estymacji średniej) musimy znać
stosunki między wariancjami obserwacji, znajomość samych
wariancji nie jest konieczna. Stosunki są zakodowane w macierzy
kofaktorów:
Q
x
ob
=
q
1
0
· · ·
0
0
q
2
· · ·
0
· · ·
· · ·
· · ·
· · ·
0
0
· · ·
q
n
A faktyczna macierz kowariancji pomiarów jest przeskalowaną
macierzą kofaktorów. W praktyce kofaktory są najlepszym
dostępnym przybliżeniem wariancji poszczególnych pomiarów.
C
x
ob
=
σ
2
1
0
· · ·
0
0
σ
2
2
· · ·
0
· · ·
· · ·
· · ·
· · ·
0
0
· · ·
σ
2
n
= σ
2
0
Q
x
ob
gdzie σ
2
0
- jest współczynnikiem wariancji
A. Wilkowski
Jak określać macierze kowariancji pomiarów i kofaktorów?
Dostępne są dwie drogi:
I
Znamy tylko stosunki między wariancjami pomiarów
(kofaktory). Możemy estymować współczynnik wariancji
m
0
= ˆ
σ
0
, w celu określenia macierzy kowariancji pomiaru
a-posteriori. Jest to tzw. model Gaussa-Markova.
II
Znamy (np. na podstawie danych producenta instrumentu)
wariancje pomiarów, wtedy najczęściej przyjmujemy σ
0
= 1 i
macierz kowariancję zapisujemy jako:
C
x
ob
=
σ
2
1
0
· · ·
0
0
σ
2
2
· · ·
0
· · ·
· · ·
· · ·
· · ·
0
0
· · ·
σ
2
n
Jest to tzw. model Helmerta. W tym wypadku również
możemy estymować współczynnik wariancji m
0
= ˆ
σ
0
- w celu
wykrycia błędów grubych przez porównanie go z zakładanym
σ
0
= 1
A. Wilkowski
Rozkład estymatora wartości oczekiwanej obserwacji
Rozkład estymatora wartości oczekiwanej obserwacji
A. Wilkowski
Rozkład estymatora wartości oczekiwanej obserwacji
Punktowym estymatorem wartości oczekiwanej obserwacji w
modelu pomiarowym jest
ˆ
x = ˆ
E(x
ob
) = A ˆ
X + w
wyrażony jako funkcja estymatora wektora parametrów
ˆ
X = −(A
T
P A)
−1
A
T
P L
Macierz kowariancji estymatora wartości oczekiwanej
poszczególnych obserwacji (czyli wyrównanych wartości obserwacji)
ma postać:
1
Dla modelu Helmerta (znane wariancje obserwacji)
C
ˆ
x
= σ
2
0
A(A
T
P A)
−1
A
T
2
Dla modelu Gaussa-Markowa (estymowane wariancje
obserwacji)
ˆ
C
ˆ
x
= m
2
0
A(A
T
P A)
−1
A
T
i m
0
= ˆ
σ
0
. W tym przypadku faktycznie obliczamy estymator
macierzy kowariancji.
A. Wilkowski
Rozkład estymatora wartości oczekiwanej obserwacji
Tzw. błąd średni obserwacji obliczamy biorąc pierwiastek
elementu na przekątnej estymatora macierzy kowariancji.
m
ˆ
x
i
= m
0
q
[A(A
T
P A)
−1
A
T
]
ii
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Helmerta
Estymacja przedziałowa wartości oczekiwanej -
model Helmerta
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Helmerta
Rozpatrzmy model n pomiarów tej samej wartości oraz model
Helmerta (znane wariancje obserwacji) . Wariancja estymatora
wartości przeciętnej ma postać ogólną:
σ
2
ˆ
x
=
σ
2
0
P
n
i=1
p
i
Pamiętajmy, że przyjęliśmy σ
0
= 1 oraz p
i
=
1
σ
2
i
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Helmerta
Szczególne przypadki tego rozwiązania:
n niezależnych pomiarów pojedynczej wielkości, każdy pomiar
ma identyczną wariancję σ
2
Wartość przeciętna estymatora wartości oczekiwanej
ˆ
x =
1
n
P
n
i=1
x
ob
i
Wariancja estymatora σ
2
ˆ
x
=
σ
2
n
n niezależnych pomiarów pojedynczej wielkości, pomiary mają
różne wariancje
ˆ
x =
P
n
i=1
p
i
x
ob
i
P
n
i=1
p
i
σ
2
ˆ
x
=
1
P
n
i=1
p
i
=
1
P
n
i=1
1
σ2
i
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Helmerta
Załóżmy, że obserwacje mają rozkład łączny normalny. Wtedy
estymator wartości oczekiwanej ma rozkład normalny
ˆ
x ∼ N (x, σ
ˆ
x
)
Stąd standaryzowana zmienna losowa T
T =
ˆ
x − x
σ
ˆ
x
∼ N (0, 1)
Znajdujemy takie t, że
P (−t ¬ T ¬ t) = 1 − α
Czyli Φ(t) − Φ(−t) = 1 − α, czyli Φ(t) = 1 −
α
2
. I mamy
P (ˆ
x − σ
ˆ
x
t ¬ x ¬ ˆ
x + σ
ˆ
x
t) = 1 − α
Czyli z prawdopodobieństwem 1 − α wartość prawdziwa naszej
obserwacji znajdzie się w przedziale [ˆ
x − σ
ˆ
x
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Helmerta
Przykład. Załóżmy że α = 0.05. Wtedy
Φ(t) = 1 −
α
2
= 1 − 0.025 = 0.975
Zatem t = 1.95996 oraz z prawdopodobieństwem równym 0.95
wartość dokładna znajdzie się w przedziale
[ˆ
x − σ
ˆ
x
· 1.95996 ¬ x ¬ ˆ
x + σ
ˆ
x
· 1.95996]
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Gaussa-Markowa
Estymacja przedziałowa wartości oczekiwanej -
model Gaussa-Markowa
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Gaussa-Markowa
Rozpatrzmy model n pomiarów tej samej wartości oraz model
Gaussa-Markowa(nieznane a-priori wariancje obserwacji).
Wariancja estymatora wartości przeciętnej ma postać ogólną:
ˆ
σ
2
ˆ
x
=
ˆ
σ
2
0
P
n
i=1
p
i
=
m
2
0
P
n
i=1
p
i
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Gaussa-Markowa
Przypadki szczególne tego rozwiązania
1
n niezależnych pomiarów pojedynczej wielkości, każdy pomiar
ma identyczną wariancję
ˆ
x =
1
n
P
n
i=1
x
ob
i
ˆ
σ
2
=
1
n−1
P
n
i=1
ˆ
v
2
i
ˆ
σ
2
ˆ
x
=
ˆ
σ
2
n
2
n niezależnych pomiarów pojedynczej wielkości, pomiary mają
różne wariancje
ˆ
x =
P
n
i=1
p
i
x
ob
i
P
n
i=1
p
i
ˆ
σ
0
2
=
1
n−1
ˆ
V P ˆ
V
T
=
1
n−1
P
n
i=1
p
i
ˆ
v
2
i
ˆ
σ
2
ˆ
x
=
ˆ
σ
2
0
P
n
i=1
p
i
Przypomnijmy - poprawka jest określona jako ˆ
v
i
= ˆ
x − x
ob
i
.
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Gaussa-Markowa
Estymator standaryzowanej zmiennej T =
ˆ
x−x
ˆ
σ
ˆ
x
ma rozkład
t-Studenta o n − 1 stopniach swobody. Znajdujemy takie t, że
P (−t ¬ T
n−1
¬ t) = 1 − α
Czyli F
n−1
(t) − F
n−1
(−t) = 1 − α, czyli F
n−1
(t) = 1 −
α
2
, gdzie
F
n−1
jest dystrybuantą rozkładu Studenta o n − 1 stopniach
swobody. I mamy
P (ˆ
x − ˆ
σ
ˆ
x
t ¬ x ¬ ˆ
x + ˆ
σ
ˆ
x
) = 1 − α
Czyli z prawdopodobieństwem 1 − α wartość prawdziwa naszej
obserwacji znajdzie się w przedziale [ˆ
x − ˆ
σ
ˆ
x
t ¬ x ¬ ˆ
x + ˆ
σ
ˆ
x
t]
A. Wilkowski
Estymacja przedziałowa wartości oczekiwanej - model
Gaussa-Markowa
Przykład. Załóżmy że α = 0.05 oraz wykonaliśmy 5 pomiarów
(czyli n − 1 = 4). Wtedy
F
4
(t) = 1 −
α
2
= 1 − 0.025 = 0.975
Zatem t = 2.7764 oraz z prawdopodobieństwem równym 0.95
wartość dokładna znajdzie się w przedziale
[ˆ
x − σ
ˆ
x
· 2.7764 ¬ x ¬ ˆ
x + σ
ˆ
x
· 2.7764]
A. Wilkowski
Rozkład estymatora współczynnika wariancji
Rozkład estymatora współczynnika wariancji
A. Wilkowski
Rozkład estymatora współczynnika wariancji
Zakładamy, że wektor pomiaru x
ob
ma łączny rozkład normalny w
postaci
x
ob
∼ N (x = E(x
ob
), C
x
ob
= σ
0
P
−1
)
Przypomnijmy - estymator współczynnika wariancji (nieobciążony,
niezmienniczy i najefektywniejszy), wyraża się jako
ˆ
σ
2
0
= m
2
0
=
1
n − r
ˆ
V
T
P V
Natomiast wyrażenie
ˆ
V
T
P ˆ
V
σ
2
0
=
(n−r)ˆ
σ
2
0
σ
2
0
jest zmienną losową o
rozkładzie chi-kwadrat i n − r stopniach swobody.
(n − r)ˆ
σ
2
0
σ
2
0
∼ χ
2
n−r
A. Wilkowski
Estymacja przedziałowa współczynnika wariancji - model
Gaussa-Markowa
Estymacja przedziałowa współczynnika wariancji -
model Gaussa-Markowa
A. Wilkowski
Estymacja przedziałowa współczynnika wariancji - model
Gaussa-Markowa
W przypadku modelu Gaussa-Markowa nie mamy wiedzy a-priori
dotyczącej wartości współczynnika wariancji. Jego wartość jest
określana wyłącznie na podstawie obserwacji.
T =
(n − r)ˆ
σ
2
0
σ
2
0
∼ χ
2
n−r
Znajdujemy takie wartość χ
2
1
oraz χ
2
2
, że
P (χ
2
1
¬ T ¬ χ
2
2
) = 1 − α
Czyli F
χ
2
n−r
(χ
2
2
) − F
χ
2
n−r
(χ
2
1
) = 1 − α. Przyjmujemy arbitralnie
takie χ
2
1
i χ
2
2
, że F
χ
2
n−r
(χ
2
2
) = 1 −
α
2
oraz F
χ
2
n−r
(χ
2
1
) =
α
2
i mamy
P
χ
2
1
¬
(n − r)ˆ
σ
2
0
σ
2
0
¬ χ
2
2
!
= 1 − α
A. Wilkowski
Estymacja przedziałowa współczynnika wariancji - model
Gaussa-Markowa
Przekształcając mamy
P
(n − r)ˆ
σ
2
0
χ
2
2
¬ σ
2
0
¬
(n − r)ˆ
σ
2
0
χ
2
1
!
= 1 − α
Zatem z prawdopodobieństwem 1 − α ”prawdziwa” wartość
współczynnika wariancji znajdzie się w (dwustronnym) przedziale
ufności
h
(n−r)ˆ
σ
2
0
χ
2
2
,
(n−r)ˆ
σ
2
0
χ
2
1
i
.
A. Wilkowski
Estymacja przedziałowa współczynnika wariancji - model
Gaussa-Markowa
Przykład. Załóżmy, że α = 0.05 oraz wykonaliśmy 4 pomiary
nadmiarowe. Wtedy
F
χ
2
4
(χ
2
2
) = 1 −
α
2
= 0.975
F
χ
2
4
(χ
2
1
) =
α
2
= 0.025
(
χ
2
2
= 11.1433
χ
2
1
= 0.4844
Zatem χ
2
= 0.7107. Zatem z prawdopodobieństwem 0.95
”prawdziwy” współczynnik wariancji σ
2
0
znajdzie się w przedziale
h
4ˆ
σ
2
0
11.1433
,
4ˆ
σ
2
0
0.4844
i
.
A. Wilkowski
Weryfikacja współczynnika wariancji - model Helmerta
(test globalny
Weryfikacja współczynnika wariancji - model
Helmerta (test globalny)
A. Wilkowski
Weryfikacja współczynnika wariancji - model Helmerta
(test globalny
W modelu Helmerta zakładamy, że znane są wariancje obserwacji
a-priori. Przyjmujemy σ
0
= 1. Porównujemy wsp. wariancji a-priori
(σ
2
0
) i a-posteriori (ˆ
σ
2
0
).
T =
(n − r)ˆ
σ
2
0
σ
2
0
∼ χ
2
n−r
Korzystając z założenia σ
0
= 1
T = (n − r)ˆ
σ
2
0
∼ χ
2
n−r
Znajdujemy taką wartość χ
2
, że
P (T ¬ χ
2
) = 1 − α
Czyli F
χ
2
n−r
(χ
2
) = 1 − α,
A. Wilkowski
Weryfikacja estymacji współczynnika wariancji - model
Helmerta (test globalny)
Zatem zachodzi
P ((n − r)ˆ
σ
2
0
> χ
2
) = α
lub zamiennie
P ( ˆ
V
T
P ˆ
V > χ
2
) = α
Zatem, jeżeli stwierdzimy, że obliczona wartość ˆ
σ
0
spełnia warunek
(n − r)ˆ
σ
2
0
> χ
2
(ew. po prostu ˆ
V
T
P ˆ
V > χ
2
), dla małego α,
możemy podejrzewać błąd gruby obserwacji.
A. Wilkowski
Weryfikacja estymacji współczynnika wariancji - model
Helmerta (test globalny)
Przykład. Załóżmy że α = 0.05 oraz wykonaliśmy 4 pomiary
nadmiarowe (czyli n − r = 4). Wtedy
F
χ
2
4
(χ
2
) = 1 − α = 1 − 0.5 = 0.95
Zatem χ
2
= 9.4877. Teraz jeżeli spełniona jest zależność
4ˆ
σ
2
0
> 9.4877
możemy oczekiwać błędu modelu lub błędu grubego obserwacji.
A. Wilkowski
Rozkład prawdopodobieństwa estymatorów poprawek
Rozkład prawdopodobieństwa estymatorów
poprawek
A. Wilkowski
Rozkład prawdopodobieństwa estymatorów poprawek
Estymatory poprawek ˆ
V mają rozkład o wartości przeciętnej
E( ˆ
V) = 0
oraz macierzy kowariancji
Dla modelu Helmerta
C
ˆ
V
= σ
2
0
(P
−1
− A(A
T
P A)
−1
A
T
)
Dla modelu Gaussa-Markowa
ˆ
C
ˆ
V
= m
2
0
(P
−1
− A(A
T
P A)
−1
A
T
)
A. Wilkowski
Rozkład prawdopodobieństwa estymatorów poprawek
Wariancję pojedynczej poprawki (estymatora poprawki) można
odczytać z przekątnej macierzy kowariancji
Dla modelu Helmerta
σ
2
ˆ
v
i
=
C
ˆ
V
ii
Dla modelu Gaussa-Markowa
ˆ
σ
2
ˆ
v
i
=
h
ˆ
C
ˆ
V
i
ii
W przypadku, gdy mamy n obserwacji tej samej wartości x,
wariancję estymatora poprawki obliczamy
Dla modelu Helmerta σ
2
ˆ
v
i
= σ
2
0
1
p
i
−
1
P
n
i=1
p
i
Dla modelu Gaussa-Markowa ˆ
σ
2
ˆ
v
i
= m
2
0
1
p
i
−
1
P
n
i=1
p
i
A. Wilkowski
Test szczegółowy Baarda’y
Test szczegółowy Baarda’y
A. Wilkowski
Test szczegółowy Baarda’y
Znajomość wariancji estymatorów poszczególnych poprawek
umożliwia skonfrontowanie wyników pomiarów z naszym modelem,
odbywa się to przez sprawdzenie czy niektóre poprawki nie są ”za
duże” tzn. czy obserwowana wartość nie jest ”zbyt odległa” od
wartości estymowanej. Założenia:
Obserwacje są niezależne i mają rozkłady normalne
Zatem można zaniedbać wyrazy ”poza przekątną” macierzy
C
ˆ
V
oraz ˆ
C
ˆ
V
(kowariancje)
A. Wilkowski
Test szczegółowy Baarda’y - model Helmerta
Estymator poprawki (poprawka) ma rozkład
ˆ
v
i
= ˆ
x
i
− x
ob
i
∼ N (0, σ
ˆ
v
i
)
Szukamy obszaru, w którym estymator ˆ
v
i
powinien znaleźć się z
dużym prawdopodobieństwem (1 − α). Stąd standaryzowana
zmienna losowa T
T =
ˆ
v
i
σ
ˆ
v
i
∼ N (0, 1)
Znajdujemy takie t, że
P (−t ¬ T ¬ t) = P (|T | ¬ t) = 1 − α
Czyli Φ(t) − Φ(−t) = 1 − α, czyli Φ(t) = 1 −
α
2
. Mamy z kolei
P (|T | > t) = P
ˆ
v
i
σ
ˆ
v
i
> t
= α
Zajście zdarzenia, że zmienna losowa | ˆ
v
i
| przekroczy wartość tσ
ˆ
v
i
jest mało prawdopodobne (p = α) i wskazuje na możliwość
popełniania błędu grubego w danej obserwacji.
A. Wilkowski
Test szczegółowy Baarda’y - model Helmerta
Przykład. Przyjmijmy poziom ufności α = 0.05. Wtedy
Φ(t) = 1 −
α
2
= 1 − 0.025 = 0.975
Zatem t = 1.95996 oraz z prawdopodobieństwem równym 0.95
estymator poprawki ˆ
v
i
powinien spełniać warunek
|ˆ
v
i
| ¬ 1.95996 · σ
ˆ
v
i
Niespełnienie warunku występuje jedynie 5% przypadków i może
wskazywać na obecność błędu grubego obserwacji.
A. Wilkowski
Test szczegółowy Baarda’y - model Gaussa-Markowa
W modelu Gaussa-Markowa test Baarda’y wygląda identycznie z
dwoma wyjątkami:
Zamiast znanej a-priori wariancji estymatora σ
ˆ
v
i
używamy
estymatora tej wariancji ˆ
σ
ˆ
v
i
W związku z tym, że używamy estymatora wariancji w
przypadku małych prób dla zmiennej T powinniśmy przyjąć
rozkład t-Studenta o n − r stopniach swobody.
A. Wilkowski
[1] P. Grzegorzewski, K. Bobecka, A. Dembińska, J. Pusz.
Rachunek Prawdopodobieństwa i Statystyka.
Wyższa Szkoła Informatyki Stosowanej i Zarządzania, 2001.
[2] J. Jakubowski, R. Sztencel.
Rachunek prawdopodobieństwa dla (prawie) każdego.
SCRIPT, 2002.
[3] Zbigniew Wiśniewski.
Rachunek Wyrównawczy w Geodezji (z przykładami).
Wydawnictwo Uniwersytetu Warmińsko-Mazurskiego w
Olsztynie, 2009.
A. Wilkowski