Tikhonenko O Wykłady ze statystyki matematycznej Wykład 5

5. ESTYMACJA PRZEDZIAAOWA
Niech jak zwykle dana jest próbka x =� (x1, ..., xn ) z rozkładu Pq� , dla którego pa-
rametr q��Q� �� R jest nieznany. Do tej pory zajmowaliśmy estymacją punktową pa-
rametru nieznanego q� , tj. wyznaczeniem liczby (estymatora), która w pewnym sensie
może zastąpić prawdziwą wartość parametru.
Istnieje inne podejście do estymacji, przy którym wyznacza się przedział pokry-
wający parametr z danym z góry prawdopodobieństwem. Wskazane podejście nazy-
wa się estymacją przedziałową. Zauważmy najpierw, że im większa jest pewność te-
go, iż znaleziony przedział pokrywa wartość prawdziwą parametru, tym większa jest
długość tego przedziału. Więc marzenia o znalezieniu przedziału pokrywającego pa-
rametr z prawdopodobieństwem 1 nigdy nie będą spełnione. Mianowicie, tylko ob-
szar Q� pokrywa z prawdopodobieństwem 1 wartość prawdziwą parametru q� .
Definicja 1. Niech 0 <� e� <�1. Przedział (q�-�; q�+� ) =� (q�-� (x, e�); q�+� (x, e�)) nazywa się
przedziałem ufności dla parametru q� z poziomem ufności (na poziomie ufności) 1-� e� ,
gdy dla dowolnego q��Q� mamy
Pq�{q�-� <� q� <� q�+�}ł�1 -� e�.
Definicja 2. Niech 0 <� e� <�1. Przedział (q�-�; q�+� ) =� (q�-� (x, e�); q�+� (x, e�)) nazywa się
asymptotycznym przedziałem ufności dla parametru q� z (asymptotycznym) poziomem
ufności 1-� e� , gdy dla dowolnego q��Q� mamy
lim inf Pq�{q�-� <� q� <� q�+�} ł� 1 -� e� .
n��Ą�
W definicji 2 w rzeczywistości chodzi oczywiście nie o jeden przedział, lecz o
ciąg przedziałów zależnych od liczności próbki n.
Uwaga 1. Granicy przedziału (q�-�; q�+� ) są losowe. Dlatego o prawdopodobień-
stwie Pq�{q�-� <� q� <� q�+�} mówimy, iż jest to prawdopodobieństwo że przedział
(q�-�; q�+� ) pokrywa parametr q� , lecz nie prawdopodobieństwo że q� leży w tym prze-
dziale.
Uwaga 2. Znak ł� w definicjach 1 i 2 odpowiada zwykle rozkładom dyskret-
nym, bowiem w przypadku tym równość nie zawsze jest możliwa: np. dla ZL x� ma-
49
jącej rozkład Bernoulliego B1 2 przy dowolnym x spełnienie równości
P{x� <� x} =� 0,25 nie jest możliwe, natomiast nierówność P{x� <� x} ł� 0,25 ma sens dla
x >� 0.
Jeżeli prawdopodobieństwo tego, że przedział ufności pokrywa parametr, jest
dokładnie równe 1-� e� (dąży do 1-� e� ), to przedział nazywa się dokładnym (asympto-
tycznie dokładnym) przedziałem ufności z poziomem ufności 1-� e� .
Przed tym jak systematycznie zajmować się budową dokładnych oraz asympto-
tycznie dokładnych przedziałów ufności (PU), przeanalizujemy trzy przykłady, w
których zbadamy podobne sposoby estymacji. Pózniej postaramy się uzyskać z tych
przykładów pewną ogólną filozofię budowy dokładnych oraz asymptotycznie do-
kładnych przedziałów ufności. Zaczniemy od najczęściej stosowanego w praktyce
rozkładu normalnego.
Przykład 1. Niech x1, ..., xn będzie próbką o liczności n z rozkładu normalnego
N , gdzie a��R jest parametrem nieznanym, natomiast parametr s� >� 0 jest zna-
a, s�2
ny. Należy zbudować PU dla parametru a na poziomie ufności 1-� e� .
Zauważmy, że rozkład normalny jest stabilny względem sumowania (patrz ra-
chunek prawdopodobieństwa), czyli zachodzi następująca własność.
Własność 1. Niech ZL x�1 ma rozkład normalny N , ZL x�2 ma rozkład
2
a1, s�1
normalny N i ZL te są niezależne. Wówczas ZL h� =� bx�1 +� cx�2 +� d ma rozkład
a2 , s�2
2
2
normalny z parametrami Eh� =� ba1 +� ca2 +� d , Dh� =� b2s�1 +� c2s�2 .
2
Mamy stąd, że
n
,
��x ma rozkład N
i
na, ns�2
i=�1
n
��x -� na ma rozkład N0, ns�2 ,
i
i =�1
n
��x -� na
i
i =�1
ma rozkład N0,1.
ns�
x -� a
Wynika stąd, że ZL h� =� n spełnia rozkład normalny standaryzowany. Za-
s�
kładając, że dana jest liczba e��(0;1) , znajdziemy taką liczbę c >� 0, że
P{-�c <� h� <� c} =�1-� e� . Liczba c jest kwantylem rzędu 1 -� e� 2 rozkładu normalnego
standaryzowanego:
50
P{-�c <� h� <� c} =� F�0,1(c) -� F�0,1(-�c) =� F�0,1(c) -� (1 -� F�0,1(c)) =� 2F�0,1(c) -�1 =�1 -� e�,
czyli F�0,1(c) =� 1 -� e� 2 .
Definicja 3. Niech rozkład P o dystrybuancie F jest absolutnie ciągły. Liczba t�d�
nazywa się kwantylem rzędu d� rozkładu P , gdy F(t�d� ) =� d� . Jeżeli funkcja F jest ostro
monotoniczna, to kwantyl określa się jednoznacznie.
!/2 !/2
!/2 !/2
-3 -2 -1 0 1 2 3
Rys. 5.1
Wówczas c =� t�1-�e� 2 , czyli -� c =� t�e� 2 (kwantyle rozkładu normalnego standary-
zowanego).
Rozwiązując nierówność -�c <� h� <� c względem a, otrzymujemy dokładny prze-
dział ufności
��
x -� a cs� cs�
��
1 -� e� =� Pa{-�c <� h� <� c} =� Pa ��-� c <� n <� cż� =� Pa �� -� <� a <� x +� . (5.1)
��x ż�
s�
n n
��
��
Możemy tu podstawić c =� t�1-�e� 2 :
t�1-�e� 2s� t�1-�e� 2s�
��
Pa ��x -� <� a <� x +� =� 1 -� e� .
ż�
n n
��
Ostatecznie szukany przedział ufności na poziomie ufności 1-� e� ma postać
t�1-�e� 2s� t�1-�e� 2s�
ć� ��
��
x -� ; x +� .
��
n n
Ł� ł�
Przykład 2. Niech x1, ..., xn będzie próbką o liczności n z rozkładu wykładni-
czego Ea� , gdzie a� >� 0 . Należy zbudować asymptotycznie dokładny PU dla parame-
tru a� na poziomie ufności 1-� e� .
Wspominamy CTG:
51
n
��x -� nEa� x1
i
x -� 1 a�
i =�1
=� n =� n(a�x -�1) �� h�,
1 a�
nDa� x1
gdzie ZL h� ma rozkład normalny standaryzowany. Według definicji słabej zbieżno-
ści przy n �� Ą� mamy
Pa�{�-� c <� n(a�x -� 1) <� c}�� Pa�{-�c <� h� <� c} =�1 -� e� , gdy c =� t�1-�e� 2 .
Tj.
t�1-�e� 2 t�1-�e� 2
��
1 1
Pa�{�-� t�1-�e� 2 <� n(a�x -�1) <� t�1-�e� 2}�=� Pa� �� -� <� a� <� +� ��1 -� e� ,
ż�
x n x x n x
��
gdy n �� Ą� .
Ostatecznie asymptotycznie dokładny PU na poziomie ufności 1-� e� ma postać
t�1-�e� 2 1 t�1-�e� 2
ć� ��
1
��
-� ; +� .
��
x x n x x n
Ł� ł�
Przykład 3. Niech x1, ..., xn będzie próbką o liczności n z rozkładu Bernoulliego
B . Wiemy, że estymatorem nieobciążonym, zgodnym i efektywnym parametru p
p
m�
~
jest częstość względna p =� (patrz przykład 3 z rozdziału 4). Należy zbudować
n
asymptotycznie dokładny PU dla parametru p na poziomie ufności 1-� e� . Z twierdze-
nia Moivre a Laplace a (patrz rachunek prawdopodobieństwa) wynika następująca
równość przybliżona dla dużych n:
ć� �� ć� ��
�� m� �� n n
~
��
Pp{| p -� p |<� d�} =� Pp �� -� p <� d�ż� � F�0,1��d� -� F�0,1��-� d� =�
��
n pq pq
��
Ł� ł� Ł� ł�
ć� ��
n
��
=� 2F�0,1��d� -�1,
��
pq
Ł� ł�
x
2
1 pq
gdzie F�0,1(x) =�
��e-�t 2dt , q =�1-� p . Wprowadzmy oznaczenie d� =� t .
2p� n
-�Ą�
Wówczas mamy
��
pq
Pp ��| ~ -� p |<� t � 2F�0,1(t) -� 1.
p
ż�
n
��
Nierówność w nawiasie klamrowym jest równoważna nierówności
ć� �� ć�
t2 ��
~
��1 +� t2 ��
p2 -� 2�� ~ +� p +� p2 Ł� 0 ,
p
��
n 2n
Ł� ł� Ł� ł�
którego rozwiązanie względem p ma postać
52
2
~) ć� ��2
t2 ~(1-� ~) t t2 ~(1 -� p t
p p p
ć� ��
~ ~
p +� -� t +� p +� +� t +�
��
2n n 2n 2n n 2n
Ł� ł� Ł� ł�
Ł� p Ł� .
t2 t2
1 +� 1 +�
n n
Korzystając z tablicy dystrybuanty F�0, 1(x) rozkładu normalnego standaryzowa-
nego znajdujemy rozwiązanie t�1-�e� 2 względem t równania 2F�0,1(t) -�1 =�1 -� e�, czyli
e�
F�0, 1(t) =�1-� . Wówczas szukany asymptotycznie dokładny przedział ufności ma
2
postać
ć�
~(1-� ~) ć� t�1-�e� 2 ��2 ~(1-� ~) ć� t�1-�e� 2 ��2 ��
t�1-�e� 22 t�1-�e� 22
�� p p p p ��
~ ~
��
p +� -� t�1-�e� 2 +� p +� +� t�1-�e� 2 +�
��
��
2n n 2n 2n n 2n
Ł� ł� Ł� ł�
��
;
�� .
t�1-�e� 22 t�1-�e� 22
��
1+� 1+�
��
n n
Ł� ł�
t�1-�e� 22 t�1-�e� 2 2
ć� ��
��
Dla dużych n można tu zrezygnować ze składników , . Wówczas
��
n 2n
Ł� ł�
przedział ufności przyjmuje postać
~(1-� ~) ~(1 -� ~) ��
ć�
p p p p
~ ~
��
p -� t�1-�e� 2 ; p +� t�1-�e� 2 .
��
n n
Ł� ł�
Sformułujemy ogólną zasadę budowy dokładnych PU:
1. Znalezć funkcję G(x, q�) , której rozkład P nie zależy od parametru q� .
Jest konieczne, by G(x, q�) miała funkcję odwrotną względem q� dla do-
wolnego ustalonego x.
2. Wyznaczyć liczby g1 i g2 , które są kwantylami rozkładu P , tj.
1 -� e� =� Pq�{g1 <� G(x, q�) <� g2}.
3. Rozwiązując nierówność g1 <� G(x, q�) <� g2 względem q� wyznaczyć do-
kładny PU.
Analogicznie wygląda zasada ogólna budowy asymptotycznie dokładnych PU:
1. Znalezć funkcję G(x, q�) słabo zbieżną do rozkładu P nie zależnego od
parametru q� . Jest konieczne, by G(x, q�) miała funkcję odwrotną wzglę-
dem q� dla dowolnego ustalonego x.
53
2. Wyznaczyć liczby g1 i g2 , które są kwantylami rozkładu P , tj.
Pq�{g1 <� G(x, q�) <� g2} �� Pq�{g1 <� h� <� g2} =� 1 -� e� ,
gdzie ZL h� ma rozkład P .
3. Rozwiązując nierówność g1 <� G(x, q�) <� g2 względem q� wyznaczyć
asymptotycznie dokładny PU.
Uwaga 3. Często jako g1 i g2 wybierane są kwantyle e� 2 i 1 -� e� 2 rozkładu P .
Natomiast kwantyle należy wybrać w taki sposób, aby otrzymać najkrótszy z możli-
wych PU.
Przykład 4. Spróbujmy, korzystając ze sformułowanego schematu, zbudować
dokładny PU dla parametru q� >� 0 rozkładu jednostajnego na odcinku [q�; 2q�].
xi
Jest wiadomo, że jeżeli ZL xi mają rozkład Uq�, 2q� , to ZL yi =� -�1 mają roz-
q�
kład U0,1. Wówczas ZL
x(n)
max{x1, ..., xn}
y(n) =� max{y1, ..., yn} =� -�1 =� -�1=� G(x, q�)
q� q�
ma taki sam rozkład, jak maksimum n niezależnych ZL o rozkładzie jednostajnym na
[0;1], tj. ma nie zależną od q� dystrybuantę
0, y <� 0,
��
��
n
Fy(n) ( y) =� Pq�{y(n) <� y} =� , y ��[0;1],
��y
��1, y >�1.
��
Dla dowolnych dodatnich g1 i g2 mamy
x(n) x(n) x(n)
��
Pq�{g1 <� G(x, q�) <� g2} =� Pq� ��g1 <� -�1 <� g2 ż� =� Pq� �� <� q� <� . (5.2)
ż�
q� g2 +� 1 g1 +� 1��
��
Długość PU jest równa x(n) �� (g2 -� g1) ((g2 +� 1)(g1 +�1)) i zmniejsza się ze wzro-
stem g1 i g2 oraz z ich zbliżeniem.
Gęstość rozkładu y(n) na odcinku [0;1] jest równa nyn-�1 i jest funkcją ostro ro-
snącą na tym odcinku. Dlatego największe wartości kwantylów g1 i g2 w tym przy-
padku, gdy odległość między nimi jest najmniejsza oraz pole pod krzywej gęstości
jest ustalone, osiąga się wyborem g2 =�1, a g1 takiego że 1 -� e� =� Pq�{g1 <� y(n) <�1}:
n
Pq�{g1 <� y(n) <�1} =� Fy(n) (1) -� Fy(n) (g1) =�1-� g1n =�1-� e� , tj. g1 =� e� .
Podstawmy znalezione kwantyle do wzoru (5.2):
54
x(n) x(n)
��
1 -� e� =� Pq�{n e� <� y(n) <�1} =� Pq� �� <� q� <� .
ż�
n
2
1 +� e�
��
Ćwiczenie. Czy można korzystając ze schematu z przykładu 1 zbudować do-
kładny PU dla s� przy znanym a na drodze rozwiązywania nierówności -�c <� h� <� c w
(5.1) względem s� ?
x -� a
Z ćwiczenia widać, że funkcja G postaci n nie może być stosowana do
s�
budowy dokładnego PU dla s� przy znanym a. Z następnego przykładu, jak z przy-
kładu 2, widać, że CTG pozwala na uzyskanie postaci uniwersalnej funkcji G dla
zbudowania asymptotycznie dokładnych PU.
Przykład 5. Niech x1, ..., xn będzie próbką o liczności n z rozkładu Poissona
l� , gdzie l� >� 0 . Należy zbudować asymptotycznie dokładny PU dla parametru l� z
poziomem ufności 1-� e� .
Wspominamy CTG:
n
��x -� nEl� x1
i
x -� l�
i =�1
=� n �� h� ,
nDl� x1 l�
gdzie h� ma rozkład normalny standaryzowany. Według określenia słabej zbieżności
przy n �� Ą� mamy
��
x -� l�
Pl� ��-� c <� n <� cż� �� Pl�{-�c <� h� <� c} =� 1-� e� przy c =� t�1-�e� 2 .
l�
��
Natomiast rozwiązanie względem l� nierówności pod znakiem prawdopodobieństwa
nie jest łatwe, ponieważ otrzymujemy nierówność kwadratową z powodu obecności
pierwiastka w mianowniku. Czy zachowuje się wskazana zbieżność, jeżeli zastąpimy
l� przez x ?
Z własności słabej zbieżności wynika, że jeżeli x�n ��p oraz h�n �� h� , to
��1
x�nh�n �� h� . Estymator l�* =� x jest zgodny, dlatego
l�
��p
��1.
x
Wówczas
l� x -� l� x -� l�
�� n =� n �� h�.
x l�
x
Wynika stąd, że
��
x -� l�
Pl� ��-� t�1-�e� 2 <� n <� t�1-�e� 2 ż� �� Pl�{-�t�1-�e� 2 <� h� <� t�1-�e� 2} =�1 -� e� .
x
��
55
Rozwiązując nierówność pod znakiem prawdopodobieństwa otrzymujemy
��
t�1-�e� 2 x t�1-�e� 2 x
��
Pl� �� -� <� l� <� x +� ��1 -� e� przy n �� Ą� .
��x ż�
n n
��
��
Otrzymujemy, więc, że asymptotycznie dokładny PU na poziomie ufności 1-� e� ma
postać
ć� ��
t�1-�e� 2 x t�1-�e� 2 x
��
x -� ; x +� .
��
n n
Ł� ł�
Zamiast CTG dla budowy asymptotycznie dokładnych PU możemy stosować
asymptotycznie normalne estymatory (co w zasadzie jest to samo CTG): jeżeli q� *
jest EAN dla parametru q� ze współczynnikiem s�2(q�) , to
q� * -�q�
G(x, q�) =� n �� h�,
s�(q�)
gdzie h� ma rozkład normalny standaryzowany.
Uwaga 4. Jeżeli s�(q�) w mianowniku nam przeszkadza, to można ją zastąpić
przez estymator zgodny s�(q�*) (jak w przykładzie 5). Wystarczy by funkcja s�(q�)
była ciągłą w całym obszarze Q� . Należy tylko odpowiedzieć na pytanie: czy q� * jest
estymatorem zgodnym dla q� ?
56

Wyszukiwarka

Podobne podstrony:
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 3
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 7
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 1
Boratyńska A Wykłady ze statystyki matematycznej
Wislicki W Zadania ze statystyki matematycznej
wykład statystyka matematyczna cz 4
wykład S1 Statystyka matematyczna
Mikołaj Rybaczuk Materiały do ćwiczeń i wykładów ze statystyki Politechnika BIałostocka
Wykład ze statystyki dobry
Wyklady ze statystyki
Wzory statystyka Matematyczna
STATYSTYKA MATEMATYCZNA w1

więcej podobnych podstron