Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2


2. ESTYMACJA PUNKTOWA
2.1. Własności parametryczne rozkładów
Niech dana jest próbka o liczności n, której elementy x1, ..., xn są niezależne oraz
spełniają rozkład Pq , który w znany sposób zależy od nieznanego parametru q .
Tu Pq jest pewną klasą rozkładów zupełnie określonych przez wartość parametru
q . Parametr q przybiera wartości z pewnego zbioru Q .
Np. dla wszystkich i =1, n
xi mają rozkład Poissona l , gdzie l > 0 jest parametrem nieznanym; tu
Pq = l , q = l , Q = (0, Ą) ;
xi mają rozkład Bernoulliego B , gdzie p(0;1) jest parametrem nieznanym;
p
tu Pq = B , q = p , Q = (0;1);
p
xi mają rozkład jednostajny Ua, b , gdzie a < b są parametrami nieznanymi; tu
Pq = Ua, b , q = (a; b) , Q = {(a, b) : a < b};
xi mają rozkład jednostajny U0, q , gdzie q > 0 jest parametrem nieznanym; tu
Pq = U0, q , Q = (0; Ą) ;
xi mają rozkład normalny N , gdzie a R , s > 0 są parametrami niezna-
a, s2
nymi; tu Pq = N , q = (a, s2) , Q = R (0; Ą) ;
a, s2
xi mają rozkład normalny Na, 4, gdzie a R jest parametrem nieznanym; tu
Pq = Na, 4 , q = a , Q = R .
Sformułowane zagadnienie ma sens, ponieważ dość rzadko spotykamy się z sy-
tuacją, gdy nie możemy nic powiedzieć o badanym doświadczeniu. Zwykle typ roz-
kładu jest z góry znany i wyznaczeniu podlegają jego parametry.
Np. wzrost młodych ludzi przy dość szerokich założeniach spełnia rozkład nor-
malny (z nieznanymi WO i wariancją), a liczba klientów zwiedzających sklep w cią-
gu jednej godziny ma rozkład Poissona z nieznaną  intensywnością l.
2.2. Estymatory punktowe. Estymatory nieobciążone i zgodne
Niech x1, ..., xn będzie próbką o liczności n z rodziny parametrycznej rozkładów
Pq , gdzie qQ .
18
Zauważmy, że wszystkie charakterystyki ZL x1, ..., xn zależą od parametru q .
Np. jeżeli xi ma rozkład Poissona l , to
l2
Ex1 = l , P{x1 = 2} = e-l , Dx1 = l itd.
2
Aby ujawnić wskazaną zależność będziemy pisali Eqx1 zamiast Ex1 itd. Np.
Dq1 x1 oznacza wariancję ZL x1 obliczoną przy założeniu q = q1.
W wielu przypadkach jest to niezbędne. Załóżmy np. że xi ma rozkład Poissona
l . Wówczas dla l =1 mamy Ex1 =1, natomiast dla l = 7 mamy Ex1 = 7 . Ozna-
czenie Ex1 w tym przypadku, więc, nie ma sensu jeżeli rozkład ZL x1 nie jest omó-
wiony w całości.
Definicja 1. Dowolna funkcja borelowska q* = q * (x1, ..., xn ) elementów próbki
nazywa się statystyką.
Oczywiście statystyką jest nie dowolna lecz mierzalna funkcja próbki (czyli
funkcja borelowska, dla której przeciwobraz dowolnego zbioru borelowskiego z R
znów jest zbiorem borelowskim z Rn ), nadal my nie będziemy to omawiały, ponie-
waż nie będziemy mieć do czynienia z funkcjami innego rodzaju.
Uwaga 1. Statystyka jest funkcją wyłącznie danych empirycznych, parametr q
nie jest, więc, jej argumentem. Statystyka zwykle wprowadza się w celu oszacowania
nieznanego parametru q (dlatego ona inaczej nazywa się estymatorem) i właśnie z
tych względów nie może od niego zależeć.
Definicja 2. Statystyka q* = q * (x1, ..., xn ) nazywa się nieobciążonym estymato-
rem parametru q , gdy dla dowolnego qQ zachodzi równość Eqq* = q.
Definicja 3. Statystyka q* = q * (x1, ..., xn ) nazywa się estymatorem zgodnym pa-
rametru q , gdy dla dowolnego qQ ma miejsce zbieżność q * p , gdy n Ą .
q
Nieobciążoność jest własnością estymatorów przy ustalonym n. Jej obecność
oznacza brak błędu systematycznego w sensie wartości średniej obserwowanych wy-
ników doświadczeń.
Własność zgodności oznacza, że ciąg estymatorów zbliża się do wartości niezna-
nego parametru ze wzrostem liczności próbki. Jest jasne, że korzystanie z estymato-
rów niezgodnych nie ma sensu praktycznego.
Przykład 1. Niech x1, ..., xn będzie próbką o liczności n z rozkładu normalnego
N , gdzie a R , s > 0. Jak możemy znalezć estymatory dla parametrów a, s2 w
a, s2
19
przypadku, gdy oba wskazane parametry (można uważać je za jeden parametr dwu-
wymiarowy) są nieznane?
Przez nas są już znane dobre estymatory dla WO i wariancji rozkładu dowolne-
go.
Estymatorem prawdziwej WO E x1 może służyć empiryczna wartość prze-
a, s2
ciętna a* = x . Własność 2 z punktu 1.6 orzeka, że ten estymator jest nieobciążony i
zgodny.
Co do wariancji s2 = D x1 to mamy dwa jej estymatora:
a, s2
n n
1 1
2
s2 = oraz s0 =
(x - x)2 (x - x)2
i
n n -1i =1 i
i =1
(wariancja empiryczna oraz wariancja empiryczna nieobciążona).
2
Na mocy własności 4 z p. 1.6 oba estymatory są zgodne, a estymator s0 jest nie-
obciążony.
Następna metoda oceniania nieznanych parametrów rozkładów poleca zastąpie-
nie prawdziwych momentów przez momenty empiryczne.
2.3. Metody wyznaczenia estymatorów: metoda momentów
Istota metody momentów polega na tym, co następuje: moment dowolny ZL x1
(np. moment rzędu k) zależy (najczęściej w sposób funkcyjny) od parametru q . Pa-
rametr q , więc, także jest funkcją k-go momentu teoretycznego. Podstawiając we
wzór na wskazaną funkcję zamiast k-go momentu teoretycznego jego analogon empi-
ryczny otrzymamy zamiast parametru q jego estymator q *.
Niech x1, ..., xn będzie próbką o liczności n z rodziny parametrycznej rozkładów
Pq , gdzie qQ . Wybierzmy pewną funkcję g(y) w taki sposób, aby istniał moment
Eqg(x1) = h(q), (2.1)
oraz funkcja h miała funkcję odwrotną na zbiorze Q . Wówczas jako estymator q *
parametru q przyjmiemy rozwiązanie równania
g(x) = h(q*).
Albo, co jest to samo, najpierw rozwiązujemy równanie (2.1) względem q , po
czym zastępujemy prawdziwy moment przez empiryczny:
n
ć
1

q = h-1(Eqg(x1)), q* = h-1(g(x))= h-1
g(x ) .
i
n
Ł i=1 ł
Najczęściej jako g(y) wybieramy g(y) = yk . Mamy wówczas
Eqx1k = h(q) ,
i jeżeli funkcja h ma odwrotną na zbiorze Q , to
20
n
ć
1

q = h-1(Eqx1k), q* = h-1(xk)= h-1 ik .
x
n
Ł i =1 ł
Można powiedzieć, że wybieramy jako estymator taką (losową) wartość parame-
tru q , dla której moment prawdziwy zgadza się z odpowiednim momentem empi-
rycznym.
Przykład 2. Niech x1, ..., xn będzie próbką o liczności n z rozkładu jednostajne-
go U0, q na odcinku [0; q], gdzie q > 0 .
Korzystając z metody momentów znajdziemy estymator parametru q najpierw
na podstawie pierwszego momentu:
q
*
Eqx1 = , wówczas q = 2Eqx1 , a więc mamy estymator q1 = 2x .
2
Estymator na podstawie k-go momentu to
q
1 qk
Eqx1k = yk dy = ,

q k +1
0
wówczas
k
k
q = (k + 1)Eqx1k , a więc mamy estymator q* = (k +1)xk . (2.2)
k
Uwaga 2. Możliwe jest, że q* = h-1(g(x))Q , chociaż qQ . W tym przypadku
niezbędna jest korekta estymatora. Np. jako estymator przyjmują najbliższy w sto-
sunku do h-1(g(x)) punkt z Q , albo punkt z zamykania Q .
Przykład 3. Niech x1, ..., xn będzie próbką o liczności n z rozkładu normalnego
Na,1 z WO a ł 0. Szukamy estymator dla a na podstawie pierwszego momentu:
Ea x1 = a , skąd wynika a* = x .
Jednak z treści zadania mamy a ł 0, chociaż x może być ujemne. Jeśli x < 0 , to
jako estymator możemy wziąć 0. Jeśli x ł 0 , to jako estymator należy wybrać x .
Ostatecznie mamy a* = max{0, x}. Jest to poprawiony (po korekcie) estymator a
otrzymany metodą momentów.
2.4. Zgodność estymatorów otrzymanych za pomocą metody
momentów
Twierdzenie 1. Niech q* = h-1(g(x)) będzie estymatorem parametru q otrzyma-
nym według metody momentów, gdzie funkcja h-1 jest ciągła. Wówczas estymator q *
jest zgodny.
21
Dowód. Na mocy prawa wielkich liczb w postaci Chinczyna mamy
n
1
g(x) = Eqg(x1) = h(q).
g(x ) p
i
n
i =1
Ponieważ funkcja h-1 jest ciągła, to
q* = h-1(g(x)) p
h-1(Eqg(x1)) = h-1(h(q)) = q .
Uwaga 3. Dla funkcji zwrotnej (tj. wzajemnie jednoznacznej) h : R R cią-
głość h a ciągłość h-1 są równoważne.
Już mówiliśmy, iż otrzymane przez nas estymatory muszą być zgodne. Nato-
miast z estymatorami nieobciążonymi spotykamy się dość rzadko.
Rozpatrzmy np. ciąg estymatorów parametru nieznanego q rozkładu jednostaj-
nego na odcinku [0; q] otrzymany w przykładzie 2 i zbadamy jego własności.
Zgodność:
*
1. Na mocy prawa wielkich liczb (PWL) mamy q1 = 2x p2Eqx1 =

*
= 2q 2 = q , co oznacza ze estymator q1 = 2x jest zgodny.
2. Na mocy PWL (albo własności 3 momentów) mamy przy n Ą
qk
xk p
Eqx1k = .
k +1
k
Ponieważ funkcja (k +1) y jest ciągła dla wszystkich y > 0, to przy n Ą
qk
k
q* = (k + 1)xk p (k + 1) = q.
k
k
k + 1
k
Ćwiczenie. Gdzie tu stosuje się własność ciągłości funkcji (k +1) y ?
Nieobciążoność:
1. Zgodnie z określeniem
*
Eqq1 = Eq (2x) = 2Eq x = (patrz własność 2) = 2q 2 = q ,
*
co oznacza, że estymator q1 = 2x jest nieobciążony.
2. Rozpatrzmy estymator q* . Zauważmy, że
2
Eqq* = Eq 3x2 .
2
Natomiast z własności 3 momentów empirycznych (p. 1.6) wynika, że
22
q = 3Eqx12 = 3Eq x2 .
Równość Eqq* = q oznaczałaby, że dla ZL x = 3x2 spełniona jest równość
2
Eq x = Eqx , a dla ZL h = x jest spełniono Eqh2 = (Eqh)2 czyli Dqh = 0 .
Natomiast ZL h = 3x2 ma rozkład niedegeneratywny (ten rozkład jest abso-
lutnie ciągły). Wówczas estymator q* = 3x2 jest obciążony. Obciążone są
2
także estymatory q* , k > 2 .
k

k
Otrzymaliśmy w ten sposób, że cały ciąg {q* }Ą = (k + 1)xk składa się z es-
ż
k k =1

*
tymatorów zgodnych, przy czym tylko estymator q1 = 2x z tego ciągu jest nieobcią-
żony.
2.5. Metody wyznaczenia estymatorów: metoda największej
wiarygodności
Metoda największej wiarygodności to jeszcze jeden sposób wyznaczenia estyma-
tora parametru nieznanego. Jego istota polega na tym, że jako najwięcej prawdopo-
dobną wartość parametru wybieramy taką wartość q , przy której prawdopodobień-
stwo otrzymania w n doświadczeniach aktualnej próbki x = (x1, ..., xn ) osiąga mak-
simum. Wybraną wartość parametru q , która zależy od próbki uważamy za szukany
estymator.
Najpierw wyjaśnimy, co oznacza  prawdopodobieństwo otrzymania aktualnej
próbki , tj., od czego należy szukać maksimum. Przypomnijmy, że dla rozkładów ab-
solutnie ciągłych Pq wyrażenie fq (y)Dy , gdzie fq (y) jest gęstością ZL q , jest z
dokładnością do o(Dy) prawdopodobieństwem tego, że ZL q przyjmuje wartości z
przedziału [y; y + Dy], czyli fq (y) dy jest prawdopodobieństwem  trafienia ZL do
punktu y (dokładniej, prawdopodobieństwem jej trafienia do przedziału [y; y + dy)).
Dla rozkładów dyskretnych Pq prawdopodobieństwo trafienia ZL x do punktu y jest
równe Pq{x = y}. W tym punkcie będziemy obie te charakterystyki nazywać (uogól-
nioną) gęstością rozkładu Pq .
Definicja 4. Funkcję
fq (y) = gęstość fq (y) , gdy rozkład Pq ZL x jest absolutnie ciągły,
fq (y) = Pq{x = y}, gdy rozkład Pq ZL x jest dyskretny
będziemy nazywali gęstością rozkładu Pq .
23
Z punktu widzenia teorii miary wprowadzenie gęstości dla rozkładu dyskretnego
nie jest czymś dziwnym. Wprowadzona gęstość nie jest oczywiście gęstością wzglę-
dem miary Lebesgue a, natomiast jest gęstością względem miary liczącej.
Jeżeli dla rozkładu dyskretnego ZL x , przyjmującej wartości a1, a2, ... , wprowadzmy miarę
liczącą # na s -ciele borelowskim w taki sposób, że #(B) = liczba ai należących do B, to
#(B) =
1,
#(dy) =
aiB
B
skąd wynika, że
Pq{x B} = fq (y)# (dy) = {x = y}# (dy) = {x = ai}.
q Pq
P
aiB
B B
Jeżeli x ma rozkład absolutnie ciągły, to fq (y) jest zwykłą gęstością względem miary Lebe-
sgue a l(dy) = dy :
Pq{x B} = fq ( y)l(dy) = fq (y)dy .

B B
Definicja 5. Funkcja (ZL przy ustalonym q )
n
f (x, q) = fq(x1) fq(x2 ) ... fq (xn ) = fq (xi )

i =1
nazywa się funkcją wiarygodności. Funkcja (także losowa)
n
L(x, q) = ln f (x, q) = fq(xi )
ln
i =1
nazywa się logarytmiczną funkcją wiarygodności.
W przypadku dyskretnym funkcja wiarygodności f (x1, ..., xn , q) jest prawdopo-
dobieństwem tego, że próbka x1, ..., xn (abstrakcyjna) w danej serii doświadczeń jest
równa x1, ..., xn (jest to próbka konkretna). Wskazane prawdopodobieństwo zależy
od q :
n
f (x, q) = fq (xi ) = Pq{x1 = x1} ... Pq{xn = xn} = Pq{x1 = x1, ..., xn = xn}.

i=1
~
Definicja 6. Estymatorem największej wiarygodności q nieznanego parametru
q nazywa się wartość q dla której funkcja f (x, q) (jako funkcja od q przy ustalo-
nych x1, ..., xn ) osiąga maksimum:
~
q = arg max f (x, q) .
q
Uwaga 4. Ponieważ funkcja ln y jest monotoniczna, to punkty maksymalnych
wartości f (x, q) i L(x, q) są takie same. Wówczas estymatorem największej wiary-
24
godności (ENW) możemy nazywać także punkt maksymalnej wartości względem q
funkcji L(x, q):
~
q = arg max L(x, q) .
q
Przypomnijmy, że punkty, w których funkcja osiąga ekstremum, to są albo punk-
ty, w których pochodna jest równa zeru, albo punkty nieciągłości funkcji/pochodnej,
albo punkty graniczne określenia funkcji.
Przykład 4. Niech x1, ..., xn będzie próbką o liczności n z rozkładu Poissona
~
l , gdzie l > 0 . Wyznaczmy ENW l parametru nieznanego l.
ly
Pl{x = y} = e-l, y = 0,1, ....
y!
xi
n
l xi lnx
f (x, l) = e-l = e-nl = e-nl .
l
xi!
x ! i
i =1 i x !
Ponieważ funkcja f (x, q) ma ciągłą pochodną względem l dla wszystkich l > 0 , to
można szukać jej ekstremum zakładając, że pochodna cząstkowa względem l jest
równa zeru. Wygodniej natomiast tego dokonać dla logarytmicznej funkcji wiary-
godności:
ć
lnx
L(x, l) = ln f (x, l) = ln e-nl = nxln l - ln !- nl .
x
i

!
xi
Ł ł
Wówczas mamy
ś nx
L(x, l) = - n,
śl l
~ nx ~
i punktem ekstremum l jest rozwiązanie równania - n = 0 , czyli l = x .
l
~
Ćwiczenie. 1) Przekonać się, że l = x jest punktem maksimum a nie minimum.
~
2) Przekonać się, że l = x jest równoważne jednemu z
estymatorów otrzymanych za pomocą metody momentów.
Przykład 5. Niech x1, ..., xn będzie próbką o liczności n z rozkładu normalnego
N , gdzie a R , s > 0 i oba te parametry są nieznane.
a, s2
Wypiszemy gęstość, funkcję wiarygodności oraz logarytmiczną funkcję wiary-
godności. Gęstość to
ć
1 (y - a)2
,
f(a, s2 ) (y) = exp -
2ps2 2s2
Ł ł
25
funkcja wiarygodności:
n
ć

(x - a)2
i
n
ć
1 (xi - a)2 1

i=1

f (x, a, s2 ) = exp- = exp-

2 ,
i =1 2ps2 2s2 (2ps2)n 2s2
Ł ł


Ł ł
logarytmiczna funkcja wiarygodności:
n
(x - a)2
i
n
i =1
L(x, a, s2) = ln f (x, a, s2) = -ln(2p)n 2 - ln s2 - .
2
2s2
W punkcie ekstremum względem (a, s2) funkcji L mającej ciągłe pochodne do
rzędu drugiego włącznie pochodne względem a i s2 są równe zeru:
n n
2 - a)
(x (x - a)2
i i
ś nx - na ś n
i=1 i =1
L(x, a, s2 ) = = ; L(x, a, s2 ) = - + .
śa
2s2 s2 śs2 2s2 2s4
~ ~
Estymatorem największej wiarygodności (a, s2) dla (a, s2) jest tu rozwiązanie
układu równań
n
(x - a)2
i
nx - na n
i=1
= 0 ; - + = 0 .
s2 2s2 2s4
Rozwiązując dostajemy dobrze znane estymatory
n
1
~ ~
a = x , s2 = = s2 .
(x - x)2
i
n
i=1
~ ~
Cwiczenie. 1) Przekonaj się, że a = x , s2 = s2 jest punktem maksimum a nie
minimum.
2) Przekonaj się, że te estymatory są równoważne pewnym
estymatorom otrzymanym za pomocą metody momentów.
Przykład 6. Niech x1, ..., xn będzie próbką o liczności n z rozkładu jednostajne-
go U0, q , gdzie q > 0 . Utworzymy z danej próbki szereg wariacyjny x(1), ..., x(n) .
Wówczas funkcja wiarygodności ma postać
(1 q)n, gdy x(n) Ł q,

f (x, q) =


0 w przypadku przeciwnym.
~
Funkcja ta osiąga maksimum w punkcie q = x(n) .
~
Wówczas q = x(n) = max{x1, ..., xn}.
26
Przykład 7. Niech x1, ..., xn będzie próbką o liczności n z rozkładu jednostajne-
go Uq, q+5 , gdzie qR .
Wypiszmy gęstość i funkcję wiarygodności. Gęstość to
1 5, gdy y [q; q + 5],

fq (y) =
0, gdy y [q; q + 5],

funkcja wiarygodności to
(1 5)n, gdy wszystkie xi [q;q + 5],
f (x, q) = =

0 w przypadku przeciwnym
(1 5)n, gdy q Ł x(1) Ł x(n) Ł q + 5, (1 5)n, gdy x(n) - 5 Ł q Ł x(1) ,

= =


0 w przypadku przeciwnym
0 w przypadku przeciwnym.
Funkcja wiarygodności osiąga wartość maksymalną (1 5)n we wszystkich punk-
tach q[x(n) - 5; x(1) ]. Wykres tej funkcji jest przedstawiony na rys. 2.1.
f (x, q)
1
5n
q
x(n) - 5 x(1)
Rys. 2.1
~
Punkt dowolny q [x(n) - 5; x(1) ] jest tu estymatorem największej wiarygodno-
ści. Otrzymujemy, więc, liczbę nieprzeliczalną estymatorów postaci
~
qa = (1 - a)(x(n) - 5) + ax(1)
~ ~
dla różnych a [0;1] włącznie z punktami granicznymi q0 = x(n) - 5 i q1 = x(1) .
Ćwiczenie. 1) Przekonaj się, że zbiór punktów [x(n) - 5; x(1)] nie jest zbiorem
pustym.
2) Oblicz EMM (względem momentu pierwszego) i przekonaj się,
że on jest inny niż ENW.
3) Oblicz ENW dla rozkładu jednostajnego Uq, 2q .
27


Wyszukiwarka