5. ESTYMACJA PRZEDZIAAOWA
Niech jak zwykle dana jest próbka x = (x1, ..., xn ) z rozkładu Pq , dla którego pa-
rametr qQ R jest nieznany. Do tej pory zajmowaliśmy estymacją punktową pa-
rametru nieznanego q , tj. wyznaczeniem liczby (estymatora), która w pewnym sensie
może zastąpić prawdziwą wartość parametru.
Istnieje inne podejście do estymacji, przy którym wyznacza się przedział pokry-
wający parametr z danym z góry prawdopodobieństwem. Wskazane podejście nazy-
wa się estymacją przedziałową. Zauważmy najpierw, że im większa jest pewność te-
go, iż znaleziony przedział pokrywa wartość prawdziwą parametru, tym większa jest
długość tego przedziału. Więc marzenia o znalezieniu przedziału pokrywającego pa-
rametr z prawdopodobieństwem 1 nigdy nie będą spełnione. Mianowicie, tylko ob-
szar Q pokrywa z prawdopodobieństwem 1 wartość prawdziwą parametru q .
Definicja 1. Niech 0 < e <1. Przedział (q-; q+ ) = (q- (x, e); q+ (x, e)) nazywa się
przedziałem ufności dla parametru q z poziomem ufności (na poziomie ufności) 1- e ,
gdy dla dowolnego qQ mamy
Pq{q- < q < q+}ł1 - e.
Definicja 2. Niech 0 < e <1. Przedział (q-; q+ ) = (q- (x, e); q+ (x, e)) nazywa się
asymptotycznym przedziałem ufności dla parametru q z (asymptotycznym) poziomem
ufności 1- e , gdy dla dowolnego qQ mamy
lim inf Pq{q- < q < q+} ł 1 - e .
nĄ
W definicji 2 w rzeczywistości chodzi oczywiście nie o jeden przedział, lecz o
ciąg przedziałów zależnych od liczności próbki n.
Uwaga 1. Granicy przedziału (q-; q+ ) są losowe. Dlatego o prawdopodobień-
stwie Pq{q- < q < q+} mówimy, iż jest to prawdopodobieństwo że przedział
(q-; q+ ) pokrywa parametr q , lecz nie prawdopodobieństwo że q leży w tym prze-
dziale.
Uwaga 2. Znak ł w definicjach 1 i 2 odpowiada zwykle rozkładom dyskret-
nym, bowiem w przypadku tym równość nie zawsze jest możliwa: np. dla ZL x ma-
49
jącej rozkład Bernoulliego B1 2 przy dowolnym x spełnienie równości
P{x < x} = 0,25 nie jest możliwe, natomiast nierówność P{x < x} ł 0,25 ma sens dla
x > 0.
Jeżeli prawdopodobieństwo tego, że przedział ufności pokrywa parametr, jest
dokładnie równe 1- e (dąży do 1- e ), to przedział nazywa się dokładnym (asympto-
tycznie dokładnym) przedziałem ufności z poziomem ufności 1- e .
Przed tym jak systematycznie zajmować się budową dokładnych oraz asympto-
tycznie dokładnych przedziałów ufności (PU), przeanalizujemy trzy przykłady, w
których zbadamy podobne sposoby estymacji. Pózniej postaramy się uzyskać z tych
przykładów pewną ogólną filozofię budowy dokładnych oraz asymptotycznie do-
kładnych przedziałów ufności. Zaczniemy od najczęściej stosowanego w praktyce
rozkładu normalnego.
Przykład 1. Niech x1, ..., xn będzie próbką o liczności n z rozkładu normalnego
N , gdzie aR jest parametrem nieznanym, natomiast parametr s > 0 jest zna-
a, s2
ny. Należy zbudować PU dla parametru a na poziomie ufności 1- e .
Zauważmy, że rozkład normalny jest stabilny względem sumowania (patrz ra-
chunek prawdopodobieństwa), czyli zachodzi następująca własność.
Własność 1. Niech ZL x1 ma rozkład normalny N , ZL x2 ma rozkład
2
a1, s1
normalny N i ZL te są niezależne. Wówczas ZL h = bx1 + cx2 + d ma rozkład
a2 , s2
2
2
normalny z parametrami Eh = ba1 + ca2 + d , Dh = b2s1 + c2s2 .
2
Mamy stąd, że
n
,
x ma rozkład N
i
na, ns2
i=1
n
x - na ma rozkład N0, ns2 ,
i
i =1
n
x - na
i
i =1
ma rozkład N0,1.
ns
x - a
Wynika stąd, że ZL h = n spełnia rozkład normalny standaryzowany. Za-
s
kładając, że dana jest liczba e(0;1) , znajdziemy taką liczbę c > 0, że
P{-c < h < c} =1- e . Liczba c jest kwantylem rzędu 1 - e 2 rozkładu normalnego
standaryzowanego:
50
P{-c < h < c} = F0,1(c) - F0,1(-c) = F0,1(c) - (1 - F0,1(c)) = 2F0,1(c) -1 =1 - e,
czyli F0,1(c) = 1 - e 2 .
Definicja 3. Niech rozkład P o dystrybuancie F jest absolutnie ciągły. Liczba td
nazywa się kwantylem rzędu d rozkładu P , gdy F(td ) = d . Jeżeli funkcja F jest ostro
monotoniczna, to kwantyl określa się jednoznacznie.
!/2 !/2
!/2 !/2
-3 -2 -1 0 1 2 3
Rys. 5.1
Wówczas c = t1-e 2 , czyli - c = te 2 (kwantyle rozkładu normalnego standary-
zowanego).
Rozwiązując nierówność -c < h < c względem a, otrzymujemy dokładny prze-
dział ufności
x - a cs cs
1 - e = Pa{-c < h < c} = Pa - c < n < cż = Pa - < a < x + . (5.1)
x ż
s
n n
Możemy tu podstawić c = t1-e 2 :
t1-e 2s t1-e 2s
Pa x - < a < x + = 1 - e .
ż
n n
Ostatecznie szukany przedział ufności na poziomie ufności 1- e ma postać
t1-e 2s t1-e 2s
ć
x - ; x + .
n n
Ł ł
Przykład 2. Niech x1, ..., xn będzie próbką o liczności n z rozkładu wykładni-
czego Ea , gdzie a > 0 . Należy zbudować asymptotycznie dokładny PU dla parame-
tru a na poziomie ufności 1- e .
Wspominamy CTG:
51
n
x - nEa x1
i
x - 1 a
i =1
= n = n(ax -1) h,
1 a
nDa x1
gdzie ZL h ma rozkład normalny standaryzowany. Według definicji słabej zbieżno-
ści przy n Ą mamy
Pa{- c < n(ax - 1) < c} Pa{-c < h < c} =1 - e , gdy c = t1-e 2 .
Tj.
t1-e 2 t1-e 2
1 1
Pa{- t1-e 2 < n(ax -1) < t1-e 2}= Pa - < a < + 1 - e ,
ż
x n x x n x
gdy n Ą .
Ostatecznie asymptotycznie dokładny PU na poziomie ufności 1- e ma postać
t1-e 2 1 t1-e 2
ć
1
- ; + .
x x n x x n
Ł ł
Przykład 3. Niech x1, ..., xn będzie próbką o liczności n z rozkładu Bernoulliego
B . Wiemy, że estymatorem nieobciążonym, zgodnym i efektywnym parametru p
p
m
~
jest częstość względna p = (patrz przykład 3 z rozdziału 4). Należy zbudować
n
asymptotycznie dokładny PU dla parametru p na poziomie ufności 1- e . Z twierdze-
nia Moivre a Laplace a (patrz rachunek prawdopodobieństwa) wynika następująca
równość przybliżona dla dużych n:
ć ć
m n n
~
Pp{| p - p |< d} = Pp - p < dż F0,1d - F0,1- d =
n pq pq
Ł ł Ł ł
ć
n
= 2F0,1d -1,
pq
Ł ł
x
2
1 pq
gdzie F0,1(x) =
e-t 2dt , q =1- p . Wprowadzmy oznaczenie d = t .
2p n
-Ą
Wówczas mamy
pq
Pp | ~ - p |< t 2F0,1(t) - 1.
p
ż
n
Nierówność w nawiasie klamrowym jest równoważna nierówności
ć ć
t2
~
1 + t2
p2 - 2 ~ + p + p2 Ł 0 ,
p
n 2n
Ł ł Ł ł
którego rozwiązanie względem p ma postać
52
2
~) ć 2
t2 ~(1- ~) t t2 ~(1 - p t
p p p
ć
~ ~
p + - t + p + + t +
2n n 2n 2n n 2n
Ł ł Ł ł
Ł p Ł .
t2 t2
1 + 1 +
n n
Korzystając z tablicy dystrybuanty F0, 1(x) rozkładu normalnego standaryzowa-
nego znajdujemy rozwiązanie t1-e 2 względem t równania 2F0,1(t) -1 =1 - e, czyli
e
F0, 1(t) =1- . Wówczas szukany asymptotycznie dokładny przedział ufności ma
2
postać
ć
~(1- ~) ć t1-e 2 2 ~(1- ~) ć t1-e 2 2
t1-e 22 t1-e 22
p p p p
~ ~
p + - t1-e 2 + p + + t1-e 2 +
2n n 2n 2n n 2n
Ł ł Ł ł
;
.
t1-e 22 t1-e 22
1+ 1+
n n
Ł ł
t1-e 22 t1-e 2 2
ć
Dla dużych n można tu zrezygnować ze składników , . Wówczas
n 2n
Ł ł
przedział ufności przyjmuje postać
~(1- ~) ~(1 - ~)
ć
p p p p
~ ~
p - t1-e 2 ; p + t1-e 2 .
n n
Ł ł
Sformułujemy ogólną zasadę budowy dokładnych PU:
1. Znalezć funkcję G(x, q) , której rozkład P nie zależy od parametru q .
Jest konieczne, by G(x, q) miała funkcję odwrotną względem q dla do-
wolnego ustalonego x.
2. Wyznaczyć liczby g1 i g2 , które są kwantylami rozkładu P , tj.
1 - e = Pq{g1 < G(x, q) < g2}.
3. Rozwiązując nierówność g1 < G(x, q) < g2 względem q wyznaczyć do-
kładny PU.
Analogicznie wygląda zasada ogólna budowy asymptotycznie dokładnych PU:
1. Znalezć funkcję G(x, q) słabo zbieżną do rozkładu P nie zależnego od
parametru q . Jest konieczne, by G(x, q) miała funkcję odwrotną wzglę-
dem q dla dowolnego ustalonego x.
53
2. Wyznaczyć liczby g1 i g2 , które są kwantylami rozkładu P , tj.
Pq{g1 < G(x, q) < g2} Pq{g1 < h < g2} = 1 - e ,
gdzie ZL h ma rozkład P .
3. Rozwiązując nierówność g1 < G(x, q) < g2 względem q wyznaczyć
asymptotycznie dokładny PU.
Uwaga 3. Często jako g1 i g2 wybierane są kwantyle e 2 i 1 - e 2 rozkładu P .
Natomiast kwantyle należy wybrać w taki sposób, aby otrzymać najkrótszy z możli-
wych PU.
Przykład 4. Spróbujmy, korzystając ze sformułowanego schematu, zbudować
dokładny PU dla parametru q > 0 rozkładu jednostajnego na odcinku [q; 2q].
xi
Jest wiadomo, że jeżeli ZL xi mają rozkład Uq, 2q , to ZL yi = -1 mają roz-
q
kład U0,1. Wówczas ZL
x(n)
max{x1, ..., xn}
y(n) = max{y1, ..., yn} = -1 = -1= G(x, q)
q q
ma taki sam rozkład, jak maksimum n niezależnych ZL o rozkładzie jednostajnym na
[0;1], tj. ma nie zależną od q dystrybuantę
0, y < 0,
n
Fy(n) ( y) = Pq{y(n) < y} = , y [0;1],
y
1, y >1.
Dla dowolnych dodatnich g1 i g2 mamy
x(n) x(n) x(n)
Pq{g1 < G(x, q) < g2} = Pq g1 < -1 < g2 ż = Pq < q < . (5.2)
ż
q g2 + 1 g1 + 1
Długość PU jest równa x(n) (g2 - g1) ((g2 + 1)(g1 +1)) i zmniejsza się ze wzro-
stem g1 i g2 oraz z ich zbliżeniem.
Gęstość rozkładu y(n) na odcinku [0;1] jest równa nyn-1 i jest funkcją ostro ro-
snącą na tym odcinku. Dlatego największe wartości kwantylów g1 i g2 w tym przy-
padku, gdy odległość między nimi jest najmniejsza oraz pole pod krzywej gęstości
jest ustalone, osiąga się wyborem g2 =1, a g1 takiego że 1 - e = Pq{g1 < y(n) <1}:
n
Pq{g1 < y(n) <1} = Fy(n) (1) - Fy(n) (g1) =1- g1n =1- e , tj. g1 = e .
Podstawmy znalezione kwantyle do wzoru (5.2):
54
x(n) x(n)
1 - e = Pq{n e < y(n) <1} = Pq < q < .
ż
n
2
1 + e
Ćwiczenie. Czy można korzystając ze schematu z przykładu 1 zbudować do-
kładny PU dla s przy znanym a na drodze rozwiązywania nierówności -c < h < c w
(5.1) względem s ?
x - a
Z ćwiczenia widać, że funkcja G postaci n nie może być stosowana do
s
budowy dokładnego PU dla s przy znanym a. Z następnego przykładu, jak z przy-
kładu 2, widać, że CTG pozwala na uzyskanie postaci uniwersalnej funkcji G dla
zbudowania asymptotycznie dokładnych PU.
Przykład 5. Niech x1, ..., xn będzie próbką o liczności n z rozkładu Poissona
l , gdzie l > 0 . Należy zbudować asymptotycznie dokładny PU dla parametru l z
poziomem ufności 1- e .
Wspominamy CTG:
n
x - nEl x1
i
x - l
i =1
= n h ,
nDl x1 l
gdzie h ma rozkład normalny standaryzowany. Według określenia słabej zbieżności
przy n Ą mamy
x - l
Pl - c < n < cż Pl{-c < h < c} = 1- e przy c = t1-e 2 .
l
Natomiast rozwiązanie względem l nierówności pod znakiem prawdopodobieństwa
nie jest łatwe, ponieważ otrzymujemy nierówność kwadratową z powodu obecności
pierwiastka w mianowniku. Czy zachowuje się wskazana zbieżność, jeżeli zastąpimy
l przez x ?
Z własności słabej zbieżności wynika, że jeżeli xn p oraz hn h , to
1
xnhn h . Estymator l* = x jest zgodny, dlatego
l
p
1.
x
Wówczas
l x - l x - l
n = n h.
x l
x
Wynika stąd, że
x - l
Pl - t1-e 2 < n < t1-e 2 ż Pl{-t1-e 2 < h < t1-e 2} =1 - e .
x
55
Rozwiązując nierówność pod znakiem prawdopodobieństwa otrzymujemy
t1-e 2 x t1-e 2 x
Pl - < l < x + 1 - e przy n Ą .
x ż
n n
Otrzymujemy, więc, że asymptotycznie dokładny PU na poziomie ufności 1- e ma
postać
ć
t1-e 2 x t1-e 2 x
x - ; x + .
n n
Ł ł
Zamiast CTG dla budowy asymptotycznie dokładnych PU możemy stosować
asymptotycznie normalne estymatory (co w zasadzie jest to samo CTG): jeżeli q *
jest EAN dla parametru q ze współczynnikiem s2(q) , to
q * -q
G(x, q) = n h,
s(q)
gdzie h ma rozkład normalny standaryzowany.
Uwaga 4. Jeżeli s(q) w mianowniku nam przeszkadza, to można ją zastąpić
przez estymator zgodny s(q*) (jak w przykładzie 5). Wystarczy by funkcja s(q)
była ciągłą w całym obszarze Q . Należy tylko odpowiedzieć na pytanie: czy q * jest
estymatorem zgodnym dla q ?
56
Wyszukiwarka
Podobne podstrony:
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2Tikhonenko O Wykłady ze statystyki matematycznej Wykład 3Tikhonenko O Wykłady ze statystyki matematycznej Wykład 7Tikhonenko O Wykłady ze statystyki matematycznej Wykład 1Boratyńska A Wykłady ze statystyki matematycznejWislicki W Zadania ze statystyki matematycznejwykład statystyka matematyczna cz 4wykład S1 Statystyka matematycznaMikołaj Rybaczuk Materiały do ćwiczeń i wykładów ze statystyki Politechnika BIałostockaWykład ze statystyki dobryWyklady ze statystykiWzory statystyka MatematycznaSTATYSTYKA MATEMATYCZNA w1więcej podobnych podstron