25
3. ESTYMACJA PRZEDZIAŁOWA
3.1. Pojęcia podstawowe
Niech jak zwykle dana jest próbka
)
...,
,
(
1
n
x
x
x
z rozkładu absolutnie ciągłego
P
, dla którego parametr
R
jest nieznany. Do tej pory zajmowaliśmy esty-
macją punktową parametru nieznanego
, tj. wyznaczeniem liczby (estymatora), któ-
rą w pewnym sensie można zastąpić prawdziwą wartość parametru.
Istnieje inne podejście do estymacji, przy którym wyznacza się przedział pokry-
wający parametr z danym z góry prawdopodobieństwem. Wskazane podejście nazy-
wa się estymacją przedziałową. Zauważmy najpierw, że im większa jest pewność te-
go, iż znaleziony przedział pokrywa wartość prawdziwą parametru, tym większa jest
długość tego przedziału. Więc marzenia o znalezieniu przedziału pokrywającego pa-
rametr z prawdopodobieństwem 1 nigdy nie będą spełnione. Mianowicie,
z praw-
dopodobieństwem 1 znajduje się w obszarze
.
Definicja 1.
Niech
1
0
. Przedział
))
,
(
);
,
(
(
)
;
(
x
x
nazywa się
dokładnym przedziałem ufności dla parametru
z poziomem ufności
1
, gdy dla
dowolnego
mamy
1
}
{
P
.
Definicja 2. Niech
1
0
. Przedział
))
,
(
);
,
(
(
)
;
(
x
x
nazywa się
asymptotycznie dokładnym przedziałem ufności dla parametru
z (asymptotycznym)
poziomem ufności
1
, gdy dla dowolnego
mamy
1
}
{
inf
lim
P
n
.
W definicji 2 w rzeczywistości chodzi oczywiście nie o jeden przedział, lecz o
ciąg przedziałów zależnych od liczności próbki n.
Uwaga 1. Granicy przedziału
)
;
(
są losowe. Dlatego o prawdopodobień-
stwie
}
{
P
mówimy, iż jest to prawdopodobieństwo tego, że przedział
)
;
(
pokrywa parametr
, lecz nie prawdopodobieństwo tego, że
leży w tym
przedziale.
Na początku przeanalizujemy trzy przykłady, w których zbadamy sposoby es-
tymacji. Później postaramy się uzyskać z tych przykładów pewną ogólną filozofię
budowy dokładnych oraz asymptotycznie dokładnych przedziałów ufności. Zacznie-
my od najczęściej stosowanego w praktyce rozkładu normalnego.
26
Przykład 1. Niech
n
x
x ...,
,
1
będzie próbką o liczności n z rozkładu normalnego
2
,
a
N
, gdzie
R
a
jest parametrem nieznanym, natomiast parametr
0
jest zna-
ny. Należy zbudować PU dla parametru a na poziomie ufności
1
.
Zauważmy, że rozkład normalny jest stabilny względem sumowania, czyli za-
chodzi następująca własność
Własność 1. Niech ZL
1
ma rozkład normalny
2
1
1
,
a
N
, ZL
2
ma rozkład
normalny
2
2
2
,
a
N
i ZL te są niezależne. Wówczas ZL
d
c
b
2
1
ma rozkład
normalny z parametrami
d
ca
ba
2
1
E
,
2
2
2
2
1
2
c
b
D
.
Mamy stąd, że
n
i
i
x
1
ma rozkład
2
,
n
na
N
,
na
x
n
i
i
1
ma rozkład
2
,
0
n
N
,
n
na
x
n
i
i
1
ma rozkład
1
,
0
N
.
Wynika stąd, że ZL
a
x
n
spełnia rozkład normalny standaryzowany.
Zakładając, że dana jest liczba
)
1
;
0
(
, znajdziemy taką liczbę
0
c
, że
1
}
{
c
c
P
(patrz rys. 3.1). Liczba c jest kwantylem rzędu
2
1
rozkładu
normalnego standaryzowanego:
1
1
)
(
2
))
(
1
(
)
(
)
(
)
(
}
{
1
,
0
1
,
0
1
,
0
1
,
0
1
,
0
c
c
c
c
c
c
c
P
,
czyli
2
1
)
(
1
,
0
c
.
-3
-2
-1
0
1
2
3
ℇ/2
ℇ/2
Rys. 3.1
ℇ/2
ℇ/2
27
Definicja 3. Niech rozkład
P
o dystrybuancie F jest absolutnie ciągły. Liczba
nazywa się kwantylem rzędu
rozkładu
P
, gdy
)
(
F
. Jeżeli funkcja F jest
ostro monotoniczna, to kwantyl określa się jednoznacznie.
Wówczas
2
1
c
, czyli
2
c
(kwantyle rozkładu normalnego standary-
zowanego).
Rozwiązując nierówność
c
c
względem a, otrzymujemy dokładny prze-
dział ufności
n
c
x
a
n
c
x
c
a
x
n
c
c
c
a
a
a
P
P
P
}
{
1
.
Możemy tu podstawić
2
1
c
:
1
2
1
2
1
n
x
a
n
x
a
P
.
Ostatecznie szukany przedział ufności na poziomie ufności
1
ma postać
n
x
n
x
2
1
2
1
;
.
Przykład 2. Niech
n
x
x ...,
,
1
będzie próbką o liczności n z rozkładu wykładni-
czego
E
, gdzie
0
. Należy zbudować asymptotycznie dokładny PU dla parame-
tru
na poziomie ufności
1
.
Wspominamy CTG:
)
1
(
1
1
1
1
1
x
n
x
n
x
n
x
n
x
n
i
i
D
E
,
gdzie ZL
ma rozkład normalny standaryzowany. Według definicji słabej zbieżno-
ści przy
n
mamy
1
}
{
)
1
(
c
c
c
x
n
c
P
P
, gdy
2
1
c
.
Tj.
1
1
1
)
1
(
2
1
2
1
2
1
2
1
x
n
x
x
n
x
x
n
P
P
,
gdy
n
.
Ostatecznie asymptotycznie dokładny PU na poziomie ufności
1
ma postać
n
x
x
n
x
x
2
1
2
1
1
;
1
.
28
Sformułujemy ogólną zasadę budowy dokładnych PU:
1.
Znaleźć funkcję
)
,
(
x
G
, której rozkład
P
nie zależy od parametru
.
Jest konieczne, by
)
,
(
x
G
miała funkcję odwrotną względem
dla do-
wolnego ustalonego x.
2.
Niech liczby
1
g
i
2
g
są kwantylami rozkładu
P
, takimi że
}
)
,
(
{
1
2
1
g
G
g
x
P
.
3.
Rozwiązując nierówność
2
1
)
,
(
g
G
g
x
względem
, otrzymujemy
dokładny PU.
Analogicznie wygląda zasada ogólna budowy asymptotycznie dokładnych PU:
1.
Znaleźć funkcję
)
,
(
x
G
, słabo zbieżną do rozkładu
P
nie zależnego od
parametru
. Jest konieczne, by
)
,
(
x
G
miała funkcję odwrotną wzglę-
dem
dla dowolnego ustalonego
x.
2.
Niech liczby
1
g
i
2
g
są kwantylami rozkładu
P
, takimi że
1
}
{
}
)
,
(
{
2
1
2
1
g
g
g
G
g
P
x
P
,
gdzie ZL
ma rozkład
P
.
3.
Rozwiązując nierówność
2
1
)
,
(
g
G
g
x
względem
, otrzymujemy
asymptotycznie dokładny PU.
Uwaga 2. Często w jakości
1
g
i
2
g
wybierane są kwantyle
2
i
2
1
roz-
kładu
P
. Natomiast kwantyle należy wybrać w taki sposób, aby otrzymać najkrótszy
z możliwych PU.
Przykład 3. Spróbujmy, korzystając ze sformułowanego schematu, zbudować
dokładny PU dla parametru
0
rozkładu jednostajnego na odcinku
]
2
;
[
.
Jest wiadomo, że jeżeli ZL
i
x
mają rozkład
2
,
U
, to ZL
1
i
i
x
y
mają roz-
kład
1
,
0
U
. Wówczas ZL
)
,
(
1
1
}
...,
,
max{
}
...,
,
max{
)
(
1
1
)
(
x
G
x
x
x
y
y
y
n
n
n
n
ma taki sam rozkład, jak maksimum n niezależnych ZL o rozkładzie jednostajnym na
]
1
;
0
[
, tj. ma nie zależną od
dystrybuantę
.
1
,
1
],
1
;
0
[
,
,
0
,
0
}
{
)
(
)
(
)
(
y
y
y
y
y
y
y
F
n
n
y
n
P
Dla dowolnych dodatnich
1
g
i
2
g
mamy
29
1
1
1
}
)
,
(
{
1
)
(
2
)
(
2
)
(
1
2
1
g
x
g
x
g
x
g
g
G
g
n
n
n
P
P
x
P
.
Długość PU jest równa
))
1
)(
1
((
)
(
1
2
1
2
)
(
g
g
g
g
x
n
i zmniejsza się ze
wzrostem
1
g
i
2
g
oraz z ich zbliżeniem.
Gęstość rozkładu
)
(n
y
na odcinku
]
1
;
0
[
jest równa
1
n
ny
i jest funkcją ostro
rosnącą na tym odcinku. Dlatego największe wartości
1
g
i
2
g
w tym przypadku, gdy
odległość między nimi jest najmniejsza oraz pole pod krzywej gęstości jest ustalone,
osiąga się wyborem
1
2
g
, a
1
g
takiego, że
}
1
{
1
)
(
1
n
y
g
P
:
1
1
)
(
)
1
(
}
1
{
1
1
)
(
1
)
(
)
(
n
y
y
n
g
g
F
F
y
g
n
n
P
, tj.
n
g
1
.
Podstawmy znalezione kwantyle do wzoru (5.2):
n
n
n
n
n
x
x
y
1
2
}
1
{
1
)
(
)
(
)
(
P
P
.
Łatwo zauważyć, że funkcja G postaci
a
x
n
nie może być stosowana do
budowy dokładnego PU dla
przy znanym a. Z następnego przykładu, jak z przy-
kładu 2, widać, że CTG pozwala na uzyskanie postaci uniwersalnej funkcji G dla
zbudowania asymptotycznie dokładnych PU.
Przykład 4. Niech
n
x
x ...,
,
1
będzie próbką o liczności n z rozkładu Poissona
,
Π
gdzie
0
. Należy zbudować asymptotycznie dokładny PU dla parametru
z
poziomem ufności
1
.
Wspominamy CTG:
x
n
x
n
x
n
x
n
i
i
1
1
1
D
E
,
gdzie
ma rozkład normalny standaryzowany. Według określenia słabej zbieżności
przy
n
mamy
1
}
{
c
c
c
x
n
c
P
P
przy
2
1
c
.
Natomiast rozwiązanie względem
nierówności pod znakiem prawdopodobieństwa
nie jest łatwe, ponieważ otrzymujemy nierówność kwadratową z powodu obecności
pierwiastka w mianowniku. Czy zachowuje się wskazana zbieżność, jeżeli zastąpimy
przez x ?
Z własności słabej zbieżności wynika, że jeżeli
1
p
n
oraz
n
, to
n
n
. Estymator
x
*
jest zgodny, dlatego
30
1
p
x
.
Wówczas
x
x
n
x
n
x
.
Wynika stąd, że
1
}
{
2
1
2
1
2
1
2
1
P
P
x
x
n
.
Rozwiązując nierówność pod znakiem prawdopodobieństwa otrzymujemy
1
2
1
2
1
n
x
x
n
x
x
P
przy
n
.
Mamy, więc, że asymptotycznie dokładny PU na poziomie ufności
1
ma postać
n
x
x
n
x
x
2
1
2
1
;
.
Uwaga 3. Jeżeli
)
(
w mianowniku nam przeszkadza, to można ją zastąpić
przez estymator zgodny
*)
(
(jak w przykładzie 4). Wystarczy by funkcja
)
(
była ciągłą w całym obszarze
. Należy tylko odpowiedzieć na pytanie: czy
*
jest
estymatorem zgodnym dla
?
3.2. Rozkłady związane z rozkładem normalnym
W p. 3.1 było rozwiązane zagadnienie 1 budowy dokładnego PU dla parametru
a rozkładu normalnego, gdy drugi parametr
2
był znany. W tym celu stosowaliśmy
funkcję próbki i nieznanego parametru a
a
x
n
a
G
)
,
(x
,
która przy dowolnym a ma rozkład normalny standaryzowany.
Następujące zagadnienia jednak pozostały nierozwiązane:
2) zbudować dokładny PU dla
, gdy a jest znane,
3) zbudować dokładny PU dla a, gdy
jest nieznane,
4) zbudować dokładny PU dla
, gdy a jest nieznane.
Jak wiadomo, dla rozwiązania sformułowanych zagadnień należy znaleźć funk-
cje próbki i parametrów, których rozkłady są znane. W szczególności, w zagadnieniu
3 szukana funkcja musi być niezależną od nieznanego parametru
, a w zagadnieniu
4 – od parametru a.
31
Takie szczególne zaciekawienie rozkładem normalnym związane oczywiście z
CTG – prawie wszystko w tym świecie jest normalne (albo jest bliskie tego).
Dlatego w tym rozdziale będziemy się zajmować rozkładami związanymi z roz-
kładem normalnym, zbadamy ich własności oraz własności próbek z rozkładu nor-
malnego.
1. Rozkład Gamma i jego własności. Rozkład Gamma
,
Γ
jest znany z kursu
rachunku prawdopodobieństwa. Mianowicie, gęstość tego rozkładu ma postać
,
0
gdy
,
)
(
,
0
gdy
,
0
)
(
1
,
y
e
y
y
y
f
y
gdzie
0
,
,
0
1
)
(
dt
e
t
t
jest funkcja Gamma, mająca w szczególności na-
stępujące własności:
)
1
(
)
1
(
)
(
;
1
)
1
(
, skąd mamy
)!
1
(
)
(
n
n
dla
N
n
;
)
2
1
(
.
W ciągu dalszym nam będzie potrzebna własność stabilności tego rozkładu
względem sumowania.
Własność 1. Niech ZL
n
...,
,
1
będą niezależne oraz
i
ma rozkład Gamma
i
,
Γ
,
n
i
,
1
. Wówczas
n
i
i
n
S
1
ma rozkład
n
i
1
,
Γ
.
Własność 2. Jeżeli ZL
ma rozkład normalny standaryzowany, to ZL
2
ma
rozkład Gamma
2
1
,
2
1
Γ
.
2. Rozkład „chi-kwadrat” (χ
2
) i jego własności. Z własności 1 i 2 wynika bez-
pośrednio następujące stwierdzenie.
Wniosek 1. Jeżeli ZL
k
...,
,
1
są niezależne i mają rozkład normalny standary-
zowany, to ZL
2
2
1
2
...
k
k
ma rozkład
2
,
2
1
k
Γ
.
Definicja 4. Rozkład sumy k kwadratów niezależnych ZL mających rozkład
normalny standaryzowany nazywa się rozkładem „chi-kwadrat” (
2
) o k stopniach
swobody i oznacza się
k
H
. Na mocy wniosku 1 rozkład ten jest rozkładem
2
,
2
1
k
Γ
.
Na rys. 3.2 podany jest wykres gęstości rozkładu
2
,
2
1
k
k
Γ
H
dla k równego
1, 2, 4 i 8.
32
My często będziemy oznaczali przez
2
k
ZL o rozkładzie
k
H
.
Podamy własności rozkładu ZL
2
k
.
1.
Stabilność względem sumowania. Niech ZL
2
k
ma rozkład
k
H
, ZL
2
m
ma rozkład
m
H
i ZL te są niezależne. Wówczas ich suma ma rozkład
m
k
H
.
2.
Momenty rozkładu
2
. Jeżeli ZL
2
k
ma rozkład
k
H
, to
k
k
2
E
i
k
k
2
2
D
.
3.
Niech
...
,
,
2
1
są niezależne i mają rozkład normalny
2
,
a
N
. Wówczas
ZL
k
i
i
k
a
1
2
2
ma rozkład
2
(
k
H
) o k stopniach swobody.
Rys. 3.2
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0
2
4
6
8
10
12
14
16
y
H
1
2
H
4
H
8
H
33
3. Rozkład Studenta i jego własności.
Definicja 5. Niech ZL
k
...,
,
,
1
0
są niezależne i mają rozkład normalny stan-
daryzowany. Rozkład ZL
k
k
t
k
k
k
2
0
2
2
1
0
)
...
(
1
nazywa się rozkładem Studenta o k stopniach swobody i oznacza się
k
T
.
Gęstość rozkładu Studenta (patrz rys. 3.3) o k stopniach swobody to
2
)
1
(
2
1
)
2
(
)
2
)
1
(
(
)
(
k
k
k
y
k
k
k
y
f
. (6.1)
Podamy własności rozkładu Studenta.
1.
Symetryczność. Jeżeli ZL
k
t
ma rozkład Studenta
k
T
o k stopniach swo-
body, to ZL
k
t
ma taki sam rozkład.
2.
Asymptotyczna normalność. Rozkład Studenta
k
T
jest słabo zbieżny do
rozkładu normalnego standaryzowanego przy
k
.
3. Dla rozkładu Studenta istnieją tylko momenty rzędu
k
m
i nie istnieje
momentów rzędu
k
m
, przy czym wszystkie momenty nieparzystych
rzędów są równe zero.
Podamy teraz wzory na charakterystyki ZL o rozkładzie Studenta.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
-8
-4
0
4
8
Rozkład normalny
Rozkład Studenta k = 2
Rys 3.3
34
0
1
2
n
k
t
E
,
)
2
(
)
2
1
(
)
2
(
2
k
n
n
k
k
t
n
n
k
E
,
k
n
2
;
.
2
gdy
,
,
2
gdy
,
2
k
k
k
k
t
k
D
Możemy, oczywiście, doprowadzić wzory na momenty rozkładu Studenta do
postaci nie zawierającej funkcji Gamma.
Zauważmy, że rozkłady
2
i Studenta są tablicowane, tak, że jeżeli będzie po-
trzebne zbudować jakiś PU przez obliczanie kwantylów, to kwantyle znajdziemy za
pomocą tablic.
Następny rozkład także jest związany z rozkładem normalnym, natomiast korzy-
stać z niego będziemy później w zagadnieniach weryfikacji hipotez.
4. Rozkład Fishera.
Definicja 6. Niech ZL
2
k
ma rozkład
k
H
, a ZL
2
m
ma rozkład
m
H
, przy czym
ZL te są niezależne. Rozkład ZL
2
2
2
2
,
m
k
m
k
m
k
k
m
m
k
f
nazywa się rozkładem Fishera (rozkładem F Snedecora) o k, m stopniach swobody i
oznacza się
m
k ,
F
.
Własności rozkładu Fishera:
1. Jeżeli ZL
m
k
f
,
ma rozkład
m
k ,
F
, to ZL
m
k
f
,
1
ma rozkład
k
m,
F
.
2. Rozkład
m
k ,
F
jest słabo zbieżny do rozkładu degeneratywnego w punkcie 1
(
1
I
), gdy k i m dążą do nieskończoności w sposób dowolny.
3.3. Dokładne przedziały ufności dla parametrów rozkładu
normalnego
Niech dana jest próbka
n
x
x ...,
,
1
z rozkładu normalnego
2
,
a
N
. Przypomnijmy
oznaczenia
n
i
i
a
x
n
s
1
2
2
)
(
1
i
n
i
i
x
x
n
s
1
2
2
0
)
(
1
1
.
Można udowodnić, że spełnione są następujące stwierdzenia.
35
1)
a
x
n
ma rozkład normalny standaryzowany (wykorzystaliśmy już ten
fakt do budowy PU dla a gdy
jest znane);
2)
n
i
i
a
x
1
2
ma rozkład
n
H
(z tego będziemy korzystać budując PU dla
2
gdy a jest znane);
3)
2
2
0
1
2
2
)
1
(
)
(
s
n
x
x
n
i
i
ma rozkład
1
n
H
; (z tego będziemy korzystać budu-
jąc PU dla
2
gdy a jest nieznane);
4)
0
2
0
s
a
x
n
s
a
x
n
ma rozkład
1
n
T
(z tego będziemy korzystać budując
PU dla a gdy
jest nieznane).
Ze stwierdzeń tych wynikają następujące wzory na PU dla parametrów rozkładu
normalnego.
1. Dla a gdy
jest znane. Ten PU był przez nas zbudowany w przykładzie 1 z
p. 3.1:
1
2
1
2
1
n
x
a
n
x
a
P
, gdzie
2
1
)
(
2
1
1
,
0
.
2. Dla
2
gdy a jest znane. Według stwierdzenia 2 mamy
2
2
ns
ma rozkład
n
H
, gdzie
n
i
i
a
x
n
s
1
2
2
)
(
1
.
Niech
2
2
,
1
n
g
oraz
2
2
1
,
2
n
g
są kwantylami rozkładu
n
H
rzędu
2
i
2
1
. Wówczas
1
2
2
2
2
,
2
2
2
1
,
2
2
1
g
ns
g
ns
g
ns
g
a
a
P
P
.
3. Dla
2
gdy a jest nieznane. Według stwierdzenia 3 mamy
2
2
0
)
1
(
s
n
ma rozkład
1
n
H
, gdzie
n
i
i
x
x
n
s
1
2
2
0
)
(
1
1
.
Niech
2
2
,
1
1
n
g
i
2
2
1
,
1
2
n
g
są kwantylami rozkładu
1
n
H
rzędu
2
i
2
1
. Wówczas
36
1
2
0
2
2
2
0
,
2
2
2
0
1
,
)
1
(
)
1
(
)
1
(
1
2
2
g
s
n
g
s
n
g
s
n
g
a
a
P
P
.
4. Dla a gdy
jest nieznane. Według stwierdzenia 4 mamy
0
s
a
x
n
ma rozkład
1
n
T
, gdzie
n
i
i
x
x
n
s
1
2
2
0
)
(
1
1
.
Niech
2
,
1
1
n
t
a
i
2
1
,
1
2
n
t
a
są kwantylami rozkładu
1
n
T
rzędu
2
i
2
1
. Rozkład Studenta jest symetryczny, tj.
2
1
a
a
. Wówczas
2
1
,
1
0
2
1
,
1
,
2
1
n
n
a
t
s
a
x
n
t
P
n
s
t
x
a
n
s
t
x
n
n
a
0
2
1
,
1
0
2
1
,
1
,
2
P
.