6. ROZKAADY ZWIZANE Z ROZKAADEM
NORMALNYM
W rozdziale 5 było rozwiązane zagadnienie 1 budowy dokładnego PU dla para-
metru a rozkładu normalnego, gdy drugi parametr s2 był znany. W tym celu stoso-
waliśmy funkcję próbki i nieznanego parametru a
x - a
G(x, a) = n ,
s
która przy dowolnym a ma rozkład normalny standaryzowany.
Następujące zagadnienia jednak pozostały nierozwiązane:
2) zbudować dokładny PU dla s , gdy a jest znane,
3) zbudować dokładny PU dla a, gdy s jest nieznane,
4) zbudować dokładny PU dla s , gdy a jest nieznane.
Jak wiadomo, dla rozwiązania sformułowanych zagadnień należy znalezć funk-
cje próbki i parametrów, których rozkłady są z góry znane. W szczególności, w za-
gadnieniu 3 szukana funkcja musi być niezależną od nieznanego parametru s , a w
zagadnieniu 4 od parametru a.
Takie szczególne zaciekawienie rozkładem normalnym związane oczywiście z
CTG prawie wszystko w tym świecie jest normalne (albo jest bliskie tego).
Dlatego w tym rozdziale będziemy się zajmować rozkładami związanymi z roz-
kładem normalnym, zbadamy ich własności oraz własności próbek z rozkładu nor-
malnego.
6.1. Rozkład Gamma i jego własności
Rozkład Gamma a, l jest znany z kursu rachunku prawdopodobieństwa. Mia-
nowicie, gęstość tego rozkładu ma postać
0, gdy y Ł 0,
fa, l ( y) = (6.1)
la
,
G(a) ya-1e-ly gdy y > 0,
57
Ą
gdzie a, l > 0 , G(a) = e-tdt jest funkcja Gamma, mająca w szczególności na-
ta-1
0
stępujące własności: G(a) = (a -1)G(a -1) ; G(1) =1, skąd mamy G(n) = (n -1)! dla
nN ; G(1 2) = p .
W ciągu dalszym nam będzie potrzebna własność stabilności tego rozkładu
względem sumowania.
Własność 1. Niech ZL x1, ..., xn będą niezależne oraz xi ma rozkład Gamma
n
ai , l , i =1, n . Wówczas Sn = ma rozkład .
n
x
i
1 ai , l
i=1
Dowód. Skorzystamy z własności funkcji charakterystycznych (f. ch.). F. ch.
rozkładu Gamma a, l ma postać (patrz rachunek prawdopodobieństwa)
-a
it
ć1
jx (t) = Eeitx = - .
l
Ł ł
F.ch. sumy niezależnych ZL jest iloczynem f.ch. jej składników:
n
-ai - ai
n n 1
jSn (t) = = .
j (t) = ć1- it ć1 - it
xi
l l
Ł ł Ł ł
i=1 i=1
Otrzymana funkcja jest oczywiście f.ch. rozkładu .
n
1 ai , l
Własność 2. Jeżeli ZL x ma rozkład normalny standaryzowany, to ZL x2 ma
rozkład Gamma 1 2, 1 2 .
Dowód. Obliczmy pochodną dystrybuanty ZL x2 i sprawdzmy czy jest ona gę-
stością. Dla y Ł 0 mamy
Fx2 ( y) = P{x2 < y} = 0, a więc gęstość fx2 (y) = 0.
Dla y > 0 mamy
Fx2 (y) = P{x2 < y} = P{- y < x < y} = Fx( y) - Fx(- y) .
Wówczas
ó ó ó ó ó
fx2 (y) = (Fx2 (y)) = Fx( y) ( y ) - Fx (- y)(- y) =
fx ( y)
1 1
= (fx ( y) + fx (- y)) = = e- y 2 .
2 y y 2py
Natomiast funkcja fx2 (y) , która jest równa 0, gdy y Ł 0 , i równa
58
1 (1 2)1 2
fx2 (y) = e- y 2 = y1 2-1e- y 2 ,
G(1 2)
2py
przy y > 0, jest gęstością rozkładu 1 2, 1 2 .
6.2. Rozkład chi-kwadrat (2) i jego własności
Z własności 1 i 2 wynika bezpośrednio następujące stwierdzenie.
Wniosek 1. Jeżeli ZL x1, ..., xk są niezależne i mają rozkład normalny standary-
zowany, to ZL c2 = x12 + ... + xk 2 ma rozkład k 2,1 2 .
k
Definicja 1. Rozkład sumy k kwadratów niezależnych ZL mających rozkład
normalny standaryzowany nazywa się rozkładem chi-kwadrat (c2 ) o k stopniach
swobody i oznacza się Hk . Na mocy wniosku 1 rozkład ten jest rozkładem k 2,1 2 .
My często będziemy oznaczali przez c2 ZL o rozkładzie Hk .
k
Z definicji 1 i wzoru (6.1) wynika, że gęstość ZL c2 ma postać
k
0, gdy y Ł 0,
fc (y) = fk 2,1 2(y) = 1 (6.2)
2
2-1 y 2
k , gdy y > 0.
k 2
2 G(k 2) yk e-
Na rys. 6.1 podano wykres gęstości rozkładu Hk = k 2,1 2 dla k równego 1, 2,
4 i 8.
Ćwiczenie. Udowodnij, że maksimum gęstości rozkładu Hk osiąga się w punk-
cie k - 2 .
Podamy własności rozkładu ZL c2 .
k
1. Stabilność względem sumowania. Niech ZL c2 ma rozkład Hk , ZL c2
k m
ma rozkład Hm i ZL te są niezależne. Wówczas ich suma ma rozkład
Hk +m .
Dowód. Niech x1, x2, ... są niezależne i mają rozkład normalny standa-
ryzowany. Wówczas c2 ma taki sam rozkład jak x12 + ... + xk 2 , c2
k m
59
jak xk +12 + ... + xk +m2 , a ich suma jak x12 + ... + xk +m2 , tj. ma rozkład
Hk +m .
Ćwiczenie. Udowodnij własność 3.
Ćwiczenie. Jak można korzystając z tablicy rozkładu normalnego znalezć kwan-
tyl danego rzędu dla rozkładu c2 o jednym stopniu swobody?
0,9
0,8
0,7
H1
0,6
0,5
H2
0,4
H
4
0,3
H8
0,2
0,1
0
0 2 4 6 8 10 12 14 16
y
Rys. 6.1
2. Momenty rozkładu c2 . Jeżeli ZL c2 ma rozkład Hk , to Ec2 = k i
k k
Dc2 = 2k .
k
Dowód. Niech x1, x2, ... są niezależne i mają rozkład normalny standa-
ryzowany. Wówczas
2
Ex12 =1, Dx12 = Ex14 -(Ex12) = 3 -1 = 2
60
(patrz przykład 2 z rozdziału 4). Mamy wówczas
Ec2 = E(x12 + ... + xk 2) = k , Dc2 = D(x12 + ... + xk 2) = 2k .
k k
3. Niech x1, x2, ... są niezależne i mają rozkład normalny N . Wówczas
a, s2
2
k
xi - a
ZL c2 =
ma rozkład c2 (Hk ) o k stopniach swobody.
ć
k
s
Ł ł
i=1
6.3. Rozkład Studenta i jego własności
Definicja 2. Niech ZL x0, x1, ..., xk są niezależne i mają rozkład normalny stan-
daryzowany. Rozkład ZL
x0 x0
tk = =
1
c2
k
(x12 + ... + xk 2)
k
k
nazywa się rozkładem Studenta o k stopniach swobody i oznacza się Tk .
Znajdziemy gęstość ZL tk . Przypomnijmy najpierw, że jeżeli fx (y) jest gęsto-
ścią ZL x oraz h = ax + b , a ą 0 , to gęstość ZL h ma posrać
1 y - b
fh( y) = fxć . (6.3)
| a | a
Ł ł
Ponieważ c2 k jest funkcją liniową zmiennej c2 , to ze wzoru (6.2) dostajemy
k k
0, gdy y Ł 0,
k 2
fc k = kfc (ky) =
2 2 k
2-1 2
k k
e-ky , gdy y > 0.
2 G(k 2) yk
k 2
Teraz przypomnijmy, że jeżeli fx (y) jest gęstością nieujemnej ZL x to gęstość
fh(y) ZL h = x ma postać
gdy y Ł 0,
0,
fh( y) =
2yfx (y2 ), gdy y > 0.
Gęstość ZL c2 k ma, więc, postać
k
0, gdy y Ł 0,
k 2
2
f (y) =
k
-1 2
c2 k
k e-ky , gdy y > 0.
2 G(k 2) yk
k 2-1
61
Należy teraz skorzystać ze wzoru na gęstość ilorazu niezależnych ZL: jeżeli ZL
x ma gęstość fx (y) , a ZL h ma gęstość fh(y) i ZL te są niezależne, to ZL z = x h
ma gęstość
Ą
fz ( y) = z | fh(z) fx (yz)dz . (6.4)
|
-Ą
Mamy, więc, że gęstość ZL tk ma postać (tu j0,1( y) jest gęstością ZL x0 o rozkła-
dzie normalnym standaryzowanym)
Ą
fk (y) = ftk (y) = f (z)j0,1(yz)z dz =
c2 k
k
-Ą
Ą
k 2
2
k 1
z2
= zk -1e-kz 2 e- y2 zdz =
2p
2k 2-1G(k 2)
0
Ą
2
kk 2
=
zke-(k + y2 )z 2dz.
2k 2-1G(k 2) 2p
0
Podstawiamy (k + y2)z2 2 = t , z dz = dt (k + y2) i otrzymujemy
Ą
k 2
k 2(k -1) 2
fk ( y) = e-tdt =
t(k -1) 2
2k 2-1G(k 2) 2p(k + y2)(k +1) 2
0
-(k +1) 2
ć
G((k +1) 2) 1 G((k +1) 2) y2
1 +
= = .
k
pkG(k 2) pkG(k 2)
(1+ y2 k)(k +1) 2
Ł ł
Czyli ostatecznie
-(k +1) 2
ć
G((k + 1) 2) y2
1+
fk (y) = . (6.5)
k
pkG(k 2)
Ł ł
Wykres gęstości rozkładu Studenta podano na rys. 6.2.
Podamy własności rozkładu Studenta.
1. Symetryczność. Jeżeli ZL tk ma rozkład Studenta Tk o k stopniach swo-
body, to ZL - tk ma taki sam rozkład (Ćwiczenie. Udowodnij).
2. Asymptotyczna normalność. Rozkład Studenta Tk jest słabo zbieżny do
rozkładu normalnego standaryzowanego przy k Ą.
62
Rozkład Studenta k = 2
Rozkład normalny
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-8 -4 0 4 8
Rys 6.2
Dowód. Niech ZL x0, x1, ..., xk są niezależne i mają rozkład normalny
standaryzowany. Wówczas Ex12 =1 i na mocy PWL
c2 x12 + ... + xk 2
k
= p1 gdy k Ą.
k k
Mamy stąd, że
x0
tk = px0 ,
1
(x12 + ... + xk 2)
k
skąd wynika słaba zbieżność ciągu ZL tk mających rozkład Studenta do
ZL x0 mającej rozkład normalny standaryzowany. Tj. Tk N0,1.
3. Rozkład Studenta o jednym stopniu swobody jest standaryzowanym roz-
kładem Cauchy ego.
Dowód. Podstawmy k =1 do wzoru (6.5). Wówczas biorąc pod uwagę, że
G(1 2) = p oraz G(1) =1, otrzymujemy gęstość rozkładu Cauchy ego:
1
f1(y) = (1 + y2)-1.
p
4. Dla rozkładu Studenta istnieją tylko momenty rzędu m < k i nie istnieje
momentów rzędu m ł k , przy czym wszystkie momenty nieparzystych
rzędów są równe zeru.
63
Ćwiczenie. Popatrz na gęstość (6.5) i przekonaj się co do zbieżności bądz roz-
bieżności dla odpowiednich m całek o postaci
Ą
1
m
C(k) y dy.
(k + y2)(k +1) 2
-Ą
Podamy teraz wzory na charakterystyki ZL o rozkładzie Studenta.
knG(k 2 - n)G(n + 1 2)
Etk 2n-1 = 0 , Etk 2n = , 2n < k ;
pG(k 2)
k
, gdy k > 2,
Dtk =
k - 2
Ą, gdy k Ł 2.
Obliczmy np. wariancję ZL tk . Ponieważ Etk = 0 (jeśli istnieje), to
ć
x02
Dtk = Etk 2 = E = kEx02E(c2 )-1.
k
(1 k)c2
Ł k ł
Uwzględniając, że c2 ma rozkład Gamma, a Ex02 =1, możemy napisać
k
Ą Ą
1 1 1
Dtk = k 1 yk 2-1e- y 2dy = k yk 2-2e- y 2dy.
y
2k 2G(k 2) 2k 2G(k 2)
0 0
Ostatnia całka jest zbieżna dla k > 2 , a zatem wariancja istnieje dla k > 2 . Z
własności funkcji Gamma mamy
2k 2-1G(k 2 -1) G(k 2 -1) k
Dtk = k = k = .
2(k 2 -1)G(k 2 -1) k - 2
2k 2G(k 2)
Ćwiczenie. Doprowadzić wzory na momenty rozkładu Studenta do postaci nie
zawierającej funkcji Gamma.
Zauważmy, że rozkłady c2 i Studenta są stablicowane, tak, że jeżeli będzie po-
trzebne zbudować jakiś PU przez obliczanie kwantylów, to kwantyle znajdziemy za
pomocą tablic.
Następny rozkład także jest związany z rozkładem normalnym, natomiast korzy-
stać z niego będziemy pózniej w zagadnieniach weryfikacji hipotez. Tam że będzie
zrozumiałe dlaczego ten rozkład jest nazywany rozkładem stosunku wariancji.
64
6.4. Rozkład Fishera
Definicja 3. Niech ZL c2 ma rozkład Hk , a ZL c2 ma rozkład Hm , przy czym
k m
ZL te są niezależne. Rozkład ZL
c2 k m c2
k k
fk, m = =
c2 m k c2
m m
nazywa się rozkładem Fishera (rozkładem F Snedecora) o k, m stopniach swobody i
oznacza się Fk, m .
Znajdziemy gęstość fk, m ( y) ZL fk, m . Ze wzoru (6.3) mamy
m m
(6.6)
fk, m (y) = fc c2 ć y ,
2
k m
k k
Ł ł
Na podstawie wzoru (6.4) znajdujemy
Ą
fc c2 (y) = z | fc (z) fc (yz)dz =
2 2 2
|
k m m k
-Ą
Ą
1 1
= zm 2-1e- z 2 ( yz)k 2-1e- yz 2dz =
z
2m 2G(m 2) 2k 2G(k 2)
0
Ą
1
= yk 2-1 +m) 2-1e- z( y+1) 2dz =
z(k
2(k +m) 2G(k 2)G(m 2)
0
2(k +m) 2 G((k + m) 2)
= yk 2-1 .
2(k +m) 2G(k 2)G(m 2) ( y +1)(k +m) 2
Ze wzoru (6.6) wynika, że
k 2-1
m G((k + m) 2) k 1
ć
fk, m ( y) = y =
k G(k 2)G(m 2) m
Ł ł
((k m) y + 1)(k + m) 2
m 2
G((k + m) 2) k ym 2-1
ć
= .
G(k 2)G(m 2) m
Ł ł ( y + k m)(k +m) 2
Ostatecznie gęstość rozkładu Fishera ma postać
0, gdy y Ł 0,
m 2
fk, m(y) =
G((k + m) 2) k ym 2-1
ć
, gdy y > 0.
G(k 2)G(m 2)
m
Ł ł
(y + k m)(k +m) 2
Własności rozkładu Fishera:
1. Jeżeli ZL fk, m ma rozkład Fk, m , to ZL 1 fk, m ma rozkład Fm, k .
65
2. Rozkład Fk, m jest słabo zbieżny do rozkładu degeneratywnego w punkcie 1
(I1 ), gdy k i m dążą do nieskończoności w sposób dowolny.
Dowód. Wystarczy przekonać się za pomocą PWL, że dowolny ciąg ZL
hk, m , których rozkład zgadza się z rozkładem stosunku dwóch średnich aryt-
x12 + ... + xk 2 h12 + ... + hm2
metycznych
i , gdzie ZL x1, x2, ... i h1, h2, ...
k m
są ciągami niezależnych ZL o rozkładzie normalnym standaryzowanym, jest
zbieżny według prawdopodobieństwa do 1, gdy k Ą i m Ą .
Obliczmy teraz WO i wariancję ZL fk, m .
ć ć
m c2 m 1
k
Efk, m = E = Ec2E
k
,
k
c2 k c2
Ł m ł Ł m ł
ale Ec2 = k , a dla m > 2 mamy
k
Ą
ć
1 1 1 G(m 2 -1) 1
E = ym 2-1e-m 2dy = = .
y 2G(m 2) m - 2
c2 2m 2G(m 2)
Ł m ł
0
Zatem dla m > 2 otrzymujemy
m 1 m
Efk, m = k = ;
k m - 2 m - 2
Efk, m nie istnieje dla m Ł 2.
Obliczmy E( fk, m )2. Mamy
2
ć
m c2 m2
k
E( fk, m)2 = E = E E(c2 )2E(c2 )-2 .
k m
k
c2 k2
Ł m ł
Jest jasne, że E(c2 )2 = D(c2 ) + (E(c2 ))2 = k2 + 2k . Ponieważ ZL c2 ma roz-
k k k m
kład c2 o m stopniach swobody (dla m > 4 ) mamy
Ą Ą
1 1
E(c2 )-2 = ym 2-1y-2e- y 2dy = y(m-4) 2-1e- y 2dy =
m
2m 2G(m 2) 2m 2G(m 2)
0 0
1 G(m 2 - 2) 1
= 2m 2-2G(m 2 - 2) = = .
4(m 2 -1)(m 2 - 2)G(m 2 - 2) (m - 2)(m - 4)
2m 2G(m 2)
Zatem otrzymujemy
m2 k(k + 2)
E(c2 )2 = ,
k
2
(m - 2)(m - 4)
k
66
m2 k(k + 2) m2 2m2(k + m - 2)
D(c2 ) = - = .
k
2
(m - 2)(m - 4)
k (m - 2)2 k(m - 2)2(m - 4)
Rozkład Fishera jest stablicowany.
6.5. Przekształcenia normalnych próbek
Niech x1, ..., xn będzie próbką z rozkładu N0,1 (zespół niezależnych ZL o jed-
nakowym rozkładzie). Rozważmy wektor losowy x = (x1, ..., xn ) . Niech C jest macie-
rzą ortogonalną n n (jej elementy oznaczmy przez cij ), tj.
1 0
ć
CCT = E = O ,
0 1
Ł ł
n
oraz y = C x będzie wektorem o współrzędnych yi = x .
c
ij j
j =1
Jaki rozkład mają współrzędne wektora y? Czy są one zależne? Aby odpowie-
dzieć na postawione pytania wyjaśnimy jak zmieni się gęstość wektora losowego
x = (x1, ..., xn ) po jego mnożeniu przez dowolną macierz nieosobliwą.
Z rachunku prawdopodobieństwa jest wiadomo jak znalezć gęstość ZL c x zna-
jąc gęstość x: fcx (y) =| c |-1 fx (c-1 y) .
Analogiczne stwierdzenie zachodzi w przypadku wielowymiarowym. Dla jego
dowodu, który pomijamy, należy skorzystać z zamiany zmiennych w całce wielo-
wymiarowej przy użyciu pojęcia jakobianu.
Zmiana gęstości rozkładu łącznego dla liniowego przekształcenia wektora
losowego. Niech wektor losowy x ma gęstość fx (z1, ..., zn ) = fx (z) oraz C jest ma-
cierzą nieosobliwą. Wówczas wektor losowy y = C x ma gęstość
-1
fy (z) = fCx (z) = det C fx(C-1 z) . (6.7)
Udowodnijmy teraz bardzo ciekawą własność rozkładu normalnego.
Własność 1. Niech wektor losowy x składa się z niezależnych ZL o rozkładzie
normalnym standaryzowanym, C jest macierzą ortogonalną oraz y = C x . Wówczas
składowe wektora y są niezależne i mają rozkład normalny standaryzowany.
Dowód. Zapiszemy gęstość rozkładu łącznego wektora x. Na mocy niezależno-
ści jest to iloczyn gęstości składowych (to samo co funkcja wiarygodności):
67
n
1
1
2
- zi 2
n
- z
1 1
2
i=1 2
fx (z1, ..., zn ) = fxi (zi ) = e = e .
(2p)n 2 (2p)n 2
i =1
2
Tu dla dowolnego z kwadrat normy z jest
n
2
z = = zT z .
z 2
i
i =1
Korzystając ze wzoru (6.7) obliczmy gęstość wektora y = C x . Macierz C jest
ortogonalna, dlatego C-1 = CT oraz det C =1.
2
1
- CT z
1
2
fy (z) = fx(CT z) = e .
(2p)n 2
Natomiast mnożenie przez macierz ortogonalną nie zmienia, jak wiadomo, normę
wektora. Istotnie,
2
2
CT z = (CT z)T (CT z) = (zT C) (CT z) = zT E z = z . (6.8)
Ostatecznie mamy
n
1
1
2
- zi 2
- z
1 1
2
2 i=1
fy (z) = e = fx (z) = e .
(2p)n 2 (2p)n 2
Oznacza to, że wektor y składa się z takich samych ZL niezależnych mających
rozkład normalny standaryzowany, co wektor x.
Ćwiczenie. Niech ZL x i h są niezależne i mają rozkład normalny standaryzo-
1 1
wany. Czy są niezależne ZL (x - h) i (x + h) ? Czy będzie ortogonalną ma-
2 2
cierz
1 1
ć
-
2 2
?
C =
1 1
2 2
Ł ł
Lemat Fishera. Niech wektor losowy x = (x1, ..., xn ) składa się z n niezależnych
ZL o rozkładzie normalnym standaryzowanym, C jest macierzą ortogonalną oraz
n
y = C x . Wówczas dla dowolnego k =1, n ZL T (x) = - y12 - ... - yk 2 nie zale-
x 2
i
i=1
ży od ZL y1, ..., yk i spełnia rozkład c2 o n - k stopniach swobody (tj. rozkład
Hn-k ).
68
Dowód. Jak widać ze wzoru (6.3), normy wektorów x i y są równe siebie:
n n
= x = = yi 2 .
x 2 2 C x 2
i
i =1 i =1
Wówczas
n n
T (x) = - y12 - ... - yk 2 = yi 2 -y12 - ... - yk 2 = yk +12 + ... + yn2 .
x 2
i
i =1 i =1
ZL y1, ..., yn są niezależne i mają rozkład normalny standaryzowany wobec własno-
ści 1, dlatego T (x) = yk +12 + ... + yn2 ma rozkład Hn-k i nie zależy od y1, ..., yk .
Główny wniosek z lematu Fishera. Jeżeli ZL x1, ..., xn są niezależne i mają
rozkład normalny N , to
a, s2
x - a
1) n ma rozkład normalny standaryzowany;
s
2
(n -1)s0 n - x)2
i
2) =
ma rozkład c2 o n -1 stopniach swobody;
(x
s2 s2
i=1
2
3) ZL x i s0 są niezależne.
2
(n -1)s0
Okazało się, że wbrew definicji 1 rozkładu Hn-1 wielkość
jest sumą
s2
nie n -1, a n składników, przy czym składniki te są zależne wobec obecności każde-
go z xi w x . Dodamy do tego, że chociaż wskazane składniki mają ten sam rozkład,
rozkład ten różni się od N0,1.
2
Zauważmy bez dowodu, że niezależność x i s0 jest własnością wyłącznie roz-
kładu normalnego, także jak własność zachowania składowych po mnożeniu przez
macierz ortogonalną.
Dowód.
1. Jest oczywiste.
2. Pokażemy na wstępie, że można rozpatrywać próbkę z rozkładu normalnego
standaryzowanego zamiast N :
a, s2
2
2
n
ć
(n -1)s0 n - x)2 n xi - a x - a
= = - = ,
(xi (z - z)2
i
s s
s2 s2
i=1 i=1Ł ł i =1
69
xi - a x - a
gdzie zi =
ma rozkład normalny standaryzowany i z = . Tj. mo-
s s
glibyśmy od początku zakładać, że xi mają rozkład normalny standaryzowa-
ny i dowodzić punkt 2 w przypadku a = 0, s2 =1.
Stosujemy lemat Fishera:
n n n
2
T (x) = (n -1)s0 = = - n(x)2 = - y12 .
(x - x)2 x 2 x 2
i i i
i =1 i=1 i =1
x1 xn
Przez y1 oznaczyliśmy tu wielkość y1 = n x = + ... + . Aby można
n n
było stosować lemat Fishera należy znalezć macierz ortogonalną C, taką, że
y1 jest pierwszą współrzędną wektora y = C x . Bierzemy macierz C z
1 1
ć
pierwszym wierszem ... . Ponieważ długość (norma) tego wektora
n n
Ł ł
równa się 1, można go dopełnić do bazy ortonormalnej w Rn (tj. ten słupek
można dopełnić do macierzy ortogonalnej). Wówczas y1 = n x i będzie
pierwszą współrzędną wektora y = C x . Zostało więc skorzystać z lematu
Fishera, wobec którego ZL T (x) nie zależy od y1 i ma rozkład c2 o n -1
stopniach swobody.
2
3. Z lematu Fishera i punktu 2 natychmiast wynika, że T (x) = (n -1)s0 =
n
2
= - y12 nie zależy od y1 = n x , tj. ZL x i s0 są niezależne.
x 2
i
i=1
Kolejny wniosek z lematu Fishera pozwoli nam budować dokładne PU dla pa-
rametrów rozkładu normalnego. W każdym punkcie tego wniosku chodzi o konkret-
ny parametr dla którego buduje się PU.
Wniosek z głównego wniosku lematu Fishera.
x - a
1) n ma rozkład normalny standaryzowany (dla a gdy s jest znane);
s
2
n
2)
ma rozkład Hn (dla s2 gdy a jest znane);
ć xi - a
s
Ł ł
i =1
2
n
i
3) =
(x - x)2 (n -1)s0 ma rozkład Hn-1; (dla s2 gdy a jest nieznane);
s2 s2
i =1
x - a x - a
4) n = n ma rozkład Tn-1 (dla a gdy s jest nieznane).
2
s0
s0
70
Dowód. 1) i 3) wynika natychmiast z lematu Fishera, 2) wynika ze wniosku 1.
Pozostaje skorzystać z lematu Fishera i definicji 2 dla dowodu 4):
x - a x - a 1 x0
n = n = .
2 2
s
s0 (n - 1)s0 1 c2
n-1
n - 1 n -1
s2
N0,1
Hn-1
niezależne
Według definicji 2 stosunek ten ma rozkład Studenta Tn-1.
6.6. Dokładne przedziały ufności dla parametrów rozkładu
normalnego
1. Dla a gdy s jest znane. Ten PU był przez nas zbudowany w przykładzie 1 z
rozdziału 5:
t1-e 2s t1-e 2s
Pa x - < a < x + = 1 - e , gdzie F0, 1(t1-e 2 ) =1 - e 2 .
ż
n n
2. Dla s2 gdy a jest znane. Według p. 2 wniosku
n
ns2 1
.
ma rozkład Hn , gdzie s2 =
(x - a)2
i
n
s2
i=1
Niech g1 = c2 oraz g2 = c2 są kwantylami rozkładu Hn rzędu e 2 i
n, e 2 n,1-e 2
1 - e 2 . Wówczas
ns2
ns2 ns2
1 - e = P = P < s2 <
g < < g2 ż
a, s2 1
g2 g1 ż.
s2 a, s2
3. Dla s2 gdy a jest nieznane. Z p. 3 wniosku wynika, że
2
n
(n -1)s0 1
2
.
ma rozkład Hn-1, gdzie s0 =
(x - x)2
n -1i=1 i
s2
Niech g1 = c2 i g2 = c2
są kwantylami rozkładu Hn-1 rzędu e 2
n-1, e 2 n-1,1-e 2
i 1 - e 2 . Wówczas
71
2 2 2
(n -1)s0
(n -1)s0 (n -1)s0
1 - e = P < g2 ż = P < s2 <
g <
a, s2 1 a, s2
g2 g1 ż.
s2
4. Dla a gdy s jest nieznane. Z p. 4 wniosku wynika, że
n
x - a 1
2
n ma rozkład Tn-1, gdzie s0 = .
(x - x)2
s0 n -1i=1 i
Niech a1 = tn-1, e 2 i a2 = tn-1,1-e 2 są kwantylami rozkładu Tn-1 rzędu e 2 i
1 - e 2 . Rozkład Studenta jest symetryczny, tj. a1 = -a2 . Wówczas
x - a
1 - e = P =
- tn-1,1-e < n < tn-1,1-e ż
2 2
a, s2
s0
tn-1, 1-e 2s0 tn-1, 1-e 2s0
= P < a < x +
x - ż.
a, s2
n n
Ćwiczenie. Porównaj p. 1 z p. 4.
Uwaga 1. PU otrzymane w p. 2 i 3 wyglądają dziwnie w porównaniu z PU z p. 1
i 4: oni zawierają n w liczniku a nie w mianowniku. Jeżeli jednak kwantyle rozkładu
normalnego w ogóle nie zależą od n, kwantyle rozkładu Studenta nie zależą od n
asymptotycznie na mocy własności Tn N0,1, to kwantyle Hn zależą od n w spo-
sób istotny. Istotnie, niech g = g(n) jest takie, że P{c2 < g} = d dla wszystkich n, w
n
g - n
tym i dla n Ą . Wówczas ciąg g(n) jest taki, że td przy n Ą , gdzie td
2n
jest kwantylem rozkładu normalnego standaryzowanego. Istotnie, na mocy CTG przy
n Ą mamy
n
c2
- n g - n
P{c2 < g} = P i2 < gż = P n < F0,1(td) = d .
x ż
n
2n 2n
i=1
Wówczas kwantyl rzędu d rozkładu Hn zachowuje się jako g = g(n) =
= td 2n + o( n) .
Ćwiczenie. Podstawić w wyrażenia dla granic PU z p. 2 i 3 wyrażenia asympto-
tyczne dla kwantylów i wyjaśnić jak zachowuje się długość tych PU ze wzrostem n.
72
Wyszukiwarka
Podobne podstrony:
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 2Tikhonenko O Wykłady ze statystyki matematycznej Wykład 3Tikhonenko O Wykłady ze statystyki matematycznej Wykład 7Tikhonenko O Wykłady ze statystyki matematycznej Wykład 5Tikhonenko O Wykłady ze statystyki matematycznej Wykład 1Boratyńska A Wykłady ze statystyki matematycznejWislicki W Zadania ze statystyki matematycznejwykład statystyka matematyczna cz 4wykład S1 Statystyka matematycznaMikołaj Rybaczuk Materiały do ćwiczeń i wykładów ze statystyki Politechnika BIałostockaWykład ze statystyki dobryWyklady ze statystykiWzory statystyka MatematycznaSTATYSTYKA MATEMATYCZNA w1więcej podobnych podstron