1
Twierdzenia graniczne (wykład 4)
Twierdzenia graniczne zarówno w teorii prawdopodobieostwa, jak i w praktyce badao
statystycznych mają ogromne znaczenie. W twierdzeniach tych rozpatruje się ciągi
zmiennych losowych, powiedzmy {X
n
}, których rozkłady – przy wzroście wskaźnika n do
nieskooczoności – mogą byd zbieżne do pewnego rozkładu. Jeśli takie zjawisko występuje, to
taki rozkład nazywany jest rozkładem granicznym (asymptotycznym) ciągu zmiennych
losowych {X
n
}. Mówi się wtedy również, że zmienna losowa X
n
ma graniczny (asymptotyczny)
rozkład o określonej postaci
1
.
Rozróżnia się dwa rodzaje twierdzeo granicznych:
lokalne,
integralne.
Twierdzenia graniczne lokalne dotyczą zbieżności ciągów funkcji rozkładu
prawdopodobieostwa zmiennych losowych typu skokowego bądź funkcji gęstości
prawdopodobieostwa zmiennych typu ciągłego.
Twierdzenia graniczne integralne dotyczą zbieżności ciągów dystrybuant. W obu
przypadkach najbardziej istotną rzeczą jest poznanie granic tych ciągów
2
.
Do grupy twierdzeo lokalnych należy między innymi tzw. przybliżenie Poissona.
Dowodzi się, że przy n→∞ zmienna losowa X o rozkładzie dwumianowym zmierza do
rozkładu Poissona. Mówimy wówczas, że rozkład Poissona jest granicznym rozkładem
rozkładu dwumianowego, czyli:
,
!
lim
)
(
lim
e
k
q
p
k
n
k
X
P
k
k
n
k
n
n
gdzie λ=np jest dodatnią stałą (λ>0), natomiast k = 0, 1, ... Przybliżenie jest tym lepsze, im p
jest mniejsze, a n większe
3
.
Przykład 1
4
Siła kiełkowania nasion łubinu wynosi 0,98. Prawdopodobieostwo, że na 100 nasion
wybranych wszystkie wykiełkują, jest równe prawdopodobieostwu, że wśród 100 ziaren nie
ma ziaren niezdolnych do wykiełkowania. Podobnie prawdopodobieostwo, że na 100 nasion
wykiełkuje 99, jest równe prawdopodobieostwu, że na 100 nasion jedno nie wykiełkuje itd.
Prawdopodobieostwo wybrania nasienia niezdolnego do wykiełkowania jest zatem równe
p=0,02.
1. Na podstawie wzoru Bernoulliego obliczyd prawdopodobieostwa, że na 100 nasion a)
wszystkie wykiełkują, b) jedno nie wykiełkuje, c) dwa nie wykiełkują.
2. Odczytad odpowiednie prawdopodobieostwa z tablic rozkładu Poissona.
Najstarszym twierdzeniem granicznym dotyczącym zbieżności do innego rozkładu niż rozkład
jednopunktowy jest (udowodnione w XVIII wieku przez A. de Moivre’a, a na początku XIX wieku przez P.S.
Laplace’a) twierdzenie o zbieżności rozkładu dwumianowego do rozkładu normalnego. Twierdzenie to
przedstawione jest poniżej jako integralne twierdzenie graniczne
5
.
1
J. Jóźwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2006, s. 152.
2
C. Platt, Problemy rachunku prawdopodobieostwa i statystyki matematycznej, PWN, Warszawa 1974, s. 66.
3
M. Sobczyk, Statystyka, PWN, Warszawa 2002, s. 124.
4
C. Platt, Problemy rachunku prawdopodobieostwa i statystyki matematycznej, PWN, Warszawa 1974, s. 49 i 71.
5
J. Jóźwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2006, s. 160-162.
2
Abraham de Moivre (1667-1754) – matematyk angielski pochodzenia francuskiego; zajmował się
teorią szeregów, rachunkiem prawdopodobieostwa i teorią liczb zespolonych
6
.
Pierre Simon de Laplace (1749-1827) – francuski astronom, matematyk i fizyk; zajmował się głównie
fizyką matematyczną i mechaniką nieba; usystematyzował i rozwinął rachunek prawdopodobieostwa
7
.
Z twierdzenia Moivre’a-Laplace’a wynikają następujące wnioski:
1) ciąg niestandaryzowanych zmiennych losowych {X
n
} o rozkładzie dwumianowym z
parametrami n i p jest zbieżny do rozkładu normalnego
;
, npq
np
N
2) ciąg zmiennych losowych
,
n
X
Y
n
n
gdzie X
n
jest zmienną losową o rozkładzie
dwumianowym, ma asymptotyczny rozkład normalny
8
.
,
n
pq
p
N
Przykład 2
9
.
Ośrodek Badania Opinii Publicznej (OBOP) ocenia, że 50% rodzin polskich żyje w ubóstwie
(poniżej minimum socjalnego). Wybrano losowo 100 rodzin polskich. Obliczyd, jakie jest
prawdopodobieostwo, że liczba rodzin żyjących w ubóstwie (wśród wybranych):
a) jest mniejsza niż 60,
b) przekracza 40.
Za najważniejsze twierdzenie statystyki matematycznej uznaje się udowodnione przez
J.W. Lindeberga i P. Lévy’ego tzw. centralne twierdzenie graniczne. Dotyczy ono zbieżności
sum niezależnych zmiennych o takich samych rozkładach (rozkład nie musi byd znany) z
rozkładem normalnym.
Załóżmy, że dany jest ciąg X
1
, X
2
, ...,X
n
niezależnych zmiennych losowych o jednakowym
rozkładzie. Zmienne losowe mają jednakowe rozkłady prawdopodobieostwa, a więc również
identyczne wartości oczekiwane E(X
i
)=m i wariancje D
2
(X
i
)=σ
2
. Oznaczmy przez Z
n
następującą zmienną losową:
,
...
1
2
1
n
i
i
n
n
X
X
X
X
Z
o wartości oczekiwanej i wariancji
E(Z
n
)=nm,
D
2
(Z
n
)=nσ
2
.
Z centralnego twierdzenia granicznego wynika, że jeśli n jest duże, to rozkład zmiennej
losowej Z
n
można przybliżad rozkładem normalnym z wartością oczekiwaną nm i
odchyleniem standardowym
10
.
n
Krótko można to zapisad:
.
,
~
n
nm
N
Z
n
Z twierdzenia wynika również, że średnia arytmetyczna
n
n
X
X
X
n
X
...
1
2
1
niezależnych zmiennych losowych X
1
, X
2
, …, X
n
o jednakowych rozkładach ma – jeśli n→∞ –
asymptotycznie rozkład
11
).
,
(
n
m
N
6
Matematyka. Encyklopedia szkolna, Wydawnictwa Szkolne i Pedagogiczne, Warszawa 1990, s. 254.
7
Matematyka. Encyklopedia szkolna, Wydawnictwa Szkolne i Pedagogiczne, Warszawa 1990, s. 254.
8
M. Sobczyk, Statystyka, PWN, Warszawa 2002, s. 124-125.
9
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 1997, s. 195-196.
10
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 1997, s. 197-198; M. Sobczyk, Statystyka,
PWN, Warszawa 2002, s. 125-126.
3
Przykład 4
12
.
Wiadomo, że średnia waga dorosłego człowieka wynosi 75 kg i odchylenie standardowe
wagi wynosi 3 kg. Samolot zabiera 81 pasażerów. Obliczyd prawdopodobieostwo, że łączna
waga pasażerów przekroczy 6 ton.
Przykład 5
13
W grupie studentów przeprowadzany jest test ze statystyki, w którym można uzyskad od 0
do 100 punktów. Liczba punktów, jaką może otrzymad pojedynczy (i-ty) student, jest
zmienną losową, którą oznaczad będziemy przez X
i
. Przyjmijmy, że rozkład niezależnych
zmiennych X
i
jest identyczny dla wszystkich studentów (chociaż postad tego rozkładu nie jest
znana), przy czym wartośd oczekiwana wynosi 70 punktów, a odchylenie standardowe
wynosi 20 punktów dla każdego i. Należy obliczyd prawdopodobieostwo tego, że:
a) suma punktów uzyskana przez 100 studentów będzie większa niż 7500,
b) przeciętna liczba punktów przypadających na jednego studenta w 100-osobowej grupie
zawierad się będzie w przedziale 65-70 punktów.
Ogólnie rzecz biorąc, twierdzenia centralne stwierdzają, że gdy zmienna losowa może byd
traktowana jako suma znacznej liczby zmiennych losowych, z których żadna nie ma
dominującego wpływu na wielkośd tej sumy, to suma ta ma zwykle rozkład normalny
14
.
11
J. Wawrzynek, Metody opisu i wnioskowania statystycznego, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 2007, s. 95-96; Z. Bobowski, Wybrane metody statystyki
opisowej i wnioskowania statystycznego, Wyd. WWSZiP, Wałbrzych 2004, s. 118-119.
12
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 1997, s. 198.
13
J. Jóźwiak, J. Podgórski, Statystyka od podstaw, PWE, Warszawa 2006, s. 163-164.
14
J. Wawrzynek, Metody opisu i wnioskowania statystycznego, Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław 2007, s. 95-96.