Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 1
8 Twierdzenia graniczne
8.1 Nierówność Czebyszewa
Nierówność Czebyszewa daje ilościowe oszacowanie zjawiska polegającego na grupowaniu
się wartości zmiennej losowej wokół jej wartości oczekiwanej.
Jeżeli X jest zmienna losową mającą skończona wartość oczekiwaną
μ i wariancję
0
2
>
σ
to dla dowolnego t>0 zachodzi nierówność:
2
1
)
-
X
P(
t
t
≤
≥
σ
μ
(8.1)
Nierówność Czebyszewa obejmuje rozkłady wszystkich typów o ile spełniają wspomnaine w
twierdzeniu bardzo ogólne założenia.
Dla rozkładów ciągłych, których gęstość prawdopodobieństwa ma tylko jedno maksimum
lokalna (rozkłady jednomodalne) i jest symetryczna, zachodzi (przy dodatkowych
informacjach o rozkładzie zmiennej losowej) lepsze oszacowanie Gaussa:
2
9
4
)
-
X
P(
t
t
≤
≥
σ
μ
(8.2)
W praktyce mamy do czynienia na ogół ze zmiennymi losowymi, które za bardzo małym
prawdopodobieństwem przyjmują wartości spoza przedziału
σ
μ
σ
μ
3
,
3
-
+
. Dlatego, gdy
nieznany jest rozkład zmiennej losowej, a znane są tylko parametry jej rozkładu
μ i σ ,
pomija się możliwość przyjęcia przez zmienną losową wartości spoza przedziału
σ
μ
σ
μ
3
,
3
-
+
. Postępowanie takie przyjęto nazywać postępowaniem zgodnym z prawem
trzech sigm.
PRZYKŁAD 8.1
Należy oszacować
)
3
)
-
X
P(
σ
μ
≥
dla rozkładu
N(0,1)
korzystając kolejno z nierówności Czebyszewa (8.1),
następnie z nierówności (8.2) i z tablic rozkładu normalnego.
Rozwiązanie:
Z nierówności Czebyszewa:
111
.
0
9
1
)
3
)
-
X
P(
≈
≤
≥
μ
z nierówności Gaussa:
049
.
0
9
9
4
)
3
)
-
X
P(
≈
⋅
≤
≥
μ
z tablic:
0027
.
0
)
99865
.
0
1
(
2
))
3
(
1
(
2
3
)
-
X
P(
=
−
=
Φ
−
=
≥
μ
Jest widoczne, że najgrubsze przybliżenie pochodzi od nierówności Czebyszewa i jest ok. 50 razy większe od
oszacowania dokładnego.
Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 2
PRZYKŁAD 8.2
Należy oszacować zilustrowac prawo trzech sigm na przykładzie zmiennej o rozkładzie
N(0,1)
.
Rozwiązanie:
z tablic:
997
.
0
1
99865
.
0
2
1
)
3
(
2
))
3
(
1
(
)
3
(
)
3
(
)
3
(
3)
X)
P(
=
−
⋅
=
−
Φ
⋅
=
Φ
−
−
Φ
=
−
Φ
−
Φ
=
≤
A zatem jeśli przyjmiemy, że zmienna losowa ma rozkład normalny to prawdopodobieństwo tego, że zmienna
losowa przyjmie wartości spoza przedziału trzech sigm jest mniejsze od 0.3%.
8.2 Twierdzenia graniczne
Twierdzenia graniczne dotyczą
własności ciągów zmiennych losowych
,...
,...,
,
2
1
n
X
X
X
Twierdzenia graniczne można połączyć w grupy:
• twierdzeń granicznych lokalnych dotyczących zbieżności ciągu funkcji
prawdopodobieństwa zmiennych losowych dyskretnych oraz zbieżności ciągu gęstości
prawdopodobieństwa zmiennych losowych ciągłych,
• twierdzeń granicznych integralnych dotyczących zbieżności ciągu dystrybuant ciągu
zmiennych losowych.
Twierdzenia integralne
dotyczące ciągu niezależnych zmiennych losowych nazywamy
centralnymi.
Tutaj ograniczymy się do omówienia dwóch ważniejszych centralnych twierdzeń
granicznych.
Twierdzenie (centralne graniczne) Lindeberga-Levy’ego (CTG LL)
Jeżeli
,...,
,
2
1
X
X
są niezależnymi zmiennymi losowymi o tym samym rozkładzie mającym
wartość oczekiwaną
μ i standardowe odchylenie
0
≠
σ
to ciąg dystrybuant
)
(
N
n
F
n
∈
zmiennych losowych:
n
n
X
n
X
Y
n
i
i
n
i
i
n
σ
μ
σ
μ
∑
∑
=
=
−
=
−
=
1
1
)
(
(8.3)
spełnia dla każdego
R
y
∈
warunek:
du
e
y
F
y
u
n
n
∫
∞
−
−
∞
→
=
2
/
2
2
1
)
(
lim
π
(8.4)
Oznacza to innymi słowy, że ciąg zmiennych losowych (8.3) jest zbieżny według dystrybuant
do zmiennej losowej o rozkładzie normalnym
N
(0,1). Jeżeli zachodzi wzór (8.4) to mówimy,
że zmienna losowa
∑
=
n
i
i
X
1
ma rozkład asymptotycznie normalny
N
(
μ
n
,
n
σ
)
Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 3
Z twierdzenia LL wynika, że:
)
(
)
(
)
(
lim
1
2
2
1
y
y
y
Y
y
P
n
Φ
−
Φ
=
<
<
∞
→
(8.5)
Możemy zatem uznać, że dla dostatecznie dużego n zachodzi:
)
(
)
(
)
(
lim
1
n
n
a
n
n
b
b
X
a
P
n
i
i
n
σ
μ
σ
μ
−
Φ
−
−
Φ
=
<
<
∑
=
∞
→
(8.6)
gdzie a i b są pewnymi stałymi.
Ważnym wnioskiem z CTG jest także to, że średnia arytmetyczna niezależnych zmiennych
losowych o jednakowych rozkładach nawet znacznie różniących się od siebie, jest z dobrym
przybliżeniem normalna. Jeśli bowiem, zgodnie z powyższym
∑
=
n
i
i
X
1
ma rozkład
asymptotycznie normalny
N( μ
n
,
n
σ
) to
n
X
n
i
i
∑
=1
ma rozkład
N( μ ,
n
/
σ
)
Sformułujemy teraz nieco ogólniejsze CTG:
Twierdzenie (centralne graniczne) Lindeberga-Fellera (CTG LF) (1922,1937)
Niech
,...,
,
2
1
X
X
będą niezależnymi zmiennymi losowymi niekoniecznie o tym samym
rozkładzie mającymi wartości oczekiwane
i
i
X
μ
=
)
(
E
i wariancje
2
i
σ . Tworzymy zmienną
losową:
∑
∑
=
=
−
=
n
i
i
n
i
i
i
n
X
Y
1
2
1
)
(
σ
μ
(8.7)
Okazuje się, że przy bardzo słabych założeniach co do zmiennych losowych X
i
ciąg
dystrybuant
)
(
N
n
F
n
∈
zmiennych losowych Y
n
spełnia dla każdego
R
y
∈
warunek:
)
(
2
1
)
(
lim
2
/
2
y
du
e
y
F
y
u
n
n
Φ
=
=
∫
∞
−
−
∞
→
π
(8.8)
Oznacza to innymi słowy, że ciąg zmiennych losowych jest zbieżny według dystrybuant do
zmiennej losowej o rozkładzie normalnym
N(0,1). Jeżeli zachodzi wzór (8.8) to mówimy, że
zmienna losowa
∑
=
n
i
i
X
1
ma rozkład asymptotycznie normalny.
Podobna zależność zachodzi dla kwantyli zmiennej losowej (8.7). Jeśli założymy, że istnieje i
jest zdefiniowany jednoznacznie kwantyl rzędu
α zmiennej losowej
n
Y
-
)
(
α
n
y
to wtedy
także zachodzi:
Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 4
)
(
)
(
lim
α
α
y
y
n
n
=
∞
→
(8.9)
gdzie
)
(
α
y
jest kwantylem rzędu
α zmiennej losowej o rozkładzie N(0,1).
W powyższym twierdzeniu nie sformułowaliśmy założeń twierdzenia. Zwykle założenia te
formułuje się w formie warunku wystarczającego tzw. warunku Lindeberga. Nie będziemy
tutaj formułować tego warunku. Ograniczymy się do stwierdzenia, że nakłada on ograniczenie
aby wpływ każdego ze składników
i
i
X
μ
−
na unormowaną sumę (8.7) stawał się znikomo
mały gdy
∞
→
n
.
Z CTG LF wynikają ważne wnioski:
1. CTG LL jest szczególnym przypadkiem CTG LF.
Aby uzasadnić ten wniosek wystarczy przyjąć, że dla każdego i
μ
=
)
(
E
i
X
oraz dla
każdego i
σ
σ
=
i
.
Wtedy teza CTG LL wynika wprost z tezy CTG LF.
2. Korzystając z CTG LF (lub CTG LL) sformułujemy integralne twierdzenia graniczne
Moivre’a-Laplace’a. Twierdzenie to mówi, że zmienna losowa o rozkładzie
dwumianowym ma rozkład asymptotycznie normalny. Dla uzasadnienia tego faktu
załóżmy, że ciąg zmiennych losowych
,...,
,
2
1
X
X
ma rozkład zerojedynkowy. Funkcja
rozkładu jest jak wiadomo zdefiniowana dla takiej zmiennej wzorem:
⎪⎩
⎪
⎨
⎧
=
−
=
=
=
=
poza
x
p
q
x
p
x
X
P
i
i
i
i
0
0
1
1
)
(
(8.10)
Łatwo policzyć, że powyższa zmienna losowa ma wartość oczekiwaną
p
X
i
=
)
(
E
i wariancję
pq
i
=
2
σ
.
Jeśli zastosujemy do ciągu takich zmiennych CTG LL to otrzymamy że zmienna
losowa:
npq
np
X
n
n
X
Y
n
i
i
n
i
i
n
∑
∑
=
=
−
=
−
=
1
1
σ
μ
(8.11)
jest asymptotycznie normalna.
Zauważmy jednak, że jeżeli rozpatrywać będziemy ciąg niezależnych doświadczeń i zmienna
losowa )
,...,
2
,
1
(
n
i
X
i
=
przyjmować będzie wartość 1 gdy badane zjawisko wystąpi w i-ej
próbie i wartość 0 gdy nie wystąpi to zmienna losowa
∑
=
n
i
i
X
1
będzie miała rozkład
dwumianowy z parametrami n i p. Wobec tego ze wzoru (8.11) i twierdzenia LL wynika, że
zmienna o rozkładzie dwumianowym ma rozkład asymptotycznie normalny.
Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 5
PRZYKŁAD 8.3
Łańcuch rokowy składa się z n=43 ogniw. Ogniwa tego łańcucha mają wymiar
05
.
0
04
.
0
06
.
19
+
−
=
d
. Należy obliczyć
prawdopodobieństwo, że otrzymamy długość całego łańcucha
2
.
0
4
.
0
820
−
−
=
L
mm (przewidzianą normą).
Wskazówka: Oszacować nieznane parametry rozkładów wymiarów poszczególnych ogniw na podstawie
znajomości pola tolerancji korzystając z prawa
σ
3
a następnie wykorzystać CTG LL albo LL (centralne
twierdzenie graniczne Lindeberga-Fellera albo Lindeberga-Levy’ego).
Rozwiązanie:
Wartości średnie i odchylenia standardowe (w mm) szacujemy z prawa trzech sigm:
065
.
19
2
04
.
0
06
.
19
05
.
0
06
.
19
1
=
−
+
+
=
μ
,
015
.
0
6
04
.
0
05
.
0
1
=
+
=
σ
Wartości do standaryzacji zmiennej:
795
.
819
065
.
19
43
=
⋅
=
μ
,
09836
.
0
43
015
.
0
=
=
σ
oraz
=
−
<
<
−
=
<
<
∑
∑
)
09836
.
0
795
.
819
80
.
819
09836
.
0
795
.
819
60
.
819
(
)
80
.
819
60
.
819
(
i
i
X
P
X
P
47
.
0
1
9535
.
0
5199
.
0
))
68
.
1
(
1
(
)
05
.
0
(
)
05
.
0
68
.
1
(
=
−
+
=
Φ
−
−
Φ
=
<
<
−
=
Y
P
Dokonano odczytu z tablic rozkładu normalnego. Zatem szukane prawdopodobieństwo wynosi 0.47
PRZYKŁAD 8.4
(JO str. 59)
Lina stalowa jest spleciona z 20 drutów grubych i 70 cienkich. Wytrzymałość drutu grubego ma rozkład
równomierny w przedziale
>
<
8
.
4
,
2
.
3
kN natomiast wytrzymałość drutu cienkiego ma rozkład równomierny w
przedziale
>
<
2
.
1
,
8
.
0
kN. Przyjmując, że wszystkie zmienne losowe są niezależne, i że wytrzymałość liny jest
sumą wytrzymałości wszystkich drutów, znaleźć prawdopodobieństwo, że wytrzymałość liny Q jest większa od
145 kN.
Rozwiązanie:
Dla rozkładu równomiernego na przedziale <a, b> średnia równa się
2
b
a
+
=
μ
natomiast wariancja równa się
12
)
(
2
2
a
b
−
=
σ
. Otzrymujemy zatem dla drutu grubego i cienkiego odpowiednio średnia i wariancję:
4
2
8
.
4
2
.
3
=
+
=
g
μ
,
2133
.
0
12
)
2
.
3
8
.
4
(
2
=
−
=
g
σ
1
2
2
.
1
8
.
0
=
+
=
C
μ
0133
.
0
12
)
8
.
0
2
.
1
(
2
=
−
=
C
σ
Z CTG LF otrzymujemy, że zmienna losowa:
28
.
2
150
0133
.
0
70
2133
.
0
20
)
1
70
4
20
(
−
=
⋅
+
⋅
⋅
+
⋅
−
=
Q
Q
Y
n
ma w przybliżeniu rozkład N(0,1). A zatem
986
.
0
)
19
.
2
(
)
19
.
2
(
1
)
19
.
2
(
)
28
.
2
150
145
(
)
145
(
=
Φ
=
−
Φ
−
=
−
>
=
−
>
=
>
n
n
Y
P
Y
P
Q
P
Prawa zastrzeżone © J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07
Strona 6
Należy podkreślić, że twierdzenia graniczne w podanych sformułowaniach orzekają tylko o
asymptotycznej zbieżności zmiennych losowych natomiast nie mówią nic o tempie
zbieżności. Sprawa ta wymaga w każdym przypadku osobnego badania.