Wykład 3
Zmienna losowa i jej rozkład
Aktualizacja: 28 marca 2008
3.1. Pojęcie zmiennej losowej
W całym niniejszym wykładzie przyjmujemy, że (&!, P ) jest ustaloną przestrzenią proba-
bilistycznÄ….
Definicja 3.1. Funkcję X : &! R przyporządkowującą każdemu zdarzeniu elementarne-
mu liczbÄ™ rzeczywistÄ… nazywamy zmiennÄ… losowÄ….
Definicja 3.2. Mówimy, że zmienna losowa X jest typu skokowego (dyskretnego),
jeśli może przyjmować jedynie skończoną lub nieskończoną, ale przeliczalną liczbę warto-
ści1. Wartości zmiennej skokowej X oznaczać będziemy przez x1, x2, ....
Przykład 3.1. Rozpatrujemy doświadczenie polegające na rzucie symetryczną monetą.
Niech E = {orzeł, reszka} . Określamy zmienna losową X w sposób następujący:
X(orzeł) = 1, X(reszka) = 0.
Zmienna losowa przyjmuje wartości ze zbioru {0, 1}, ma więc charakter dyskretny. Po-
nieważ prawdopodobieństwa poszczególnych zdarzeń elementarnych wynoszą 0.5, tak więc
możemy zapisać:
P (X = 1) = P {orzeł} = 0.5,
P (X = 0) = P {reszka} = 0.5.
Gdybyśmy, zgodnie z przyjętą regułą, oznaczyli wartości zmiennej losowej jako x1 = 0,
x2 = 1, to mamy, że odpowiadające im prawdopodobieństwa to p1 = 0.5, p2 = 0.5.
Przykład 3.2. Dla celów statystycznych wylosowano grupę n gospodarstw domowych,
dla których określono liczbę osób czynnych zawodowo w rodzinie XS. Zmienna XS =
0, 1, 2, 4, 5 jest zmienną losową dyskretną, natomiast prawdopodobieństwo, że i członków
1
Mówimy, że funkcja przyjmuje przeliczalną ilość wartości, jeśli wszystkie jej wartości można ustawić
w nieskończony ciąg x1, x2, . . . .
1
Wykład 3. Zmienna losowa i jej rozkład
danej rodziny jest czynnych zawodowo możemy określić jako częstość empiryczną (czyli
posługując się definicją klasyczną)
ni
P (XS = i) = ,
n
gdzie ni jest liczbą rodzin w wylosowanej próbie dla których stwierdzono, że XS jest równe
i.
Definicja 3.3. Mówimy, że zmienna losowa X jest typu ciągłego, jeśli zbiorem jej
wartości jest pewien przedział liczbowy.
W rzeczywistym świecie zmienne losowe o charakterze ciągłym w swej czystej postaci
występują rzadko. Pomiary wartości wyrażanych przez liczby rzeczywiste, prowadzone
są bowiem zwykle z określoną dokładnością (np. do jednej setnej, tysięcznej, itp.), a
więc liczba możliwych różnych pomiarów może być nawet skończona. Często jednak zbiór
wartości tego typu zmiennej jest tak liczny, że praktyce przyjąć musimy iż stanowi on
przedział liczbowy. Tego typu zmienne losowe nazywamy quasi ciągłymi lub po prostu
ciągłymi.
Przykład 3.3. Jeśli analizujemy wybraną (bardzo dużą) grupę przedsiębiorstw przemysło-
wych w pewnym regionie kraju, z punktu widzenia ich zadłużenia bankowego (w milionach
złotych), to możemy określić zmienną losową X, przyjmującą wartości wszystkich moż-
liwych kwot tego zadłużenia. Są to wartości rzeczywiste, wypełniające pewien przedział,
którego granice określa najmniejsza (zerowa) i największa możliwa wielkość zadłużenia.
W rozważanym przypadku prawdopodobieństwo wystąpienia konkretnej wartości zadłu-
żenia, np. 3.65786 miliona złotych, może być dokładnie równe zero (P (X = 3.65786) =
0), pomimo, że liczba ta może należeć do przedziału będącego zbiorem wartości zmien-
nej. Możemy ustalać jedynie prawdopodobieństwo zadłużenia w pewnym przedziale. Np.
P (3.5 < X < 4.4) = 0.4107 oznacza, że na każde 100 losowo badanych przedsiębiorstw
trafimy około 41, których zadłużenie jest wyższe niż 3.5 mln złotych, ale niższe niż 4.5
mln złotych).
Zauważmy, że zmienna ta ma charakter quasi ciągły. Pomiary wielkości zadłużenia doko-
nywane są z określoną dokładnością (co najwyżej do jednego grosza). Tym niemniej zbiór
możliwych wartości zmiennej jest tak liczny, że musimy traktować ją jako ciągłą.
Z definicji zmiennej losowej wynika, że wartości zmiennej losowej związane są z pewny-
mi zdarzeniami losowymi. Tak więc (jak widzimy w przedstawionych wyżej przykładach),
występowanie określonej wartości zmiennej losowej wiąże się z prawdopodobieństwem
wystąpienia zdarzeń losowych do których jest ona przypisana. Zmienna losowa, w prze-
ciwieństwie do innych zmiennych znanych nam z matematyki definiowana jest nie tylko
przez zbiór możliwych wartości, ale również przez odpowiednie prawdopodobieństwa okre-
ślające jak często wartości te wystąpią w badanej sytuacji. Konkretna wartość (nazywana
często realizacją) zmiennej losowej zależy jedynie od przypadku. Sposób rozdysponowania
całej masy prawdopodobieństwa (równej 1) pomiędzy wartości jakie przyjmuje zmien-
na losowa określamy mianem rozkładu prawdopodobieństwa zmiennej lub krótko
rozkładu zmiennej. Pojęcie rozkładu zmiennej jest bardzo ważne, i wymaga bliższego
sprecyzowania. Opis rozkładu zmiennych losowych skokowych i ciągłych odbywa się w
różny sposób, dlatego potraktujemy je jako odmienne zagadnienia.
2
Wykład 3. Zmienna losowa i jej rozkład
3.2. Rozkład zmiennej losowej skokowej
Przypuśćmy, że zmienna losowa X, typu skokowego (dyskretna), przyjmuje wartości
x1, x2, . . . z prawdopodobieństwami odpowiednio p1, p2, . . . . Prawdopodobieństwa te speł-
niają oczywiście równość
n
pi = 1, (3.1)
i=1
gdy zbiór wartości zmiennej losowej X jest skończony lub równość
"
pi = 1 (3.2)
i=1
w przypadku nieskończonej liczby wartości zmiennej losowej X.
Rozkład dyskretnej zmiennej losowej możemy określić za pomocą funkcji prawdopo-
dobieństwa lub dystrybuanty.
Definicja 3.4. Zbiór prawdopodobieństw postaci
P (X = xi) = pi, i = 1, 2, . . . (3.3)
spełniających warunek (3.2) nazywamy funkcją prawdopodobieństwa zmiennej lo-
sowej X typu skokowego albo rozkładem prawdopodobieństwa zmiennej losowej
typu skokowego.
Tak więc funkcja prawdopodobieństwa przypisuje wartościom zmiennej losowej praw-
dopodobieństwa ich realizacji. Jeśli zbiór wartości zmiennej jest skończony i stosunkowo
niewielki, rozkład zmiennej losowej przedstawiamy zwykle w formie tabelarycznej
xi x1 x2 . . . xn
pi p1 p2 . . . pn
Przykład 3.4. Do tarczy oddaje się w sposób niezależny trzy strzały. Prawdopodobieństwo
1
trafienia w tarczę dla każdego strzału wynosi . Zbiór zdarzeń elementarnych dla tego
2
doświadczenia przedstawia się następująco (T trafienie, C chybienie):
E = {CCC, CCT, CT C, T CC, CT T, T CT, T T C, T T T }.
Niech zmienna losowa X oznacza liczbę trafień w tarczę. Przyjmuje więc ona wartości:
x1 = 0, x2 = 1, x3 = 2, x4 = 3. Stosując elementarne zasady rachunku prawdopodobień-
stwa, możemy obliczyć:
1
P (X = 0) = p1 = ,
8
3
P (X = 1) = p2 = ,
8
3
P (X = 2) = p3 = ,
8
1
P (X = 3) = p4 = .
8
3
Wykład 3. Zmienna losowa i jej rozkład
Aatwo widać, że p1+p2+p3+p4 = 1, zatem obliczone prawdopodobieństwa można traktować
jako wartości funkcji prawdopodobieństwa zmiennej losowej X. W ujęciu tabelarycznym
funkcja ta przedstawia się następująco:
xi 0 1 2 3
pi 1 3 3 1
8 8 8 8
Przykład 3.5. Wylosowaną grupę 1000 przedsiębiorstw przemysłowych przeanalizowano
pod względem współpracujących z nimi kooperantów. Zmienną losową X, określono jako
liczbę kooperantów. Określono, że może ona przyjmować wartości 2, 3, 4, 5 oraz 6. Obli-
czone liczby zakładów dla poszczególnych pięciu poziomów realizacji zmiennej wyniosły w
badanej grupie odpowiednio: 121, 362, 309, 184, 24. Na tej podstawie możemy oszacować
prawdopodobieństwa liczby kooperantów jako częstości empiryczne:
xi 2 3 4 5 6
pi 0.121 0.362 0.309 0.184 0.024
Oczywiście suma poszczególnych prawdopodobieństw jest równa 1, tak więc możemy je
traktować jako rozkład liczby kooperantów w zakładach przemysłowych.
Do opisu rozkładu prawdopodobieństwa zmiennej losowej służy również funkcja zwana
dystrybuantÄ….
Definicja 3.5. Dystrybuantą zmiennej losowej X nazywamy funkcję F (x) określoną
na zbiorze liczb rzeczywistych, jako
F (x) = P (X d" x). (3.4)
Znaczenie dystrybuanty polega między innymi na tym, że jak zobaczymy w przyszłości,
powyższa definicja stosuje się zarówno do zmiennych dyskretnych jak i ciągłych. W oby-
dwu przypadkach wartość dystrybuanty jest równa prawdopodobieństwu tego, że zmienna
losowa X przyjmie wartość nie większą od wartości argumentu.
Dla skokowej zmiennej losowej X, która przyjmuje wartości x1, x2, . . . z prawdopodobień-
stwami p1, p2, . . . , dystrybuanta ma postać
F (x) = P (X d" x) = P (X = xi) = pi, -" < x < ". (3.5)
xid"x xid"x
Dystrybuantę zmiennej skokowej X zapisać możemy również następująco
Å„Å‚
ôÅ‚ 0 dla x < x1
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚ p1 dla x1 d" x < x2
ôÅ‚
ôÅ‚
ôÅ‚
òÅ‚
p1 + p2 dla x3 d" x < x4
F (x) = (3.6)
. . .
. . .
ôÅ‚
ôÅ‚ . . .
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚ p1 + p2 + . . . + pn-1 dla xn-1 d" x < xn
ôÅ‚
ôÅ‚
ół
1 dla xn d" x
Powyższy zapis uwidacznia podstawowe własności dystrybuanty dyskretnej zmiennej lo-
sowej:
4
Wykład 3. Zmienna losowa i jej rozkład
Własność 3.1 (Własności dystrybuanty).
(D1) 0 d" F (x) d" 1,
(D2) limx-" F (x) = 0 oraz limx" F (x) = 1,
(D3) F jest funkcją niemalejącą (tzn. dla x1 < x2 zachodzi F (x1) d" F (x2) ) i przedziałami
ciągłą,
(D4) F jest funkcją prawostronnie ciągłą.
Opierając się na znajomości dystrybuanty możemy wyznaczyć prawdopodobieństwo
zdarzenia polegającego na tym, że zmienna losowa przyjmuje wartości z przedziału (a, b] ,
tzn. zdarzenia a < X d" b. Zdarzenie to możemy przedstawić jako różnicę zdarzeń
(X d" b) - (X d" a),
których prawdopodobieństwa można określić znając dystrybuantę
P (a < X d" b) = P (X d" b) - P (X d" a) = F (b) - F (a). (3.7)
W szczególności na podstawie dystrybuanty zmiennej skokowej możemy wyznaczyć war-
tość jej funkcji prawdopodobieństwa
P (X = xi) = P (xi-1 < X d" xi) = F (xi) - F (xi-1) = pk - pk = pi. (3.8)
kd"i kd"i-1
Przykład 3.6. Dla zmiennej losowej z Przykładu 3.4 postać dystrybuanty, zgodnie ze
wzorem (3.6), możemy zapisać jako
Å„Å‚
ôÅ‚ 0 dla x < 0
ôÅ‚
ôÅ‚
ôÅ‚
1
ôÅ‚
ôÅ‚ dla 0 d" x < 1
òÅ‚ 8
4
F (x) = .
dla 1 d" x < 2
8
ôÅ‚
ôÅ‚
7
ôÅ‚
ôÅ‚ dla 2 d" x < 3
ôÅ‚
8
ôÅ‚
ół
1 dla 3 d" x
Przykład 3.7. Dla zmiennej losowej z Przykładu 3.5 postać dystrybuanty, zgodnie ze
wzorem (3.6), możemy zapisać jako
Å„Å‚
ôÅ‚
0 dla x < 2
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
0.121 dla 2 d" x < 3
ôÅ‚
ôÅ‚
ôÅ‚
òÅ‚
0.483 dla 3 d" x < 4
F (x) = .
ôÅ‚
0.792 dla 4 d" x < 5
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
ôÅ‚
0.976 dla 5 d" x < 6
ôÅ‚
ôÅ‚
ôÅ‚
ół
1 dla 6 d" x
5
Wykład 3. Zmienna losowa i jej rozkład
3.3. Rozkład zmiennej losowej ciągłej
Zgodnie z wcześniejszą definicją zmiennej losowej ciągłej jej wartości wypełniają prze-
dział liczbowy, co oznacza, że zbiór zdarzeń elementarnych, na którym określono taką
zmienną jest nieskończony i nieprzeliczalny. Przypisanie więc każdej wartości zmiennej
losowej dodatniego prawdopodobieństwa jest niemożliwe. Opis rozkładu zmiennej losowej
ciągłej musi więc przebiegać inaczej niż w przypadku dyskretnym. Nie możemy bowiem
zdefiniować dla niej funkcji prawdopodobieństwa. Z tego powodu podstawową rolę w tym
przypadku gra pojęcie funkcji gęstości prawdopodobieństwa.
Definicja 3.6. Funkcją gęstości prawdopodobieństwa zmiennej losowej typu cią-
głego nazywamy funkcję f określona na zbiorze liczb rzeczywistych o następujących wła-
snościach
(G1) f(x) e" 0, x " R,
b
(G2) f(x)dx = P (a < x d" b), dla dowolnych a < b.
a
Własność 3.2. Funkcja gęstości spełnia też warunek:
+"
f(x)dx = P (-" < x d" +") = 1. (3.9)
-"
Tak więc prawdopodobieństwo realizacji zmiennej losowej w dowolnym przedziale (a, b]
określone jest poprzez całkę oznaczoną z funkcji gęstości prawdopodobieństwa tej zmiennej
w przedziale od a do b.
b
Graficzną interpretacją całki f(x)dx jest pole obszaru ograniczonego wykresem
a
funkcji f(x), osią odciętych i prostymi x = a i x = b (patrz Rysunek 3.1).
( )
b
Rysunek 3.1: Graficzna interpretacja całki f(x)dx
a
Zauważmy, że prawdopodobieństwo tego, że zmienna losowa równa jest pewnej określonej
wartości zgodnie z podaną wyżej definicja wynosi 0, ponieważ:
a
P (X = a) = P (a < X d" a) = f(x)dx = 0.
a
6
Wykład 3. Zmienna losowa i jej rozkład
W związku z powyższym zachodzi również równość:
P (a d" X d" b) = P (a < X < b).
Przykład 3.8. Autobus pewnej linii kursuje regularnie co 5 minut. Pasażer przychodzi na
przystanek w przypadkowym momencie, nie kierując się rozkładem jazdy. Niech zmienną
losową X będzie czas oczekiwania (w minutach) pasażera na autobus. Określimy funkcję
gęstości prawdopodobieństwa zmiennej losowej X oraz obliczymy prawdopodobieństwo tego,
że czas oczekiwania na autobus będzie liczbą z przedziału (1, 3].
Czas oczekiwania jest zmienną losową, mogącą przyjąć każdą wartość z przedziału
[0, 5]. Z warunków zadania wynika, że gęstość prawdopodobieństwa w tym przedziale jest
funkcją stałą. Wszystkie wartości zmiennej losowej są jednakowo prawdopodobne, ponieważ
pasażer nie zna czasów odjazdów. Możemy zatem zapisać:
Å„Å‚
ôÅ‚ 0 dla x < 0
òÅ‚
f (x) =
c dla 0 d" x d" 5
ôÅ‚
ół
0 dla 5 < x
gdzie c jest pewną stałą. Wartość stałej c wyznaczyć można z warunku normalizacyjne-
go (3.9), jaki musi spełniać funkcja gęstości, tzn. że całka z gęstości od minus do plus
nieskończoności musi być równa 1. Tak więc w tym przypadku mamy:
+" 0 5 +"
1 = f(x)dx = f(x)dx + f(x)dx + f(x)dx =
-" -" 0 5
0 5 +"
= 0dx + cdx + 0dx = 0 + [cx]5 + 0 = 5c,
0
-" 0 5
zatem
1
5c = 1 Ô! c = .
5
Obliczając prawdopodobieństwo P (1 < x d" 3) skorzystamy z własności (G2)
3 3
3
1 1 2
P (1 < x d" 3) = f(x)dx = dx = x = .
5 5 5
1
1 1
Rozkład ciągłej zmiennej losowej również możemy scharakteryzować za pomocą dys-
trybuanty. Korzystając z definicji funkcji gęstości, dystrybuantę zmiennej losowej X typu
ciągłego określić możemy jako
x
F (x) = P (X d" x) = f(t)dt, (3.10)
-"
gdzie f(t) jest funkcją gęstości zmiennej losowej X. Jak widzimy dystrybuanta jest więc
funkcja pierwotną funkcji gęstości prawdopodobieństwa zmiennej, tzn. funkcja gęstości
7
Wykład 3. Zmienna losowa i jej rozkład
jest pochodną dystrybuanty. Dystrybuanta ciągłej zmiennej losowej posiada podobne wła-
sności jak zmiennej skokowej (zob. Własność 3.1) poza tym, że - w przeciwieństwie do
tamtej - jest funkcją ciągłą. Ponadto, również jak w przypadku dyskretnym:
b a
P (a < X d" b) = P (X d" b) - P (X d" a) = f(x)dx - f(x)dx = F (b) - F (a) (3.11)
-" -"
Przykład 3.9. Określmy postać dystrybuanty dla zmiennej losowej z Przykładu 3.8. Przy-
pomnijmy, że charakteryzowała się ona gęstością
Å„Å‚
ôÅ‚ 0 dla x < 0
òÅ‚
1
f (x) = .
dla 0 d" x d" 5
5
ôÅ‚
ół
0 dla 5 < x
Tak więc dla x < 0 otrzymujemy
x
F (x) = 0dt = 0,
-"
dla 0 d" x d" 5
0 x
x
1 1 1
F (x) = 0dt + dt = 0 + t = x,
5 5 5
0
-" 0
dla x e" 5
0 5 x
1
F (x) = 0dt + dt + 0dt = 0 + 1 + 0 = 1.
5
-" 0 5
Mamy więc
Å„Å‚
ôÅ‚ 0 dla x < 0
òÅ‚
1
F (x) =
x dla 0 d" x d" 5
5
ôÅ‚
ół
1 dla 5 < x
Korzystając z dystrybuanty również możemy obliczyć prawdopodobieństwo tego, że czas
oczekiwania na autobus będzie liczbą z przedziału (1, 3]
1 1 2
P (1 < X d" 3) = F (3) - F (1) = · 3 - · 1 = .
5 5 5
8
Wyszukiwarka
Podobne podstrony:
Przekształcenia ciągłe zmiennej losowejMPiS30 W05d Zmienne losowe IIPiS15 W03 Zmienne losowe II 12MPiS cw zmienne losowezmienne losowe22 09 AMPiS cw dwie zmienne losowe3 Zmienne losowe i ich rozkładyrozklad zmiennej losowe metodologia wyk2Rozklad zmiennej losowej zadaniaPiS15 W02k Zmienne losowe ISM15 W02k Zmienne losowe IParametry zmiennej losowejPiS15 W02d Zmienne losowe IPiS15 W03k Zmienne losowe IIjurlewicz,probabilistyka, parametry zmiennej losowej2rozklady zmiennej losowejDwuwymiarowe Zmienne Losowe p29więcej podobnych podstron