1
Zmienne losowe (wykład 2, poprawiony)
Przez zmienną losową można rozumieć taką zmienną, która w wyniku doświadczenia przyjmuje różne wartości
z określonym prawdopodobieństwem. Zmienne losowe oznacza się wielkimi literami, np. X, Y, Z.
Rozróżnia się dwa typy zmiennych losowych: zmienne losowe skokowe (dyskretne) i zmienne losowe ciągłe.
Zmienna losowa X jest typu skokowego, jeśli może przyjmować tylko skończoną lub co najwyżej przeliczalną
liczbę wartości. Zmienna losowa X jest typu ciągłego, jeśli możliwe jej wartości należą do przedziału ze zbioru liczb
rzeczywistych. Zbiór możliwych wartości zmiennej losowej ciągłej jest nieskończony i nieprzeliczalny.
Tabela. Przykłady zmiennych losowych skokowych i zmiennych losowych ciągłych
Zmienne losowe skokowe
Zmienne losowe ciągłe
miesięczna liczba urodzeń i zgonów w Jeleniej
Górze,
liczba synów w rodzinie mającej czworo dzieci,
liczba zgonów, urodzeń, małżeństw w Polsce,
liczba koni w poszczególnych gospodarstwach na
terenie Dolnego Śląska,
liczba chłopców wśród stu noworodków.
temperatura jakiegoś ciała,
czas przeznaczony na wyprodukowanie sztuki wyrobu przez
pracowników pewnej fabryki,
czas bezawaryjnej pracy jakiegoś urządzenia (np. czas
świecenia żarówki),
wzrost, waga, wiek poszczególnych osób,
zużycie wody w Wałbrzychu w określonym dniu.
Rozkłady zmiennej losowej skokowej
Przypuśćmy, że zmienna losowa X typu skokowego przyjmuje wartości x
1
,x
2
,… z prawdopodobieństwami,
odpowiednio, p
1
,p
2
,…. Prawdopodobieństwa p
1
,p
2
,… spełniają równość:
,
1
1
n
i
i
p
gdy zmienna losowa X przyjmuje skończoną liczbę n wartości
lub równość:
,
1
1
i
i
p
w przypadku nieskończonej liczby wartości zmiennej losowej X.
Funkcję przyporządkowującą wartościom x
i
zmiennej losowej X odpowiadające im prawdopodobieństwa nazywa
się funkcją rozkładu prawdopodobieństwa tej zmiennej lub krótko: rozkładem prawdopodobieństwa.
Funkcja rozkładu prawdopodobieństwa może być określona za pomocą wzoru, tabelki lub wykresu.
Funkcja F(x) = P(X<x) nazywa się dystrybuantą zmiennej losowej X. Dystrybuanta jest funkcją niemalejącą,
.
1
)
(
,
0
)
(
F
F
Przykład 1. Wykonujemy rzut kostką sześcienną. Zbiorem zdarzeń elementarnych jest zbiór wszystkich możliwych
wyników rzutu kostką.
Jeśli każdemu zdarzeniu elementarnemu przyporządkujemy liczbę oczek na ściance kostki, to określimy w ten
sposób zmienną losową X, która przyjmie wartości 1,2,3,4,5,6 z prawdopodobieństwami wynoszącymi
,
6
1
)
(
i
x
X
P
dla x
i
=1,2,3,4,5,6, czyli (…).
2
Przykład 2
1
. Wyprodukowanie określonej liczby wyrobów przez jednego robotnika w ciągu godziny jest zmienną
losową X o następującym rozkładzie prawdopodobieństwa:
Liczba wyrobów X=x
i
2
3
4
5
6
7
8
Prawdopodobieństwo p
i
0,02
0,18
0,28
0,22
0,16
0,08
0,06
Wykreślić funkcję rozkładu prawdopodobieństwa zmiennej losowej X.
1. Rozkład jednopunktowy
Zmienna losowa X posiada rozkład jednopunktowy, jeżeli istnieje taki punkt x
0
, że P(X=x
0
)=1.
2. Rozkład dwupunktowy
Zmienna losowa X ma rozkład dwupunktowy, jeżeli z dodatnimi prawdopodobieństwami przyjmuje jedynie dwie
wartości x
1
i x
2
.
P(X=x
1
)=p
P(X=x
2
)=q=1–p.
Często dla wygody przyjmuje się, że x
1
=1, x
2
=0 (wartościom x
1
i x
2
przyporządkowuje się liczby 1 i 0), stąd też
rozkład ten bywa nazywany rozkładem zero-jedynkowym. Wtedy:
P(X=1)=p
P(X=0)=q=1–p.
Zmienną losową zero-jedynkową posługujemy się wtedy, gdy w doświadczeniu spodziewamy się tylko dwóch
wyników. Jeden z nich nazywamy sukcesem. Spodziewamy się go z prawdopodobieństwem p i przyporządkowujemy mu
wartość 1. Drugi wynik, który nazywamy niepowodzeniem, jest oczekiwany z prawdopodobieństwem q=1–p i
przyporządkowujemy mu wartość 0. Prawdopodobieństwo p nazywamy prawdopodobieństwem sukcesu.
Wartość oczekiwana i wariancja zmiennej losowej X o rozkładzie zero-jedynkowym są odpowiednio równe
2
:
E(X)=1∙p+0∙q=p; D
2
(X)=1
2
∙p+0
2
∙q–p
2
=p–p
2
=p(1–p)=pq.
Przykład 3
3
. Z rozkładem dwupunktowym mamy do czynienia przy jednorazowym rzucie monetą (na przykład gdy
sędziowie sportowi ustalają, drogą losowania, rozpoczynającego grę). Jeśli zdarzeniu polegającemu na wyrzuceniu
orła przyporządkujemy liczbę 1 (zajście tego zdarzenia można nazwać „sukcesem”), a wyrzuceniu reszki – liczbę 0
(zajście tego zdarzenia można nazwać „niepowodzeniem”), wówczas
2
1
)
1
(
X
P
oraz
2
1
)
0
(
X
P
.
Przykład 4
4
. Rzucamy jeden raz kością do gry. Interesuje nas wyrzucenie sześciu oczek. Prawdopodobieństwo
sukcesu wynosi
6
1 , natomiast prawdopodobieństwo niepowodzenia
6
5 . Oznaczając sukces liczbą 1, a
niepowodzenie liczbą 0 otrzymamy rozkład zero-jedynkowy. Zmienna losowa X przybiera wartość 1 z
prawdopodobieństwem
6
1
, 0 z prawdopodobieństwem
6
5
.
3. Rozkład dwumianowy
1
J. Bielecki, B. Jurkiewicz, Z. Szymanowska, Zbiór zadań ze statystyki ogólnej i matematycznej, PWN, Warszawa 1978, s. 29.
2
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Książka Ekonomiczna, Wrocław 1997, s. 135.
3
M. Krzysztofiak, D. Urbanek, Metody statystyczne, PWN, Warszawa 1975, s. 131; M. Maliński, Weryfikacja hipotez statystycznych wspomagana komputerowo, Gliwice 2004, s. 7.
4
Z. Hellwig, Elementy rachunku prawdopodobieństwa i statystyki matematycznej, Wydawnictwo Naukowe PWN, Warszawa 1993, s. 69-70.
3
Zmienną losową o rozkładzie dwumianowym otrzymuje się w schemacie doświadczeń zwanym schematem
Bernoulliego.
Eksperyment polega na tym, że przeprowadzamy n (n≥2) niezależnych doświadczeń. Wynikiem każdego
doświadczenia może być tylko jeden z dwu możliwych stanów: sukces lub porażka.
1. Prawdopodobieństwo stanu, który został uznany jako sukces, jest takie samo w kolejnych doświadczeniach.
Prawdopodobieństwo sukcesu oznaczamy symbolem p, a prawdopodobieństwo niepowodzenia symbolem q. Między
prawdopodobieństwami p i q zachodzi związek p + q = 1.
2. Doświadczenia są niezależne, tzn. wynik poprzedniego doświadczenia nie ma wpływu na wynik następnego
5
.
Dokonujemy n doświadczeń losowych. W rezultacie każdego doświadczenia może zajść zdarzenie A z
prawdopodobieństwem p i zdarzenie przeciwne
A
z prawdopodobieństwem q = 1–p, przy czym wyniki n
doświadczeń są niezależne. Przyporządkujmy zdarzeniu A liczbę 1 i zdarzeniu przeciwnemu liczbę 0. W rezultacie n
doświadczeń losowych zdarzenie A może nastąpić 0, 1, 2, ..., n razy. Wobec tego zmienna losowa X może przybierać
wartości k=0, 1, 2, ..., n, przy czym równość X=k oznacza, że w n doświadczeniach zdarzenie A zaszło dokładnie k
razy.
Funkcja rozkładu prawdopodobieństwa takiej zmiennej opisana jest wzorem:
.
,...,
2
,
1
,
0
,
1
,
)
(
n
k
p
q
q
p
k
n
q
p
C
k
X
P
k
n
k
k
n
k
k
n
Symbol
k
n
C
zastępuje się najczęściej symbolem Newtona
k
n
gdzie:
)!
(
!
!
k
n
k
n
k
n
.
k
n
C
– liczba k elementowych kombinacji utworzonych z n elementów (liczba podzbiorów k-elementowych zbioru n-
elementowego), n – liczba doświadczeń, k – liczba sukcesów, p – prawdopodobieństwo sukcesu w pojedynczym
doświadczeniu, q – prawdopodobieństwo porażki w pojedynczym doświadczeniu.
Rozpatrzmy następujące przykłady
6
:
a. Rzucamy cztery razy monetą. Niech H oznacza liczbę wyrzuconych reszek.
b. Wiadomo, że w pewnym mieście 30% mieszkańców woli korzystać z komunikacji miejskiej, niż z własnego
samochodu. Wybrano próbę dwudziestoosobową. Niech T będzie liczbą mieszkańców w próbie, którzy wolą
korzystać z komunikacji miejskiej.
c. Wiadomo, że pewna maszyna produkuje 15% wyrobów wadliwych. Wybrano losowo próbę dwunastoelementową.
Niech D oznacza liczbę wyrobów wadliwych w próbie.
Wszystkie wymienione zmienne losowe (H, T i D) podlegają rozkładowi prawdopodobieństwa zwanemu rozkładem
dwumianowym.
Przykład 5. Rzucono 2 razy monetą. Przedstawić w postaci tablicy rozkład zmiennej losowej X – liczby rzutów, w
których wypadł orzeł.
5
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Książka Ekonomiczna, Wrocław 1997, s. 136.
6
A. Aczel, Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa 2000, s. 129-131.
4
Przykład 6
7
. Obliczyć prawdopodobieństwa odpowiadające poszczególnym wartościom zmiennej losowej, którą jest
liczba białych kul wyciągniętych z urny, jeśli ciągniemy kolejno 5 kul i każdorazowo, po obejrzeniu barwy,
wkładamy kule z powrotem do urny oraz jeśli frakcja białych kul w urnie wynosi 1/3. Podać rozkład dwumianowy
zmiennej losowej X.
Przykład 7
8
. Z urny zawierającej sześć kul białych i cztery czarne losuje się ze zwracaniem 6 kul. Znaleźć rozkład
prawdopodobieństwa zmiennej losowej X, określającej liczbę kul białych w próbce.
Wartość oczekiwana zmiennej losowej o rozkładzie dwumianowym wynosi E(X)=np.
Wynik ten jest intuicyjnie zrozumiały: jeżeli prawdopodobieństwo realizacji pewnego zdarzenia losowego w
pojedynczym doświadczeniu jest równe p, to średnio przy n doświadczeniach liczba realizacji powinna być równa np.
Przykład: stwierdzono, że prawdopodobieństwo popełnienia błędu przez kontrolera jakości kontrolującego zgodność
faktycznych wymiarów pewnych detali stalowych ze standardami technicznymi w pewnej fabryce przemysłu
maszynowego jest równe 0,02. Ile średnio błędów będzie popełniał dziennie kontroler, któremu przedstawia się do
sprawdzenia 200 sztuk detali?
Odpowiedź: Średnio kontroler popełnia 4 błędy dziennie. Można bowiem przyjąć, że liczba popełnionych przez
kontrolera błędów ma rozkład dwumianowy o parametrach n = 200 oraz p = 0,02. Korzystając ze wzoru E(X)=np
znajdujemy
9
, że E(X) = 200∙0,02 = 4.
Wariancja zmiennej losowej o rozkładzie dwumianowym wynosi D
2
(X)=npq=np(1–p).
4. Rozkład Poissona
Zmienna losowa X ma rozkład Poissona, jeżeli jej rozkład prawdopodobieństwa jest określony wzorem:
e
k
k
X
P
k
!
)
(
gdzie: λ>0, e≈2,718.
Rozkład Poissona daje na ogół dostatecznie dobre przybliżenie rozkładu dwumianowego, gdy:
1)
liczba doświadczeń jest duża (n>20),
2)
prawdopodobieństwo sukcesu w każdym doświadczeniu jest małe (p<0,2).
Iloczyn np jest wartością stałą, a mianowicie np=λ.
Przy stosowaniu rozkładu Poissona można korzystać z tablic, w których dla danej wartości np i wybranej
wartości k można odczytać P(X≤k).
Wartość oczekiwana i wariancja tej zmiennej są odpowiednio równe: E(X)=λ, D
2
(X)=λ.
Przykład 8
10
. W pewnym przedsiębiorstwie zaobserwowano, że w ciągu miesiąca zdarzają się średnio 2 wypadki i że
rozkład liczby wypadków może być opisany za pomocą rozkładu Poissona. Obliczyć prawdopodobieństwo, że w
losowo wybranym miesiącu:
a) będą 3 wypadki,
b) nie będzie wypadków,
c) liczba wypadków nie przekroczy 2.
7
Z. Hellwig, Elementy rachunku prawdopodobieństwa i statystyki matematycznej, Wydawnictwo Naukowe PWN, Warszawa 1993, s. 72-73.
8
C. Platt, Problemy rachunku prawdopodobieństwa i statystyki matematycznej, PWN, Warszawa 1974, s. 45-46.
9
Z. Pawłowski, Wstęp do statystyki matematycznej, PWN, Warszawa 1966, s. 133.
10
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Materiały do ćwiczeń, Książka Ekonomiczna, Wrocław 1994, s. 141.
5
Charakterystyki liczbowe zmiennej losowej dyskretnej
Najpełniejsze informacje o rozkładzie zmiennej losowej daje jej dystrybuanta bądź też jej funkcja rozkładu
prawdopodobieństwa lub – w przypadku zmiennych losowych ciągłych – funkcja gęstości prawdopodobieństwa.
Niezależnie od tego w wielu sytuacjach zachodzi potrzeba scharakteryzowania rozkładu zmiennej losowej za
pomocą jednej lub paru liczb wyrażających najistotniejsze własności rozkładu rozpatrywanej zmiennej losowej
11
.
Najważniejszymi parametrami zmiennych losowych są: wartość oczekiwana i wariancja zmiennej losowej X
12
.
Charakterystyki liczbowe rozkładu
13
Wartość oczekiwana E(X)=m jest to wartość, wokół której skupiają się realizacje zmiennej losowej uzyskiwane
w wyniku wielokrotnie powtarzanego eksperymentu.
Wartość oczekiwana (przeciętna) zmiennej losowej skokowej X jest określona za pomocą jednego z wzorów:
,
)
(
1
n
i
i
i
p
x
X
E
gdy zmienna X przyjmuje n wartości;
,
)
(
1
i
i
i
p
x
X
E
gdy zmienna X przyjmuje przeliczalnie wiele wartości.
Wariancja zmiennej losowej X jest to miara rozproszenia wartości zmiennej wokół wartości średniej. Im
wariancja jest mniejsza, tym bardziej wartości zmiennej skupiają się wokół wartości przeciętnej E(X).
Wariancja zmiennej losowej X jest określona za pomocą jednego z następujących wzorów:
2
2
)]
(
[
)
(
)
(
X
E
X
E
X
V
X
D
2
2
2
)
(
)
(
)
(
)
(
X
E
X
E
X
V
X
D
Do obliczeń wariancji można wykorzystać następujące wzory:
i
n
i
i
p
X
E
x
X
V
X
D
1
2
2
)
(
)
(
)
(
lub
n
i
i
i
X
E
p
x
X
V
X
D
1
2
2
2
))
(
(
)
(
)
(
Gdy zmienna losowa X przyjmuje przeliczalnie wiele wartości, wówczas po prawej stronie powyższych wzorów
występuje suma nieskończona.
Odchylenie standardowe zmiennej losowej X jest to pierwiastek z jej wariancji:
.
)
(
2
X
D
Przykład 9
14
. Niech X będzie liczbą oczek wyrzuconych w rzucie kostką. Obliczyć wartość oczekiwaną, wariancję i
odchylenie standardowe zmiennej losowej X.
Przykład 10
15
. Prawdopodobieństwo zachorowania na chorobę zakaźną Z w n-tym dniu od chwili zetknięcia się z
chorym ma następujący rozkład:
Dzień zachorowania od chwili
zetknięcia się z chorym (X=x
i
)
0
1
2
3
4
5
Prawdopodobieństwo p(x
i
)
0,10
0,25
0,30
0,20
0,10
0,05
Obliczyć następujące parametry rozkładu: wartość oczekiwaną, wariancję i odchylenie standardowe.
Przykład 11
16
. Znaleźć wartość oczekiwaną liczby zajścia zdarzenia A w jednym doświadczeniu, jeżeli
prawdopodobieństwo zdarzenia A jest równe p.
11
Z. Pawłowski, Wstęp do statystyki matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1969, s. 82.
12
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Książka Ekonomiczna, Wrocław 1997, s. 122.
13
S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Książka Ekonomiczna, Wrocław 1997, s. 122-123.
14
Matematyka. Encyklopedia szkolna, Wydawnictwa Szkolne i Pedagogiczne, Warszawa 1990, s. 179; S. Ostasiewicz, Z. Rusnak, U. Siedlecka, Statystyka. Elementy teorii i zadania, Książka Ekonomiczna, Wrocław 1997, s. 125-128.
15
J. Bielecki, B. Jurkiewicz, Z. Szymanowska, Zbiór zadań ze statystyki ogólnej i matematycznej, PWN, Warszawa 1978, s. 33.
16
W. Gmurman, Rachunek prawdopodobieństwa i statystyka matematyczna, Wydawnictwa Naukowo-Techniczne, Warszawa 1975, s. 83.