Zmienne losowe
Dla określenia zmiennej losowej potrzebna jest znajomość tzw. trójki probabilistycznej. Załóżmy, że dana jest przestrzeń probabilistyczna (E, S, P).
Zmienną losową X nazywamy funkcję rzeczywistą określoną na przestrzeni zdarzeń elementarnych E i mierzalną względem ciała zdarzeń S:
,
która każdemu zdarzeniu elementarnemu e∈E przyporządkowuje liczbę rzeczywistą X(e)∈R
Jest zmienną, która w wyniku doświadczenia (losowego) przyjmuje jedną i tylko jedną wartość ze zbioru wszystkich wartości, jakie zmienna ta może przyjąć.
Jest to wielkość, która na skutek przeprowadzonego doświadczenia przyjmuje określoną wartość, znaną dopiero po wykonaniu tego doświadczenia (oznaczenie: X, Y, wartości, jakie przyjmuje: x, y).
Wzajemne przyporządkowanie zmiennych losowych i zdarzeń jest jednoznaczne,
Rodzaje zmiennych losowych:
skokowa (dyskretna) - jest to zmienna, która posiada skończony lub policzalny zbiór wartości, najczęściej są to liczby naturalne (np. liczba oczek wyrzucona za pomocą kostki do gry),
ciągła - jest to zmienna, która może przybierać dowolne wartości liczbowe (rzeczywiste) z pewnego przedziału, nieskończonego i niepoliczalnego (np. stężenie procentowe roztworu).
Zmienna losowa skokowa
Dla zmiennej losowej skokowej X, która przybiera wartości: x1, x2, ..., xn i odpowiadającym i prawdopodobieństwom p1, p2, ..., pn, definiuje się funkcję rozkładu prawdopodobieństwa jako:
Dystrybuantą zmienne losowej X nazywany funkcję F(x) zmiennej rzeczywistej x, która wyznacza prawdopodobieństwo tego, że zmienna losowa X przyjmie w uporządkowanym zbiorze x1 ≤ x2 ... ≤ xi ≤ ...xn-1≤ xn wartość mniejszą od x:
Dla zmiennej losowej skokowej:
Własności dystrybuanty:
przyjmuje wartości z przedziału 0 ≤ F(x) ≤ 1 dla x ∈ (-∞;+∞);
jest funkcją niemalejącą, tzn. dla x1 < x2 zawsze F(x1) ≤ F(x2);
jest funkcją lewostronnie ciągłą;
oraz
.
Przykład 1
Rzucamy trzykrotnie monetą. Zmienną losową oznaczamy liczbę uzyskanych orłów. Przestrzeń zdarzeń elementarnych E = {(RRR), (ROR), (RRO), (ORR), (OOO), (ROO), (OOR), (ORO)}
i |
Wartość zmiennej losowej xi |
P(X = xi) |
Prawdopodobieństwo pi |
1 |
0 |
P(X = 0) |
1/8 |
2 |
1 |
P(X = 1) |
3/8 |
3 |
2 |
P(X = 2) |
3/8 |
4 |
3 |
P(X = 3) |
1/8 |
Dystrybuanta zmiennej losowej:
P(X = 2) = 3/8 P(X > 2) = P(X > 3) - P(X ≤ 3) = 1 - 7/8 = 1/8
P(X ≤ 2) = 4/8 P(X ≥ 2) = P(X > 3) - P(X ≤ 2) = 1 - 4/8 = 6/8
P(X < 2) = 1/8
Parametry zmiennej losowej lub parametry rozkładu zmiennej losowej są to liczby charakteryzujące wartości, jakie może przybierać zmienna losowa.
Wartość oczekiwana (przeciętna) E(x) - jest to wartość, wokół której skupiają się realizacje zmiennej losowej uzyskiwane w wyniku wielokrotnego powtarzania eksperymentu.
Wartość oczekiwana zmiennej losowej skokowej:
- gdy zmienna X przyjmuje n wartości,
- gdy zmienna X przyjmuje przeliczalnie wiele wartości.
Właściwości:
wartość oczekiwana stałej równa się tej stałej:
E(C) = C;
wartość oczekiwana dwóch zmiennych losowych X i Y równa się sumie wartości oczekiwanych tych zmiennych:
E(X+Y) = E(X) + E(Y);
jeżeli dwie zmienne X i Y są niezależne, to wartość oczekiwana iloczynu zmiennych jest równa iloczynowi wartości oczekiwanych tych zmiennych:
E(XY) = E(X)⋅E(Y)
wynika stąd również zależność:
E(CX) = E(C)⋅E(X) = CE(X)
Wariancja zmienne losowej V(X) - miara rozproszenia wartości zmiennej wokół średniej, jest to wartość oczekiwana kwadratu różnicy tej zmiennej i wartości oczekiwanej E(X):
Wariancja zmiennej losowej skokowej:
Własności wariancji:
wariancja stałej równa się zeru:
V(C) = 0;
wariancja iloczynu stałej i zmiennej losowej:
V(CX) = C2V(X);
jeżeli dwie zmienne X i Y są niezależne, to wariancja sumy (różnicy) tych zmiennych jest równa:
V(X ± Y) = V(X) + V(Y).
Odchylenie standardowe ၳ zmiennej losowej:
Współczynnik zmienności vၳ:
Współczynnik skośności Aၳ:
Medianą Me zmiennej losowej X - nazywamy wartość x, która spełnia układ równań:
Modalną Mo zmiennej losowej X - nazywamy wartość x, której odpowiada największe prawdopodobieństwo realizacji.
Przykład 2
Rzucamy trzykrotnie monetą. Zmienną losową oznaczamy liczbę uzyskanych orłów. Przestrzeń zdarzeń elementarnych E = {(RRR), (ROR), (RRO), (ORR), (OOO), (ROO), (OOR), (ORO)}. Rozkład prawdopodobieństwa:
xi |
0 |
1 |
2 |
3 |
pi |
1/8 |
3/8 |
3/8 |
1/8 |
E(X) = 0⋅1/8 + 1⋅3/8 + 2⋅3/8 + 3⋅1/8 = 12/8 = 1,5
V(X) = (0 - 1,5)2⋅1/8 + (1 - 1,5)2⋅3/8 + (2 - 1,5)2⋅3/8 + (3 - 1,5)2⋅1/8 = 0,75
Zmienna losowa ciągła
Dla zmiennej losowej ciągłej nie jest możliwe przypisanie wszystkim jej wartościom dodatnich prawdopodobieństw sumujących się do jedności. Można jednak przyporządkować prawdopodobieństwa przedziałom liczbowym:
P(x < X < x+Δx)
gdzie Δx jest długością przedziału o początku w x.
Jeżeli Δx → 0 oraz istnieje granica funkcji f(x) w postaci:
to granicę tę nazywamy funkcją gęstości prawdopodobieństwa zmiennej losowej X.
Prawdopodobieństwo tego, że zmienna losowa przyjmuje wartość z przedziału (a, b) - skończonego lub nieskończonego - jest całką funkcji gęstości prawdopodobieństwa w tym przedziale:
Jeżeli zmienna losowa X przybiera wartości z przedziału skończonego (a, b) lub nieskończonego (-∞, +∞) to funkcja f(x) musi spełniać warunek:
Prawdopodobieństwo tego, że zmienna losowa ciągła X przyjmie dokładnie wartość a (gdzie a jest dowolną stałą) jest równe zeru:
Nie oznacza to, że zdarzenie x = a jest niemożliwe, jest tylko bardzo mało prawdopodobne, ponadto, prawdopodobieństwo tego, że zmienna losowa X przyjmie wartość inną niż x = a jest równe jedności, co nie świadczy o tym, że jest ono pewne, jest tylko wysoce prawdopodobne.
Dystrybuanta zmiennej losowej ciągłej F(x)=P(X<x) - jest definiowana podobnie jak dla zmiennej losowej skokowej, z tym, że suma jest zastąpiona całką:
gdzie f(x) jest funkcją gęstości prawdopodobieństwa zmiennej losowej X, stąd:
Dla zmiennej losowej X przyjmującej wartości z przedziału (a, b):
Ponadto:
Wartość oczekiwana zmiennej losowej ciągłej:
Wariancja zmiennej losowej ciągłej:
Medianą Me zmiennej losowej ciągłej - jest to wartość, dla której spełniona jest równość:
Modalną Mo zmiennej losowej ciągłej - jest to wartość, dla której funkcja gęstości f(x) osiąga maksimum.
Przykład 3
Dana jest funkcja:
Sprawdzić, czy jest to funkcja gęstości zmiennej losowej X.
warunek 1:
- funkcja w całym zakresie jest nieujemna.
warunek 2:
- aby był spełniony ten warunek musi zachodzić:
ponieważ w przedziale (-∞;0] i [1;+∞) funkcja gęstości jest równa zero.
Obydwa warunki są spełnione, więc funkcja f(x) jest funkcją gęstości zmiennej losowej X.
Dla x ≤ 0 dystrybuanta zmiennej losowej X równa się zero, dla dowolnego x z przedziału [0, 1] dystrybuanta wyraża się następująco:
stąd
P(X = 0,5) |
0 |
|
P(0 < X < 0,1) |
|
F(0,1) - F(0) = 0,01 |
P(X < 0,5) |
|
F(0,5) = 0,25 |
P(X > 0,6) |
|
1 - F(0,6) = 1 - 0,36 = = 0,64 |
Mediana:
stąd
czyli Me = 0,71
Oznacza to, że zmienna losowa X przyjmuje wartości mniejsze od 0,71 z prawdopodobieństwem 0,5.
Drugi parametr pozycyjny, modalna nie istnieje, gdyż funkcja f(x) nie ma maksimum.
Rozkłady zmiennej losowej skokowej
Rozkład zero-jedynkowy (dwupunktowy)
Zmienna losowa X przyjmuje dwie wartości
x1 = 1 i x2 = 0
z prawdopodobieństwem
P(X=x1=1) = p i P(X=x2=0) = q
Rozkład zero-jedynkowy:
gdzie k=x1=1 lub k=x2=0 oraz 0<p<1 i q=1 - p.
Stąd
Dystrybuanta
Wartość oczekiwana
Wariancja
Rozkład dwumianowy
Określa prawdopodobieństwo, tego że realizując n doświadczeń osiągniemy k sukcesów (k ≤ n).
Rozkład dwumianowy:
gdzie
jest kombinacją:
oraz k = 0, 1, 2, ..., n i p + q =1
Dystrybuanta:
Wartość oczekiwana:
Wariancja:
Zmienna losowa o rozkładzie dwumianowym opisuje eksperyment noszący nazwę prób Bernoulliego - dlatego rozkład ten nazywany jest rozkładem Bernoulliego.
Eksperyment polega na przeprowadzeniu n (n ≥ 2)niezależnych doświadczeń, wynikiem może być tylko jedno z dwóch możliwych stanów: sukces lub porażka.
Uwagi:
prawdopodobieństwo stanu, który został uznany za sukces jest takie samo w kolejnych doświadczeniach (p), prawdopodobieństwo niepowodzenia q łączy się z p zależnością: p + q = 1;
doświadczenia są niezależne, tzn. wynik poprzedniego nie wpływa na wynik następnego.
funkcja rozkładu zależy od dwóch parametrów: liczby doświadczeń n i prawdopodobieństwa sukcesu p;
dla p = q = 1/2 rozkład dwumianowy jest symetryczny, dla p ≠ q rozkład jest asymetryczny, jeżeli p < 1/2 - prawostronnie asymetryczny, dla p > 1/2 - lewostronnie asymetryczny.
Przykład 4
Eksperyment polega na pięciokrotnym rzucie monetą. Zmienna losowa przybiera wartości: 0, 1, 2, 3, 4, 5.
Możliwe są dwa wzajemnie wykluczające się wyniki: wypadł orzeł (sukces), wypadła reszka (niepowodzenie), prawdopodobieństwo wyrzucenia orła równe 1/2 nie zmienia się, a wynik danego doświadczenia nie wpływa na wynik następnego - schemat Bernoulliego.
Prawdopodobieństwa poszczególnych wartości i dystrybuanta:
|
|
P(X < 2) = P(X = 0) + P(X = 1) = 6/32 lub P(X < 2) = F(2) = 6/32
P(X ≥ 3) = 1 - P(X < 3) = 1 - F(3) = 1 - 16/32 = 16/32
Funkcje standardowe programu Excel związane z rozkładem dwumianowym
Rozkład Poissona
Jeżeli prawdopodobieństwo zmiennej losowej X jest opisane rozkładem dwumianowym oraz przyjmuje wartości: k = 0, 1, 2, 3, ..., czyli n → ∞, to p przyjmuje takie wartości, że iloczyn n⋅p jest wartością stałą równą m (n⋅p = m; m > 0).
Rozkład Poissona:
Dystrybuanta:
Wartość oczekiwana:
Wariancja:
Rozkład Poissona jest szczególnym przypadkiem rozkładu dwumianowego, zachodzącym wtedy, gdy prawdopodobieństwo p sukcesu jest małe, a liczba realizacji n na tyle duża, że np = m.
Rozkład Poissona stosuje się jako przybliżenie rozkładu dwumianowego, gdy:
prawdopodobieństwo sukcesu jest mniejsze niż 0,2;
liczba doświadczeń jest równa co najmniej 20.
Przykład 5
Stwierdzono w pewnym wydawnictwie, że ich zecerzy popełniają średnio 1,5 błędu na jednej stronie. Obliczyć prawdopodobieństwa wystąpienia od 0 do 10 błędów na jednej stronie.
Funkcja standardowa programu Excel związana z rozkładem Poissona
1/8
3/8
pi
xi
0
1
2
3
2/8
4/8
pi
xi
6/8
1
0
1
2
3
4
1
1
F(x)
x
0,1
F(0,1)
1
2
f(x)
x
0,1