Zmienna losowa.
Rozkłady zmiennych losowych.
Szacowanie prawdopodobieństwa realizacji zdarzeń.
Wiadomości wstępne
Rachunek prawdopodobieństwa zajmuje się analizą praw rządzących zjawiskami przypadkowymi czyli takimi, których wyniku nie można przewidzieć.
Zjawisko polegające na przebiegu dużej ilości tych samych doświadczeń nazywamy masowymi.
Dla ustalonego zdarzenia A liczbę tę nazywamy prawdopodobieństwem zajścia zdarzenia A i oznaczamy symbolem P(A).
Klasyczna definicja prawdopodobieństwa
Jeżeli przestrzeń W składa się z n-zdarzeń elementarnych jednakowo prawdopodobnych, to prawdopodobieństwo zajścia zdarzenia A jest ilorazem liczby zdarzeń elementarnych sprzyjających zajściu zdarzenia A przez liczbę wszystkich zdarzeń elementarnych, tzn.
sformułowana przez Pierre-Simona Laplace'a w 1812 roku).
Klasyczna definicja prawdopodobieństwa jest niekonsekwentna i nieprzydatna. Jej wadami są:
1) Użycie w definicji słowa definiowanego - mówiąc o zdarzeniach jednakowo możliwych, mamy na myśli zdarzenia jednakowo prawdopodobne
2) Przestrzeń zdarzeń elementarnych OMEGA i zbiór zdarzeń sprzyjających zdarzeniu A muszą być zbiorami skończonymi, co nie zawsze występuje w praktyce
3) Przestrzeń zdarzeń elementarnych i zbiór zdarzeń sprzyjających zdarzeniu A muszą być znane.
lub
- moc zb. A, ilość elementów sprzyjających zdarzeniu A
- moc zb. W, ilość wszystkich możliwych zdarzeń elementarnych danego doświadczenia
Wadami tej definicji są:
1. mówiąc o zdarzeniach jednakowo możliwych, mamy na myśli zdarzenia jednakowo prawdopodobne, które w życiu najczęściej nie występują;
2. przestrzeń zdarzeń elementarnych i zbiór zdarzeń sprzyjających zdarzeniu A muszą być zbiorami skończonymi, co nie zawsze zachodzi;
3. przestrzeń zdarzeń elementarnych i zbiór zdarzeń elementarnych sprzyjających danemu zdarzeniu A muszą być znane.
Przykład 1.
Partia wyprodukowanych golarek elektrycznych wynosi 15 428 sztuk. Dział Kontroli Jakości produkcji stwierdził, że wśród nich jest 926 golarek uszkodzonych (niesprawnych technicznie). Jakie jest prawdopodobieństwo, że brakarz trafi na golarkę z usterkami technicznymi?
oznacza, że wśród 100 golarek wyprodukowanych w tej partii przeciętnie 6 golarek wskazuje usterki techniczne.
Przykład 2
Wyznaczyć prawdopodobieństwo zajścia zdarzenia:
A - w rzucie kostką wypadła parzysta liczba oczek
B - w rzucie kostką wypadła liczba oczek większa od 4.
Przestrzeń zdarzeń elementarnych
Zdarzeniu A sprzyjają wyniki
Zatem
Do zdarzenia B zaliczyć można elementy 5 i 6, czyli
Prawdopodobieństwo
Aksjomatyczna definicja prawdopodobieństwa (Kołmogorowa)
Prawdopodobieństwem określonym na przestrzeni zdarzeń elementarnych W nazywamy taką funkcję P, która każdemu zdarzeniu
przyporządkowuje liczbę rzeczywistą P(A) w taki sposób, że:
(A1) (aksjomat 1)
(A2) (aksjomat 2)
(A3) jeżeli
Własności prawdopodobieństwa
Przykład 3.
Badając terminowość spłat kredytów inwestycyjnych pewnego banku, oszacowano prawdopodobieństwo następujących zdarzeń:
● spłaty terminowej (P1=0,783)
● spłaty nieterminowej (P2=0,198)
● zaniechania spłat (P3=0,019)
Czy spełnione są aksjomaty definicji prawdopodobieństwa?
Wszystkie wartości podanych liczb mieszczą się w przedziale ;
● P1+P2+P3 =1 co oznacza, że wszyscy klienci banku bądź dokonają spłaty terminowej, bądź nieterminowej, bądź zaniechają spłat (innej możliwości nie ma);
● A3: np. P1+P2=0,981, co oznacza, że łączne prawdopodobieństwo spłaty kredytu (terminowej lub nieterminowej) wynosi 0,981.
Zmienne losowe
Zmienną losową jest zmienna, która przyjmuje różne wartości liczbowe, wyznaczone przez los.
Przyporządkowanie prawdopodobieństw różnym możliwym wartościom zmiennej losowej nazywa się rozkładem prawdopodobieństwa zmiennej losowej.
Definicja
Rozkładem prawdopodobieństw zmiennej losowej skokowej, zwanym też funkcją rozkładu prawdopodobieństwa, jest tablica, wzór lub wykres, który przyporządkowuje prawdopodobieństwa każdej możliwej wartości zmiennej.
Oznaczenia:
X, Y - zmienne losowe
P(X = x) oznacza prawdopodobieństwo, że zmienna losowa X przyjmie pewną określoną wartość x. Np. P(X=5)=0,2 oznacza, że prawdopodobieństwo, że zmienna losowa X przyjmie wartość liczbową 5 jest równe 0,2.
Rozkład prawdopodobieństwa zmiennej losowej skokowej X spełnia następujące warunki:
1.
2.
Przykład 1.
Każdego dnia gazeta otrzymuje zamówienia na ogłoszenia do porannego wydania w dniu następnym. Lista zamieszczonych ogłoszeń zależy od wielu czynników: pory roku, dnia tygodnia, stanu gospodarki krajowej i stanu miejscowego biznesu.
Liczba ogłoszeń jest więc zmienną losową (ozn. X). Ponieważ liczba ogłoszeń zamieszczonych w danym dniu jest liczbą naturalną 0, 1, 2, …. jest więc to zmienna skokowa.
W zamieszczonym zestawieniu wymieniono możliwe liczby ogłoszeń zamieszczonych dziennie w gazecie i odpowiadające im prawdopodobieństwa
x |
P(x) |
0 1 2 3 4 5 |
0,1
0,3
0,1 0,1 |
|
1,0 |
Należy zauważyć, że wszystkie prawdopodobieństwa sumują się do całości. Gdyby tak nie było, znaczyłoby to, że zastała pominięta pewna wartość zmiennej losowej, której odpowiada niezerowe prawdopodobieństwo.
Informacje z rozkładu prawdopodobieństwa:
Wszystkie prawdopodobieństwa sumują się do jedności. Gdyby tak nie było, znaczyłoby to, że została pominięta pewna wartość zmiennej losowej, której odpowiada niezerowe prawdopodobieństwo.
Zmienna losowa przyjmuje wartość co najwyżej 5 tzn., że gazeta nie zamieszcza więcej niż 5 ogłoszeń dziennie.
Np. prawdop. zamieszczenia w jednym dniu 2 ogłoszeń wynosi 30%, a 3 ogłoszeń 20%.
4. Ponieważ zdarzenia wzajemnie się wykluczają, prowdop. zamieszczenia 2 lub 3 ogłoszeń wynosi 0,2+0,3=0,5 (50%);
5. Prawdop., że liczba zamieszczonych ogłoszeń znajdzie się między 1 a 4 wynosi 0,8 (P(1)+…+P(4)).
Rozkład prawdopodobieństwa za pomocą wykresu
Dystrybuanta
Definicja.
Skumulowaną funkcją rozkładu (dystrybuantą) skokowej zmiennej losowej X jest funkcja:
cd. Przykładu 1.
Prawdop., że liczba ogłoszeń zamieszczonych jutro w gazecie będzie mniejsza lub równa 3 wynosi:
x |
P(x) |
F(x) |
0 1 2 3 4 5 |
0,1 0,2 0,3 0,2 0,1 0,1 |
0,1 0,3 0,6 0,8 0,9 1,0 |
|
1,0 |
|
Prawdopodobieństwo, ze zostanie zamieszczone więcej niż jedno ogłoszenie wynosi:
Jest tak dlatego, że
(zdarzenia wzajemnie się dopełniają).
Prawdopodobieństwo, że liczba zamieszczonych ogłoszeń będzie się wahać między 1 a 3 jest równe:
Przykład 2.
Salon samochodowy rejestruje dzienną sprzedaż. Wyniki obserwacji doprowadziły do następującego rozkładu prawdopodobieństwa:
x |
P(x) |
0 1 2 3 4 5 |
0,1 0,1 0,2 0,2 0,3 0,1 |
|
1,0 |
a) Obliczyć prawdop., że liczba sprzedanych samochodów będzie mieściła się między 2 i 4 (łącznie z wartościami krańcowymi).
b) Znajdź dystrybuantę dziennej sprzedaży samochodów.
x |
P(x) |
F(x) |
0 1 2 3 4 5 |
0,1 0,1 0,2 0,2 0,3 0,1 |
0,1 0,2 0,4 0,6 0,9 1,0 |
|
1,0 |
|
c) Wykaż, że P(X) jest funkcją rozkładu prawdopodobieństwa.
Przykład 3.
Liczba żaglówek budowanych w ciągu miesiąca w małej stoczni jest zmienną losową X o następującym rozkładzie prawdopodobieństwa.
x |
P(x) |
2 3 4 5 6 7 8 |
0,2 0,2 0,3 0,1 0,1 0,05 0,05 |
Oblicz prawdopodobieństwo, że liczba żaglówek, które zostaną zbudowane w przyszłym miesiącu będzie mieściła się między 4 a 7 (z włączeniem wartości skrajnych);
Znajdź dystrybuantę zmiennej X;
Wykorzystaj dystrybuantę do wyznaczenia prawdopodobieństwa, że liczba żaglówek zbudowanych w ciągu miesiąca będzie nie większa od 6;
Oblicz prawdopodobieństwo, że liczba zbudowanych żaglówek w ciągu miesiąca będzie większa niż 3, ale nie większa niż 6.
a)
b)
x |
2 3 4 5 6 7 8 |
F(x) |
0,2 0,4 0,7 0,8 0,9 0,95 1 |
c)
d)
Wartość oczekiwana i odchylenie standardowe
Definicja
Wartość oczekiwana zmiennej losowej skokowej X jest równa sumie wszystkich możliwych wartości tej zmiennej mnożonych przez ich prawdopodobieństwa:
cd. Przykładu 1.
Wartość oczekiwana:
x |
p(x) |
xp(x) |
0 1 2 3 4 5 |
0,1 0,2 0,3 0,2 0,1 0,1 |
0 0,2 0,6 0,6 0,4 0,5 |
|
1,0 |
2,3 |
Jak widać E(X)=2,3. Można zatem powiedzieć, że przeciętnie gazeta zamieszcza dziennie 2,3 ogłoszenia.
Definicja
Wariancją zmiennej losowej skokowej X jest
Wariancja jest miarą rozproszenia możliwych wartości zmiennej. Daje wyobrażenie o zmienności a tym samym o niepewności związanej z przyszłymi wartościami zmiennej, które mogą tym bardziej odbiegać od przeciętnej, im wyższa jest wariancja.
Wariancja liczby ogłoszeń w gazecie:
x |
p(x) |
xp(x) |
x2p(x) |
0 1 2 3 4 5 |
0,1 0,2 0,3 0,2 0,1 0,1 |
0 0,2 0,6 0,6 0,4 0,5 |
0 0,20 1,20 1,80 1,60 2,50 |
|
1,0 |
2,3 |
7,30 |
Odchylenie standardowe:
Zatem w przykładzie:
Przykład 4.
W dużej aglomeracji miejskiej statystyki policyjne odnotowały w ciągu ostatnich 300 dni następujące dane dotyczące wypadków drogowych:
Liczba wypadków drogowych |
Liczba dni |
0 1 2 3 4 |
45 75 120 45 15 |
a) Co jest zmienną losową w przykładzie?
b) Określić i przedstawić w formie tabelarycznej rozkład prawdopodobieństwa i dystrybuantę empiryczną wypadków drogowych w tym mieście.
c) Jakie jest prawdopodobieństwo tego, że w dowolnie wybranym dniu zdarzą się mniej niż 3 wypadki?
d) Jakie jest prawdopodobieństwo tego, że w dowolnie wybranym dniu zdarzy się co najmniej jeden wypadek drogowy?
e) Wyznaczyć wartość oczekiwaną i wariancję zmiennej losowej?
Odp.a) Zmienną losową skokową jest dzienna liczba wypadków drogowych. Przyjmuje ona wartości 0,1,2,3,4.
b) Określić i przedstawić w formie tabelarycznej rozkład prawdopodobieństwa i dystrybuantę empiryczną wypadków drogowych w tym mieście.
Liczba wypadków drogowych |
Liczba dni |
pi |
F(xi) |
0 1 2 3 4 |
45 75 120 45 15 |
0,15 0,25 0,40 0,15 0,05 |
0,15 0,40 0,80 0,95 1,00 |
c) Jakie jest prawdopodobieństwo tego, że w dowolnie wybranym dniu zdarzą się mniej niż 3 wypadki?
d) Jakie jest prawdopodobieństwo tego, że w dowolnie wybranym dniu zdarzy się co najmniej jeden wypadek drogowy?
e) Wyznaczyć wartość oczekiwaną i wariancję zmiennej losowej?
Liczba wypadków drogowych xi |
Liczba dni |
pi |
F(xi) |
xipi |
xi2pi |
0 1 2 3 4 |
45 75 120 45 15 |
0,15 0,25 0,40 0,15 0,05 |
0,15 0,40 0,80 0,95 1,00 |
0 0,25 0,80 0,45 0,2 |
0 0,25 1,60 1,35 0,80 |
Suma |
300 |
1 |
X |
1,70 |
4,00 |
Przykład 5.
Na podstawie wielu obserwacji ustalono, że rozkład liczby zapałek w pudełku jest zmienną losową o poniższej funkcji prawdopodobieństwa:
Liczba zapałek |
46 |
47 |
48 |
49 |
50 |
Prawdopodobieństwo |
0,10 |
0,32 |
0,45 |
0,10 |
0,03 |
Czy informacja, że w pudełku znajduje się 48 zapałek jest rzetelna? Odpowiedź uzasadnić, obliczając wartość oczekiwaną liczby zapałek w pudełku.
Jaki procent kupujących może twierdzić, że w pudełku jest mniej niż 48 zapałek?
Zmienną typy ciągłego jest np. czas, waga, odległość, wiek, temperatura itp.
Zmienna ciągła przybiera wartości z pewnego przedziału liczbowego.
Wykresem zmiennej ciągłej jest histogram.
W miarę, jak pomiary stają się coraz dokładniejsze, liczba prostokątów w histogramie rośnie a ich podstawa staje się coraz węższa
Schodkowa powierzchnia utworzona przez wierzchołki prostokątów w histogramie staje się gładką krzywą - wykresem pewnej funkcji. Pole pod tą krzywą - jako suma pól prostokątów odpowiadających pewnym prawdopodobieństwom - jest równe 1.
Funkcję tę nazywamy funkcją gęstości rozkładu prawdopodobieństwa ciągłej zmiennej losowej X i oznaczamy f(x).
Definicja
Ciągła zmienna losowa to taka zmienna losowa, która może przyjmować dowolne wartości z pewnego przedziału liczbowego.
Prawdopodobieństwa związane z ciągłą zmienną losową X są wyznaczane przez funkcję gęstości prawdopodobieństwa zmiennej losowej f(x) o własnościach:
1. f(x) 0 dla wszystkich x
2. Prawdopodobieństwo, że X przyjmie wartość między a i b jest równe mierze pola pod krzywą (wykresem) f(x) między punktami a i b
Całe pole pod krzywą (wykresem) jest równe 1.
Dystrybuanta
Definicja
Skumulowana funkcja rozkładu prawdopodobieństwa (dystrybuanta) ciągłej zmiennej losowej X ma postać:
Jest to miara pola pod wykresem funkcji f(x) między najmniejszą możliwą wartością X (często utożsamianą
z ) a punktem X.
Uwaga: Dla zmiennej losowej ciągłej zachodzi
Wartość oczekiwana zmiennej typu ciągłego określa wzór:
Odpowiednio wariancja oraz odchylenie standardowe:
Mimo tego, że dystrybuanta, wartość oczekiwana, wariancja i inne miary dla rozkładu ciągłego są wyznaczane za pomocą rachunku całkowego - nie należy się tym martwić. Praktyczna statystyka nie wymaga umiejętności posługiwania się tymi środkami.
Rozkłady ważne dla statystyki są stablicowane.
Rozkłady zmiennej losowej
Wyniki obserwacji (doświadczenia) pogrupowane są w szeregi (np. punktowe, przedziałowe i inne).
Dysponując szeregiem danych empirycznych, można dokonać opisu statystycznego całej zbiorowości.
W parze z rozkładami empirycznymi idą rozkłady teoretyczne, czyli funkcje (modele) matematyczne, służące przeprowadzeniu analizy statystycznej danego zjawiska.
Istnieje kilkadziesiąt typów teoretycznych rozkładów zmiennych losowych. Do najbardziej znanych zaliczamy
Dla zmiennej skokowej:
- rozkład dwumianowy Bernoulliego (B)
- rozkład Poissona (P)
Dla zmiennej ciągłej
- rozkład normalny Gaussa-Laplace'a (N)
- rozkład logarytmiczno-normalny (LN)
- rozkład chi-kwadrat Abbego
- rozkład t-Studenta (S)
- rozkład Fishera-Snedecora (FS)
Rozkład Bernoulliego
Zmienna losowa ma rozkład Bernoulliego X:B(n,p), jeśli jej funkcja prawdopodobieństwa określona jest wzorem:
gdzie:
n - liczba wariantów zmiennej,
k - liczba realizacji zdarzenia k
p - prawdopodobieństwo realizacji zdarzeń k w każdej
z niezależnych realizacji
Z takim rozkładem mamy do czynienia w przypadku wyznaczania prawdopodobieństwa kolejnych wartości k w n doświadczeniach. Aby rozkład dwumianowy mógł znaleźć zastosowanie, muszą być spełnione warunki:
● przeprowadza się n jednakowych doświadczeń;
● dla każdego doświadczenia możliwe są dwa wyniki: jeden - zwany sukcesem, a drugi porażką;
● prawdopodobieństwo sukcesu czy porażki w kolejnych doświadczeniach jest stałe;
● doświadczenia są od siebie niezależne.
Doświadczenie |
Sukces |
Porażka |
Rzut monetą |
orzeł |
reszka |
Rzut kością |
parzysta liczba oczek |
nieparzysta liczba oczek |
Strzelanie do celu |
trafienie |
chybienie |
Pobieranie sztuki towaru ze zwracaniem |
dobra |
wadliwa |
Urodzenie dziecka |
dziewczynka |
chłopiec |
Wartość oczekiwana w tym rozkładzie wynosi:
a wariancja
Przykład 6.
Kasia i Tomek, świeżo poślubieni małżonkowie z Gdańska, postanowili mieć czwórkę dzieci. Kasi marzą się 3 chłopcy i 1 dziewczynka, Tomkowi 2 dziewczynki i 2 chłopców. Wiedząc, że w Gdańsku na 1000 niemowląt rodzi się średnio 520 chłopców oceń, czyje marzenia mają większą szansę na spełnienie.
Przykład 7.
Sprzedawca pewnego dobra trwałego użytku kontaktuje się z 8 potencjalnymi klientami dziennie. Z wcześniejszych doświadczeń wiadomo, że prawdopodobieństwo zakupu tego dobra przez potencjalnego klienta wynosi 0,10.
Jakie jest prawdop. tego, że sprzedawca przeprowadzi dokładnie 2 transakcje dziennie;
Jakie jest prawdop. tego, że sprzedawca przeprowadzi co najmniej 2 transakcje dziennie;
Jaki odsetek stanowić będą dni, w których sprzedawca nie dokona żadnej transakcji sprzedaży?
Jakiej średniej liczby sprzedanych dóbr trwałego użytku dziennie może się spodziewać sprzedawca?
n=8, p=0,1, k=2
Prawdop., że sprzedawca przeprowadzi dokładnie 2 transakcje sprzedaży dziennie wynosi 0,1488;
b) lub za pomocą tablic rozkładu
Prawdop., że sprzedawca przeprowadzi co najmniej 2 transakcje dziennie wynosi ok. 0,19.
c)
43% ogółu dni roboczych stanowią takie dni, w których nie zostanie przeprowadzona żadna transakcja.
moc zb. A, ilość elementów sprzyjających zdarzeniu A
Może przyjmować
wartości z dowolnego
przedziału liczbowego
Może przyjmować
wartości ze zbioru
przeliczalnego
Ciągła
Skokowa
(dyskretna)
Zmienna losowa
Rozkład prawdopodobieństwa
zmiennej losowej X
P(x)
0,3
0,2
0,1
5
4
3
2
1
0
x
0
1
2
3
4
5
0,1
0,2
0,3
x
P(x)
P(x≤3)=F(3)
F(1)
P(x>1)=
=1-F(1)
P(x)
x
0,3
0,2
0,1
5
4
3
2
1
0
F(3)
F(0)
P(1≤x≤3)=F(3)-F(0)
P(x)
x
0,3
0,2
0,1
5
4
3
2
1
0
0,10
0,25
0,30
0,20
0,10
0,05
6
5
4
P(x)
x
3
2
1
6
5
4
P(x)
x
3
2
1
Całe pole pod krzywą f(x)
ma miarę 1,0
f(x)
Prawdopodobieństwem, że x
przybierze wartość od 2 do 3, jest
miara pola pod krzywą f(x)
Między punktami 2,0 i 3,0
6
5
4
P(x)
x
3
2
1