Wykład 3.
Teoria prawdopodobieństwa i statystyki matematycznej
Zdarzenia losowe i prawdopodobieństwo
Def. Doświadczenie (eksperyment) nazywamy losowym, jeżeli nie jesteśmy w stanie przewidzieć jego wyniku. Wyniki doświadczenia losowego to zdarzenia elementarne, np. w doświadczeniu polegającym na jednokrotnym rzucie kostką sześcienną, wypadnięcie dwóch oczek jest zdarzeniem elementarnym.
Def. Przestrzenią zdarzeń elementarnych
nazywamy zbiór wszystkich zdarzeń elementarnych odpowiadających danemu doświadczeniu losowemu, np. w doświadczeniu polegającym na jednokrotnym rzucie kostką sześcienną, przestrzeń zdarzeń elementarnych jest postaci:
, gdzie
jest zdarzeniem elementarnym - otrzymano i oczek (i=1,2,...,6).
Def. Zdarzeniem losowym A nazywamy każdy podzbiór przestrzeni zdarzeń elementarnych, np. w doświadczeniu polegającym na jednokrotnym rzucie kostką sześcienną uzyskano parzystą ilość oczek, czyli
.
Def. Zdarzeniem pewnym nazywamy całą przestrzeń zdarzeń elementarnych. Zdarzeniem niemożliwym- podzbiór pusty zbioru
.
Skoro zdarzenia losowe są zbiorami, więc można na nich wykonywać działania mnogościowe tworząc inne zdarzenia, tzn. suma (alternatywa) zdarzeń, iloczyn (koniunkcja) zdarzeń, różnica zdarzeń, zdarzenie przeciwne.
Graficzną ilustracją działań na zdarzeniach jest diagram Venna.
Przykłady na tablicy.
Klasyczna definicja prawdopodobieństwa (Laplace'a):
Jeżeli przez n oznaczymy liczbę wszystkich możliwych zdarzeń elementarnych, to prawdopodobieństwo zaistnienia (zajścia) zdarzenia losowego A wyraża się stosunkiem liczby zdarzeń elementarnych sprzyjających zdarzeniu A (m), do całkowitej liczby zdarzeń elementarnych (n), czyli
,
przy czym
, gdzie A' jest zdarzeniem przeciwnym do zdarzenia A.
Aksjomatyczna definicja prawdopodobieństwa (Kołmogorowa):
Aksjomat 1. Każdemu zdarzeniu losowemu przyporządkowana jest jednoznacznie pewna liczba rzeczywista z przedziału (0,1), zwana prawdopodobieństwem tego zdarzenia.
Aksjomat 2. Prawdopodobieństwo zdarzenia pewnego jest równe jedności.
Aksjomat 3. Jeżeli zdarzenie losowe A jest sumą rozłącznych zdarzeń losowych
, to prawdopodobieństwo zrealizowania tego zdarzenia jest równe sumie prawdopodobieństw zdarzeń
, czyli
.
Elementy kombinatoryki (w telegraficznym skrócie):
Wariacje z powtórzeniami- liczba k-wyrazowych wariacji z powtórzeniami zbioru złożonego z n różnych elementów jest równa
, co zapisujemy:
Przykład: Wyznaczyć liczbę możliwych wyników doświadczenia polegającego na dwukrotnym rzucie kostką sześcienną:
Wariacje bez powtórzeń - liczba k-wyrazowych wariacji bez powtórzeń zbioru złożonego z n różnych elementów, gdzie
, jest równa
, co zapisujemy:
Przykład: Z urny zawierającej 49 kul oznaczonych numerami 1,2,...,49 losujemy kolejno 6 kul (nie wrzucamy wylosowanych kul do urny) i układamy je w kolejności losowania. Wyliczyć liczbę możliwych wyników takiego doświadczenia:
Permutacje- liczba permutacji zbioru n - elementowego wynosi n!, co zapisujemy:
Przykład: Rodzina 4-osobowa ustawia się w szeregu do zdjęcia. Ile różnych fotografii można otrzymać:
Kombinacje - liczba k- elementowych kombinacji zbioru złożonego z n elementów, gdzie
, jest równa
, co zapisujemy:
Przykład: Ile kuponów należałoby kupić w Kolekturze Lotto, aby mieć pewność wygranej I stopnia w Dużym Lotku:
Prawdopodobieństwo całkowite i wzór Bayesa
Def. Dwa zdarzenia losowe A i B są niezależne, jeżeli zajście jednego z nich nie ma wpływu na prawdopodobieństwo zajścia drugiego, tzn.
W przeciwnym wypadku mamy do czynienia ze zdarzeniami zależnymi.
Prawdopodobieństwo warunkowe zdarzenia A przy założeniu, że zaszło zdarzenie B obliczamy następująco: jeśli P(B)>0, to
Def. Prawdopodobieństwa całkowitego
Jeżeli zdarzenie A może zajść pod warunkiem zajścia jednego z wykluczających się zdarzeń
(tworzących zupełny układ zdarzeń), to prawdopodobieństwo zdarzenia A obliczamy ze wzoru:
Wzór Bayesa:
Przykład: Rynek zaopatrywany jest w ten sam towar przez 3 producentów. Pierwszy z nich zaopatruje rynek w 50%, drugi w 30%, trzeci w 20%. Średni procent braków w produkcji pierwszego producenta wynosi 3%, drugiego 4%, a trzeciego 5%. Kupiony towar okazał się brakiem. Od którego producenta najprawdopodobniej on pochodzi.
Rozwiązanie:
Odp.: Od pierwszego producenta.
Zmienne losowe
Funkcją rozkładu prawdopodobieństwa zmiennej losowej skokowej lub krótko rozkładem prawdopodobieństwa nazywamy przyporządkowanie realizacjom zmiennej losowej X odpowiadające im prawdopodobieństwa, co można zapisać następująco:
,
gdzie
,
,
Dla zmiennej typu ciągłego rozkład prawdopodobieństwa określony jest za pomocą funkcji gęstości f mającej następujące własności:
oraz
Def. Dystrybuantą zmiennej losowej X nazywamy funkcję zmiennej rzeczywistej x określoną wzorem:
dla każdego
.
Dla zmiennej skokowej:
dla i=1,2,3,...
Dla zmiennej ciągłej:
Def. Wartością oczekiwaną zmiennej losowej X nazywamy liczbę:
dla zmiennej skokowej
dla zmiennej ciągłej
Def. Wariancją zmiennej losowej X nazywamy liczbę:
dla zmiennej skokowej
dla zmiennej ciągłej
Przykład:
Zakładając, że liczba wezwań górskiego pogotowia ratunkowego w ciągu doby ma następujący rozkład:
Liczba wezwań
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
|
0,12 |
0,32 |
0,18 |
0,15 |
0,12 |
0,08 |
0,03 |
sporządzić wykres funkcji prawdopodobieństwa i dystrybuanty,
obliczyć prawdopodobieństwo, że w ciągu doby liczba wezwań będzie wynosić od dwóch do czterech,
obliczyć oczekiwaną liczbę wezwań w ciągu doby oraz wariancję.
Podstawowe rozkłady teoretyczne zmiennej losowej
Rozkłady zmiennej skokowej:
Rozkład dwumianowy
dla k=0,1,2,...,n ( p - prawdopodobieństwo „sukcesu”, q - prawdopodobieństwo „porażki”, p+q=1)
,
Rozkład Poissona (nazywany rozkładem rzadkich zdarzeń, jest to szczególny przypadek rozkładu dwumianowego - przyjęto, że wzór Poissona stosuje się gdy n jest duże, a p małe)
dla k=0,1,2,... (
, e=2,7182)
Przykład:
W WSZiB wylosowano 90 studentów i dokonano rejestracji ich nieobecności na zajęciach obowiązkowych w ciągu semestru zimowego. Otrzymano wyniki:
Liczba dni nieobecności |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Liczba studentów |
12 |
20 |
27 |
18 |
7 |
3 |
2 |
1 |
Zakładając, że rozkład liczby dni nieobecności na zajęciach jest rozkładem Poissona, wyznaczyć jego dystrybuantę oraz obliczyć prawdopodobieństwo, że student będzie nieobecny w ciągu semestru mniej niż dwa razy.
Rozwiązanie:
Prawdopodobieństwo tego, że student będzie nieobecny w ciągu semestru mniej niż dwa razy, wynosi:
Rozkłady zmiennej ciągłej:
Rozkład normalny
,
,
gdzie
.
Rozkład normalny charakteryzują dwa parametry: m i
, które są odpowiednio wartością oczekiwaną i odchyleniem standardowym. Dla zmiennej X o rozkładzie normalnym z parametrami m i
stosuje się oznaczenie
. Zapis N(3;0,5) oznacza, że zmienna losowa X ma rozkład normalny o średniej m=3 i odchyleniu standardowym
=0,5.
Rozkłady normalne przy różnych wartościach m i
(rys. na tablicy: a)
i
,
przy ustalonym
;
b)
i
i
,
przy ustalonym m).
Standaryzowany rozkład normalny N(0,1):
,
.
Rysunek na tablicy!!!
Zasada trzech sigm, tzn.
Każdy rozkład normalny o znanych parametrach m i
, czyli
da się zamienić na rozkład normalny o średniej równej 0 i odchyleniu standardowym 1 ( N(0,1)). Stosujemy wówczas procedurę zwaną standaryzacją postaci:
.
Jeżeli zmienna losowa X ma rozkład normalny
, to nowa zmienna losowa ma rozkład N(0,1) ( do wszelkich obliczeń wykorzystuje się tablice statystyczne z wartościami standaryzowanego rozkładu normalnego).
Przykład: Obliczyć prawdopodobieństwo tego, że wzrost przypadkowo wybranego mężczyzny będzie zawarty między 180 a 185cm, skoro wiadomo, że populacja mężczyzn ma rozkład normalny N(172,6).
Rozwiązanie:
Skoro X ma N(172,6), to zmienna
ma N(0,1).
.
(Wartości odczytujemy z Tablicy A).
Oznacza to, że ok. 8 mężczyzn spośród 10000 ma wzrost z interesującego nas przedziału.
Przykład: Przypuśćmy, że dla Kasi i Tomka przeprowadzono badanie poziomu inteligencji za pomocą odpowiedniego testu i uzyskano wynik Kasia 115, Tomek 80.Kasia i Tomek są zainteresowani odpowiedzią na pytanie: czy to dużo, czy mało?
Poziom inteligencji mierzony jako współczynnik inteligencji IQ jest zmienną losową o rozkładzie normalnym. Zmienna ta mierzona jest w skali 0-200, ze średnią równą 100 i odchyleniem standardowym wahającym się w okolicach 13-14, w zależności od wieku badanych. Zakładamy N(100,13).
Zadanie do rozwiązania!!!!!!!!!!!!!
Przykład: Wyobraź sobie, że jesteś właścicielem niewielkiego hotelu w centrum Krakowa. Idealne położenie, liczna, choć wymagająca klientela i dość wysokie ceny. Dbasz o swój hotel i chciałbyś wiedzieć, co twoi goście cenią sobie w nim najwyżej, a co im się nie podoba. W celu poprawy wizerunku hotelu postanawiasz, że dziesięciu procentom gości, którzy najgorzej oceniają Twój hotel, będziesz dawał specjalny prezent, niewielki, ale dość gustowny.
Przeprowadzasz najpierw małe badanko dotyczące opinii klientów, np. ankieta składająca się z 12 pytań w skalach 1-7punktów(najwyższa nota to 84, najniższa 12).Po zebraniu 100 ankiet obliczasz średnią, która wynosi 53 punkty, i odchylenie standardowe wynoszące 12 punktów. Sprawdzasz, czy rozkład jest normalny(załóżmy, że tak: N(53,12) ).
Chcesz wiedzieć na przyszłość komu byłoby dobrze wręczyć prezent po wypełnieniu ankiety, a komu nie dawać, innymi słowy jaki jest najwyższy wynik ankiety przyznawany przez 10% klientów, którzy najgorzej oceniają Twój hotel.
Rozwiązanie:
Rysunek!!!!!!!!!!!
Skoro X ma N(53,12), to zmienna
ma N(0,1).
Wiemy, że P(X<x)=0,1, czyli
. Szukamy z wiedząc, że pole jest równe 0,1, a następnie x. Z tablic standaryzowanego rozkładu (Tablica A) normalnego wyznaczamy z=-1,28,
czyli
.
Reasumując, x=37,64 punktów.
Każdy klient, który daje nie więcej niż 37-38 punktów powinien otrzymać prezent.
Rozkład t-Studenta, F-Snedecora,
- rozkłady występujące w tablicach statystycznych, które przy odpowiednio dużej próbie (często uznaj się za dużą próbę liczebność n>30) są zbliżone do rozkładu normalnego.
Zadania do rozwiązania:
Zadanie 1.Student socjologii zdaje egzamin ze statystyki. Z listy 20 zadań losuje 4 zadania. Jeżeli rozwiąże mniej niż 2 zadania, to otrzymuje ocenę niedostateczną. Gdy rozwiąże 2 zadania, to otrzymuje ocenę dostateczną (3.0). Gdy 3 zadania, to dobrą (4.0), a gdy 4 zadania, to bardzo dobrą (5.0).Jakie jest prawdopodobieństwo uzyskania przez studenta oceny dobrej (4.0), jeżeli potrafi rozwiązać tylko 12 zadań spośród 20?
Zadanie 2. Dany jest rozkład prawdopodobieństwa zmiennej losowej skokowej X:
|
10 |
20 |
30 |
40 |
50 |
|
0,1 |
0,2 |
0,3 |
0,3 |
? |
Obliczyć wartość oczekiwaną zmiennej losowej X oraz wariancję.
Zadanie 3. Gra dwuosobowa polega na rzucie dwiema kostkami sześciennymi. Jeżeli wyrzucisz wartości skrajne na kostkach, to zgarniasz pulę o wartości równej sumie wyrzuconych oczek pomnożonej przez 10 zł. W przeciwnym wypadku drugi gracz otrzymuje od ciebie 20 zł. Czy warto uczestniczyć w takiej grze? Odpowiedź uzasadnij.
Zadanie 4. Indeks mierzący umiejętność szybkiego czytania ze zrozumieniem jest zmienną losową o rozkładzie normalnym o średniej 8,9 i odchyleniu standardowym
.
Jaka proporcja osób może uzyskać wynik lepszy niż 14?
Jaka będzie proporcja osób, które uzyskają wynik pomiędzy 8,9 a 14?
Jaka będzie proporcja osób, które uzyskają wynik gorszy niż 14?
Jaka proporcja osób uzyska wynik gorszy niż 8,5?
Jaka proporcja osób uzyska wynik pomiędzy 8,5 a 14?
Czy proporcjonalnie więcej osób uzyska wynik gorszy niż 8,5, czy wynik lepszy niż 14?
Jakie jest prawdopodobieństwo wylosowania osoby, której wynik będzie lepszy niż 12,5?
Jakie jest prawdopodobieństwo wylosowania osoby, która uzyska wynik pomiędzy 6 a 12,5?
Zadanie 5. Zmienna losowa X ma rozkład normalny N(45,7). Wyznaczyć x dla którego spełniony jest warunek:
P(X>x)=0,1,
P(X<x)=0,7.