Wykład nr 13. Zmienne losowe i ich rozkłady
Zmienne losowa - odpowiednik cechy statystycznej (iloraz inteligencji IQ, wzrost, waga, poziom wykształcenia, płeć)
Zmienna losowa - wielkość, której konkretna wartość będzie znana dopiero po realizacji doświadczenia, a przed przeprowadzeniem eksperymentu wartość te można co najwyżej przewidzieć z pewnym prawdopodobieństwem.
Podział zmiennych losowych
zmienne losowe skokowe (dyskretne), o przeliczalnym lub skończonym zbiorze wartości - np.płeć, barwa, typ umysłu, typ temperamentu - zmienne mierzone na skalach jakościowych i porządkowych
zmienne ciągłe - mierzone na skalach ilorazowych i interwałowych (waga, wzrost, temperatura, średnie wyniki z podskali testu psychologicznego)
Zmienne losowe skokowe
Rozkład zmiennej losowej skokowej
Rozkład zmiennej losowej skokowej to suma ( w sensie mnogościowym, w sensie algebry zbiorów) wszystkich wartości, jakie zmienna może przyjąć wraz z odpowiadającymi im prawdopodobieństwami pi, co zapisujemy,
.
Parametry rozkładu zmiennej losowej skokowej:
a) wartość oczekiwana - odpowiednik średniej
Wartość oczekiwana |
|
E(X) - wartość oczekiwana,
xi - kokretna realizacja zmiennej losowej, np.,. wzrost wylosowanej osoby równy 165 cm
pi - prawdopodobieństwo wystąpienia wartości xi
wariancja V(X) i odchylenie standardowe δ
Wariancja |
|
Odchylenie standardowe |
|
Dystrybuanta zmiennej losowej skokowej
Dystrybuanta |
|
Dystrybuanta zmiennej losowej skokowej jest funkcją przyporządkowującą przedziałom wartości zmiennej skumulowane prawdopodobieństwa.
Prawdopodobieństwo
Prawdopodobieństwo to pojęcie określające nasze oczekiwania co do rezultatu danego zdarzenia, którego wynik zależy wyłącznie od przypadku. Jeśli jakieś mające nastąpić zdarzenie (np. rzut kostką), może przyjąć kilka rezultatów (liczba oczek), to jeden z rezultatów (liczba oczek większa od 1) możemy opisać jako bardziej prawdopodobny od drugiego (liczba oczek równa 1), jeżeli na podstawie jakiejś przesłanki (np. poprzednich doświadczeń), nasze oczekiwania co do wystąpienia rezultatu A są większe niż co do wystąpienia rezultatu B.
Definicja prawdopodobieństwa w oparciu o subiektywne odczucia jest oczywiście zupełnie nieprzydatna dla celów praktycznych. Brak sformalizowanej definicji musieli szczególnie dotkliwie odczuwać pierwsi "praktycy" teorii prawdopodobieństwa, czyli nałogowi hazardziści.
Prawdopodobieństwo a częstość
Przypuśćmy, że ktoś zaproponował nam grę losową: "orzeł wygrywamy, reszka przegrywamy". Na pewno zanim zagramy, będziemy chcieli zbadać jakie są szanse wygranej, przeprowadzamy więc doświadczenie, polegające na wielokrotnym rzucie monetą. Rzucamy 100 razy, orzeł wypadł 48 razy, a więc w 48/100 = 0,48 wszystkich przypadków. Kontynuujemy doświadczenie, po 1000 rzutów orzeł wypadł 508 razy, czyli w 508/1000 = 0,508 wszystkich przypadków. Zaobserwowaliśmy, że badany przez nas iloraz jest ciągle bliski wartości 0,5. Znaleziona przez nas wielkość to częstość wypadania orła. Teraz mamy już pewne wyobrażenie o zaproponowanej grze.
Co jednak stałoby się, jeśli nie mielibyśmy możliwości przeprowadzenia doświadczenia? Chcielibyśmy mieć możliwość obliczenia prawdopodobieństwa wyrzucenia orła przed pierwszym rzutem. Możemy zauważyć, że są tylko dwa rezultaty: orzeł i reszka. Ponieważ obydwa rezultaty są jednakowo możliwe, dlatego orzeł powinien pojawić się w 1/2 = 0,5 możliwych przypadków. Obliczyliśmy prawdopodobieństwo zdarzenia bez konieczności przeprowadzania doświadczenia.
Definicja klasyczna (Laplace'a)
Sposób liczenia prawdopodobieństwa z poprzedniego przykładu podał po raz pierwszy Pierre Simon de Laplace w roku 1812. Definicję tę nazywamy klasyczną:
Prawdopodobieństwem zajścia zdarzenia A nazywamy iloraz liczby zdarzeń sprzyjających zdarzeniu A do liczby wszystkich możliwych przypadków, zakładając, że wszystkie przypadki wzajemnie się wykluczają i są jednakowo możliwe.
Definicję tę można zapisać również w bardziej formalny sposób:
Oznaczmy zbiór wszystkich możliwych przypadków przez Ω. Elementami zbioru Ω są zdarzenia elementarne ω, zaś zbiór Ω to zbiór zdarzeń elementarnych. Zbiór zdarzeń sprzyjających A będzie w takim wypadku podzbiorem zbioru Ω: A ⊂ Ω.
Prawdopodobieństwo zajścia zdarzenia A możemy zapisać w postaci:
gdzie |A| oznacza liczbę elementów (moc) zbioru A, zaś |Ω| liczbę elementów (moc) zbioru Ω.
Przykład: Rzucamy sześcienną kostką. Jakie jest prawdopodobieństwo, że liczba oczek będzie większa od 5?
Odpowiedź: Zbiór zdarzeń elementarnych Ω = {1, 2, 3, 4, 5, 6}, zatem liczba możliwych zdarzeń |Ω| = 6. Zbiór zdarzeń sprzyjających A = {6}, liczba zdarzeń sprzyjających |A| = 1. Prawdopodobieństwo zajścia zdarzenia wynosi:
Prawdopodobieństwo geometryczne
Definicja klasyczna nie pozwala obliczać prawdopodobieństwa w przypadku, gdy zbiory A i Ω są nieskończone,jeśli jednak zbiory te mają interpretację geometryczną, zamiast liczebności zbiorów można użyć miary geometrycznej (długość, pole powierzchni, objętość).
Przykład: z przedziału [0,4] wybieramy losowo punkt. Jakie jest prawdopodobieństwo, że wybrany punkt będzie należał do przedziału [1,2]?
Odpowiedź: Długości przedziałów wynoszą odpowiednio: |[0,4]| = 4 i |[1,2]| = 1. Zatem prawdopodobieństwo opisanego zdarzenia wynosi:
Prawdopodobieństwo to funkcja P(X), która przyporządkowuje każdemu elementowi zbioru zdarzeń losowych pewną nieujemną wartość rzeczywistą i ma następujące własności:
prawdopodobieństwo sumy przeliczalnego zbioru zdarzeń parami rozłącznych jest równe sumie prawdopodobieństw tych zdarzeń:
P(A1 ∪ ... ∪ An ∪ ... ) = P(A1) + ... + P(An) + ...
Wartość P(X) nazywa się prawdopodobieństwem zdarzenia X.
Ważniejsze własności prawdopodobieństwa:
P(A) ≥ 0
P(Ø) = 0 (UWAGA: odwrotna implikacja nie jest prawdziwa - P(A)=0 nie implikuje A=Ø)
A⊂B ⇒ P(A) ≤ P(B)
P(A) ≤ 1
A ⊂ B ⇒ P(B|A) = 1
P(A ∪ B) = P(A) + P(B) - P(A ∩ B).
RACHUNEK PRAWDOPODOBIEŃSTWA
1.1. Charakterystyki zmiennych losowych skokowych (dyskretnych) jednowymiarowych: |
||||
Wartość oczekiwana |
Wariancja |
Współczynnik skośności |
Dystrybuanta |
Moment zwykły rzędu k |
|
|
|
|
|
1.2. Charakterystyki zmiennych losowych ciągłych jednowymiarowych: |
Zmienne skokowe c.d. |
|||
Wartość oczekiwana |
Rozkłady mieszane |
Wariancja |
Dystrybuanta |
Moment centralny rzędu k |
|
|
|
|
|