140
siwa. Przykład: opis rodzin zamieszkujących jedne budynek według cj? ności: ,ct'
I Liczba dzieci w rcnlzinie |
Liczba rodzin |
Proporcje rodzin |
Dyst|buanta |
0 |
4 |
0.20 |
(L20 |
1 |
6 |
0.30 |
0.50~~' |
2 |
5 |
0.25 |
0.75 |
3 |
2 |
0.10 |
0.85 |
4 |
2 |
0,10 |
0,95 |
5 |
1 |
0.05 |
1,00 |
20 |
1,00 |
Przypuśćmy, że chcemy wylosować z listy lokatorów tego bloku jedną rodzinę. Jaka jest szansa, że trafimy akurat na rodzinę mającą dwoje dzieci? Jak tę szansę obliczyć? Należy liczbę rodzin mających właśnie po dwoje dzieci podzielić przez liczbę wszystkich rodzin z tego bloku (5:20 = -0.25). Zamiast terminu „szansa*’ w użyciu jest termin „prawdopodobień-siwo”. A więc prawdopodobieństwo trafienia na rodzinę z dwojgiem dzieci przy losowaniu jednej rodziny z całej klasy wynosi tu 0.25. Prawdopodobieństwo zaś wylosowania rodziny z czworgiem dzieci wynosiłoby 2-20 -0,10. Zauważmy, że liczbowy wskaźnik prawdopodobieństwa odpowiada liczbowemu wskaźnikowi proporcji. Kolejne pytanie: ile wynosi prawdopodobieństwo, że losując z bloku jedną rodzinę trafimy na rodzinę mającą najwyżej dwoje dzieci? Jeśli wylosujemy obojętnie: rodzinę bezdzietną, z jednym dzieckiem lub z dwojgiem dzieci, to uzyskamy to. o co szło: najwyżej dwoje dzieci”. Rodziny bezdzietne są cztery, z jednym dzieckiem 6, z dwojgiem pięć. Prawdopodobieństwo zatem wylosowania rodziny mającej najwyżej dwoje dzieci to (4 + 6 + 5): 20 = 0,75. Liczbę tę znajdujemy przypisaną rodzinom z dwojgiem dzieci w ostatniej rubryce tabelki. W naszym przykładzie zmienna (związana ze skalą interwałową) to liczba dzieci w rodzinie. Ma ona tu sześć możliwych warto* ści: 0. 1, 2. 3, 4, 5. Dystrybuanta danej wartości zmiennej to prawdopodobieństwo zrealizowania się jej właśnie lub którejkolwiek wartości
niższej- Zatem dystrybuanta wartości: „dwoje dzieci” to prawdopodobieństwo zrealizowania sic którejkolwiek z wartości: „brak dzieci”, „jedno jziecko". ..dwoje dzieci”. Dystrybuanta najwyższej (końcowej) wartości równa jest 1 (100%). Byłaby to odpowiedź na pytanie o prawdopodobieństwo wylosowania z tego bloku rodziny mającej najwyżej pięcioro
dzieci-
Zmienna z naszego przykładu to zmienna losowa. Losową nazywani)’ laką zmienną, której wartościom przypisane są prawdopodobieństwa realizacji. Wielkość całej masy prawdopodobieństwa określamy licz-bą 1. Owa masa rozdzielona zostaje pomiędzy poszczególne wartości zmiennej. Sposób podzielenia prawdopodobieństwa (jak wielkie jego porcje przypisane zostały poszczególnym wartościom zmiennej) nazywamy rozkładem prawdopodobieństwa. Przykład z rodzinami był to przekład rozkładu empirycznego. Tak mianowicie ułożyła się sytuacja w tym konkretnym bloku mieszkalnym. Statystyka wnioskowań operuje rozkładami teoretycznymi. Wymieńmy kilka z nich: rozkład normalny, Poissona, Studenta, Fishera, rozkład Chi2, rozkład F... każdy taki rozkład opisany jest swoistą funkcją przypisującą wartościom zmiennej porcje prawdopodobieństwa.
Obliczanie za każdym razem na własną rękę wartości tych funkcji, tj. podstawianie konkretnych wartości zmiennej i wyliczenie w ielkości przypisywanego im przez rozkład prawdopodobieństwa, byłoby nader uciążliwe. Dlatego już dawno opracow ano tablice rozkładów, w których po prostu odnajdujemy gotowe wyniki: wielkości prawdopodobieństw przypisywanych konkretnym wartościom zmiennej. Wyłania się tu jednak kłopot, bowiem wielkość przypisywanego prawdopodobieństwa zależy nie tylko od wartości zmiennej, lecz i od innych parametrów. Np. wielkości prawdopodobieństwa przypisywane wartościom zmiennej przez rozkład normalny zależą nie tylko od samej tej wartości, lecz także od wartości średniej oraz od wielkości rozproszenia mierzonego odchyleniem standardowym.
Rozkład normalny zmiennej, której wartość średnia równa się zero. zaś odchylenie standardowe równa się jeden, nazywamy rozkładem normalnym standaryzowanym. Stablicowano właśnie tylko rozkład standaryzowany: średnia równa 0. odchylenie równe jeden. Aby więc posłużyć się rozkładem normalnym, należy dane ze „swojego” rozkładu empirycznego dopasować do postaci standaryzowanej, poddać standa-