ROZKŁAD NORMALNY.
- jest swoistą postacią rozkładu dwumianowego (jednego z rozkładów teoretycznych służących do obliczania prawdopodobieństwa); rozkład dwumianowy zwany także rozkładem Bernuollego, to rozkład określający liczbę sukcesów (p) w trakcie N niezależnych prób.
Na przykład ilość `orłów' w przypadku rzutu trzema monetami:
Możliwe wyniki:
OOO 2) OOR 3) ORO
ORR 5) ROO 6) ROR
7) RRO 8) RRR
Rozkład prawdopodobieństw:
Liczba orłów |
częstość |
prawdopodobieństwo |
3 |
1 |
1/8 |
2 |
3 |
3/8 |
1 |
3 |
3/8 |
0 |
1 |
1/8 |
Natomiast ilość `orłów' w przypadku rzutu 10 monetami:
Liczba orłów |
częstość |
prawdopodobieństwo |
10 |
1 |
1 /1024 |
9 |
10 |
10 /1024 |
8 |
45 |
45 /1024 |
7 |
120 |
120 /1024 |
6 |
210 |
210 /1024 |
5 |
252 |
252 /1024 |
4 |
210 |
210 /1024 |
3 |
120 |
120 /1024 |
2 |
45 |
45 /1024 |
1 |
10 |
10 /1024 |
0 |
1 |
1 /1024 |
Na wykresie można by tę sytuację przedstawić następująco:
Podstawowy wniosek dla nas: pewne wartości w teoretycznym rozkładzie dwumianowym wystapują częsciej (większe prawdopodobieństwo) inne natomiast rzadziej (mniejsze prawdopodobnieństwo).
Wracając do rozkładu nomalnego.
- pisze się, że jest on uogólneniem rozkładu dwumianowego na sytuacje kiedy jest nieskończeie wiele prób
- innymi słowy jest on rozkładem zmiennej losowej ciągłej.
- rozkład wielu zmiennych (jak wiek, inteligencja) przybiera własnie kształt krzywej Gaussa.
- krzywa normalna:
- własności rozkładu normalnego:
krzywa jest symetryczna: średnia, mediana i dominanta zbiegają się w jednym punkcie
krzywa jest asymptotyczna - zbliża się do osi poziomej lecz nigdy do niej nie dochodzi (rozciąga się od minus nieskończoności do plus nieskończoności)
mniej więcej 68% powierzchni pod krzywą mieści się w granicach plus lub minus jednej jednostki odchylenie standardowego
w granicach ± 1,96 z (z to jednostka miary odchylenia standardowego) mieści się 95% powierzchni pod krzywą
w granicach ± 2,58 z mieści się 99% powierzchni pod krzywą
pole pod krzywą ma wartość równą 1 (100%)
z racji tego, że rozkład jest symetryczny na każdą stronę rozkładu przypada po 0,5 (50%) wartości pola pod krzywą
Zgodnie z regułą trzech sigm, znalezienie wartości mniejszej lub większej niż 3 odchylenia standardowe jest bardzo mało prawdopodobne!
- pojawiając się wartość `z' wiąże się z tym, że w statystyce najczęściej posługujemy się zestandaryzowanymi wartościami rozkładu normalnego
Standaryzacja rozkładu zmiennej polega na zamianie empirycznego (zmierzonego) rozkładu zmiennej o pewnej średniej (na przykład 100) i pewnym odchyleniu standardowym (powiedzmy 15), na rozkład, którego średnia wynosi 0, a odchylenie standardowe 1.
Procedura standaryzacji odbywa się `za pomocą' wzoru:
, gdzie: X - wartość zmiennej (zmierzona, emipryczna)
m - średnia
- odchylenie standardowe
Przykład standaryzacji Z:
|
wartości zmiennej |
standaryzacja Z |
|
1 |
-1,482 |
|
2 |
-1,120 |
|
3 |
-0,759 |
|
4 |
-0,398 |
|
5 |
-0,036 |
|
5 |
-0,036 |
|
6 |
0,325 |
|
7 |
0,687 |
|
8 |
1,048 |
|
10 |
1,771 |
średnia |
5,1 |
0,00 |
odch. stand. |
2,77 |
1,00 |
Do czego służy rozkład normalny?
Na przykład, mamy dane: za pomocą testu inteligencji zmierzono iloraz inteligencji, uzyskano następujące wyniki:
średnia = 100
odchylenie standardowe = 15
Chcemy oszacować jaki procent populacji ma iloraz inteligencji równy 120 lub wyższy od tego wyniku.
W tym celu:
interesujący nas iloraz inteligencji (120 punktów) zamieniamy na wynik standardowy
Z = (120-100)/15 = 1,33
zatem iloraz inteligencji 120 mieści się 1,33 jednostek odchylenia standardowego od średniej (czyli 0 w rozkładzie zestandaryzowanym)
w tablicach rozkładu normalnego odnajdujemy zestandaryzowaną wartość 1,33 i odczytujemy jaki obszar znajduje się powyżej 1,33 (ten obszar to będzie procent osób posiadających iloraz inteligencji wyższy niż 120 punktów; 120=1,33)
obok wartości 1,33 znajduje się wartość 0,4082 - jest to obszar poniżej 1,33 do tego obszaru należy dodać wartość 0,5, czyli obszar, który znajduje się po drugiej stronie rozkładu
w efekcie mamy: 0,5 + 0,4082 = 0,9082, ta wartość to w istocie ilość osób, które maja iloraz inteligencji poniżej 120 punktów!
Po `przerobieniu' tej wartości na procenty można powiedzieć, że 90,8% osób ma iloraz inteligencji poniżej 120 punktów!
wiemy, że cały obszar pod krzywą ma wartość równą 1, jeśli chcemy obliczyć interesujący nas odsetek osób mających iloraz inteligencji równy 120 i wyższy musimy:
od 1 odjąć wartość 0,9082, czyli 1 - 0,9082= 0,092
przerabiamy teraz wartość 0,092 na procenty i możemy powiedzieć, że odsetek osób, które mają iloraz inteligencji równy 120 punktów i wyższy wynosi 9,2%
wskazówka do `przerabiania': jeśli chcemy coś wyrazić w procentach, to przecinek `przesuwamy' o dwa miejsca w stosunku do miejsca, w którym na początku się znajdował!
Chcemy oszacować jaki środkową część ilorazów inteligencji, obejmująca 50 % populacji
W tym celu:
znajdujemy obszar, który obejmuje z jednej strony 25% przypadków, pamiętajmy, że rozkład jest symetryczny!
dla +25% jest to wartość +0,67, dla drugiego 25% będzie to wartość -0,67
zatem 50% powierzchni pod krzywą zawiera się w przedziale ± 0,67
mamy zatem wartości Z1 = +0,67 i Z2 = -0,67
mamy średnią m=100
mamy odchylenie standardowe sd=15
musimy znaleźć teraz punkty (X1 i X2) przypadające na wartości Z1 i Z2
w tym celu przekształcamy wzór (jak na matematyce!)
, na podstawie przekształceń mamy:
X=
* Z + m
obliczamy wartości Z1 i Z2
Z1 = 15 * (-0,67) + 100 = -10,05 + 100 = 89,95
Z2 =15 * 0,67 + 100 = 10,05 + 100 = 110.05
środkowy iloraz inteligencji, obejmujący 50% populacji zawiera się w przedziale miedzy około 90 i 110 punktów