zmiennej X standaryzowana zmienna losowa U przyjmuje wartości z przedziałów, odpowiednio. (-1, 1). (-2. 2), (-3, 3)1, a zatem
/>(-l <U< 1) = <I>(1)-O(-l) = <I>(1)-(1 -0(1)) = 2<I>(1)- 1 = 0,6826;
P (-2 < U < 2) = 20(2) - 1 = 0,9545 ;
P (-3 < U < 3) = 20(3) - 1 = 0,9973 ;
Ostatni wzór jest podstawa szeroko stosowanej tzw. reguły trzech sigm: jeżeli zmienna losowa ma rozkład normalny, to wartość bezwzględna odchylenia tej zmiennej od wartości oczekiwanej nie powinna przekraczać potrojonego odchylenia standardowego.
Prawdopodobieństwo przekroczenia tej wartości wynosi bowiem jedynie 1 - 0,9973 = = 0,0027 = 0,27% !
Dominujące znaczenie rozkładu normalnego wywołane jest przede wszystkim następującymi czynnikami:
— większość cech populacji biologicznych ma rozkład w przybliżeniu normalny, lub rozkład, który można zmienić na normalny po odpowiednim przekształceniu,
— wiele rozkładów w określonych warunkach zbliża się do rozkładu normalnego, przykładem może być tu chociażby rozkład dwumianowy,
— jeżeli zmienna losowa X jest sumą bardzo dużej liczby wzajemnie niezależnych zmiennych losowych, przy czym wpływ każdej z tych zmiennych na sumę jest znikomy, to rozkład zmiennej X jest w przybliżeniu normalny2; przybliżenie jest tym lepsze, im liczba zmiennych jest większa.
2
Rozkład chi-kwadrat (x )
Niech zmienna losowa X ma rozkład praw-dopodobieństw-a Af (p, a). Wówczas zmienna standaryzowana U = (X - p)/a podlega rozkładowi jV(0, 1). Kwadrat zmiennej standaryzowanej normalnej U nosi nazwę zmiennej losowej %2 (chi-kwadrat) z jednym stopniem swobody; zatem
332
Inaczej mówiąc, są to prawdopodobieństwa tego. żc wartość zmiennej losowej X będzie odbiegała od średniej mniej niż. odpowiednio, odchylenie standardowe, dwa odchylenia standardowe, trzy odchylenia standardowe
Jest to wniosek wynikający ze znanego z rachunku prawdopodobieństwa centralnego twierdzenia granicznego