ROZKŁAD NORMALNY
Rozkład normalny opisuje nie tylko rozkład średnich proporcji X =k / N przy dużych wielkościach próby, jest zatem nie tylko przybliżeniem rozkładu dwumianowego dla dużych wartości N. Ma on znacznie szersze zastosowanie , ponieważ bardzo wiele pomiarów w biologii ma rozkład zbliżony do normalnego.
Rozkład normalny ma pewne charakterystyczne właściwości. Powierzchnia pod krzywą równa się jedności. Jest to rozkład symetryczny o najwyższej wartości Y dla pomiaru X równemu średniej ą. Oba skrzydła rozkładu ciągną się w nieskończoność, czyli dla X-ów nawet bardzo odległych od średniej ji, Y jest dodatnie aczkolwiek bardzo małe.
W rozkładzie normalnym około 2/3 powierzchni pod krzywą rozkładu (dokładnie 68,26%) mieści się w granicach jednego odchylenia standardowego od średniej, czyli w granicach p. ±ct. W granicach dwóch odchyleń standardowych od średniej, czyli p. ± 2ct mieści się 95,46% pomiarów. Wynika z tego. że wykres rozkładu jest wąski i wysoki przy małych wartościach odchyleń standardowych, a spłaszczony przy ich dużych wartościach. Dwa parametry tego rozkładu - średnia p i odchylenie standardowe determinuję rozkład w ten sposób, że średnia określa położenie szczytu na osi X odchylenie standardowe zaś spłaszczenie całego rozkładu.
Odchylenie standardowe dlatego jest tak ważną miarą rozproszenia pomiarów wokół średniej, żc przy zgodności rozkładu pomiarów z rozkładem normalnym pozwala nam na określenie, jaka proporcja pomiarów zmieści się w założonym przedziale lub też. w jakim przedziale wokół średniej zmieści się założona proporcja.
Do praktycznego stosowania rozkładu normalnego potrzebna jest znajomość powierzchni pod krzywą rozkładu. Powierzchnia ta. czyli całka rozkładu normalnego, podana jest w tablicach dla rozkładu o średniej p =0 i odchyleniu standardowym =Ia. Jest to tak zwany rozkład normalny standaryzowany. Aby zastosować ten rozkład do jakichkolwiek danych, trzeba przeprowadzić ich kodowanie zwane standaryzacją.
Standaryzacja pomiarów ma znaczenie nie tylko przy stosowaniu rozkładu normalnego, ale może być także przydatna biologowi z innych powodów. Wyobraźmy sobie, że długość skoku X pewnewgo konkretnego samca sikory bogatki X=19.7 mm. O pomiarze tym niewiele możemy powiedzieć, jeśli nie wiemy jak kształtuje się średnia długość skoku i jego zmienność u innych osobników. Jeśli natomiast znamy średnią dla wielu osobników wynoszącą X = 20,08 i odchylenie standardowe wynoszące s=0,46 , wówczas możemy obliczyć pomiar standaryzowany Z według wzoru :
Z = (X - X)/ s
Po podstawieniu danych otrzymujemy Z= (19,7 - 20,08)/ 0,46 = - 0,82. Oznacza to, że nasz pomiar znajduje się poniżej średniej, ponieważ Z jest mniejsze od zera. ale odbiega od średniej o mniej niż o jedno odchylenie standardowe. Dokładnie nasz pomiar odbiega o -0,82 odchylenia standardowego od średniej. Ponieważ długość skoku jest dobrym wskaźnikiem wielkości samca, możemy powiedzieć, że ten konkretny samiec jest nieco mniejszy od innych w badanej próbie. Gdyby pomiar standaryzowany tego skoku wyniósł Z= 2.0. oznaczałoby to, że badany samiec jest wyjątkowo duży. ponieważ długość jego skoku przekracza średnią o dwa odchylenia standardowe. Ponieważ rozkład długości skoku sikory jest bliski rozkładowi normalnemu, możemy sądzić, że mniej niż 5% samców ma skok tak bardzo odbiegający od średniej.
Standaryzacja pomiarów pozwala zatem na określenie stosunku pojedynczego pomiaru do średniej i rozproszenia, dając nam dane w granicach od -3 do *3. Pomiarów powyżej Z= -3 i powyżej Z= +3 nie można wykluczyć. . aczkolwiek pojawiają się one bardzo rzadko. Standaryzacja jest tylko kodowaniem, a nie transformacja danych.