Możemy więc powiedzieć, że przeciętna odległość między pomiarem i średnią wynosi 8,4.
Odchylenie średnie daje się bardziej intuicyjnie interpretować, niż odchylenie standardowe, lecz niestety ma poważne braki. Po pierwsze, operowanie wartościami bezwzględnymi jest niewygodne algebraicznie. Co ważniejsze jednak, odchylenie średnie trudniej jest zinterpretować teoretycznie i nie prowadzi ono do tak prostych rezultatów matematycznych. Może być miernikiem wygodnym do celów czysto opisowych, chociaż — jak się przekonamy — przy posługiwaniu się krzywą normalną odchylenie standardowe jest również wygodniejsze. Omawiając statystykę indukcyjną zobaczymy, że niemal wyłącznie stosuje się tam odchylenie standardowe, a to z racji jego wyższości teoretycznej. Dlatego też w literaturze socjologicznej rzadko spotyka się odchylenie średnie. , 6.4. ODCHYLENIE STANDARDOWE
Po omówieniu kilku mniej ważnych i użytecznych mierników dyspersji skoncentrujemy się na najważniejszym z nich i najczęściej stosowanym. Jest nim odchylenie standardowe, czyli pierwiastek kwadratowy ze średniej arytmetycznej kwadratów odchyleń od średniej:
(6.3)
gdzie s — odchylenie standardowe1. Słownie wyrazimy to tak: znajdujemy różnicę między każdym pomiarem a średnią, podnosimy te różnice do kwadratu, dodajemy otrzymane liczby, dzielimy je przez liczbę pomiarów i z tego ilorazu wyciągamy pierwiastek kwadratowy. Jeśli wynik ma być prawidłowy, ważne jest przeprowadzenie operacji algebraicznych w tej właśnie kolejności. W naszym przykładzie liczbowym odchylenie standardowe otrzymujemy następująco:
Xi |
(Xi-X) |
(xt-Xf |
72 |
-1 |
i |
81 |
8 |
64 |
86 |
13 |
169 |
69 |
-4 |
16 |
57 |
-16 |
256 |
X = 73,0 |
0 |
506 |
s = /60% = |/l01,2 = 10,06
Intuicyjne znaczenie liczby 10,06 stanie się jasne dopiero później, gdy pojęcie odchylenia standardowego powiążemy z obliczaniem pól pod krzywą normalną. Obecnie przyjmiemy ją po prostu jako pewną liczbę. Łatwo zauważyć kilka własności odchylenia standardowego. Widzimy, że jest ono tym większe, im większy jest rozrzut pomiarów wokół średniej. Gdyby wszystkie pomiary były sobie równe, odchylenia pomiarów od średniej byłyby równe zeru, a tym samym odchylenie standardowe byłoby równe zeru, Widzimy też, że ekstremalne odchylenia od średniej mają bardzo silny wpływ na wartość odchylenia standardowego. Liczby 169 i 256 dominują nad trzema pozostałymi w tabelce. Podnosząc odchylenia od średniej do kwadratu — pomimo tego nawet, że później wyciągamy pierwiastek — nadajemy odchyleniom ekstremalnym nawet stosunkowo większe znaczenie, niż przy obliczaniu średniej. Oznacza to, że powinniśmy nieco stłumić entuzjazm wobec odchylenia standardowego jako „najlepszej” pojedynczej miary dyspersji. Z pewnością, jeśli dane zawierają kilka przypadków odbiegających od reszty, miernik dyspersji powinien ten fakt uwzględnić. Jeśli jednak tych przypadków jest niewiele, odchylenie standardowe może zrobić się niezwykle wielkie i dać przez to mylące rezultaty. W takich przypadkach lepiej stosować medianę jako miernik tendencji centralnej, a odchylenie ćwiartkowe jako miernik rozrzutu. Dla większości danych empirycznych odchylenie standardowe jest jednak miernikiem zadowalającym.
Można postawić pytanie: po co wyciągać pierwiastek kwadratowy przy obliczaniu miary dyspersji? Prosta, lecz niepełna odpowiedź będzie następująca:bo tak zostało zdefiniowane odchylenie standardowe. Można by też tę operację uzasadnić wyjaśnieniem, że poprzednio różnice zostały podniesione do kwadratu i wyciąganie pierwiastka jest tylko rekompensatą
6* 83
W niektórych podręcznikach definiuje się odchylenie standardowe przez wielkość N-1 w mianowniku, a nie przez N, jak we wzorze (6.3). Z przyczyną tej rozbieżności zapoznamy się w rozdz. 11.