witego zróżnicowania, czyli niejednorodności. Ta druga własność „najmniejszych kwadratów” ma znacznie większe znaczenie teoretyczne niż pierwsza i będziemy się na nią jeszcze nieraz powoływali.
5.2. MEDIANA
Przypuśćmy, że pomiary zostały uszeregowane od największego do najmniejszego i chcemy znaleźć pomiar środkowy. Albo też mając grupę studentów uszeregowanych według wyników w nauce chcemy znaleźć takiego studenta, aby dokładnie 10% lub dokładnie 32% grupy miało wyniki gorsze niż on. Mierniki tego typu bywają nazywane miarami pozycyjnymi, gdyż podają one pozycję pewnego typowego (lub nietypowego) przypadku w stosunku do innych przypadków. Najważniejszym miernikiem pozycyjnym jest mediana. Określamy medianę jako liczbę, dla której dokładnie połowa otrzymanych pomiarów jest od niej mniejsza lub jej równa, druga zaś połowa jest od niej większa lub jej równa. Mediana dzieli więc zbiór pomiarów na dwie połowy. Gdy liczba pomiarów jest nieparzysta, medianą jest po prostu środkowy pomiar. Ale kiedy N jest parzyste, środkowy pomiar nie istnieje i każda liczba między dwoma środkowymi pomiarami dzieli zbiór pomiarów na dwie równe grupy. Gdy N jest parzyste, mediana jest więc zdefiniowana niejednoznacznie. Przyjmuje się, że w takich przypadkach medianą jest średnia arytmetyczna dwóch środkowych pomiarów. Dla liczb 72, 81, 86, 69 i 57 medianą jest więc 72 (średnia wynosiła 73 — patrz wyżej). Gdy dodamy do tego zbioru szósty pomiar, np. 55, to dwa środkowe pomiary 69 i 72 dają średnią arytmetyczną (69+72)/2 = 70,5. Jeśli dwa środkowe pomiary mają równe wartości, to mediana jest oczywiście także równa tej wartości. Zauważmy, że gdy N jest nieparzyste, środkowy pomiar jest N+l/2 z kolei. Gdy N jest parzyste, dwa środkowe pomiary mają kolejne numery N/2 i N/2+1. Przykładowo: gdy IV = 251, medianą jest 126-ty przypadek; gdy N = 106, środkowymi pomiarami są 53-ci i 54-ty, a medianą średnia arytmetyczna ich wartości. Zasady te bywają pomocne gdy N jest duże.
Widzieliśmy, że średnia ma następujące dwie własności:
E (Xr- X) - 0
1=1
N
£ (X,—X)* = minimum
Pierwsza polega na tym, że odejmując średnią od każdego pomiaru otrzymujemy szereg liczb dodatnich i ujemnych, które nawzajem dokładnie się znoszą. Co się jednak stanie, jeśli wszystkie te różnice uznamy za dodatnie? Można wykazać, że jeśli odejmiemy medianę od każdego pomiaru i dodamy wszystkie te różnice przypisując każdej znak dodatni, to otrzymamy liczbę mniejszą od sumy wartości bezwzględnych różnic między pomiarami a jakąkolwiek inną liczbą. Symbolicznie:
N
£ | X,—Md | = minimum
gdzie Md oznacza medianę, a pionowy nawias oznacza, że każdej różnicy przypisujemy znak dodatni (czyli bierzemy tylko wartość bezwzględną). Ta własność mediany jest dość ciekawa, nie znajduje jednak bezpośrednich zastosowań istotnych dla socjologa.
5.3. OBLICZANIE ŚREDNIEJ I MEDIANY 1 Z DANYCH POGRUPOWANYCH
Obliczanie średniej. Dla dużej liczby pomiarów obliczanie średniej lub mediany w sposób zobrazowany powyżej na przykładach może stać się bardzo uciążliwe. Szczególnie kłopotliwe może stać się szeregowanie kilkuset pomiarów w celu obliczenia mediany, gdyż kalkulator nie stanowi w tym przypadku żadnej pomocy. Można jednak zastosować pewne procedury upraszczające problem. Gdy liczba przypadków jest doża, zwykle bardzo ułatwia pracę pogrupowanie ich w kategorie i obliczenie średniej lub mediany w oparciu o rozkład liczebności. Czasem zaś otrzymujemy już dane w tej postaci i powrót do pierwotnych danych jest już niemożliwy lub niecelowy. Tak na przykład podaje się zwykle dane spisowe: wiemy z nich tylko, że istnieje pewna liczba ludzi w wieku od 0 do 4 lub od 5 do 9 lat, nie znamy jednak dokładnego wieku każdej z tych osób.
Przekonamy się, że pogrupowanie danych może bardzo uprościć pracę. Wiąże się to jednak z nieuniknioną stratą informacji. Po dokonaniu grupowania danych wiemy już bowiem tylko, że 17 osób zarabia od 2000
63