94 i 95. Zauważmy, że gdyby dane nie zostały pogrupowane, szukalibyśmy pomiaru (lV-j-l)/2, czyli 95. Przyczynę tej niekonsekwencji wyjaśnimy niżej. Istnieje 81 pomiarów mniejszych od 4950 i 132 pomiary mniejsze od 5950, mediana leży więc w przedziale 4950-5950. Warto zaznaczyć ten przedział klamrą, gdyż zdarza się czasem odczytywanie przedziału z medianą w wierszu zawierającym liczbę 81, czyli nieprawidłowego przedziału 3950-4950.
Zajmiemy się teraz przedziałem zawierającym medianę. Ma on 51 pomiarów, dzielimy więc jego długość na 51 części, każda o szerokości 1000/51 = 19,61. Każdy z 51 pomiarów lokujemy następnie w środku odpowiadającego mu podprzedziału. Pomiar 81 znajdzie się w najwyższym podprzedziale przedziału 3950-4950, a pomiar 132 znajdzie się tuż poniżej górnej granicy przedziału zawierającego medianę. Teraz obliczamy, ile podprzedziałów dzieli nas od mediany. Gdyby dane nie były pogrupowane, musielibyśmy znaleźć pozycję (JV+l)/2, czyli 95 pomiaru. Byłby to 14 pomiar w tym przedziale i zgodnie z naszą konwencją leżałby on w środku 14 podprzedziału, czyli w odległości 13,5 podprzedziałów od dolnej granicy przedziału. Zauważmy, że tę samą liczbę 13,5 otrzymujemy odejmując 81 od 94,5, czyli od N/2. Dlatego właśnie posługując się podprzedziałami odliczamy N/2 podprzedziałów, by znaleźć położenie (7V+1)/2 podprzedziału.
81 94,5 132
-4|-H H-W-f-H-H-A-1 i |l |-
4,950 5,950
Wartość mediany otrzymujemy mnożąc liczbę podprzedziałów przez ich szerokość i dodając wynik do dolnej granicy przedziału zawierającego medianę. Cały proces można wyrazić wzorem
Md = /+ -J-2~F i (5.6)
gdzie F—liczebność skumulowana odpowiadająca dolnej granicy przedziału działu zawierającego medianę;
/—liczba pomiarów w tym przedziale / — dolna granica tego przedziału; i — szerokość tego przedziału.
Wielkość /// odpowiada szerokości każdego podprzedziału, zaś N/2—F to odległość (mierzona w podprzedziałach) między dolną granicą przedziału zawierającego medianę a nią samą. Otrzymujemy więc:
1000
51
94 5 — 81
Md = 4950+ ’ 1000 = 4950+13,5 -
= 4950+265 = 5215 dolarów.
Można też inaczej interpretować ten sposób obliczania. Zamiast znajdować szerokość podprzedziału i mnożyć ją przez liczbę podprzedziałów rozumujemy następująco: w całym przedziale jest 51 pomiarów, a mediana leży w odległości 13,5 podprzedziałów od dolnej granicy przedziału, musimy więc odłożyć 13,5/51 przedziału od jego dolnej granicy. Mnożąc szerokość przedziału (1000) przez ten ułamek, otrzymujemy żądany wynik. Kiedy stosujemy wzór, nie jest oczywiście ważne, jak go interpretujemy. Aby się jednak zbytnio nie uzależniać od wzorów, wskazane jest przechodzenie całego procesu myślowego przy każdorazowym obliczaniu mediany, aż do pełnego zrozumienia wzoru. Do sprawdzenia obliczeń można wykorzystać fakt, że medianę otrzymamy także odejmując odpowiednią wielkość od górnej granicy przedziału, zawierającego ją. Łatwo pokazać, że słuszny jest wzór
(5.7)
... F-Nl2 .
Md = u--1
gdzie F—liczebność skumulowana odpowiadająca górnej granicy przedziału zawierającego medianę.
Mamy więc
i ^2—94 5
Md = 5950- i 1000 = 5215 dolarów
5.4. PORÓWNANIE ŚREDNIEJ I MEDIANY
Przedyskutowaliśmy już sposoby obliczania średniej i mediany na podstawie danych pogrupowanych i niepogrupowanych, teraz zaś można już porównać je ze sobą. Od razu uwidaczniają się pewne różnice między tymi miernikami. Po pierwsze, średnia „zuźytkowuje” więcej informacji niż mediana w tym sensie, że obliczając średnią korzystamy z wszystkich pomiarów, mediana zaś jest sama tylko pewnym pojedynczym pomiarem. Powracając do przykładu 5 pomiarów: 72, 81, 86, 69 i 57 widzimy, że gdyby największy z nich wynosił 126, nie 86, na medianę nie wpłynęłoby to wcale, na średnią natomiast znacznie. Podobnie, gdyby najmniejszy pomiar wy-
71