wprawy można już nie wypisywać w tabeli obliczeń kolumny „punkty środkowe przedziałów”.
Zauważyliśmy z pewnością, że wszystkie odchylenia od średniej odgadniętej są w tym przykładzie wielokrotnością 1000, czyli szerokości przedziału klasowego. Tak jest zawsze, jeśli tylko przedziały mają równe szerokości. Możemy więc z każdego iloczynu ftdl wyłączyć ten czynnik poza nawias. Innymi słowy sumę —63000 otrzymujemy w ten sposób:
-63000 = 1000 (-51 -52 -38 +0 +36 +42)
Wyraziliśmy więc odchylenia od średniej odgadniętej przez liczbę przedziałów. Następnie obliczamy odległość między średnią rzeczywistą a odgadniętą, mierząc ją w przedziałach, potem zaś wracamy do pierwotnych jednostek pomiaru mnożąc tę odległość przez szerokość przedziału. Ozna-my odległość mierzoną liczbą przedziałów przez d[. Otrzymujemy tabelę 5.3.
Tabela 5.3. Obliczanie średniej z danych pogrupowanych: metoda skrócenia z obliczaniem liczby przedziałów
Faktyczne granice przedziałów |
Punkty środkowe przedziałów |
fi |
d'i |
jtd't |
1950-2950 |
2450 |
17 |
-3 |
-51 |
2950-3950 |
3450 |
26 |
-2 |
-52 |
3950-4950 |
4450 |
38 |
-1 |
-38 |
4950-5950 |
5450 |
51 |
0 |
0 |
5950-6950 |
6450 |
36 |
1 |
36 |
6950-7950 |
7450 |
21 |
2 |
42 |
Razem |
189 |
-63 |
Zmodyfikowany wzór (5.2) przyjmie teraz postać:
X=X'+-!=}-Ń—i (5.5)
gdzie i jest szerokością przedziału klasowego. Tak więc X= 5450 + 1000 = 5117
1 07
Gdy przedziały klasowe są nierównej szerokości, tę ostatnią postać metody skróconej należy zmodyfikować. Niektórzy czytelnicy będą woleli w tej sytuacji powrócić do pierwszej wersji metody skróconej i posługiwać się dt, a nie d[. Jeśli jednak tylko jeden lub dwa przedziały różnią się od reszty, można przyjąć za i szerokość przedziałów. Odchylenie środków pozostałych przedziałów od średniej odgadniętej będzie się wtedy wyrażało liczbą ułamkową. Przypuśćmy, że ostatni przedział określony jest nie „6950-7950”, lecz „6950-8950”, czyli środek przedziału znajduje się w punkcie 7950, a nie 7450. Jego odległość od średniej odgadniętej wyniesie więc 2500, czyli 2,5 w jednostkach szerokości przedziału. Gdyby przedział ten sięgał do 9950, wartość d\ wynosiłaby 3,0, co można łatwo sprawdzić.
Obliczanie mediany. Obliczając medianę zakładamy, że wszystkie pomiary znajdujące się w danym przedziale są w nim równo rozłożone. Najpierw znajdujemy przedział zawierający środkowy pomiar, a następnie znajdujemy dokładne położenie mediany przy pomocy interpolacji. Przy znajdowaniu przedziału zawierającego pomiar środkowy wygodnie jest posługiwać się kumulatywnym rozkładem liczebności. Dla danych, które tu analizujemy, znajdziemy go w tabeli 5.4. Chociaż nie jest to konieczne, warto przyzwyczaić się do konstruowania całego rozkładu kumulacyjnego i do oznaczania w oddzielnej kolumnie (w tabeli 5.4 jest to kolumna ostatnia) sensu poszczególnych liczebności zawartych w kolumnie „F”. Sprawdzeniem obliczeń jest wyliczenie, że wartości wszystkich 189 pomiarów są mniejsze od 7950.
Następnie znajdujemy przedział zawierający środkowy, czyli N/2 pomiar. Tutaj 189/2 — 94,5, szukamy więc przedziału zawierającego pomiary
Tabela S.4. Obliczanie mediany z danych pogrupowanych
Dokładne granice |
/ |
F |
Liczba przypadków mniejszych od | |
1950-2950 |
17 |
17 |
2950 | |
2950-3950 |
26 |
43 |
3950 | |
3950-4950 |
38 |
811 |
(4950 | |
• 4950-5950 |
51 |
132/ |
\5950 | |
5950-6950 |
36 |
168 |
6950 | |
6950-7950 |
21 |
189 |
7950 | |
Razem |
189 |
69