3.1.2 Obliczanie średniej, mediany i modalnej dla danych w postaci szeregów rozdzielczych
W poprzednim rozdziale w tabeli 2.3 pokazano przykład danych ilościowych w formie tzw. szeregu rozdzielczego. Taki zagregowany sposób dostarczania danych stosuje się w przypadku dużej liczby obserwacji. Grupuje się wówczas obserwacje w kilka do kilkunastu klas oraz podaje się jedynie granice przedziałów klasowych i liczby obserwacji w poszczególnych klasach. Dane takie często przedstawia się graficznie w postaci histogramów (por. rys. 3.1).
Rys. 3.1 Histogram rozkładu wieku pacjentów z nowotworem płuc (według tabeli 2.3).
Niejednokrotnie istnieje potrzeba obliczenia wartości średniej, mediany i wartości modalnej dla danych w postaci szeregu rozdzielczego. Stosujemy wówczas wzory przybliżone, które przedstawimy poniżej. Wzory te wykorzystamy dalej do obliczeń mierników tendencji centralnej danych dotyczących wielu pacjentów z nowotworem płuc (por. tabela 2.3). Dane te powtórzono w tabeli 3.1 uzupełniając je dodatkowo o postać szeregu skumulowanego (dla danych przedziału klasowego podaje się sumę liczebności danej klasy i wszystkich poprzednich — jest to pewien odpowiednik dystrybuanty rozkładu).
Wartość średnią dla danych w postaci szeregu rozdzielczego oblicza się według wzoru:
*
i=i
(3.2)
gdzie:
/i/ — liczebność w /-tym przedziale klasowym.
29