ny będzie zależał ponadto od tego, czy liczba obserwacji jest liczbą parzystą czy nieparzystą. Jeżeli:
a) liczba obserwacji ,<V jest liczbą nieparzystą- mediana jest równa wartości cechy, którą posiada jednostka o numerze-:
Me = x
N_t1 2
(4.13)
b) liczba obserwacji .V jest liczbą parzystą-mediana jest średnią arytmetyczną
. . . ... . J J . N . N
wartości zmiennej, które posiadająjednostki o numerach — 1 — +1.
XN + XN
(4.14)
Me = -±
Przykład 4.14.
Zapytano o wiek 2 grupy osób i otrzymano następujące odpowiedzi:
• dla grupy pierwszej: 25,32,18.22,37 lat,
• dla grupy drugiej: 43,24,26,29,32.41 lat.
Na podstawie powyższych danych wyznacz medianę wieku w tych dwóch grupach osób.
Rozwiązanie
W grupie pierwszej o wiek zapytano 5 osób, czyli N = 5.
W pierwszej kolejności należy uporządkować dane rosnąco:
18
22
x2
25
X3
32
x<
37
X5
Mamy tutaj zatem do czynienia z szeregiem szczegółowym o nieparzystej liczbie obserwacji, wobec czego korzystamy ze wzoru 4.13.
^ ~ XN+1 — *5+1 ~ X6 ~ Xi 2 2 2
Widzimy, że x3 = 25, wobec czego Me w tym szeregu wynosi 25 lat.
W przypadku szeregu szczegółowego o nieparzystej liczbie obserwacji wartość mediany można odczytać, wskazując wartość, która znajduje się dokładnie w środku. W naszym przykładzie jest to wartość 25 lat, bowiem przed nią znajdują się dwie obserwacje tj. 18 i 22 oraz za nią znajdują się dwie obserwacje tj. 32 i 37.
W drugiej grupie o wiek zapytano 6 osób, czyli N = 6.
Uporządkowany szereg jest następujący:
24 |
26 |
Xl |
x2 |
29_32
x3 x4
41 |
43 |
*5 |
*6 |
Mamy tutaj do czynienia z szeregiem szczegółowym o parzystej liczbie informacji, wobec czego korzystamy ze wzoru 4.14.
x
Me = —
X
_ 2
2 _
xx + x4 _ 29 + 32
= 30,5 lat.
W przypadku szeregu szczegółowego o parzystej liczbie obserwacji wartość mediany można obliczyć jako średnią arytmetyczną dwóch środkowych obserwacji. W naszym przykładzie tj. 29 i 32. Średnia arytmetyczna z tych dwóch wartości wynosi (29+32)/2=30,5 lat.
Z przeprowadzonej analizy wynika, że wartość środkowa (mediana) wieku dla pracowników pierwszej grupy osób wynosi 25 lat, a drugiej grupy 30,5 lat (jest wyższa o 5,5 lat).
Nieco inaczej przebiega wyznaczanie mediany w sytuacji, gdy informacje o wartości cechy przedstawione są w postaci szeregu rozdzielczego punktowego. Medianę wyznacza się tutaj na podstawie częstości (liczebności) skumulowanych, które omówiliśmy w rozdziale trzecim. Mediana jest tą wartością cechy, której częstość skumulowana obejmuje jednostkę o numerze -y lub ~~~ •
Zasady postępowania przy wyznaczaniu mediany dla danych przedstawionych w postaci szeregu rozdzielczego punktowego są następujące:
1) wyznaczamy częstości skumulowane,
2) obliczamy numer mediany korzystając ze wzoru:
gdy N jest parzyste, gdy N jest nieparzyste,
(4.15)
3) wyznaczamy klasę, w której znajduje się mediana, tzn. odszukujemy wartość numeru mediany NrMc wśród częstości skumulowanych niik,
4) odczytujemy wartość mediany.
Przykład 4.15.
Wyniki klasówki ze statystyki w klasie lla były następujące: 1 ocena niedostateczna, 3 oceny mierne, 10 ocen dostatecznych, 4 oceny dostateczny plus, 3 oceny dobre, 1 ocena dobry plus, 2 piątki i jedna szóstka. Ile wynosi mediana wyników z tej klasówki?
Przystępując do rozwiązania tego przykładu wygodnie będzie dane przedstawić w postaci szeregu rozdzielczego punktowego:
109