Miary zmienności
Wartości średnie nie dają wyczerpującej charakterystyki struktury zbiorowości. Przede wszystkim nie informują o stopniu zmienności (dyspersji) badanej cechy. Dyspersją nazywamy zróżnicowanie jednostek zbiorowości ze względu na wartość badanej cechy. Siłę dyspersji oceniamy za pomocą pozycyjnych i klasycznych miar zmienności. Do miar klasycznych zaliczamy: odchylenie przeciętne, wariancję, odchylenie standardowe oraz współczynnik zmienności (w zależności od techniki obliczania może być również pozycyjną miarą dyspersji)
Odchylenie przeciętne określa, o ile wszystkie jednostki danej zbiorowości różnią się średnio ze względu na wartość zmiennej od średniej arytmetycznej tej zmiennej. Odchylenie przeciętne jest średnią arytmetyczną bezwzględnych wartość (modułów) odchyleń wartości cechy od jej średniej arytmetycznej. Oblicza się je wg wzoru:
dla szeregu wyliczającego:
dla szeregu rozdzielczego punktowego:
dla szeregu rozdzielczego przedziałowego:
Ćwiczenie 5
Oblicz odchylenie przeciętne dla podanego szeregu
Tab. Nauczyciele szkół średnich w miejscowości Z wg stażu pracy
Staż pracy (w latach) |
Liczba
|
Obliczenie pomocnicze |
|||
|
|
|
|
|
|
0-5 5-10 10-15 15-20 20-25 25-30 30-35 |
4 7 10 15 8 4 2 |
2,5 7,5 12,5 17,5 22,5 27,5 32,5 |
10,0 52,5 125,0 262,5 180,0 110,0 65,0 |
13,6 8,6 3,6 1,4 6,4 11,4 16,4 |
54,4 60,2 36,0 21,0 51,2 45,6 32,8 |
Ogółem |
50 |
x |
805,0 |
x |
301,2 |
Źródło: M. Sobczyk, Statystyka, PWN, W-wa 1991, s.45.
Najpierw należy obliczyć średni staż pracy:
Wynik podstawiamy do wzoru:
Otrzymany wynik oznacza, że przeciętne zróżnicowanie badanej zbiorowości nauczycieli ze względu na staż pracy wynosi
6 lat.
Wariancja jest to średnia arytmetyczna z kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej całej zbiorowości.
Dla szeregu wyliczającego oblicza się ją wg wzoru:
Dla szeregu rozdzielczego punktowego:
Dla szeregu rozdzielczego przedziałowego:
Ćwiczenie 6
Oblicz wariancję z podanego szeregu.
Tab. Zgony niemowląt na wsi wg wieku w Polsce w 1977 r.
Wiek zmarłych
|
Liczba
|
Obliczenie pomocnicze |
||||
|
|
|
|
|
|
|
0-6 7-13 14-20 21-27 28-29 |
3 186 623 336 243 74 |
3,0 10,0 17,0 24,0 28,5 |
9 558 6 230 5 712 5 832 2 109 |
-3,6 3,4 10,4 17,4 21,9 |
12,96 11,56 108,16 302,76 479,61 |
41 290,56 7 201,88 36 341,76 73 570,68 35 491,14 |
Ogółem |
4 462 |
x |
29 441 |
x |
x |
193 896,02 |
Źródło: M. Sobczyk, Statystyka, PWN, W-wa 1991, s.47.
Najpierw należy obliczyć średnią arytmetyczną:
Następnie podstawiamy do wzoru:
Wariancja, jako suma kwadratów dzielona przez liczbę dodatnią jest zawsze wielkością dodatnią i mianowaną. Mianem wariancji jest kwadrat jednostki fizycznej, w jakiej mierzona jest badana cecha.
Im zbiorowość jest bardziej zróżnicowana tym wyższa jest wartość wariancji
Wariancja obliczona na podstawie szeregów rozdzielczych przedziałowych jest wielkością zawyżoną. Powoduje to fakt, że do obliczeń wykorzystuje się środki przedziałów klasowych, a nie średnie arytmetyczne z poszczególnych klas.
Wariancja jest wielkością kwadratową. Aby uzyskać miarę zróżnicowania o postaci liniowej (o mianie zgodnym z mianem badanej cechy), wyciągamy pierwiastek kwadratowy. W wyniku pierwiastkowania otrzymujemy tzw. odchylenie standardowe.
Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji.
Odchylenie standardowe określa o ile wszystkie jednostki danej zbiorowości różnią się średnio od średniej arytmetycznej badanej zmiennej. Dla poszczególnych rodzajów szeregów korzystamy z odpowiednich wzorów na wariancję, a następnie wyciągamy pierwiastek kwadratowy z wariancji.
Możemy je wykorzystać do konstrukcji typowego obszaru zmienności badanej cechy. W obszarze tym mieści się około 2/3 wszystkich jednostek badanej zbiorowości statystycznej. Typowy obszar zmienności określa wzór:
Pomiędzy odchyleniami: przeciętnym a standardowym obliczonym z tego samego szeregu zachodzi relacja:
Omówione powyżej miary dyspersji są miarami bezwzględnymi, gdyż wyrażamy je w takich samych jednostkach jak wartości badanej zmiennej. Nie pozwala to na porównywanie zmienności cech o różnych mianach. Ponadto nie można porównywać pod względem tej samej cechy dwóch (lub kilku) zbiorowości będących na różnym poziomie, określonym np. średnią arytmetyczną czy medianą. Z tego powodu w analizie dyspersji stosuje się względną miarę zróżnicowania - współczynnik zmienności.
Współczynnik zmienności jest ilorazem bezwzględnej miary dyspersji i odpowiednich wartości średnich. Jest on wyrażany w procentach. Ponieważ w analizie rozkładu zmienności cech korzystamy z różnych miar zróżnicowania i różnych przeciętnych, współczynnik zmienności można obliczyć kilkoma metodami:
1)
;
2)
Są to tzw. klasyczne współczynniki zmienności.
3)
;
4)
Są to tzw. pozycyjne współczynniki zmienności.
Współczynniki zmienności informują o sile dyspersji.
Ich duże wartości liczbowe świadczą o niejednorodności zbiorowości.
Ćwiczenie 9
Zastosuj współczynnik zmienności dla analizy dyspersji dochodów w podanych niżej hotelach A, B i C:
Średnie miesięczny wpływy:
.
Odchylenia standardowe wartości sprzedanych usług wynosiły:
.
Z uwagi na duże różnice w średnim poziomie wpływów w poszczególnych hotelach należy zastosować wzór 1.
Po podstawieniu danych otrzymujemy:
Dla hotelu A:
;
Dla hotelu B:
;
Dla hotelu C:
.
Z powyższego wynika, że największe względne zróżnicowanie miesięcznych wpływów miało miejsce w hotelu B, a najmniejsze w hotelu A.
SŁOWNICZEK:
- symbol średniej arytmetycznej;
xi - warianty cechy mierzalnej;
N - liczebność badanej zbiorowości;
N - suma liczebności (szeregi przedziałowe);
- środek przedziału;
- procentowy wskaźnik udziału (odsetki);
H - symbol średniej harmonicznej;
- symbol dominanty;
- dolna granica klasy, w której znajduje się dominanta;
- liczebność przedziału dominanty;
- liczebność przedziału poprzedzającego przedział dominanty;
- liczebność przedziału następującego po przedziale dominanty;
- interwał, czyli rozpiętość przedziału dominanty;
- symbol mediany;
- symbole kwartyli;
- granice przedziałów, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
N - ogólna liczebność danej zbiorowości;
- suma liczebności od klasy pierwszej do tej, w której znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
- liczebności przedziałów, w których, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
- interwały (rozpiętość) przedziałów, w których znajdują się odpowiednio: kwartyl pierwszy, drugi (mediana) i trzeci;
d - symbol odchylenia przeciętnego;
- symbol wariancji;
s - symbol odchylenia standardowego;
V - symbol współczynnika zmienności.
Miary zmienności
1