ĆWICZENIA II
MIARY TENDENCJI CENTRALNEJ
MIARY TENDENCJI CENTRALNEJ - wskazanie w zbiorowości statystycznej takiej wartości badanej cechy, wokół której skupiają się cechy wszystkich jednostek wchodzącej w skład tej zbiorowości. Tendencja centralna określana jest jako miara przeciętna lub średnia
1. ŚREDNIA ARYTMETYCZNA
Średnia arytmetyczna to iloraz sumy wartości danej cechy w badanej zbiorowości dzielonej przez liczbę jednostek zbiorowości
Średnia arytmetyczna badanej cechy X (zmiennej) to wypadkowa wszystkich jej realizacji (obserwacji). Podaje ona, jaki jest średni poziom zmiennej X w całej zbiorowości, liczącej N elementów.
Sposób obliczania średniej arytmetycznej uzależniony jest od rodzaju szeregu statystycznego
1.1. Szereg szczegółowy (do jednej cechy przyporządkowana jest jedna jednostka statystyczna)
dodajemy wartości danej cechy i dzielimy ją przez liczbę jednostek w zbiorowości
Gdzie:
średnia arytmetyczna
- poszczególne wartości badanej zmiennej
- liczebność zbiorowości statystycznej czyli ogólna liczba jednostek statystycznych
PRZYKŁAD
Liczebność klas w szkole podstawowej X
17 19 20 22 25 27 29 31 33 34 35 (liczba klas N = 11)
Średnia arytmetyczna:
Średnia liczebność klasy w szkole podstawowej X wynosi 26,54
1.2. Szereg rozdzielczy z przedziałami jednowariantowymi
mnożymy wartość danej cechy przez odpowiadającą jej liczebność cząstkową i dzielimy przez liczebność zbiorowości statystycznej
(tzw. średnia ważona)
Gdzie:
- liczba jednostek statystycznych o i-tym wariancie badanej zmiennej
Pozostałe symbole bez zmian
PRZYKŁAD:
Oceny uzyskane przez studentów w roku akademickim 2010/2011
Oceny (xi) |
Liczba studentów (ni) |
|
2 3 4 5 |
19 25 38 15 |
38 75 152 75 |
RAZEM |
N = 97 |
340 |
Średnia ważona:
Średnia ocen w roku akademickim 2009/2010 wyniosła 3,5
1.3. Szereg rozdzielczy z przedziałami wielowariantowymi
znajdujemy dla każdego przedziału jego środek, następnie mnożymy wartości środkowe przez liczebność danego przedziału. Sumujemy iloczyny i dzielimy je przez liczebność zbiorowości
Gdzie:
- środek przedziału klasowego
środek przedziału klasowego wyznacza się:
w przypadku cech ciągłych (gdy górna granica danego przedziału klasowego jest równa dolnej granicy następnego przedziału klasowego) środek wyznacza się jako średnie arytmetyczne dolnych i górnych granic danych przedziałów klasowych
w przypadku cech skokowych (gdy górna granica danego przedziału klasowego nie jest równa dolnej granicy następnego przedziału) środek wyznacza się jako średnie arytmetyczne dolnych (a dla ostatniego przedziału klasowego górnych) granic sąsiednich przedziałów klasowych
PRZYKŁAD 1
Liczba mieszkańców w powiatach w województwie zachodniopomorskim
Liczba mieszkańców (w tys.) |
Liczba powiatów |
|
|
2-6 6-10 10-14 14-18 18-22 22-26 26-30 30-34 34-38 |
10 12 14 16 22 23 21 15 8 |
4 8 12 16 20 24 28 32 36 |
40 96 168 256 440 552 588 480 288 |
Razem |
N = 141 |
|
2908 |
Średnia ważona:
Średnia liczba mieszkańców w powiatach województwa zachodniopomorskiego wynosi 20,6 tys.
PRZYKŁAD 2
Liczba mieszkańców (w tys.) |
Liczba powiatów |
|
|
2-6 7-11 12-16 17-21 22-26 27-31 32-36 37-41 |
11 13 19 18 23 22 19 16 |
4,5 9,5 14,5 19,5 24,5 29,5 34,5 38,5 |
49,5 123,5 275,5 351 563,5 649 655,5 616 |
Razem |
141 |
|
3283,5 |
Średnia ważona:
Średnia liczba mieszkańców w powiatach województwa zachodniopomorskiego wynosi 22,42 tys.
2. MEDIANA
MEDIANA - taka wartość badanej zmiennej, która dzieli, uporządkowany ze względu na tę cechę, szereg statystyczny na połowy. Połowa jednostek statystycznych danej zbiorowości charakteryzuje się wartościami badanej zmiennej niższymi od mediany, a połowa wyższymi. Zatem mediana to wartość środkowa, czyli leżąca po środku uporządkowanego zbioru badanej przez nas cechy; poniżej i powyżej tej wartości znajduje się taka sama ilość elementów
Mediana to jeden z tzw. parametrów pozycyjnych stosowanych dla szeregów otwartych (z dołu lub z góry). Warunkiem wyznaczenia parametru pozycyjnego jest uporządkowanie szeregu statystycznego, najlepiej od najniższej do najwyższej wartości badanej zmiennej
Sposób obliczania mediany uzależniony jest od rodzaju szeregu statystycznego
2.1. Szereg szczegółowy z nieparzystą liczbą jednostek
ogólny wzór pozwalający wyliczyć, która w kolejności wartość jest medianą:
Gdzie:
- ilość jednostek w zbiorowości
PRZYKŁAD
Liczebność klas w szkole podstawowej X
17 19 20 22 25 27 29 31 33 34 35 (n = 11)
(szósta w kolejności jednostka jest medianą)
Medianą jest liczebność klasy równa 27
2.2. Szereg szczegółowy z parzystą liczbą jednostek
dla zbiorów parzystych istnieją dwie środkowe jednostki, a mediana znajduje się pośrodku między nimi. Jest równa średniej arytmetycznej tych dwóch wartości
wzór dla pierwszej środkowej jednostki
wzór dla drugiej środkowej jednostki
PRZYKŁAD
Liczebność klas w szkole podstawowej X
17 19 20 22 25 27 29 31 33 34 35 38 (n = 12)
mediana znajduje się między 6 a 7 jednostką w szeregu (między liczbami 27 i 29)
Medianą jest liczebność klasy równa 28
2.3. Szereg rozdzielczy punktowy
w pierwszej kolejności dzielimy liczebność zbiorowości na pół (1/2)
następnie tworzymy szereg skumulowany
w liczebności skumulowanej odnajdujemy klasę (wartość danej cechy) w której zawiera się połowa liczebności badanej zbiorowości - wartość cechy, w której się ona zawiera jest medianą
PRZYKŁAD
Oceny uzyskane przez studentów w roku akademickim 2010/2011
Oceny (xi) |
Liczba studentów (ni) |
szereg skumulowany |
2 3
5 |
19 25
15 |
19 44 (19+25) 82 (44+38) 97 (82+15) |
RAZEM |
N = 97 |
340 |
połowa liczby studentów zawiera się w klasie trzeciej (w szeregu skumulowanym), o wartości cechy równej 4. Zatem mediana równa się 4: taka sama liczba studentów uzyskała oceny niższe od 4 oraz wyższe od 4.
2.4. Szereg rozdzielczy z przedziałami wielowariantowymi
w pierwszej kolejności ustala się przedział klasowy, w którym znajduje się mediana
ustala się go poprzez podzielenie ogólnej liczebności zbiorowości przez 2; następnie po stworzeniu szeregu kumulacyjnego odnajdujemy przedział w którym zawiera się połowa liczebności ogólnej
medianę oblicza się wg wzoru
Gdzie:
- przedział klasowy zawierający medianę
- dolna granica przedziału klasowego zawierająca medianę
- ogólna liczebność zbiorowości statystycznej
- suma liczebności klas poprzedzających klasę mediany
- liczebność klasy mediany
- rozpiętość klasy zawierającej medianę
PRZYKŁAD
liczba ludności w Polsce w 2000 roku
Wiek |
Liczebność w tys. |
Szereg skumulowany |
0-2 3-6 7-12 13-19 20-24 25-29 30-44 45-50 |
1149,9 1738,5 3204,3 4544,1 3128,7 2772,5 8013,1 … |
1149,9 2888,4 6092,7 10636,8 13765,5
24551,1 … |
|
38 254 |
|
= 38254:2 = 19127[Author ID1: at Sun Oct 18 14:15:00 2009
]
Znajdujemy przedział, w którym mieści się środkowa liczba ludności [Author ID1: at Sun Oct 18 14:20:00 2009 ]w szeregu skumulowanym (30-44 - 24551)[Author ID1: at Sun Oct 18 14:20:00 2009 ]
Podstawiamy do wzoru:[Author ID1: at Sun Oct 18 14:20:00 2009 ]
- dolna granica przedziału klasowego zawierająca medianę, czyli 30
- połowa ogólnej liczebności zbiorowości, czyli 19 127
- suma liczebności klas poprzedzających klasę mediany (w szeregu skumulowanym), czyli 16 538
- liczebność klasy mediany, czyli 8013,1
- rozpiętość klasy zawierającej medianę, czyli 14 lat (44-31)
Mediana wieku w roku 2000 dla [Author ID1: at Sun Oct 18 14:26:00 2009 ]populacji[Author ID1: at Sun Oct 18 14:27:00 2009 ] [Author ID1: at Sun Oct 18 14:26:00 2009 ]Polski wyniosła 34,[Author ID1: at Sun Oct 18 14:27:00 2009 ]5 lat [Author ID1: at Sun Oct 18 14:27:00 2009 ]
3. DOMINANTA
Dominanta to wartość badanej zmiennej, która w szeregu statystycznym występuje najczęściej
procedurę obliczania dominanty rozpoczyna się od wskazania przedziału klasowego zawierającego dominantę, na podstawie największej liczebności cząstkowej w szeregu statystycznym
następnie obliczamy wg wzoru
Gdzie:
- dominanta
- dolna granica klasy dominanty
- liczebność klasy dominanty
- liczebność klasy poprzedzającej klasę dominantę
- liczebność klasy następującej po klasie dominanty
- rozpiętość klasy dominanty
PRZYKŁAD
Bezrobotni zarejestrowani wg stażu pracy (w latach) w roku 2008
1-5 |
5-10 |
10-15 |
15-20 |
20-30 |
w tys. |
||||
194,3 |
302,4 |
229,6 |
158,8 |
36,4 |
Klasa w której występuje dominanta: 5-10
Podstawiamy do wzoru:
- dominanta
- dolna granica klasy dominanty, czyli 5
- liczebność klasy dominanty, czyli 302,4
- liczebność klasy poprzedzającej klasę dominanty , czyli 194,3
- liczebność klasy następującej po klasie dominanty, czyli 229,6
- rozpiętość klasy dominanty, czyli 5
W 2008 roku najczęściej rejestrowali się bezrobotni o stażu pracy wynoszącym 7,9 roku.
w przypadku szeregu rozdzielczego o nierównej rozpiętości klas, dominanta znajdzie się w klasie o największej gęstości;
gęstość - liczba jednostek liczebności przypadająca na jednostkę długości przedziału (dzielimy liczebność danego przedziału przez jego rozpiętość)
następnie procedura obliczania dominanty jest taka sama jak w przypadku szeregu o równej rozpiętości klas
PRZYKŁAD
Powierzchnia gospodarstw indywidualnych ( w tys. ha) w Polsce wg powierzchni (w ha)
1-2 |
2-5 |
5-10 |
10-15 |
15-20 |
20-30 |
30-50 |
50-100 |
620 |
1961 |
2907 |
1989 |
1326 |
1496 |
1369 |
1115 |
Obliczamy gęstość klas (620:1; 1961:3; 2907:5 itp.)
620 |
654 |
581 |
398 |
265 |
150 |
68 |
22 |
Dominanta znajduje się w przedziale 2-5 ha; rozpiętość tego przedziału 3
Podstawiamy do wzoru:
W Polsce największą powierzchnię w kraju zajmują gospodarstwa o powierzchni 6 ha
6