Dorota Duda 14 lutego 2010 r.
KNoP, Studia doktoranckie niestacjonarne, IX edycja
Zadanie 3. Analiza struktury
Analizę struktury przeprowadzono na zbiorowości urodzeń żywych w podziale na małżeńskie i pozamałżeńskie w poszczególnych województwach w Polsce.
Źródło: Rocznik demograficzny 2009, Główny Urząd Statystyczny http://www.stat.gov.pl/gus/5840_3697_PLK_HTML.htm |
---|
Urodzenia żywe małżeńskie | Urodzenia żywe pozamałżeńskie |
---|---|
Średnia | 20762,125 |
Błąd standardowy | 2997,539246 |
Mediana | 20030 |
Dominanta | #N/D! |
Odchylenie standardowe | 11990,15698 |
Wariancja próbki | 143763864,5 |
Kurtoza | 0,659100499 |
Skośność | 1,04942389 |
Zakres | 42168 |
Minimum | 7247 |
Maksimum | 49415 |
Suma | 332194 |
Licznik | 16 |
W omawianych 16 województwach suma urodzeń małżeńskich wyniosła 332194, zaś pozamałżeńskich 8230. Najniższy wskaźnik urodzeń małżeńskich zanotowano w województwie opolskim (7247), a najwyższy w województwie mazowieckim (49415). Jeśli chodzi o urodzenia pozamałżeńskie, najmniejsze wartości miały województwa podlaskie i świętokrzyskie (po 1455), a największą województwo mazowieckie (9299).
Wartość średnia określa przeciętny poziom w danej zbiorowości. Jest to taka wartość cechy, którą posiadałaby każda jednostka zbiorowości, gdyby jednostki te nie różniły się w ogóle między sobą. W tym przypadku na każde województwo przypada średnio 20762 urodzeń żywych w małżeństwach oraz średnio 5144 urodzeń żywych poza małżeństwami.
Medianę można określić jedynie w uporządkowanym rosnąco lub malejąco zbiorze danych. Mediana jest wartością środkową, czyli wartością, którą charakteryzuje się jednostka zajmująca środkową pozycję w uporządkowanym zbiorze danych. Medianą liczby urodzeń jest dla urodzeń małżeńskich liczba 20030, co oznacza, że połowa województw charakteryzowała się liczbą urodzeń poniżej tej liczby, a druga połowa powyżej. Dla urodzeń pozamałżeńskich mediana wyniosła 4768.
Dominanta to wartość, która w zbiorze danych występuje najczęściej. Dominantą będzie ta kategoria, której odpowiada największa liczebności lub największa częstotliwość. W pierwszym przypadku liczba urodzeń posiadała inna wartość w każdym województwie, dlatego dominanta nie została obliczona, zaś w drugim przypadku w dwóch województwach liczba urodzeń żywych wyniosła 1455, czyli najwięcej było województw o liczbie urodzeń żywych równej 1455.
Odchylenie standardowe określa przeciętną różnicę pomiędzy odnotowanymi wartościami i ich wartością średnią. Wyznacza się je z wariancji, która jest średnią arytmetyczną różnic między obserwowanymi wartościami i ich średnią, podniesionych do kwadratu. W omawianym przykładzie wariancja próbki urodzeń małżeńskich wynosi 143763864,5, a pozamałżeńskich 7707473,8. Natomiast odchylenie standardowe wyniosło dla małżeństw 11990 urodzeń, co oznacza że średnio o tyle różniły się liczby urodzeń w województwach od wartości średniej wynoszącej 20792. Zaś liczba urodzeń pozamałżeńskich różniła się średnio o 2776 od ich wartości średniej równej 5144. Jeśli zatem największa rozbieżność liczby urodzeń, czyli zakres między wartością najwyższą a wartością najniższą w pierwszym przypadku wynosi 42168, a w drugim 7844, to przeciętna rozbieżność liczy urodzeń wyniosła odpowiednio 11990 i 2776.
Kolejny współczynnik skośności rozkładu to miara asymetrii rozkładu. Współczynnik skośności przyjmuje wartość zero dla rozkładu symetrycznego, wartości ujemne dla rozkładów o lewostronnej asymetrii i wartości dodatnie dla rozkładów o prawostronnej asymetrii. W omawianym przypadku obie wartości są dodatnie, przy czym dla urodzeń małżeńskich skośność przyjmuje wartość 1,049, co oznacza asymetrię prawostronną. Zaś skośność dla urodzeń pozamałżeńskich jest bliska zero i wynosi 0,149, co świadczy o tzw. quasi symetrii.
Kurtoza jest miarą spłaszczenia rozkładu wartości cechy, która pozwala wnioskować, jaka część zbiorowości jest skupiona wzdłuż wartości średniej. Można ją analizować tylko dla rozkładów symetrycznych, dla których skośność jest mała. Dla zbiorowości urodzeń dzieci w małżeństwach nie można liczyć kurtozy z uwagi na asymetrię rozkładu. Zaś dla zbiorowości urodzeń dzieci poza małżeńskich, gdzie rozkład jest quasi-symetryczny, kurtoza wynosi -1,41 i jest wartością ujemną, co oznacza, ze wykres jest bardziej spłaszczony.