Zadanie 1) Przeprowadzono badanie liczby posiadanych dzieci wśród matek pewnego miasta:
Liczba (xi) |
Odsetek matek (w %) (ni) |
xi ni |
(xi - xśr)2 ni |
nskum |
1 2 3 4 5+ (5)* |
54,6 31,1 9,3 2,8 2,2 |
54,6 62,2 27,9 11,2 11 |
24,44 3,41 16,48 15,21 24,41 |
54,6 85,7 95,0 97,8 100,0 |
Ogółem |
100,0 |
166,9 |
83,94 |
X |
Przeprowadź kompleksową analizę struktury
ROZWIĄZANIE:
Zbiorowość statystyczna: matki z pewnego miasta
Jednostka statystyczna: 1 matka
Cecha statystyczna zmienna: liczba posiadanych dzieci - cecha rzeczowa, mierzalna, SKOKOWA !!!
*** Badany szereg jest szeregiem strukturalnym (kryterium treści) oraz rozdzielczym JEDNOstopniowym (kryterium formy). Ostatni wariant jest jednak zapisany w postaci przedziału otwartego (5+ oznacza 5 i więcej). Można zostawić taki przedział i liczyć tylko miary pozycyjne, ale byłoby to trochę zbyt łatwe i mało interesujące. Najlepiej uzasadnić więc, że ten przedział można zamknąć (bo jego liczebność nie przekracza 5% liczebności całkowitej) i zamiast 5+ przyjąć wariant równy 5. Wtedy wszystkie warianty są wyrażone jako jedna liczba i nie ma problemu z liczeniem miar KLASYCZNYCH
WYNIKI:
• Średnia (Xśr) = 1,67 dziecka
Odp. Badane matki mają średnio 1,67 dziecka
• Odchylenie (SigmaX) = 0,92 dziecka
Odp. Poszczególne matki różnią się liczbą posiadanych dzieci od średniej arytmetycznej przeciętnie o +- 0,92 dziecka
• Współczynnik zmienności (Vx) = 54,90 %
Odp. Zróżnicowanie posiadanych dzieci wśród badanych matek jest umiarkowane, ponieważ Vx jest w przedziale 35%-60%. Oznacza to, że średnia arytmetyczna dosyć dobrze opisuje przeciętny poziom liczby posiadanych dzieci
• 0,75 < Xtyp < 2,59 (jest to Typowy obszar zmienności)
Odp. Około 68% matek ma od 0,75 do 2,59 dzieci
Można wyliczyć Klasyczny Współczynnik Asymetrii (Alfa3) ale żeby ułatwić sobie obliczenia można wyznaczyć Modalną i Medianę i zamiast Alfa3 wyliczyć Klasyczno-Pozycyjny Współczynnik Asymetrii czyli As
• Modalna = 1 dziecko
Odp. Najwięcej matek (54,6%) ma 1 dziecko
• Mediana = 1 dziecko
Odp. Połowa (50%) matek ma 1 dziecko (w domyśle „lub mniej” choć takich nie ma) zaś połowa 1 lub więcej dzieci
• Klasyczno-Pozycyjny Współczynnik Asymetrii czyli As = 0,73
Odp. Rozkład posiadanych dzieci wykazuje asymetrię prawostronną (ponieważ As > 0). Oznacza to, że dominują takie matki, które mają mniej dzieci niż wynosi średnia (Mo < Xśr)
Gdyby liczyć Alfa3 (zamiast As) to wychodzi 1,61 czyli również rozkład jest prawostronnie asymetryczny, wtedy potrzebna jest jeszcze jedna kolumna w tabeli: (Xi - Xśr)3 ni
Zadanie 2) Zbadano roczne spożycie mięsa i podrobów w 150 gospodarstwach domowych (w kg na 1 osobę):
Spożycie mięsa (w kg) |
Liczba gospodarstw domowych (ni) |
(x'i) |
(x'i ni) |
(x'i - xśr)2 ni (do Odchylenia) |
nskum (do Mediany) |
30-40 40-50 50-60 60-70 70-80 |
10 20 60 50 10 |
35 45 55 65 75 |
350 900 3300 3250 750 |
4840 2880 240 3200 3240 |
10 30 90 140 150 |
Ogółem |
150 |
X |
8550 |
14400 |
X |
Przeprowadź kompleksową analizę struktury
ROZWIĄZANIE:
Zbiorowość statystyczna: 150 gospodarstw domowych
Jednostka statystyczna: 1 gospodarstwo domowe
Cecha statystyczna zmienna: spożycie mięsa i podrobów (wyrażone w kg na 1 osobę) - cecha rzeczowa, mierzalna, ciągła
Badany szereg jest szeregiem strukturalnym (kryterium treści) oraz rozdzielczym wielostopniowym (kryterium formy). Składa się z 5 przedziałów klasowych, które wszystkie są zamknięte dołem i górą oraz mają identyczne rozpiętości. W związku z tym MOŻNA wyznaczyć MIARY KLASYCZNE (i uzupełnić je częściowo miarami pozycyjnymi)
WYNIKI:
Najpierw nadajemy środki przedziałów (x'i)
• Średnia (Xśr) = 57 kg/osobę
Odp. W każdym z gospodarstw co roku spożywa się średnio 57 kg mięsa na 1 osobę
• Odchylenie (SigmaX) = 9,80 kg/osobę
Odp. Poszczególne gospodarstwa różnią się rocznym spożyciem mięsa na 1 osobę od średniej arytmetycznej przeciętnie o +- 9,80 kg/osobę
• Współczynnik zmienności (Vx) = 17,19 %
Odp. Zróżnicowanie spożycia mięsa w badanych gospodarstwach jest małe, ponieważ Vx nie przekracza 35%. Oznacza to, że średnia arytmetyczna dobrze opisuje przeciętny poziom spożycia mięsa
• 47,20 < Xtyp < 66,80 (jest to Typowy obszar zmienności)
Odp. Około 68% badanych gospodarstw spożywa od 47,20 do 66,80 kg mięsa na 1 osobę
Można wyliczyć Klasyczny Współczynnik Asymetrii (Alfa3) ale żeby ułatwić sobie obliczenia można wyznaczyć Modalną i Medianę i zamiast Alfa3 wyliczyć Klasyczno-Pozycyjny Współczynnik Asymetrii czyli As
• Modalna = 58,00 kg/osobę
Odp. Najwięcej gospodarstw spożywa rocznie 58,00 kg mięsa na 1 osobę
• Mediana = 57,50 kg/osobę
Odp. Połowa (75) gospodarstw spożywa co roku nie więcej niż 57,50 kg/osobę, a druga połowa (też 75) nie mniej niż 57,50 kg/osobę
• Klasyczno-Pozycyjny Współczynnik Asymetrii czyli As = -0,10
Odp. Rozkład spożycia mięsa badanych gospodarstw wykazuje asymetrię lewostronną (ponieważ As < 0). Oznacza to, że dominują takie gospodarstwa, które spożywają więcej mięsa na 1 osobę niż wynosi średnia (Xśr < Mo)
Gdyby liczyć Alfa3 (zamiast As) to wychodzi -0,41 czyli również rozkład jest lewostronnie asymetryczny, wtedy potrzebna jest jeszcze jedna kolumna w tabeli: (Xi - Xśr)3 ni
NA KONIEC SPORZĄDZAMY WYKRES SŁUPKOWY (HISTOGRAM)
Zadanie 3) Zbadano wiek ludności Warszawy:
Wiek (w latach) (xi) |
Ludność (w tys.) (ni) |
nskum |
0-2 3-6 7-14 15-17 |
42,3 50,7 106,6 49,3 |
42,3 93,0 199,6 248,9 |
Ogółem |
248,9 |
X |
Przeprowadź kompleksową analizę struktury
ROZWIĄZANIE:
Zbiorowość statystyczna: ludność Warszawy w wieku 0-17 lat
Jednostka statystyczna: 1 mieszkaniec Warszawy w tym wieku
Cecha statystyczna zmienna: wiek (wyrażony w latach) - cecha rzeczowa, mierzalna, ciągła
Badany szereg jest szeregiem strukturalnym (kryterium treści) oraz rozdzielczym wielostopniowym (kryterium formy). Składa się z 4 przedziałów klasowych, które chociaż wszystkie są zamknięte dołem i górą, nie mają identycznej rozpiętości. W związku z tym nie wolno wyznaczać miar klasycznych TYLKO POZYCYJNE!!!
W tabeli roboczej potrzebna będzie tylko jedna nowa kolumna: nskum (czyli liczebności skumulowane)
WYNIKI:
• Modalna: znajduje się w 3 przedziale (7-14) bo tam jest maksymalna liczebność (106,6) jednak NIE WOLNO jej wyznaczać, bo sąsiadujące przedziały mają inne rozpiętości (różne od c0 = 7)
(!!! warunkiem wyznaczenia Modalnej są 3 przedziały o równej rozpiętości !!!)
• Mediana: ponieważ N/2 = 124,45 mieści się w 3 od góry skumulowanej liczebności, więc Mediana znajduje się w 3 od góry przedziale (7-14)
x0 = 7
c0 = 8 (bo faktycznie między 7 a 15)
n0 = 106,6
Me = 9,36 lat
Odp.: Połowa badanej ludności Warszawy ma nie więcej niż 9,36 lat, a druga połowa nie mniej niż 9,36 lat
• Kwartyl 1 (Q1): ponieważ N/4 = 62,225 mieści się w 2 od góry skumulowanej liczebności, więc Q1 znajduje się w 2 od góry przedziale (3-6)
x0 = 3
c0 = 4 (bo faktycznie między 3 a 7)
n0 = 50,7
Q1 = 4,57 lat
Odp.: 1/4 badanej ludności Warszawy ma nie więcej niż 4,57 lat, a 3/4 nie mniej niż 4,57 lat
• Kwartyl 3 (Q3): ponieważ 3N/4 = 186,675 mieści się w 3 od góry skumulowanej liczebności, więc Q3 znajduje się w 3 od góry przedziale (7-14)
x0 = 7
c0 = 8 (bo faktycznie między 7 a 15)
n0 = 106,6
Q3 = 14,03 lat
Odp.: 3/4 badanej ludności Warszawy ma nie więcej niż 14,03 lat, a 1/4 nie mniej niż 14,03 lat
• Odchylenie ćwiartkowe (Q)
Q = 4,73 lat
Odp.: Dla 50% środkowych jednostek zbiorowości zróżnicowanie wieku od mediany wynosi przeciętnie +- 4,73 lat
• Pozycyjny współczynnik zmienności (VQ)
VQ = 50,52 %
Odp.: Dla 50% środkowych jednostek zbiorowości zróżnicowanie wieku jest umiarkowane, ponieważ Vq znajduje się w przedziale 35%-60%. Znaczy to, że mediana jest parametrem dosyć dobrze opisującym przeciętny wiek badanych osób
• Pozycyjny współczynnik asymetrii (ASq)
ASq = 0,01
Odp. Dla 50% środkowych jednostek zbiorowości rozkład wieku wykazuje niewielką asymetrię prawostronną (ponieważ ASq > 0). Znaczy to, że dominują osoby w wieku niższym od mediany