Praca zaliczeniowa
ze statystyki
Ludność według płci, województw i podregionów w zachodniej Polsce w 2013 roku.
Sawicki Kamil
Romańska Dagmara
Romańska Martyna
Politechnika Częstochowska
Logistyka grupa 5
2013/2014
Województwo | Lp. | Podregion | Mężczyźni | Kobiety |
---|---|---|---|---|
DOLNOŚLĄSKIE | 1. | jeleniogórski | 279,705 | 297,943 |
2. | legnicko-głogowski | 220,335 | 233,048 | |
3. | wałbrzyski | 324,656 | 351,541 | |
KUJAWSKO-POMORSKIE | 4. | bydgosko-toruński | 368,374 | 406,350 |
5. | włocławski | 381,555 | 398,783 | |
LUBUSKIE | 6. | gorzowski | 189,125 | 197,846 |
7. | zielonogórski | 308,774 | 326,508 | |
ŁÓDZKIE | 8. | łódzki | 183,114 | 201,734 |
9. | sieradzki | 222,062 | 230,902 | |
MAZOWIECKIE | 10. | ciechanowsko-płocki | 307,309 | 321,207 |
11. | radomski | 304,804 | 317,084 | |
OPOLSKIE | 12. | nyski | 194,570 | 205,704 |
13. | opolski | 292,383 | 314,342 | |
ŚLĄSKIE | 14. | bytomski | 216,233 | 230,664 |
15. | częstochowski | 253,012 | 273,289 | |
16. | gliwicki | 231,941 | 247,970 | |
WIELKOPOLSKIE | 17. | kaliski | 328,000 | 344,495 |
18. | pilski | 204,226 | 209,777 | |
ZACHODNIOPOMORSKIE | 19. | m. Szczecin | 194,149 | 214,353 |
20. | szczeciński | 162,366 | 167,151 |
Charakterystyka
Nazwa | Liczba mężczyzn na 1000 mieszkańców dla wybranych podregionów w zachodniej Polsce | Liczba kobiet na 1000 mieszkańców dla wybranych podregionów w zachodniej Polsce |
---|---|---|
zbiorowość generalna | Podregiony w Polsce | Podregiony w Polsce |
jednostka statystyczna | Podregion | Podregion |
cecha statystyczna | Mężczyźni urodzeni w 2013r. na 1000 mieszkańców dla wybranych podregionów w zachodniej Polsce | Kobiety urodzone w 2013r. na 1000 mieszkańców dla wybranych podregionów w zachodniej Polsce |
rodzaj cechy | Mierzalne skokowe | Mieszalne skokowe |
rodzaj badania | Częściowe | Częściowe |
materiał statystyczny | Wtórny | Wtórny |
forma prezentacji danych | Szereg szczegółowy (indywidualny) | Szereg szczegółowy (indywidualny) |
Wykresy analizowanych danych
Porównanie liczby mężczyzn i kobiet na 1000 mieszkańców dla wybranych podregionów
Punkt 1. Opracowane zadanie pozwalające na wszechstronną ocenę struktury badanego zjawiska.
*średnia arytmetyczna $\overset{\acute{}}{x} = \frac{\sum_{}^{}x_{i}}{n}$
a) dla mężczyzn :$\overset{\acute{}}{x} = \frac{5166,693}{20} = 258,33$
b) dla kobiet: $\overset{\acute{}}{y} = \frac{5490,691}{20} =$ 274,53
Odp.: Średnia liczba mężczyzn na 1000 mieszkańców w 2013r wynosiła 258,33 natomiast średnia liczba kobiet na 1000 mieszkańców w 2013r wynosiła 274,53.
*mediana $\text{pozMe} = \frac{n + 1}{2}$
a) dla mężczyzn : pozMe = 10, 5 $\begin{matrix} \\ \text{Me} = 253,012 + 0,5\left( 231,914 - 253,012 \right) = 242,477 \\ \end{matrix}$
b) dla kobiet: pozMe = 10, 5 Me = 273, 289 + 0, 5(247,970−273,289)= 260,630
Odp.: W 50% podregionów zachodniej polski liczba mężczyzn wynosiła mniej lub równo 242,477 na 1000 mieszkańców a 50% więcej lub równo .
W 50% podregionów zachodniej polski liczba kobiet wynosiła mniej lub równo 260,630 na 1000 mieszkańców a 50% więcej lub równo.
* dominanta
Odp.: W obu przypadkach nie można określić wartości, która najczęściej występowała.
*kwartyl pierwszy $\text{poz}Q_{1} = \frac{n + 1}{4}$ $\begin{matrix} Q_{1} = x_{5} + 0,75\left( x_{6} - x_{5} \right) \\ \\ \end{matrix}$
a) dla mężczyzn: pozQ1 = 5, 25 $\begin{matrix} Q_{1} = 191,510 + 0,75(201,226 - 191,510) = 201,812 \\ \\ \end{matrix}$
b) dla kobiet: pozQ1 = 5, 25 $\begin{matrix} Q_{1} = 205,701 + 0,75\left( 209,777 - 205,701 \right) = 213,209 \\ \\ \end{matrix}$
Odp.: W 25% wybranych podregionów liczba mężczyzn na 1000 mieszkańców wynosiły mniej bądź równo 201,812 a w 75% więcej bądź równo.
W 25% wybranych podregionów liczba kobiet na 1000 mieszkańców wynosiły mniej bądź równo 213,209 a w 75% więcej bądź równo.
*kwartyl trzeci $\text{poz}Q_{3} = \frac{3}{4}*\left( n + 1 \right)$ Q3 = x15 + 0, 25(x16−x15)
a) dla mężczyzn: pozQ3 = 15, 75 Q3 = 307, 309 + 0, 25(308, 774 − 307, 309)=307, 67525 ≈307,675
b) dla kobiet: pozQ3 = 15, 75 Q3 = 321, 207 + 0, 25(326,508−321,207)= 322,53225 ≈322,532
Odp: W 75% wybranych podregionów liczba mężczyzn na 1000 mieszkańców wynoszą mniej bądź równo 307,675 a w 25% więcej bądź równo.
W 75% wybranych podregionów liczba kobiet 1000 mieszkańców wynoszą mniej bądź równo 322,532 a w 25% więcej bądź równo.
*wariancja
$$\mathbf{\ }s^{2} = \frac{1}{n}\sum_{}^{}\left( x_{i} - \overset{\acute{}}{x} \right)^{2}$$
a) dla mężczyzn: $s^{2} = \frac{81290,45}{20} = 4064,5225$ ≈4064,52
b) dla kobiet: $s^{2} = \frac{93982,12}{20} = 4699,106$ ≈4699,11
* odchylenie standardowe $s = \sqrt{S^{2}}$
a) dla mężczyzn: $s = \sqrt{4064,5225} = 63,753$ ≈63,75
b) dla kobiet: $s = \sqrt{4699,106} = 68,550$ ≈68,55
Odp.: Przeciętne zróżnicowanie liczby mężczyzn na 1000 mieszkańców w wybranych podregionach w stosunku do średniej wynosi 63,75.
Przeciętne zróżnicowanie liczby kobiet na 1000 mieszkańców w wybranych podregionach w stosunku do średniej wynosi 68,55.
*odchylenie ćwiartkowe $Q = \frac{Q_{3} - Q_{1}}{2}$
a) dla mężczyzn: $Q = \frac{307,67522 - 201,812}{2} = 52,93161$ ≈52,93
b) dla kobiet: $Q = \frac{322,53225 - 213,209}{2} = 54,661625$ ≈54,66
Odp.: W przypadku liczby mężczyzn na 1000 mieszkańców przeciętne zróżnicowanie w badanych podregionach dla połowy podregionów wynosiło 52,93.
W przypadku liczby kobiet na 1000 mieszkańców przeciętne zróżnicowanie w badanych podregionach dla połowy podregionów wynosiło 54,66
*typowy obszar zmienności Me − Q < xtyp < Me + Q
a) dla mężczyzn: 242, 477 − 52, 93161 < xtyp < 242, 477 + 52, 93161
189, 54539 < xtyp < 295, 40861
b) dla kobiet: 260, 630 − 54, 661625 < xtyp < 260, 630 + 54, 661625
205, 968375 < xtyp < 315, 291625
Odp.: W przypadku liczby mężczyzn dla „typowych” podregionów liczby mężczyzn wynosiły od 189,54539 do 2995,40861. Natomiast liczba kobiet dla „typowych” podregionów liczby kobiet wynosiło od 205,968375 do 315,291625.
*współczynnik asymetrii dla miar pozycyjnych
$$A_{Q} = \frac{\left( Q_{3} - M_{e} \right) - \left( M_{e} - Q_{1} \right)}{2Q} = \frac{Q_{3} + Q_{1} - 2M_{e}}{2Q}$$
a) dla mężczyzn: $A_{Q} = \frac{307,67525 + 201,812 - 2*242,477}{2*52,93161} = 0.2317541734$ ≈ 0,232
b) dla kobiet: $A_{Q} = \frac{322,53225 + 213,209 - 2*260,630}{2*54,661625} = 0,132471821$≈ 0,132
Odp.: Dla liczby mężczyzn na 1000 mieszkańców występuje słaba asymetria dodatnia w badanych podregionach. Dla liczby kobiet występuje bardzo słaba asymetria dodatnia w badanych podregionach.
*współczynnik asymetrii oparty na miarach klasycznych $A_{s} = \frac{\overset{\acute{}}{x} - M_{0}}{s}$
Odp.: W obu przypadkach nie można obliczyć asymetrii, ponieważ dominanta nie występuje.
Punkt 2. Opracowane zadanie pozwalające na zastosowanie współczynnika zmienności.
*współczynnik zmienności $V_{s} = \frac{s}{\overset{\acute{}}{x}}*100$
a) dla mężczyzn: $V_{s} = \frac{63,750}{258,33465}*100 = 24,67$%
b) dla kobiet: $V_{s} = \frac{68,550}{274,53455}*100 = 24,96$%
Odp.: W przypadku liczby mężczyzn odchylenie standardowe stanowiło 24,68% wartości średniej arytmetycznej liczby mężczyzn w badanych podregionach. Taka wartość współczynnika świadczy o średnim zróżnicowaniu badanych podregionów pod względem liczby mężczyzn na 1000 mieszkańców.
W przypadku liczby kobiet odchylenie standardowe stanowiło 24,97% wartości średniej arytmetycznej liczby kobiet w badanych podregionach. Taka wartość współczynnika świadczy o średnim zróżnicowaniu badanych podregionów pod względem liczby kobiet na 1000 mieszkańców.
Punkt 3. Opracowane zadanie, w którym zostaną zastosowane metody statystyczne do analizy współzależoności zjawisk dla cech mierzalnych.
*współczynnik korelacji liniowej Pearsona
$r_{\text{xy}} = \frac{87094,713235}{\sqrt{81290,45*93982,12}} \approx 0,9964359845$ ≈0,996
Korelacyjny wykres zrzutu
Odp.: Pomiędzy liczbą mężczyzn, a liczbą kobiet występuje znacząca korelacja dodatnia.
*współczynnik korelacji rang Spermana
$$R_{s} = 1 - \frac{6*\text{di}^{2}}{n\left( n2 - 1 \right)}$$
$R_{s} = 1 - \frac{6*14}{20\left( 20^{2} - 1 \right)} = 0,0105263158$≈0,011
Odp.: Pomiędzy liczbą mężczyzn, a liczbą kobiet występuje słaba zależność dodatnia.
Punkt 4. Opracowane zadanie w którym zostaną zastosowane metody statystyczne do analizy współzależności zjawisk dla cech niemierzalnych.
*X-kwadrat
$$X^{2} = \frac{n\left( a*d - b*c \right)^{2}}{\left( a + b \right)*\left( c + d \right)*\left( a + c \right)*\left( b + d \right)}$$
$X^{2} = \frac{130\left( 40*23 - 32*35 \right)^{2}}{\left( 72 \right)*\left( 58 \right)*\left( 75 \right)*\left( 55 \right)} = 0,3018692674$≈0,30
Odp.: X2jest różne od zera. Występuje zależność między badanymi cechami.
*C-Pearson
$$s = \sqrt{\frac{X^{2}}{X^{2} + n}}$$
$$s = \sqrt{\frac{0,3018692674}{0,3018692674 + 130}} = 0,0481320243$$
*Współczynnik Yule'a
$$Y = \sqrt{\frac{X^{2}}{n}}$$
$$Y = \sqrt{\frac{0,3018692674}{130}} = 0,0481878749$$
Odp.: Rodzaj rodziny i aktywność alkoholowa są nieznaczenie skorelowane.
Punkt 5. Opracowane zadanie pozwalające na wyznaczenie funkcji trendu, wskaźników okresowych i przypadkowych metodą analityczną w analizie szeregów czasowych.
*Oszacowanie parametrów funkcji trendu
;
;
;
Postać funkcji trendu:
Interpretacja parametru kierunkowego funkcji trendu:
W latach 1991-1993 zużycie prądu przeciętnie zmniejszało się teoretycznie o około 0,12 kWh z kwartału na kwartał.
Interpretacja wyrazu wolnego:
W IV kwartale 1990 roku teoretyczna liczba kWh wynosiła około 34,20.
*wariancja składnika resztowego
*odchylenie standardowe składnika resztowego
Odp,;W latach 1991-1993 empiryczny poziom zużycia różnił się przeciętnie o 0,56 kWh od teoretycznego poziomu zużycia.
*współczynnik zmienności resztowej
interpretacja
Odchylenie standardowe reszt stanowi 0,02% przeciętnego poziomu zużycia.
*Współczynnik zbierzności
interpretacja
W 1,9% zużycie nie zostało wyjaśnione przez przyjęty model zmian zjawiska w czasie; czynniki przypadkowe w 2% wpływają na zmienność zużycia.
*współczynnik determinacji
interpretacja
W 98% zużycie zostało wyjaśnione przez przyjęty model zmian zjawiska w czasie.
Bibliografia:
Punkt 1,2,3. GUS, Departament Badań Demograficznych i Rynku Pracy „Ludność według płci, województw i podregionów w zachodniej Polsce w 2013 roku.”
Punkt 4. Własne źródło informacji zaczerpnięte z ćwiczeń statystyki.
Punkt 5. Zakład Systemów Informatycznych i Informatyki Ekonomicznej „Zużycie energii elektrycznej w latach 1991-1993”