Analiza statystyczna poziomu życia (2)


Poziom życia w województwach

Spis treści:

Praca nr 1 ze Statystyki -strona tytuowa 1

1. Spis treści: 2

2. Wprowadzenie 3

3. Opis użytych danych 3

4 Charakterystyki poszcególnych zmiennych 4

4.1 Zmienna „Ludność” 4

4.2 Zmienna „Nurse” 7

4.3 Zmienna „Majątek” 9

4.4 Zmienna „Płace” 11

4.5 Zmienna „Łóżko” 12

5. ANALIZA REGRESJI 14

5.1 Wykres dopasowanego modelu dla zmiennych: „Ludność” i „Majątek” 15

5.2 Wykres dopasowanego modelu dla zmiennych: „Ludność” i „Płaca” 16

5.3 Wykres dopasowanego modelu dla zmiennych: „Majątek” i „Ludność” 16

5.4 Wykres dopasowanego modelu dla zmiennych: „Majątek” i „Płaca” 17

5.5 Wykres dopasowanego modelu dla zmiennych: „Płaca” i „Ludność” 18

5.6 Wykres dopasowanego modelu dla zmiennych: „Płaca” i „Majątek” 18

6. HIERARCHICZNA ANALIZA SKUPIEŃ 19

7. ZAKOŃCZENIE 20

8. SŁOWNICZEK 21

  1. Wprowadzenie

Przedmiotem pracy jest analiza danych statystycznych:

Moim zadaniem jest opracowanie tych pięciu zmiennych. dla 16 województw Polski znalezienie zależności między poszczególnymi zmiennymi oraz wyciągnięcie wniosków statystycznych. Zmienne te będą poddane różnym analizom, które pomogą mi przetworzyć dane tak aby ograniczyć niepewności. Za pomocą programu statystycznego sgplus będę mogła przetworzyć powyższe dane statystyczne, przedstawić je graficznie a  ze zgromadzonych danych wyciągnąć informacje.

  1. Dane te zestawiono w poniższej tabeli

Województwa

Ludność

Nurse

Majątek

Płaca

Łóżko

Dolnośląskie

2982,1

156

30696

1194,95

157

Kujawsko-pomorskie

2100,1

197

26498

1093,78

213

Lubelskie

2239,5

163

27762

1099,72

174

Lubuskie

1022,5

188

28071

1095,53

188

Łódzkie

2663,6

182

28601

1096,85

166

Małopolskie

3215,9

179

30566

1152,83

183

Mazowieckie

5066,6

183

46461

1524,11

183

Opolskie

1089,6

189

36657

1142,71

199

Podkarpackie

2122,2

182

24448

1069,27

221

Podlaskie

1223,8

164

29206

1109,04

182

Pomorskie

2185,5

200

30669

1180,06

194

Śląskie

4882,4

173

32992

1365,28

153

Świętokrzyskie

1326,3

179

28029

1096,42

208

Warmińsko-mazurskie

1463,5

196

28198

1048,17

203

Wielkopolskie

3351,4

211

30907

1164,56

189

Zachodniopomorskie

1731,8

191

33369

1145,76

108

4.Charakterystyki opisowe zmiennych

4.1 Zmienna „Ludność”

Wykres rozrzutu dla zmiennej „Ludność” pokazano poniżej

0x01 graphic

W16 polskich województwach mieszka 38 666 800 osób. Natomiast średnia liczba ludności w województwie wynosi 2417 tyś, wielkość ta podana jest z odchyleniem standardowym tego estymatora +/- 309tyś. i zmienia się od najmniejszej 1022 tyś dla województwa lubuskiego do największej 5067tys. dla województwa mazowieckiego. Różnica więc jest bardzo duża, bo wynosi ponad 4 miliony. Daje to orientację cd możliwego wpływu polityczanego czy gospodarczego określonych regionów, np. jako polityk reprezentujący województwo miałabym różną siłę „przebicia” w państwie. Natomiast mediana, która dzieli szereg na dwie równe części pod względem liczebności dla tej zmiennej (inaczej wartość środkowa) wynosi:2154 i różni się od średniej arytmetycznej. Potwierdza to współczynnik zmienności, który wynosi aż 51,2%.

Rozkład parametru - „Ludność” przedstawia poniższy histogram:

0x01 graphic

Możemy z niego odczytać iż w dziesięciu województwach liczba ludności kształtuje się w przedziale od 900 tyś osób do 2100tyś osób i jest to najczęściej spotykana sytuacja w kraju. W czterech województwach natomiast liczba ludności mieści się w przedziale od 2200tyś osób do 3900tyś, są to województwa: dolnośląskie łódzkie małopolskie wielkopolskie. Największa liczba ludności kształtująca się w przedziale 4880 -5070 jest w  województwach: mazowieckim i śląskim .Dla polityki i demografii to dwa najważniejsze w Polsce regiony.

Przy pobieżnym wnioskowaniu z powyższego histogramu widać , że nie mamy do czynienia z normalnym rozkładem zmiennych, co oznacza że na rozkład zmiennej badanej miało kilka jednokierunkowo działających czynników ekonomicznych, politycznych i geograficznych, Spostrzeżenia tego nie potwierdzają jednak niezbyt duże wartości standaryzowanych współczynników skośności i kurtozy, które wynoszą: 1,7 dla skośności i 0,4 dla kurtozy. Popatrzmy więc na poniższy wykres, który przedstawia nam graficzny obraz dystrybuanty zlinaryzowanego rozkładu Gausa.

0x01 graphic

Wobec wątpliwości co do rozkładu przeprowadzę jeszcze test statystyczny.

Jak wykazuje test Shapiro- Wilksa przy poziomie istotności przekraczającym 5% nie ma podstaw do odrzucenia hipotezy, że zmienna ma rozkład normalny, potwierdza to również bardzo dobry test Z skośności.

Przedziały ufności dla zmiennej liczba ludności w Polsce

Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że średnia liczba ludności we wszystkich województwach jest nie większa niż 3076 tysięcy i nie mniejsza niż 1757 osób. Tak, więc rząd planując obowiązkowe szczepienia przeciwko broni bakteriologicznej musiałby przewidzieć w każdym województwie liczbę szczepionek w podanych wyżej granicach. Co oznacza, że przy średniej 2417 tyś szczepionek rezerwa musiałaby wynosić około +/- 659tyś.

.

Testowanie hipotez dla zmiennej „Ludność”

Średnia z próby wynosi 2417 tyś a mediana z próby wynosi 2154

Przeprowadzam test t-Studenta przyjmując hipotezę zerową, że średnia liczba ludności wynosi 2000 osób stawiając hipotezę alternatywną, że jest różna od 2000. Na poziomie istotności 5% nie mam podstaw do odrzucenia hipotezy, że średnio w województwie mieszka 2000 osób na rzecz hipotezyalternatywnej. Nawiązując do poprzedniego przykładu po przygotowaniu 2 mln. szczepionek ryzyko niezaszczepienia byłoby nie większe niż 5%. Trudności organizacyjne w przeprowadzeniu tej operacji na pewno przekroczyłyby tak niewielkie ryzyko.

    1. Zmienna „Nurse”

0x01 graphic

W polskich województw średnia geometryczna liczba ludności na pielęgniarkę wynosi 183 osoby i wielkość ta podana wyestymowana jest z błędem 4 i zmienia się od najmniejszej 156 dla województwa dolnośląskiego( najlepsza opieka nad chorym) do największej 211,0 dla województwa wielkopolskiego.(potencjalnie najsłabsza). Różnica więc jest całkiem mała bo wynosi 55. Co potwierdza 8% współczynnik zmienności. Natomiast mediana, dzieląca szereg na dwie równe części pod względem liczebności dla tej zmiennej (inaczej wartość środkowa) wynosi:182 i nie wiele różni się od średniej geometrycznej.

Rozkład parametru -zmiennej „Nurse” przedstawia poniższy histogram

0x01 graphic

Powyższy histogram ukazuje rozkład ludności na pielęgniarkę w szesnastu województwach Polski. Możemy z niego odczytać iż w czterech województwach liczba ludności na pielęgniarkę kształtuje się w przedziale od 150 osób do 180 osób, są to województwa: dolnośląskie, lubelskie podlaskie, śląskie, w siedmiu województwach : lubuskie, łódzkie, mazowieckie, opolskie, podkarpackie małopolskie, świętokrzyskie, liczba ludności przypadająca na pielęgniarkę kształtuje się w przedziale od 180 osób do 190 osób i jest to najczęściej spotykana sytuacja w kraju. W czterech województwach natomiast liczba ludności mieści się w przedziale od 190 osób do 200, są to województwa: kujawsko -pomorskie, warmińsko -mazurskie, zachodniopomorskie i pomorskie. Największa liczba ludności przypadająca na pielęgniarkę jest w  województwie wielkopolskim:

Współczynnik skośności wynosi dla tej zmiennej wynosi: -0,25, a współczynnik kurtozy-0,13 mamy więc do czynienia z niewielką asymetrią lewostronną i małą platokurtycznością. Oznacza to, że na takie rozłożenie się liczby ludności na pielęgniarkę miały wpływ czynniki: ekonomiczne polityczne i geograficzne i inne z których żaden nie miał przewagi oddziaływania nad innymi. Sprawdzam jeszcze na poniższym wykresie rozkład normalności.

0x01 graphic

Na przedstawionym wykresie normalności rozkładu można zauważyć, że dla zmiennej liczba ludności rozkład ten jest normalny - punkty rozmieszczone są w pobliżu linii prostej. W związku z tym nie będę już przeprowadzała testu nieparametrycznego.

Przedziały ufności dla zmiennej „Nurse”

Natomiast przedział ufności na poziomie 95% wynosi: [175;191].Widać więc ,że z takim prawdopodobieństwem mogę znając liczbę ludności w najbliższym rejonie ustalić liczbę pielęgniarek przypadającą na jedną osobę. W miasteczku 20 tysięcznym wyniesie ona od 104 do 114 pielęgniarek.

Testowanie hipotez dla zmiennej „Nurse”

Średnia geometryczna badanej zmiennej wynosi: 183.

Przeprowadzam test t-Studenta przyjmując hipotezę zerową, że średnia liczba ludności przypadająca na jedną pielęgniarkę wynosi 200 osób stawiając hipotezę alternatywną, że jest różna od 200. Nie odrzucam hipotezy zerowej dla alfa wynoszącego 0,05. Z ryzykiem błędu pierwszego rodzaju nie mam podstaw do odrzucenia hipotezy, że średnio w województwie przypada 200 osób na jedną pielęgniarkę na rzecz hipotezy, że w województwie średnio na jedną pielęgniarkę mniej lub więcej pielęgniarek. Nawiązując do poprzedniego przykładu 20-sto tysięcznym miasteczku burmistrz, który obdarowywuje wszystkie pielęgniarki twarzowymi czepkami o wartości 100zł musiałby wydać zaledwie 10 000 zł.

    1. Zmienna „Majątek” jednego mieszkańca w tys.

0x01 graphic

Dla 16 polskich województw średnia geometryczna wartość środków trwałych przypadających na jedną osobę wynosi 30,5tyś zł z błędem standardowym tego estymatora

1,3tyś. Wskaźnik ten przyjmuje wartości od najmniejszej 24tyś dla województwa podkarpackiego co jest spostrzeżeniem dość oczywistym do największej 46tyś zł dla województwa mazowieckiego, co również wydaje się zrozumiałe. Różnica więc jest całkiem duża bo wynosi. 22tyś .Obrazuje to rzeczywistą różnic w poziomie szeroko rozumianej infrastruktury. Natomiast mediana dla tej zmiennej wynosi: 30 tyś.

Rozkład parametru -przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie widzimy rozkład wartości środków trwałych przypadających na jednego mieszkańca w szesnastu województwach Polski. Możemy z niego odczytać iż w dziesięciu województwach wartość środków trwałych przypadająca na jednego mieszkańca kształtuje się w przedziale od 27 tys. do 31 tys. I jest to najczęściej spotykana sytuacja. W dwóch województwach: podkarpackim i kujawsko - pomorskim wartość środków trwałych kształtuje się od 23 tys. do 27 tys i oznacza skromny majątek. Największa wartość środków trwałych przypada na jednego mieszkańca w województwie mazowieckim. Stan ten jest to spowodowany czynnikami natury politycznej i ekonomicznej.

Współczynnik skośności wynosi dla tej zmiennej 3,41 a współczynnik kurtozy 4,66 Współczynniki te są duże co oznacza, iż badana zmienna nie ma rozkładu normalnego gdyż wykazuje asymetrię prawostronną oraz leptokurtozę.

Potwierdza ten fakt wykres normalności rozkładu.

0x01 graphic

Można na nim zauważyć, że dla zmiennej wartość brutto środków trwałych - punkty nie są rozmieszczone pobliżu linii prostej co potwierdza spostrzeżenie, że badana zmienna wykazuje asymetrię prawostronną. Także test Shapiro oraz test Z skośności potwierdzają to jednoznacznie.

4.4 Zmienna „Płace”

0x01 graphic

Dla 16 polskich województw średnia geometryczna wartość przeciętnego wynagrodzenia brutto wynosi 1161,19. Wielkość ta podana jest z odchyleniem standardowym (Błędem +/-) 30,31 i zmienia się od najmniejszej 1048,17 dla województwa podkarpackiego do największej dla województwa1524,11mazowieckiego. Różnica więc jest całkiem znacząca - wynosi. 475,94. Jednakże współczynnik zmienności wynosi tylko 10,5%. Mediana dla tej zmiennej przyjmuje wartość: 1125,88, niewiele więc różni się od średniej. Wykształceni politycy powinni więc posługiwać się medianą a nie średnią przy estymacji średnich zarobków.

Rozkład parametru -„Płaca” przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie widzimy rozkład wartości wynagrodzenia brutto przypadającego na jednego mieszkańca w szesnastu województwach Polski. Możemy z niego odczytać iż w czternastu województwach wynagrodzenie brutto kształtuje się w przedziale od 1000 tys. do 1200 tys. W województwie śląskim natomiast przeciętne wynagrodzenie brutto wynosi od 1300zł do 1400zł. Najwyższe wynagrodzenie brutto jest w województwie mazowieckim, gdyż kształtuje się w przedziale od 1500 zł do 1600zł. Jest to spowodowane czynnikami natury politycznej i ekonomicznej. W tym województwie mieści się stolica, która stanowi centrum gospodarcze, polityczne i naukowe Polski. W tym województwie obok najwyższych zarobków występują najwyższe koszty

Standardowy współczynnik skośności dla tej zmiennej wynosi 3,67. Natomiast współczynnik kurtozy wynosi 4,29, co oznacza, że badana zmienna nie ma rozkładu normalnego. W związku z tym nie będę już robiła pozostałych badań.

    1. Zmienna „Łóżko”

0x01 graphic

W 16 polskich województwach średnia geometryczna liczba pacjentów przypadających na jedno łóżko w szpitalu wynosi 180osób przy błędzie tej średniej +/- 7 osób i zmienia się od najmniejszej 108 dla województwa zachodnio-pomorskiego do największej 221 dla województwa podkarpackiego. Różnica więc jest całkiem mała bo wynosi 113 przy zmienności 15%. Dla tej zmiennej mediana wynosi: 183. Najczęściej powtarzająca się wartością dla liczby ludności na łóżko w szpitalu jest modalna, która wynosi183. Wszystkie te estymatory średniej nie różnią się między sobą.

Rozkład parametru - liczba osób na łóżko w szpitalu przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie widzimy rozkład liczby ludności na łóżko w szpitalu w szesnastu województwach Polski. Możemy z niego odczytać iż w  województwie zachodnio - pomorskim wynosi ona 108 osób. W województwach: dolnośląskim, lubelskim, łódzkim i śląskim na jedno łóżko w szpitalu przypada od 150 do 180 osób. W kolejnych siedmiu województwach : Lubuskim, małopolskim, mazowieckim, opolskim, podlaskim, pomorskim, wielkopolskim liczba ta zawiera się w przedziale od 181 do 200 osób na jedno łóżko. Najwyższa liczba ludności przypadająca na jedno szpitalne łóżko (od 201 osób do 225) jest w województwach: kujawsko - pomorskim, podkarpackim, świętokrzyskim i warmińsko - mazurskim

Standardowy współczynnik skośności dla tej zmiennej wynosi -2,06 a współczynnik kurtozy wynosi 2,05 .

0x01 graphic

Na przedstawionym wykresie normalności rozkładu można zauważyć, że dla zmiennej liczba ludności na łóżko w szpitalu - punkty rozmieszczone są w pobliżu linii prostej z wyjątkiem jednej położonej po lewej stronie od linii prostej co potwierdza tezę o niewielkiej asymeterii lewostronnej. Testy Shapiro oraz Z nie pozwalają na odrzucenie hipotezy o braku normalności.

Przedziały ufności dla zmiennej liczba ludności na łóżko w szpitalu

Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że średni wskaźnik osób przypadających na jedno łóżko jest nie większy niż 197 i nie mniejszy niż 168. W 20-sto tysięcznym miasteczku łóżek powinno się znajdować na poziomie ufności 95% od 101 do 119.

Testowanie hipotez dla zmiennej liczba ludności na łóżko w szpitalu

Średnia z próby wynosi183 a mediana z próby wynosi 185

Przeprowadzam test t-Studenta przyjmując hipotezę zerową, że średnia liczba pacjentów przypadająca na łóżko w szpitalu wynosi 200 osób stawiając hipotezę alternatywną, że jest różna od 200. Nie odrzucam hipotezy zerowej dla alfa wynoszącego 0,05. Tak więc mogę przyjąć z błędem 5%, że przeciętnie w Polsce na jedno łóżko przypada 200 pacjentów, czyli w krajowych szpitalach mamy 193334 łóżka, przy 5% błędzie tego stwierdzenia .

W tym rozdziale będę poszukiwać modelu regresji dla prognozy zmiennej objaśnianej, w tym celu przeprowadzę statystyczną weryfikację modelu przy uzasadnionym statystycznie wyborze zmiennych objaśniających oraz objaśnianych.Nie decyduje przy tym które z nich pełnią taką rolę ograniczając się do czysto mechanicznych obliczeń.

Poniższa tabela przedstawia analizę regresji dla wszystkich rozpatrywanych przeze mnie zmiennych, czyli liczby ludności, liczby ludności na pielęgniarkę, wartości brutto środków trwałych, przeciętnego wynagrodzenia brutto w zł. oraz .liczby ludności na łóżko w szpitalu.

Z zaznaczeniem istotności badanych modeli o najwyższej determinacji

„Ludność”

„Nurse”

„Majątek”

„Płaca”

„Łóżko”

„Ludność”

Nie ma zależności

Jest zależność P=0,0282

Jest zależność P=0,0000

Nie ma zależności

„nurse”

Nie ma zależności

Nie ma zależności

Nie ma zależności

Nie ma zależności

„Majątek”

Jest zależność P=0,0282

Nie ma zależności

Jest zależność P=0,0000

Nie ma zależności

„Płaca”

Jest zależność P=0,0000

Nie ma zależności

Jest zależność P=0,0000

Nie ma zależności

„Łóżko”

Nie ma zależności

Nie ma zależności

Nie ma zależności

Nie ma zależności

Wykresy dopasowanego modelu dla badanych zmiennych wykazujących zależności opisane poniżej przy największym współczynniku determinacji .Nie doszukując się związków przyczynowo skutkowych znajdują tylko cztery zależności co zaznaczono pogrubionym tekstem

Brak zależności w pozostałych przypadkach często przeczy sądom potocznym.

    1. Wykres dopasowanego modelu dla zmiennych: „Ludność” i „Majątek”

0x01 graphic

Powyższy wykres przedstawia liniową zależność liczby ludności od wartości brutto środków trwałych

Model ten jest istotny, gdyż p=0%. Dla regresji liniowej ;R- kwadrat (30%) można tłumaczy jaki jest procent zależności pomiędzy liczbą ludności a wartością brutto środków trwałych. Wyjaśnia to dobrana liczba regresji. Współczynnik korelacji dla tej funkcji wynosi: 0,55. Na podstawie tej analizy można wysnuć wniosek, że im wyższa jest wartość środków trwałych tym wyższa jest liczba ludności. Teza ta ma uzasadnienie gdyż im bardziej zasobne woj. tym więcej ludzi znajduje tu warunki do życia, pracy i wypoczynku

    1. Wykres dopasowanego modelu dla zmiennych: „Ludność” i „Płaca”

0x01 graphic

Poniższy wykres przedstawia hiperboliczną zależność liczby ludności od wartości przeciętnego wynagrodzenia. Model ten jest istotny, gdyż p=0%. ,R- kwadrat wynosi 71% co można tłumaczyć jako procent zależności pomiędzy liczbą ludności a  przeciętnym wynagrodzeniem. Współczynnik korelacji dla tej funkcji wynosi 84%.

    1. Wykres dopasowanego modelu dla zmiennych: „Majątek” i „Ludność”

0x01 graphic

Powyższy wykres przedstawia liniowa zależność wartości brutto środków trwałych od liczby ludności

Model ten jest istotny, gdyż p=0%, przy R- kwadrat 30% co można tłumaczy jaki jest procent zależności pomiędzy wartością brutto środków trwałych a liczbą ludności który wyjaśnia dobrana linia regresji. Współczynnik korelacji dla tej funkcji wynosi: 55%. Na podstawie tej analizy można wysnuć wniosek, że im jest wyższa jest liczba ludności tym liniowo rośnie wartość środków trwałych.

    1. Wykres dopasowanego modelu dla zmiennych: „Majątek” i „Płaca”

0x01 graphic

Poniższy wykres przedstawia zależność wartości brutto środków trwałych od wartości przeciętnego wynagrodzenia.

Model ten jest istotny, gdyż p=0%. Za pomocą funkcji liniowej R- kwadrat 73% można tłumaczyć jaki jest procent zależności pomiędzy wartością brutto środków trwałych a przeciętnym wynagrodzeniem. Wyjaśnia to dobrana liczba regresji. Współczynnik korelacji dla tej funkcji wynosi:0,856. Na podstawie tej analizy można wysnuć wniosek, że wartość brutto środków trwałych rośnie wraz ze wzrostem wynagrodzenia co znaczy,że zamożne społeczności woj. gospodarują na większym majątku.

(może Państwo znajdziecie bardziej pogłębione wnioski niż uczyniła to P.Joanna?)

    1. Wykres dopasowanego modelu dla zmiennych: „Płaca” i „Ludność”0x01 graphic

Poniższy wykres przedstawia paraboliczną zależność wartości przeciętnego wynagrodzenia od liczby ludności.

Model ten jest istotny, gdyż p=0%, przy wsp.determinacji 0,84. Współczynnik korelacji dla tej funkcji wynosi:71%. Na podstawie tej analizy można wysnuć wniosek, iż przeciętne wynagrodzeń rośnie wraz ze wzrostem ludności, dzieje się tak dlatego ,że duże woj. to także silniejsza gospodarka, wyższe wynagrodzenie i bardziej kwalifikowani pracownicyi co ciekawe wzrost ten jest nieliniowy.

    1. Wykres dopasowanego modelu dla zmiennych „Płaca” i „Majątek”

0x01 graphic

Poniższy wykres przedstawia zależność wartości przeciętnego wynagrodzenia od wartości brutto środków trwałych

Model ten jest istotny, gdyż p=0%. Za pomocą funkcji liniowej R- kwadrat 73,2% można tłumaczyć jaki jest procent zależności pomiędzy wartością brutto środków trwałych a przeciętnym wynagrodzeniem. Wyjaśnia to dobrana liczba regresji. Współczynnik korelacji dla tej funkcji wynosi:0,85. Na podstawie tej analizy można wysnuć wniosek, iż ludzie, którzy mieszkają w bogatszych woj. zarabiają więcej pieniędzy..

  1. Hierarchiczna analiza skupień

Podobnie jak w przypadku Skalowania Wielowymiarowego, punktem wyjścia do analizy są odległości pomiędzy obiektami (ewentualnie korelacje pomiędzy cechami). W tym przypadku bezpośrednim celem analizy nie jest odtworzenie wymiarów postrzegania, ale wskazanie grup obiektów podobnych i dalej - grup obiektów podobnych do innych grup itd. Analizując skład poszczególnych skupień można odtworzyć kryteria, na podstawie których obiekty zostały zgrupowane - a więc ustalić, jakie kryteria są istotne dla postrzegania danej grupy obiektów.

Za pomocą analizy skupień można także badać relacje pomiędzy badanymi (jednostkami obserwacji). W takim przypadku konstruuje się macierz odległości pomiędzy badanymi, zaś wynikiem analizy jest podział badanych na mniejsze grupy w taki sposób, że w jednej grupie badane zmienne są podobne do siebie ze względu na interesujące nas cechy.

0x01 graphic

Na powyższym dendrogramie województwa uplasowały się w 3 klastrach w zależności od wielkości parametrów. Do województw tworzących pierwsze skupienie należą: kujawsko-pomorskie, lubuskie, warmińsko-mazurskie, opolskie, zachodniopomorskie, świętokrzyskie, łódzkie, podkarpackie, małopolskie lubelskie, podlaskie i odróżniające się w tym klastrze województwo dolnośląskie, Drugi klaster tworzy województwo wielkopolskie. Natomiast województwa, które wyraźnie się wyróżniają na powyższym dendrogramie tworzące trzeci klaster to województwa: śląskie i mazowieckie. O odrębności tych dwóch województw zadecydowały uwarunkowaniami ekonomiczno-gospodarcze oraz czynniki natury politycznej. Województwa te są zamieszkiwane przez największą liczbę ludności, którą przyciągają najwyższe w Polsce zarobki.

  1. Zakończenie

Na podstawie wykonanej pracy mogłam się przekonać jak potężnym i przydatnym narzędziem jest statystyka. Dzięki niej można zaobserwować pewne prawidłowości występujące w zjawiskach masowych. Obecnie metody statystyczne znajdują coraz szersze zastosowanie w wielu dziedzinach wiedzy. Dzięki wykorzystaniu metod ilościowych i metod ściśle statystycznych do analizy złożonych problemów otaczającej nas rzeczywistości można usprawnić działania. Dzieje się tak, ponieważ metody te zwielokrotniają siłę poznawczą danej dyscypliny naukowej i pozwalają na wygodne, ścisłe i jednoznaczne oddawanie myśli za pomocą liczb. Korzystając z języka statystyki można nieporównywalnie dokładniej opisywać różnorodne zjawiska masowe, niż jakbyśmy próbowali uczynić to za pomocą słów.

0x01 graphic

0x08 graphic

22

0x01 graphic



Wyszukiwarka

Podobne podstrony:
analiza statystyczna poziomu zy poziom zycia w wojewodztwach id
Praca mag Analiza poziomu życia w poszczególnych województwach
Analiza poziomu życia w poszczególnych województwach
Analiza poziomu życia w poszczególnych województwach(1)
Analiza pionowa i pozioma sprawozdań finansowych
Analiza statystyczna praca
Przestępczość nieletnich w latach dziewięćdziesiątych w świetle analiz i statystyk policyjnych Szym
AnaLIZA STATYSTYCZNA 8 wykład6, 1
195444statystyka-Analiza stat., Analiza statystyczna jest ostatnim etapem badania statystycznego
AnaLIZA STATYSTYCZNA 8 wykład2, ANALIZA STATYSTYCZNA
AnaLIZA STATYSTYCZNA 8 wykład3, ANALIZA STATYSTYCZNA
Przedsiębiorstwo, analiza pionowa i pozioma bilansu (14 str
Analiza statystyczna chorych z algodystrofiÄ… Sudecka leczonych metodÄ… krioterapii
poziom zycia, Politologia, Polityka społeczna i gospodarcza

więcej podobnych podstron