Praca ze statystyki(1)


Praca ze Statystyki

Opracowanie wybranych danych statystycznych.

Dane charakteryzują liczbę uczniów w szkolnictwie w poszczególnych województwach.

Spis streści:

  1. Wstep 3

  2. Opis użytych danych 3

  1. Charakterystyka poszczególnych zmiennych 4

    1. Zmienna „ludność” 4

    2. Zmienna „ uczniowie w szkolnictwie podstawowym” 7

    3. Zmienna „ uczniowie w szkolnictwie gimnazjalnym” 10

    4. Zmienna „ uczniowie w szkolnictwie średnim ogólnokształcącym” 13

    5. Zmienna „uczniowie w szkolnictwie średnim zawodowym” 16

  2. Analiza regresji 19

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach podstawowych i ludność 20

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach

gimnazjalnych i szkołach podstawowych 21

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach

ogólnokształcących i ludność 21

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach średnich zawodowych i ludność 22

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach średnich zawodowych i ogólnokształcących

1. Wstęp

W poniższym zastawieniu podaję zmienne które będą analizowane w mojej pracy :

Moim zadaniem jest opracowanie tych pięciu zmiennych dla 16 województw Polski, znalezienie zależności między poszczególnymi zmiennymi oraz wyciągnięcie wniosków statystycznych.

Dane te zestawiono w poniższej tabeli:

Województwa

Ludność

Podstawowe

Gimnazja

Zawodowe

Ogólnokształcące

Dolnośląskie

2972,7

225,8

87,2

115,1

69,4

Kujawsko-pomorskie

2099,7

181,4

66,5

85,9

48,1

Lubelskie

2232,1

195,7

72,2

89,3

65,1

Lubuskie

1024,0

87,9

33,3

46,9

22,7

Łódzkie

2643,4

201,3

74,5

89,7

62,6

Małopolskie

3233,8

284,5

101,8

130,0

76,1

Mazowieckie

5072,3

400,0

147,4

169,2

137,3

Opolskie

1084,7

85,4

31,4

42,4

21,3

Podkarpackie

2128,6

201,8

72,7

99,9

50,1

podlaskie

1221,1

110,0

40,6

48,1

32,8

Pomorskie

2198,3

191,9

69,4

85,5

52,0

Śląskie

4847,6

369,1

139,9

197,5

101,3

Świętokrzyskie

1322,9

111,1

40,8

56,9

32,1

Warmińsko-mazurskie

1468,3

134,8

49,4

63,7

34,4

Wielkopolskie

3360,9

297,5

109,8

144,8

75,0

Zachodnio-pomorskie

1733,8

142,4

53,0

63,0

43,9

3. Charakterystyki poszczególnych zmiennych.

    1. Zmienna „ludność”

Wykres rozrzutu dla zmiennej „ludność”

0x01 graphic

W 16 polskich województwach zamieszkuje 38 644 200 osób. Średnia liczba ludności województwie wynosi 2415 tysięcy; odchylenie standardowe dla tego estymatora wynosi ± 1234 tysiące i zmienia się od najmniejszej wynoszącej 1024 tys. województwie Lubuskim do największej 50723 tysięcy w województwie mazowieckim. Różnica jest więc bardzo duża wynosi bowiem ponad 4 miliony i jest uwarunkowana występowaniem bogactw naturalnych, charakterem środowiska naturalnego oraz sposobem jego zagospodarowania oraz położeniem nad największymi rzekami w kraju, uprzemysłowieniem, a co za tym idzie dużym rynkiem pracy. Liczba ludności na danym terenie zależy również od produktywności ziemi, aktywności gospodarczej oraz ukształtowania zamieszkiwanego terenu. Ważnym czynnikiem jest to, że największe zagęszczenie ludności występuje w tych województwach, w których znajdują się miasta akademickie, gdzie po zakończeniu edukacji większość młodzieży zostaje na stałe. Daje to szerokie możliwości zarówno inwestowania jak i wywierania wpływów politycznych.

Mediana dzieląca szereg na dwie równe części pod względem liczebności dla tej zmiennej wynosi 2163 i różni się od średniej arytmetycznej. Potwierdza to współczynniki zmienności, który wynosi 51 %.

Rozkład parametru „ludność” przedstawia poniższy histogram:

0x01 graphic

Na podstawie przedstawionego histogramu można odczytać iż w 12 województwach liczba ludności kształtuje się w przedziale do 1024-2972 tysięcy osób; w czterech województwach liczba ludności mieści się w przedziale 2200-3900 tysięcy: woj. Małopolskie, Łódzkie, Dolnośląskie, Wielkopolskie. Największa liczba ludności mieszcząca się w przedziale 4888-5070 jest w woj. Mazowieckim i Śląskim. Są to dwa najbardziej rozwinięte pod względem gospodarczym regiony kraju i stanowią podstawę inwestycji i rozwoju przemysłowego. Patrząc na przedstawiony histogram możemy wnioskować, ze zmienna nie ma rozkładu normalnego. Jednak wartości standaryzowanych współczynników skośności i kurtozy nie są zbyt duże i wynoszą dla skośności - 1,6, dla kurtozy - 0,47.

Dla dokładniejszej analizy przedstawiono graficzny obraz dystrybuanty zlinaryzowanego rozkładu Gausa:

0x01 graphic

Przedziały ufności dla zmiennej Ludność

Na poziomie ufności 95 % (1-α =0.95) możemy stwierdzić, że średnia liczba ludności we wszystkich województwach jest nie większa niż 3072 tysięcy i nie mniejsza niż 1757 osób.

W obliczu zagrożenia atakiem bioterrorystycznym np. zakażenie wąglikiem należałoby zaplanować zabezpieczenie antybiotyków i szczepionek. I tak więc średnie zapotrzebowanie skutecznego antybiotyku jakim jest Ciprofloksacyna (op. 10 szt/500 mg) powinno wynosić 28983 tys. opakowań tego leku przy czym rezerwa musiałaby wynosić ±7892 tys. opakowań. Wyprodukowanie takiej ilości leku może stworzyć problemy techniczne związane z brakiem składników, czy mocy produkcyjnych przemysłu farmaceutycznego, należałoby poczynić kroki, aby temu zapobiec, zwłaszcza, że doniesienia mówią iż Polska nie jest do tego przygotowana.

Testowanie hipotez dla zmiennej „Ludność”

Średnia z próby wynosi - 2415 tyś a mediana - 2163.

W przeprowadzonym teście -Studenta przyjęto hipotezę zerową, ze średnia liczba ludności wynosi 2600 tys. osób, stawiając hipotezę alternatywną, że jest większa od 2600 tys. Na poziomie istotności 5 % , nie mam podstaw do odrzucenia tejże hipotezy, że średnio w województwie mieszka 2600 tys. osób na rzecz hipotezy alternatywnej. Kontynuując podany powyżej przykład możemy założyć iż nie przygotowanie antybiotyku dla 185 tys. ludności nie byłoby większe niż 5 %. Mogłyby natomiast. wystąpić trudności techniczne.

3.2 Zmienna „ uczniowie w szkolnictwie podstawowym”

Wykres rozrzutu dla zmiennej „ uczniowie w szkolnictwie podstawowym”

0x01 graphic

W polskich województwach średnia arytmetyczna uczniów w szkolnictwie podstawowym wynosi 201 tysięcy uczniów; z błędem 23 i zmienia się od najmniejszej wynoszącej 85 400 uczniów w województwie opolskim do 400 000 uczniów w województwie Mazowieckim. Różnica jest tutaj dosyć duża, i jest związana z powierzchnią województwa oraz zaludnieniem całkowitym w województwie. Potwierdza to współczynnik zmienności wynoszący 47 %. Mediana dzieląca szereg na dwie równe części pod względem liczebności dla tej zmiennej wynosi 193.

Rozkład parametru zmiennej „ uczniowie w szkolnictwie podstawowym” przedstawia histogram:

0x01 graphic

W/w histogram przedstawia nam rozkład uczniów w szkołach podstawowych przypadających na dane województwo. Możemy z niego odczytać iż w 6 województwach liczba uczniów zawiera się w przedziale od 85,4 tys. do 142,4 tys.; są to województwa: Opolskie, Lubuskie, Podlaskie, Świętokrzyskie, Warmińsko Mazurskie, Zachodniopomorskie.

W przedziale od 181, 4 tys. a 225,8 tys. uczniów znajduje się również 6 województw: Kujawsko Pomorskie, Pomorskie, Lubelskie, Łódzkie, Podkarpackie, Dolnośląskie. W 2 województwach liczba uczniów mieści się w przedziale 284,5 tys. a 297 tys. uczniów, a najwięcej uczniów przypada na województwa Śląskie i Mazowieckie i mieści się w przedziale369,1 tys. a 400 tys.

Standaryzowany współczynnik skośności dla tej zmiennej wynosi 1, 3(asymetria prawostronna),a standaryzowany współczynnik kurtozy wynosi - -0,04

Wykres normalności dla tej zmiennej:

0x01 graphic

Ponieważ są wątpliwości, czy zmienna ma rozkład normalny przeprowadzimy test statystyczny. W teście Shapiro-Wilksa W = 0,918829, przy poziomie istotności równym 0,16 oraz przy teście z skośności - 1,02przy poziomie istotności - 0,30 możemy stwierdzić, że nie ma podstaw do podrzucenia hipotezy, że zmienna ma rozkład normalny.

Przedziały ufności dla zmiennej liczba uczniów w szkołach podstawowych:

Na poziomie ufności 97 % (1-α=0,03) możemy stwierdzić, że średnia liczba uczniów w szkołach podstawowych jest nie większa niż 258,261 tys. i nie mniejsza niż 144,314tys. Z takim prawdopodobieństwem możemy ustalić liczbę szkół podstawowych zakładając, że średnio na jedna szkołę przypada 181 uczniów. Przy założeniach przedstawionych powyżej dla najwyższej średniej powinno być 1426 szkół w województwie, a dla najmniejszej średniej 797 szkół podstawowych. Przy czym trzeba założyć potrzebę utworzenia bądź likwidacji ±276 szkół.

Testowanie hipotez dla zmiennej liczba uczniów w szkołach podstawowych:

Średnia z próby wynosi 201,288 tys., a mediana 193,8 tys. Przeprowadzam Test t-Studenta. Przyjmując hipotezę zerową, że średnia liczba uczniów wynosi 258 tys. i stawiając hipotezę alternatywną, że jest większa niż 258 tys.; na poziomie istotności 5 % nie mamy podstaw do odrzucenia hipotezy zerowej, że średnio w szkołach podstawowych uczy się średnio 258 tys. uczniów na rzecz hipotezy alternatywnej. Zatem likwidacja nawet 1 szkoły w województwie przyniosłaby ujemne skutki dla uczniów (jakość usług, wydłużenie czasu dojazdu do szkoły).

3.3 Zmienna „ uczniowie w szkolnictwie gimnazjalnym”

Wykres rozrzutu dla zmiennej „ uczniowie w szkolnictwie gimnazjalnym”

0x01 graphic

W 16 polskich województwach w gimnazjach na początku roku szkolnego uczyło się 1189,9 tys. uczniów. Średnio uczyło się 74, 3687 uczniów z odchyleniem standartowym wynoszącym ±35, 3786 tys. i zmienia się od najmniejsze wynoszącej 31,4. tys. w województwie Opolskim do największej wynoszącej 147,4 tys. w woj. Mazowieckim. Różnica ta jest bardzo duża i jest związana z powierzchnią województw (woj. Opolskie jest najmniejsze, a Mazowieckie największe pod względem powierzchni) i oraz przyrostem naturalnym w poszczególnych woj., jest to związane również z reformą szkolnictwa.

Mediana dzieląca szereg na dwie równe części po względem liczebności wynosi 70,8 i jest różna od średniej geometrycznej co potwierdza współczynnik zmienności wynoszący ok. 47 %.

Rozkład parametru „ uczniowie w szkolnictwie gimnazjalnym” przedstawia histogram:

0x01 graphic

Na podstawie przedstawionego histogramu możemy odczytać, iż w 6 woj. liczba uczniów w gimnazjach kształtuje się w przedziale 31,4 tys a 53 tys.; w przedziale 66, 5 tys a 74,5 tys mieści się 5 województw, w przedziale 85,4 - 101,8tys. dwa woj.; w przedziale 109, 8 tys. jedno woj. Wielkopolskie i największa liczba dzieci w gimnazjach występuje w przedziale 139,9 a 147,4 w województwach Śląskim i Mazowieckim.

Wnioskując z powyższego histogramu możemy pobieżnie określić iż mamy tutaj do czynienia z normalnym rozkładem zmiennych.

Potwierdzają to niskie współczynniki: skośności - 0,8384079 (asymetria prawostronna) i kurtozy - 0,0106012

Poniżej przedstawiono graficzny obraz dystrybuanty zlinaryzowanego rozkładu Gausa.

0x01 graphic

Przeprowadzony test Shapiro-Wilksa przy poziomie istotności przekraczającym 5 % wykazuje iż nie ma podstaw do odrzucenia hipotezy że zmienna ma rozkład normalny.

Przedziały ufności dla zmiennej „ uczniowie w szkolnictwie gimnazjalnym

Na poziomie ufności 95% (1-α) =0,95) możemy stwierdzić iż średnia uczniów w szkołach gimnazjalnych we wszystkich województwach nie jest większa niż 93 tysiące nie jest mniejsza niż 56 tysięcy i uczniów. Planując program dożywiania uczniów przyjmując, ze średnio wśród uczniów szkół gimnazjalnych 4 tys. uczniów na województwo wymaga dożywiania. Możemy przyjąć iż ta liczba będzie pomiędzy 5 tysięcy a 3 tysiące uczniów ±2 tysiące uczniów. Może to stanowić podstawę do utworzenia rezerwy w budżecie na dożywianie uczniów w tym sektorze.

Testowanie hipotez dla zmiennej „ uczniowie w szkolnictwie gimnazjalnym

Średnia z próby wynosi 74,3687, zaś mediana z próby równa się 70,8

W przeprowadzonym teście t-Studenta przyjmując, że hipoteza zerowa, że średnia liczba uczniów wynosi 80, oraz stawiając hipotezę alternatywną, że jest większa od hipotezy zerowej; przy poziomie istotności 0,05 nie mamy podstaw do odrzucenia hipotezy zerowej, że średnio w województwie w szkołach gimnazjalnych uczy się 80 tys. na rzecz hipotezy alternatywnej. Możemy tutaj przyjąć z błędem 5 %, że średnio w szkołach gimnazjalnych uczy się 80 tysięcy uczniów, czyli średnio 4,3 tys. uczniów w szkołach gimnazjalnych w Polsce wymaga dożywiania.

    1. Zmienna „ uczniowie w szkolnictwie średnim ogólnokształcącym”

Wykres rozrzutu dla zmiennej „ uczniowie w szkolnictwie średnim ogólnokształcącym”

0x01 graphic

W 16 województwach średnia geometryczna uczniów w szkołach ogólnokształcących wynosi 57, 7625 tys. i jest wyliczona z błędem 7. Wielkość ta zmienia się od największej wynoszącej 137, 3 tys. w woj. Mazowieckim do najmniejszej - 21, 3 tys. uczniów w woj. Opolskim. Wielkości te są tak samo opisywane w charakterystyce zmiennej „ uczniowie w szkołach gimnazjalnych”. Myślę, że jest to spowodowane tymi samymi czynnikami.

Znaczną różnicę w wielkościach potwierdza współczynnik zmienności wynoszący ponad 50 % (52,5 %). Mediana, która dzieli szereg na dwie równe części pod względem liczebności dla tej zmiennej wynosi 51, 05 i jest zbliżona do średniej geometrycznej dla tej zmiennej.

Rozkład parametru „uczniowie w szkolnictwie średnim ogólnokształcącym

0x01 graphic

Histogram przedstawia rozkład uczniów w szkołach ogólnokształcących w 16 województwach Polski. Możemy z niego odczytać, iż w 6 województwach liczba uczniów mieści się w przedziale 50,1 tys. a 76,1 tys.; w 5 województwach pomiędzy 32,1 tys. a 48,1 w trzech pomiędzy 75 tyś. a 137 tys. są to woj. Wielkopolskie, Śląskie i Mazowieckie. ; w dwóch 21-22 tys. uczniów i są to woj. Opolskie i Lubuskie.

Współczynnik skośności dla tej zmiennej wynosi 2 , a współczynnik kurtozy równa się 1,5 i nie są one zbyt wysokie Mamy więc do czynienia z skośnością prawostronną.

Sprawdzenie powtórne na wykresie rozkładu normalności:

0x01 graphic

Na przedstawionym wykresie większość punktów jest rozmieszczonych w pobliżu linii prostej z wyjątkiem jednego położonego po prawej stronie od linii prostej co potwierdza tezę o asymetrii prawostronnej.

Przeprowadzone testy Shapiro-Wilksa oraz Z nie pozwalają na odrzucenie hipotezy, że zmienna ma rozkład normalny.

Przedziały ufności dla zmienna „ uczniowie w szkolnictwie średnim ogólnokształcącym”

Na poziomie ufności równym 95% (1-α) możemy stwierdzić, że średni wskaźnik uczniów w szkołach ogólnokształcących jest nie większy niż 74 tys. i nie mniejszy niż 41,5 tys. Organizując pracownie komputerowe w szkołach przy założeniach, że średnio w Polsce jest 137 liceów ogólnokształcących, na które przypada ok. 450 uczniów można założyć iż potrzeba by było średnio 274 pracownie na województwo liczące po 60 komputerów każda. Stworzyłoby to możliwości dla firm komputerowych uzyskania korzystnego kontraktu finansowanego przez Ministerstwo Edukacji Narodowej.

Testowanie hipotez dla zmiennej „ uczniowie w szkolnictwie średnim ogólnokształcącym

Średnia z próby jest równa 57,7625, a mediana z próby wynosi 51,05

W przeprowadzonym teście t-Studenta przyjąłem hipotezę zerową, że średnia liczba uczniów w szkołach ogólnokształcących wynosi 60 tys. oraz postawiłem hipotezę alternatywną, że jest ona różna od 60 tys. Nie odrzucam hipotezy zerowej dla α wynoszącego 0,05. Mogę przyjąć, że z błędem 5 % w Polsce, że na 60 tys. uczniów konieczne by było utworzenie 266 pracowni komputerowych.

3.5 Zmienna „uczniowie w szkolnictwie średnim zawodowym”

Wykres rozrzutu dla zmiennej „uczniowie w szkolnictwie średnim zawodowym”

0x01 graphic

W polskich województwach średnia geometryczna uczniów w szkołach średnich zawodowych wynosi 86,2 tys. i jest podana z błędem 11. Zmienia się od najmniejszej wynoszącej 42,4 tys. w woj. Opolskim do największej wynoszącej 197,5 tys. w woj. Śląskim. Największa liczba w województwie Śląskim świadczy o tym , że młodzież częściej wybiera naukę w szkołach zawodowych, aby szybciej zdobyć zawód. Mediana inaczej wartość środkowa dzieląca szereg na dwie równe części pod względem liczebności wynosi 87,6 i niewiele różni się od średniej geometrycznej.

Rozkład parametru zmiennej „uczniowie w szkolnictwie średnim zawodowym” został przedstawiony na poniższym histogramie:

0x01 graphic

Na podstawie przedstawionego histogramu możemy odczytać iż w 12 województwach liczba uczniów w szkołach średnich zawodowych kształtuje się pomiędzy 42,4 tys. uczniów a 115,1 tys.; w pozostałych czterech liczba ta kształtuje się pomiędzy130, 0 tys. a 197, 5 tys. uczniów w województwach Małopolskim, Wielkopolskim, Mazowieckim i Śląskim.

Współczynnik skośności dla tej zmiennej wynosi 0,9, a współczynnik kurtozy =0,1

Mamy więc do czynienia z niewielką asymetrią prawostronną .

Wykres normalności dla tej zmiennej:

0x01 graphic

Na przedstawionym wykresie normalności rozkładu dla zmiennej uczniowie w szkołach średnich zawodowych rozkład ten jest normalny, gdyż punkty rozmieszczone są w pobliżu linii prostej.

Przedziały ufności dla zmiennej uczniowie w szkołach średnich zawodowych

Na poziomie ufności 95 % (1-α =0,95) możemy założyć liczba uczniów w szkołach zawodowych jest nie mniejsza niż 71 tys. i nie większa niż 120 tys. Na podstawie tej analizy dla województwa, w którym liczba uczniów w szkołach zawodowych wynosi ok. 71 tys. powinno się przygotować tyleż samo miejsc do odbywania praktyk zawodowych.

Testowanie hipotez dla zmiennej uczniowie w szkołach średnich zawodowych

Średnia z próby wynosi 95, 4 tys. natomiast mediana 87,6.

W przeprowadzonym teście t-Studenta przyjęłam hipotezę, że średnia liczba uczniów w szkołach średnich zawodowych wynosi 100 tys. postawiłem hipotezę alternatywną, że jest ona większa od 100 tys. Nie mam podstaw do odrzucenia tej hipotezy, że średnio w województwie jest 100 tys. uczniów na rzecz hipotezy alternatywnej że jest ich mniej niż 100 tys. lub więcej. Możemy tutaj przyjąć iż średnio konieczne jest przygotowanie 100 tys. miejsc do odbywania praktyk zawodowych przy założeniu 5 % błędu.

Poszukujemy mechanizmu powiązań miedzy zmiennym analizowanymi w tej pracy. W tym celu przeprowadzę analizę regresji prostej przyporządkowywując wartości zmiennych objaśnianych (zależnych) konkretnym wartościom zmiennych objaśniających (niezależnych).

Poniżej w tabeli przedstawiam analizę regresji dla wszystkich analizowanych zmiennych:

Uczniowie - podstawowe

Uczniowie gimnazja

Uczniowie szkoły średnie zawodowe

Uczniowie szkoły ogólnokształcące

Ludność

Uczniowie - podstawowe

Brak

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Uczniowie gimnazja

Jest zależność

P=0,0000

Brak

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność P=0,0000

Uczniowie szkoły średnie zawodowe

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Brak

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Uczniowie szkoły ogólnokształcące

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność P=0,0000

Brak

Jest zależność

P=0,0000

Ludność

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Jest zależność

P=0,0000

Brak

Na podstawie przeprowadzonej analizy wszystkie dane mają istotność o największej determinacji.

Do dalszej analizy wybiorę 5 zależności.

4.1 Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach podstawowych i ludność

0x01 graphic

Najlepszym modelem opisującym zależność uczniów w szkołach podstawowych od liczby ludności jest model iloczynowy, którego wzór przedstawia się następująco:

Y = a*X^b, gdzie a jest równe -2,08864, b =0,949904. P = 0,0000.

R-kwadrat tłumaczy 98%, zależności uczniów w szkołach podstawowych od ludności. Współczynnik korelacji jest równy 99%. Na podstawie tej analizy możemy wyciągnąć wniosek, że im jest większa liczba ludności, tym więcej dzieci rozpoczyna naukę w szkołach podstawowych. Jest to jak najbardziej uzasadnione, gdyż przyrost naturalny niewątpliwie wpływa na to ile dzieci rozpocznie naukę.

4.2 Wykres dopasowanego modelu dla zmiennych :uczniowie w gimnazjach i uczniowie w szkołach podstawowych

0x01 graphic

Przedstawiony wykres przedstawia model podwójnie odwrotnościowy opisujący najdokładniej zależność pomiędzy uczniami w szkołach podstawowych i w szkołach gimnazjalnych. Wzór dla tego modelu wynosi: Y = 1/(a + b/X), gdzie a = 0,000130164, b = . 2,68518. R kwadrat = 99,863 procent tłumaczy 99 % zależności pomiędzy tymi danymi. Możemy tutaj wnioskować iż liczba uczniów w szkołach gimnazjalnych zależy od liczby uczniów w szkołach gimnazjalnych; jest to uzasadnione ponieważ wszyscy uczniowie, którzy ukończą edukację w szkole podstawowej muszą kontynuować naukę w szkołach gimnazjalnych.

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach ogólnokształcących i ludność

0x01 graphic

Powyższy wykres przedstawia iloczynową zależność uczniów w szkołach ogólnokształcących od ludności. Model ten istotny p =0%. R kwadrat dla tej regresji wynosi 96 % i tłumaczy jaki jest procent zależności pomiędzy liczbą ludności a uczniami w szkołach ogólnokształcących.

Można wnioskować iż im większa jest liczba ludności tym więcej młodych ludzi po ukończeniu szkoły gimnazjalnej decyduje się na naukę w szkołach ogólnokształcących. Liczba ta zależy od miejsca zamieszkania ludności (wieś - miasto). Współczynnik korelacji dla tej funkcji wynosi 0,98.

4.4 Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach średnich zawodowych i ludność

0x01 graphic

Powyższy wykres przedstawia iloczynową zależność uczniów w szkołach ogólnokształcących od ludności. Model ten istotny p =0%. R kwadrat dla tej regresji wynosi 96 % i tłumaczy jaki jest procent zależności pomiędzy liczbą ludności a uczniami w szkołach średnich zawodowych.

Można tutaj wnioskować iż liczba ludności ma wpływ na liczbę uczniów w szkołach średnich zawodowych. Jest ona większa w środowiskach wiejskich, gdzie młodzież chce zdobyć zawód się, ażeby jak najszybciej się usamodzielnić. Współczynnik korelacji dla tej funkcji wynosi 0,98.

    1. Wykres dopasowanego modelu dla zmiennych: uczniowie w szkołach średnich zawodowych i uczniowie w szkołach średnich ogólnokształcących

0x01 graphic

Najlepszym modelem opisującym zależność uczniów w szkołach średnich zawodowych od uczniów w szkołach ogólnokształcących jest model podwójnie odwrotnościowy, którego wzór jest taki: Y = 1/(a + b/X), gdzie a jest równe 0,00226442 , a b 0,476385. R kwadrat dla tej funkcji wynosi 91 %, co tłumaczy 91 procent zależności pomiędzy uczniami w szkołach średnich zawodowych a uczniami w szkołach ogólnokształcących. Współczynnik korelacji jest równy 0,95. Można tutaj wysnuć wniosek, że im więcej uczniów podejmuje naukę w szkołach ogólnokształcących, tym mniej rozpoczyna naukę w szkołach średnich zawodowych. Szkoły ogólnokształcące dają większą możliwość kształcenia w szkołach wyższych, a przez to dostania lepszej pracy.

  1. Hierarchiczna analiza skupień

Celem jest wskazanie grup, obiektów tworzących skupienia ze względu na podobieństwo. Następnie analizując skład poszczególnych skupień możemy odtworzyć kryteria, wg których dane obiekty zostały zgrupowane, a które są istotne dla postrzegania danej grupy.

Konstruujemy macierz odległości pomiędzy elementami, następnie otrzymujemy podział badanych zmiennych na grupy, w taki sposób, że w poszczególnych skupieniach występują podobne cechy.

0x01 graphic

Na przedstawionym dendogramie poszczególne województwa zostały zgrupowane w 2 klastrach w zależności od rozpatrywanych parametrów.

Najbardziej wyróżniającym się skupieniem jest to zawierające dwa województwa: Mazowieckie i Śląskie, w następnym pozostałe województwa.

Wyróżnienie województw Mazowieckiego i Śląskiego jest spowodowane tym, iż obszary te są najbardziej zaludnione, przez co jest w nich największa liczba uczniów w poszczególnych szkołach.

6. Zakończenie

W powyższej pracy starałem się scharakteryzować pięć zmiennych , wskazać korelacje występujące między nimi , przedstawić czynniki (natury ekonomicznej, społecznej, politycznej, geograficznej i historycznej) kształtujące wartości zmiennych w poszczególnych subregionach. Otrzymane wyniki próbowałem odnieść do możliwych problemów w badanej zbiorowości.

Pisząc tą pracę dowiedziałem się jak ważnym narzędziem jest Statystyka - nauka zajmująca się ilościowymi metodami badania prawidłowości zjawisk (procesów) masowych. Jej celem jest poznanie występujących prawidłowości, ich ilościowe wyrażenie oraz wyodrębnienie w nich składnika systematycznego i przypadkowego.

WYŻSZA SZKOŁA ZARZĄDZANIA I BANKOWOŚCI W KRAKOWIE

2



Wyszukiwarka

Podobne podstrony:
praca ze statystyki
Praca ze statystyki, NOWE !!!
Praca zaliczeniowa ze statystyki i demografii
Praca kontrolna ze statystki, statystyka
Praca zaliczeniowa ze statystyki i demografii
Egzamin II ze statystyki luty 2007
ANOVA - A - powtarzane pomiary (2), SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
ANOVA-AB-interakcja 1, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
zadania ze statystyki cz 2
Metodologia ze statystyką kurs zaawansowany
egzamin ze statystyki, Statystyka opisowa
ANOVA-AB-interakcja 2, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
Egzamin ze statystyki, PK, Statystyka
Pytania - Statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
pytania ze statystyki
Egzamin z Metodologii ze statystyk kurs podstawowy
Zadania ze statystyki cz5 związki między zmiennymi

więcej podobnych podstron