Praca ze statystyki, NOWE !!!


0x08 graphic

Analiza wybranych danych statystycznych

charakteryzujących poziom życia w subregionach

Spis treści:

Praca ze Statystyki -strona tytułowa 1

1. Spis treści.......................................................................................................................... 2

2. Wprowadzenie................................................................................................................... 3

3. Opis użytych danych......................................................................................................... 3

  1. Charakterystyki poszcególnych zmiennych ................................................................... 4

4.1 Zmienna „Ludki”........................................................................................................... 4

4.2 Zmienna „Powierzchnia”............................................................................................... 7

4.3 Zmienna „Crime”.......................................................................................................... 9

4.4 Zmienna „Police”.......................................................................................................... 12

4.5 Zmienna „Bezrobocie”................................................................................................. 15

  1. ANALIZA REGRESJI ................................................................................................ 17

5.1 Wykres dopasowanego modelu dla zmiennych: „Powierzchnia” i „Ludki” ........... 18

5.2 Wykres dopasowanego modelu dla zmiennych: „Bezrobocie” i „Ludki” ................19

5.3 Wykres dopasowanego modelu dla zmiennych: „Crime” i „Police”.........................20

5.4 Wykres dopasowanego modelu dla zmiennych: „Crime” i „Bezrobocie” ................20

    1. Wykres dopasowanego modelu dla zmiennych: „Ludki” i „Bezrobocie”................ 21

6. HIERARCHICZNA ANALIZA SKUPIEŃ ............................................................. 22

  1. ZAKOŃCZENIE..................................................................................................................... 23

0x08 graphic

Przedmiotem pracy jest analiza poniższych danych statystycznych:

Moje zadanie polega na opracowaniu powyższych zmiennych dla subregionów Polski, dostrzeżeniu i wskazaniu zależności, korelacji między poszczególnymi zmiennymi oraz zbudowaniu wniosków statystycznych. Zmienne te poddam analizom w celu zminimalizowania stopnia niepewności. Przetworzenie statystyczne danych oraz ich graficzną ilustrację uzyskam korzystając z programu stworzonego dla celów statystycznych o nazwie: SG PLUS.

0x08 graphic

POWIE-

RZCHNIA

LUDKI

CRIME

POLICE

BEZROBOCIE

jeleniogórsko-wałbrzyski

10371

1387,7

365,5

59,3

23,7

legnicki

4149

515,5

440,3

56,6

19,3

wrocławski

5135

435,6

187,4

66,6

19,3

bydgoski

8913

1034,5

352,5

51,4

17,9

toruńsko-wrocławski

9057

1065,2

316,2

54,7

20,4

białskopodlaski

5977

321

246,1

63,2

14,8

chełmsko-zamojski

9290

680,6

220

66,7

14,7

lubelski

9847

1230,4

258,2

59,3

13,4

gorzowski

6107

385,1

442,3

61,8

19,5

zielonogórski

7877

638,9

388,3

54,1

22,4

łódzki

8725

957,2

223,9

51,6

16,7

piotrkowsko-skierniewicki

9200

892,9

216,3

48,7

16,3

krakowsko-tarnowski

7327

1392,9

223,6

55,9

13,4

nowosądecki

7490

1099,4

182,3

58,1

14,8

ciechanowsko-płocki

7778

646,6

222,5

55,3

19,1

ostrołęcko-siedlecki

12098

772,5

229,9

52,8

15,9

warszawski

8138

1290

294,7

37,3

10,8

radomski

7071

752,8

261,2

52,9

20,3

opolski

9412

1084,7

281,1

59,2

15,7

rzeszowsko-tarnobrzeski

7512

1168,6

186,1

56,8

15,2

krośnieńko-przemyski

10414

960

135

65,7

17,3

białostocko-suwalski

14871

903,9

290,4

55,6

12,9

łomżyński

5309

317,3

230,1

56

16,3

słupski

8185

490

330,1

45,9

26,4

gdański

9693

954,5

288,1

51,9

20,1

północnośląski

5846

1049,1

276,2

48,9

14,6

południowośląski

5232

1695,1

257,9

51,3

11,6

centralny śląski

1216

2103,4

440,5

43

13,1

świętokrzyski

11691

1322,9

250,5

61,3

16,6

elbląski

7525

546,2

296,2

54,6

27,1

olsztyński

10332

628,6

378

49,3

22,4

ełcki

6346

293,5

325,1

60

31,1

pilski

6458

411,8

291,3

58

19,1

poznański

11521

1127,1

226,3

56,4

10,8

kaliski

7147

806

183,4

62,4

15,3

koniński

4439

441

237,6

56,5

19

szczeciński

12498

1118,9

446,7

43,3

17,4

koszaliński

10404

615

364,1

55,6

26,9

0x08 graphic

4.1 Zmienna „Ludki”

Wykres rozrzutu dla zmiennej „Ludki”

0x01 graphic

We wszystkich subregionach Polski mieszka 38 mln. osób. Średnia liczba ludności w każdym podregionie wynosi 882,5 tyś, natomiast mediana (inaczej wartość środkowa) jest równa 898,4 i różni się od średniej arytmetycznej nieznacznie. Średnia jest podana z odchyleniem standardowym +/- 65,9131tyś. i zmienia się od najmniejszej 293,5 tyś dla subregionu ełckiego do największej 2103,4tys.dla centralnego śląska. Różnica więc jest duża, bo wynosi 1809,9. Takie dysproporcje wynikają z uwarunkowań ekonomicznych, politycznych, geograficznych. Ludzie migrują w poszukiwaniu pracy , możliwości rozwoju intelektualnego (studia) także ukształtowanie terenu odgrywa w tym względzie istotną rolę. Centralny Śląsk wskazany przeze mnie jako subregion o najwyższej liczbie ludności od niepamiętnych czasów był ważnym regionem o znaczeniu przemysłowym (G.O.P), zapewniając zatrudnienie licznym rzeszom ludzi (stopa bezrobocia w 2000 roku była stosunkowo niska- 13%). Choć ostatnie lata spowodowały znaczne pogorszenie się warunków gospodarczych w analizowanym obszarze. Skutki załamanie się polskiego górnictwa uwidacznia znaczny wzrost bezrobocia w tym regionie . W ramach programu G.S.P górnicy otrzymali po 40 000 zł jednak pieniądze te nie są w stanie zrekompensować stałej płacy. Jako ciekawostkę podam iż rocznie Polska eksportuje węgiel o łącznej wartości 175 mln.USD! Analizując przyczyny wysokiego wskaźnika zaludnienia w centralnym śląsku można również sięgnąć do faktów sprzed 50 lat kiedy to fala repatriantów ówczesnego ZSRR a także liczne rzesze ludności południowej Polski migrowały na zachód . Trasy te przebiegały przez cały kraj lecz należy zaznaczyć iż 2 z największych biegły w pobliżu centralnego Śląska. Na pewno więc część migrantów zwabiona dobrymi perspektywami osiedliła się na tym terenie (G.O.P brylował bowiem w hutnictwie, przemyśle maszynowym i metalowym ,wiele innych gałęzi przemysłu było także jego domeną, zapewniając liczne miejsca pracy). Przywołałam te odległe fakty ponieważ uważam iż mogły mieć wpływ na kształtowanie się rozłożenia ludności w Polsce. Obecnie napływ ludności na 10 000 osób na terenie centralnego śląska wynosi 0-5. Dla kontrastu przywołam subregion ełcki, w którym odnotowano najniższą liczbę ludności -293,5 tyś. Jest on zdeterminowany przez wysoką stopę bezrobocia na tym terenie wynoszącym aż 31%. Ludzie nie mając możliwości bytu ze względu na brak pracy przenoszą się do subregionów o niższej stopie bezrobocia (odpływ ludności na 10 000 mieszkańców subregionu ełckiego jest najwyższy i wynosi 5-20 osób) . Warunki naturalne (średnio lub mało korzystne ) wykluczają prowadzenie działalności rolniczej a minimalnie rozwijający się przemysł powoduje niemożność zatrudnienia w tej branży.

Rozkład parametru - „Ludki” przedstawia poniższy histogram:

0x01 graphic

Na podstawie analizy powyższego histogramu możemy wyciągnąć wnioski na temat rozłożenia liczebności ludności w poszczególnych subregionach. Czyli można odpowiedzieć na pytanie o przesłanki zróznicowania Wykres wskazuje iż w dwunastu subregionach liczba ludności zawiera się w przedziale od 400- 700 tyś. osób i jest to najczęściej występująca sytuacja w kraju. Natomiast w jedenastu subregionach liczba ta wynosi od 1000-1400 tyś. Największa liczba osób 2100-2400 tyś. występuje w centralnym śląsku (obszarze o dużym znaczeniu ekonomicznym o czym szerzej napisałam przy okazji

analizy wykresu rozrzutu ludności ).Należy zauważyć iż powyższy histogram ilustruje wysoki stopień zróżnicowania potencjału ludnoścowego. O dysproporcjach tych decydują takie czynniki jak poziom rozwoju cywilizacyjnego ,gospodarczego stopa bezrobocia, warunki naturalne ,ukształtowanie terenu itp.

Wykres normalności rozkładu dla zmiennej ,,Ludki”

0x01 graphic

Jak widać na załączonym rysunku wykres ten jest zbliżony do normalnego ,punkty rozmieszczone są wzdłuż linii prostej (wartości standardowych współczynników skośności i kurtozy poniżej 2). Aby poprzeć tą tezę przedstawię dodatkowo wykres gęstości, który przypomina krzywą Gaussa.

0x01 graphic

Przedziały ufności dla zmiennej ,,Ludki”

Na poziomie ufności 95 % możemy stwierdzić, że średnia liczba ludności we wszystkich subregionach jest nie większa niż 1 016 tysięcy i nie mniejsza niż 749 tyś. osób. Tak, więc Minister Zdrowia zarządzając obowiązkowe szczepienia przeciwko żółtaczce typu B musiałby w każdym subregionie zakupić ilość szczepionek w podanych wyżej granicach. Co oznacza, że przy średniej 883 tyś szczepionek rezerwa musiałaby wynosić około +/- 134 tyś.

.

Testowanie hipotez dla zmiennej „Ludki”

Dzięki testowi t-studenta mogłam postawić hipotezę zerową iż średnia liczba ludności w subregionie wynosi 1mil oraz hipotezę alternatywną iż liczba ta jest mniejsza niż 1mil. Przy średniej z próby o wartości 883tyś okazało się że nie należy odrzucać H0 dla poziomu istotności alfa=0,01. Na podstawie powyższych danych możemy zbudować wniosek iż przy koszcie 1 szczepionki przeciwko żółtaczce typu B w wysokości 20 zł należałoby wydać 5 mil zł jeśli rząd zdecydowałby się refundować tą szczepionkę co 4 osobie w każdym subregionie.

    1. Zmienna „Powierzchnia”

Wykres rozrzutu dla zmiennej ,,Powierzchnia”

0x01 graphic

Zaprezentowany wykres rozrzutu jest odzwierciedleniem rozkładu powierzchni w km2. Średnia powierzchnia subregionu wynosi 8174 km2 , wartość minimalna jest równa 1216 km2 i odnosi się ona do centralnego Śląska natomiast wartość maksymalna 14871 km2 i opisuje ona region białostocko-suwalski. Na bazie powyższych danych można spostrzec iż różnica wielkości skrajnie małego i dużego subregionu jest znaczna ( 13655 km2 ). W tym miejscu odwołam się do przyczyn jak w poprzednim podrozdziale.

Rozkład parametru -zmiennej „Powierzchnia” przedstawia poniższy histogram

0x01 graphic

Powyższy histogram ukazuje powierzchni w 38 subregionach Polski. Należy zaznaczyć iż rozkład ten jest prawie symetryczny (wartości: średniej, mediany i dominanty są zbliżone). Możemy z niego odczytać iż w 13 subregionach powierzchnia w km 2 zamyka się w przedziale od 7 -9tyś. i jest to najczęściej spotykana sytuacja w kraju. Subregionem o najmniejszej powierzchni 0-2 tyś. jest centralny śląsk natomiast subregionem o największej powierzchni 14-16 tyś. jest białostocko-suwalski. Współczynnik skośności wynosi dla tej zmiennej wynosi: 0,005 a współczynnik kurtozy 0,751.

Wykres normalności rozkładu dla zmiennej ,,Powierzchnia”

0x01 graphic

Powyższy wykres przedstawia normalny rozkład zmiennej ,,Powierzchnia” , punkty układają się wzdłuż linii prostej a standardowe współczynniki skośności i kurtozy mają wartości poniżej 2. Idealny wykres gęstości jak w rozkładzie Gaussa potwierdza normalność .

0x01 graphic

Przedziały ufności dla zmiennej „Powierzchnia”

Przedział ufności na poziomie 95% wynosi [7298;9049]. Średnia ma wartość 8174 km2 +/-876. Jeśli więc w każdym subregionie minister Ochrony Środowiska zarządziłby posadzenie drzew na powierzchni 10 m 2 na każdym kilometrze 2 w ramach propagowania to zalesimy od 73-90 h lasu co i tak stanowiłoby tylko wzrost o ok. 1%.W okresie powojennym zalesienie kraju wzrosło o 6% i nadal będzie rosnąć gdyż coraz mniej gruntów ornych trzeba do wyżywienia Polaków a las stanowi ważny czynnik równowagi w przyrodzie.

Testowanie hipotez dla zmiennej „Powierzchnia”

W niniejszym podrozdziale przeprowadzam test t-Studenta przyjmując hipotezę zerową, iż średnia powierzchnia subregionu wynosi 9 224 km2 zaś hipoteza alternatywna mówi, że powierzchnia ta jest mniejsza niż 9 224 km2. Przy średniej z próby równej 8174 dowiodłam

iż nie należy odrzucać H0 przy alfa=0,01. Na podstawie wyżej udowodnionej tezy i znajomości historii możemy stworzyć hipotetyczną sytuację. Cofnijmy się do osławionej daty 1772 roku gdy 3 mocarstwa ograbiły Polskę z 211 tyś km2 ziemi. W przełożeniu na współczesne realia rozbiór ten spowodowałby pomniejszenie każdego subregionu o 5 553

km2 co stanowiłoby 60% średniej powierzchni Polski podczas gdy zagrabione tereny w XVIII wieku stanowiły jedynie 27% całkowitej powierzchni. Zaprezentowane porównanie odzwierciedla jak wielkim krajem była Polska przed 1772 rokiem w odniesieniu do współczesnych rozmiarów naszej Ojczyzny. Wiek walki o niepodległość przywrócił 50% terenów.

    1. Zmienna „Crime”

Wykres rozrzutu dla zmiennej ,,Crime”

0x01 graphic

Wyżej zilustrowany wykres jest obrazem rozrzutu przestępstw stwierdzonych na 10 tyś. ludności. Średnia wynosi wartość minimalna równa 182,3 określa liczbę przestępstw stwierdzonych w subregionie nowosądeckim natomiast wartością skrajnie z nią kontrastującą jest wartość maksymalna 446,7 opisująca sytuację subregionu szczecińskiego. W dobie bezrobocia i kultu pieniądza ludzie posuwają się do strasznych zbrodni w celu zaspokojenia swych ambicji finansowych. Działalność przestępcza kwitnie na terenie całego kraju ale dlaczego wskaźnik ten jest najwyższy w szczecińskim? Odpowiedz na to pytanie dostarczają statystyki. Obszar ten ma bowiem najwyższy procentowy udział bezrobotnych w ogólnej liczbie ludności zawodowo czynnej (powyżej 12 %)wraz z kilkoma innymi terenami Polski. Najbezpieczniejszym subregionem jest .nowosądecki (wskaźnik przestępczości jest najniższy ). Także procentowy udział bezrobotnych w ogólnej liczbie ludności zawodowo czynnej jest najniższy i wynosi 6-8% co rzutuje na wskaźnik przestępczości. Przy okazji analizy zmiennej ,,Crime” chciałabym zilustrować przestępczość w Polsce na tle tego parametru w innych krajach europejskich. Dokonam tego wykorzystując zestawienia Wydziału Prasowego Komendy Głównej Policji.

0x08 graphic

Na podstawie tego wykresu można postawić wniosek iż Polska zajmuje czołowe miejsce w kradzieży samochodów .

0x08 graphic

Jak widać na załączonym wykresie przynajmniej liczba morderstw jest w Polsce stosunkowo niska w odniesieniu do innych krajów Europy.

W poszczególnych kategoriach przestępstw zagrożenie przestępczością w analizowanych państwach jest zróżnicowane:

W kategorii zabójstw na100 tysięcy ludności przestępczość w Polsce jest niższa niż w Niemczech o ok. 28 %, we Włoszech o ok. 32 %, w Holandii aż o ok. 82 % czy we Francji i na Węgrzech o ok. 22 %. Z drugiej strony niższe zagrożenie tą kategorią przestępczości jest w Austrii, Hiszpanii i Szwajcarii. Podobnie kształtuje się przestępczość związana z poważnym uszkodzeniem ciała.

Liczba przestępstw na 100 tysięcy ludności popełnionych w Polsce przeciwko mieniu (wszystkie rodzaje przestępstw) jest najmniejsza spośród wszystkich tego typu przestępstw w analizowanych krajach. Na podobnym poziomie, aczkolwiek nieco wyższa jest w Hiszpanii, w pozostałych krajach zaś jest wyraźnie wyższa (np. 4-krotnie w Holandii, 2-3-krotnie we Francji i Niemczech).

Ilościowa struktura najgroźniejszych przestępstw skierowanych przeciwko mieniu, takich jak rozboje i wymuszenia rozbójnicze, a także kradzieże z włamaniem w poszczególnych państwach jest już bardziej złożona. Rozboje i wymuszenia rozbójnicze najrzadziej popełniane są na Węgrzech, w Szwajcarii, Austrii i we Włoszech. W tych krajach liczba przestępstw jest niższa niż w Polsce. Wyższa jest w Hiszpanii (ok. 3 razy), a także we Francji, Holandii, Niemczech.

Największa liczba kradzieży z włamaniem dokonywana jest w Holandii (ok. 3.000 na 100.000 ludności). W Polsce liczba tych przestępstw nie przekracza 800. Natomiast najmniej jest ich popełnianych w Hiszpanii (566) i we Francji(752).

W kategorii oszustw Polska ze średnią ok. 170 przestępstw na 100 tysięcy ludności, jest daleko w tyle za Niemcami (913 przestępstw), Francją (530) i Węgrami (498). Najniższe zagrożenie tą przestępczością jest w Holandii (42 przestępstwa) i Hiszpanii (68 przestępstw).

Rozkład parametru -przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie widzimy rozkład przestępstw stwierdzonych na 10 tyś ludności.

Z wykresu wynika iż w 16 subregionach liczba przestępstw na 10 tyś ludności mieści się w przedziale 220-280 przy czym należy zaakcentować iż jest to najczęściej spotykana sytuacja w kraju. Najniższa fala przestępstw od 80-140 występuje w jednym subregionie krośnieńsko-przemyskim gdzie odnotowuje się 135 wykroczeń na 10 tyś ludności (warto zaznaczyć iż na wskazanym terenie stopień wykrywalności przestępstw jest stosunkowo wysoki) zaś najwyższa liczba przestępstw występuje od 430-500 w 4 subregionach: szczecińskim-446,7 , legnickim 440,3, gorzowskim 442,3 oraz centralnym śląskim 440,5.

Współczynnik skośności wynosi dla tej zmiennej 1,29447 natomiast współczynnik kurtozy 0,266907. Na podstawie analizy danych i wykresu możemy postawić tezę o lekkiej prawoskośności rozkładu.

Wykres normalności rozkładu dla zmiennej ,,Crime”

0x01 graphic

Z powyższego wykresu oraz na podstawie wartości standardowych współczynników skośności i kurtozy (poniżej 2) możemy wnioskować iż jest to rozkład zbliżony do normalnego. Dla potwierdzenia tej myśli przedstawię jeszcze wykres gęstości.

0x01 graphic

Przedziały ufności dla zmiennej ,,Crime”

Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że średni wskaźnik przestępstw stwierdzonych na 10 tyś ludzi w subregionach jest nie większy niż 310 i nie mniejszy niż 257 . Tak, więc wymiar sprawiedliwości planując umieszczenie wszystkich przestępców w więzieniu w osobnych celach (przy założeniu że 1 przestępca popełnił tylko 1 przestępstwo) zapełniłby od 97660-122800 cel tylko .w roku analizowanym Co oznacza, że przy średniej 107920 pomieszczeń więziennych rezerwa musiałaby wynosić około +/-19 880.Jest to całkowicie nierealna hipoteza lecz dobrze uzmysławia skalę problemu

Testowanie hipotez dla zmiennej ,,Crime”

Przy wykorzystaniu testu t- studenta przy średniej o wartości 269 postawiłam hipotezę zerową iż średnia liczba przestępstw na 10 tyś ludności wynosi 300 przeciwstawiając ją hipotezie alternatywnej mówiącej iż liczba ta jest mniejsza niż 300. przekonałam się że nie należy odrzucać H0 dla alfa=0,01.A skoro tak to w ciągu roku suma zarejestrowanych przestępstw we wszystkich subregionach jest nie większa niż 1 197 000.

    1. Zmienna „Police”

Wykres rozrzutu dla zmiennej ,,Police”

0x01 graphic

Wykres rozrzutu wskaźnika wykrywalności przestępstw ( % ) uwidacznia powyżsy rysunek. Średnia geometryczna ma wartość 55,8 % . Ten procentowy wskaźnik zróżnicowany jest od 37,3 % w regionie warszawskim do 66,7% na terenie subregionu chełmsko-zamojskiego ( obszar Wrocławia wykazuje również wysoki stopień wykrywalności ,ustępując maksymalnej wartości zaledwie o 0,1%). Warszawa jako stolica Polski powinna być miastem o bezwzględnie przestrzeganym i respektowanym prawie. Dlaczego jak na ironię losu właśnie tam wkaźnik wykrywalności przestępstw jest tak niski? Jedną z przyczyn jest zapewne rezydowanie w tym mieście dużej liczby przestępców. W Polsce bowiem przywódcy największych zorganizowanych grup przestępczych są praktycznie nietykalni. Władze pobliskich miasteczek stolicy , stworzyły program mający zmaksymalizować skuteczność policji. Jest to program stałego partnerskiego współdziałania Policji ze społeczeństwem, który poprzez swoje wyspecjalizowane agendy i instytucje przyczyniać się będzie do poprawy bezpieczeństwa w zagrożonym rejonie. Realizacji programu o nazwie ,,BEZPIECZNE 0x01 graphic
MIASTO” oprócz Warki podjęto się także w lubelskim czy poznańskim. Miejmy nadzieję że tego typu programy będą realizowane we wszystkich miastach polskich.

.

Rozkład parametru -„Police” przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie za pomocą programu SG PLUS zilustrowałam rozkład wskaźnika wykrywalności sprawców przestępstw stwierdzonych (w %).Na podstawie wykresu można zaobserwować iż w 14 subregionach wskaźnik ten wynosi od 52 do 58%.Najniższy wskaźnik (35-41 %) wykrywalności sprawców przestępstw ma 1 subregion: warszawski, chociaż jako stolica wskaźnik ten powinien być wyższy natomiast najwyższym wskaźnikiem od 63-69% mogą się poszczycić 3 subregiony: wrocławski, chełmsko-zamojski, rzeszowsko-tarnobrzeski..

Standardowy współczynnik skośności dla tej zmiennej wynosi-1,35728. natomiast współczynnik kurtozy ma wartość 0,837973. Wykres ten przedstawia tendencje lewoskośnego rozkładu.

Wykres normalności rozkładu dla zmiennej ,,Police”

0x01 graphic

Na podstawie wykresu można zauważyć iż punkty układają się wzdłuż linii prostej więc jest to wykres zbliżony do normalnego co potwierdzają wartości standardowych współczynników skośności i kurtozy. W celu rozwiania wątpliwości przedstawię jeszcze wykres gęstości.

0x01 graphic

Przedziały ufności dla zmiennej ,,Police”

Na poziomie ufności 95 % (1-α = O,95) możemy przyjąć, że średni (%) wskaźnik wykrywalności sprawców przestępstw stwierdzonych w subregionach jest nie większy niż 57,34 % i nie mniejszy niż 53,08 %. Wykorzystując dane statystyczne zawarte w roczniku możemy przyjąć iż przy liczbie 145 tyś pełnozatrudnionych (wyłączając pracowników cywilnych) w bezpieczeństwie publicznym oraz przy średniej wskaźnika wykrywalności sprawców przestępstw 55% na jednego ,,obrońcę” ładu publicznego przypada wykrycie ok. 2-3 sprawców rocznie +/-2,1%.

*)Wskaźnik wykrywalności sprawców przestępstw jest to stosunek liczby przestępstw wykrytych w danym roku (łącznie z wykrytymi po podjęciu z umorzenia) do liczby

przestępstw stwierdzonych w danym roku, powiększonej o liczbę przestępstw w podjętych postępowaniach, a umorzonych w latach poprzednich z powodu niewykrycia sprawcy.

Testowanie hipotez dla zmiennej ,,Police”

Przy wykorzystaniu testu t- studenta postawiłam hipotezę zerową iż średni wskaźnik wykrywalności przestępstw stwierdzonych wynosi 57% przeciwstawiając ją hipotezie alternatywnej mówiącej iż wskaźnik ten jest mniejszy niż 57% . Przy średniej z próby o wartości 55,21% przekonałam się że nie należy odrzucać H0 dla alfa=0,01. W nawiązaniu do poprzednich rozważań możemy więc postawić tezę iż przy 100% wskaźniku wykrywalności sprawców przestępstw każdy stróż prawa musiałby wykryć ok. 6 przestępstw rocznie.

    1. Zmienna „Bezrobocie”

Wykres rozrzutu dla zmiennej ,,Bezrobocie”

0x01 graphic

Zaprezentowany wykres rozrzutu jest odzwierciedleniem stopy bezrobocia rejestrowanego w 38 subregionach. Średnia stopa wynosi 17,9 % , wartość minimalna jest równa 10,8 % i odnosi się ona do regionu warszawskiego natomiast wartość maksymalna równa 31,1 % opisuje subregion ełcki. Poddając analizie powyższe dane możemy stwierdzić iż różnice w wielkości bezrobocia są znaczne. Spostrzeżenie to można w prosty sposób wyjaśnić. Bowiem o stopie bezrobocia decyduje istnienie bądź nieistnienie możliwości zatrudnienia. Miasta-metropolie takie jak Warszawa brylują w świadczeniu usług *(szacuje się iż zatrudnionych w tym segmencie jest ponad 500 000 osób) ,również budownictwo i przemysł są domeną stolicy ( zapewniają od 100 000 do 250 000 miejsc pracy). Ponadto liczne atrakcje turystyczne redukują poziom bezrobocia. Stąd też najniższa stopa bezrobocia w tym regionie. Jeśli chodzi o kwestię zatrudnienia, szczęścia Warszawiaków nie mają mieszkańcy subregionu ełckiego, którzy muszą się zmagać z omawianym problemem ekonomicznym (brakiem pracy) . Najwyższa stopa bezrobocia (co 3 zarejestrowany bezrobotny ) jest wynikiem wielu czynników , które stworzyły tak dramatyczną sytuację na tym terenie. Brak rozwiniętego przemysłu, złóż surowców mineralnych ,czy rolnictwa wykluczają główne źródła utrzymania. Jedynie atrakcyjność turystyczna tego rejonu umożliwia stworzenie jakichkolwiek miejsc pracy. By jednak zajmować się branżą turystyczną należy zainwestować, a na to nie stać

mieszkańców subregionu ełckiego. Warto zaznaczyć iż wysoka stopa bezrobocia kształtuje demografię tego terenu powodując migracje odpływową ludności.

Rozkład parametru ,,Bezrobocie” przedstawia poniższy histogram

0x01 graphic

Na powyższym histogramie widzimy stopę bezrobocia rejestrowanego w %.Możemy z niego odczytać iż w  22 subregionach zamyka się w przedziale 12-19%.Najniższą stopę bezrobocia w wysokości 9-12% rejestrujemy w 3 subregionach-warszawskim, południowośląskim oraz białstocko-suwalskim zaś najwyższą w 1 subregionie-ełckim (30-33%).

Standardowy współczynnik skośności dla tej zmiennej wynosi 2,21 a współczynnik kurtozy 0,85.

Wykres normalności rozkładu dla zmiennej ,,Bezrobocie”

0x01 graphic

Powyższy wykres umożliwia postawienie tezy o normalności rozkładu analizowanej zmiennej. Punkty nie układają się wzdłuż linii dlatego też zmienna ,,Crime” nie ma rozkładu normalnego co potwierdza zaprezentowany poniżej wykres Gaussa oraz

standardowy współczynnik skośności 2,2 .Pomimo tego stwierdzenia stworzę dla tej zmiennej test studenta i przedziały ufności.

0x01 graphic

Przedziały ufności dla zmiennej ,,Bezrobocie”

Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że stopa bezrobocia rejestrowanego jest nie większa niż 19,5% i nie mniejsza niż 16,4% .Średnia więc wynosi 17,9% +/-1,5%.%. Wygrana Wrocławia w konkursie na gospodarza EXPO w roku 2010 zaowocowałaby powstaniem 10 000 miejsc pracy (jak przewidywano) co z kolei zmniejszyłoby stopę bezrobocia o 0,026%. Niestety uzyskane głosy w liczbie 2 zaprzepaściły szansę na minimalną redukcję zmory ekonomicznej nękającej ówczesne społeczeństwo. Otworzyło natomiast wrota możliwości dla Szanghaju.

Testowanie hipotez dla zmiennej ,,Bezrobocie”

Przeprowadzenie testu t-studenta dało mi możliwość postawienia hipotezy zerowej iż średnia stopa bezrobocia wynosi 19% oraz hipotezy alternatywnej utrzymującej że rozpatrywana stopa bezrobocia jest mniejsza niż 19%. Przy średniej z próby 17,9 okazało się że nie należy odrzucać H0 dla alfa=0,01. Na podstawie wyników testu można przyjąć iż w Polsce jest średnio 7 220 000 osób bezrobotnych co oznacza iż co 5 mieszkaniec nie posiada pracy.

0x08 graphic

W niniejszym rozdziale wykorzystam modele regresji w celu oceny współzależności zmiennych Zastosuję regresję prostą służącą do dokonywania analizy regresji metodą

najmniejszych kwadratów dla jednej zmiennej niezależnej. O wyborze szerzej rozpatrywanych przykładów zadecydują nie tylko obliczenia skonstruowane przez program

statystyczny ale także logika. Stawiane przeze mnie wnioski stworzę w oparciu o wykresy, wielkości kluczowych współczynników oraz posiadaną wiedzę.

LUDKI

POWIE-RZCHNIA

CRIME

POLICE

BEZROBOCIE

LUDKI

Nie ma zależności

Nie ma zależności

Jest zależność

Jest zależność

POWIE-RZCHNIA

Nie ma zależności

Nie ma zależności

Nie ma zależności

Nie ma zależności

CRIME

Nie ma zależności

Nie ma zależności

Jest zależność

Jest zależność

POLICE

Jest zależność

Nie ma zależności

Jest zależność

Nie ma zależności

BEZROBO-CIE

Jest zależność

Nie ma zależności

Jest zależność

Nie ma zależności

Doszukałam się 8 zależności pomiędzy analizowanymi zmiennymi (co uwidacznia powyższa tabela) jednak rozpatrzę jedynie 5 przypadków ze względu na alogiczne powiązania pozostałych trzech.

0x08 graphic

0x08 graphic

0x01 graphic

Powyższy wykres przedstawia zależność między wskaźnikiem wykrywalności przestępstw a liczbą ludności. Najwłaściwszy dla powyższego przykładu jest model odwrotnościowy -Y (gdzie R- kwadrat =14,7%). Na podstawie wyników można określić procent zależności pomiędzy liczbą ludności a wskaźnikiem wykrywalności przestępstw .Współczynnik korelacji

dla tej funkcji wynosi 0,38. Na podstawie tej analizy można wysnuć wniosek, że im więcej jest ludności tym niższy jest % wskaźnik wykrywalności przestępstw .Teza ta znajduje uzasadnienie bowiem im więcej jest ludności tym więcej osób wiąże swą przyszłość z działalnością przestępczą co w efekcie skutkuje niskim stopniem wykrywalności przestępstw.

0x08 graphic

0x08 graphic

0x01 graphic

Powyższy wykres ilustruje zależność bezrobocia wyrażonego w % od liczby ludności. Najwłaściwszym typem modelu w tym przypadku jest model odwrotnościowy -Y (współczynnik korelacji wynosi 0,58 zaś R-kwadrat = 33,6%).Na podstawie wyżej zobrazowanego modelu możemy postawić tezę iż wraz ze wzrostem liczby ludności maleje % wskaźnik bezrobocia .Stwierdzenie to może wydawać się paradoksalne lecz dogłębna analiza wyniku czyni je prawdopodobnym. Bowiem wraz ze wzrostem ludności rośnie liczba zakładanych firm ,wzrasta zapotrzebowanie na pracowników w sektorze prywatnym, rolniczym a także przemysłowym co z kolei powoduje minimalizowanie stopy bezrobocia.

0x08 graphic

0x08 graphic

0x01 graphic

Wyżej zaprezentowany wykres odwrotnościowy -Y jest ilustracją zależności popełnionych przestępstw do wskaźnika wykrywalności przypadków łamania prawa. Współczynnik korelacji = 0,47 natomiast R-kwadrat wynosi 21,8%.Wykres ten pozwala nam postawić optymistyczną tezę iż wraz ze wzrostem wykrywalności przestępstw maleje liczba popełnianych zbrodni. Można to tłumaczyć tym iż przestępcy widząc sprawnie działające organy prawa i porządku w obawie przed ujęciem, rezygnują ze zbrodniczych planów. Może więc oprócz restrykcyjnego wymiaru kar (który niestety w rzeczywistości polskiej nie zaistniał )warto byłoby zwiększyć skuteczność policji co zniwelowałoby szerzące się bezprawie. Ten sposób zapewniłby niszczenie przestępczości zanim się pojawi. Jest to bezapelacyjnie najlepsza metoda walki z przestępczością.

0x01 graphic

0x01 graphic

0x01 graphic

Powyższy wykres za pomocą funkcji wykładniczej ilustruje zależność wskaźnika przestępstw od stopy bezrobocia wyrażonego w %. Przy współczynniku korelacji = 0,37 oraz R-kwadracie =14% możemy wysnuć wnioski dotyczące powiązań zaprezentowanych zmiennych. Wykres

stworzony za pomocą programu statystycznego stanowi niezbity dowód iż wraz ze wzrostem stopy bezrobocia rośnie wskaźnik przestępczości. Zilustrowana na powyższym modelu sytuacja jest wierną kopią realiów polskich w nowym millenium. Brak pracy powodujący niemożność egzystencji skłania ludzi do popełniania zbrodni które zapewniają im byt. Sytuacja ekonomiczna, ubogi rynek pracy sprzyjają zastraszająco rosnącej liczbie kradzieży malwersacji, oszust, zbrodni na tle rabunkowym. Przestępstwo jest bowiem najprostszą drogą zdobycia funduszy. Wysokiemu wskaźnikowi przestępczości sprzyja także nieudolność polskiego prawa i niski wymiar kar za popełnione zbrodnie.

0x01 graphic

0x01 graphic

0x01 graphic

Wyżej zaprezentowany wykres odwrotnościowy -X jest ilustracją zależności liczby ludności od % wskaźnika bezrobocia. Współczynnik korelacji = 0,58 natomiast R-kwadrat wynosi 34%.Z zaprezentowanego wyżej modelu możemy odczytać iż wraz ze wzrostem bezrobocia maleje liczba ludności. Brak pracy powoduje iż ludzie wybierają model rodziny 2+1 bowiem nie są w stanie zapewnić dzieciom bytu. Sytuacja ta doskonale odzwierciedla ówczesną

rzeczywistość. Badania demograficzne wykazują znaczny spadek liczebności urodzeń. Oszacowano iż przy przyroście demograficznym oscylującym wokół 0 za kilkadziesiąt lat pozostanie niewielki odsetek osób w wielu produkcyjnym co przyczyni się do zaburzenia struktury społecznej. Zmniejszenie liczby populacji jest także spowodowane odchodzeniem ludzi od wiary katolickiej(która w sprawie życia nienarodzonych zajmuje określone dogmatami wiary stanowisko) zabiegami aborcyjnymi (choć są one prawnie nielegalne kwitnie działalność przestępcza w tej materii) . Także niskie dotacje dla samotnych matek przyczyniają się do zaistniałego stanu demograficznego (dla kontrastu we Francji pomoc finansowa dla samotnych matek pozwala im wieść życie na przyzwoitym poziomie bez konieczności podejmowania pracy). Realia są takie iż jesteśmy społeczeństwem starzejącym się! Sytuacja ta będzie się pogłębiać wraz ze wzrostem bezrobocia. Jest to poważne zagrożenie którego nie należy bagatelizować ze względu na wymiar ekonomiczny tego problemu.

(Uwaga Kasia zapomniała napisać wzory lub chociażby typy funkcji opisujących ww zależności)

0x08 graphic

Zanim przeprowadzę analizę będącą treścią tego rozdziału chciałabym przywołać kilka informacji opisujących tą analizę. Przede wszystkim należy zaznaczyć iż znalazła ona

zastosowanie przy porównywaniu obiektów charakteryzowanych przez wiele zmiennych (w mojej pracy obiekty, czyli subregiony są charakteryzowane przez 5 zmiennych: ,,Powierzchnię” ,,Ludki” ,,Crime”, ,,Police” i ,,Bezrobocie”). Ponadto analiza ta zrodziła się we Wrocławskiej Szkole Statystyki stąd też funkcjonuje nazwa zamienna dla tej analizy-Taksonomia Wrocławska.

0x01 graphic

Na załączonym dendrogramie (dendrogram, czyli graficzny obraz opisujący zależności badanych obiektów pod względem podobieństwa cech , pokrewieństwa) widzimy wyodrębnione trzy klastry. Najbardziej wybijają się subregiony: warszawski, szczeciński, centralny śląski, ełcki oraz słupski tworząc skupisko zobrazowane na dendrogramie. Grupa tych terenów obejmuje dwa mniejsze klastry ( ełcki, słupski, legnicki, gorzowski oraz samotnie wyodrębniony Centralny Śląsk). Wyżej wymienione tereny poddałam szczególnej analizie w niniejszej pracy ze względu na wartości jakie przyjmowały poszczególne zmienne. Na wykresie wyróżnia się także grupa w której skład wchodzą regiony: legnicki, gorzowski, południowo-ślaski, północno-ślaski, chełmsko-zamojski, białostocko-suwalski, lubelski, opolski, świętokrzyski, białsko-podlaski, kaliski, poznański a także krakowsko-tarnobrzeski. Należy zaznaczyć że obejmuje on wiele mniejszych zgrupowanych subregionów.

0x08 graphic

W powyższej pracy starałam się scharakteryzować pięć zmiennych , wskazać korelacje występujące między nimi , przedstawić czynniki (natury ekonomicznej, społecznej, politycznej, geograficznej i historycznej) kształtujące wartości zmiennych w poszczególnych subregionach. Mając do dyspozycji jedynie dane zaczerpnięte z rocznika statystycznego oraz program SG PLUS, stworzyłam ilustracje rozkładów zmiennych (wykresy) starając się poprzeć je komentarzami. Przy pisaniu tej pracy zrozumiałam jak cennym narzędziem jest statystyka i jak wiele można stworzyć znając jej tajniki. O mądrości statystyki przekonali się już bowiem starożytni lecz wiele wieków upłynęło zanim doceniono jej zastosowanie w wielu naukach, zarówno technicznych, jak i społecznych. Praca ta utwierdziła mnie w przekonaniu iż: ,,Statystyka poskramia niepewność, wznosząc się o szczebel od danych do informacji”.

4

1



Wyszukiwarka

Podobne podstrony:
praca ze statystyki
Praca kontrolna ze statystki, statystyka
Praca zaliczeniowa ze statystyki i demografii
Egzamin II ze statystyki luty 2007
ANOVA - A - powtarzane pomiary (2), SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
ANOVA-AB-interakcja 1, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
zadania ze statystyki cz 2
Metodologia ze statystyką kurs zaawansowany
egzamin ze statystyki, Statystyka opisowa
ANOVA-AB-interakcja 2, SWPS, ROK 2, Metodologia ze statystyką - Brzeziński
Egzamin ze statystyki, PK, Statystyka
Pytania - Statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
pytania ze statystyki
Egzamin z Metodologii ze statystyk kurs podstawowy
Zadania ze statystyki cz5 związki między zmiennymi

więcej podobnych podstron