Analiza wybranych danych statystycznych
charakteryzujących poziom życia w subregionach
Spis treści:
Praca ze Statystyki -strona tytułowa 1
1. Spis treści.......................................................................................................................... 2
2. Wprowadzenie................................................................................................................... 3
3. Opis użytych danych......................................................................................................... 3
Charakterystyki poszcególnych zmiennych ................................................................... 4
4.1 Zmienna „Ludki”........................................................................................................... 4
4.2 Zmienna „Powierzchnia”............................................................................................... 7
4.3 Zmienna „Crime”.......................................................................................................... 9
4.4 Zmienna „Police”.......................................................................................................... 12
4.5 Zmienna „Bezrobocie”................................................................................................. 15
ANALIZA REGRESJI ................................................................................................ 17
5.1 Wykres dopasowanego modelu dla zmiennych: „Powierzchnia” i „Ludki” ........... 18
5.2 Wykres dopasowanego modelu dla zmiennych: „Bezrobocie” i „Ludki” ................19
5.3 Wykres dopasowanego modelu dla zmiennych: „Crime” i „Police”.........................20
5.4 Wykres dopasowanego modelu dla zmiennych: „Crime” i „Bezrobocie” ................20
Wykres dopasowanego modelu dla zmiennych: „Ludki” i „Bezrobocie”................ 21
6. HIERARCHICZNA ANALIZA SKUPIEŃ ............................................................. 22
ZAKOŃCZENIE..................................................................................................................... 23
Przedmiotem pracy jest analiza poniższych danych statystycznych:
Liczba osób mieszkających w subregionach wyrażona w tysiącach - „Ludki”
Powierzchnia ogólna ujęta w km 2 subregionów -,,Powierzchnia”
Przestępstwa stwierdzone na 10 tys.ludności- ,,Crime”
Wskaźnik wykrywalności sprawców przestępstw stwierdzonych w % -,,Police”
Stopa bezrobocia rejestrowanego w %- ,,Bezrobocie”
Moje zadanie polega na opracowaniu powyższych zmiennych dla subregionów Polski, dostrzeżeniu i wskazaniu zależności, korelacji między poszczególnymi zmiennymi oraz zbudowaniu wniosków statystycznych. Zmienne te poddam analizom w celu zminimalizowania stopnia niepewności. Przetworzenie statystyczne danych oraz ich graficzną ilustrację uzyskam korzystając z programu stworzonego dla celów statystycznych o nazwie: SG PLUS.
|
POWIE- RZCHNIA |
LUDKI |
CRIME |
POLICE |
BEZROBOCIE |
jeleniogórsko-wałbrzyski |
10371 |
1387,7 |
365,5 |
59,3 |
23,7 |
legnicki |
4149 |
515,5 |
440,3 |
56,6 |
19,3 |
wrocławski |
5135 |
435,6 |
187,4 |
66,6 |
19,3 |
bydgoski |
8913 |
1034,5 |
352,5 |
51,4 |
17,9 |
toruńsko-wrocławski |
9057 |
1065,2 |
316,2 |
54,7 |
20,4 |
białskopodlaski |
5977 |
321 |
246,1 |
63,2 |
14,8 |
chełmsko-zamojski |
9290 |
680,6 |
220 |
66,7 |
14,7 |
lubelski |
9847 |
1230,4 |
258,2 |
59,3 |
13,4 |
gorzowski |
6107 |
385,1 |
442,3 |
61,8 |
19,5 |
zielonogórski |
7877 |
638,9 |
388,3 |
54,1 |
22,4 |
łódzki |
8725 |
957,2 |
223,9 |
51,6 |
16,7 |
piotrkowsko-skierniewicki |
9200 |
892,9 |
216,3 |
48,7 |
16,3 |
krakowsko-tarnowski |
7327 |
1392,9 |
223,6 |
55,9 |
13,4 |
nowosądecki |
7490 |
1099,4 |
182,3 |
58,1 |
14,8 |
ciechanowsko-płocki |
7778 |
646,6 |
222,5 |
55,3 |
19,1 |
ostrołęcko-siedlecki |
12098 |
772,5 |
229,9 |
52,8 |
15,9 |
warszawski |
8138 |
1290 |
294,7 |
37,3 |
10,8 |
radomski |
7071 |
752,8 |
261,2 |
52,9 |
20,3 |
opolski |
9412 |
1084,7 |
281,1 |
59,2 |
15,7 |
rzeszowsko-tarnobrzeski |
7512 |
1168,6 |
186,1 |
56,8 |
15,2 |
krośnieńko-przemyski |
10414 |
960 |
135 |
65,7 |
17,3 |
białostocko-suwalski |
14871 |
903,9 |
290,4 |
55,6 |
12,9 |
łomżyński |
5309 |
317,3 |
230,1 |
56 |
16,3 |
słupski |
8185 |
490 |
330,1 |
45,9 |
26,4 |
gdański |
9693 |
954,5 |
288,1 |
51,9 |
20,1 |
północnośląski |
5846 |
1049,1 |
276,2 |
48,9 |
14,6 |
południowośląski |
5232 |
1695,1 |
257,9 |
51,3 |
11,6 |
centralny śląski |
1216 |
2103,4 |
440,5 |
43 |
13,1 |
świętokrzyski |
11691 |
1322,9 |
250,5 |
61,3 |
16,6 |
elbląski |
7525 |
546,2 |
296,2 |
54,6 |
27,1 |
olsztyński |
10332 |
628,6 |
378 |
49,3 |
22,4 |
ełcki |
6346 |
293,5 |
325,1 |
60 |
31,1 |
pilski |
6458 |
411,8 |
291,3 |
58 |
19,1 |
poznański |
11521 |
1127,1 |
226,3 |
56,4 |
10,8 |
kaliski |
7147 |
806 |
183,4 |
62,4 |
15,3 |
koniński |
4439 |
441 |
237,6 |
56,5 |
19 |
szczeciński |
12498 |
1118,9 |
446,7 |
43,3 |
17,4 |
koszaliński |
10404 |
615 |
364,1 |
55,6 |
26,9 |
4.1 Zmienna „Ludki”
Wykres rozrzutu dla zmiennej „Ludki”
We wszystkich subregionach Polski mieszka 38 mln. osób. Średnia liczba ludności w każdym podregionie wynosi 882,5 tyś, natomiast mediana (inaczej wartość środkowa) jest równa 898,4 i różni się od średniej arytmetycznej nieznacznie. Średnia jest podana z odchyleniem standardowym +/- 65,9131tyś. i zmienia się od najmniejszej 293,5 tyś dla subregionu ełckiego do największej 2103,4tys.dla centralnego śląska. Różnica więc jest duża, bo wynosi 1809,9. Takie dysproporcje wynikają z uwarunkowań ekonomicznych, politycznych, geograficznych. Ludzie migrują w poszukiwaniu pracy , możliwości rozwoju intelektualnego (studia) także ukształtowanie terenu odgrywa w tym względzie istotną rolę. Centralny Śląsk wskazany przeze mnie jako subregion o najwyższej liczbie ludności od niepamiętnych czasów był ważnym regionem o znaczeniu przemysłowym (G.O.P), zapewniając zatrudnienie licznym rzeszom ludzi (stopa bezrobocia w 2000 roku była stosunkowo niska- 13%). Choć ostatnie lata spowodowały znaczne pogorszenie się warunków gospodarczych w analizowanym obszarze. Skutki załamanie się polskiego górnictwa uwidacznia znaczny wzrost bezrobocia w tym regionie . W ramach programu G.S.P górnicy otrzymali po 40 000 zł jednak pieniądze te nie są w stanie zrekompensować stałej płacy. Jako ciekawostkę podam iż rocznie Polska eksportuje węgiel o łącznej wartości 175 mln.USD! Analizując przyczyny wysokiego wskaźnika zaludnienia w centralnym śląsku można również sięgnąć do faktów sprzed 50 lat kiedy to fala repatriantów ówczesnego ZSRR a także liczne rzesze ludności południowej Polski migrowały na zachód . Trasy te przebiegały przez cały kraj lecz należy zaznaczyć iż 2 z największych biegły w pobliżu centralnego Śląska. Na pewno więc część migrantów zwabiona dobrymi perspektywami osiedliła się na tym terenie (G.O.P brylował bowiem w hutnictwie, przemyśle maszynowym i metalowym ,wiele innych gałęzi przemysłu było także jego domeną, zapewniając liczne miejsca pracy). Przywołałam te odległe fakty ponieważ uważam iż mogły mieć wpływ na kształtowanie się rozłożenia ludności w Polsce. Obecnie napływ ludności na 10 000 osób na terenie centralnego śląska wynosi 0-5. Dla kontrastu przywołam subregion ełcki, w którym odnotowano najniższą liczbę ludności -293,5 tyś. Jest on zdeterminowany przez wysoką stopę bezrobocia na tym terenie wynoszącym aż 31%. Ludzie nie mając możliwości bytu ze względu na brak pracy przenoszą się do subregionów o niższej stopie bezrobocia (odpływ ludności na 10 000 mieszkańców subregionu ełckiego jest najwyższy i wynosi 5-20 osób) . Warunki naturalne (średnio lub mało korzystne ) wykluczają prowadzenie działalności rolniczej a minimalnie rozwijający się przemysł powoduje niemożność zatrudnienia w tej branży.
Rozkład parametru - „Ludki” przedstawia poniższy histogram:
Na podstawie analizy powyższego histogramu możemy wyciągnąć wnioski na temat rozłożenia liczebności ludności w poszczególnych subregionach. Czyli można odpowiedzieć na pytanie o przesłanki zróznicowania Wykres wskazuje iż w dwunastu subregionach liczba ludności zawiera się w przedziale od 400- 700 tyś. osób i jest to najczęściej występująca sytuacja w kraju. Natomiast w jedenastu subregionach liczba ta wynosi od 1000-1400 tyś. Największa liczba osób 2100-2400 tyś. występuje w centralnym śląsku (obszarze o dużym znaczeniu ekonomicznym o czym szerzej napisałam przy okazji
analizy wykresu rozrzutu ludności ).Należy zauważyć iż powyższy histogram ilustruje wysoki stopień zróżnicowania potencjału ludnoścowego. O dysproporcjach tych decydują takie czynniki jak poziom rozwoju cywilizacyjnego ,gospodarczego stopa bezrobocia, warunki naturalne ,ukształtowanie terenu itp.
Wykres normalności rozkładu dla zmiennej ,,Ludki”
Jak widać na załączonym rysunku wykres ten jest zbliżony do normalnego ,punkty rozmieszczone są wzdłuż linii prostej (wartości standardowych współczynników skośności i kurtozy poniżej 2). Aby poprzeć tą tezę przedstawię dodatkowo wykres gęstości, który przypomina krzywą Gaussa.
Przedziały ufności dla zmiennej ,,Ludki”
Na poziomie ufności 95 % możemy stwierdzić, że średnia liczba ludności we wszystkich subregionach jest nie większa niż 1 016 tysięcy i nie mniejsza niż 749 tyś. osób. Tak, więc Minister Zdrowia zarządzając obowiązkowe szczepienia przeciwko żółtaczce typu B musiałby w każdym subregionie zakupić ilość szczepionek w podanych wyżej granicach. Co oznacza, że przy średniej 883 tyś szczepionek rezerwa musiałaby wynosić około +/- 134 tyś.
.
Testowanie hipotez dla zmiennej „Ludki”
Dzięki testowi t-studenta mogłam postawić hipotezę zerową iż średnia liczba ludności w subregionie wynosi 1mil oraz hipotezę alternatywną iż liczba ta jest mniejsza niż 1mil. Przy średniej z próby o wartości 883tyś okazało się że nie należy odrzucać H0 dla poziomu istotności alfa=0,01. Na podstawie powyższych danych możemy zbudować wniosek iż przy koszcie 1 szczepionki przeciwko żółtaczce typu B w wysokości 20 zł należałoby wydać 5 mil zł jeśli rząd zdecydowałby się refundować tą szczepionkę co 4 osobie w każdym subregionie.
Zmienna „Powierzchnia”
Wykres rozrzutu dla zmiennej ,,Powierzchnia”
Zaprezentowany wykres rozrzutu jest odzwierciedleniem rozkładu powierzchni w km2. Średnia powierzchnia subregionu wynosi 8174 km2 , wartość minimalna jest równa 1216 km2 i odnosi się ona do centralnego Śląska natomiast wartość maksymalna 14871 km2 i opisuje ona region białostocko-suwalski. Na bazie powyższych danych można spostrzec iż różnica wielkości skrajnie małego i dużego subregionu jest znaczna ( 13655 km2 ). W tym miejscu odwołam się do przyczyn jak w poprzednim podrozdziale.
Rozkład parametru -zmiennej „Powierzchnia” przedstawia poniższy histogram
Powyższy histogram ukazuje powierzchni w 38 subregionach Polski. Należy zaznaczyć iż rozkład ten jest prawie symetryczny (wartości: średniej, mediany i dominanty są zbliżone). Możemy z niego odczytać iż w 13 subregionach powierzchnia w km 2 zamyka się w przedziale od 7 -9tyś. i jest to najczęściej spotykana sytuacja w kraju. Subregionem o najmniejszej powierzchni 0-2 tyś. jest centralny śląsk natomiast subregionem o największej powierzchni 14-16 tyś. jest białostocko-suwalski. Współczynnik skośności wynosi dla tej zmiennej wynosi: 0,005 a współczynnik kurtozy 0,751.
Wykres normalności rozkładu dla zmiennej ,,Powierzchnia”
Powyższy wykres przedstawia normalny rozkład zmiennej ,,Powierzchnia” , punkty układają się wzdłuż linii prostej a standardowe współczynniki skośności i kurtozy mają wartości poniżej 2. Idealny wykres gęstości jak w rozkładzie Gaussa potwierdza normalność .
Przedziały ufności dla zmiennej „Powierzchnia”
Przedział ufności na poziomie 95% wynosi [7298;9049]. Średnia ma wartość 8174 km2 +/-876. Jeśli więc w każdym subregionie minister Ochrony Środowiska zarządziłby posadzenie drzew na powierzchni 10 m 2 na każdym kilometrze 2 w ramach propagowania to zalesimy od 73-90 h lasu co i tak stanowiłoby tylko wzrost o ok. 1%.W okresie powojennym zalesienie kraju wzrosło o 6% i nadal będzie rosnąć gdyż coraz mniej gruntów ornych trzeba do wyżywienia Polaków a las stanowi ważny czynnik równowagi w przyrodzie.
Testowanie hipotez dla zmiennej „Powierzchnia”
W niniejszym podrozdziale przeprowadzam test t-Studenta przyjmując hipotezę zerową, iż średnia powierzchnia subregionu wynosi 9 224 km2 zaś hipoteza alternatywna mówi, że powierzchnia ta jest mniejsza niż 9 224 km2. Przy średniej z próby równej 8174 dowiodłam
iż nie należy odrzucać H0 przy alfa=0,01. Na podstawie wyżej udowodnionej tezy i znajomości historii możemy stworzyć hipotetyczną sytuację. Cofnijmy się do osławionej daty 1772 roku gdy 3 mocarstwa ograbiły Polskę z 211 tyś km2 ziemi. W przełożeniu na współczesne realia rozbiór ten spowodowałby pomniejszenie każdego subregionu o 5 553
km2 co stanowiłoby 60% średniej powierzchni Polski podczas gdy zagrabione tereny w XVIII wieku stanowiły jedynie 27% całkowitej powierzchni. Zaprezentowane porównanie odzwierciedla jak wielkim krajem była Polska przed 1772 rokiem w odniesieniu do współczesnych rozmiarów naszej Ojczyzny. Wiek walki o niepodległość przywrócił 50% terenów.
Zmienna „Crime”
Wykres rozrzutu dla zmiennej ,,Crime”
Wyżej zilustrowany wykres jest obrazem rozrzutu przestępstw stwierdzonych na 10 tyś. ludności. Średnia wynosi wartość minimalna równa 182,3 określa liczbę przestępstw stwierdzonych w subregionie nowosądeckim natomiast wartością skrajnie z nią kontrastującą jest wartość maksymalna 446,7 opisująca sytuację subregionu szczecińskiego. W dobie bezrobocia i kultu pieniądza ludzie posuwają się do strasznych zbrodni w celu zaspokojenia swych ambicji finansowych. Działalność przestępcza kwitnie na terenie całego kraju ale dlaczego wskaźnik ten jest najwyższy w szczecińskim? Odpowiedz na to pytanie dostarczają statystyki. Obszar ten ma bowiem najwyższy procentowy udział bezrobotnych w ogólnej liczbie ludności zawodowo czynnej (powyżej 12 %)wraz z kilkoma innymi terenami Polski. Najbezpieczniejszym subregionem jest .nowosądecki (wskaźnik przestępczości jest najniższy ). Także procentowy udział bezrobotnych w ogólnej liczbie ludności zawodowo czynnej jest najniższy i wynosi 6-8% co rzutuje na wskaźnik przestępczości. Przy okazji analizy zmiennej ,,Crime” chciałabym zilustrować przestępczość w Polsce na tle tego parametru w innych krajach europejskich. Dokonam tego wykorzystując zestawienia Wydziału Prasowego Komendy Głównej Policji.
Na podstawie tego wykresu można postawić wniosek iż Polska zajmuje czołowe miejsce w kradzieży samochodów .
Jak widać na załączonym wykresie przynajmniej liczba morderstw jest w Polsce stosunkowo niska w odniesieniu do innych krajów Europy.
W poszczególnych kategoriach przestępstw zagrożenie przestępczością w analizowanych państwach jest zróżnicowane:
W kategorii zabójstw na100 tysięcy ludności przestępczość w Polsce jest niższa niż w Niemczech o ok. 28 %, we Włoszech o ok. 32 %, w Holandii aż o ok. 82 % czy we Francji i na Węgrzech o ok. 22 %. Z drugiej strony niższe zagrożenie tą kategorią przestępczości jest w Austrii, Hiszpanii i Szwajcarii. Podobnie kształtuje się przestępczość związana z poważnym uszkodzeniem ciała.
Liczba przestępstw na 100 tysięcy ludności popełnionych w Polsce przeciwko mieniu (wszystkie rodzaje przestępstw) jest najmniejsza spośród wszystkich tego typu przestępstw w analizowanych krajach. Na podobnym poziomie, aczkolwiek nieco wyższa jest w Hiszpanii, w pozostałych krajach zaś jest wyraźnie wyższa (np. 4-krotnie w Holandii, 2-3-krotnie we Francji i Niemczech).
Ilościowa struktura najgroźniejszych przestępstw skierowanych przeciwko mieniu, takich jak rozboje i wymuszenia rozbójnicze, a także kradzieże z włamaniem w poszczególnych państwach jest już bardziej złożona. Rozboje i wymuszenia rozbójnicze najrzadziej popełniane są na Węgrzech, w Szwajcarii, Austrii i we Włoszech. W tych krajach liczba przestępstw jest niższa niż w Polsce. Wyższa jest w Hiszpanii (ok. 3 razy), a także we Francji, Holandii, Niemczech.
Największa liczba kradzieży z włamaniem dokonywana jest w Holandii (ok. 3.000 na 100.000 ludności). W Polsce liczba tych przestępstw nie przekracza 800. Natomiast najmniej jest ich popełnianych w Hiszpanii (566) i we Francji(752).
W kategorii oszustw Polska ze średnią ok. 170 przestępstw na 100 tysięcy ludności, jest daleko w tyle za Niemcami (913 przestępstw), Francją (530) i Węgrami (498). Najniższe zagrożenie tą przestępczością jest w Holandii (42 przestępstwa) i Hiszpanii (68 przestępstw).
Rozkład parametru -przedstawia poniższy histogram
Na powyższym histogramie widzimy rozkład przestępstw stwierdzonych na 10 tyś ludności.
Z wykresu wynika iż w 16 subregionach liczba przestępstw na 10 tyś ludności mieści się w przedziale 220-280 przy czym należy zaakcentować iż jest to najczęściej spotykana sytuacja w kraju. Najniższa fala przestępstw od 80-140 występuje w jednym subregionie krośnieńsko-przemyskim gdzie odnotowuje się 135 wykroczeń na 10 tyś ludności (warto zaznaczyć iż na wskazanym terenie stopień wykrywalności przestępstw jest stosunkowo wysoki) zaś najwyższa liczba przestępstw występuje od 430-500 w 4 subregionach: szczecińskim-446,7 , legnickim 440,3, gorzowskim 442,3 oraz centralnym śląskim 440,5.
Współczynnik skośności wynosi dla tej zmiennej 1,29447 natomiast współczynnik kurtozy 0,266907. Na podstawie analizy danych i wykresu możemy postawić tezę o lekkiej prawoskośności rozkładu.
Wykres normalności rozkładu dla zmiennej ,,Crime”
Z powyższego wykresu oraz na podstawie wartości standardowych współczynników skośności i kurtozy (poniżej 2) możemy wnioskować iż jest to rozkład zbliżony do normalnego. Dla potwierdzenia tej myśli przedstawię jeszcze wykres gęstości.
Przedziały ufności dla zmiennej ,,Crime”
Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że średni wskaźnik przestępstw stwierdzonych na 10 tyś ludzi w subregionach jest nie większy niż 310 i nie mniejszy niż 257 . Tak, więc wymiar sprawiedliwości planując umieszczenie wszystkich przestępców w więzieniu w osobnych celach (przy założeniu że 1 przestępca popełnił tylko 1 przestępstwo) zapełniłby od 97660-122800 cel tylko .w roku analizowanym Co oznacza, że przy średniej 107920 pomieszczeń więziennych rezerwa musiałaby wynosić około +/-19 880.Jest to całkowicie nierealna hipoteza lecz dobrze uzmysławia skalę problemu
Testowanie hipotez dla zmiennej ,,Crime”
Przy wykorzystaniu testu t- studenta przy średniej o wartości 269 postawiłam hipotezę zerową iż średnia liczba przestępstw na 10 tyś ludności wynosi 300 przeciwstawiając ją hipotezie alternatywnej mówiącej iż liczba ta jest mniejsza niż 300. przekonałam się że nie należy odrzucać H0 dla alfa=0,01.A skoro tak to w ciągu roku suma zarejestrowanych przestępstw we wszystkich subregionach jest nie większa niż 1 197 000.
Zmienna „Police”
Wykres rozrzutu dla zmiennej ,,Police”
Wykres rozrzutu wskaźnika wykrywalności przestępstw ( % ) uwidacznia powyżsy rysunek. Średnia geometryczna ma wartość 55,8 % . Ten procentowy wskaźnik zróżnicowany jest od 37,3 % w regionie warszawskim do 66,7% na terenie subregionu chełmsko-zamojskiego ( obszar Wrocławia wykazuje również wysoki stopień wykrywalności ,ustępując maksymalnej wartości zaledwie o 0,1%). Warszawa jako stolica Polski powinna być miastem o bezwzględnie przestrzeganym i respektowanym prawie. Dlaczego jak na ironię losu właśnie tam wkaźnik wykrywalności przestępstw jest tak niski? Jedną z przyczyn jest zapewne rezydowanie w tym mieście dużej liczby przestępców. W Polsce bowiem przywódcy największych zorganizowanych grup przestępczych są praktycznie nietykalni. Władze pobliskich miasteczek stolicy , stworzyły program mający zmaksymalizować skuteczność policji. Jest to program stałego partnerskiego współdziałania Policji ze społeczeństwem, który poprzez swoje wyspecjalizowane agendy i instytucje przyczyniać się będzie do poprawy bezpieczeństwa w zagrożonym rejonie. Realizacji programu o nazwie ,,BEZPIECZNE
MIASTO” oprócz Warki podjęto się także w lubelskim czy poznańskim. Miejmy nadzieję że tego typu programy będą realizowane we wszystkich miastach polskich.
.
Rozkład parametru -„Police” przedstawia poniższy histogram
Na powyższym histogramie za pomocą programu SG PLUS zilustrowałam rozkład wskaźnika wykrywalności sprawców przestępstw stwierdzonych (w %).Na podstawie wykresu można zaobserwować iż w 14 subregionach wskaźnik ten wynosi od 52 do 58%.Najniższy wskaźnik (35-41 %) wykrywalności sprawców przestępstw ma 1 subregion: warszawski, chociaż jako stolica wskaźnik ten powinien być wyższy natomiast najwyższym wskaźnikiem od 63-69% mogą się poszczycić 3 subregiony: wrocławski, chełmsko-zamojski, rzeszowsko-tarnobrzeski..
Standardowy współczynnik skośności dla tej zmiennej wynosi-1,35728. natomiast współczynnik kurtozy ma wartość 0,837973. Wykres ten przedstawia tendencje lewoskośnego rozkładu.
Wykres normalności rozkładu dla zmiennej ,,Police”
Na podstawie wykresu można zauważyć iż punkty układają się wzdłuż linii prostej więc jest to wykres zbliżony do normalnego co potwierdzają wartości standardowych współczynników skośności i kurtozy. W celu rozwiania wątpliwości przedstawię jeszcze wykres gęstości.
Przedziały ufności dla zmiennej ,,Police”
Na poziomie ufności 95 % (1-α = O,95) możemy przyjąć, że średni (%) wskaźnik wykrywalności sprawców przestępstw stwierdzonych w subregionach jest nie większy niż 57,34 % i nie mniejszy niż 53,08 %. Wykorzystując dane statystyczne zawarte w roczniku możemy przyjąć iż przy liczbie 145 tyś pełnozatrudnionych (wyłączając pracowników cywilnych) w bezpieczeństwie publicznym oraz przy średniej wskaźnika wykrywalności sprawców przestępstw 55% na jednego ,,obrońcę” ładu publicznego przypada wykrycie ok. 2-3 sprawców rocznie +/-2,1%.
*)Wskaźnik wykrywalności sprawców przestępstw jest to stosunek liczby przestępstw wykrytych w danym roku (łącznie z wykrytymi po podjęciu z umorzenia) do liczby
przestępstw stwierdzonych w danym roku, powiększonej o liczbę przestępstw w podjętych postępowaniach, a umorzonych w latach poprzednich z powodu niewykrycia sprawcy.
Testowanie hipotez dla zmiennej ,,Police”
Przy wykorzystaniu testu t- studenta postawiłam hipotezę zerową iż średni wskaźnik wykrywalności przestępstw stwierdzonych wynosi 57% przeciwstawiając ją hipotezie alternatywnej mówiącej iż wskaźnik ten jest mniejszy niż 57% . Przy średniej z próby o wartości 55,21% przekonałam się że nie należy odrzucać H0 dla alfa=0,01. W nawiązaniu do poprzednich rozważań możemy więc postawić tezę iż przy 100% wskaźniku wykrywalności sprawców przestępstw każdy stróż prawa musiałby wykryć ok. 6 przestępstw rocznie.
Zmienna „Bezrobocie”
Wykres rozrzutu dla zmiennej ,,Bezrobocie”
Zaprezentowany wykres rozrzutu jest odzwierciedleniem stopy bezrobocia rejestrowanego w 38 subregionach. Średnia stopa wynosi 17,9 % , wartość minimalna jest równa 10,8 % i odnosi się ona do regionu warszawskiego natomiast wartość maksymalna równa 31,1 % opisuje subregion ełcki. Poddając analizie powyższe dane możemy stwierdzić iż różnice w wielkości bezrobocia są znaczne. Spostrzeżenie to można w prosty sposób wyjaśnić. Bowiem o stopie bezrobocia decyduje istnienie bądź nieistnienie możliwości zatrudnienia. Miasta-metropolie takie jak Warszawa brylują w świadczeniu usług *(szacuje się iż zatrudnionych w tym segmencie jest ponad 500 000 osób) ,również budownictwo i przemysł są domeną stolicy ( zapewniają od 100 000 do 250 000 miejsc pracy). Ponadto liczne atrakcje turystyczne redukują poziom bezrobocia. Stąd też najniższa stopa bezrobocia w tym regionie. Jeśli chodzi o kwestię zatrudnienia, szczęścia Warszawiaków nie mają mieszkańcy subregionu ełckiego, którzy muszą się zmagać z omawianym problemem ekonomicznym (brakiem pracy) . Najwyższa stopa bezrobocia (co 3 zarejestrowany bezrobotny ) jest wynikiem wielu czynników , które stworzyły tak dramatyczną sytuację na tym terenie. Brak rozwiniętego przemysłu, złóż surowców mineralnych ,czy rolnictwa wykluczają główne źródła utrzymania. Jedynie atrakcyjność turystyczna tego rejonu umożliwia stworzenie jakichkolwiek miejsc pracy. By jednak zajmować się branżą turystyczną należy zainwestować, a na to nie stać
mieszkańców subregionu ełckiego. Warto zaznaczyć iż wysoka stopa bezrobocia kształtuje demografię tego terenu powodując migracje odpływową ludności.
Rozkład parametru ,,Bezrobocie” przedstawia poniższy histogram
Na powyższym histogramie widzimy stopę bezrobocia rejestrowanego w %.Możemy z niego odczytać iż w 22 subregionach zamyka się w przedziale 12-19%.Najniższą stopę bezrobocia w wysokości 9-12% rejestrujemy w 3 subregionach-warszawskim, południowośląskim oraz białstocko-suwalskim zaś najwyższą w 1 subregionie-ełckim (30-33%).
Standardowy współczynnik skośności dla tej zmiennej wynosi 2,21 a współczynnik kurtozy 0,85.
Wykres normalności rozkładu dla zmiennej ,,Bezrobocie”
Powyższy wykres umożliwia postawienie tezy o normalności rozkładu analizowanej zmiennej. Punkty nie układają się wzdłuż linii dlatego też zmienna ,,Crime” nie ma rozkładu normalnego co potwierdza zaprezentowany poniżej wykres Gaussa oraz
standardowy współczynnik skośności 2,2 .Pomimo tego stwierdzenia stworzę dla tej zmiennej test studenta i przedziały ufności.
Przedziały ufności dla zmiennej ,,Bezrobocie”
Na poziomie ufności 95 % (1-α = O,95) możemy stwierdzić, że stopa bezrobocia rejestrowanego jest nie większa niż 19,5% i nie mniejsza niż 16,4% .Średnia więc wynosi 17,9% +/-1,5%.%. Wygrana Wrocławia w konkursie na gospodarza EXPO w roku 2010 zaowocowałaby powstaniem 10 000 miejsc pracy (jak przewidywano) co z kolei zmniejszyłoby stopę bezrobocia o 0,026%. Niestety uzyskane głosy w liczbie 2 zaprzepaściły szansę na minimalną redukcję zmory ekonomicznej nękającej ówczesne społeczeństwo. Otworzyło natomiast wrota możliwości dla Szanghaju.
Testowanie hipotez dla zmiennej ,,Bezrobocie”
Przeprowadzenie testu t-studenta dało mi możliwość postawienia hipotezy zerowej iż średnia stopa bezrobocia wynosi 19% oraz hipotezy alternatywnej utrzymującej że rozpatrywana stopa bezrobocia jest mniejsza niż 19%. Przy średniej z próby 17,9 okazało się że nie należy odrzucać H0 dla alfa=0,01. Na podstawie wyników testu można przyjąć iż w Polsce jest średnio 7 220 000 osób bezrobotnych co oznacza iż co 5 mieszkaniec nie posiada pracy.
W niniejszym rozdziale wykorzystam modele regresji w celu oceny współzależności zmiennych Zastosuję regresję prostą służącą do dokonywania analizy regresji metodą
najmniejszych kwadratów dla jednej zmiennej niezależnej. O wyborze szerzej rozpatrywanych przykładów zadecydują nie tylko obliczenia skonstruowane przez program
statystyczny ale także logika. Stawiane przeze mnie wnioski stworzę w oparciu o wykresy, wielkości kluczowych współczynników oraz posiadaną wiedzę.
|
LUDKI |
POWIE-RZCHNIA |
CRIME |
POLICE |
BEZROBOCIE |
LUDKI |
Nie ma zależności |
Nie ma zależności |
Jest zależność |
Jest zależność |
|
POWIE-RZCHNIA |
Nie ma zależności |
Nie ma zależności |
Nie ma zależności |
Nie ma zależności |
|
CRIME |
Nie ma zależności |
Nie ma zależności |
Jest zależność |
Jest zależność |
|
POLICE |
Jest zależność |
Nie ma zależności |
Jest zależność |
Nie ma zależności |
|
BEZROBO-CIE |
Jest zależność |
Nie ma zależności |
Jest zależność |
Nie ma zależności |
Doszukałam się 8 zależności pomiędzy analizowanymi zmiennymi (co uwidacznia powyższa tabela) jednak rozpatrzę jedynie 5 przypadków ze względu na alogiczne powiązania pozostałych trzech.
Powyższy wykres przedstawia zależność między wskaźnikiem wykrywalności przestępstw a liczbą ludności. Najwłaściwszy dla powyższego przykładu jest model odwrotnościowy -Y (gdzie R- kwadrat =14,7%). Na podstawie wyników można określić procent zależności pomiędzy liczbą ludności a wskaźnikiem wykrywalności przestępstw .Współczynnik korelacji
dla tej funkcji wynosi 0,38. Na podstawie tej analizy można wysnuć wniosek, że im więcej jest ludności tym niższy jest % wskaźnik wykrywalności przestępstw .Teza ta znajduje uzasadnienie bowiem im więcej jest ludności tym więcej osób wiąże swą przyszłość z działalnością przestępczą co w efekcie skutkuje niskim stopniem wykrywalności przestępstw.
Powyższy wykres ilustruje zależność bezrobocia wyrażonego w % od liczby ludności. Najwłaściwszym typem modelu w tym przypadku jest model odwrotnościowy -Y (współczynnik korelacji wynosi 0,58 zaś R-kwadrat = 33,6%).Na podstawie wyżej zobrazowanego modelu możemy postawić tezę iż wraz ze wzrostem liczby ludności maleje % wskaźnik bezrobocia .Stwierdzenie to może wydawać się paradoksalne lecz dogłębna analiza wyniku czyni je prawdopodobnym. Bowiem wraz ze wzrostem ludności rośnie liczba zakładanych firm ,wzrasta zapotrzebowanie na pracowników w sektorze prywatnym, rolniczym a także przemysłowym co z kolei powoduje minimalizowanie stopy bezrobocia.
Wyżej zaprezentowany wykres odwrotnościowy -Y jest ilustracją zależności popełnionych przestępstw do wskaźnika wykrywalności przypadków łamania prawa. Współczynnik korelacji = 0,47 natomiast R-kwadrat wynosi 21,8%.Wykres ten pozwala nam postawić optymistyczną tezę iż wraz ze wzrostem wykrywalności przestępstw maleje liczba popełnianych zbrodni. Można to tłumaczyć tym iż przestępcy widząc sprawnie działające organy prawa i porządku w obawie przed ujęciem, rezygnują ze zbrodniczych planów. Może więc oprócz restrykcyjnego wymiaru kar (który niestety w rzeczywistości polskiej nie zaistniał )warto byłoby zwiększyć skuteczność policji co zniwelowałoby szerzące się bezprawie. Ten sposób zapewniłby niszczenie przestępczości zanim się pojawi. Jest to bezapelacyjnie najlepsza metoda walki z przestępczością.
Powyższy wykres za pomocą funkcji wykładniczej ilustruje zależność wskaźnika przestępstw od stopy bezrobocia wyrażonego w %. Przy współczynniku korelacji = 0,37 oraz R-kwadracie =14% możemy wysnuć wnioski dotyczące powiązań zaprezentowanych zmiennych. Wykres
stworzony za pomocą programu statystycznego stanowi niezbity dowód iż wraz ze wzrostem stopy bezrobocia rośnie wskaźnik przestępczości. Zilustrowana na powyższym modelu sytuacja jest wierną kopią realiów polskich w nowym millenium. Brak pracy powodujący niemożność egzystencji skłania ludzi do popełniania zbrodni które zapewniają im byt. Sytuacja ekonomiczna, ubogi rynek pracy sprzyjają zastraszająco rosnącej liczbie kradzieży malwersacji, oszust, zbrodni na tle rabunkowym. Przestępstwo jest bowiem najprostszą drogą zdobycia funduszy. Wysokiemu wskaźnikowi przestępczości sprzyja także nieudolność polskiego prawa i niski wymiar kar za popełnione zbrodnie.
Wyżej zaprezentowany wykres odwrotnościowy -X jest ilustracją zależności liczby ludności od % wskaźnika bezrobocia. Współczynnik korelacji = 0,58 natomiast R-kwadrat wynosi 34%.Z zaprezentowanego wyżej modelu możemy odczytać iż wraz ze wzrostem bezrobocia maleje liczba ludności. Brak pracy powoduje iż ludzie wybierają model rodziny 2+1 bowiem nie są w stanie zapewnić dzieciom bytu. Sytuacja ta doskonale odzwierciedla ówczesną
rzeczywistość. Badania demograficzne wykazują znaczny spadek liczebności urodzeń. Oszacowano iż przy przyroście demograficznym oscylującym wokół 0 za kilkadziesiąt lat pozostanie niewielki odsetek osób w wielu produkcyjnym co przyczyni się do zaburzenia struktury społecznej. Zmniejszenie liczby populacji jest także spowodowane odchodzeniem ludzi od wiary katolickiej(która w sprawie życia nienarodzonych zajmuje określone dogmatami wiary stanowisko) zabiegami aborcyjnymi (choć są one prawnie nielegalne kwitnie działalność przestępcza w tej materii) . Także niskie dotacje dla samotnych matek przyczyniają się do zaistniałego stanu demograficznego (dla kontrastu we Francji pomoc finansowa dla samotnych matek pozwala im wieść życie na przyzwoitym poziomie bez konieczności podejmowania pracy). Realia są takie iż jesteśmy społeczeństwem starzejącym się! Sytuacja ta będzie się pogłębiać wraz ze wzrostem bezrobocia. Jest to poważne zagrożenie którego nie należy bagatelizować ze względu na wymiar ekonomiczny tego problemu.
(Uwaga Kasia zapomniała napisać wzory lub chociażby typy funkcji opisujących ww zależności)
Zanim przeprowadzę analizę będącą treścią tego rozdziału chciałabym przywołać kilka informacji opisujących tą analizę. Przede wszystkim należy zaznaczyć iż znalazła ona
zastosowanie przy porównywaniu obiektów charakteryzowanych przez wiele zmiennych (w mojej pracy obiekty, czyli subregiony są charakteryzowane przez 5 zmiennych: ,,Powierzchnię” ,,Ludki” ,,Crime”, ,,Police” i ,,Bezrobocie”). Ponadto analiza ta zrodziła się we Wrocławskiej Szkole Statystyki stąd też funkcjonuje nazwa zamienna dla tej analizy-Taksonomia Wrocławska.
Na załączonym dendrogramie (dendrogram, czyli graficzny obraz opisujący zależności badanych obiektów pod względem podobieństwa cech , pokrewieństwa) widzimy wyodrębnione trzy klastry. Najbardziej wybijają się subregiony: warszawski, szczeciński, centralny śląski, ełcki oraz słupski tworząc skupisko zobrazowane na dendrogramie. Grupa tych terenów obejmuje dwa mniejsze klastry ( ełcki, słupski, legnicki, gorzowski oraz samotnie wyodrębniony Centralny Śląsk). Wyżej wymienione tereny poddałam szczególnej analizie w niniejszej pracy ze względu na wartości jakie przyjmowały poszczególne zmienne. Na wykresie wyróżnia się także grupa w której skład wchodzą regiony: legnicki, gorzowski, południowo-ślaski, północno-ślaski, chełmsko-zamojski, białostocko-suwalski, lubelski, opolski, świętokrzyski, białsko-podlaski, kaliski, poznański a także krakowsko-tarnobrzeski. Należy zaznaczyć że obejmuje on wiele mniejszych zgrupowanych subregionów.
W powyższej pracy starałam się scharakteryzować pięć zmiennych , wskazać korelacje występujące między nimi , przedstawić czynniki (natury ekonomicznej, społecznej, politycznej, geograficznej i historycznej) kształtujące wartości zmiennych w poszczególnych subregionach. Mając do dyspozycji jedynie dane zaczerpnięte z rocznika statystycznego oraz program SG PLUS, stworzyłam ilustracje rozkładów zmiennych (wykresy) starając się poprzeć je komentarzami. Przy pisaniu tej pracy zrozumiałam jak cennym narzędziem jest statystyka i jak wiele można stworzyć znając jej tajniki. O mądrości statystyki przekonali się już bowiem starożytni lecz wiele wieków upłynęło zanim doceniono jej zastosowanie w wielu naukach, zarówno technicznych, jak i społecznych. Praca ta utwierdziła mnie w przekonaniu iż: ,,Statystyka poskramia niepewność, wznosząc się o szczebel od danych do informacji”.
4
1