STATYSTYKA
Definicja statystyki:
zbiór danych liczbowych dotyczących określonej dziedziny życia społecznego i gospodarczego np. statystyka ludności, handlu, przemysłu itp.
statystyka jako dziedzina wiedzy
Statystyka jest to nauka o metodach zbierania, opracowywania i analizy danych dotyczących zjawisko i procesów masowych.
Definicja demografii:
Demografia - nauka o prawidłowościach rozwoju ludności w konkretnych warunkach gospodarczych i społecznych, historycznych badanego obszaru. (korzysta z narzędzi statystycznych)
Uregulowania prawne:
ustawa o statystyce publicznej z dn. 29.06.1995 r. określa m.in. zasady i stworzyła podstawy właściwego, ZGODNEGO Z NORMAMI ETYCZNYMI i naukowego i niezależnego sposobu prowadzenia i organizowania badań statystycznych. Wyniki tych badań mają charakter oficjalnych danych statystycznych.
Poglądy religijne, polityczne itp. są zabronione w pytaniach, które są obowiązkowe, gdyż są to informacje zbyt intymne.
Badania mogą być obowiązkowe lub dobrowolne. O tym jaki jest charakter badań decydują właściwe przepisy prawne.
Obserwacje statystyczne:
Pierwszym etapem zbierania danych statystycznych. warunkujący cały, późniejszy charakter badań jest obserwacja statystyczna. Obserwacja taka ma na celu ustalenie wartości cech poszczególnych jednostek statystycznych i polega na stwierdzeniu oraz rejestracji - zapisie elementów składowych badanych zjawisk.
Obserwacje dzielimy (choć uzupełniają się one) pod względem:
kompletności
pełne (całkowite, wyczerpujące) - obejmują wszystkie elementy badanej zbiorowości1
częściowe (niepełne) - dotyczą one wybranych jednostek
ankieta
monografia
metoda reprezentacyjna
częstotliwości
rejestracje bieżące - polegają na zapisie zdarzeń w momencie ich zaistnienia np. rejestracja zawierania małżeństw, zgonów, urodzeń, zameldowań itp.
obserwacje okresowe - są przeprowadzane co pewien czas, są to tzw. spisy, z których najważniejszym jest Narodowy Spis Powszechny Ludności2, będący jednocześnie badaniem okresowym i pełnym.
1 - definicja zbiorowości statystycznej
Zbiorowość statystyczna jest to zespół elementów poddanych badaniu. Elementy zbiorowości statystycznej nazywamy jednostkami statystycznymi, a ich liczbę liczebnością. Każda zbiorowość musi być określona pod względem rzeczowym (kogo lub co badamy?), czasowym (kiedy prowadzimy badanie?), przestrzennym (gdzie prowadzimy badanie?)
2 - definicja Narodowego Spisu Powszechnego Ludności
Narodowy Spis Powszechny Ludności jest to badanie ustalające stan i strukturę ludności w określonym momencie, na określonym terytorium poprzez indywidualne uzyskiwanie danych o wszystkich jednostkach podlegających badaniu.
EUROSTAT - Główny Urząd Statystyczny Unii Europejskiej
Parametry położenia
Mamy informacje o zarobkach 9 osób w pewnej firmie: 1000, 1230, 30000, 1400, 2500, 2200, 1800, 1770, 3100.
śr. = 5000 zł
jest to wynik zawyżony przez jedną wysoką wartość i posługiwanie się tą miarą nie jest właściwe (8 osób zarabia mniej).
Mediana - Me - (jest nieodzowna w demografii np. przy określaniu wieku) inaczej wartość wyrazu środkowego, jest to taka wartość cechy, która dzieli materiał statystyczny na połowy w ten sposób, że jedna połowa elementów ma wartości cech mniejsze (bądź równe) medianie, a druga połowa wartości większe od mediany (bądź jej równe).
I Mediana w szeregu szczegółowym:
Żeby obliczyć medianę musimy uporządkować szereg: 1000, 1230, 1400, 1770, 1800, 2200, 2500, 3100, 30000.
Wyznaczenie mediany, czyli wartości środkowej wymaga uprzednio stwierdzenia, która z kolei będzie to wartość, czyli obliczenia tzw. numeru mediany:
NMe = 9+1 /2 = 5
Me = 1800 zł
Jeżeli mamy parzystą liczbę obserwacji np. dołączyła 10 osoba, zarabiająca 30000 zł to numer mediany jest równy 5,5.
Mediana = (1800+2200)/2 = 2000 zł
Odp. Połowa osób zarabia 2000 zł i mniej, a połowa 2000 zł i więcej.
II Mediana w szeregu rozdzielczym punktowym:
Ocena xi |
Liczba osób ni |
Liczebność skumulowana si |
2,0 |
50 |
50 |
3,0 |
90 |
140 |
3,5 |
20 |
160 |
4,0 |
50 |
210 |
4,5 |
10 |
220 |
5,0 |
30 |
250 |
x |
250 |
x |
Obliczamy numer mediany:
w szeregach o dużej liczebności (umowna granica N>30) możemy posłużyć się wzorami:
dla N nieparzystego:
NMe = N+1 /2
dla N parzystego:
NMe = N/2
zatem numer mediany wynosi:
NMe = 250/2 = 125
Odczytanie wartości mediany: ponieważ numer mediany wynosi 125, to mediana jest w grupie tych osób, które otrzymały 3,0 (w liczebności skumulowanej si = 140)
zatem Me = 3,0.
Odp. Połowa studentów otrzymała ocenę dostateczną i niższą, a połowa dostateczną i wyższą.
III Mediana w szeregu rozdzielczym przedziałowym:
Obliczamy numer mediany
Kumulujemy liczebność
Sprawdzamy, w którym przedziale liczebność skumulowana po raz pierwszy przekracza numer mediany
Wyznaczamy wartość mediany z tego przedziału posługując się wzorem:
Me = a + NMe - s(i-1) /ni x l
a - dolna granica przedziału klasowego, w którym jest mediana,
l - rozpiętość przedziału klasowego, w którym jest mediana,
NMe - numer mediany,
s(i-1) - liczebność skumulowana klasy poprzedniej do klasy, w której jest mediana,
ni - liczebność rzeczywista klasy, w której jest mediana.
Histogram - wykres szeregu przedziałowego. Wykres słupkowy stworzony z przylegających do siebie prostokątów reprezentujących poszczególne klasy. Na osi poziomej zaznaczamy wartości granic przedziałów klasowych (podstawy prostokątów), natomiast na osi pionowej odkładamy liczebności.
Nad każdą klasą zaznaczoną na osi x rysujemy słupek o wysokości równej liczebności danego przedziału klasowego. Jeśli na osi y oznaczymy liczebności skumulowane otrzymamy tzw. histogram skumulowany.
Modalna - Mo - jest to wartość najczęstsza (powtarza się najwięcej razy). Modalna inaczej zwana bywa modą bądź dominantą. Modalną liczymy z przedziałów klasowych o jednakowej długości.
WZÓR
Graficzne wyznaczanie modalnej
Kwantyle - są to parametry, które dzielą badaną zbiorowość na części np. jeśli podzielimy na 100 części nazwiemy je percentylami, jeśli na 10 będą to decyle, a jeśli na 4 kwartyle (istnieją 3 kwartyle).
Kwartyle:
Kwartyl pierwszy (dolny) - Q1 - jest to taka wartość cechy, która odcina ¼ wartości mniejszych i ¾ wartości większych (bądź równych).
Kwartyl drugi - mediana Q2 = Me
Kwartyl trzeci (górny) - Q3 - jest to taka wartość cechy, która odcina ¾ wartości mniejszych i ¼ wartości większych.
Odstęp międzykwartylowy - jest to różnica między kwartyle górnym, a kwartyle dolnym tj. Q3 - Q1
Obliczanie kwartyli:
Numery kwartyli obliczamy analogicznie jak w przypadku mediany.
Numer kwartyli w szeregu szczegółowym (poniżej 30 jednostek):
WZORY
Wykres pudełkowy (pudełko z wąsami) - są na nim przedstawione podstawowe statystyki opisowe takie jak:
Mediana
Dolny kwartyl
Górny kwartyl
Najmniejszy wynik obserwacji
Największy wynik obserwacji
Elementy wykresu „pudełka z wąsami”:
Dolna krawędź pudełka odpowiada pierwszemu kwartylowi Q1 natomiast górna trzeciemu kwartylowi Q3. A więc wysokość pudełka jest równa odstępowi międzykwartylowemu:
IQR = Q3 - Q1
Linia przechodząca w poprzek pudełka odpowiada medianie (szerokość pudełka nie ma znaczenia).
Linię wychodzącą w dół od pudełka jak też w górę nazywamy „wąsami”
Wąs dolny wyznacza najmniejszą wartość w zbiorze danych, o ile nie jest ona mniejsza od
Q1 - 1,5 IQR.
Wąs górny wyznacza największą wartość w zbiorze danych, o ile nie jest ona większa niż:
Q3 + 1,5 IQR.
Wąsy pokazują nam wartości zbioru danych, leżące poza odstępem międzykwartylowy, ale odległe nie więcej niż o 1,5 odstępu międzykwartylowego.
Obserwacje, których wartości są większe od Q3 + 1,5 IQR a mniejsze od Q3 + 3 IQR lub mniejsze od Q1 - 1,5 IQR, a większe od Q1 - 3 IQR są obserwacjami podejrzanymi o nietypowość.
Obserwacje, które lezą dalej niż trzykrotna wielkość IQR od dolnej i górnej granicy krawędzi pudełka nazywamy obserwacja odstającymi.
Parametry rozrzutu (rozproszenia)
Mierzą one zróżnicowanie wartości cechy w badanym materiale statystycznym.
Przykład 1.
Mamy pięcioro rodzeństwa w wieku: 7 lat, 12, 14, 16 i 16. Jak zróżnicowany jest wiek rodzeństwa możemy określić np. obliczając różnicę między wiekiem najstarszego a wiekiem najmłodszego dziecka: 16-7 = 9 lat. Jest to tzw. rozstęp.
Rozstęp:
W szeregu rozdzielczym punktowym łatwo go wyznaczamy odejmując od największej wartości wartość najmniejszą.
W szeregu rozdzielczym przedziałowym nie możemy dokładnie obliczyć, możemy go oszacować jeśli skrajne przedziały klasowe są otwarte.
Średnia wieku rodzeństwa wynosi 13 lat.
Obliczmy, o ile różni się wiek każdej osoby od średniej.
Wiek w latach |
xi - xśr |
(xi - xśr)2 |
7 |
-6 |
36 |
12 |
-1 |
1 |
14 |
1 |
1 |
16 |
3 |
9 |
16 |
3 |
9 |
razem: |
x |
56 |
s2 = 56/5 = 11,2
s = 3,3 lat
Odchylenie standardowe wieku wynosi 3,3 lat, zatem wiek każdego z rodzeństwa różni się przeciętnie (średnio) o 3,3 roku od średniego wieku.
Właściwość średniej:
Suma odchyleń (różnic) indywidualnych wartości cechy od wartości średniej jest równa zero.
Σ(xi - xśr ) = 0
Wariancja - jeśli weźmiemy do obliczeń kwadraty różnic między indywidualnymi wartościami cechy, a wartością średnią, to ich średnia arytmetyczna nosi nazwę - wariancji.
Odchylenie standardowe - jest pierwiastkiem kwadratowym z wariancji, czyli pierwiastkiem średniej arytmetycznej kwadratów odchyleń poszczególnych wartości od wartości średniej.
WZORY
Odchylenie ćwiartkowe - jest średnią arytmetyczną odchyleń dwóch skrajnych kwartyli od mediany.
WZORY
Współczynniki zmienności - umożliwiają porównywanie jednostek o różnych wartościach.
WZORY
Asymetria (skośność) w szeregach statystycznych: określają kierunek odchyleń (w którą stronę odchylenia są bardziej liczne). W tym celu porównujemy wartości średniej arytmetycznej i modalnej. Im większa jest różnica między średnią a modalną, tym większa asymetria zbiorowości statystycznej.
Wskaźniki asymetrii:
xśr - Mo >0 - tzw. asymetria prawostronna
xśr - Mo <0 - tzw. asymetria lewostronna
xśr - Mo =0 - symetria
Współczynnik skośności i asymetrii:
WZORY
Liczby stosunkowe:
Każdą wielkość podającą rozmiary badanego zjawiska nazywamy liczbą absolutną lub bezwzględną. Przez podzielenie dwóch liczb absolutnych logicznie ze sobą powiązanych, otrzymujemy liczbę stosunkową.
Podstawowe grupy liczb stosunkowych:
Liczby stosunkowe charakteryzujące natężenie (intensywność występowania) zjawisk czyli tzw. współczynniki - jest to największa grupa liczb stosunkowych, umożliwiająca ocenę intensywności badanych zjawisk, a także co jest bardzo ważne, umożliwiającą porównanie różnych zbiorowości. W konstrukcji współczynników natężenia ważne jest odpowiednie dobranie bazy (mianownika ułamka).
Liczby stosunkowe charakteryzujące strukturę badanych zjawisk
Liczby stosunkowe charakteryzujące zmianę zjawisk w czasie
Liczby stosunkowe charakteryzujące stopień wykonania planu
Liczby stosunkowe charakteryzujące terytorialne rozmieszczenie zjawisk
PRZYKADY:
Współczynnik feminizacji - liczba kobiet/ liczba mężczyzn x 100
Mieszkania oddane do użytku na 1000 zawieranych małżeństw
Zagęszczenie mieszkań - liczba mieszkań/ liczba izb w mieszkaniach
Gęstość zaludnienia - liczba mieszkańców/ powierzchnia danego obszaru
Mierniki natężenia
Mierniki struktury są to liczby, które określają wielkość udziału części w badanej całości. Udziały takie wyrażamy w procentach, traktując całość jako 100%. Po wykonaniu wszystkich obliczeń, konieczne jest sprawdzenie, czy suma wszystkich udziałów równa jest 100%. Jeśli (wskutek zaokrągleń) różni się należy skorygować największy udział tak aby w efekcie otrzymać wynik dokładnie równy 100%.
PRZYKŁAD:
Zatrudnienie w pewnej firmie usługowej:
Koniec września - rok poprzedni |
Koniec września - rok bieżący |
||
Liczba zatrudnionych |
W tym z wyższym wykształceniem |
Liczba zatrudnionych |
W tym z wyższym wykształceniem |
220 |
143 |
250 |
150 |
W poprzednim roku 65,0% pracowników miało wyższe wykształcenie, w bieżącym zaś 60,0%.
Nie wolno nam odejmować wyliczonych udziałów procentowych, ponieważ obliczane są one dla różnych liczebnie zbiorowości. Takie odejmowania możliwe jest jedynie wtedy jeśli wynik podany nie w procentach a w punktach procentowych. Natomiast odpowiedź na pytanie o ile procent zmienił się udział osób z wyższym wykształceniem wymaga podzielenia wyniku z bieżącego roku, przez wynik z poprzedniego. Otrzymana wartość 92,3% wskazuje na spadek o 7,7% liczby osób z wyższym wykształceniem.
Charakteryzujące stopień wykonania planu (przykłady):
I
Plan: dochody w budżecie miasta X: 160 tys. zł
Wykonanie: dochody uzyskane: 140 tys. zł
Stopień wykonania planu: wykonanie/plan = 140 tys./160 tys. x 100% = 87,5 %
II
Plan: obniżenie wydatków o 15 tys. zł
Wykonanie: obniżka o 10 tys. zł
Stopień wykonania planu: wykonanie/plan = 10 tys./15 tys. x 100% = 66,7 %
III
Plan: obniżenie kosztów o 5%
Wykonanie: obniżono koszty o 6%
Stopień wykonania planu: plan/wykonania = 95% : 94% x 100% = 101,1%
Rozkład - sposób rozmieszczenia, obraz struktury całej zbiorowości; częstość występowania poszczególnych wartości obserwacji w całej populacji np. rozkład wieku ludności, rozkład wynagrodzeń, czy rozkład gospodarstw domowych według liczby osób itp. Każdy szereg prezentuje rozkład pewnej cechy.
Rozkład normalny:
można w pełni określić za pomocą dwóch znanych parametrów: średniej arytmetycznej i odchylenia standardowego;
ma kształt symetrycznej krzywej, której obie strony asymptotycznie zbliżają się do osi. Wartości średniej arytmetycznej, mediany i modalnej są sobie równe.
W rozkładzie normalnym:
68,27% wszystkich wartości znajduje się w przedziale: xśr - sx do xśr + sx - przedział typowy
95,45% mieści się w przedziale: xśr - 2 sx do xśr + 2 sx
99,73% mieści się w przedziale: xśr - 3 sx do xśr + 3 sx - reguła trzech sigm (w rozkładzie normalnym prawie wszystkie wartości mieszczą się w przedziale: xśr - 3 sx do xśr + 3 sx).
Rozkład zbliżony do normalnego ma np.
wzrost ludzi,
trafność serii strzałów,
wyniki wielokrotnie powtarzanych eksperymentów itd.
Korelacja - badanie współzależności zjawisk.
Istota zależności:
funkcyjna (deterministyczna, matematyczna) - gdy określonym wartościom jednej cechy przyporządkowana jest ściśle określona wartość drugiej (np. X=7Y).
statystyczna - gdy określonym wartościom jednej cechy odpowiada kilka wartości drugiej (zmianom wartości jednej cechy odpowiada zmiana rozkładu drugiej).
Typy korelacji:
dodatnia -wzrost (spadek) jednej wartości pociąga za sobą wzrost (spadek) wartości drugiej cechy;
ujemna - wzrostowi wartości jednej cechy towarzyszy spadek wartości drugiej cechy.
Badanie zjawisk w czasie
Dane o wielkościach badanych zjawisk w czasie mogą być przedstawiane dla wybranych dni, miesięcy, kwartałów, lat. Prezentacja taka w statystyce opisowej nosi nazwę szeregu dynamicznego, chronologicznego lub najprościej mówiąc szeregu czasowego.
Szeregi czasowe:
szeregi okresów - charakteryzują zmiany badanych zjawisk w przeciągu dłuższego czasu np. roku. Istnieje możliwość kumulacji okresów (roczna produkcja jest np. suma produkcji 4 kwartałów). W szeregach tych liczymy prostą średnią arytmetyczną.
szeregi momentów - charakteryzują stan zjawiska w pewnej chwili , zazwyczaj na początku lub końcu miesiąca (roku) np. liczba ludności, liczba abonentów TV, liczba studentów, najczęściej podaje się stan w dniu 31 XII. W szeregach tych liczymy tzw. średnią chronologiczną.
Dynamika zmian zjawisk w czasie: możemy ją wyznaczyć w dwojaki sposób.
1. Pierwszy ze sposobów polega na przyjęciu wartości z dowolnego okresu jako podstawy porównania, do której odnosi się dane z pozostałych okresów. Za okres podstawowy przyjmuje się w zasadzie okres pierwszy w danym badaniu, ale może to być (jeżeli jest to uzasadnione) również każdy inny okres. Tworzy się szereg mierników zwanych indeksami (wskaźnikami) jednopodstawowymi (obrazują o ile zmieniło się dane zjawisko).
Indeks jednopodstawowy:
Jeżeli przez „p” oznaczymy numer okresu przyjętego za podstawę porównań, to indeksy jednopodstawowe będą miały postać:
it,p = Yt/Yp x 100%
gdzie t=1,2,3…,n; a Y1, Y2, Y3…, Yn to wartości badanego zjawiska w kolejnych okresach.
2. Drugi ze sposobów polega na porównywaniu danych liczbowych z wybranego okresu do wielkości z okresu bezpośrednio poprzedzającego. Ze względu na to, że liczniki i mianowniki kolejno zamieniają się miejscami, mierniki takie nazywamy indeksami (wskaźnikami) łańcuchowymi (obrazują na tempo zmian).
Indeks łańcuchowy:
ił = Yt/Yt-1 x 100%
Średnia geometryczna - chcąc poznać przeciętne tempo zmian, musimy się posłużyć parametrem, który nosi nazwę średniej geometrycznej - G. Obliczana jest ona jako pierwiastek stopnia k (k=N-1) z iloczynu k indeksów łańcuchowych.
WZÓR
Obliczanie przeciętnego tempa zmian, gdy mamy jedynie dane wskaźniki łańcuchowe, uniemożliwia nam stosowanie wzoru uproszczonego.
Indeksy ekonomiczne (agregatowe, zespołowe)
Przykład: Mamy informację dotyczące wydatków wybranym gospodarstwie domowym, w październiku 2009 roku i październiku 2010 r. Okres w stosunku, do którego odnosimy porównanie nazwiemy podstawowym, natomiast okres, z którego dane porównujemy - badanym. Zatem w naszym przykładzie okresem podstawowym jest październik 2009, a okresem badanym październik 2010.
Nazwa |
Jednostka |
Okres podst. X 2009 |
Okres badany X 2010 |
p0 x q0 |
p1 x q1 |
||
|
|
cena |
ilość |
cena |
ilość |
|
|
|
|
p0 |
q0 |
p1 |
q1 |
|
|
energia elektryczna |
kWh |
0,56 |
140 |
0,59 |
140 |
78,4 |
83,78 |
gaz ziemny |
1 m3 |
2,39 |
10 |
2,56 |
9 |
23,9 |
23,04 |
ciepła woda |
1 m3 |
16,9 |
7 |
17,83 |
7 |
118,3 |
124,81 |
CO |
1 m2 pu |
3,4 |
50 |
3,61 |
50 |
170 |
180,5 |
|
|
|
|
|
|
390,6 |
412,13 |
indeksy indywidualne: stanowią relacje poszczególnych ilości (q) i cen (p) z okresu badanego do podstawowego (wyrażone w procentach), zapisujemy następującymi wzorami:
iq = q1/q0 x [100%]
ip = p1/p0 x [100%]
indeks wartości:
Iw = Σp1 x q1 / Σp0 x q0
Iw = 105,5%
Istotne będzie określenie jaki wpływ na zmianę wydatków miały zmiany cen a jaki zmiany ilości. W tym celu konieczne będzie proste założenie: jeżeli chcemy określić wpływ zmiany cen, musimy przyjąć, że nie zmieniły się ilości i odwrotnie. Dla określenia wpływu zmian ilości przyjmujemy stałe ceny.
Przyjmując jako stałe dane z okresu podstawowego otrzymujemy indeksy Laspeyeresa, natomiast stałe z okresu badanego dają nam indeksy Paaschego.
|
p0q0 |
p1q1 |
p1q0 |
p0q1 |
energia elektryczna |
78,40 |
83,78 |
82,60 |
79,52 |
gaz ziemny |
23,90 |
23,04 |
25,60 |
21,51 |
ciepła woda |
118,30 |
124,81 |
124,81 |
118,30 |
CO |
170,00 |
180,50 |
180,50 |
170,00 |
razem: |
390,60 |
412,13 |
413,51 |
389,33 |
PIp = 412,13/389,33 x 100% = 105,9%
Ceny wzrosły o 5,9%.
PIq = 412,13/413,51 x 100% = 99,7%
Ilość nabywanych artykułów zmalała o 0,3% przy założeniu stałych cen z okresu badanego.
Równanie indeksów
Iw = PIp x LIq
Iw = PIq x LIp
Wątpliwości, którymi indeksami najlepiej się posłużyć, czy Laspeyresa, czy Paaschego skłoniły kolejnego badacza Fishera, do zaproponowania średnich z obu indeksów jako miary uniwersalnej.
indeks dynamiki ilości Fishera (kartka z wzorami)
indeks dynamiki cen Fishera (kartka z wzorami)
Wskaźnik inflacji
Publikowane przez GUS dane o inflacji są obliczonym dla obydwu porównanych okresów według formuły Laspeyresa (koszyk z okresu podstawowego) indeksem dynamiki cen towarów i usług konsumpcyjnych.
Badanie tempa zmian
Są one wykorzystywane m.in. do:
waloryzacji zasiłków dla bezrobotnych
do celów określonych w ustawie o emeryturach i rentach z Funduszu Ubezpieczeń Społecznych
w ustawie o podatkach i opłatach lokalnych
Wskaźniki cen (pot. inflacja) służą także do:
ustalania wysokości stypendiów i kosztów kształcenia w Krajowej Szkole Administracji Publicznej
celów związanych z organizacją i funkcjonowaniem funduszy emerytalnych. Wielkości wskaźników (miesięczne, kwartalne i roczne) podawane są przez Prezesa GUS-u w formie specjalnych Komunikatów.
Badanie tendencji (trendu) w szeregach czasowych:
Liczba małżeństw zawartych w Polsce w latach 2006-2008 (w tys.)
kwartały |
lata |
||
|
2006 |
2007 |
2008 |
I |
21,5 |
21,4 |
26,1 |
II |
59,8 |
69,8 |
69,4 |
III |
101,0 |
107,1 |
111,0 |
IV |
43,9 |
50,5 |
51,3 |
razem: |
226,3 |
248,8 |
257,8 |
Badanie tendencji (trendu) tj. stwierdzenie, czy z upływem czasu zjawisko rośnie, czyli ma tendencję rosnącą, czy z upływem czasu zjawisko maleje, czyli ma trend malejący.
Metoda mechaniczna wyznaczania tendencji w szeregach czasowych (wygładzania szeregów) - średnia ruchoma
t |
Yt |
z 3 |
z 5 |
z 7 |
1 |
21,5 |
- |
- |
- |
2 |
59,8 |
60,8 |
- |
- |
3 |
101,0 |
68,2 |
49,5 |
- |
4 |
43,9 |
55,4 |
54,2 |
60,6 |
5 |
21,4 |
45,0 |
68,6 |
64,8 |
6 |
69,8 |
66,1 |
58,5 |
60,0 |
7 |
107,1 |
75,8 |
55,0 |
55,5 |
8 |
50,5 |
61,3 |
64,6 |
65,0 |
9 |
26,1 |
48,7 |
72,8 |
69,3 |
10 |
69,4 |
68,8 |
61,7 |
- |
11 |
111,0 |
77,2 |
- |
- |
12 |
51,3 |
- |
- |
- |
średnie ruchome - są to proste arytmetyczne z określonej liczby obserwacji.
Pierwszą wartość wyłączamy (odrzucamy) i dodajemy kolejną np. z 3 śr.=60,8 (jest liczona z liczb: 21,5; 59,8; 101,0)
Można wyznaczać średnie ruchome z parzystej liczby obserwacji (np. z 2) lecz w takiej sytuacji nie można przypisać wyniku żadnemu z okresów. Dlatego zazwyczaj liczy się ponownie z wyznaczonych średnich średnie z parzystej liczby np. z 2 po 4 itp.
Równanie Władysława Bortkiewicza (kartka z wzorami)
DEMOGRAFIA
kohorta - jest to zbiorowość osób, które przeżyły ten sam typ zdarzeń w tym samym momencie (np. zbiorowość studentów rozpoczynających studia w danym roku, zbiorowość małżeństw zawartych w tym samym roku).
generacja - szczególną kohortą jest generacja, czyli zbiorowość osób mających wspólną datę urodzenia.
Metody analizy demograficznej:
W analizie demograficznej wyróżnia się 2 podejścia:
analiza poprzeczna (przekrojowa) dotyczy badania wielu kohort w określonym momencie lub przedziale czasu, najczęściej jest to rok;
analiza wzdłużna (kohortowa), czyli badanie jednej kohorty w ciągu całego okresu jej trwania. Może ona mieć charakter retrospektywny lub prospektywny (jeśli dotyczy prognozowania zjawiska w przyszłości).
Liczba ludności Polski:
31 XII 2008 r. - 38 136 tys. osób
31 XII 2009 r. - 38 167 tys. osób
Przyrost rzeczywisty ludności:
w 2009 r. - 31 tys. osób
PRZ = PNAT + PM
gdzie:
PNAT - przyrost naturalny
PM - przyrost migracyjny
Przyrost naturalny - jest to różnica między liczbą urodzeń żywych UŻ a liczbą zgonów Z (w badanym okresie t).
PNAT = UŻ - Z
Przyrost migracyjny (wędrówkowy) - jest to różnica między liczbą osób, które przyjechały do danej jednostki terytorialnej (kraju, województwa, powiatu, miasta, gminy) z zagranicy bądź innej jednostki, a liczną osób, które opuściły badaną jednostkę (w okresie t).
Przyrost migracyjny w ruchu zagranicznym - jest to różnica między liczbą imigrantów I a liczbą emigrantów E, w badanym okresie t.
PM = I - E
Przyrost migracyjny w ruchu wewnątrz kraju - jest to różnica między napływem N do danej jednostki administracyjnej, a odpływem O z tej jednostki (w badanym okresie t).
PM = N - O
Przyrost naturalny w 2009 r. w Polsce:
UŻ = 417,6 tys.
Z = 384,9 tys.
PN = 32,7 tys. (był dodatni)
Przyrost migracyjny w 2009 r. w Polsce: (są to dane meldunkowe tzn. pochodzą z meldunków)
liczba imigrantów I = 17,4 tys. osób
liczba emigrantów E = 18,6 tys. osób
stąd PM = -1,2 tys.
Struktura ludności:
wg miejsca zamieszkania
wg płci i wieku
wg cech społeczno-ekonomicznych np. wykształcenia, aktywności ekonomicznej, źródła utrzymania itp.
ad.1.
Współczynnik urbanizacji WURB - jest to udział procentowy mieszkańców miast w ogólnej liczbie ludności (kraju, województwa, powiatu, gminy miejsko-wiejskiej).
ad.2.
według płci:
Obrazuje ją współczynnik feminizacji WF wyrażający liczbę kobiet przypadającą na 100 mężczyzn. Dla młodszych grup wiekowych można liczyć tzw. współczynnik maskulinizacji (odwrotnie).
według wieku:
Podział ludności na grupy w wieku:
przedprodukcyjnym (0-17 lat)
produkcyjnym ( M 18-64 lat, K 18-59 lat)
poprodukcyjnym (M 65 lat i więcej, K 60 lat i więcej)
Obciążenia demograficzne
Liczba osób w wieku przedprodukcyjnym i poprodukcyjnym na 100 (lub 1000) osób w wieku produkcyjnym.
Struktura ludności wg płci i wieku jest czynnikiem kształtującym przebieg wszystkich procesów demograficznych. Graficzny obraz struktury wg wieku i płci nosi nazwę piramida wieku.
Typy struktury (modelowe):
typ progresywny: kształt trójkąta, liczba ludności rośnie, przyrost naturalny jest dodatni
typ zastojowy: kształt dzwonu, liczba ludności nie zmienia się, przyrost naturalny wynosi 0
typ regresywny: kształt wrzecionu, liczba ludności maleje, przyrost naturalny jest ujemny
Współczynniki demograficzne
WT = FT/LTŚR x C
gdzie:
FT - liczba zdarzeń w okresie t
LTŚR - średnia liczba ludności w okresie t (stan w dniu 30 VI lub obliczona)
C - constans (1, 100, 1000- najpopularniejszy mnożnik, 10000)
Średnia liczba ludności - zakłada się, że stan z 31 XII roku poprzedniego jest równy stanowi z 1I danego roku.
LTŚR = LT-131 XII + LT31 XII / 2
np. L2009 r.ŚR = L200831 XII + L200931 XII / 2
Ruch naturalny:
małżeństwa
rozwody
urodzenia
zgony, w tym zgodny niemowląt
małżeństwo - jest to zawarcie związku między dwiema osobami płci odmiennej pociągające za sobą wzajemne prawa i obowiązki.
konkordat podpisany w 1993 r. wprowadza ślubu kościelne równoprawne z cywilnymi,
ustawa z 24 VII 1998 r. zmieniła zasady udzielania ślubu, m.in. obniżyła wiek zawierania małżeństw przez mężczyzn do 18 lat (kobieta za zgodą sądu 16 lat)
Współczynnik natężenia zawierania małżeństw brutto:
WTM = MT/LTŚR x 1000
Współczynnik natężenia zawierania małżeństw netto:
WTM = MT/LTŚR16+ x 1000
Nowożeńcy w Polsce się starzeją (Me wieku nowożeńców M = 27 lat, K = 25 lat w 2005 r.,
M = 27,8 lat, K = 25,8 lat w 2009 r.)
Małżeńskość: małżeństwa, rozwody, separacje
Homogeniczność zawierania małżeństw np. współczynnik homogeniczności wg stanu cywilnego: jest to udział małżeństw zawartych między osobami o takim samym stanie cywilnym (kawaler-panna, wdowiec-wdowa, rozwiedziony-rozwiedziona) w ogólnej liczbie małżeństw.
Sezonowość małżeństw
Oblicza się średnią liczbę zawartych małżeństw na miesiąc i odnosi do niej rzeczywiste miesięczne liczby zawartych małżeństw. Przyjmując średnią miesięczną = 100 dla 2009 r.
marzec - 25
listopad - 32
maj - 81
sierpień - 216
wrzesień - 177
Rozwody
rozwód - rozwiązanie związku małżeńskiego przez odpowiedni sąd w formie przypisanej prawem.
konkordat wprowadził kategorię separacji.
współczynnik natężenia rozwodów
WTR = RT/LTŚR x 1000
RT - liczba orzeczonych rozwodów
współczynnik rozpadu małżeństw
WTR = RT/M x 1000
M - liczba istniejących małżeństw
Główne przyczyny rozwodów w Polsce:
niezgodność charakterów
niedochowanie wierności
nadużywanie alkoholu
Urodzenia:
Od 1994 r. zgodnie z Światową Organizacją Zdrowia (WHO) rozróżnia się 2 kategorie urodzeń:
urodzenia żywe - jest to całkowite wydalenie lub wydobycie z ustroju matki noworodka, niezależnie od okresu trwania ciąży, który po takim wydaleniu lub wydobyciu oddycha bądź wykazuje jakiekolwiek inne oznaki życia;
urodzenia martwe - (zgon płodu), zgon nastąpił przed całkowitym wydaleniem bądź wydobyciem z ustroju matki.
Urodzenia:
wg płci (częstość urodzeń dziewczynek ok. 0,483)
pojedyncze lub wielorakie
natężenie urodzeń na wsi i w miastach
wg wieku matki, poziomu wykształcenia i źródła utrzymania matki
wg kolejności urodzenia dziecka
sezonowość (wg miesięcy)
wg okresu trwania małżeństwa
Współczynnik natężenia urodzeń - rodności
WTROD = UTZ/ LTŚR x 1000
UTZ -liczba urodzeń żywych w okresie t
LTŚR- średnia liczba ludności w okresie t
Płodność kobiet
Natężenie urodzeń w porównaniu do średniej liczby kobiet - płodność ogólna
Natężenie urodzeń w grupie wieku w porównaniu do średniej liczby kobiet w tym wieku - płodność cząstkowa
Współczynnik płodności (ogólny)
WTPŁ = UTŻ/ KTŚR (15-49) x 1000
Wiek 15-49 lat jest przyjmowany w analizie demograficznej tzw. wiek rozrodczy kobiet, inaczej wiek zdolności do prokreacji.
Zgony
zgon - trwałe i nieodwracalne ustanie czynności narządów niezbędnych do życia i w konsekwencji ustanie czynności całego ustroju.
zgon niemowlęcia - dziecka poniżej 1 roku życia;
zgon noworodka - dziecka poniżej 28 dnia życia.
umieralność - natężenie zgonów
śmiertelność - natężenie zgonów wg przyczyn
Współczynnik umieralności ogólnej (2009 = 10,1)
WTUM = ZT/ LTŚR x 1000
Współczynnik umieralności niemowląt
WTUM.N. = ZTN/ UTŻ x 1000
ZTN- liczba zgonów niemowląt
UTŻ- liczba urodzeń niemowląt
Główne przyczyny zgonów w Polsce:
ok. 50% zgonów z powodu chorób układu krążenia
ok. 20% nowotwory
ok. 7% urazy i zatrucia
Umieralność neonatalna - stosunek liczby zgonów noworodków do ogólnej liczby urodzeń żywych.
Umieralność postneonatalna - stosunek liczby zgonów niemowląt powyżej 28 dni życia do ogólnej liczby urodzeń żywych.
Umieralność endogeniczna - związana z życiem wewnątrzmacicznym i okolicznościami porodu tj. spowodowana wrodzonymi wadami.
Umieralność egzogeniczna - ma źródło w styczności niemowląt z otoczeniem (choroby zakaźne, brak higieny, złe odżywianie bądź wypadki).
Migracje wewnętrzne tj. zmiany miejsca stałego pobytu (zamieszkania) podlegające na przekroczeniu granicy administracyjnej miasta bądź gminy, w celu osiedlenia się na stałe w innym mieście lub gminie.
napływ - nowe zameldowania na pobyt na stały
odpływ - wymeldowanie z pobytu stałego
Migracje zagraniczne:
Statystyka prowadzona prze GUS dotyczy tylko przyjazdów do kraju na pobyt stały - imigracji oraz wyjazdów z kraju na stałe - emigracji (na podstawie zgłoszenia wymeldowania z miejsca z pobytu stałego).
Klasyfikacja migracji
Migracje można podzielić wg:
czasu trwania:
stałe
czasowe (krótko lub długookresowe (ponad rok), wahadłowe, sezonowe)
przyczyn migracji
ekonomiczne i polityczne
dobrowolne i przymusowe (np. deportacja, uchodźctwo)
zasięgu migracji: międzykontynentalne, międzypaństwowe, wewnątrzkrajowe
kierunku migracji: wieś-miasto, miasto-wieś, wieś-wieś, miasto-miasto
Mierniki migracji
saldo migracji (różnica)
obrót migracyjny (sama napływu i odpływu)
współczynnik efektywności migracji (saldo migracji przez obrót)
współczynnik napływu i odpływu na 1000 ludności
Współczynnik napływu
WTN = NT/ LTŚR x 1000
współczynnik odpływu
WTN = OT/ LTŚR x 1000
Współczynnik efektywności migracji wewnętrznej
WTN = NT-OT/ NT+OT
Migracje między miastem a wsią zanikły w 2000 r., a ich przypadał na rok 1975. Obecnie odwróciły się kierunki migracji tzn. więcej osób migruje na wieś niż do miasta.
Reprodukcja ludności
procesy umierania i rodzenia zwane są w demografii reprodukcją ludności. Przez długi okres istnienia gatunku ludzkiego poddane były działaniom praw naturalnych. Niekontrolowana reprodukcja ludności trwała od początku gatunku ludzkiego do około połowy XIX wieku.
Miary reprodukcji ludności
Przyrost naturalny i współczynnik przyrostu naturalnego
WPN = WROD - WUM
Współczynnik dynamiki (żywotności) demograficznej
WDD = UŻ/Z
Współczynnik dzietności
WDZ = suma WPL (X=15)
Współczynnik dzietności (płodności ogólnej)
przekrojowy - tj. suma rocznych współczynników płodności dla kolejnych roczników w wieku 15-49 lat. Wyraża on średnią liczbę dzieci, jakby urodziłaby kobieta w ciągu okresu rozrodczego, przy stałym poziomie płodności z danego roku kalendarzowego.
kohortowy - obliczony dla rzeczywistych kohort. Jest to iloraz liczby dzieci urodzonych przez daną kohortę kobiet, do średniej liczby kobiet tej że kohorty będących w wieku rozrodczym.
Współczynnik reprodukcji brutto i netto:
BRUTTO - określa średnią liczbę żywo urodzonych córek przypadająco na jedną kobietę w wieku rozrodczym. Jest to iloczyn współczynnika dzietności i współczynnika wyrażającego częstość urodzeń dziewcząt (stała wartość ok. 0,483).
NETTO - wyraża średnią liczbę żywo urodzonych córek, które dożyją wieku swych matek, a przypadających na 1 kobietę będącą w wieku rozrodczym przy założeniu niezmiennego, aktualnego poziomie cząstkowych współczynnika płodności i umieralności.
Współczynnik reprodukcji netto określa stosunek liczebności dwóch pokoleń matek i córek, za jego pomocą mierzymy stopień zastępowania pokoleń.
Współczynnik reprodukcji netto (WR.N.):
kiedy WR.N. =1 tj. reprodukcja prosta, liczebności matek i córek dożywających wieku matek są identyczne,
kiedy WR.N. <1 - reprodukcja zawężona (pokolenie córek mniej liczne niż matek),
kiedy WR.N. >1 - reprodukcja rozszerzona (pokolenie córek liczniejsze niż matek).
Współczynnik płodności całkowitej gwarantujący prostą zastępowalność pokoleń wynosi 2,12. Próg ten został osiągnięty w Polsce w 1988 r.
Poziom płodności w następnych latach nie gwarantuje już prostej zastępowalności pokoleń.
Trwanie życia
W 1693 r. angielski astronom E. Halley zbudował tablicę trwania życia - na podstawie wykazu zgonów mieszkańców Wrocławia zmarłych w latach 1687-1693.
Tablice trwania życia (do 1970 r. zwane tablicami wymieralności).
Podstawę tablic są prawdopodobieństwa zgonów wyznaczane na podstawie aktualnych cząstkowych współczynników umieralności.
Podstawowe parametry tablic:
lX - liczba dożywających wieku X lat
dX - liczba zmarłych w ciągu roku w wieku X lat
qX - prawdopodobieństwo zgonu w ciągu roku osoby w wieku X lat
PX - prawdopodobieństwo przeżycia roku przez osobę w wieku X lat
LX - średnia liczba osób dożywających wieku X lat
EX - przeciętne dalsze trwanie życia osoby wieku X lat
E0 - przeciętne trwanie życie noworodka
Przeciętne dalsze trwanie życia - średnia liczby lat, jaką ma jeszcze do przeżycia osoba w wieku X lat
Przeciętne trwanie życia - średnia liczby lat, jaką ma szansę przeżyć noworodek urodzony w danym roku
Teorie ludnościowe
- J. Graunt (1620-1674) londyński kupiec uważany za „ojca statystyki i demografii”. Badając ludność Londynu zaobserwował regularność wielu faktów demograficznych jak np. urodzenia według płci, stosunek liczby pogrzebów do liczby chrzcin.
- T. R. Malthus (1766-1834) ekonomista, oparł się na 2 [?] trwałych prawa natury:
1) żywność jest potrzebna do utrzymania człowieka przy życiu;
2) namiętność w pożyciu między osobami różnej płci jest konieczna i będzie trwała zawsze, w podobnej intensywności.
maltuzjanizm - opowiada się za ograniczeniem tempa przyrostu na drodze przeszkód represyjnych i prewencyjnych;
neomaltuzjanizm - opowiada się za ograniczeniem przyrostu ludności za pomocą regulacji urodzeń.
- E.Rosset (1897-1989) prawa demograficzne wojny; Rosset stwierdził, że wojenny cykl demograficzny składa się z dwóch kolejno po sobie występujących faz: destrukcyjnej i kompensacyjnej.
Faza destrukcyjna rozpoczyna się z momentem podjęcia działań wojennych i trwa do czasu ich zakończenia. Charakterystyczny dla tej fazy jest wzrost liczby zgonów i spadek liczby zawieranych małżeństw, a co za tym idzie liczbą urodzeń. Efektem tego spadku jest niż demograficzny.
Faza kompensacyjna rozpoczyna się z chwilą zakończenia wojny. Rodzi się zjawisko wyżu demograficznego. Faza ta trwa przynajmniej tak długo jak faza destrukcyjna, niekiedy może ulec wydłużeniu, gdy straty ludności są szczególnie duże.
- Teoria transformacji demograficznej (przejścia demograficznego)
Autorzy: W. Thompson, Notestein i Kirk
Prekursorem był W. Thompson. W wyniku tego badania podzielił populacje na 3 typy:
o wysokiej stopie urodzeń i zgonów, a zatem niskiej stopie przyrostu naturalnego;
o spadającej stopie zgonów i rosnącej stopie przyrostu naturalnego;
o spadającej stopie urodzeń i spadającej stopie przyrostu naturalnego.
Teoria transformacji określa zamianę reprodukcji ludności z tradycyjnej na nowoczesną, wskazując na trwały i głęboki spadek umieralności i rozrodczości. Przyjście jest fazą cyklu demograficznego, oznaczającego zamianę jednego stanu równowagi w inny.
Przejście demograficzne: proces przywracania równowagi między urodzeniami a zgonami oraz między ludnością a środowiskiem. Wywołane jest urbanizacją i industrializacją. Każda populacja dąży do tego samego docelowego stanu.
Teoria trzyfazowa:
Faza I - tradycyjna - charakteryzuje się wysoką niekontrolowaną płodnością i umieralnością
Faza II - przejściowa - charakteryzuje się spadkiem umieralności i rozrodczości
Faza III - nowoczesna - faza kontrolowanej reprodukcji.
Model czterofazowy:
Faza I - wysoka dzietność (6 dzieci), umieralność ( 60 lat)
Faza II - wysoka rodność (4,5- 6 dzieci), spada umieralność (45-60 lat)
Faza III - spada rodność, spada umieralność
Faza IV - następuje nowa stabilizacja ludności przy niskim poziomie umieralności i rodności
Teoria pięciofazowa:
W krajach wysokorozwiniętych gospodarczo nastąpiło drugie przejście demograficzne.
W fazie V następuje zmniejszenie się liczebności populacji. Niski współczynnik zgonów i jeszcze niższy urodzeń. Liczba Zgonów przewyższa w tej fazie liczbę urodzeń.
Podstawą tablic są prawdopodobieństwa zgonów wyznaczane na podstawie aktualnych cząstkowych współczynników umieralności.
modernizacja - przejście z jednego stanu do stanu drugiego (przejście demograficzne).
Cechami charakterystycznymi dla II przejścia demograficznego są następujące grupy czynników:
I czynniki związane ze zmianami modelu małżeńskości:
opóźnienie wieku zawierania małżeństwa,
osłabienie trwałości związku małżeńskiego,
zmniejszenie częstości zawierania małżeństw,
wzrost natężenia rozwodów,
wzrost liczby rodzin niepełnych,
wzrost liczby związków kohabitacyjnych, w tym związków typu wspólnego życia, ale oddzielnego zamieszkania.
II czynniki dotyczące zmian we wzorcu dzietności, prokreacji, płodności:
zmniejszenie się dzietności poniżej poziomu reprodukcji kobiet, czyli prostej zastępowalności pokoleń,
opóźnienia wieku urodzenia pierwszego dziecka,
przesuwanie największej płodności do starszych grup wieku,
wzrost udziału urodzeń pozamałżeńskich.
III rozpowszechnianie się metod, a także dostępności różnego rodzaju środków antykoncepcyjnych:
stosowanych dla świadomego powoływania do życia dzieci w czasie i liczbie jakiej chcą sami rodzice.
IV zmiana stylu życia, która jest dwukierunkowa:
dążenie do zdrowego odżywiania się, zdrowego życia, aktywności społecznej i fizycznej co prowadzi do obniżenia umieralności do wydłużenia trwania życia;
dążenie do jak najwyższej pozycji w społeczeństwie, również zawodowej, powoduje stres i to, że człowiek żyje w napięciu. Prowadzi to do pogorszenia stanu zdrowia. Pojawiają się też różnego rodzaju cywilizacyjne zagrożenia np. używanie alkoholu.
wykład dr Ewy Miki na UWr z dn. 04.10.2010 r.
wykład dr Ewy Miki na UWr z dn. 08.11.2010 r.
wykład dr Ewy Miki na UWr z dn. 22.11.2010 r.
wykład dr Ewy Miki na UWr z dn. 29.11.2010 r.
wykład dr Ewy Miki na UWr z dn. 06.12.2010 r.
wykład dr Ewy Miki na UWr z dn. 17.01.2011 r.
wykład dr Ewy Miki na UWr z dn. 24.01.2011 r.
wykład dr Ewy Miki na UWr z dn. 20.12.2010 r.
wykład dr Ewy Miki na UWr z dn. 03.01.2011 r.
wykład dr Ewy Miki na UWr z dn. 10.01.2011 r.