Geneza statystyki
Termin statystyka pochodzi od łacińskiego słowa status - oznacza stan, położenie, stosunki. We współczesnym włoskim stato oznacza państwo. W piśmiennictwie słowo statystyka zostało użyte po raz pierwszy przez Gottfrieda Achenwalla w połowie XVIII wieku. Rozumiał on ją jako zbiór szeroko ujmowanych wartości o państwie (warunkach fizjograficznych, ludności, ustroju społecznym, gospodarce, itp.). Przedmiot zainteresowań statystyki jako nauki o państwie wyłonił się z potrzeb ówczesnej administracji państwowej, na użytek której zaczęto gromadzić dane liczbowe. Posługiwano się danymi liczbowymi, ujmowanymi w postaci tabel. W 1834 roku w Londynie powołano Królewskie Towarzystwo Statystyczne, a w 1854 roku w Brukseli zwołano I Międzynarodowy Kongres Statystyczny.
Znaczenie statystyki
-nazwa zbioru informacji dotyczących określonych zjawisk i procesów (urodzeń, rolnictwa itp.)
-nazwa wszelkich prac związanych z gromadzeniem i opracowywaniem danych liczbowych
-nazwa pełnych charakterystyk liczbowych opisujących właściwości jednostek tworzących zbiorowości próbne (np. średnia arytmetyczna z próby, odchylenie standardowe z próby)
-nazwa dyscypliny naukowej zajmującej się metodami analizy zbiorów danych liczbowych, odnoszących się do powtarzalnych zjawisk masowych lub wyników eksperymentów.
3. Definicja statystyki
Statystyka - nauka o metodach ilościowych badania zjawisk masowych. Mają one charakter uniwersalny i są wykorzystywane niemal we wszystkich dyscyplinach naukowych. Językiem statystyki można dokładniej opisać różnorodne zjawiska ilościowe niż werbalnie.
Korzyści wynikające z wykorzystania statystyki
Umożliwia ona dokładniejszy opis rzeczywistości, zmusza do dokładności w działaniu i rozumowaniu, umożliwia formułowanie uogólnień na podstawie uzyskanych wyników, pozwala na przewidywanie zjawisk w przyszłości, dostarcza narzędzi do porządkowania informacji o zjawiskach, a przez to pozwala na budowę ich ogólnego obrazu, umożliwia klasyfikację zjawisk i procesów na systematyczne i przypadkowe.
Funkcje statystyki:
-informacyjna (dająca pełny i obiektywny obraz badanych zjawisk)
-analityczna (umożliwia określenie czynników kształtujących konkretne procesy i zjawiska)
-prognostyczna (pozwala na przewidywanie kierunku rozwoju analizowanych zjawisk)
6. Podział statystyki
a) Statystyka opisowa - zajmuje się problemami programowania badań statystycznych oraz metodami obserwacji statystycznej, sposobami opracowywania i prezentacji materiału statystycznego syntezującym opisem właściwości zbioru danych.
b) Statystyka matematyczna - zajmuje się metodami wnioskowania (estymacji i weryfikacji hipotez) o całej zbiorowości generalnej na podstawie zbadania w sposób losowy pewnej jej częsci zwanej próbą.
c) Statystyki branżowe (stosowane) - zajmują się badaniem poszczególnych sfer działalności (np. transportu, handlu, usług, produkcji). Wykorzystuje się tu zarówno statystyczne metody opisu, jak również wnioskowania.
7. Podstawowe pojęcia statystyczne
a) Zbiorowość statystyczna - zbiory dowolnych elementów (osób, przedmiotów, faktów) podobnych do siebie pod względem określonych właściwości. Kompletny zbiór elementów nosi miano zbiorowości generalnej. Indywidualne składowe zbiorowości nazywamy jednostkami statystycznymi. Zbiorowości statystyczne tworzą jednostki, które istnieją, istniały lub będą istniały w ściśle określonym momencie (np. zbiorowość ludności Polski według stanu na 12.12.2012r.)
b) Zbiorowość dynamiczna - składa się z jednostek obserwowanych w pewnym przedziale czasu. Szereg czasowy.
c) Cechy statystyczne - właściwości elementów składowych zbiorowości. Dzielą się na statyczne i zmienne.
-Cechy statyczne - nie podlegają badaniu statystycznemu, a jedynie umożliwiają zaliczanie jednostek do określonych zbiorowości.
-Cechy zmienne - właściwości, które różnicują jednostki statystyczne między sobą.
Zbiorowości muszą posiadać jedną lub wiele cech stałych oraz jedną lub wiele cech, które je różnicują.
-Cechy niemierzalne (jakościowe) - ich warianty wyrażane są w sposób opisowy
-Cechy mierzalne (ilościowe) - ich warianty wyrażane są za pomocą liczb (np. wiek, wzrost, waga)
8. Rodzaje badań statystycznych
Badanie statystyczne - zespół czynności zmierzających do uzyskania, za pomocą metod statystycznych, informacji charakteryzujących daną zbiorowość. Wyróżnia się:
a) Badania pełne - kompletne, całkowite, wyczerpujące
b) Badania częściowe - niekompletne, niepełne. Obserwowane są tylko niektóre, wybrane z danej zbiorowości generalnej jednostki. Dobór jednostek może być losowy lub celowy.
-Badania reprezentacyjne - z całej zbiorowości pobiera się próbę losową, przeprowadza się dokładne badanie jednostek wchodzących w jej skład, a następnie przenosi się wyniki badań próby na całą populację. Wykorzystuje się tu rachunek prawdopodobieństwa (wnioskowanie statystyczne).
-Badania monograficzne, ankietowe - celowy dobór jednostek.
9. Etapy badania statystycznego(4):
-przygotowanie (szczegółowo rozpisana koncepcja zamierzonego badania)
-obserwacja statystyczna (ustalenie wartości cech ilościowych lub odmian cech jakościowych u jednostek tworzących badaną zbiorowość. Bezpośredni pomiar, zbieranie informacji, wyniki spisów powszechnych, rejestracji bieżącej czy sprawozdawczości statystycznej)
-opracowanie i prezentacja materiału statystycznego
-opis (wnioskowanie) statystyczny
10. Szeregi statystyczne - ciąg wartości liczbowej badanej cechy, uporządkowanych według określonych kryteriów (np. rosnąco lub malejąco).
a) szereg prosty - przedstawia materiał statystyczny wyłącznie według wartości badanej cechy. Porządkowanie w kolejności rosnącej lub malejącej. Zawierają zwykle powtarzające się wartości (np. tabela wzrostu).
b) szereg czasowy - podstawą grupowania są zmiany badanego zjawiska w czasie (np. zachorowania w latach xxxx, xxxy, xxxz)
c) szeregi rozdzielcze - ciąg wartości liczbowych uporządkowanych według wariantów badanej cechy mierzalnej lub niemierzalnej. Poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności.
-szereg rozdzielczy cechy niemierzalnej - zestawienie poszczególnych wariantów danej cechy i odpowiadającej im liczebności.
-szereg rozdzielczy cechy mierzalnej
Szeregi rozdzielcze przedziałowe - dotyczą cechy ciągłej. Liczba klas, ich rozpiętości oraz sposób oznaczania granic przedziałów. Rozpiętość przedziałów (interwał) - różnica między górną a dolną wartością przedziału klasowego.
Prosty szereg rozdzielczy punktowy z cechą mierzalną (np. ilość gmin o danej powierzchni)
Skumulowany szereg rozdzielczy punktowy z cechą mierzalną - otrzymujemy na drodze łączenia kolejnych przedziałów klasowych i dodawania odpowiadających im liczebności.
Prosty przedziałowy szereg rozdzielczy z cechą mierzalną
11. Tablice statystyczne - wykorzystywane są do prezentacji danych uporządkowanych według określonego kryterium.
a) tablice proste - charakteryzują badaną zbiorowość ze względu na jedną cechę (ilościową lub jakościową).
b) tablice złożone - opisują badaną zbiorowość według kilku cech lub wiele zbiorowości według kilku cech.
12. Wykresy statystyczne - są narzędziem analizy i formą rejestracji informacji statystycznych. Skladają się z części tekstowej oraz pola wykresu (np. histogram, diagram, krzywa liczebności).
13. Miary (średnie) klasyczne - obliczane są na podstawie cechy wszystkich jednostek badanej zbiorowości średnia arytmetyczna, średnimi klasycznymi są średnia:
- arytmetyczna,
- geometryczna,
- potęgowa.
Miary (średnie) pozycyjne - wartości cechy statystycznej, występujące u konkretnej jednostki statystycznej, jednostka ta wyróżnia się miejscem (pozycja) w uporządkowanym szeregu statystycznym, średnimi pozycyjnymi są:
- wartości skrajne,
- dominanta,
- mediana,
- kwantyle.
14. miary przeciętne, asymetrii, rozproszenia, koncentracji i spłaszczenia
15. miary średnie
16. Dominanta - (wartość modalna, moda, wartość najczęstsza) to jedna z miar tendencji centralnej, statystyka dla zmiennych o rozkładzie dyskretnym, wskazująca na wartość o największym prawdopodobieństwie wystąpienia, lub wartość najczęściej występująca w próbie. Dla zmiennej losowej o rozkładzie ciągłym jest to wartość, dla której funkcja gęstości prawdopodobieństwa ma wartość największą.
Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach. |
Kwartyl pierwszy Q1 |
dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q1, a 75% równe bądź wyższe od tego kwartyla |
Kwartyl drugi (mediana Me) |
dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa |
Kwartyl trzeci Q3 |
dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q3, a 25% równe bądź wyższe od tego kwartyla |
Decyle |
np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pirwszego |
17. Dyspersja, rozproszenie, zmienność, zróżnicowanie jednostek zbiorowości statystycznej z uwagi na pewną cechę mierzalną. Im bardziej wartości cechy jednostek są skupione dookoła swej średniej, tym mniejsza jest dyspersja i odwrotnie - im bardziej są rozproszone, tym większa jest dyspersja.
Liczbową ocenę dyspersji przeprowadzamy za pomocą miar dyspersji, z których najpowszechniej stosowane są: wariancja, odchylenie standardowe.
Odchylenie standardowe - klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.
Intuicyjnie rzecz ujmując, odchylenie standardowe mówi, jak szeroko wartości jakiejś wielkości (takiej jak np. wiek, inflacja, kurs akcji itp.) są rozrzucone wokół jej średniej. Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej.
Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej.
18.
19. Demografia (od stgr. demos - "lud" i γράφω grapho - "piszę") - dziedzina nauki zajmująca się powstawaniem, życiem i przemijaniem społeczności ludzkiej.
Demografia zajmuje się w równej mierze przyrostem naturalnym, migracjami, strukturą społeczną (wiek, płeć, przynależność zawodowa, narodowość, wyznanie) oraz ich rozmieszczeniem przestrzennym i oddziaływaniami społecznymi i socjologicznymi.
20. Podział demografii:
-demografię formalną (matematyczną, demometrię) - istotą jej jest techniczny pomiar struktur i procesów ludnościowych oraz ich formalna analiza;
-demografię opisową - zajmuje się ona analizą struktur i procesów ludnościowych w kontekście społecznym, ekonomicznym, przestrzennym, kulturowym i innym.
21. Powiązania z innymi naukami:
1) Ekonomia: demografia ekonomiczna - zajmuje się ekonomicznymi uwarunkowaniami i konsekwencjami procesów demograficznych
2) Socjologia: demografia społeczna - zajmuje się społecznymi uwarunkowaniami i konsekwencjami procesów demograficznych
3) Historia: demografia historyczna - zajmuje się opracowywaniem metod pomiaru oraz opisu struktur i procesów demograficznych w minionych okresach
4) Antropologia
5) Psychologia
6) Politologia
22. Ruchy naturalne ludności:
1) zawieranie i rozwiązywanie związków małżeńskich
2) urodzenia i zgony
- powodują zmiany w stanie liczebnym i strukturze ludności wg płci, wieku, stanu cywilnego
- istnieją ścisłe powiązania między natężeniem poszczególnych elementów ruchu naturalnego a strukturą ludności wg płci i wieku (uwidocznia się to szczególnie przy sporządzaniu prognoz demograficznych)
- w analizie ruchu naturalnego szczególne znaczenie ma analiza urodzeń i zgonów
- natężenie poszczególnych elementów ruchu naturalnego jest bardzo zróżnicowane terytorialnie; zależy w dużej mierze od rozwoju społeczno-gospodarczego danego regionu, klimatu, rozwoju kulturalnego, zwyczajów, wierzeń religijnych
RUCHY WĘDRÓWKOWE LUDNOŚCI
Ruchy wędrówkowe (migracja) ludności:
1) Zewnętrzna:
A) Emigracja - wychodźstwo, odpływ ludności poza granice określonego terytorium (państwa)
B) Imigracja - napływ ludności, zmiana miejsca stałego zamieszkania, rozpatrywana od strony kraju przybycia
C) Reemigracja - powrót do dawnego miejsca zamieszkania (kraju, z którego się wcześniej emigrowało)
D) Repatriacja - powrót do ojczystego kraju osób, które wskutek różnych okoliczności (wojna, rewolucja, prześladowania) znalazły się czasowo poza jego granicami
2) Wewnętrzna:
- wędrówki ze wsi do miast
- przenoszenie się ludności do miejsc, w których występuje duży popyt na siłę roboczą lub opuszczenie obszarów o nadwyżce siły roboczej
- wędrówki między jednostkami tego samego stopnia administracyjnego (np. z woj. do woj.)
- ruch wewnątrz danej jednostki administracyjnej (np. wewnątrz województwa)
23.