Wyk艂ad 1.
Rodow贸d, przedmiot bada艅 i podstawowe poj臋cia statystyczne. Uwagi na temat organizacji bada艅 statystycznych
Rodow贸d statystyki
badania pa艅stwowznawcze - pocz膮tek spis贸w ludno艣ci i zasob贸w datuje si臋 od bardzo dawna (np. Egipt, Chiny, 2000 lat p.n.e., Rzym 600 lat p.n.e.).
arytmetycy polityczni np. J.Graunt, W.Petty, (XVII w.).
tabelarystysci np. G. Achenwald (XVIIIw.) pierwszy wprowadzi艂 termin statystyka (status - pa艅stwo), J.K. Kirgi艂ow (opis tabelaryczny Rosji, XVIII w.), J.P. Anchersen (opis tabelarystyczny Danii, XVIII w.).
badania zjawisk gospodarczych i spo艂ecznych, A.Quetlet (XVII-XIX w.)
dzia艂alno艣膰 badawcza i naukowa oparta na teorii rachunku prawdopodobie艅stwa:
B.Pascal (XVII w.), P.Fermat (XVII w.), A. de Moivre, (XVIII w.), P.C. Laplace (XIX w.), K.F. Gauss (XIX w.), S.Poisson (XIX w.).
podejmowanie decyzji diagnostycznych w warunkach niepewno艣ci: K. Pearson, R.A. Fisher, J.Neyman, E.S.Pearson, A. Wald (XX w.)
Statystyka - nauka traktuj膮ca o ilo艣ciowych metodach badania zjawisk (proces贸w) masowych.
Metody statystyczne obejmuj膮:
deterministyczne metody opisowe (statystyka opisowa).
wnioskowanie statystyczne (metody uog贸lniania wynik贸w otrzymanych z pr贸by losowej na ca艂膮 populacj臋).
Zadania statystyki
opis zjawiska masowego (procesu masowego)
wykrycie prawid艂owo艣ci jakie w tych zjawiskach istniej膮
Podstawowe poj臋cia statystyczne:
Zbiorowo艣膰 statystyczna (populacja, masa statystyczna) - zbi贸r dowolnych element贸w obj臋tych badaniem statystycznym. Elementy sk艂adowe badanej zbiorowo艣ci nazywamy jednostkami statystycznymi.
Cecha statystyczna - w艂a艣ciwo艣ci jednostek zbiorowo艣ci statystycznych. Cechy statystyczne dziel膮 si臋 na sta艂e i zmienne. Badaniom statystycznym podlegaj膮 cechy zmienne.
Cechy:
jako艣ciowe (niemierzalne - nie da si臋 ich zmierzy膰, lecz tylko okre艣li膰 s艂ownie np. rodzaj badanej ska艂y, gatunek drzewa w lesie).
ilo艣ciowe (mierzalne).
quasi-ilo艣ciowe (okre艣la nat臋偶enie badanej w艂a艣ciwo艣ci w spos贸b opisowy np. stopie艅 zachmurzenia nieba w prognozach pogody).
skokowe (liczba przekrocze艅 stanu alarmowego rzeki w ci膮gu roku).
ci膮g艂e (np. temperatura, ci艣nienie, obj臋to艣膰, masa).
W praktyce zdarza si臋 cz臋sto 偶e podzia艂 cech na skokowe i ci膮g艂e nie jest ostry.
Gdy cechy statystyczne maj膮 dwa r贸偶ne warianty to m贸wimy, 偶e podzia艂 jest dychotomiczny: np. cecha: zawarto艣膰 danego zwi膮zku chemicznego w glebie mo偶e by膰 naturalna b膮d藕 pochodzenia antropogenicznego.
Rodzaje bada艅 statystycznych
Badania mog膮 by膰:
pe艂ne (ca艂kowite, wyczerpuj膮ce) - obejmuj膮ce wszystkie jednostki zbiorowo艣ci statystycznej.
niepe艂ne (cz臋艣ciowe) obejmuj膮ce niekt贸re jednostki zbiorowo艣ci statystycznej.
szacunki interpolacyjne lub ekstrapolacyjne.
(Interpolacja - szacowanie nieznanych warto艣ci cechy na podstawie znanych warto艣ci s膮siednich).
(Ekstrapolacja - szacowanie warto艣ci wykraczaj膮cych poza przedzia艂 znanych warto艣ci).
ci膮g艂e
okresowe
dora藕ne
rodzaje bada艅 niepe艂nych
ankietowe
monograficzne (szczeg贸艂owy i wszechstronny opis jednej, typowej jednostki statystycznej (lub ich niewielkiej ilo艣ci).
reprezentacyjne ( cz臋艣ciowe badanie statystyczne oparte na pr贸bie pobranej ze zbiorowo艣ci generalnej w spos贸b losowy).
Etapy bada艅 statystycznych (zarys):
przygotowanie (programowanie) badania:
Badanie statystyczne powinno by膰 podporz膮dkowane konkretnemu celowi.
Nale偶y dok艂adnie okre艣li膰 przedmiot badania tzn. jednostk臋 badania i zbiorowo艣膰 statystyczn膮. Nale偶y podj膮膰 decyzj臋 co do metody badania (pe艂ne czy niepe艂ne).
obserwacja statystyczna - polega na ustaleniu warto艣ci cech ilo艣ciowych lub odmian cech jako艣ciowych u wszystkich jednostek tworz膮cych zbiorowo艣膰 statystyczn膮. Odbywa si臋 drog膮 bezpo艣redniego pomiaru lub zbierania informacji. Zbi贸r danych uzyskanych w wyniku obserwacji nazywamy materia艂em statystycznym.
Materia艂 statystyczny powinien by膰 poddany kontroli pod wzgl臋dem mo偶liwych b艂臋d贸w. Kontrola jest dwojakiego rodzaju:
formalna (ilo艣ciowa) polega na sprawdzeniu kompletno艣ci, pe艂no艣ci i zupe艂no艣ci materia艂u statystycznego
merytoryczna - obejmuje kontrol臋 logiczn膮 i arytmetyczn膮.
B艂臋dy wyst臋puj膮ce w materiale statystycznym mog膮 by膰:
systematyczne (tendencyjne) -wynikaj膮 z jednokierunkowej tendencji do zniekszta艂cania badanej rzeczywisto艣ci. B艂臋dy systematyczne sumuj膮 si臋.
niesystematyczne (przypadkowe) - s膮 pope艂niane nieumy艣lnie np. z nieuwagi, przez pomy艂k臋 itp.
opracowanie i prezentacja materia艂u statystycznego
grupowanie - polega na wyodr臋bnieniu jednorodnych lub wzgl臋dnie jednorodnych cz臋艣ci w ramach wi臋kszej i zr贸偶nicowanej zbiorowo艣ci statystycznej. Statystyka nie podaje sztywnych regu艂 dotycz膮cych grupowania. Zaleca si臋 jednak stosowanie dw贸ch kryteri贸w:
jednostki zaliczane do tej samej grupy nie powinny by膰 zbyt zr贸偶nicowane.
liczba grup nie powinna by膰 zbyt du偶a.
Dzielenie materia艂u statystycznego ze wzgl臋du na jedn膮 cech臋 nazywamy grupowaniem prostym.
Dzielenie materia艂u statystycznego na podstawie kilku cech nazywamy grupowaniem z艂o偶onym.
Jednolity system grupowania nazywamy klasyfikacj膮.
Z punktu widzenia celu grupowanie dzielimy na:
- typologiczne - polega na wyodr臋bnianiu grup na podstawie wariant贸w cech jako艣ciowych.
- wariacyjne - oparte si臋 na cechach ilo艣ciowych.
zliczanie.
Niezwykle wa偶na jest prezentacja materia艂u statystycznego.
Materia艂 ten prezentujemy przy pomocy tzw. szereg贸w statystycznych.
Szeregi statystyczne mog膮 by膰 przedstawiane w r贸偶norodnej postaci np. w formie tabelarycznej, wykres贸w, histogram贸w.
Rodzaje szereg贸w statystycznych
Szereg szczeg贸艂owy - materia艂 statystyczny uporz膮dkowany wy艂膮cznie wed艂ug warto艣ci badanej cechy (w kolejno艣ci malej膮cej lub niemalej膮cej). Np. temperatura w po艂udnie w danej miejscowo艣ci w danym tygodniu: 12,5; 13,1; 14,3; 14,4; 15,1;16,5; 17,7.
Szereg rozdzielczy -zbi贸r warto艣ci liczbowych uporz膮dkowanych wed艂ug wariant贸w cechy mierzalnej lub niemierzalnej. Poszczeg贸lnym wariantom przyporz膮dkowane s膮 odpowiadaj膮ce im liczebno艣ci. Szeregi rozdzielcze dzielimy na punktowe (w przypadku cechy skokowej) lub przedzia艂owe (w przypadku cechy ci膮g艂ej lub punktowej).
Przyk艂ad szeregu rozdzielczego punktowego, wybrane cechy: wojew贸dztwo oraz liczba pomiar贸w zanieczyszczenia gleby dan膮 substancj膮.
Wojew贸dztwo |
Liczba pomiar贸w |
Mazowieckie |
500 |
Lubuskie |
112 |
Dolno艣l膮skie |
366 |
Kujawsko-Pomorskie |
405 |
Ma艂opolskie |
239 |
....... |
....... |
Przyk艂ad szeregu rozdzielczego przedzia艂owego, wybrana cecha - zanieczyszczenie gleby (w ppm).
Zanieczyszczenie gleby (w ppm) |
Liczba pomiar贸w na danym obszarze |
Od 0 do 40 |
39 |
40-60 |
4 |
60-80 |
8 |
80-100 |
3 |
ponad 100 |
1 |
Buduj膮c szeregi rozdzielcze musimy zadecydowa膰 o:
liczbie przedzia艂贸w klasowych
ich rozpi臋to艣ci
sposobie okre艣lenia granic przedzia艂贸w
Niekt贸re sugestie literaturowe na temat liczby przedzia艂贸w:
- liczba przedzia艂贸w (k) powinna mie艣ci膰 si臋 w granicach 15-25 (nie mniej ni偶 10. (Yule i Kendall)
liczba przedzia艂贸w powinna mie艣ci膰 si臋 w granicach 10-20 (S. Szulc)
inne sugestie
:
(N oznacza liczebno艣膰 grupy)
Najlepszym przewodnikiem jest jednak zdrowy rozs膮dek i znajomo艣膰 celu, kt贸remu ma s艂u偶y膰 podzia艂 zbiorowo艣ci na klasy.
Rozpi臋to艣膰 przedzia艂u i (interwa艂, rozst臋p) obliczamy ze wzoru:
gdzie i-interwa艂 przedzia艂owy, xmax - najwi臋ksza warto艣膰 cechy, xmin - najmniejsza warto艣膰 cechy, k - liczba przedzia艂贸w.
opis lub wnioskowanie statystyczne (uwagi).
opis statystyczny ma charakter sumaryczny i odnosi si臋 do ca艂ej zbiorowo艣ci a nie do poszczeg贸lnych jednostek. Opisu statystycznego dokonuje si臋 za pomoc膮 zbioru odpowiednich parametr贸w takich jak np. 艣rednia arytmetyczna, odchylenie standardowe, wsp贸艂czynnik zmienno艣ci itp.
r贸偶nica pomi臋dzy opisem a wnioskowaniem statystycznym polega na tym, 偶e opis dotyczy tylko danej zbiorowo艣ci statystycznej, za艣 wnioskowanie statystyczne ma miejsce w贸wczas, gdy badanie jest reprezentacyjne tzn. oparte jest na pr贸bie losowej i jego wyniki s膮 uog贸lniane na ca艂膮 populacj臋 generaln膮. Metody wnioskowania statystycznego oparte s膮 na statystyce matematycznej.
1
OKRES脫W
MOMENT脫W
PRZEDZIA艁OWE
PUNKTOWE
CECH
NIEMIERZALNYCH
CECH
MIERZALNYCH
CZASOWE
(DYNAMICZNE)
GEOGRAFICZNE
(PRZESTRZENNE)
ROZDZIELCZE
(STRUKTURALNE)
SZCZEG脫艁OWE
(WYLICZJ膭CE)
SZEREGI STATYSTYCZNE