Statystyka i jej zastosowania
Rok akademicki 2007/2008
Wykłady z prof. dr hab. Wacławą Starzyńska
Podstawy statystyki pod red. W. Starzyńskiej, wyd. Difin, W - wa 2006
T. Michalski, Statystyka, WsiP, W - wa, 2001 lub nowsze
M. Sobczyk, Statystyka, PWN, W - wa, 1988 lub nowsze
Metody statystyczne. Teoria i zadania. Wydawnictwo UŁ, Łódź 2001 lub nowsze [skrypt]
Rocznik statystyczny, GUS, W - wa 2006 lub 2007
Ustawa o statystyce publicznej z dnia 29 czerwca 1995r. wraz z jej nowelizacjami stanowi podstawę niezależności systemu statystycznego w Polsce, a także określa zasady ochrony poufności danych osobowych i innych danych jednostkowych
Podstawowe pojęcia związane ze statystyką
Statystyka
Zbiór danych liczbowych na określony temat, np. statystyka ludności, procesy demograficzne, badanie zjawisk demograficznych, statystyka wypadków, bezrobocia |
Czynności zbierania i opracowywania danych liczbowych, np. w przedsiębiorstwie - statystyka środków trwałych, itp. |
Nauka o metodach zbierania, opracowywania i analizy danych liczbowych o zjawiskach masowych |
Zjawiska masowe - to takie jak społeczne, ekonomiczne odnośnie których prawidłowości ustalane są na podstawie dużej liczby obserwacji, np. procesy demograficzne ( starzenie się społeczeństwa ). Zjawiska masowe to przestępczość, wypadki drogowe, konsumpcja, produkcja ( zjawisko ekonomiczne ).
Jednostka statystyczna - osoba, rzecz lub zjawisko podlegające badaniu statystycznemu, np. gospodarstwo domowe, rolne, powodzie, bezrobotny, gmina, itd.
Zbiorowość statystyczna - jest to ogół jednostek podlegających badaniu statystycznemu, np. kraje UE ( 27 ).
Cechy statystyczne - to właściwości wspólne i różnicujące poszczególne jednostki statystyczne.
Cechy statystyczne
Strukturalne (rzeczowe) |
Przestrzenne (terytorialne) |
Czasowe (dynamiczne) |
Strukturalne - płeć, wiek; przestrzenne - miejsce zamieszkania, województwo; czasowe - rok urodzenia, rok powstania firmy.
Strukturalne
mierzalne |
niemierzalne |
||
skokowe |
ciągłe |
dwudzielne |
wielodzielne |
Wykształcenie to cecha niemierzalna, która jest kategorią jakościową. Cechy mierzalne - to takie cechy, które warianty (wartości) dają się wyrazić za pomocą liczb mianowanych, np. wiek, oceny. Cechy niemierzalne - wykształcenie, płeć, grupa społeczno-zawodowa, kolor oczu.
Skokowe - to liczba osób w gospodarstwie domowym.
Dwudzielne - płeć (są dwa warianty różnicy).
Wielodzielne - wykształcenie
Badanie statystyczne i jego rodzaje
Badanie statystyczne - to ogół prac, których celem jest poznanie prawidłowości charakteryzujących określoną zbiorowość statystyczną. Wybór metody badania statystycznego należy do ważniejszych elementów tego badania, gdyż wymiernie wpływa na jego jakość.
Badania statystyczne
Ze względu na liczbę jednostek biorących udział w badaniu statystycznym
*pełne (wyczerpujące, całkowite)
*częściowe (metoda reprezentacyjna)
Pełne to np. spisy ludności (narodowy spis powszechny), sprawozdawczość, rejestracja statystyczna.
Sprawozdawczość statystyczną prowadzą przedsiębiorstwa, przedszkola.
Rejestracja - urzędy gminy, instytucje.
Częściowe - metoda reprezentacyjna, badania monograficzne, ankietowe.
Badania monograficzne - badania dotyczą jednej jednostki.
Ze względu na częstotliwość prowadzenia badań:
*stałe
sprawozdawczość, rejestracja
badanie budżetów gospodarstw domowych
*okresowe
spisy
*doraźne
badania profilaktyczne (służba zdrowia)
Etapy badania statystycznego
I Projektowanie badania
II Obserwacja statystyczna
III Opracowanie zebranego materiału statystycznego
IV Analiza opracowanego materiału statystycznego
Ad. I
Szereg czynności - najważniejsze to: określenie celu, zakresu, jednostki, zbiorowości, metody badania, terminu prowadzenia badania, ustalenie kosztorysu badania, przygotowanie kadry przeprowadzającej badanie, zbudowanie formularza statystycznego, przeprowadzenie badań pilotażowych.
Ad. II
Moment zbierania danych, np. metodą wywiadu kwestionariuszowego.
Ad. III
Kontrola
Przed przystąpieniem do opracowania materiału statystycznego należy przeprowadzić kontrolę materiału statystycznego. Ma ona na celu sprawdzenie czy zebrany materiał jest kompletny, zawiera wszystkie zapisy niezbędne w formularzu, czy też zachodzi zgodność rachunkowa informacji zawartych w materiale. Ta kontrola nosi nazwę kontroli formalnej.
W celu wykrycia ewentualnych błędów i nieścisłości, surowy materiał statystyczny poddaje się kontroli merytorycznej i logicznej. Kontrola ta wymaga wszechstronnej znajomości badanego zjawiska. W materiale statystycznym mogą pojawić się dwa rodzaje błędów:
błędy przypadkowe (losowe)
błędy systematyczne (zamierzone)
Błędy przypadkowe, inaczej wielokierunkowe, nierozmyślne to głównie pomyłki w zapisie cyfr, np. czeski błąd ( przestawienie cyfr ). Błędy te mają zwykle różny kierunek ( in + lub in - ) dzięki czemu nie zniekształcają poważnie wyników badania.
Błędy systematyczne, określane również jako tendencyjne lub jednokierunkowe, polegają na podawaniu zniekształconych ( świadomie lub nieświadomie )danych, np. zaniżanie dochodu ( podaje się wtedy pewien przedział liczbowy dla zminimalizowania wystąpienia błędu ).
Grupowanie danych statystycznych
Grupowanie statystyczne ma na celu podział zbiorowości na grupy jednostek podobnych do siebie. Jeśli grupowanie zostało dokonane w sposób prawidłowy, mamy większą gwarancję że obliczane mierniki statystyczne charakteryzujące badania społeczne i badaną społeczność będą również prawidłowe. W zależności również od tego ile cech statystycznych będzie brane pod uwagę przy podziale społeczności. Rozróżnia się dwa rodzaje grupowania statystycznego:
grupowanie proste ma miejsce wówczas, gdy analizowana jest tylko jedna cecha statystyczna. W wyniku grupowania prostego powstają szeregi statystyczne.
grupowanie złożone - przeprowadzane jest ze względu na kilka cech jednocześnie.
Szeregi statystyczne dzielimy na:
szczegółowe |
rozdzielcze |
przestrzenne (geograficzne) |
czasowe |
|||
|
punktowe |
przedziałowe |
|
momentu |
okresu |
|
|
|
otwarte |
zamknięte |
|
|
|
W sposób formalny ( za pomocą symboli matematycznych ) szeregi statystyczne dla cech mierzalnych zapisujemy następująco:
X - cecha mierzalna
Xi - warianty ( wartości cechy X )
i = 1,2, ......, N - szereg szczegółowy
i = 1,2, ...., K - szeregi rozdzielcze
ni - liczebności ( częstości absolutne lub względne )
Dla poszczególnych wartości cechy lub jej przedziałów ( dotyczy tylko szeregów rozdzielczych ).
N - liczba badanych jednostek w zbiorowości lub w próbie.
Szereg szczegółowy Szereg rozdzielczy
( jest precyzyjny ) ( punktowy )
Xi |
ni |
X1 X2 . . . X K
|
n1 n2 . . . n K
|
ogółem |
K Σ n1 i =1 |
Xi
X1
X2
.
.
.
Xn
Jest to najbardziej odpowiedni
szereg przy małej obserwacji.
Następuje oddzielenie cechy
od jej liczebności.
Xi |
ni |
2 3 4 5 6 |
10 30 50 20 10 |
ogółem |
120 |
Szereg rozdzielczy
( przedziałowy )
X0i - X1i
|
n1
|
X0i |
X01 - X11 X02 - X12 . . . X0K - X1K
|
n1 n2 . . . n K
|
|
ogółem |
K Σ n1 i =1
|
|
K Σ n1 = N i =1 |
X0i - dolna granica przedziału
X1i - górna granica przedziału
Szeregi przedziałowe pojawiają się na ogół, gdy cecha jest mierzalna, ma wiele wariantów i charakteryzuje się rozproszeniem cechy. Przedziały klasowe tworzą się w sposób przybliżony ( metoda prób i błędów ). Rozpoczynamy od większej liczby przedziałów ( bardziej szczegółowo ), a jeśli pewne przedziały będą puste, wówczas sąsiednie łączymy ze sobą, przechodzimy do mniej szczegółowego przedziału. Przedziały klasowe mogą być o jednakowej rozpiętości ( częściej ) i o różnej rozpiętości.
6