Słowo „statystyka” pochodzi od łacińskiego słowa „status”, które oznacza stan rzeczy, państwo. W łacinie średniowiecznej słowa „status” używano dla wyrażenia politycznego stanu rzeczy.
Statystyka jest dyscypliną naukową, zajmującą się „konstrukcją metod liczbowego opisu i wnioskowania o zjawiskach masowych”.[1] Z takiej definicji wynika, że należy wyróżnić tutaj dwa pojęcia: metodę i zjawisko masowe.
Metoda statystyczna to sposób badania liczbowego określonych zbiorowości, za pomocą odpowiednich narzędzi i procedur.
Badanie statystyczne jest procesem złożonym, który „obejmuje cały kompleks problemów, zagadnień i procedur organizacyjnych, metodologicznych i merytorycznych. Związane są one zarówno z „produkcją” danych liczbowych, jak i z ich analizą statystyczną.”[1] Proces badania statystycznego obejmuje więc całokształt czynności badawczych, prowadzących do poznania zjawiska masowego za pomocą odpowiednich metod statystycznych.
Obowiązująca ustawa o statystyce publicznej definiuje badanie statystyczne jako „zbieranie, gromadzenie i opracowywanie danych statystycznych oraz ogłaszanie i udostępnianie wyników dokonanych obliczeń, opracowań i analiz, w tym podstawowych wielkości i wskaźników”.[2]
Badanie statystyczne jest zatem szeregiem czynności sprowadzających się do zebrania, przetworzenia i analizy informacji na temat zbiorowości statystycznej z punktu widzenia wybranych cech statystycznych, opisujących jednostki należące do tej zbiorowości. Proces badania statystycznego jest wieloetapowy, i można wyróżnić w nim cztery zasadnicze etapy:
programowanie (przygotowanie) badania
obserwacja statystyczna (empiryczna)
opracowanie materiału statystycznego
W etapie pierwszym formułowana jest całościowa koncepcja metodologiczna badania. Etap drugi poświęcony jest zbieraniu danych statystycznych o wariantach cech oraz jednostkach zbiorowości statystycznej. Z kolei w etapie trzecim przetwarzane są informacji pozyskane podczas obserwacji. Ostatni etap poświęcony jest zagadnieniom analitycznym.
Bibliografia:
Luszniewicz A., Statystyka Ogólna, Państwowe Wydawnictwo Ekonomiczne, Warszawa 1987.
Ustawa z 29 czerwca 1995, o statystyce publicznej, rozdz. I, art. 2.
Precyzyjne określenie celów badania (zarówno ogólnych jak i szczegółowych) ma istotny wpływ na jakość badania. Każde badanie musi być podporządkowane konkretnemu celowi. Dotyczy to również sformułowania hipotez badawczych, czyli przypuszczeń o występowaniu, o wielkości danego zjawiska, o stosunku do innych zjawisk lub zależności pomiędzy zjawiskami.
W zależności od wyznaczonych celów, określenie zbiorowość statystyczna (przedmiot badania), pod względem odpowiednich cech poszczególnych jednostek statystycznych (zakres badania).
Kolejna czynność to wybór odpowiedniej metody badania, do dyspozycji jest:
Wybór metody badania uzależniony jest od czynników natury statystycznej (cel, przedmiot i zakres badania, oraz stopień jego szczegółowości) i pozastatystycznej (dostępne zasoby ekonomiczne oraz ograniczony czas).
Podział metod badań statystycznych związany jest z udziałem zbiorowości statystycznej w badaniu. Wyróżniania się badanie pełne, częściowe oraz tzw. metody pośrednie.
Metoda badania pełnego polega na pełnej obserwacji zbiorowości statystycznej. Każda jednostka tej zbiorowości jest poddana badaniu, czyli zbierane są informacje o wszystkich jednostkach statystycznych zbiorowości. Do badań tego typu zaliczany jest:
spis statystyczny
rejestracja statystyczna
sprawozdawczość statystyczna
Spis statystyczny jest cyklicznym bądź jednorazowym badaniem pełnym, dostarczającym niezbędnych informacji o stanie i strukturze zjawiska w określonym momencie. Badanie polega na zebraniu informacji o każdej jednostce statystycznej przez rachmistrzów spisowych i umieszczeniu ich na formularzach spisowych. W Polsce do najważniejszych spisów statystycznych należą: Narodowy Spis Powszechny i Mieszkań (ostatni w 2002 r., planowany w 2011 r.), Powszechny Spis Rolny (ostatni w 2002 r., planowany w 2010 r. ).
Rejestracja statystyczna to badanie pełne polegające na systematycznym (bieżąca rejestracja statystyczna), rzadziej jednorazowym (doraźna rejestracja statystyczna) notowaniu zdarzeń i faktów będących przedmiotem badania. Prowadzona jest przez odpowiednie instytucje (np. sądy, organy administracji publicznej) i polega na udzielenia informacji objętych tematem rejestracji, w określonym miejscu rejestracyjnym oraz w określonym czasie (np. ewidencja działalności gospodarczej, ewidencja pojazdu)
Sprawozdawczość statystyczna to rodzaj pełnego badania statystycznego, odbywającego się na zasadzie przekazywania przez podmiot zobligowany przepisami prawnymi, danych statystycznych do instytucji organizujących badanie. Dane te, przekazywane są za pomocą sprawozdań statystycznych (wypełnionych formularzy). Przykładem takiej sprawozdawczości mają przedsiębiorstwa prowadzące pełną księgowość. Przedsiębiorstwa przekazują do Głównego Urzędu Statystycznego (GUS) informacje m.in. o wynikach finansowych, stanie zatrudnienia.[1]
Bibliografia:
Podstawy statystyki, pod. red. Wacławy Starzyńskiej, Difin , Warszawa 2004.
Badanie częściowe (niepełne) obejmuje obserwacją wybrane części populacji generalnej (próbę). Wyniki obserwacji dokonane na próbie mogą być uogólniane na całą populacje.
Badanie to jest zalecane w przypadkach gdy:
• proces obserwacji związany jest ze zniszczeniem bądź uszkodzeniem badanego produktu (np. crash testy ),
• badana zbiorowość jest zbyt liczna, proces badania byłby czasochłonny i kosztowny (np. badanie preferencji politycznej mieszkańców Polski).
Wyróżnia się następujące metody (rodzaje) badań częściowych:
metoda reprezentacyjna
metoda monograficzna
metoda ankietowa
Badanie reprezentacyjne polega na obserwacji grupy jednostek wybranej z populacji generalnej. Próba ta powinna być reprezentacyjna dla całej populacji, czyli musi spełniać dwa warunki: musi być stosunkowo liczna, oraz dobrana w sposób losowy. Losowanie jednostek do próby musi być takie, aby rezultaty badania mogły być przeniesione na całą populacje. W ten sposób badana jest m.in. kontrola jakości produktów, warunki mieszkaniowe, wstępna ocena plonów w rolnictwie.
Badanie monograficzne sprowadza się do wszechstronnego opisu i szczegółowej analizie wybranej (zwykle wybór jest celowy) jednostki lub niewielkiej grupy jednostek badanej zbiorowości statystycznej. Obserwacja umożliwia dokładne poznanie cech przedmiotu badania w formie ilościowej i jakościowej. Metoda monograficzna używane jest do badania m.in. rozwoju społecznego krajów, miast, wsi.
Badanie ankietowe przeprowadzane jest najczęściej w sytuacjach, gdy celem badania jest ustalenie opinii o konkretnych faktach. Dane statystyczne o zbiorowości lub zjawisku gromadzone są przy pomocy ankiet (formularz zawierający pytania odpowiednio zaprojektowane). Badanie stosowane jest w celu m.in. ustalenia opinii określonej grupy ludzi o produkcie, wydarzeniu.
Metody pośrednie (szacunek statystyczny) polegają „na ustaleniu pewnych wielkości lub właściwości nieznanej zbiorowości na podstawie zbiorowości znanej, pozostającej nią w określonym związku.”[1] Rozróżniane są dwie metody: interpolacja i ekstrapolacja.
Interpolacja polega na oszacowaniu hipotetycznej wartości cechy na podstawie pozostałych (sąsiednich) znanych wartości.
Ekstrapolacja sprowadza się na oszacowaniu hipotetycznej wartości wykraczającej poza okres badania. Szacunek statystyczny wykorzystywany jest w przypadkach kiedy nie jest możliwe lub mija się z celem zastosowanie badania pełnego, a nawet częściowego.
Bibliografia:
Sobczyk M., Statystyka, Wydawnictwo Naukowe PWN, Warszawa 1999.
Drugim etapem badania statystycznego jest obserwacja statystyczna, polegająca na ustalaniu wartości cech wszystkich jednostek zbiorowości (badanie pełne) lub próbie zbiorowości (badanie częściowe).
Zbiór danych zebranych podczas obserwacji tworzy materiał statystyczny. Informacje zgromadzone specjalniedla celów badania stanowią materiał pierwotny (np. dane pozyskane w czasie spisu powszechnego). Natomiast dane zebrane wcześniej z innych powodów, a wykorzystane w badaniu statystycznym są określane mianem wtórnego materiału statystycznego (np. publikacje statystyczne).[1]
Materiał statystyczny obciążony jest z reguły błędami, to też musi być poddany kontroli merytorycznej i formalnej. Kontrola umożliwia wyeliminowanie błędów w celu uzyskanie jak najbardziej dokładnego obrazu badanej rzeczywistości.
Bibliografia:
Parlińska M., Parliński J., Badanie statystyczne z Excelem, Wydawnictwo SGGW, Warszawa 2007.
Kolejnym etapem badania statystycznego jest opracowanie materiału statystycznego, obejmujące grupowanie i zliczanie pozyskanych danych. Opracowanie ma na celu ułatwienie analizy zbiorowości.
Grupowanie statystyczne polega na podziale zbiorowości na grupy jednostek podobnych względem siebie. Jednostki poddane zostają systematyzacji według zmienności podlegających badaniu cech statystycznych (zmiennych). Grupowanie prowadzi do zbudowania szeregu statystycznego. Rozróżnia się grupowanie typologiczne i wariancyjne.
Grupowanie typologiczne polega na podziale niejednorodnej zbiorowości z punktu widzenia cechy zmiennej na grupy jednorodne. Odbywa się to na podstawie wariantów cech jakościowych.
Grupowanie wariancyjne oparte jest na cesze ilościowej i polega na łączeniu jednostek o równych lub zbliżonych wartościach cech w klasy. Jednolity system grupowania określany jest mianem klasyfikacji.
Ze względu na ilość cech, które będą stanowić kryterium podziału zbiorowości rozróżnia się grupowanie proste (podział zbiorowości ze względu na jedną cechę) oraz złożone (podział zbiorowości ze względu na kilka cech równocześnie). Grupowanie proste ma postać szeregu statystycznego, określanego również jako rozkład empiryczny.
Opracowany materiał przedstawiony zostaje w postaci szeregów statystycznych, które również mogą przyjąć formę tablic i wykresów. Szereg statystyczny to zbiór wartości liczbowych badanej cechy uporządkowany według określonych kryteriów.
Materiał pierwotny z reguły przedstawiony jest w postaci indywidualnego szeregu wartości cech. Szereg szczegółowy tworzą uporządkowane (malejąco lub rosnąco) wartości badanej cechy statystycznej.