W każdym badaniu statystycznym można wyróżnić następujące etapy:
1) przygotowanie (programowanie) badania
2) obserwację statystyczną
3) opracowanie i prezentację materiału statystycznego
4) opis lub wnioskowanie statystyczne
Etap pierwszy obejmuje czynności przygotowawcze, takie jka : ustalenie celu i metody badania, określenie zbiorowości statystycznej i cech podlegających badaniu, zdefiniowanie jednostki statystycznej i sprawozdawczej. Każde badanie statystyczne powinno być np: zbadanie częstotliwości rozmaitych przyczyn zgonów niemowląt w pewnym okresie i na określonym terytorium czy ustalenie siły i kierunku współzależności między paleniem tytoniu a rakiem płuc. Po ustaleniu celu badania statystycznego należy określić jego przedmiot, czyli zbiorowość statystyczną i dednostkę badania. Zbiorowość statystyczna i jednostka badania powinny być ściśle zdefiniowane pod względem rzeczowym (co?) czasowym (kiedy?) i przestrzennym (gdzie?). Z punktu widzenia poprawności wyników badania istotne jest również właściwe określenie jednostki sprawozdawczej. Jednostkami sprawozdawczymi są te jednostki, które posiadają odpowiednie źródła danych niezbędnych w badaniu. Mogą być nimi osoby fizyczne lub prawne( przedsiębiorstwa, instytucje, organizacje społeczne itp. ) Na etapie przygotowania badania należy ponadto podjąć decyzję co do metody badania( pełne czy częściowe).
Drugim etapem badania statystycznego jest obserwacja. Obserwacja - w najogólniejszym znaczeniu- polega na ustaleniu wartości cech ilościowych lub odmian cech jakościowych u wszystkich jednostek tworzących zbiorowść statystyczą lub u prawidłowo dobranej ich reprezentacji. Może to się odbywać za pomocą bezpośredniego pomiaru lub zbierania informacji od jednostek sprawozdawczych. Zbiór danych uzyskanych w wyniku obserwacji nazywamy materiałem statystycznym. Jeżeli dane są gromadzone specjalnie dla celów badania statystycznego, to nazywamy je materiałem pierwotnym. Materiałem pierwotnym są np. dane zbierane podczas narodowego spisu powszechnego ludności. Służą one wyłącznie do realizacjiprogramu statystycznego. Dane statystyczne zgromadzone z innych powodów (np. do celów związanych z polityką podatkową lub dyscypliną pracy) a wykorzystywane w badaniach statystycznych znazywamy materiałem wtórnym. W badaniach statystycznych wiekszą wartość poznawczą mają materiały pierwotne, ponieważ są aktualne, gromadzone z określoną dokładnością i nie są obciążone zbytecznymi informacjami.
Błędy systematyczne wynikają z jednokierunkowej tendencji do zniekształcenia badanej rzeczywistości. Błędy przypadkowe są popełniane nieumyślnie i mogą wynikać z nieuwagi, z nieumiejętności podania prawidłowych informacji bądź też ze zwykłego niedbalstwa.
W celu wykrycia ewentualnych błędów i nieścisłości surowy materiał statystyczny poddaje się dwojakiego rodzaju kontroli: formalnej i merytorycznej.Zadaniem kontroli formalnej (ilościowej) jest sprawdzenie kompletności, pełnośći i zupełności danego materiału statystycznego. Kontrola merytoryczna obejmuje kontrolę logiczną i arytmetyczną. Pierwsza z nich polega na sprawdzeniu, czy treść rubryk formularza statystycznego opowiada rzeczywistość (np. może się zdarzyć , że w formularzu podano wartość produkcji globalnej zamiast dodanej, a są to odmienne pojęcia i różne liczby). Natomiast celem kontroli artmetycznej jest porównywanie liczb otrzymanych z sumowania danych źródłowych z liczbami w sprawozdaniach zbiorczych.
Trzeci etap badania statystycznego - opracowanie materiału statystycznego- obejmuje dwie zasadnicze czynności: grupowanie i zliczanie. Grupowanie polega na wyodrębinieniu jednorodnych lub względnie jednorodnych części w ramach większej i zróżnicowanej zbiorowościa statystycznej lub ptóby. Zadaniem grupowania jest więc przejście od informacji o właściwościach poszczegolnych jednostek statystycznych do informacji o właściwościach całej zbiorowości lub wyodrębnionej jej części. Niekiedy grupowanie ma charakter naturalny (np. grupowanie według płci, a więc podział na koniety i mężczyzn). Często jednak osoba prowadząca badania sama ma zdecydować, na ile i na jakie grupy podzielić daną zbiorowość.
Dzielenie materiału statystycznego na grupy według nednej cechy nosi nazwę grupowania prostego ( np. podział pracowników według płci) Jeżeli za podstawę grupowania przyjmuje się kilka cech wzajemnie powiązanych i uzupełniających się , to mówimy o grupowaniu złożonym(np, podział zatrudnionych według stażu pracy i stopnia wykonania norm produkcyjnych).
Z punktu widzenia celu, jakiemu ma slużyć grupowanie, dzielimy je na typologiczne i wariancyjne. Grupowanie typologiczne polega na wyodrębnieniu jednorodnych hrup na podstawie wariantów cech jakościowych. Przykładem grupowania typologicznego jest podział ludności zawodwo czynnej według grup społecdzno-ekonomicznych na : zatrudnionych na podstawie stosunku pracy, pracujących w rolniczych społdzielniach produkcyjnych, osoby wykonujące pracę nakładczą, agentów wynagradzanych z funduszu agencyjno-prowizyjnego, agentów w systemie agencji zryczałtowanej oraz pozostałych.
Opracowany materiał statystyczny musi być odpowiednio zaprezentowany. Temu celowi służą czeregi statystyczne, które mogą być również przedstawione w postaci tablic i wykresów. Szeregiem statystycznym nazywamy zbiór wyników obserwacji jednostek według pewnej cechy.
Szereg szczegołowych to materiał statystyczny uporządkowany wyłącznie według wartości badanej cechy. Porządkowanie polega tu na ustawianiu wartości według kolejności rosnącej lub malejącej. Najczęściej wartości zmiennej są podawane w kolejności od najmniejszej do największej. Jedynie w badaniach psychologiczno-pedagogicznych spotka się porządek odwrotny. W zapisach wyników testów psychologicznych i ocen szkolnych wygodneiej jest bowiem dokonywać analizy zebranego materiału statystycznego na tle wyników lepszego.
Szeregiem rozdzielniczym nazywamy zbiór wartości liczbowych uporządkowanych według wariantów badanej cechy mierzalnej lub niemierzalnej, przy czym poszczególnym wariantom zmiennej przyporządkowane są odpowiadające im liczebności. Szeregi rozdzielnicze określają strukturę badanej zbiorowości. Tworząc szeregi rozdzielnicze na podstawie cechy mierzalnej , jej warianty możemy określać punktowo lub przedziałowo. Szeregi rozdzielnicze punktowe buduje się dla cechy skokowej. Budując szeregi rozdzielnicze musimy na samym początku zadecydować o liczbie przedziałów klasowych, o ich rozpiętości is posobie określania granic przedziałów. Teoria statystyki nie podaje w tym względzie uniwersalnych zaleceń. Chodzi jednak o to, by szereg rozdzielniczy przedziałowy był tak zbudowany, aby klasyfikacja danych statystycznych była przeprowadzona w sposób rozłączny(poszczególne przedział nie mogą zachodzić na siebie) i wyczerpujący (klasy powinny obejmowacć wszystkie jednostki badanej zbiorowości)
Liczba przedziałów w szeregu uzależniona jest od obszaru zmienności badanej cechy, od liczebności zbiorowości oraz od celu badania. Im większy obszar zmienności i liczniejsza zbiorowość, tym więcej powinno być przedziałów. Jeśli liczba przedzialów jest zbyt mała, to materiał statystyczny jest niezbyt skondensowany, co w rezultacie powoduje zacieranie się prawidłowości rozkładu danej zmiennej. z kolei przy dużej liczbie przedziałów występuje nadmierna szczegółowość, utrudniająca analizę i wyciąganie wniosków dotyczących rozkładu cechy. Rozpiętość podziału, zwana interwałem lub rozstępem przedziałowym, jest różnicą między górną i dolną granicą klasy. Jest ona uwarunkowana obszarem zmienności badanej cechy, a tym samymy liczbą ustalonych klas.
Wyróżniamy ponadto szeregi przestrzenne i dynamiczne. Szeregi przestrzenne, zwane też geograficznymi lub terytorialnymi, przedstawiają rozmieszczenie wielkości statystycznych według jednostek administracyjnych, części świata, regionów gospodarczych itp. Szeregi dynamiczne(czasowe, chronologiczne) prezentują rozwój zjawisk w czasie, przy czym może być tu uwzględniony ściśle określony monemt np. 31 grudnia każdego roku(szeregi czasowe momentów) lub pewien przedział, jak lata czy miesiące )szeregi czasowe okresów).
Tablice statystyczne wykorzystywane są do prezentacji danych statystycznych uporządkowanych według określonego kryterium. Aby tablica statystyczna była użyteczna, powinna spełniać określone warunki dotyczące formalnej (zewnętrznej) budowy oraz merytorycznej (wewnętrznej) spoitośći.Z formalnego punktu widzenia każda tablica statystyczna powinna zawierać tytuł, słowne oznaczenie kolumn i wierszy, źródło danych statystycznych oraz- w razie potrzeby dodatkowe objaśnienia. W tytule tablicy podaje się w sposób jasny i zwięzły treśc tablicy, określającą zbiorowość statystyczna pod względem rzeczowym, czasowym i przestrzennym.
Rozróżniamy proste i złożone tablice statystyczne. Tablice proste charakteruzują strukturę lub dynamikę jednej zbiorowości statystycznej ze względu na jedna cechę, przy czym może to być cecha ilościowa lub jakościowa.Wynika z tego , że tablica prosta może być utożsamiona z szeregiem statystycznym. Tablice złożone opisują badaną zbiorowość według cech lub kilka zbiorowości według jednej cechy. Tego rodzaju tablica prezentuje więc zespół szeregów statystycznych, a stopień ich zależności zależy od liczby badanych cech lub liczby zbiorowośći.
Do przedstawienia materiału statystycznego wykorzystywane są również wykresy. Wykres jest graficzną formą rejestracji danych oraz narzędziem prezentacji i analizy uogólnionych informacji statystycznych. Najczęściej wykresy sporządza się na podstawie tablic statystycznych, ale nie mogą być one prostym powtorzeniem zawartym w nich danych. Wykres ujmuje zjawiska w sposób syntetyczny i w związku z tym zawiera zwykle mniej szczegółów niż tablica. Dlatego tez wykres należy traktować jako uzupełnienie tablic.
Każdy wykres, podobnie jak tablica, powinna mieć tytuł i źródło danych, na podstawie których został sporządzony. Ponadto do każdego wykresu należy podać legendę , czyli wyjanienie zastosowanych symboli, znaków barw oraz przeyjętej skali.
Do wykresów opisujących rozkład cechy ilościowej w prostokątnym układzie współrzędnych zalicza sie m.in. histogram i diagram. Histogram to zbiór przylegających prostokątów, których podstawy-równe rpziętości przedziałów klasowych-spoczywają na osi odciętych, a wysokości sa liczebnościami przedziałów.
Diagram (wielobok liczebności) jest łamaną powstałą przez połaczenie punktów o współrzędnych: środki przdziałów i odpowiadające im liczebności. Diagram można również otrzymać z histogramu przez łączenie odcinkami środków przedziałów.
Czwartym etapem badania statystycznego jest opis lub wnioskowania statystycznego. Różnica pomiędzy opisem w wioskowaniem statystycznym sprowadza się do tego, że opis statystyczny dotyczy tylko danej zbiorowości generalnej lub próby , podczas gdy wnioskowanie statystyczne ma miejsce wówczas, kiedy badanie jest reprezentacyjne i jego wyniki są uogólnione na całą populację generalną , z której została pobrana próbna. Możliwość uogólnienia wyników z próby losowej na cała populacje daje rachunek prawdopodobieństwa, ktory jest teoretyczną podstawą wnioskowania statystycznego.
Opis statystyczny ma charakter sumaryczny tzn. nie odnosi się do poszczególnych jednostek, ale do całej zbiorowości. Opisu statystyczneggo dokonujemy za pomocą odpowiednich miar, którymi są np, średnia artmetyczna, odchylenie standardowe, współczynnik korelacji. Metody wykorzystywane w opisie statystycznym wchodza w zakres statystyki soisowej.
Metody wnioskowania statystycznego wchodzą w zakres statystki matematycznej, która jest nauką o mteodach wnioskowania na podstawie wyników zaobserwowanych w próbie o właściwościach opoulacji generalnej, z której próba została wylosowana.
Po obliczeniu charakterystki liczbowej (odpowiednimi dla danego typu zjawisk metodami) można przystąpić do analizyotrzymanych wyników.Analiza pozwala na jednoznaczne i zwięzłe scharakteryzowanie badanego zjawiska, dzięki czemu można wyciągnać odpowienie wnioski merytoryczne oraz dkokonać uogólnienia i prówniań mających na celu wykrycia określanych prawidłowości.