Jeżeli zebranie wszystkich danych nie jest możliwe (gdy populacja jest nieskończona lub bardzo liczna), należy wypowiadać się o badanym zjawisku na podstawie danych częściowych. Zbieranie danych częściowych jest przedmiotem Statystyki matematycznej (wnioskowanie opiera się na rachunku prawdopodobieństwa).
Przygotowanie badania - poprawne sformułowanie celu i zakresu badania oraz podstawowe hipotezy badawcze
Obserwacja statystyczna - rejestracja wartości przyjętego zespołu cech jednostek zbiorowości - uzyskanie materiału statystycznego
Opracowanie statystyczne - w formie tablic wynikowych oraz prezentacji graficznej
Analiza statystyczna - wyczerpująca analiza statystyczna umożliwiająca wykrycie prawidłowości zbiorowości.
Badanie statystyczne jest procesem złożonym i wieloetapowym.
Na etapie przygotowania powinno się poprawnie sformułować cel i zakres badania oraz sformułować podstawowe hipotezy badawcze.
Obserwacja statystyczna polega na rejestracji zespołu cech jednostek wyróżnionej zbiorowości.
W ten sposób uzyskuje się materiał statystyczny , który podlega ocenie formalno-merytorycznej.
Opracowanie statystyczne polega na przedstawieniu w formie tablic wynikowych oraz prezentacji graficznej zebranego materiału.
Przetworzony komputerowo materiał statystyczny jest poddawany analizie statystycznej opartej na metodach statystycznych, umożliwiających wykrycie prawidłowości w badanej zbiorowości.
Wybór konkretnej metody jest uzależniony celem badania, ilością i kompletnością zebranego materiału statystycznego. Warto dodać, że metody statystyczne należy zawsze stosować z należytą rozwagą, uwzględniając warunki ich stosowania w konkretnych badaniach.
Każde badanie statystyczne wymaga ustalenia właściwej metody. Wybór metody jest uzależniony od:
1. celu badania
2. rodzaju zbiorowości statystycznej
3.tematu badania
4. jego szczegółowości
5. środków, jakimi dysponujemy (tj. liczby osób przeprowadzających badania, możliwości technicznych, finansowych).
Badania pełne (całkowite, wyczerpujące) - obejmują wszystkie jednostki badanej zbiorowości statystycznej
Badania niepełne (częściowe) - obejmują niektóre jednostki zbiorowości statystycznej, próba
Szacunek statystyczny polega na ustaleniu pewnych wielkości lub właściwości nieznanej zbiorowości na podstawie zbiorowości znanej pozostającej z nią w określonym związku. Np. wielkość produkcji mleka w woj. Podlaskim można ocenić mając dane: ilość krów i średnią mleczność krowy.
Decyzja o przeprowadzeniu badań częściowych zamiast pełnych może być podjęta z następujących przyczyn
Zbiorowość statystyczna jest tak liczna, że badanie pełne byłoby zbyt kosztowne bądź wymagałoby zbyt długiego czasu
Badanie ma charakter niszczący (np. badanie jakości konserw)
Chodzi jedynie o wyniki orientacyjne.
SPIS STATYSTYCZNY - jest doraźnym lub okresowym (np. spis ludności) badaniem statystycznym obejmującym wszystkie jednostki zbiorowości
REJESTRACJA - polega na systematycznym notowaniu określonych faktów będących przedmiotem badania (np. ewidencja urodzeń, ślubów, zgonów, wędrówek ptaków itp)
BAD. ANKIETOWE - informacje o zbiorowości są gromadzone za pomocą ankiety rozesłanej do ściśle określonych osób, instytucji lub przedsiębiorstw, sprecyzowane są w niej konkretne pytania - najczęściej stosowana metoda obserwacji.
W Polsce badaniami ankietowymi - głównie na temat zmienności zachowań, postaw, systemu wartości, zajmują się OBOP, CBOS, PENTOR oraz ośrodki naukowe.
BAD. MONOGRAFICZNE - polega na szczegółowym opisie i analizie wybranej jednostki statystycznej lub niewielkiego zespołu jednostek, np. grupa społeczna, wieś miasto.
BAD. REPREZENTACYJNE - jest częściowym badaniem statystycznym opartym na próbie pobranej ze zbiorowości generalnej w sposób losowy (metoda najbardziej prawidłowa). Wyniki w tej metodzie są przenoszone na całą zbiorowość, a rachunek prawdopodobieństwa umożliwia określenie wielkości popełnianego błędu.
INTERPOLACJA - polega na szacowaniu wartości nieznanej na podstawie wartości sąsiednich (wcześniejszej i późniejszej)
EKSTRAPOLACJA - polega na szacowaniu wartości wykraczających poza przedział wartości znanych
Zbiorowość statystyczna - zbiór dowolnych elementów objętych badaniem statystycznym.
Jednostka statystyczna - element składowy badanej zbiorowości (np. poszczególne osoby, rodziny, bądź gospodarstwa domowe). Wybór jednostki statystycznej zależy od celu badania statystycznego
Cecha statystyczna - właściwość jednostki objętej badaniem statystycznym
Cechy statystyczne stałe określają jednostki pod względem rzeczowym (co?), czasowym (kiedy?) oraz przestrzennym (gdzie?). Cechy stałe (rzeczowe, czasowe, przestrzenne) są wspólne wszystkim badanym jednostkom badanej zbiorowości. Nie podlegają zatem badaniu, a decydują jedynie o przynależności jednostek do określonej zbiorowości.
Badaniu statystycznemu podlegają cechy zmienne - są to właściwości, którymi różnią się poszczególne jednostki statystyczne.
Cechy jakościowe (niemierzalne) - można jedynie określić słowem (np. pochodzenie, kolor oczu, płeć, narodowość, stan cywilny, nastroje społeczne itd.)
Cechy ilościowe dadzą się wyrazić liczbą (np. wzrost w cm., wiek w latach, zarobek w zł.)
Cechy skokowe - są to cechy, których wartości mogą wyrażać się jedynie określonymi liczbami zmieniającymi się skokami, bez wartości pośrednich (np. liczba studentów w grupie, liczba pomieszczeń w mieszkaniu, ilość strzelonych goli)
Cechy ciągłe - mogą przyjmować każdą wartość z określonego przedziału liczbowego (np. wzrost, waga, wiek, temperatura)
Opracowany materiał statystyczny musi być odpowiednio zaprezentowany. Służą temu celowi SZEREGI STATYSTYCZNE, które mogą przedstawione w postaci tablic i wykresów.
Jednostkowe wartości lub odmiany cechy spisane według kolejności badania jednostek tworzą nieuporządkowany szereg statystyczny Te same wielkości ustawione np. w sposób rosnący tworzą uporządkowany szereg statystyczny.
Szereg wyliczający nazywamy też szczegółowym.
Do przedstawienia materiału statystycznego wykorzystywane są również wykresy.
Wykres jest graficzną formą rejestracji danych oraz narzędziem prezentacji i analizy uogólnionych informacji statystycznych.
Każdy wykres podobnie jak tablica powinien mieć tytuł i źródło danych, na podstawie których został sporządzony. Ponadto do każdego wykresu należy podać legendę, czyli wyjaśnienie zastosowanych symboli, znaków, barw oraz przyjętej skali.
W teorii statystyki wypracowano wiele charakterystyk opisowych, za pomocą których można przeprowadzić analizę struktury zjawisk masowych, czyli analizę właściwości różnych rozkładów.
Do charakterystyk najczęściej wykorzystywanych przy opisie struktury zbiorowości należą:
Miary średnie - (zwane miarami poziomu wartości zmiennej, miarami położenia lub przeciętnymi) służące do określania tej wartości zmiennej opisanej przez rozkład, wokół której skupiają się wszystkie wartości zmiennej
Miary rozproszenia - (zmienności, zróżnicowania, dyspersji) służą do badania stopnia zróżnicowania wartości zmiennej
Miary asymetrii - (skośności) służą do badania kierunku zróżnicowania wartości zmiennej
Miary koncentracji
Średnie klasyczne są obliczane na podstawie wszystkich wartości szeregu.
Średnie pozycyjne są wartościami konkretnych wyrazów szeregu wyróżniających się pod pewnym względem.
Obie grupy średnich nawzajem się uzupełniają. Każda z nich opisuje bowiem poziom wartości zmiennej z innego punktu widzenia. Są jednak sytuacje, w których układ informacji liczbowych nie pozwala na obliczenie danej średniej.
Średnia arytmetyczna to suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzieloną przez liczbę tych jednostek. Średnia określona powyższym wzorem nazywa się średnią arytmetyczną nieważoną.
Średnia geometryczna jest zwykle mniejsza od średniej arytmetycznej
Wielkość różnicy zależy głównie od stopnia zróżnicowania wartości badanej zmiennej.
Zaletą średniej geometrycznej jest to, że na wyniki obliczeń mają niewielki wpływ wartości skrajne zmiennej, gdyż pierwiastek z iloczynu wartości zmiennej osłabia ich wpływ
Oznaczamy przez D.
Wynika z tego, że dominanta występuje w szeregach jednomodalnych.
W szeregach przedziałowych bezpośrednio można określić tylko przedział (jest to przedział o największej liczebności), w którym jest dominanta, a następnie za pomocą wzoru należy określić jej konkretną wartość.
Szereg rozdzielczy punktowy i przedziałowy
Znajomość miar średnich nie wystarcza do scharakteryzowania struktury zbiorowości statystycznej.
Rozstęp jest różnicą pomiędzy największą a najmniejszą wartością zmiennej w analizowanej zbiorowości.
Rozstęp jest stosowany głównie w tych przypadkach, gdy jest konieczne szybkie określenie obszaru zmienności badanej zmiennej. Znajduje zastosowanie w kontroli jakości, gdzie jest utrzymywana ciągła obserwacja procesu produkcyjnego.
Wartość miary R zależy jedynie od dwóch wartości skrajnych (najmniejszej i największej), nie dostarczając tym samym wyczerpującej informacji o pozostałych wartościach cechy wszystkich jednostek należących do zbiorowości.
Odchylenie ćwiartkowe mierzy poziom zróżnicowania tylko części jednostek należących do badanej zbiorowości.
Na wartość odchylenia ćwiartkowego nie mają wpływu wartości jednostek mniejszych od Q1 oraz większych od Q3. Miara ta nie jest więc wrażliwa na skrajne (nietypowe) wartości i z tego powodu zaleca się jej stosowanie w praktyce.
Im zbiorowość jest bardziej zróżnicowana, tym większa jest wariancja i odchylenie standardowe.
W obszarze typowym mieszczą się jednostki o typowych wartościach cechy. W obszarze tym mieści się około 2/3 wszystkich jednostek badanej zbiorowości statystycznej..
Prezentowane dotychczas metody statystyczne dotyczyły analizy struktury zbiorowości i opierały się na obserwacjach jednej zmiennej (cechy).
Tymczasem jednostki tworzące zbiorowość statystyczną charakteryzują się zazwyczaj za pomocą więcej niż jednej cechy. Cechy te nie są od siebie izolowane, ale wzajemnie się warunkują. Zachodzi zatem potrzeba ich łącznego zbadania. Celem takiej analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.
Prezentowane dotychczas metody statystyczne dotyczyły analizy struktury zbiorowości i opierały się na obserwacjach jednej zmiennej (cechy).
Tymczasem jednostki tworzące zbiorowość statystyczną charakteryzują się zazwyczaj za pomocą więcej niż jednej cechy. Cechy te nie są od siebie izolowane, ale wzajemnie się warunkują. Zachodzi zatem potrzeba ich łącznego zbadania. Celem takiej analizy jest stwierdzenie, czy między badanymi zmiennymi zachodzą jakieś zależności, jaka jest ich siła, kształt i kierunek.
W tablicy korelacyjnej są dwarodzaje rozkładów: rozkład brzegowy i rozkłady warunkowe.
W szeregach czasowych zmienną niezależną jest czas, zmienną zależną jest - wartości liczbowe badanego zjawiska.
Zjawiska zmieniające się wolno są ujmowane w pewnych określonych momentach np. w dniu lub godzinie, np. liczba ludności Suwałk na dzień 31.XII w kolejnych 10 latach.
Szeregi czasowe zawierające informacje o rozmiarach zjawiska w dłuższych lub krótszych okresach (np. rok, półrocze, kwartał) nazywamy szeregami czasowymi okresów.
Przyrosty absolutne są wielkościami mianowanymi wyrażonymi w tych samych jednostkach miary co badane zjawisko.
Wniosek - nie nadają się one do porównań ze zmianami innych zjawisk, które są wyrażone w innych jednostkach miary
Innym zagadnieniem przy obliczaniu wielkości absolutnych jest wybór podstawy porównań - powinna ona być na tyle charakterystyczna, aby pozwalała poznać istotę zachodzących zmian. Nie należy obierać za podstawę okresu zupełnie wyjątkowego, gdyż wszystkie porównania byłyby wówczas zniekształcone.
Badając np. rozwój produkcji roślinnej nie należy przyjmować jako stałej podstawy tego roku, w którym był silny nieurodzaj, ponieważ przyrosty absolutne dawałyby niesłychanie korzystny obraz rozwoju produkcji.
Przyrosty względne mogą być jednopodstawowe lub łańcuchowe.
Przyrosty względne są najczęściej są wyrażone w procentach.
Indeksy indywidualne znajdują zastosowanie w przypadku badania dynamiki zjawisk jednorodnych.
Indeksem indywidualnym nazywamy wówczas stosunek poziomów tego samego zjawiska z dwóch różnych okresów (momentów).
W statystyce społeczno-ekonomicznej rozpatruje się zwykle trzy rodzaje indywidualnych wskaźników dynamiki:
Indeksy cen
Indeksy ilości
Indeksy wartości
Między indywidualnymi indeksami cen, ilości i wartości obliczonymi dla tego samego okresu zachodzi związek:…….
W praktyce badań statystycznych niejednokrotnie zachodzi potrzeba obliczenia indeksów dotyczących nie indywidualnych jednostek, ale całego zespołu (agregatu, zbioru) jednostek.
Do badania dynamiki całego zespołu zjawisk - zwykle niejednorodnych i bezpośrednio niesumowalnych - stosowane są indeksy agregatowe.
Konstrukcja indeksów opiera się na wykorzystaniu określonych współczynników przeliczeniowych, odgrywajacych rolę wag. Rolę wag najczęściej spełniają ceny i ilości.
Do uzyskania agregatowego indeksu ilości unieruchamiane są ceny, do indeksu cen unieruchamiane (ustalane na stałym poziomie) są ilości (wielkości) produktu.
Najczęściej wykorzystywane są formuły standaryzacji Laspeyresa i Paaschego.
Agregatowe indeksy cen i ilości obliczone według reguł Laspeyresa i Paaschego dla tego samego zespołu artykułów różnią się zwykle między sobą.
Powstaje zatem pytanie, która z tych formuł jest poprawniejsza?
Przyjmuje się, że należy obliczać, w miarę możliwości, oba indeksy - informują one bowiem o zakresie (granicach) zmian w dynamice badanego agregatu.
Jeżeli indeksy agregatowe różnią się o więcej niż o 1%, to należy wyznaczyć indeks średni - indeks Fishera
Pomiędzy agregatowymi indeksami wartości, cen i ilości zachodzą następujące związki - jest to tzw. RÓWNŚĆ INDEKSOWA DLA INDEKSÓW AGREGATOWYCH
69