Lepiej znać prawdę niedokładnie, niż dokładnie się mylić.
John Maynard Keynes
Statystyka-jest nauką traktującą o specyficznych metodach ilościowych dostosowanych do badania prawidłowości zjawisk masowych
Zjawiska masowe -to takie, które powtarzają się często, np. urodzenia, zarobki, wypadki samochodowe, produkcja. Są to zjawiska, które badane w dużej masie wykazują pewne prawidłowości.
Są to zjawiska, które badane w dużej masie wykazują określone prawidłowości. Prawidłowości tych nie można uchwycić w pojedynczym przypadku.
Celem statystyki- jest pozyskiwanie i przedstawianie danych w postaci ułatwiających ich ocenę i analizę oraz identyfikacja prawidłowości i ilościowe wyrażenie.
Jeżeli zebranie wszystkich danych nie jest możliwe (gdy populacja jest nieskończona lub bardzo liczna), należy wypowiadać się o badanym zjawisku na podstawie danych częściowych. Zbieranie danych częściowych jest przedmiotem Statystyki matematycznej (wnioskowanie opiera się na rachunku prawdopodobieństwa).
Badanie statystyczne - ogół prac mających na celu poznanie struktury określonej zbiorowości statystycznej.
Obejmuje ono:
przygotowanie badania - Poprawne sformułowanie celu i zakresu badania oraz podstawowe hipotezy badawcze
obserwację statystyczną - Rejestracja wartości przyjętego zespołu cech jednostek zbiorowości - uzyskanie materiału statystycznego
opracowanie statystyczne - w formie tablic wynikowych oraz prezentacji graficznej
analizę statystyczną - Wyczerpująca analiza statystyczna umożliwiająca wykrycie prawidłowości zbiorowości.
Wybór konkretnej metody jest uzależniony celem badania, ilością i kompletnością zebranego materiału statystycznego. Warto przy tym dodać, że metody statystyczne należy zawsze stosować z należytą rozwagą, uwzględniając warunki ich stosowania w konkretnych badaniach.
Metody analizy:
analiza struktury
analiza współzależności
analiza szeregów czasowych
analiza przestrzenno-czasowa
Badania statystyczne
SPIS STATYSTYCZNY - jest doraźnym lub okresowym (np. spis ludności) badaniem statystycznym obejmującym wszystkie jednostki zbiorowości
REJESTRACJA - polega na systematycznym notowaniu określonych faktów będących przedmiotem badania (np. ewidencja urodzeń, ślubów, zgonów, wędrówek ptaków itp)
BADANIA ANKIETOWE - informacje o zbiorowości są gromadzone za pomocą ankiety rozesłanej do ściśle określonych osób, instytucji lub przedsiębiorstw, sprecyzowane są w niej konkretne pytania - najczęściej stosowana metoda obserwacji.
W Polsce badaniami ankietowymi - głównie na temat zmienności zachowań, postaw, systemu wartości, zajmują się OBOP, CBOS, PENTOR oraz ośrodki naukowe.
BADANIA MONOGRAFICZNE - polega na szczegółowym opisie i analizie wybranej jednostki statystycznej lub niewielkiego zespołu jednostek, np. grupa społeczna, wieś miasto.
BADANIA REPREZENTACYJNE - jest częściowym badaniem statystycznym opartym na próbie pobranej ze zbiorowości generalnej w sposób losowy (metoda najbardziej prawidłowa). Wyniki w tej metodzie są przenoszone na całą zbiorowość, a rachunek prawdopodobieństwa umożliwia określenie wielkości popełnianego błędu.
INTERPOLACJA - polega na szacowaniu wartości nieznanej na podstawie wartości sąsiednich (wcześniejszej i późniejszej)
EKSTRAPOLACJA - polega na szacowaniu wartości wykraczających poza przedział wartości znanych
Każde badanie statystyczne wymaga ustalenia właściwej metody. Wybór metody jest uzależniony od:
1. celu badania
2. rodzaju zbiorowości statystycznej
3.tematu badania
4. jego szczegółowości
5. środków, jakimi dysponujemy (tj. liczby osób przeprowadzających badania, możliwości technicznych, finansowych).
Badania pełne (całkowite, wyczerpujące) - obejmują wszystkie jednostki badanej zbiorowości statystycznej
Badania niepełne (częściowe) - obejmują niektóre jednostki zbiorowości statystycznej, próba
Szacunek statystyczny polega na ustaleniu pewnych wielkości lub właściwości nieznanej zbiorowości na podstawie zbiorowości znanej pozostającej z nią w określonym związku. Np. wielkość produkcji mleka w woj. Podlaskim można ocenić mając dane: ilość krów i średnią mleczność krowy.
Decyzja o przeprowadzeniu badań częściowych zamiast pełnych może być podjęta z następujących przyczyn
Zbiorowość statystyczna jest tak liczna, że badanie pełne byłoby zbyt kosztowne bądź wymagałoby zbyt długiego czasu
Badanie ma charakter niszczący (np. badanie jakości konserw)
Chodzi jedynie o wyniki orientacyjne.
Podstawowe pojęcia statystyczne
zbiorowość statystyczna - zbiór dowolnych elementów objętych badaniem statystycznym. Zbiór jednostek , który podlega obserwacji statystycznej i który charakteryzuje się takimi samymi wariantami przynajmniej jednej cechy stałej oraz różnymi wariantami przynajmniej jednej cechy zmiennej. Ozn. N
Jednostka statystyczna - element składowy badanej zbiorowości (np. poszczególne osoby, rodziny, bądź gospodarstwa domowe). Wybór jednostki statystycznej zależy od celu badania statystycznego
Cecha statystyczna - właściwość jednostki objętej badaniem statystycznym Właściwości jednostki objęte badaniem statystycznym. Ozn. Xi
- Cechy statystyczne stałe określają jednostki pod względem rzeczowym (co?), czasowym (kiedy?) oraz przestrzennym (gdzie?). Cechy stałe (rzeczowe, czasowe, przestrzenne) są wspólne wszystkim badanym jednostkom badanej zbiorowości. Nie podlegają zatem badaniu, a decydują jedynie o przynależności jednostek do określonej zbiorowości.
Badaniu statystycznemu podlegają cechy zmienne - są to właściwości, którymi różnią się poszczególne jednostki statystyczne.
- Cechy jakościowe (niemierzalne) - można jedynie określić słowem (np. pochodzenie, kolor oczu, płeć, narodowość, stan cywilny, nastroje społeczne itd.)
- Cechy ilościowe dadzą się wyrazić liczbą (np. wzrost w cm., wiek w latach, zarobek w zł.)
Cechy skokowe - są to cechy, których wartości mogą wyrażać się jedynie określonymi liczbami zmieniającymi się skokami, bez wartości pośrednich (np. liczba studentów w grupie, liczba pomieszczeń w mieszkaniu, ilość strzelonych goli)
Cechy ciągłe - mogą przyjmować każdą wartość z określonego przedziału liczbowego (np. wzrost, waga, wiek, temperatura)
Przykład 1.
Stwierdzić, jakiego rodzaju są cechy:
Temperatura ciała
Kolor oczu
Ocena studentów danej grupy ze statystyki
Nastroje społeczne
Rozmiar buta
Przykład 2.
Jeżeli badamy pracowników zatrudnionych etatowo ze względu na płeć, wiek, zarobki, wykonywany rodzaj pracy oraz stanowisko, to aby mówić o zbiorowości statystycznej, powinno się przyjąć przynajmniej:
jedna cechę zmienną
jedną cechę stałą i jedną zmienną
dwie cechy stałe
dwie cechy zmienne
Przykład 3.
Osiągany zysk netto (dodatni lub ujemny) prywatyzowanych podmiotów sektora publicznego stanowi cechę statystyczną postaci:
mierzalnej skokowej
niemierzalnej
mierzalnej ciągłej
zero-jedynkowej
Przykład 4.
W księgarni uczelnianej przeprowadzono badanie wydatków na książki 40 studentów wybranych losowo spośród kupujących w tym dniu.
a) przeprowadzono badanie pełne
b) cecha statystyczna to wydatki na książki
c) jednostką statystyczną jest student
Przykład 5.
Wszystkim studentom Akademii Ekonomicznej zdano pytanie dotyczące motywów wyboru kierunku studiów.
jednostką statystyczną jest kierunek studiów
badana cecha ma charakter jakościowy
przeprowadzono badanie częściowe
Przykład 6
W przedsiębiorstwie P wylosowano20 pracowników pracujących na takim samym stanowisku. Badanie statystyczne dotyczyło wydajności (w szt./godz).
jednostką pomiaru jest szt./godz.
przeprowadzono badanie częściowe
badaną cechą jest wydajność
Zakres analiz opisowych i indukcyjnych
Metody statystyczne służą celom analitycznym. Zasadniczym kryterium podziału stosowanych metod statystycznych jest ich deterministyczna (metody opisu) lub probabilistyczna (metody wnioskowania) konstrukcja
Zakres analiz opisowych i indukcyjnych
Zakres analiz opisowych i indukcyjnych
Opracowany materiał statystyczny musi być odpowiednio zaprezentowany. Służą temu celowi SZEREGI STATYSTYCZNE, które mogą przedstawione w postaci tablic i wykresów.
Szeregiem statystycznym - nazywamy zbiór wyników obserwacji jednostek według pewnej cechy.
Jednostkowe wartości lub odmiany cechy spisane według kolejności badania jednostek tworzą nieuporządkowany szereg statystyczny Te same wielkości ustawione np. w sposób rosnący tworzą uporządkowany szereg statystyczny.
Oznaczenia
xi - wariant cechy
ni - liczba jednostek o i-tym wariancie cechy
N - ogólna liczba obserwacji (liczba jednostek w badanej zbiorowości)
x0i - początek przedziału klasowego
x1i - koniec przedziału klasowego
hi - długość (rozpiętość) przedziału klasowego, hi=x1i-x0i
Przykład 7.
Przykład szeregu wyliczającego (dane indywidualne)
Grupę studentów zbadano ze względu na oceny uzyskane na egzaminie ze statystyki. Otrzymano następujące dane indywidualne:
4,3+,3,2+,3+,3,2,4,4,3+,3,3,2,2+,3,2+,2,2,5,3,2+,3,2+,3,2+,2,3+,3+2,4,3+,2+,4+,2,3+,2,4+,3+,4,2+,2+3,2+,3,2+,2+,4,4+,4+,5
Przykład 8
Przykład szeregu punktowego
Oceny studentów xi |
Ilość studentów ni |
2 2,5 3 3,5 4 4,5 5 |
8 12 10 8 6 4 2 |
Suma |
50 |
Przykład 9.
Przykład szeregu przedziałowego
Liczba koni w gospodarstwie x0i - x1i |
Liczba gospodarstw ni |
0-3 3-6 6-9 |
28 15 7 |
Suma |
50 |
Wstępną czynnością przy tworzeniu szeregu rozdzielczego przedziałowego jest ustalenie liczby k przedziałów klasowych i wspólnej ich długości h.
liczba przedziałów powinna mieścić się między 10 a 30
rozpiętość przedziału klasowego powinna być liczbą prostą, np.. 1,2,5,10…
oraz
Przykład 10.
Przykład szeregu skumulowanego
Liczba koni xi |
Liczba gospodarstw ni |
Do 3 Do 6 Do 9 |
28 43 50 |
Przykład 11.
Kolor włosów xi |
Liczba osób ni |
Blond Rudy Brunet Szatyn |
3 7 10 4 |
Wykresy
Do przedstawienia materiału statystycznego wykorzystywane są również wykresy.
Wykres jest graficzną formą rejestracji danych oraz narzędziem prezentacji i analizy uogólnionych informacji statystycznych.
Każdy wykres podobnie jak tablica powinien mieć tytuł i źródło danych, na podstawie których został sporządzony. Ponadto do każdego wykresu należy podać legendę, czyli wyjaśnienie zastosowanych symboli, znaków, barw oraz przyjętej skali.
Histogram - wykres składający się ze słupków bezpośrednio przylegających do siebie, mających równe podstawy
czas pisania pracy w minutach |
liczba studentów |
40-50 |
7 |
50-60 |
12 |
60-70 |
15 |
70-80 |
|
80-90 |
4 |
Diagram - powstaje poprzez połączenie linią ciągłą środków górnych boków prostokątów w histogramie
Statystyka 1
1
-ankieta
met. monograficzna
met. reprezentatywna
spis
rejestracja bieżąca
SZACUNEK
STATYSTYCZNY
- wnioskowanie (na podstawie
danych częściowych) opiera się
na rachunku prawdopodobieństwa
metody gromadzenia danych
opracowania danych
prezentacji danych
analiza danych
STATYSTYKA
MATEMATYCZNA
STATYSTYKA
OPISOWA
STATYSTYKA
NIEPEŁNE
interpolacyjny
ekstrapolacyjny
PEŁNE
BADANIA STATYST.
ciągłe
skokowe
Cechy ilościowe
Cechy jakościowe
Cechy zmienne
Cechy stałe
Cechy statystyczne
Szeregi czasowe z okresowością
Szeregi czasowe bez okresowości
Indeksy statystyczne
Rachunek wariancyjny
Rachunek korelacyjny
Rachunek regresyjny
- Miary położenia
- Miary zróżnicowania
- Miary asymetrii i kurtozy
Współzależność zjawisk
Dynamika zjawisk
Struktura zjawisk
Jak jest?
Skończona zbiorowość
Opis statystyczny
Weryfikacja hipotez
(parametrycznych i nieparametrycznych)
Estymacja parametrów
(punktowa i przedziałowa)
Jak prawdopodobnie może być?
Próby losowe
Wnioskowanie statystyczne
skumulowany
przedziałowe
punktowe
cech niemierzalnych
cech mierzalnych
rozdzielcze
szczegółowe
(wyliczające)
Rodzaje szeregów
statystycznych