STATYSTYKA OPISOWA – WYKŁADY.
Wykład z 3.10.2010 r.
Statystyka opisowa – jest to nauka traktująca o metodach ilościowych badania prawidłowości zjawisk (procesów masowych).
Metoda statystyczna - to sposób badania liczbowego określonych zbiorowości, za pomocą odpowiednich narzędzi i procedur.
Zjawisko masowe to takie zjawisko które występuje często, dotyczy ono więc wystarczająco dużej liczby jednostek.
Badanie statystyczne jest procesem złożonym, obejmującym cały kompleks problemów, zagadnień i procedur organizacyjnych, metodologicznych i merytorycznych. Związane są one zarówno z „produkcją” danych liczbowych, jak i z ich analizą statystyczną. Proces badania statystycznego obejmuje więc całokształt czynności badawczych, prowadzących do poznania zjawiska masowego z wykorzystaniem odpowiednich metod statystycznych.
Obowiązująca ustawa o statystyce publicznej definiuje badanie statystyczne jako „zbieranie, gromadzenie i opracowywanie danych statystycznych oraz ogłaszanie i udostępnianie wyników dokonanych obliczeń, opracowań i analiz, w tym podstawowych wielkości i wskaźników”.[
Etapy badania statystycznego
Badanie statystyczne jest zatem szeregiem czynności sprowadzających się do zebrania, przetworzenia i analizy informacji na temat zbiorowości statystycznej z punktu widzenia wybranych cech statystycznych, opisujących jednostki należące do tej zbiorowości. Proces badania statystycznego jest wieloetapowy, i można wyróżnić w nim cztery zasadnicze etapy:
projektowanie (przygotowanie) badania
obserwacja statystyczna (empiryczna)
opracowanie materiału statystycznego
analiza statystyczna
Etap I: Projektowanie badania statystycznego
Określenie celów badania (zarówno ogólnych jak i szczegółowych), co ma istotny wpływ na jakość badania. Każde badanie musi być podporządkowane konkretnemu celowi.
Sformułowania hipotez badawczych, czyli przypuszczeń o występowaniu, o wielkości danego zjawiska, o stosunku do innych zjawisk lub zależności pomiędzy zjawiskami.
Określenie zbiorowości statystycznej (przedmiotu badania) poprzez określenie cech poszczególnych jednostek statystycznych pod względem:
rzeczowym (co stanowi przedmiot badań),
przestrzennym (gdzie przeprowadzane jest badanie - miejsce badań),
czasowym (okres lub moment badań).
4. Wybór metody badania (podjęcie decyzji czy badanie będzie pełne czy częściowe, oraz jakie techniki zostaną wykorzystane)
Zbiorowość statystyczna (populacja) - zbiór dowolnych N- elementów objętych badaniem statystycznym.
Jednostki statystyczne - elementy badanej zbiorowości, tworzące liczebność populacji (i=1,…..,N).
Cechy statystyczne – poddane badaniu właściwości jednostek statystycznych, opisywane za pomocą liter końca alfabetu X, Y, Z.
Próba - wyodrębniona część zbiorowości statystycznej o liczebności n.
Obserwacja statystyczna – proces zbierania informacji statystycznych.
Cechy zmienne – to właściwości które różnią poszczególne jednostki statystyczne.
Cechy statystycznie zmienne:
Ilościowe
Skokowe
ciągłe
jakościowe (mierzalne i niemierzalne)
II etap: Obserwacja statystyczna
Obserwacja statystyczna polega na ustalaniu wartości cech wszystkich jednostek zbiorowości (badanie pełne) lub próbie zbiorowości (badanie częściowe).
Etap III – opracowanie materiału statystycznego
Opracowanie materiału statystycznego, obejmuje grupowanie i zliczanie pozyskanych danych.
Grupowanie statystyczne polega na podziale zbiorowości na grupy jednostek podobnych względem siebie. Grupowanie prowadzi do zbudowania szeregu statystycznego.
Etap IV – Analiza statystyczna i wyciągnięcie wniosków
Opracowany materiał przedstawiony zostaje w postaci szeregów statystycznych, które również mogą przyjąć formę tablic i wykresów.
Szereg statystyczny to zbiór wartości liczbowych badanej cechy uporządkowany według określonych kryteriów.
Materiał pierwotny z reguły przedstawiony jest w postaci indywidualnego szeregu wartości cech w postaci szeregu szczegółowego, który tworzą uporządkowane (malejąco lub rosnąco) wartości badanej cechy statystycznej.
Rodzaje szeregów statystycznych
Szeregi statystyczne
Jeżeli badacz dysponuje wartościami analizowanej cechy statystycznej X , dla każdego elementu, który znalazł się w próbie, to mamy do czynienia z szeregiem statystycznym szczegółowym, zapisywanym w następujący sposób:
x1, x2, x3,...xi, gdzie i=1,2,…,n
Szereg szczegółowy-przykład
X – liczba dzieci w wylosowanych 10-ciu gospodarstwach domowych
n = 10
1, 2, 0, 3, 1, 3, 4, 0, 2, 1
Żeby dane stanowiły szereg statystyczny muszą być posortowane od wartości najmniejszej do największej !!!
0, 0, 1, 1, 1, 2, 2, 3, 3, 4
Szereg rozdzielczy
W sytuacji, gdy liczba danych dla szeregu szczegółowego jest niewielka, nie ma problemu z dokonaniem ich analizy. Przyjmuje się, że dane w takiej postaci można pozostawić dla prób wielkości do 10 elementów. Gdy próby są większe, istotnym jest przedstawienie materiału statystycznego w takiej formie by ułatwić jego przeanalizowanie.
W tym celu dane zaprezentowane w postaci szeregów szczegółowych, dla licznych prób, przekształca się w formie szeregów rozdzielczych punktowych lub rozdzielczych w przedziałami klasowymi.
Szereg rozdzielczy punktowy
Szereg rozdzielczy jest inną formą zapisu szeregu szczegółowego.
Szereg szczegółowy przekształca się szereg rozdzielczy punktowy, w sytuacji gdy badacz ma do czynienia z liczną próbą, a cecha, którą bada przyjmuje skokowe, powtarzające się wartości.
Postać szeregu rozdzielczego punktowego jest następująca:
x1, x2, x3,...xj, gdzie wartości cechy przyjmowane są odpowiednio z liczebnościami n1, n2, n3,...nj,
gdzie j=1,2,…,k, a k oznacza liczbę klas w szeregu,
oraz n1 + n2 + n3 + nj = n lub
Przykład szeregu rozdzielczego punktowego
X – liczba dzieci w 10 stu gospodarstwach domowych
0, 0, 1, 1, 1, 2, 2, 3, 3, 4
Należy przekształcić szereg szczegółowy w szereg rozdzielczy punktowy
k | xj | nj | wj | wj x 100% |
---|---|---|---|---|
1 | 0 | 2 | 0,2 | 20,00% |
2 | 1 | 3 | 0,3 | 30,00% |
3 | 2 | 2 | 0,2 | 20,00% |
4 | 3 | 2 | 0,2 | 20,00% |
5 | 4 | 1 | 0,1 | 10,00% |
x | x | 10 | 1 | 100,00% |
Szereg rozdzielczy z przedziałami klasowymi
Szereg szczegółowy przekształca się szereg rozdzielczy punktowy, w sytuacji gdy badacz ma do czynienia z liczną próbą, a cecha, którą jest zmienną ciągłą.
Zaznaczyć należy, że badacz może mieć do czynienia z cechą tzw. qasi ciągłą. Cecha taka, tak naprawdę jest cechą skokową, jednakże z uwagi na fakt, że jej wartości się często nie powtarzają oraz przyjmują wartości z dużego zbioru liczb, wyniki badania dla takiej cechy przekształcimy nie w szereg rozdzielczy punktowy, a przedziałowy.
Szereg rozdzielczy z przedziałami klasowymi
Szereg ten składa się z k – klas, dla których należy określić rozpiętość, a następnie przyporządkować poszczególne wartości zmiennej do danej klasy oraz wskazać jej liczebność.
k | Wartości dochodu (xj) |
Liczba gmin, których dochód mieści się w danym przedziale (nj) |
wj | wj x 100% |
---|---|---|---|---|
1 | 50 000 – 150 000 | 9 | 0,3000 | 30,00% |
2 | 150 000 – 250 000 | 7 | 0,2333 | 23,33% |
3 | 250 000 – 350 000 | 3 | 0,1000 | 10,00% |
4 | 350 000 – 450 000 | 3 | 0,1000 | 10,00% |
5 | 450 000 – 550 000 | 6 | 0,2000 | 20,00% |
6 | 550 000 – 650 000 | 2 | 0,0667 | 6,67% |
suma | x | 30 | 1,00 | 100% |