Statystyka (15 stron) 7M555RBMUEPLAOGWBUP5LQYRUSBQ7KFEPDFWQLI


Przeciwieństwem zjawiska masowego jest pojedynczy przypadek. Obserwując zjawiska masowe jesteśmy w stanie wykryć pewne prawidłowości o trwałym charakterze, opisać je a następnie wykorzystać w celach przewidywania, prognozowania. Prawidłowości te nie zawsze znajdują potwierdzenie w pojedynczych przypadkach. W celu poznania nowych zjawisk należy przeprowadzić badanie statystyczne. Jest to ogół zbiór czynności, które możemy sprowadzić do czterech podstawowych etapów:

  1. Przygotowanie badania

Pierwszą czynnością jest określenie celu badania, ponieważ jemu podporządkowane są dalsze czynności. Cel badania może pochodzić z różnorodnych dziedzin nauki lub praktyki. W następnej kolejności ustalamy przedmiot obserwacji, czyli zbiorowość statystyczną. Cechy statystyczne to właściwości posiadane przez jednostki np.: wiek. Cechy statystyczne posiadają wszystkie jednostki badanej zbiorowości, ale różny ich poziom pozwala na wyróżnienie jednostki w zbiorowości.

0x08 graphic
0x08 graphic
0x08 graphic

Cechy statystyczne

czasowe

rzeczowe

terytorialne

0x08 graphic
0x08 graphic
0x08 graphic
(dynamiczne, chronologiczne)

(strukturalne)

(przestrzenne)

0x08 graphic
np. data urodzenia

np. nasz wygląd, włosy

np. miejsce zamieszkania

0x08 graphic
0x08 graphic

cechy mierzalne

cechy niemierzalne

0x08 graphic
0x08 graphic

cechy skokowe

cechy ciągłe

Spośród wszystkich możliwych cech statystycznych dokonujemy wyboru tych, które są niezbędne z punktu widzenia celu badania.

Następną czynnością jest ustalenie zakresu badania tzn. podjęcie decyzji, czy będzie to badanie całkowite czy częściowe. W badaniu całkowitym bezpośrednią obserwacją objęte są wszystkie jednostki zbiorowości. Zbiorowość taką nazywamy zbiorowością generalną lub populacją. W badaniach częściowych bezpośredniej obserwacji podlegają te jednostki, które zostały wybrane lub wylosowane do badania. Zespół takich jednostek nazywamy zbiorowością próbną lub próbą.

Ostatnią czynnością w tym etapie badania jest opracowanie formularza, który posłuży do zbierania danych.

  1. Obserwacja statystyczna, czyli zbieranie materiałów

W tym etapie badania musimy podjąć decyzję jaką metodą będziemy zbierać dane. Może to być bezpośredni wywiad, pośrednictwo poczty, zlecenie specjalnym instytucjom i inne. Metoda zbierania danych musi być powiązana z celem badania.

  1. Opracowanie zebranego materiału

Pierwszą czynnością jest kontrola zebranego materiału. Wstępna kontrola formalna polega na sprawdzeniu kompletności zapisów tzn. sprawdzeniu, czy na wszystkie pytania otrzymaliśmy odpowiedzi. Kontrola merytoryczna polega na wstępnej ocenie jakości zebranego materiału. W zbieranych informacjach mogą pojawić się błędy przypadkowe lub systematyczne. Przypadkowe są wynikiem pomyłek i na ogół nie wpływają na jakość formułowanych wniosków. Systematyczne są wynikiem na ogół złej woli respondentów (osób odpowiadających). Błędy te mogą wpłynąć na jakość naszych ocen i wniosków.

  1. Opis statystyczny i wnioskowanie

Następną czynnością jest grupowanie materiału, które polega na łączeniu jednostek charakteryzujących się takim samym lub zbliżonym poziomem badanej cechy w jednorodnej grupie. Grupowania dokonujemy wg każdej z badanych cech statystycznych. W wyniku grupowania otrzymujemy szeregi statystyczne.

Schemat szeregu prostego, szczegółowego:

Cecha statystyczna

np. powierzchnia mieszkania w m2

Xi

Xi

x1

38 = x1

x2

56 = x2

x3

73 = x3

...

23 = x4

xn

45 = x5

x1+x2+x3+x4+...+xn=∑xi 235 m2

Szeregi takie tworzymy dla niewielkich zbiorowości - na ogół nie przekraczających 30 informacji.

O P I S S T A T Y S T Y C Z N Y S T R U K T U R Y Z J A W I S K

Podstawią analizy są dane empiryczne pogrupowane w szeregu wg cechy rzeczowej. Miernikami służącymi do opisu są:

  1. wskaźnik struktury

  2. miary średnie, inaczej miary tendencji centralnej

  3. miary zróżnicowania, inaczej rozproszenia (dyspersji)

  4. miary asymetrii (skośności)

  5. miary koncentracji

Ad. 1.

Wskaźnik struktury jest to udział jednostek z cechą wyróżnioną w ogólnej liczbie jednostek badanej zbiorowości.

ni

n - wybrana gruba lub jednostka zbiorowości

W 0x08 graphic
=

i ni - suma jednostek zbiorowości

i ni

W - miernik


0 ≤ Wi ≤ 1 ; ∑i Wi = 1,0

ni 0x08 graphic

W = * 100 - otrzymujemy wynik w procentach

i ni

0 ≤ Wi ≤ 100 ; ∑i Wi = 100

np.: W = 20%

20% badanej zbiorowości charakteryzuje się wybranym wariantem cechy.

Ad. 2.

Miary średnie służące do opisu struktury zjawisk dzielimy na:

  1. średnie klasyczne

W szeregach szczegółowych łączną wartość cechy otrzymujemy w wyniku bezpośredniego jej sumowania. Dzieląc sumę przez liczbę jednostek otrzymujemy średnią arytmetyczną prostą.

__

X - poziom średni (charakterystyczna kreska na górze)

__ i xi

0x08 graphic
X =

n

W szeregach rozdzielczych wartości cechy są rozdzielone.

Schemat szeregu rozdzielonego:

Cecha

Liczba jednostek

xi ni

xi

ni

x1

n1

x1 n1

x2

n2

x2 n2

x3

n3

x3 n3

x4

n4

x4 n4

...

...

...

...

...

...

xn

nn

xn nn

Ogółem

i ni

i xini

W szeregach rozdzielczych o klasach pojedynczych (jednowariantowych) łączną wartość cechy obliczamy mnożąc każdy jej wariant przez liczbę jednostek, następnie sumując te iloczyny. Dzieląc łączną wartość cechy przez sumę jednostek (obserwacji) otrzymujemy średnią arytmetyczną ważoną.

0x08 graphic
__ i xi ni

0x08 graphic
0x08 graphic
X = wagi

i ni

W szeregach rozdzielczych o przedziałach klasowych obliczamy również średnią arytmetyczną ważoną. Przed jej obliczeniem obliczamy środki przedziałów klasowych. Jest to średnia arytmetyczna z granic przedziału.

0x08 graphic
0x08 graphic

__ i xi ni charakterystyczny znak (kółko)

0x08 graphic
X =

i ni

Własności średniej arytmetycznej:

__

X min < X < X max

___

i (xi - x) = 0

___

i (xi - x)ni = 0

  1. Średnie pozycyjne - są wyznaczane w szeregu, ponieważ zajmują w nim określoną pozycję.

W pierwszej kolejności porządkujemy wartości cechy rosnąco lub malejąco, następnie wyznaczamy miejsce jednostki, która znajduje się pośrodku szeregu tzn. obliczamy numer mediany. Wartość cechy środkowej jednostki jest medianą.

W szeregach szczegółowych o nieparzystej liczbie obserwacji obliczamy jeden numer mediany.

n + 1

0x08 graphic
NM =

2

W szeregach o parzystej liczbie obserwacji obliczamy dwa numery mediany.

n n

0x08 graphic
0x08 graphic
NM I = i NM II = + 1

2 2

W szeregach rozdzielczych obliczamy tylko jeden numer mediany, a następnie tworzymy skumulowany szereg liczebności.

i ni

0x08 graphic
NM =

2

W szeregach o klasach pojedynczych wskazujemy od razu wartość mediany.

W szeregach rozdzielczych o przedziałach klasowych w pierwszej kolejności wyznaczamy przedział mediany, a następnie szacujemy jej wartość w przedziale wg wzoru:

ho

0x08 graphic
M = x 0 + (NM - n isk - 1)

no

M - wartość mediany

x0 - dolna granica przedziału mediany

h0 - rozpiętość przedziału mediany

n0 - liczba jednostek w przedziale mediany

NM - numer mediany

N isk - 1 -liczba jednostek w skumulowanym szeregu liczebności w przedziale poprzedzającym przedział mediany.

Własności mediany:

W szeregach rozdzielczych dominanta to ta wartość cechy, której odpowiada największa liczba jednostek.

W szeregach rozdzielczych o przedziałach klasowych wyznaczamy przedział dominanty, a następnie szacujemy jej wartość w przedziale wg wzoru:

(no - n -1)ho

0x08 graphic
D = x 0 +

(no - n -1) + (no - n +1)

D - wartość dominanty

x0 - dolna granica przedziału dominanty

n0 - liczba jednostek w przedziale dominanty

n -1 - liczba jednostek w przedziale poprzedzającym przedział dominanty

n +1 - liczba jednostek w przedziale następnym dominanty

h0 - rozpiętość przedziału dominanty

Dominanty nie wyznaczamy w szeregach: