opracowanie materialu statystycznego

background image












OPRACOWANIE MATERIAŁU

STATYSTYCZNEGO
























- 1 -

background image

Materiał statystyczny otrzymujemy w wyniku obserwacji statystycznej ma postać
nieuporządkowanego zbioru danych o poszczególnych jednostkach statystycznych i jest on
określany jako surowy (indywidualny) materiał statystyczny. Materiał ten nie może być
przedmiotem analizy, porównań i wyciągania wniosków, gdyż zawiera informacje o
poszczególnych jednostkach, a nie o całej zbiorowości statystycznej. Dlatego materiał ten w
kolejnym etapie badania statystycznego podlega opracowaniu (uporządkowaniu).
Opracowanie materiału obejmuje: grupowanie statystyczne i zliczanie materiału
statystycznego
. W zależności od możliwości instytucji prowadzącej badanie statystyczne
opracowanie materiału statystycznego może być prowadzone przy wykorzystaniu różnych
metod organizacyjno – technicznych. Jeżeli badanie statystyczne jest prowadzone przez małe
przedsiębiorstwo, wówczas większość czynności związanych z opracowaniem materiału
statystycznego jest prowadzona ręcznie, bądź z wykorzystaniem komputera osobistego. Jeżeli
natomiast badanie jest prowadzone przez wyspecjalizowaną instytucję, wówczas do
opracowywania materiału statystycznego wykorzystuje się specjalistyczne urządzenia.

W wyniku opracowania surowego materiału statystycznego zostaje on przekształcony

w materiał zbiorczy, charakteryzujący całą badaną zbiorowość bądź próbę.


Grupowanie materiału statystycznego

Grupowanie statystyczne

polega na podziale całej zbiorowości statystycznej na mniejsze

jej części, czyli jednolite grupy jednostek. Wyodrębnienie tych grup dokonywane jest na
podstawie jednoznacznych kryteriów. Tymi kryteriami są warianty cechy statystycznej. Jeżeli
cecha statystyczna ma charakter naturalny (np. płeć), wówczas grupowanie statystyczne ma
również naturalny charakter (np. podział mieszkańców Warszawy na mężczyzn i kobiety).
Niekiedy jednak kryteria podziału zbiorowości grup nie mają charakteru naturalnego, wtedy
podmiot prowadzący badanie musi zdecydować jakie mniejsze zostaną wyodrębnione w
ramach badanej zbiorowości. Grupowanie statystyczne pozwala na uporządkowanie materiału
statystycznego i zapewnia jego porównywalność. Celem grupowania statystycznego jest
wskazanie podobieństwa i różnic występujących w badanej zbiorowości statystycznej oraz
sformułowanie obiektywnych wniosków ogólnych. Decydujące znaczenie, przy dokonywaniu
grupowania statystycznego, ma cel badania statystycznego.


Grupowanie statystyczne jest stworzenie wykazu klasyfikacyjnego, czyli

uporządkowanego wykazu wariantów cech. W przypadku cechy niemierzalnej i cechy
mierzalnej ze zmiennością skokową o niewielkiej liczbie wariantów stworzenie wykazu
klasyfikacyjnego jest zadaniem stosunkowo prostym – można ograniczyć się w tym
przypadku do wypisania wszystkich wariantów cechy.

Dokonanie prawidłowego grupowania statystycznego wymaga przestrzegania niżej

wymienionych zasad:

Wykaz klasyfikacyjny (wykaz wariantów cech) musi być skonstruowany w taki
sposób, aby żadna jednostka statystyczna poddana badaniu nie znalazła się poza
wykazem – jest to zasada grupowania wyczerpującego;


- 2 –

background image

Wykaz musi być skonstruowany w taki sposób, aby żadna jednostka statystyczna
poddana badaniu nie była zaliczona jednocześnie do dwóch grup (wariantów) – jest to
zasada grupowania rozłącznego;

Jeżeli jednostki statystyczne są bardzo zróżnicowane pod względem wartości cechy,
należy tworzyć więcej przedziałów klasowych, tak aby każdy z nich zawierał
jednostki o małym zróżnicowaniu wartości cechy;

Grup nie powinno być zbyt dużo, dlatego jeżeli niektóre warianty cechy występują u

niewielkiej liczby jednostek, możliwe jest stworzenie grup zbiorczych, które określa
się jako pozostałe czy różne

10

;

Przy badaniach powtarzalnych nie powinno się zmieniać wykazu klasyfikacyjnego,
dzięki czemu możliwie będzie porównywanie wyników tych badań.



Przykład


Jeżeli badanie statystyczne polegało na określeniu poziomu wykształcenia ludności, to wykaz klasyfikacyjny
przedstawia się następująco;

Grupowania ludności wg wykształcenia

Wykształcenie

Podstawowe
Zasadnicze zawodowe

Średnie

Wyższe


Osoby, które mają wykształcenie niepełne średnie zostaną zaliczone do grupy osób z wykształceniem
podstawowym, a osoby, które mają wykształcenie policealne i niepełne wyższe zostaną zaliczone do grupy osób z
wykształceniem średnim.


















- 3 -

background image

ZLICZANIE MATERIAŁU STATYSTYCZNEGO

Po dokonaniu grupowania statystycznego następuje zliczanie materiału, czyli ustalenie
liczebności poszczególnych grup. Efektem zliczania materiału statystycznego jest
stwierdzenie, ile jednostek statystycznych przypada na poszczególne warianty cechy przyjęte
w wykazie klasyfikacyjnym.

Zliczanie bezpośrednie (ręczne) jest stosowane wówczas, gdy badane zbiorowości

mają małą liczebność i gdy podział jednostek na grupy jest prosty. Zliczanie bezpośrednie
polega na zliczeniu i zanotowaniu liczby jednostek statystycznych posiadających określony
wariant i cechy.

Przykład
Policzenie przez wyznaczoną osobę liczby wiernych uczęszczających we mszy.



Zliczanie sposobem kreskowym wymaga skonstruowania tablicy roboczej, w której

pionowymi kreskami zaznacza się wystąpienie określonego wariantu cechy. Ułatwieniem jest
zastosowanie jako piątej – kreski poziomej, która przecina cztery kreski pionowe. W taki
sposób każda wiązka oznacza pięć jednostek obserwacji. W celu sprawdzenia prawidłowości
zliczania materiału statystycznego sposobem kreskowym porównuje się liczbę kresek z
liczebnością badanej zbiorowości. Jednak nawet w sytuacji, gdy liczba kresek jest równa
liczebności zbiorowości, mógł zostać popełniony błąd, że kreska została postawiona przy
niewłaściwym wariancie cechy.

Przykład
Liczba noworodków, które narodziły się w każdym z 75 szpitali w województwie Śląskim w dniu 29.11.1998r.
przedstawia się następująco: 60; 65; 67; 69; 71; 75; 76; 77; 78; 79; 81; 83; 88; 95; 96; 97; 98; 100; 102; 103;
104; 105; 106; 107; 108; 109; 110; 111; 112; 113; 114; 115; 116; 117; 119; 119; 120; 121; 122; 125; 125;
127; 128; 128; 130; 130; 132; 132; 136; 139; 142; 143; 145; 146; 147; 149; 150; 150; 150; 151; 162; 163;
163; 164; 165; 166; 166; 168; 169; 169; 177; 177; 182; 184; 184.

Liczba

noworodków

Liczba szpitali (każdy szpital

oznaczony jest kreską)

Liczba szpitali

60 – 85

IIII IIII II

12

86 – 111

IIII IIII IIII I

16

112 – 137

IIII IIII IIII IIII I

21

138 – 163

IIII IIII IIII

14

164 - 189

IIII IIII II

12

Razem

75



Zliczanie sposobem kartkowym polega na posegregowaniu indywidualnego

materiału statystycznego w postaci wypełnionych formularzy statystycznych na stosy o
jednakowych wariantach cechy. Po zliczeniu formularzy znajdujących się w każdym stosie
zapisuje się ich liczbę. Zliczanie sposobem kartkowym może być stosowane jedynie
wówczas, gdy informacje o poszczególnych jednostkach podlegających badaniu zostały
zebrane na indywidualnych formularzach.

- 4 -

background image

Zliczanie sposobem maszynowym jest stosowane, gdy liczebność badanej zbiorowości jest
duża. Jest rzadko stosowana ze względów finansowych, wysoki koszt maszyn. Ten sposób
zliczania materiału statystycznego jest stosowany przez instytucje, które prowadzą wiele
różnych badań statystycznych, w których można wykorzystać zakupione maszyny. Dokonując
zliczenia sposobem maszynowym należy wykonać symbolizację materiału statystycznego.



Przedział

to zbiór elementów danego zbioru częściowo uporządkowanego, zawartych

między dwoma ustalonymi elementami tego zbioru, nazywanymi początkiem i końcem
przedziału.

Przedział nazywa się domkniętym, gdy oba jego końce doń należą, zaś otwartym gdy żaden
nie należy. Jeśli do przedziału należy tylko początek albo tylko koniec, przedział taki nazywa
się, odpowiednio, lewostronnie albo prawostronnie domkniętym.

Przykłady przedziałów w zbiorze liczb rzeczywistych:

Przedział otwarty o końcach a i b liczb rzeczywistych jest to zbiór postaci {x: a<x<b},
gdzie a i b są pewnymi liczbami rzeczywistymi. Przedział otwarty to zbiór wszystkich
liczb pomiędzy a i b (nie włączając a i b). Notacja: (a,b) lub (a;b).

Przedział otwarty :























- 5 -

background image

Szereg statystyczny - ciąg wielkości statystycznych, uporządkowanych wg określonego
kryterium


Wśród szeregów statystycznych wyróżnia się szeregi:

jednocechowe (jednowymiarowe) – obejmują wartości liczbowe jednej cechy, czyli

próby jednowymiarowe (np. cecha – przychody z podatków z nieruchomości;
jednostki – przedsiębiorstwa),

wielocechowe (wielowymiarowe) – uwzględniają wartości liczbowe dwu lub więcej

cech, czyli próby wielowymiarowe (np. cechy – liczba złożonych zeznań
podatkowych, liczba prywatnych działalności gospodarczej, opłaty z działalności
gospodarczej; jednostki – osoby fizyczne prowadzące działalność gospodarczą).


Wśród jednych i drugich wyodrębnia się szeregi szczegółowe i strukturalne. W szeregach
pierwszego rodzaju podawane są szczegółowe wartości liczbowe cech jednostek
wchodzących w skład próby jedno lub wielowymiarowej. W przypadku drugim zadawane są
pewne przedziały liczbowe oraz liczby jednostek do nich zaliczanych.
Szeregi szczegółowe najczęściej mają postać szeregu surowego i wtedy jest określany jako
szereg nieuporządkowany. Gdy ma on postać odpowiednio uporządkowaną dla jednej z
wybranych cech według wartości rosnących (niemalejących) lub malejących (nierosnących),
to wówczas otrzymuje się szereg uporządkowany.


Sposób grupowania cech zależy od: rodzaju badania (przekrojowe, czasowe), rodzaju cechy
statystycznej, sposobu pomiaru oraz liczby obserwacji (szczegółowe, rozdzielcze).


Szeregiem szczegółowym nazywamy uporządkowany, wyłącznie według wartości badanej
cechy, zbiór danych. Porządkowanie polega na ustawieniu wartości określonej cechy danej
zbiorowości lub próby według kolejności rosnącej lub malejącej.

Szereg szczegółowy obejmuje wartości zmiennych występujących u wszystkich
jednostek badanej zbiorowości.


Przykład

Załóżmy, że mamy szereg statystyczny, zawierający 10 obserwacji dotyczących wieku
studentów II roku, o następującej postaci:

19, 20, 20, 20, 20, 21, 21, 22, 23.

x

i

n

i

19

1

20

4

21

2

22

1

23

1


- 6 -

background image

Wzory;

n

i

i

n

x

n

x

x

x

x

n

x

1

3

2

1

1

1

Średnia arytmetyczna


D -

Dominanta ( wartość występująca najczęściej )

2

1

2

2

n

n

x

x

Me

Mediana ( wartość średnia ) dnia parzystej liczby n


2

1

n

x

Me

Mediana ( wartość średnia ) dnia nieparzystej liczby n


2

2

1

2

1

2

1

1

x

x

n

x

x

n

S

i

n

i

Wariancja


2

S

S

Odchylenie standardowe

min

max

x

x

R

Rozstęp

%

100

x

S

V

S

Współczynnik zmienności

n

i

i

x

x

n

d

1

1

Odchylenie przeciętne

%

100

x

d

V

d

Współczynnik zmienności

s

x

s

x

x

typ

;

Typowy obszar zmienności

s

x

s

x

3

;

3

3

Reguła trzech sigm

- 7 -

background image

Szeregiem rozdzielczym nazywamy uporządkowany i pogrupowany (według

przyjętych kryteriów) zbiór informacji dotyczących badanej cechy występującej w
określonej zbiorowości lub próbie. Otrzymuje się go dzieląc zbiorowość statystyczną
na klasy zbiorcze według pewnej cechy i podając liczebności każdej z tych klas,
zwane liczebnościami klasowymi ni, i=1,2,...,k.


Szeregi rozdzielcze mogą dotyczyć zarówno cechy jakościowej, jak i ilościowej.
Charakteryzują one strukturę danej zbiorowości stąd nazywane są czasem szeregami
strukturalnymi.

Kolejne kroki podczas wykonywania szeregu rozdzielczego:

porządkujemy (jeśli to możliwe rosnąco) wartości cechy

zliczamy ilość wystąpień danej cechy w próbie

obliczamy częstości występowania dla każdej wartości cechy

prezentujemy wynik w formie tabeli


Jeśli cecha ma charakter ciągły, wtedy dzielimy przedział wartości cechy na przedziały
klasowe. Liczba i rozpiętości przedziałów powinny być tak dobrane, aby dawały przejrzysty
obraz rozkładu. Na ogół przyjmuje się, że liczba przedziałów powinna być większa od 5 i
mniejsza od 20.

Jeśli cecha ma charakter skokowy, ale liczba możliwych wartości jest bardzo duża, wtedy
możemy postąpić podobnie jak w przypadku cechy o charakterze ciągłym.

Przykład: Oceny ze statystyki uzyskane przez uczniów klas I Policealny Studium Technik
rachunkowości w roku szkolnym 2005/2006 r.

Ocena

Liczba uczniów

1

0

2

1

3

4

4

6

5

5

6

4

Razem

20

0%

5%

20%

30%

25%

20%

Niedostateczny
Dopuszczający

Dostateczny

Dobry

Bardzo dobry
Celujący

- 8 –

background image

Wzory;


Pierwsza metoda podziału szeregu lementów ego

na grupy klasowe

n - liczba lementów

lementów – liczba klas



5

5

2

1

k

Druga metoda podziału szeregu lementów ego na grupy klasowe



k

R

b

lement przedziału klasowego ( lementów )



k

i

n

x

n

x

1

1

1

Średnia arytmetyczna szeregu lementów ego



D

D

D

D

D

D

D

D

b

n

n

n

n

n

n

x

D

1

1

1

Dominanta ( szeregu lementów ego ) – wybieramy przedział
o największej liczbie lementów


Me

Me

l

Me

b

n

n

n

x

Me

Q

1

2

2

Mediana (dolna granica w której znajduje się mediana)



- 9 -

n

k

30 – 60

6 – 8

60 – 100

5 – 10

background image

k

i

i

o

i

n

x

x

n

s

1

2

2

1

,

2

s

s

,

%

100

x

s

V

s

,

k

i

i

o

n

x

x

n

d

1

1

,

%

100

x

d

V

d

Stopień zróżnicowania



s

D

x

A

S

,

d

D

x

A

d

= 0 – symetria
> 0 – asymetria lewostronna
< 0 – asymetria prawostronna


3

3

s

m

A

S

gdzie

i

o

i

n

x

x

n

m

3

3

1

Klasyczny współczynnik asymetrii




4

4

4

s

m

gdzie

k

i

i

o

n

x

x

n

m

1

4

4

1

Stopień skoncentrowania



3

4

> 0 – rozkład bardziej wysmukły
= 0 – rozkład normalny
< 0 – rozkład bardziej spłaszczony










- 10 -

background image

Szereg geograficzny – przedstawiają rozmieszczenie wielkości statystycznych

według jednostek administracyjnych (gmin, województw w układzie terytorialnym) a
także w układzie krajów i części świata.

Zbudowane z dwóch kolumn, w pierwszej z tych kolumn wymieniamy jednostki podziału
zbiorowości statystycznej na mniejsze grupy. Jednostkami przedziału szeregów terytorialnych
są jednostki geograficzne (terytorialne, przestrzenne), np. gmina, województwo, państwo,
regiony gospodarcze, kontynenty.
W drugiej kolumnie szeregu terytorialnego informuje się o wielkości badanego zjawiska w
jednostce wymienionych w pierwszej kolumnie. Szereg geograficzny pozwala na
przedstawienie przestrzennego rozmieszczenia badanego zjawiska w określonym czasie.



Kraje

Zbiory herbaty (w tysiącach

ton)

Świat w tym:

2645

Argentyna

44

Chiny

637

Gruzja

74

Indie

720

Indonezja

174

Japonia

92

Kenia

200

Sri Lanka

240

Turcja

15




54%

1%

13%

2%

15%

4%

2%

4%

5%0%

Świat w tym:

Argentyna

Chiny

Gruzja

Indie

Indonezja

Japonia

Kenia

Sri Lanka

Turcja





- 11 –

background image

Tablica 6. Powierzchnia poszczególnych kontynentów

Wyszczególnienie

Powierzchnia w tys. km

2

Europa

23 039

Azja

31 878

Afryka

30 305

Ameryka Północna i Środkowa

24 678

Ameryka Południowa

17 819

Oceania

8 536

Świat ogółem

136 255





0

20 000

40 000

60 000

80 000

100 000

120 000

140 000

Powierzchnia

w tys. km2

Europa

Afryka

Ameryka

Południowa

Świat

ogółem

Kontynenty
















-

12 -

background image

Szereg czasowy - (dynamiczny chronologiczny) powstaje w wyniku grupowania

typologicznego i wariacyjnego, gdy podstawą grupowania jest zmiana badanego
zjawiska w czasie:

- Szereg czasowy okresów – zawiera informację o rozmiarach zjawiska w krótszych lub
dłuższych okresach.
- Szereg czasowy momentów – ujmuje wielkość zjawiska w danym momencie, najczęściej
na początku lub końcu np. miesiąca.
Pokazują, jak kształtuje się zjawisko na skutek upływu czasu. Służą one do prezentacji
rozwoju zjawiska w czasie. Szeregi czasowe zbudowane są z dwóch kolumn. W pierwszej z
nich podawane są momenty czasu, np. : 31.12.1993, 31.12.1994, 31.12.1995, 31.12.1996,
31.(szeregi czasowe momentów – tablica 4) lub okresy, np. : I kwartał 1996, II kwartał 1996,
III kwartał 1996, IV kwartał 1996 (szeregi czasowe okresów – tablica 5). W drugiej kolumnie
zapisywana jest wielkość badanego zjawiska, jaka wystąpiła w czasie określonym w
pierwszej kolumnie.

Tabela 4. Ludność Polski w latach

1990 – 1994 ( szereg czasowy momentów)

Czas

Liczba ludności (w mln)

1990

38,2

1991

38,3

1992

38,4

1993

38,5

1994

38,6

Tablica 5. małżeństwo zawarte w Polsce w latach

1991 – 1995 (szereg czasowy okresowy)

Rok

Małżeństwo zawarte

1991

255 369

1992

233 206

1993

217 240

1994

207 674

1995

207 689

Małżeństwo zawarte

0

50 000

100 000

150 000

200 000

250 000

300 000

1991

1992

1993

1994

1995

Małżeństwo zawarte

- 13 -

background image

Kontrola materiału statystycznego



Rozróżniamy 2 rodzaje kontroli:

kontrolę formalną materiału statystycznego obejmującą kontrolę kompletności
materiału statystycznego, kontrolę zupełności zapisów oraz kontrolę zgodności
rachunkowej.

kontrolę merytoryczną materiału statystycznego sprowadzającą się do kontroli
logicznej poprawności zapisu


Kontrola kompletności materiału statystycznego polega na sprawdzeniu czy otrzymano
materiał od wszystkich jednostek sprawozdawczych zobowiązanych do jego przesłania.
Kontrola zupełności zapisu polega na sprawdzeniu czy odpowiedziano na wszystkie pytania
zawarte w formularzu ankiecie lub innych materiałach statystycznych.



Ankieta jest najpopularniejszym i najbardziej masowym sposobem zdobywania informacji,
wykorzystywanym w badaniach opinii i postaw ludzi oraz w badaniach masowych
























K. Romaniuk „Elementy ogólnej teorii statystyki”
B. Szulc „Statystyka dla ekonomistów”
S. Diamond „ Wszechstronna statystyka”

http://www.ekonometria.4me.pl/statystyka3.htm

http://prace.sciaga.pl/35773.htm

- 14 -


Wyszukiwarka

Podobne podstrony:
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
Opracowanie materialu statystycznego, Administracja
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
opracowanie-materiaŁu-statystycznego.--oryginal, Kierunki nauki, Ekonomia i statystyka
Opracowanie materiału statystycznego
Opracowanie materiału statystycznego
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
8 Metody organizacyjno techniczne opracowania materiału statystycznego
opracowanie materialu statystycznego zadania
02 Opracowanie i analiza materiału statystycznego
J. Huizinga - Jesień średniowiecza, Notatki, opracowania, materiały na kolokwia
mosty opracowany materiał - koło, protetyka informacje
Kolokwium Opracowanie materiału
opracowanie materiału na egzamin, Pedagogika, Lekomania
Kolokwium Opracowanie materiałów
Materiał statystyczny jest to zbiór?nych uzyskanych w wyniku obserwacji

więcej podobnych podstron