OPRACOWANIE MATERIAŁU STATYSTYCZNEGO

background image

OPRACOWANIE MATERIAŁU

STATYSTYCZNEGO

SZEREGI
STATYSTYCZNE

background image

Grupowanie

polega na wyodrębnieniu jednorodnych lub
względnie jednorodnych części w ramach
większej i zróżnicowanej zbiorowości
statystycznej,

background image

Zadaniem grupowania

jest przejście od informacji o właściwościach
poszczególnych jednostek do informacji o
właściwościach całej zbiorowości.

background image

Z punktu widzenia celu, jakiemu ma służyć
dzielimy je na:

-

typologiczne -

wyodrębnianie grup jednorodnych

różnych jakościowo (np. według cech terytorialnych,
czasowych, rzeczowych)

- wariacyjne -

mające na celu uporządkowanie

badanej zbiorowości i poznanie jej struktury, które
polega na łączeniu w klasy jednostek statystycznych
o odpowiednich wartościach cech statystycznych.

background image

Zliczanie

czynność ściśle związana z grupowaniem

(ręczne, elektroniczne).

background image

Szereg statystyczny

jest to zbiór wyników obserwacji
uporządkowanych według określonych cech
(kryteriów), których miernikiem są zmienne.

Inaczej mówiąc, szeregiem statystycznym
nazywamy ciąg liczbowy monotoniczny,
ograniczony z góry i z dołu (tj. taki, którego
wyrazy występują tylko w pewnym przedziale
wartości).

background image

Najczęściej wyróżnia się dwa kryteria podziału

szeregów:

kryterium formalne -

związane z budową

szeregu, na podstawie którego możemy
wyodrębnić: szeregi szczegółowe, szeregi
rozdzielcze
i szeregi skumulowane,

kryterium merytoryczne -

wynikające z typu

badanej cechy zbiorowości, według którego
wyróżnia się: szeregi czasowe i szeregi
przestrzenne
.

background image

Sposób grupowania cech zależy od:

rodzaju badania ,

rodzaju cechy statystycznej,

sposobu pomiaru,

liczby obserwacji .

background image

Szereg szczegółowy

uporządkowany ciąg wartości badanej cechy
statystycznej, stosowany, gdy przedmiotem
badania jest niewielka liczba jednostek, np.
zmienna X

przyjmuje wartości: x

1

, x

2

, ..., x

n

,

wartości cechy porządkujemy rosnąco: x

1

x

2

...

x

n

lub malejąco x

1

x

2

≥ ... ≥x

n

.

background image

Szereg rozdzielczy

stanowi zbiorowość statystyczną, podzieloną na
części (klasy) według określonej cechy jakościowej
lub ilościowej z podaniem liczebności lub częstości
każdej z wyodrębnionych klas.

Szeregi rozdzielcze mogą dotyczyć zarówno cechy
jakościowej, jak i ilościowej. Charakteryzują one
strukturę danej zbiorowości stąd nazywane są
czasem szeregami strukturalnymi.

background image

Szeregi Statystyczne

szczegółowe

rozdzielcze

czasowe

z cecha mierzalną

(ilościowe)

z cechą niemierzalną

(jakościowe)

punktowe

przedziałowe

geograficzne

inne

momentów

okresów

proste

skumulowane

proste

skumulowane

background image

ANALIZA STRUKTURY ZJAWISK MASOWYCH

Rozkład empiryczny- zestawienie wyników w postaci

szeregu rozdzielczego z cechą mierzalną.

Rozkład empiryczny odzwierciedla strukturę badanej

zbiorowości z punktu widzenia określonej cechy

statystycznej

background image

Szereg czasowy

szereg czasowy -

powstaje gdy podstawą

grupowania jest zmiana badanego zjawiska w
czasie:
-

szereg czasowy okresów - zawiera informację o

rozmiarach zjawiska w krótszych lub dłuższych
okresach.
-

szereg czasowy momentów - ujmuje wielkość

zjawiska w danym momencie, najczęściej na
początku lub końcu np. miesiąca.

background image

W przykładzie mamy następujące szeregi:

„Wypadki” - szereg okresów (łączna liczba

wypadków w każdym roku)

„Pojazdy” - szereg momentów (w każdym roku
stan na 31.XII)

t

(okres lub

moment)

rok

Pojazdy

stan na 31.XII

[tys.]

Wypadki

w roku

1

1995

11186

56904

2

1996

11766

57911

3

1997

12284

66586

4

1998

12709

61855

5

1999

13169

55106

6

2000

14106

57331

7

2001

14724

53799

razem

409492

background image

Podstawowe oznaczenia, podstawowe wielkości

n -

liczebność próby (zbiorowości próbnej),

x

i

- wariant cechy statystycznej (i = 1, 2 , ... , n),

n

i

- liczba jednostek o i-tym wariancie

cechy,

k -

liczba klas (wariantów cechy),

przy czym:

k

i

i

n

n

1

background image

Przykład szeregu szczegółowego

Dokonano pomiaru wzrostu (w cm) 12
studentów z jednej grupy ćwiczeniowej i
otrzymano następujące wyniki:

165, 166, 166, 167, 170, 170, 171, 172, 173,

175, 177, 181.

background image

Szereg rozdzielczy otrzymujemy wówczas gdy zbiorowość statystyczną podzielimy

na klasy według określonej cechy (jakościowej lub ilościowej) i podamy liczebność

każdej z tych klas.

W pewnym zakładzie przeprowadzono badanie grupy
krwi. Wybrano losowo 50 osób. Wyniki zostały
przedstawione w szeregu rozdzielczym punktowym

GRUPA KRWI

x

i

LICZEBNOŚĆ n

i

A

7

B

3

AB

10

0

30

background image

Badano czas reakcji

organizmu osób cierpiących
na pewne schorzenie po

zażyciu nowego leku.

Zbiorowość statystyczną

stanowiło 150 pacjentów
leczonych w szpitalu.
Mierzono czas (w min) od
podania jednorazowej dawki

leku do momentu wystąpienia
pewnego objawu. Zebrane
wyniki przedstawiono w
postaci obok podanego
szeregu rozdzielczego.

Czas reakcji w min

Liczba osób

3-7

3

8-12

4

13-17

15

18-22

24

23-27

70

28-32

22

33-37

7

38-42

5

RAZEM

150

background image

Wskaźnik struktury

W określaniu rozkładu empirycznego zamiast

liczebności n

i

stosuje się częstości względne

(zwane wskaźnikiem struktury) określone

wzorem:

Przy czym:

k

i

n

n

i

i

...

,

2

,

1

,

1

0

,

1

1

i

k

i

i

background image

Szeregi rozdzielcze skumulowane

Uzyskuje się poprzez przyporządkowanie
kolejnym wariantom cechy odpowiadających
im liczebności (częstości ) skumulowanych.

background image

Szereg rozdzielczy skumulowany wg
wieku badanych

NUMER

KLASY

i

WIEK

x

i

LICZEBNOŚĆ

SKUMULOWANA

n

isk

CZĘSTOŚĆ

SKUMULOWANA

ω

i

1

7

189

0,29

2

8

246

0,38

3

9

397

0,62

4

10

505

0,79

5

11

558

0,88

6

12

638

1

background image

Dystrybuanta empiryczna

To przyporządkowanie kolejnym wartościom
cechy statystycznej (zmiennej)
odpowiadających im częstości
skumulowanych (względnie liczebności
skumulowanych)

background image

Przykład 1

W wybranej grupie studentów przeprowadzono

kolokwium z matematyki.

Studenci otrzymali następujące oceny: 2, 5, 3, 4,

3+, 4, 3, 4+, 3+ , 3+, 5, 4, 3+, 4+, 3+, 3+, 3, 2, 3,
3+, 3, 4, 3+, 4, 3+, 4, 3, 4+, 4+, 3+.

background image

Opracowanie materiału statystycznego

Zbiorowość (populacja) generalna: …………………..

Zbiorowość próbna (próba): …………………………….

Cecha statystyczna:

………………………………………….

Liczebność próby n: …….

Liczba wariantów cechy k: …….

Warianty cechy x

i

:

…………………………

Szereg szczegółowy:

2; 2; 3; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4;

4; 4; 4; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5;

background image

Opracowanie materiału statystycznego

Zbiorowość (populacja) generalna: studenci

Zbiorowość próbna (próba): wybrana grupa studentów

Cecha statystyczna: ocena z kolokwium z matematyki

Studenci badani są pod względem ocen otrzymanych z kolokwium z
matematyki, "ocena z matematyki" jest cechą mierzalną skokową.

Liczebność próby n: 30

Liczba wariantów cechy k: 6

Warianty cechy x

i

: 2, 3, 3,5, 4, 4,5, 5

Szereg szczegółowy:

2; 2; 3; 3; 3; 3; 3; 3; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 3,5; 4; 4; 4;
4; 4; 4; 4,5; 4,5; 4,5; 4,5; 5; 5;

background image

Szereg rozdzielczy punktowy:

Numer wariantu

(klasy)

I

Wariant cechy

x

i

Liczebność

wariantu

n

i

1

2

3

4

5

6

liczebność próby n

background image

Szereg rozdzielczy punktowy:

Numer wariantu

i

Wariant cechy

x

i

Liczebność

wariantu

n

i

1

2

2

2

3

6

3

3,5

10

4

4

6

5

4,5

4

6

5

2

liczebność próby n

30

background image

W przypadku gdy wariantów jest dużo
budujemy szeregi rozdzielcze z

przedziałami klasowymi.

Tworzenie szeregów rozdzielczych z

przedziałami klasowymi-etapy:

-ustalenie liczby klas

-

określenie wielkości przedziałów klasowych

-

przyporządkowywanie danych przedziałom
klasowym

-

zliczanie liczby jednostek w każdej klasie

background image

Ustalanie liczby klas

Liczby klas w zależności od liczebności badanej zbiorowości

Liczba obserwacji

n

Liczba zalecanych klas

k

40-60

60-100

100-200
200-500

6-8

7-10
9-12

11-17

background image

Wzory na obliczanie niezbędnej liczby
klas

n

k

background image

Rozpiętość przedziału klasowego

Różnicę pomiędzy górną x

1i

i dolną x

0i

granica i-

tego przedziału klasowego

nazywamy rozpiętością (szerokością)
przedziału klasowego i oznaczamy przez h

i

background image

Wzór na ustalenie rozpiętości przedziałów
klasowych

gdzie:

nazywa się

rozstępem

, a k

oznacza liczbę klas

.

background image

Ustalanie granic poszczególnych klas

Jako dolną granicę najczęściej przyjmuje się

najmniejszą wartość cechy lub bliskiej tej

wartości, czyli:

Przy cechach ciągłych górne granice klas

poprzednich powinny być dolnymi granicami

klas następnych, aby nie było pomiędzy

przedziałami luk ponadto trzeba ustalić, do

której klasy zaliczyć wartości graniczne.

background image

Przykład

Struktura województw wg liczby gmin– dla cechy

skokowej

Szereg szczegółowy:

17, 30, 32, 37, 37, 39, 40, 40, 40, 40, 41, 41, 42, 42,

43, 43, 43, 44, 45,46, 46, 47, 47, 47, 48, 48, 49, 51,
54, 54, 55, 55, 55, 56, 57, 57, 58, 58,58, 59, 59, 62,
63, 63, 65, 69, 74, 78, 91.

background image

ROZWIĄZANIE

R =

h =
początek pierwszego przedziału klasowego
x

01

= x

min

=

(przyjmujemy, że rozpiętość przedziałów klasowych

jest taka sama dla wszystkich klas)

background image

ROZWIĄZANIE

R = 91

– 17 = 74,

h = 74/7 = 10,57 = 11
początek pierwszego przedziału klasowego
x

01

= x

min

= 17

(przyjmujemy, że rozpiętość przedziałów klasowych

jest taka sama dla wszystkich klas)

background image

Rozkład empiryczny i dystrybuanta empiryczna –

Struktura województw wg liczby gmin

Numer
klasy

Liczba
gmin

Liczba
województw

Wskaźnik
struktury

Liczebność
skumulowana

Skumulowany

wskaźnik
struktury

i

x

i

n

i

ω

i

n

isk

ω

isk

1

17 - 27

1

0,02

1

0,02

2

28 - 38

4

0,08

5

0,10

3

39 - 49

22

0,45

27

0,55

4

50 - 60

14

0,29

41

0,84

5

61 - 71

5

0,10

46

0,94

6

72 - 82

2

0,04

48

0,98

7

83 - 93

1

0,02

49

1,00

n =

49

background image
background image

Przykład

Struktura badanej zbiorowości dzieci w wieku 7 lat według masy

ciała

Szereg szczegółowy:

16,17,17,18,18,18,18,18,19,19,19,19,20,20,20,20,20,20,20,20,2
0,20,21,21,21,21,21,21,21,21,22,22,22,22,22,22,22,
22,22,22,22,22,23,23,23,23,23,23,23,23,23,23,23,23,23,23,23,2
4,24,24,24,24,24,24, 24,24,24,24,24,24,24,24,24,24,
24,24,24,24,24,25,25,25,25,25,26,26,26,26,26,26,26,27,27,27,2
7,27,2727,28,28,28,28,28,29,29,29,29,29,29,29,2930,30,30,30,
30,30,30,31,31,31,31,31,31,32,32,32,32,33,33,34,34,34,35,35,3
5,35,35,37,40,47.

background image

ROZWIĄZANIE

R = 47-16=31,
h = 31/12=2,58=3
początek pierwszego przedziału klasowego
x

01

= x

min

= 16

(przyjmujemy, że rozpiętość przedziałów klasowych

jest taka sama dla wszystkich klas)

12

144

k

background image

Rozkład empiryczny i dystrybuanta empiryczna –

Struktura dzieci w wieku 7 lat wg masy ciała

Numer

klasy

Dolna
granica
klasy

Górna
granica
klasy

n

i

ω

i

n

isk

ω

isk

1

16

18

8

0,056

8

0,056

2

19

21

22

0,153

30

0,208

3

22

24

52

0,361

82

0,569

4

25

27

19

0,132

101

0,701

5

28

30

20

0,139

121

0,840

6

31

33

12

0,083

133

0,924

7

34

36

8

0,056

141

0,979

8

37

39

1

0,007

142

0,986

9

40

42

1

0,007

143

0,993

10

43

45

0

0,000

143

0,993

11

46

48

1

0,007

144

1,000

144

background image
background image

Dysrybuanta empiryczna

0

20

40

60

80

100

120

140

160

18

21

24

27

30

33

36

39

42

45

48

16

19

22

25

28

31

34

37

40

43

46

Li

cz

ebn

ć

prz

edz

ia

łów

background image

ETAP CZWARTY - POLEGA NA:

opisie statystycznym - dotyczy tylko danej
zbiorowości generalnej lub próby
niekoniecznie losowej,

lub wnioskowaniu statystycznym - kiedy
badanie jest reprezentacyjne (próba losowa)
i jego wyniki są uogólniane na całą populację
generalną.

background image

Podstawą wnioskowania

statystycznego są empiryczne wyniki
badania reprezentacyjnego (wyniki

losowo wybranej próby)

Charakterystyki obliczane z próby losowej
nazywamy statystykami

(np. średnia

arytmetyczna z próby, odchylenie
standardowe z próby)

Te same parametry obliczone z populacji
generalnej noszą nazwę parametrów

background image

W badaniu, opartym na metodzie reprezentatywnej,
badaniu podlega jedynie jej losowo wybrana część,
parametry są szacowane na podstawie wyniku z
próby.

Wartości tych parametrów zależą od
wyników próby losowej

Jeżeli próba jest reprezentatywna, to
statystyki są dobrymi estymatorami
parametrów populacji generalnej.

Wraz ze wzrostem liczebności próby wartość
estymatorów zbliża się do prawdziwych
wartości parametrów

background image

PREZENTACJA GRAFICZNA

MATERIAŁU STATYSTYCZNEGO

Pogrupowany i uporządkowany materiał
statystyczny prezentuje się za pomocą tablic
statystycznych prostych i kombinowanych
oraz odpowiednich wykresów.

background image

Wykres

jest graficzną formą rejestracji danych oraz
narzędziem prezentacji i analizy
uogólnionych informacji statystycznych.

Wykresy ujmują zjawiska w sposób
syntetyczny w związku z tym zawierają mniej
szczegółów niż tablice (należy je traktować
jako uzupełnienie tablic statystycznych)

background image

Budowa wykresu

Każdy wykres powinien posiadać:

Tytuł

Źródło danych, na podstawie których został
sporządzony

Legendę, czyli wyjaśnienie zastosowanych
symboli, barw oraz przyjętych skal.

background image
background image

W grafice statystycznej wyróżnia się

następujące rodzaje wykresów:

Liniowe-

prezentacja za pomocą linii lub

odcinków

Powierzchniowe

– prezentacja za pomocą

figur płaskich (wykresy słupkowe, kołowe)

Pasmowe

Punktowe

Mapowe- kartogramy

Kombinowane oraz specjalne

background image

WYKRESY STATYSTYCZNE:
LINIOWY

Ceny akcji spółki Kęty

0,00

20,00

40,00

60,00

80,00

100,00

120,00

140,00

160,00

1k

w

2k

w

3k

w

4k

w

1k

w

2k

w

3k

w

4k

w

1k

w

2k

w

3k

w

4k

w

1k

w

2k

w

3k

w

4k

w

1k

w

2k

w

3k

w

4k

w

2000

2001

2002

2003

2004

kwartały

ce

na

background image

WYKRESY STATYSTYCZNE:

SŁUPKOWY

Przychody ze sprzedaży

434

481

576

768

1130

0

200

400

600

800

1000

1200

2000

2001

2002

2003

2004

lata

wartość

(mln PLN)

background image

WYKRESY STATYSTYCZNE:

KOŁOWY

Udziały w rynku

27%

33%

15%

25%

Spółka A

Spólka B

Spółka C

Spółka D

background image

WYKRESY STATYSTYCZNE:
PUNKTOWY

Przychody ze sprzedaży

434

481

576

768

1130

0

200

400

600

800

1000

1200

1999

2000

2001

2002

2003

2004

2005

lata

wartość

(mln PLN)

background image

WYKRESY STATYSTYCZNE:
WARTSTWOWY

Przychody ze sprzedaży

434

481

576

768

1130

0

200

400

600

800

1000

1200

2000

2001

2002

2003

2004

lata

wartość

(mln PLN)

background image

WYKRESY STATYSTYCZNE:

BRYŁOWY

434

481

576

768

1130

0

200

400

600

800

1000

1200

wartość

(mln PLN)

2000

2001

2002

2003

2004

lata

Przychody ze sprzedaży

background image

WYKRESY STATYSTYCZNE:

PIERŚCIENIOWY

Przychody ze sprzedaży

434

481

576

768

1130

background image

Mapowe - kartogramy

background image

Kombinowane oraz specjalne

background image

Wykresy opisujące rozkład cechy mierzalnej

w prostokątnym układzie współrzędnych to:

histogramy (wykresy słupkowe) - zbór przylegających

prostokątów, których podstawy, równe rozpiętości
przedziałów klasowych - znajdują się na osi
odciętych, a wysokości są określone na osi
rzędnych przez liczebności (częstości)
odpowiadające poszczególnym przedziałom
klasowym lub przez gęstości liczebności
(częstości) w przypadku nierównych przedziałów
klasowych.

background image
background image

2.

diagramy, wykresy liniowe (wielobok liczebności) - jest
łamaną, powstałą przez połączenie punków, których
współrzędnymi są środki przedziałów klasowych i
odpowiadające im liczebności (częstości lub gęstości).

3.

krzywe liczebności (częstości) dla cechy ciągłej - gęsta
siatka punktów wyznaczająca wielobok liczebności.

background image

Tablice statystyczne

Prezentują dane statystyczne
uporządkowane według określonego
kryterium

Stanowią główną formę prezentacji danych
liczbowych, dlatego powinny spełniać
określone wymogi dotyczące formalnej
budowy oraz merytorycznej spoistości

background image

Budowa tablicy

Każda tablica powinna zawierać:

a)

Część opisową

-

Tytuł

-

Nazwy wierszy (boczek), nazwy kolumn (główka)

-

Źródła danych

-

Ewentualnie inne uwagi wyjaśniające (np. legenda
użytych znaków graficznych)

b)

Część liczbową – tabelę właściwą

background image

Obowiązuje zasada bezwzględnego wypełniania
wszystkich kolumn i wierszy tablicy.

Jeżeli wszystkie pola nie mogą być wypełnione znakami, to w polskiej praktyce
statystycznej stosuje się następujące znaki umowne:

- (kreska)

Zjawisko nie występuje

0 (zero)

Zjawisko występuje, ale w
jednostkach mniejszych niż pół
jednostki miary przyjętej w tablicy

· (kropka)

Zupełny brak informacji lub brak
informacji wiarygodnych

x (krzyżyk)

Wypełnienie pozycji ze względu na
układ tablicy jest niemożliwe lub
niecelowe

W tym

Nie podaje się wszystkich
składników sumy

background image

Podział tablic

Proste

– struktura lub dynamika jednej zbiorowości

statystycznej ze względu na jedną cechę (ilościową
lub jakościową), Tablica prosta może być
utożsamiana z szeregiem statystycznym.

Złożone – opis badanej zbiorowości według kilku
cech, lub opis kilku zbiorowości ze względu na jedną
cechę. Tego rodzaju tablice prezentują zespół
szeregów statystycznych, a stopień ich złożoności
zależy od liczby badanych cech lub zbiorowości.

background image

Przykład tablicy wielodzielczej

Z populacji mężczyzn urodzonych w 1970 r.
wybrano losowo grupę złożoną z 90 osób i
określono ich wagę i wzrost. Wagę mierzono z
dokładnością do 0,1 kg, a wzrost 0,1 cm.
Otrzymane wyniki zaprezentowano w poniższej
tabeli dwudzielczej.

background image

Waga

Wzrost

Granice klas

Granice

klas

161,8-
165,2

165,3-

168,6

168,7-

172

172,1-

175,4

175,5-

178,8

178,9-

182,2

182,3-

185,6

49-54

4

2

1

1

-

-

1

54,1-59

2

9

2

-

-

2

-

59,1-64

2

4

8

3

1

-

-

64,1-69

-

-

4

9

5

1

3

69,1-74

1

1

-

-

2

9

5

74,1-79

-

1

1

-

-

-

3

79,1-84

-

-

-

1

-

1

1


Wyszukiwarka

Podobne podstrony:
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
Opracowanie materialu statystycznego, Administracja
opracowanie materialu statystycznego
opracowanie-materiaŁu-statystycznego.--oryginal, Kierunki nauki, Ekonomia i statystyka
Opracowanie materiału statystycznego
Opracowanie materiału statystycznego
OPRACOWANIE MATERIAŁU STATYSTYCZNEGO
8 Metody organizacyjno techniczne opracowania materiału statystycznego
opracowanie materialu statystycznego zadania
02 Opracowanie i analiza materiału statystycznego
J. Huizinga - Jesień średniowiecza, Notatki, opracowania, materiały na kolokwia
mosty opracowany materiał - koło, protetyka informacje
Kolokwium Opracowanie materiału
opracowanie materiału na egzamin, Pedagogika, Lekomania
Kolokwium Opracowanie materiałów
Materiał statystyczny jest to zbiór?nych uzyskanych w wyniku obserwacji

więcej podobnych podstron