2 Statystyka w badaniach Tabel Nieznany (2)

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Tabelaryczna i graficzna prezentacja struktury zbiorowości

Wstępna analiza statystyczna obejmuje szereg czynności związanych z porządkowaniem, prezentacją i

opisową charakterystyką zbioru danych. Polega ona, najogólniej mówiąc, na przekształceniu szczegółowych
danych dotyczących poszczególnych osób (rzeczy, zjawisk, procesów) na syntetyczną informację o całej badanej
zbiorowości, czyli na przedstawieniu i opisie struktury tej zbiorowości.

Tabela wyników surowych – arkusz danych

Dane zebrane wpisz w arkusz danych,
aby porządek był zachowany

Zgromadzony w trakcie badań materiał – wypełnione ankiety, rozwiązane testy, dane z przeprowadzonych

wywiadów, itp. musi zostać uporządkowany w tabeli wyników surowych.

Tabela wyników surowych to zapisane - w uporządkowaniu wyznaczonym schematem tabeli - dane z badań.

A więc, na przykład, dane dotyczące płci, wykształcenia, odpowiedzi poszczególnych osób na pytania ankiety,
kwestionariusza, wyniki wykonywanych lub rozwiązywanych przez nich testów, jak też inne wyznaczone celem
badań pomiary.

Identy-
fikator

ZMIENNE

Cechy fizyczne

Środowisko rodzinne

Sprawność

PŁEĆ

WZROST ......

....

Liczba
RODZ.

......

......

........

TEST1

TEST2

.......

1
2
3
...

Rys.1. Schemat tabeli wyników surowych – przykład

Pierwsza kolumna tabeli wyników surowych – boczek tabeli – zawiera identyfikatory jednostek badania.

Identyfikatorem mogą być dowolne nazwy lub symbole pozwalające rozróżnić poszczególne jednostki. Mogą to
być, na przykład, po prostu liczby porządkowe.

W główce tabeli wyników surowych zapisujemy w hierarchicznym uporządkowaniu właściwości

wyznaczone przedmiotem badań (zmienne badane). Zmiennymi są na przykład takie właściwości osób jak: płeć,
wzrost, liczba rodzeństwa, poziom wykształcenia, preferowany rodzaj wypoczynku, poziom inteligencji.

W komórki tabeli wyników surowych wpisujemy zaobserwowane wartości wyróżnionych zmiennych. I tak

wartości zmiennej płeć, to: płeć męska (mężczyzna), płeć żeńska (kobieta); wartości zmiennej preferowany
rodzaj wypoczynku
, to na przykład: wypoczynek bierny, wypoczynek czynny; wartości zmiennej liczba
rodzeństwa,
to liczby: 0 rodzeństwa, 1 rodzeństwo, 2 rodzeństwa, ......

Każdy wiersz tabeli zawiera te wartości wyróżnionych zmiennych, które charakteryzują osobę (jednostkę)

oznaczoną identyfikatorem w tym wierszu umieszczonym. Jeżeli, na przykład, identyfikator 1 został
przyporządkowany Annie Abackiej, to w wierszu o numerze 1 wpiszemy wszystkie zebrane dane dotyczące
Anny Abackiej. W kolumnie natomiast umieszczamy dane zebrane od wszystkich osób, ale dotyczące tylko
jednej z badanych właściwości, np. liczby rodzeństwa.

Tabela rozkładu jednej zmiennej

Zgromadzenie i uporządkowanie w tabeli wyników surowych materiału z badań to, można powiedzieć,

wstępny etap wstępnej analizy statystycznej. Kolejnym etapem jest rozpoznanie struktury danych, a tym samym
struktury badanej zbiorowości ze względu na różne, interesujące nas zmienne. Szukamy na przykład odpowiedzi
na pytania: Ile w badanej zbiorowości uczniów jest dziewcząt, a ilu chłopców?; Jaki procent badanej
zbiorowości stanowią dziewczęta, a jaki chłopcy? (jest to pytanie o wskaźniki struktury); Jak licznie
reprezentowane są poszczególne postawy dzieci względem rodziców?; Która z tych postaw jest reprezentowana
najczęściej? (jest to pytanie o wartość modalną, dominantę); Jaki jest rozkład wyników testu sprawności w
badanej grupie młodzieży?

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Odpowiedzi na te i podobne pytania można uzyskać poddając zgromadzone dane odpowiedniemu

grupowaniu. Czynność ta prowadzi do wyodrębnienia w badanej zbiorowości względnie jednorodnych grup, tzn.
takich, że osoby (jednostki) zaliczone do jednej grupy mają co najmniej jedną własność wspólną, bądź różnią się
ze względu na tę własność nieznacznie. Tak więc wyróżnimy, na przykład, grupę chłopców i grupę dziewcząt,
jeżeli za podstawę wyodrębnienia grup przyjmiemy zmienną „płeć”; albo grupy młodzieży, które uzyskały w
teście sprawności wyniki 0p-5p, 6p-10p, itd.; albo grupy chłopców o wynikach odpowiednio 0p-5p, 6p-10p, itd.
i grupy dziewcząt o takichże wynikach. Ogólnie, jakie to mają być grupy wynika przede wszystkim z celów
badań. Natomiast samo grupowanie musi spełniać określone warunki formalne. Po pierwsze, otrzymane grupy
muszą być rozłączne, czyli nie mogą mieć elementów wspólnych. Po drugie, wszystkie podlegające grupowaniu
elementy muszą zostać przyporządkowane do tworzonych grup.

STRUKTURĘ danych
przedstawisz najlepiej
w tabeli lub na wykresie.

Taka struktura, ROZKŁADEM ZMIENNEJ zwana,
prezentuje zbiorowość
pod względem cechy wybranej do badania.

Po utworzeniu grup określamy liczebność każdej grupy, tzn. zliczamy ile jednostek do każdej z grup należy.

Ustalamy tym samym następujące przyporządkowanie:

1.

wartość zmiennej x

1

→ liczba n

1

danych równych wartości x

1

2.

wartość zmiennej x

2

→ liczba n

2

danych równych wartości x

2

.

3........

Takie przyporządkowanie nazywamy rozkładem liczebności badanej zbiorowości według wartości

zmiennej, krótko: rozkładem empirycznym zmiennej

. Rozkład zmiennej obrazuje strukturę badanej

zbiorowości pod względem badanej zmiennej (cechy) i może być przedstawiony w tabeli liczebności lub na
wykresie.

Wartość

zmiennej

X

Liczebność

n

i

Liczebność

względna

p

i

%

x

1

n

1

p

1

x

2

n

2

p

2

..

....

.....

Σ

N

100

Rys. 2. Schemat tabeli przedstawiającej rozkład zmiennej

Symbol N oznacza tu liczebność badanej zbiorowości, zaś n

i

liczebności wyodrębnionych grup. Suma

liczebności wyodrębnionych grup równa jest liczebności badanej zbiorowości:

n

1

+ n

2

+ .... + n

k

= N, gdzie k oznacza tu liczbę wartości zmiennej.

Liczebności względne

N

n

p

i

i

=

, to wskaźniki struktury. Wskaźnik struktury informuje o tym, jaka część

zbiorowości charakteryzuje się własnością (wartością zmiennej), dla której wskaźnik struktury został obliczony.
Dla wskaźników struktury spełniona jest równość:

p

1

+ p

2

+ .... + p

k

= 1

Wskaźniki struktury można też podawać w procentach. Wówczas mamy równość:

p

1

+ p

2

+ .... + p

k

= 100%

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Przykład 1: W ramach prac związanych z przygotowaniem projektu przeciwdziałania bezrobociu w pewnym

regionie, należało poznać strukturę wykształcenia osób bezrobotnych. Pobrano 500-osobową próbę osób
zarejestrowanych w urzędach pracy tego regionu i sprawdzono, jaki poziom wykształcenia ma każda z nich.

Tabela 1. przedstawia otrzymany szereg rozdzielczy (rozkład zmiennej: poziom wykształcenia w badanej

grupie osób).

Tabela 1. Wykształcenie osób bezrobotnych zarejestrowanych w ......

Poziom
wykształcenia

Liczebność

n

i

Liczebność

względna p

i

Zawodowe

335

0,670

Średnie

121

0,242

Wyższe

44

0,088

Σ

n

i

500

1,000

Źródło: Dane umowne

Dla wartości „wykształcenie średnie” wskaźnik struktury wynosi 0,242 co oznacza, że 24,2% badanej

zbiorowości stanowią osoby z wykształceniem średnim.

Przykład 2: W celu ustalenia norm empirycznych testu ortograficznego dla uczniów kończących klasę III

szkoły podstawowej przeprowadzono badania. Losowo wybrani na początku czerwca z populacji
trzecioklasistów uczniowie wypełniali test. Rozkład liczby popełnionych błędów przedstawiony jest w tabeli 2
.

Tabela2. Liczba błędów w teście ortograficznym

Liczba błędów

0

1

2

3

4

5

ponad 6

Razem

Częstość

12

37

64

93

71

32

11

330

Częstość
względna %

7

11

19

28

22

10

3

100

W badanej grupie 330 uczniów bezbłędnie test ortograficzny napisało 12 dzieci, tj. 7% wszystkich uczniów
piszących test. Najczęściej uczniowie popełniali 3 błędy – 93 uczniów na 330, co stanowi 28 % wszystkich
biorących udział w badaniu.

Jeżeli grupowaniu podlegają zmienne o wartościach liczbowych strukturę badanej zbiorowości można

przedstawić również w postaci rozkładu kumulowanego

.

W rozkładzie kumulowanym wartościom zmiennej przyporządkowane są liczebności kumulowane. Przez

liczebność kumulowaną rozumiemy liczbę jednostek l

k

, dla których wartość zmiennej nie przekracza danej

wartości x

k

:

=

=

k

i

i

k

n

l

1

Gdy wartościom zmiennej przyporządkowane zostają liczebności kumulowane względne otrzymany szereg

przedstawia dystrybuantę empiryczną. Liczebność kumulowana względna określa, jaką część badanej
zbiorowości stanowią te jednostki, dla których wartość zmiennej nie przekracza danej wartości x

k

:

=

=

k

i

i

k

p

q

1

Gdy analizowana zmienna jest zmienną o wartościach liczbowych, jak na przykład liczba rodzeństwa,

liczba popełnionych błędów, itp. lub na przykład wiek, wzrost, czas wykonania zadania i mamy dużo danych,
należy ustalić najpierw pewne przedziały wartości zmiennej a następnie zliczyć ile danych w tych przedziałach
się „mieści”.

Liczbę przedziałów, ich szerokość oraz granice ustalamy tak, aby otrzymany rozkład czytelnie przedstawiał

strukturę badanej zbiorowości. Odpowiedź na pytanie ile przedziałów ma być w konkretnym przypadku, zależy
głównie od tego, jak liczna jest badana zbiorowość. Nie ma jednak algorytmu, którego zastosowanie
zapewniałoby otrzymanie optymalnego, z punktu widzenia celu badań, obrazu struktury zbiorowości. W

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

literaturze można znaleźć różne propozycje ustalania liczby przedziałów klasowych, z których jedna
przedstawiona jest na rys. 4.

Liczebność zbiorowości

40 - 60

60 – 100

100 – 200

200 – 500

Liczba klas

6 -8

7 – 10

9 – 12

12 – 17

Źródło: Z.Zając, Zarys metod statystycznych, PWE, 1988
Rys.4. Proponowana liczba przedziałów klasowych w zależności od liczby danych

Szerokości przedziałów ustalamy tak, aby wyodrębnione w ten sposób grupy były w miarę jednorodne. Z

pewnych względów najlepiej jest gdy szerokości przedziałów są równe, ale nie jest to wymóg konieczny.
Czasem zasadnym jest ustalenie przedziałów o różnej szerokości.

Rozkład zmiennej według przedziałów wartości zmiennej przedstawiamy w tabeli o następującym

schemacie.

Przedziały
klasowe
wartości
zmiennej X

Liczebność

n

i

Liczebność

względna

p

i

%

Liczebność

kumulowana

l

k

Liczebność

kumulowana

względna
%

(x

1

; x

2

]

(x

2

; x

3

]

(x

3

; x

4

]

.....

100

suma

100

-

-

Rys. 3. Schemat tabeli przedstawiającej rozkład zmiennej według przedziałów wartości zmiennej

Rozkład kumulowany zawiera inną informację o badanej zbiorowości niż szereg rozdzielczy prosty.

Liczebność kumulowana informuje nas o tym, u ilu osób badanej zbiorowości zaobserwowano wartości
zmiennej nie wyższe niż ta, dla której tę liczebność obliczyliśmy. Liczebność względna kumulowana wskazuje,
jaka część badanej zbiorowości charakteryzuje się wartościami zmiennej nie wyższymi od tej, dla której tę
liczebność ustaliliśmy.
Rozkładu kumulowanego można nie uwzględniać jeżeli tego nie potrzebujemy. Pomijamy wówczas w tabeli
kolumny „liczebność kumulowana” oraz „liczebność kumulowana względna”.

Tabela 3.

Wzrost uczniów Szkoły Podstawowej nr 55 w Zabeziu w roku szkolnym 1999/2000

Wzrost

(cm)

Liczebność

Liczebność

względna

%

Liczebność

kumulowana

Liczebność

kumulowana

względna

%

(136 – 140]

10

2

10

2

(140 – 145]

30

6

40

8

(145 – 150]

100

20

140

28

(150 – 155]

200

40

340

68

(155 – 160]

120

24

460

92

(160 – 165]

30

6

490

98

(165 – 170]

10

2

500

100

500

100

-

-

Źródło: Dane umowne

W powyższym przykładzie liczba uczniów, których wzrost nie przekracza 145 cm równa jest 40 (liczebność

kumulowana równa 40), co stanowi 8% badanej zbiorowości. Uczniów o wzroście nie większym niż 160 cm jest
460, czyli 92% zbiorowości.

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Tabele rozkładu jednej zmiennej w wyodrębnionych grupach

W jednej tabeli można również przedstawić dwa rozkłady tej samej zmiennej w wyodrębnionych grupach.

Taka prezentacja ułatwia porównawcze omówienie struktury badanej zbiorowości, uwypuklenie podobieństw i
różnic w strukturze grup ze względu na badaną właściwość.

Przykład: Jeżeli chcemy porównać rozkład wykształcenia w grupach według miejsca zamieszkania, to tabela
może mieć taką np. formę.

Tabela 4.

Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według miejsca

zamieszkania (w procentach)

Miejsce

zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

57

43

100

miasto

26

74

100

W grupie osób bezrobotnych mieszkających na wsi przeważają osoby o wykształceniu niższym niż średnie
(57%). Odwrotnie jest w grupie osób bezrobotnych mieszkających w mieście, tu przeważają bezrobotni o
wykształceniu średnim lub wyższym (74%).

Jeżeli natomiast chcemy porównać rozkład miejsca zamieszkania w grupach według wykształcenia, to tabela
może przybrać taką formę.

Tabela 5 .

Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005 według

wykształcenia (w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

wieś

70

39

miasto

30

61

razem

100

100

W grupie osób bezrobotnych mających wykształcenie niższe niż średnie więcej osób mieszka na wsi (70%) niż
w mieście (30%). Inaczej jest w grupie bezrobotnych posiadających wykształcenie średnie lub wyższe – więcej
osób z tej grupy mieszka w mieście (61%) niż na wsi (39%).

Tabele rozkładu wielozmiennej

Wyniki grupowania, które przebiegało w ten sposób, że każda jednostka badania została zaliczona do grupy

ze względu na to, jaką wartość przyjmuje ze względu na więcej niż jedną zmienną, tworzą rozkład
wielozmiennej. Jeżeli, na przykład, interesować nas będzie struktura bezrobotnych ze względu na wykształcenie
(zmienna X) i miejsce zamieszkania (zmienna Y) jednocześnie, tworzymy grupy w ten sposób: określamy
wykształcenie i miejsce zamieszkania każdej osoby i zliczamy ile jest osób o wykształceniu niższym niż średnie
i mieszkających na wsi, ile jest osób o wykształceniu średnim lub wyższym i mieszkających na wsi, ile jest osób
o wykształceniu niższym niż średnie i mieszkających w mieście, itd. Otrzymamy w ten sposób rozkład
dwuzmiennej (wykształcenie X, miejsce zamieszkania Y), czyli rozkład dwuzmiennej (X,Y).
Rozkład dwuzmiennej przedstawiamy w tabelach dwudzielczych, zwanych też tabelami korelacyjnymi lub
krzyżowymi.

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Zmienna Y

Zmienna X

Sumy
brzegowe

x1

x2

x3

.........

(zmienna Y)

y1
y2

......

Sumy brzegowe
(zmienna X)

Liczebność
zbiorowości

Rys.6. Schemat tabeli dwudzielczej

W główce tabeli umieszczamy nazwę jednej zmiennej (X) oraz wartości tej zmiennej lub przedziały

wartości zmiennej (x1, x2, x3, x4), w boczku tabeli nazwę drugiej zmiennej oraz jej wartości lub przedziały
wartości. W komórki tabeli wpisujemy liczebności wyodrębnionych grup, tzn. liczebności grup, dla których
zmienna X przyjmuje wartość x1 a zmienna Y wartość y1, dalej – zmienna X przyjmuje wartość x2 a zmienna Y
wartość y1, itd. Ostatnia kolumna, w której umieszczone są sumy liczebności kolejnych wierszy i ostatni wiersz,
w którym mamy sumy liczebności kolejnych kolumn przedstawiają rozkłady brzegowe. Ostatnia kolumna (wraz
z pierwszą, gdzie są wyszczególnione wartości zmiennej Y) - rozkład zmiennej Y, ostatni wiersz (wraz z
pierwszym, gdzie są wyszczególnione wartości zmiennej X) - rozkład zmiennej X.

W tabeli wielodzielczej możemy umieszczać dodatkowo lub zamiast liczebności bezwzględnych,

liczebności względne.

Poniżej (tabela ) pokazany jest przykład tabeli dwudzielczej przedstawiającej rozkład dwuzmiennej

(wykształcenie, miejsce zamieszkania) w populacji osób bezrobotnych zarejestrowanych w Urzędzie Pracy w
Paradyżu w roku 2005.

Tabela 6.

Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w

roku 2005.

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś
miasto

56
24

43
67

99
91

razem

80

110

190

Spośród 190 przebadanych osób 56 ma wykształcenie niższe niż średnie i mieszka na wsi a 67 ma wykształcenie
średnie lub wyższe i mieszka w mieście. Jak widać bezrobotni o wykształceniu średnim lub wyższym
przeważają w mieście.

W tabeli możemy również podać wartości procentowe.

Tabela 7.

Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w

roku 2005 (w procentach).

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś
miasto

29
13

23
35

52
48

razem

42

58

100

Spośród przebadanych osób 29% stanowią bezrobotni, którzy mają wykształcenie niższe niż średnie i mieszkają
na wsi a 35% bezrobotni, którzy mają wykształcenie średnie lub wyższe i mieszkają w mieście. Jak widać
bezrobotni o wykształceniu średnim lub wyższym przeważają w mieście.

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Czasem zachodzi potrzeba przedstawienia struktury badanej zbiorowości z uwzględnieniem więcej niż dwu
zmiennych. Rozkład trójzmiennej przedstawiamy w tabeli o następującym schemacie:

Zmienna Y

Zmienna Z

Zmienna X

x1

x2

.......

Sumy brzegowe
(zmn Y)

y1

z1
z2

y2

z1
z2

y3

z1
z2

........

.....
.....

Sumy
brzegowe
(Zmn X)

Liczebność

zbiorowości

Rys.7. Schemat tabeli trójdzielnej

Prezentację struktury badanej grupy bezrobotnych z uwzględnieniem oprócz miejsca zamieszkania oraz
wykształcenia również płci przedstawia tabela poniżej.

Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie,

miejsce zamieszkania i płeć (w procentach)

Miejsce

zamieszkania

Płeć

Wykształcenie

niższe niż średnie

średnie lub wyższe

płeć

miejsce

wieś

kobieta

10

13

23

mężczyzna

19

10

29

52

miasto

kobieta

7

20

27

mężczyzna

6

15

21

48

wykształcenie

42

58

100

100

Proponuję, aby interpretacji powyższej tabeli czytelnik dokonał samodzielnie.
Interpretacja!!!!! Jako zadanie na koniec rozdziału

Tytułowanie tabel i wykresów

Badania empiryczne statystyczne mogą być badaniami populacji ograniczonej lub nieograniczonej. Jeżeli
badaniu podlega populacja ograniczona, to badanie może być wyczerpujące – gdy badaniu został poddany każdy
element populacji lub częściowe – gdy badaniu zostały poddane tylko elementy próbki populacji. Tytuł tabeli lub
wykresu przedstawiającej rozkład analizowanej przez badacza zmiennej powinien być tak sformułowany, aby
wynikało z niego, jakie to było badanie. I tak, gdy przeprowadzono:

1. Badania całościowe populacji ograniczonej - tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

co?

nazwę populacji i

kto

jej przestrzenne

gdzie

i czasowe ograniczenie

kiedy?

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Przykład:

Tabela 1.

Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu

w roku 2005.

Wykształcenie

Liczebność

n

%

niższe niż średnie

80

średnie lub wyższe

110

suma

190

2. Badania częściowe populacji ograniczonej - tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

nazwę

populacji i

jej przestrzenne
i czasowe ograniczenie

oraz informację, że badania nie są całościowe

Przykład:
Tabela 2. Wykształcenie badanej grupy osób bezrobotnych zarejestrowanych w Urzędzie Pracy w

Paradyżu w roku 2005.
lub

Tabela 2. Wykształcenie bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005

(próba 30 osób).

W pierwszym z powyższych przykładów na to, że badania są częściowe wskazuje zwrot „badanej grupy osób”, w
drugim informacja podana w nawiasie.

3. Badania populacji nieograniczonej – tytuł tabeli zawiera:

nazwę zmiennej (cechy, właściwości), której rozkład przedstawiony jest w tabeli

nazwę

populacji, którą reprezentuje badana próbka
Przykład:
Tabela 1. Rozkład wieku uczniów w grupie eksperymentalnej

Jeżeli w jednej tabeli przedstawiamy dwa rozkłady jednej zmiennej w wyodrębnionych grupach, to tytuł tabeli
zawiera informację taką jak w przypadku, gdy prezentowany jest rozkład jednej zmiennej (czyli uwzględniająca
rodzaj badania) wraz z dodatkiem „według...”

Przykład:

Tabela 3. Miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku

2005 według wykształcenia(w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

wieś

70

39

miasto

30

61

razem

100

100

Przykład:

Tabela 4. Wykształcenie osób bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu w roku 2005

według miejsca zamieszkania(w procentach)

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

57

43

100

miasto

26

74

100

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Jeżeli w tabeli przedstawiamy rozkład dwuzmiennej, w tytule tabeli podajemy nazwę tej dwuzmiennej w formie
„nazwa cechy 1 a nazwa cechy 2” oraz informację pozwalającą określić typ badania.
Przykład:
Tabela 5. Wykształcenie a miejsce zamieszkania osób bezrobotnych zarejestrowanych w Urzędzie Pracy w

Paradyżu w roku 2005.

Miejsce zamieszkania

Wykształcenie

niższe niż średnie

średnie lub wyższe

razem

wieś

56

43

99

miasto

24

67

91

razem

80

110

190

Wykresy statystyczne

Strukturę badanej zbiorowości można przedstawić graficznie na wykresach statystycznych. Poprawnie i

czytelnie sporządzone wykresy pozwalają na szybką orientację w strukturze danych, obrazowo ujmują różnice
między rozkładami zmiennej w różnych zbiorowościach, co ułatwia dalszą tych różnic analizę statystyczną.
Umożliwiają wstępne rozpoznanie zgodności otrzymanego rozkładu empirycznego z rozkładem teoretycznym,
itd. O wartości wykresu decyduje wybór odpowiedniego do charakteru danych typu wykresu, jak również
właściwy dobór i opis skali oraz właściwa legenda. Przesądzają one często w ogóle o wykresu czytelności.

W literaturze spotykamy wiele rozróżnień typów wykresów statystycznych a odpowiadające rozróżnionym

typom nazwy nie są spójnie stosowane przez różnych autorów. Podobnie rzecz się ma w przypadku
komputerowych programów umożliwiających sporządzanie wykresów statystycznych. W tym skrypcie
ograniczymy się do podania bardzo ogólnych wskazówek dotyczących doboru typu wykresu, w zależności od
rodzaju właściwości (zmiennej), której rozkład ma być przedstawiony graficznie.

Rozróżnimy dwa podstawowe typy wykresów przydatnych do obrazowania rozkładu zmiennej w

zbiorowości:
1.Wykresy, w których wykorzystuje się metodę podziału powierzchni wybranej figury zamkniętej (np. koła,
prostokąta) na części w proporcjach odpowiadających proporcjom podziału badanej zbiorowości na grupy;

2.

Wykresy, w których wykorzystuje się układ odniesienia (np. układ współrzędnych kartezjańskich); w tym

przypadku informację o rozkładzie zmiennej w zbiorowości odczytuje się z odpowiednio oznaczonych i
wyskalowanych osi układu odniesienia.
Pośrednim typem są wykresy, w których wykorzystuje się jedną oś odniesienia.

Wykresy pierwszego typu stosujemy przede wszystkim do prezentacji rozkładu zmiennej nominalnej, bo

tylko taki w tym przypadku jest odpowiedni, choć można je również wykorzystać do prezentacji rozkładu
dowolnej zmiennej. Wykresy drugiego typu stosujemy wyłącznie do prezentacji rozkładu zmiennych
mierzonych na skalach z jednostką miary.

Wykres kołowy i kolumnowy

Przykładem wykresu typu I jest wykres kołowy. Koło – reprezentujące całą zbiorowość - dzielimy tak, aby

poszczególne wycinki koła były proporcjonalne do liczebności rozróżnionych grup.

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Rys. Wykształcenie osób bezrobotnych zarejestrowanych w .................

Wyższe, 8,8 %

Średnie, 24,2 %

Zawodowe, 67,0 %

Tę samą informację możemy przedstawić na wykresie kolumnowym:

Histogram

Przykładem wykresu typu II. jest histogram zmiennej ciągłej. Struktura zbiorowości obrazowana jest na

histogramie poprzez szereg prostokątów umieszczonych w odpowiednio opisanym i wyskalowanym układzie
dwu osi liczbowych; na jednej osi reprezentowane są wartości zmiennej, na drugiej - liczebności lub liczebności
względne (wskaźniki struktury).

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Jeżeli obrazujemy szereg rozdzielczy kumulowany, na drugiej osi reprezentowane są liczebności

kumulowane lub liczebności względne kumulowane, a otrzymany wykres to histogram kumulowany.

Wykres liniowy

Rozkład zmiennej ciągłej przedstawiony może być graficznie na wykresie liniowym zwanym wielobokiem

liczebności. Wielobok liczebności otrzymamy, gdy połączymy odcinkami punkty, których współrzędne
wyznaczone są przez środek przedziału klasowego i odpowiadającą temu przedziałowi liczebność.

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Wykres złożony

Wykresy złożone przedstawiają strukturę zbiorowości względem więcej niż jednej zmiennej. Tutaj

pokażemy pewną odmianę wykresu złożonego – układ wykresów skategoryzowanych. Układ taki przedstawia
rozkład według np. dwu zmiennych na tylu osobnych wykresach, ile wartości ma jedna ze zmiennych
grupujących..

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

Zadania i ćwiczenia
1.
Zapisz następujące liczby w postaci procentów:

0,2 = 20%
0,02 = 2%
0,30 =
0,24 =
0,05 =
0,004 =
0,256 =
1,00 =
1,25 =

2. Wyniki :egzaminu z matematyki w grupie studentów przedstawiają się następująco:

ndst, dst, dst, db, ndst, bdb, bdb, db, db, dst, dst, dst, db, bd, bd, ndst, dst, dst, dst, db, dst, db, bdb, dst, db, bdb,
bdb, dst, db, db, db, dst, dst, bdb, db, db, dst, dst, bdb, db, db, dst, bdb, dst, dst, db, db, db, dst, bdb, dst, db, db

Ile było ocen” ndst”, ile „dst”, ile „db”, ile „bdb”? Utwórz odpowiednią tabelę liczebności przedstawiającą
rozkład ocen w grupie studentów.
Ilu studentów zdawało egzamin?
Oblicz wskaźniki struktury otrzymanego rozkładu dla każdej oceny.

3. Na podstawie tabeli 8 odpowiedz na następujące pytania:

Ile procent bezrobotnych zarejestrowanych w Urzędzie Pracy w Paradyżu mieszka na wsi?
Ile procent bezrobotnych ma wykształcenie niższe niż średnie?
Ile, w procentach, jest kobiet wśród badanych?
Ile, w procentach, jest mężczyzn o wykształceniu średnim lub wyższym?
Jaki procent badanych bezrobotnych

Tabela 8. Bezrobotni zarejestrowani w Urzędzie Pracy w Paradyżu w roku 2005 ze względu na wykształcenie,

miejsce zamieszkania i płeć (w procentach)

Miejsce

zamieszkania

Płeć

Wykształcenie

niższe niż średnie

średnie lub wyższe

płeć

miejsce

wieś

kobieta

10

13

23

mężczyzna

19

10

29

52

miasto

kobieta

7

20

27

mężczyzna

6

15

21

48

wykształcenie

42

58

100

100

background image

Statystyka w badaniach. Tabele i wykresy

Urszula Augustyńska

4. Przeprowadź statystyczną analizę danych zawartych w poniższej tabeli według podanych poleceń:

Identyfikator

Wynik testu

(„odporność” na

stres)

Ocena z

egzaminu

Płeć

A.Z.

28

db

K

A.C.

26

db

K

B.D.

29

dst

K

B.S.

30

bdb

M

C.R.

27

dst

M

C.G.

28

db

K

T.U.

28

dst

M

D.T.

32

db

K

F.O.

29

bdb

K

H.I.

32

dst

K

N.O.

29

dst

M

M.E.

33

bdb

M

L.D.

31

bdb

M

S.W.

25

dst

K

S.B.

24

dst

M

G.G.

30

db

K

K.L.

28

db

M

K.I.

29

db

K

R.A.

27

bdb

K

G.I.

24

dst

K

J.F.

31

bdb

M

L.W.

23

db

M

T.A.

33

bdb

M

W.A.

26

dst

K

C.M.

25

dst

M

M.C.

34

db

K

B.O.

27

db

M

D.R.

22

dst

M

W.P.

23

dst

K

Przedstaw tabelarycznie i graficznie rozkład zmiennej płeć oraz rozkład zmiennej ocena z egzaminu.
Pamiętaj o tytułach tabel i wykresów oraz o zamieszczeniu legendy. W tabeli umieść również liczebności
względne (w procentach).

Przedstaw w tabeli dwudzielczej strukturę grupy:

wynik testu a płeć

wynik testu a ocena

Pamiętaj o tytułach tabel i legendzie.

Sporządź histogram (zwykły i kumulowany) zmiennej wynik testu (podziel wyniki testu na pięć klas). Naszkicuj
wielobok liczebności oraz dystrybuantę empiryczną.

Oblicz lub odczytaj ze sporządzonych wykresów:

Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 30 punktów lub więcej?

Jaki procent grupy stanowią osoby, które osiągnęły w teście wynik 23 punktów lub mniej?


Wyszukiwarka

Podobne podstrony:
7 Statystyka w badaniach Weryf Nieznany (2)
5 Statystyka w badaniach Wspol Nieznany (2)
7 Statystyka w badaniach Weryf Nieznany (2)
1 Statystyka opisowa Wprowadze Nieznany (2)
0 3 1 statystyki 2004id 1800 Nieznany
Cw 02 M 04A Badanie wlasciwos Nieznany
egzamin statystyka id 152923 Nieznany
1, 2 Fakultet Badanie neurologi Nieznany (2)
1 2 statystyka opisowaid 10222 Nieznany
podstawy marketingu badanie pre Nieznany
0 3 3 statystyki 2006id 1801 Nieznany
EGZAMIN ze statystyki 20 6 2011 Nieznany
a09 fizyka statystyczna (12 21) Nieznany
6 Statystyka w badaniach Rozkład normalny
cechy statystyczne id 109409 Nieznany
11 Statystyka opisowaid 12761 Nieznany
ciaza u suki w badaniu ultrason Nieznany
87 Nw 03 Przyrzad do badania di Nieznany

więcej podobnych podstron