Wykład 2-Opisowa analiza zjawisk masowych, socjologia, statystyka


Wykład 2. Opisowa analiza zjawisk masowych

  1. Rozkładem empirycznym zmiennej nazywamy przyporządkowanie kolejnym wartościom zmiennej (0x01 graphic
    ) odpowiadających im liczebności (0x01 graphic
    ).

Rozkład odzwierciedla strukturę zbiorowości.

Przykład: Jeżeli zbiorowością statystyczną są rodziny (n=150), a cechą mierzalną skokową liczba dzieci (X) w rodzinie, to w rezultacie pogrupowania danych indywidualnych (0x01 graphic
=0,1,2,3,4,5) otrzymujemy empiryczny (punktowy) rozkład tej cechy(zmiennej).

Liczba dzieci

(0x01 graphic
)

Liczba rodzin

(0x01 graphic
)

0

15

1

62

2

43

3

25

4

3

5

2

Ogółem

150


  1. Rodzaje rozkładów empirycznych

0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

Przykład: Zaprezentować graficznie różne typy rozkładów empirycznych dla cechy skokowej i ciągłej.


  1. Charakterystyki rozkładów

Najczęściej wykorzystywane charakterystyki przy opisie struktury zbiorowości to:

Miary średnie

0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic


Średnia arytmetyczna:

0x01 graphic

lub

0x01 graphic

a w przypadku obliczeń procentowych

0x01 graphic
,

gdzie

0x01 graphic


Przykład:

Wyznaczyć średnią arytmetyczną ilości punktów uzyskanych z egzaminu testowego z wiedzy teoretycznej ze statystyki w grupie studentów socjologii.

Otrzymano następujące wyniki:

Ilość uzyskanych

punktów z testu

0x01 graphic

Liczba

studentów

0x01 graphic

Obliczenia pomocnicze

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

20-30

30-40

40-50

50-60

60-70

70-80

2

10

7

9

12

10

25

35

45

55

65

75

50

350

315

495

780

750

4,0

20,0

14,0

18,0

24,0

20,0

100,0

700,0

630,0

990,0

1560,0

1500,0

Razem

50

X

2740

100,0

5480,0

czyli

0x01 graphic
.


Średnia harmoniczna (stosujemy ją wówczas, gdy wartości zmiennej podane są w jednostkach względnych, np. w km/godz.; kg/osobę itp.):

W przypadku szeregu wyliczającego

0x01 graphic

lub w przypadku szeregu rozdzielczego

0x01 graphic

Przykład: Załóżmy, że gęstość zaludnienia w dwu 100 tyś miastach wynosi odpowiednio: 500 0x01 graphic
i 7000x01 graphic
.Jaka jest przeciętna gęstość zaludnienia obu tych miast?

0x01 graphic

Średnia geometryczna (stosujemy w przypadku badania średniego tempa zmian zjawisk, czyli w analizie dynamiki zjawisk):

0x01 graphic

Dominanta (modalna, wartość najczęstsza) - w szeregach wyliczających i rozdzielczych punktowych dominanta to wartość cechy o największej liczebności. W szeregach rozdzielczych przedziałowych można określić przedział, w którym znajduje się dominanta tzn. przedział o największej liczebności. Wartość dominanty należącą do tego przedziału wyznaczamy ze wzoru:

0x01 graphic

gdzie

0x01 graphic
- dolna granica klasy, w której znajduje się dominanta,

0x01 graphic
- liczebność przedziału dominanty,

0x01 graphic
- liczebność przedziału poprzedzającego przedział dominanty,

0x01 graphic
- liczebność przedziału następującego po przedziale dominanty,

0x01 graphic
- rozpiętość przedziału dominanty.

Graficzna metoda wyznaczania dominanty:

Np.

0x08 graphic
0x01 graphic

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic

3 5 D 7 9 0x01 graphic

Kwantyle (kwartyle, kwintyle, decyle, percentyle) - wartości cechy badanej zbiorowości, które dzielą ją na określone części pod względem liczby jednostek.

Uwaga:

W celu wyznaczenia kwantyli szeregi statystyczne muszą być uporządkowane tzn. rosnąco lub malejąco!

Najczęściej wykorzystuje się kwartyle:


Do wyznaczania kwartyli wykorzystujemy wzory:

Mediana dla szeregu wyliczającego:

0x01 graphic

W przypadku szeregów rozdzielczych przedziałowych:

Kwartyl pierwszy:

0x01 graphic

Mediana:

0x01 graphic

Kwartyl trzeci:

0x01 graphic

gdzie

0x01 graphic
- dolne granice przedziałów, w których znajdują się odpowiednio kwartyl pierwszy, mediana, kwartyl trzeci,

N- ogólna liczebność danej zbiorowości,

0x01 graphic
- suma liczebności od klasy pierwszej do tej, w której znajdują się odpowiednio kwartyl pierwszy, mediana, kwartyl trzeci,

0x01 graphic
- liczebności przedziałów, w których znajdują się odpowiednio kwartyl pierwszy, mediana, kwartyl trzeci,

0x01 graphic
- rozpiętości przedziałów, w których znajdują się odpowiednio kwartyl pierwszy, mediana, kwartyl trzeci.


Przykład: Empiryczne badanie liczby punktów uzyskanych w teście na inteligencję przez 56 uczennic i 56 uczniów pewnej klasy gimnazjalnej dostarczyło dane, które zapisano w postaci szeregu rozdzielczego:

Wyniki testu

w punktach

Liczba uczniów

Dziewczęta

Chłopcy

20-40

40-60

60-80

80-100

100-120

120-140

1

4

17

25

8

1

1

4

11

19

13

8

Ogółem

56

56

Wyznaczyć średnie pozycyjne (dominantę, kwartyl pierwszy, medianę, kwartyl trzeci) dla grupy dziewcząt oraz chłopców.

Rozwiązanie dla grupy dziewcząt:

0x01 graphic

W celu wyznaczenia kwartyli należy w pierwszej kolejności dokonać kumulacji liczebności:

Wyniki testu

w punktach

Liczba

dziewcząt

Skumulowane

częstości

20-40

40-60

60-80

80-100

100-120

120-140

1

4

17

25

8

1

1

5

22

47

55

56

Ogółem

56

X

0x01 graphic

0x01 graphic

0x01 graphic

Podobne obliczenia dla grupy chłopców dają wyniki (sprawdzić w domu !):

D=91,4 punktu, Me=92,6 punktu, 0x01 graphic
=76,4 punku, 0x01 graphic
=110,8 punku.

Miary rozproszenia (zmienności, zróżnicowania, dyspersji) służą do badania stopnia zróżnicowania wartości zmiennej.

0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

Pozycyjne miary zmienności:

0x01 graphic

0x01 graphic

Uwaga: Do określenia typowego obszaru zmienności można wykorzystać odchylenie ćwiartkowe oraz medianę tzn.

0x01 graphic


Klasyczne miary zmienności:

Dla szeregu wyliczającego:

0x01 graphic

Dla szeregu rozdzielczego:

0x01 graphic


Dla szeregu wyliczającego:

0x01 graphic

Dla szeregu rozdzielczego:

0x01 graphic

Odchylenie standardowe to pierwiastek kwadratowy z wariancji, czyli

0x01 graphic

Uwaga: Odchylenie standardowe można wykorzystać do budowy typowego obszaru zmienności cechy, tzn.:

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic


Przykład: Empiryczne badanie liczby punktów uzyskanych w teście na inteligencję przez 56 uczennic i 56 uczniów pewnej klasy gimnazjalnej dostarczyło dane, które zapisano w postaci szeregu rozdzielczego:

Wyniki testu

w punktach

Liczba uczniów

Dziewczęta

Chłopcy

20-40

40-60

60-80

80-100

100-120

120-140

1

4

17

25

8

1

1

4

11

19

13

8

Ogółem

56

56

Dokonać oceny stopnia zróżnicowania wyników testu na inteligencję w populacji dziewcząt i chłopców(odchylenie standardowe, współczynnik zmienności, odchylenie przeciętne oraz odchylenie ćwiartkowe).

Rozwiązanie (dokonać niezbędnych obliczeń):

Wyniki

Dziewczęta

Chłopcy

S

18,43 punktu

23,92 punktu

V

22%

25,9%

d

14,9 punktu

18,9 punktu

Q

12,7 punktu

17,2 punktu

Otrzymane rezultaty oznaczają, że wyniki testu na inteligencję poszczególnych dziewcząt różnią się przeciętnie o 18,43 punktu w porównaniu ze średnim wynikiem (równym 83,6 punktu), analogiczne odchylenie wyników poszczególnych chłopców od ich wyniku średniego wynosi 23,92 punktu.

Współczynnik zmienności dla dziewcząt wynoszący 22% w porównaniu z analogicznym współczynnikiem dla chłopców wynoszącym 25,9% świadczy o tym, że subpopulacja dziewcząt jest mniej zróżnicowana niż subpopulacja chłopców.

W grupie chłopców odchylenie przeciętne wynosi 21 punktów i jest wyższe w porównaniu z grupą dziewcząt, natomiast odchylenie ćwiartkowe w rozkładzie chłopców jest niższe i wynosi 9,8 punktu.


Miary asymetrii (skośności)- oceniają, czy przeważająca liczba jednostek znajduje się powyżej, czy poniżej przeciętnego poziomu badanej cechy. Jeżeli rozkład jest symetryczny, to 0x01 graphic
(średnia arytmetyczna, mediana, dominanta są równe). Jeżeli 0x01 graphic
, to rozkład charakteryzuje się asymetrią prawostronną, jeżeli zaś 0x01 graphic
, to mamy do czynienia z lewostronną asymetrią rozkładu.

Najprostszą miarą asymetrii jest wskaźnik asymetrii:

0x01 graphic

Jeżeli W<0, to mamy do czynienia z asymetrią lewostronną. Jeżeli W>0, to występuje asymetria prawostronna.

Miarą określającą siłę i kierunek asymetrii jest współczynnik asymetrii(skośności):

0x01 graphic
lub 0x01 graphic

lub 0x01 graphic
,

gdzie 0x01 graphic
( 0x01 graphic
nazywamy momentem centralnym rzędu 3).

Miary te przyjmują wartości w przedziale [-1;1]. Gdy są dodatnie, to występuje asymetria prawostronna, gdy ujemne, to lewostronna.

Miary koncentracji- czyli skupienia:

0x01 graphic
,

gdzie 0x01 graphic

0x01 graphic

Dla rozkładu normalnego przyjmuje się, że 0x01 graphic
. Jeżeli 0x01 graphic
, to rozkład jest wysmukły. Jeżeli 0x01 graphic
, to rozkład jest spłaszczony.

Zadania do Wykładu 2:

Zad.1. Strukturę rodzin według liczby członków rodziny w miejscowości K charakteryzuje rozkład postaci:

Liczba członków rodziny

2

3

4

5

6

7

8

Odsetek rodzin

15

30

20

15

10

5

5

Za pomocą miar przeciętnych scharakteryzuj ten rozkład.

Odp.: 0x01 graphic

Zad.2. W jednym z domów akademickich przeprowadzono badanie dotyczące miesięcznych wydatków na cele kulturalne. Otrzymano następujące wyniki:

Odsetek studentów

10

30

40

20

Wydatki miesięczne w zł

40-80

80-120

120-160

160-200

Za pomocą klasycznych i pozycyjnych miar zmienności oceń zróżnicowanie badanej zbiorowości pod względem miesięcznych wydatków na cele kulturalne.

Odp.: V=28,12%

Zad.3. Dzienne zużycie energii elektrycznej (w kWh) w pewnym budynku mieszkalnym kształtowało się następująco:

Zużycie

2-4

4-6

6-8

8-10

10-12

12-14

Odsetek rodzin

6

10

30

40

10

4

Obliczyć miary tendencji centralnej oraz współczynnik zmienności. Wyznaczyć typowy obszar zmienności.

Odp.:0x01 graphic

Zad. 4. Rozkład szkół podstawowych pod względem liczby uczniów przedstawia się następująco:

Liczba uczniów w szkole

0-40

40-80

80-120

120-160

160-200

Liczba szkół

10

60

70

65

100

Wyznaczyć 0x01 graphic
.

Zad.5. Dokonaj wszechstronnej analizy porównawczej struktury stażu pracy pracowników w dwóch przedsiębiorstwach na podstawie danych:

Staż pracy

(w latach)

Liczba pracowników

Przedsiębiorstwo A

Przedsiębiorstwo B

0-5

5-10

10-15

15-20

20-25

25-30

30-35

35-40

40-45

81

108

82

54

40

37

28

16

6

47

53

65

79

83

90

28

5

2

Odp.: Przedsiębiorstwo A:

0x01 graphic
Przedsiębiorstwo B:

0x01 graphic

33

Rozkłady empiryczne

cechy skokowej

cechy ciągłej

wielomodalne

jednomodalne

jednomodalne

wielomodalne

symetryczne

umiarkowanie asymetryczne

skrajnie asymetryczne

normalne

leptokurtyczne

platokurtyczne

prawoskośne

lewoskośne

Miary średnie

Średnie klasyczne:

Średnie pozycyjne:

Pozycyjne miary zmienności:

- empiryczny obszar zmienności,

Klasyczne miary zmienności:

Dyspersja (rozproszenie)



Wyszukiwarka

Podobne podstrony:
OPISOWA ANALIZA ZJAWISK MASOWYCH
OPISOWA ANALIZA ZJAWISK MASOWYCH, OPISOWA ANALIZA ZJAWISK MASOWYCH
Wykład 4 AR Analiza zjawisk rynkowych w czasie
metody analizy zjawisk masowych
Metody Statystyczne - Laboratorium, Instrukcja, Metody analizy współzależności zjawisk masowych
Wykład 1- Przedmiot, socjologia, statystyka
KOLOKWIUM Z ANALIZY STRUKTURY TEMAT X 2004, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY (skrócony0 2004, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY TEMAT X 2006, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY TEMAT Y 2004, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY (skrócony0 2008, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY DB 2008, Statystyka Opisowa UG
KOLOKWIUM Z ANALIZY STRUKTURY TEMAT X X2004, Statystyka Opisowa UG
analiza dynamiki zjawisk masowych (14 str), Analiza i inne

więcej podobnych podstron