Statystyka opisowa, Wykład 2, ANALIZA STRUKTURY ZBIOROWOŚĆI


ANALIZA STRUKTURY ZBIOROWOŚĆI

STRUKTURA - budowa wewnętrzna badanej zbiorowości statystycznej.

ROZKŁAD EMPIRYCZNY - przyporządkowanie liczby obserwacji (liczebności) odpowiednim wartościom cechy zmiennej.

Rozkład empiryczny prezentuje szereg rozdzielczy.

KLASY ROZKŁADÓW EMPIRYCZNYCH

  1. Rozkłady symetryczne i asymetryczne

  2. Rozkłady jednomodalne, bimodalne i wielomodalne

  3. Rozkłady platokurtyczne (spłaszczone) i leptokurtyczne (wysmukłe)

ROZKŁAD SYMETRYCZNY - rozkład posiadający oś symetrii, obserwacje są rozłożone równomiernie po obu stronach osi symetrii. Oś symetrii przecina odciętą w punkcie, która jest średnią arytmetyczną zmiennej

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. normalny r. leptokurtyczny r. platokurtyczny

ROZKŁAD ASYMETRYCZNY - rozkład nie posiadający oś symetrii,

1. rozkład lewostronny - ujemny - większość jednostek grupuje się wokół wartości wyższych w szeregu;

2. rozkład prawostronny - dodatni - większość jednostek grupuje się wokół wartości niższych w szeregu;

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. prawostronny r. lewostronny r. skrajnie ujemny

r. skrajnie dodatni

ROZKŁAD JEDNOMODALNY - krzywa liczebności o jednym ekstremum (maksimum)

ROZKŁAD BIMODALNY - krzywa liczebności o dwóch ekstremach

ROZKŁAD WIELOMODALNY - krzywa liczebności ma więcej niż dwa maksima

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

r. jednomodalny r. bimodalny r. wielomodalny

PODSTAWOWE WSKAŹNIKI STRUKTURY I NATĘŻENIA

0x01 graphic
- bezwzględna liczba jednostek i-tego wariantu cechy

0x01 graphic
- łączna liczba jednostek w zbiorowości

0x01 graphic
- częstość tj. frakcja 0x01 graphic

0x01 graphic
- wskaźnik struktury, tj. stosunek wybranej części zbiorowości do całej zbiorowości; 0x01 graphic

0x01 graphic
- wskaźnik natężenia, tj. stosunek liczebności dwóch zbiorowości pozostających ze sobą w logicznej zależności

0x01 graphic
- liczebności szeregu skumulowanego, (sumowanie liczebności kolejnych przedziałów);

0x01 graphic
- względny wskaźnik podobieństwa struktur, tj. iloraz sumy mniejszych wskaźników zaobserwowanych w kolejnych przedziałach porównywalnych rozkładów i sumy większych wskaźników; 0x01 graphic
;

WŁASNOŚCI ROZKŁADU EMPIRYCZNEGO

TENDENCJA CENTRALNA - POŁOŻENIE - punkt skupienia obserwacji znajduje się w środku rozkładu (symetria) lub w pobliżu środka rozkładu (umiarkowana asymetria)

DYSPERSJA - ZRÓŻNICOWANIE , ROZPROSZENIE, ZMIENNOŚĆ - zróżnicowanie jednostek zbiorowości między sobą wartościami cechy zmiennej

ASYMETRIA - SKOŚNOŚĆ - sposób rozmieszczenia liczebności przy wartościach cechy

KONCENTRACJA - KURTOZA, SPŁASZCZENIE - stopień skupienia obserwacji wokół wartości średniej arytmetycznej

PARAMETRY OPISUJĄCE WŁASNOŚCI ROZKŁADU

PARAMETRY KLASYCZNE - miary obliczane na podstawie wszystkich obserwacji, stosowane do analizy rozkładów charakteryzujących się te tendencją centralną;

PARAMETRY POZYCYJNE - wyznaczane na podstawie miejsca jakie zajmują w szeregu lub częstotliwości występowania; szczególnie przydatne w analizie szeregów silnie (skrajnie) asymetrycznych, szeregów z otwartymi przedziałami klasowymi,

WŁASNOŚĆ ROZKŁADU

MIARY KLASYCZNE

MIARY POZYCYJNE

TENDENCJA CENTRALNA

Średnia arytmetyczna 0x01 graphic

Mediana Me

Dominanta D

Kwartyle Q1,, Q3

Decyle D1, D2, ..., D9

DYSPERSJA

Wariancja s2

Odchylenie przeciętne d

Odchylenia standardowe s

Współczynnik zmienności V(s)

Rozstęp R

Odchylenie ćwiartkowe Q

Współczynnik zmienności V(Q)

ASYMETRIA

Moment trzeci centralny 0x01 graphic

Moment trzeci względny 0x01 graphic

Współczynnik skośności A(x)

KONCENTRACJA

Moment czwarty centralny 0x01 graphic

Moment czwarty względny 0x01 graphic

Wskaźnik spłaszczenia Wk

MIARY POŁOŻENIA

ŚREDNIA ARYTMETYCZNA - iloraz globalnej wartości cechy oraz liczby obserwacji. Wskazuje jaki poziom badanej cechy przypada na jednostkę zbiorowości; określa jaki jest przeciętny (średni) poziom badanej cechy w zbiorowości.

  1. szereg szczegółowy:

0x01 graphic

  1. szereg rozdzielczy jednostopniowy:

0x01 graphic

  1. szereg rozdzielczy wielostopniowy:

0x01 graphic

WŁASNOŚCI ŚREDNIEJ ARYTMETYCZNEJ

1. 0x01 graphic

2. 0x01 graphic

3. 0x01 graphic

4. 0x01 graphic

5. 0x01 graphic

MEDIANA - wartość środkowa; wartość cechy jaką posiada jednostka znajdująca się w środku uporządkowanego szeregu. Oznacza ona, iż połowa zbiorowości ma wartości cechy nie większe niż mediana, a druga połowa wartości nie mniejsze niż mediana.

  1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację środkową.

W przypadku parzystej liczby obserwacji wartość mediany jest średnią arytmetyczną z dwóch środkowych obserwacji.

np.

2 3 3 6 7 7 9 11 13

0x01 graphic

11 13 13 16 18 19 22 22 25 30

0x01 graphic

  1. szereg rozdzielczy jednostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wartość mediany jest wartością cechy we wskazanej klasie;

0x08 graphic
0x01 graphic

xi

ni

nicum

0

6

6

1

7

13

2

11

24

3

4

28

4

3

31

5

2

33

33

x

  1. szereg rozdzielczy wielostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wyznaczamy medianę w oparciu o wzór interpolacyjny:

0x01 graphic

0x01 graphic

ni

nicum

0-10

9

9

10-20

19

28

20-30

23

51

30-40

14

65

40-50

9

74

50 i więcej

7

81

81

x

0x08 graphic

0x01 graphic

KWARTYLE - wartości ćwiartkowe, dzielą zbiorowość, uporządkowaną wg rosnących wartości badanej cechy, na cztery jednakowo liczne części.

KWARTYL PIERWSZY Q1 - oznacza, iż 25% badanej zbiorowości osiąga wartości cechy nie większe niż Q1, a 75% zbiorowości ma wartości cechy nie mniejsze niż Q1.

KWARTYL DRUGI Q2 - jest równy Medianie, gdyż oznacza, iż 50% badanej zbiorowości osiąga wartości cechy nie większe niż Q2, a druga połowa - wartości nie mniejsze niż Q2.

KWARTYL TRZECI Q3 - oznacza, iż 75% badanej zbiorowości osiąga wartości cechy nie większe niż Q3, zaś pozostałe 25% - wartości nie mniejsze niż Q3.

  1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację leżącą w ¼ zbiorowości.

np.

2 3 3 6 7 7 9 11 13

0x01 graphic

  1. szereg rozdzielczy jednostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję mediany, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję mediany, 3) wartość mediany jest wartością cechy we wskazanej klasie;

0x01 graphic

xi

ni

nicum

0

6

6

1

7

13

2

11

24

3

4

28

4

3

31

5

2

33

33

x

Q1

Q3

0x08 graphic

  1. szereg rozdzielczy wielostopniowy - 1) wyznaczamy numer jednostki znajdującej się w szeregu, tzw. pozycję, 2) w szeregu skumulowanym znajdujemy klasę zawierającą pozycję parametru, 3) wyznaczamy parametr w oparciu o wzór interpolacyjny:

0x01 graphic

0x01 graphic

ni

nicum

0-10

9

9

10-20

19

28

20-30

23

51

30-40

14

65

40-50

9

74

50 i więcej

7

81

81

x

0x01 graphic
0x01 graphic

DOMINANTA - MODA - to pozycyjna miara położenia wyznaczana przez częstotliwość występowania wyróżnionych wartości cechy. Informuje ona jaka wartość cechy występuje najczęściej (dominuje).

  1. szereg szczegółowy - porządkujemy obserwacje wg rosnących wartości cechy i wskazujemy obserwację występującą najczęściej.

np.

2 3 3 6 7 7 7 9 11 13

0x01 graphic

  1. szereg rozdzielczy jednostopniowy - wskazujemy wartość cechy wokół oscyluje największa liczba obserwacji

xi

ni

0

6

1

7

2

11

3

4

4

3

5

2

33

0x01 graphic

  1. szereg rozdzielczy wielostopniowy - 1) wskazujemy przedział klasowy, w którym skupia się największa liczba obserwacji 2) wyznaczamy dominantę w oparciu o wzór interpolacyjny:

0x01 graphic

0x01 graphic

ni

0-10

9

10-20

19

20-30

23

30-40

14

40-50

9

50-60

7

81

0x01 graphic

GRAFICZNE WYZNACZANIE DOMINANTY

0x08 graphic
0x08 graphic
0x08 graphic
0x01 graphic

GRAFICZNE WYZNACZANIE KWARTYLI

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

12

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic



Wyszukiwarka