background image

Metody   probabilistyczne 

Metody opisu struktury zbiorowości 

 

Miary asymetrii i koncentracji 

Analiza opisowa struktury zjawisk masowych 

Miary asymetrii 

charakteryzują  

 

rodzaj i stopień odstępstwa od symetrii rozkładu badanej cechy, 
 

czy przeważająca liczba jednostek tworzących badaną zbiorowość 
ma wartości cechy wyższe czy niższe od przeciętnego poziomu. 

background image

Miary asymetrii  

Miary asymetrii

Miary pozycyjne

Miary klasyczne

wskaźnik

skośności

współczynnik

skośności

wskaźnik

skośności

współczynik

asymetrii

współczynik

skośności

Najprostszą miarą asymetrii jest wskaźnik skośności (W

s

 lub W

Q

). 

Dla miar klasycznych 

jest to różnica pomiędzy średnią arytmetyczną i 

modalną. 
 
 
 
 

Dla miar pozycyjnych 

badamy odległości obu kwartyli od mediany. 

 
 
 

 

wielkością mianowaną, 

określa 

jedynie kierunek asymetrii

nie informuje o jej sile

 

– gdyż jest wielkością nieunormowaną  

Wskaźnik asymetrii - skośności  
(W

s

 lub W

Q

o

s

M

x

W

 

e

I

e

e

Q

M

Q

Q

Q

M

M

Q

W

2

3

1

3

background image

Kierunek asymetrii rozkładu

  

Rozkład symetryczny badanej cechy,  
 

 
 

średnia jest równa modalnej,  

wskaźnik skośności jest równy zero. 

 

 

 

Rozkłady niesymetryczne badanej cechy różnią się między sobą 

kierunkiem i 

siłą asymetrii. 

0

o

s

M

x

W

Kierunek asymetrii rozkładu

  

Rozkład niesymetryczne badanej cechy - 

asymetrią rozkładu

.

  

 

Dla miar klasycznych: 

asymetria lewostronna, gdy: 
 

 

asymetria prawostronna, gdy:  
 

 

Dla miar pozycyjnych 

będzie to: 

asymetria lewostronna, gdy:  
   

 

asymetria prawostronna, gdy: 

 

0

o

s

M

x

W

0

o

s

M

x

W

 

0

1

3

Q

M

M

Q

W

e

e

Q

 

0

1

3

Q

M

M

Q

W

e

e

Q

background image

Kierunek asymetrii rozkładu 

Asymetria prawostronna 
Dominują wartości mniejsze 
od średniej
 

Asymetria lewostronna 
Dominują wartości większe 
od średniej
 

0

o

s

M

x

W

0

o

s

M

x

W

f

A 

B 

C 

8,5 

10 

10 

9,5 

12 

11 

10 

14 

13 

11 

16 

16 

16 

śr 

9 

9 

9 

odch 

4,90 

4,47 

3,94 

V 

0,54 

0,50 

0,44 

R 

14 

14 

14 

Q

5 

6 

7,5 

Me 

9 

9 

9 

Q

13 

12 

10,5 

Q 

4 

3 

1,5 

 

 

 

0

1

0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15 16

f

i

x

i

Zbiorowość A

0

1

0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15 16

f

i

x

i

Zbiorowość B

0

1

0

1

2

3

4

5

6

7

8

9

10 11 12 13 14 15 16

f

i

x

i

Zbiorowość C

background image

Współczynniki asymetrii A

s

   A

 

miary przybliżone 

Dla porównania 

kierunku i siły asymetrii

 

w dwóch lub więcej 

zbiorowościach stosujemy współczynniki asymetrii

dla miar klasycznych 

 

 

 

 

dla miar pozycyjnych 

s

M

x

A

o

s

 

 

Q

M

Q

Q

Q

Me

Me

Q

Q

Me

Me

Q

A

e

Q

2

2

3

1

1

3

1

3

10 

Współczynniki asymetrii – A 

Dla miar klasycznych 

gdzie: s 

– odchylenie standardowe 

 

m

3

 

– moment standaryzowany rzędu trzeciego 

 

 

 

szeregi szczegółowe 
 

 

szeregi rozdzielczy punktowy 

 

 

szeregi rozdzielczy przedziałowy 

3

3

s

m

A

n

i

i

x

x

n

m

1

3

3

1

k

i

i

i

f

x

x

n

m

1

3

3

1

k

i

i

i

f

x

x

n

m

1

3

3

1

background image

11 

Kierunek i siła asymetrii 

Kierunek asymetrii 

Siła asymetrii 

Rozkład 

A, A

s

=0  - symetria 

symetryczny 

A, A

s

>0  - prawostronna 

A, A

s

 ≈ 0       brak lub słaba 

prawoskośny 

A, A

s

<0  - lewostronna 

A, A

s

 → 1   -  silna 

lewoskośny 

A, A

s

 ≥ 2    - ekstremalnie silna 

skrajnie asymetryczny 

Siłą asymetrii: 

– brak skośności, 

0-

0,33 mówimy o małej skośności (niewyraźnej); 

0,34-0,66 

– średnia skośność, 

0,67-

1 duża skośność (wyraźna), 

1- 

funkcyjna skośność. 

12 

Miary asymetrii - 

przykład 

klasa 

stawka godzinowa 

[zł/godz.] 

liczba pracowników (f

i

) 

x

0i

 

x

1i

 

firma A 

firma B 

firma C 

1 

15 

15 

20 

2 

30 

105 

50 

3 

60 

75 

50 

4 

10 

30 

75 

70 

5 

10 

12 

15 

30 

10 

 

suma 

150 

300 

200 

średnia 

7 

7 

7 

wariancja 

4,47 

4,47 

4,47 

odchylenie standardowe 

2,11 

2,11 

2,11 

odchylenie standardowe  

(popr Shepparda) 

0,33 

0,33 

0,33 

background image

13 

Miary asymetrii - 

przykład 

15

15

20

30

105

50

60

75

50

30

75

70

15

30

10

0

20

40

60

80

100

120

firma A

firma B

firma C

[2;4)

[4;6)

[6;8)

[8;10)

[10;12)

14 

Miary asymetrii - 

przykład 

przykładowe obliczenia dla firmy C  

5

1

5

8

7

,

,

o

s

M

x

W

34

0

2

7

2

86

8

2

5

2

3

1

,

,

,

,

e

Q

M

Q

Q

W

71

0

11

2

5

1

,

,

,

s

M

x

A

o

s

09

0

83

1

2

34

0

2

2

3

1

,

,

,

Q

M

Q

Q

A

e

Q

Dane z wcześniejszych 
obliczeń: 
• M

o

 = 8,5 

• M

e

 = 7,2 

• Q

1

 = 5,2 

• Q

3

 = 8,86 

• s   = 2,11 
•      = 7,0 

x

background image

klasa 

Stawka 

[zł/godz.] 

środek 

klasy 

obliczanie m

3

 we współczynniku 

asymetrii  (firma C

i 

x

0i

 

x

1i

 

f

i

 

1 

20 

-4 

-64 

-1280 

2 

50 

-2 

-8 

-400 

3 

50 

4 

10 

70 

560 

5 

10 

12 

11 

10 

64 

640 

 

suma 

 

200 

 

 

-480 

s=2,11 

15 

Miary asymetrii - 

przykład 

i

x

x

x

i

3

x

x

i

i

i

f

x

x

3

 

25

0

11

2

200

480

3

3

3

,

,

/

s

m

A

Obliczanie współczynnika asymetrii (A)

  

16 

Miary asymetrii - 

przykład 

firma A 

firma B 

firma C 

modalna 

7 

5,5 

8,5 

kwartyl  I 

5,5 

5,14 

5,20 

kwartyl  II  (mediana) 

7 

6,8 

7,2 

kwartyl  III 

8,5 

8,8 

8,86 

odchylenie ćwiartkowe 

1,5 

1,83 

1,83 

wskaźnik skośności (klas.) 

0 

1,5 

-1,5 

wskaźnik skośności (pozyc.) 

0 

0,34 

-0,34 

współcz. skośności (klas.) 

0 

0,71 

-0,71 

współcz. skośności (pozyc.) 

0 

0,09 

-0,09 

współcz. asymetrii (A) 

0 

0,25 

-0,25 

(licznik A, tj. m

3

) 

0 

2,4 

-2,4 

background image

17 

Miary asymetrii - 

przykład 

Struktura płac

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

2

4

6

8

10

12

stawka [zł/godz]

c

s

to

ś

ć

firma A

firma B

firma C

 

18 

Miary koncentracji i spłaszczenia  

Zjawisko 

koncentracji może być rozważane jako 

nierównomierny podział ogólnej sumy wartości cechy pomiędzy 

poszczególne jednostki badanej zbiorowości  

 

Istnieje ścisły związek 
pomiędzy koncentracją a 
rozproszeniem:  
im mniejsze rozproszenie 
tym większa koncentracja

I na odwrót . 

background image

10 

19 

Miary koncentracji  

 

Do oceny stopnia koncentracji stosujemy dwie metody. 

Metoda numeryczna 

– wyznaczanie odpowiednich wskaźników 

liczbowych: 

współczynnik skupienia inaczej kurtoza,  

współczynnik koncentracji Lorenza
 
 

Metoda graficzna 

– wykreślanie i analiza  tzw. krzywej koncentracji 

Lorenza  

20 

Współczynnik skupienia  (kurtoza)  

Dla miar klasycznych

 

 

gdzie:   s  

–  odchylenie standardowe 

 

 
Wyznaczanie wartości momentu centralnego m

szereg szczegółowy 
 

 

szereg rozdzielczy punktowy 

 

 

szereg rozdzielczy przedziałowy 

4

4

s

m

K

n

i

i

x

x

n

m

1

4

4

1

k

i

i

i

f

x

x

n

m

1

4

4

1

k

i

i

i

f

x

x

n

m

1

4

4

1

EXCEL 
=KURTOZA(liczba1;liczba2, …) 

background image

11 

21 

Współczynnik skupienia  (kurtoza) 

Dla miar pozycyjnych 

 

 

gdzie:  
D

1

 

– decyl rzędu 1 

D

9

 

– decyl rzędu 9 

)

(

*

2

1

9

1

3

D

D

Q

Q

K

p

rozkład 

spłaszczony 

rozkład 

normalny 

rozkład 

wysmukły 

K < 3 

K = 3 

K > 3 

K

p

 > 0,263 

K

p

 = 0,263 

K

p

 < 0,263 

22 

Współczynnik ekscesu K’ 

Współczynnik ekscesu 
 

 
 

 

Kurtoza w rozkładzie normalnym jest zawsze równa trzy (K=3). 

W praktyce policzoną kurtozę porównujemy z kurtozą rozkładu normalnego. 

I tak jeżeli: 
 

K>3  -  

rozkład badanej cechy jest wyższy i smuklejszy od rozkładu 

normalnego 
 

K<3  -  

odwrotnie; niższy i bardziej rozłożysty 

 

K’>0

  -  

rozkład badanej cechy jest wyższy i smuklejszy od rozkładu 

normalnego 

K’<0

  -  

odwrotnie; niższy i bardziej rozłożysty 

 

Zjawiska społeczne, gospodarcze, przyrodnicze są najczęściej opisywane tzw. 

rozkładem normalnym. 

 

3

4

4

s

m

K'

background image

12 

23 

Współczynnik ekscesu K’ - przykład 

klasa 

Stawka 

[zł/godz.] 

środek 

klasy 

obliczanie m

4

 w kurtozie  (firma A) 

i 

x

0i

 

x

1i

 

f

i

 

1 

15 

-4 

256 

3840 

2 

30 

-2 

16 

480 

3 

60 

4 

10 

30 

16 

480 

5 

10 

12 

11 

15 

256 

3840 

 

suma 

 

150 

 

 

8640 

s=2,11 

 

4

2

11

2

150

8640

4

4

4

,

,

/

s

m

K

K<3  -  

koncentracja wokół średniej stawki 

godzinowej w firmie A jest mniejsza niż w przypadku 

rozkładu normalnego (diagram jest niższy i bardziej 

rozłożysty niż w rozkładzie normalnym); 

rozproszenie jest większe niż w rozkładzie 

normalnym.

 

 

6

0

3

11

2

150

8640

3

4

4

4

,

,

/

'

s

m

K

i

x

x

x

i

4

x

x

i

i

i

f

x

x

4

24 

Krzywa koncentracji Lorenza 

opisuje stopień koncentracji  
(nierównomierności podziału globalnego zasobu cechy) 
jednowymiarowego 

rozkładu zmiennej losowej o wartościach 

nieujemnych. 

często wykorzystywana w ekonometrii do liczbowego wyrażania 
koncentracji kapitału, nierównomierności zarobków, koncentracji 
sprzedaży (np.20% sklepów sprzedaje 80% produktów, 10% firm 
przewozi 85% towarów) 

ma również zastosowania w ekologii. 
 

zawiera się w kwadracie jednostkowym, przy czym jej końce to dolny 
lewy i górny prawy wierzchołek kwadratu  

pole pomiędzy nią a przekątną kwadratu nazywane jest wskaźnikiem 
Giniego.
 

background image

13 

25 

Krzywa koncentracji Lorenza 

Kwadrat, w którym rysujemy krzywą 

Lorenza, ma powierzchnię 

100x100=10000 

Im większa jest powierzchnia 

pola (a), tym większa jest 

koncentracja w badanym 

zjawisku. 

a

z

isk

[%]

w

isk

[%]

linia równomiernego

podziału

wskaźnik Giniego

krzywa Lorenza

a

z

isk

[%]

w

isk

[%]

linia równomiernego

podziału

wskaźnik Giniego

krzywa Lorenza

26 

Krzywa koncentracji Lorenza 

Krzywą koncentracji Lorenza rysujemy wykorzystując: 

dane pogrupowane są w szereg rozdzielczy przedziałowy, 

skumulowaną częstość dla liczebności (w

i sk

), 

skumulowaną częstość dla wartości cechy (z

i sk

); 

wartość cechy obliczamy w każdej klasie jako iloczyn f

i

*z

i

 (tak jak 

przy liczeniu średniej), 

często obie częstości wyrażamy w %. 
 

Wykres krzywej Lorenza

dla każdej klasy wyznaczamy punkt o współrzędnych (w

i sk

 ,z

i sk

). 

następnie łączymy te punkty odcinkami.  

punkt (w

1_sk

 ,z

1_sk

) łączymy dodatkowo z punktem (0 , 0).  

background image

14 

27 

Współczynnik koncentracji Lorenza 

Koncentracja całkowita

Koncentracja słaba

Brak koncentracji

Koncentracja duża

KL=1 

KL=0,1 

KL=0,7 

KL=0 

28 

Współczynnik koncentracji Lorenza 

współczynnik koncentracji Lorenza (KL) - 

liczbowo siła 

koncentracji. Jest on równy stosunkowi pola (a) do pola powierzchni 

połowy kwadratu (5000): 

 
 
 

Ponieważ łatwiej jest policzyć pole (b), to pole (a) wyznaczamy  

z różnicy  = 5000-b. 

Pole (b) jest sumą pól trapezów prostokątnych (dla pierwszej klasy jest to 

trójkąt prostokątny).  

Ostateczny wzór na współczynnik koncentracji Lorenza (KL) ma postać:  
 
 

 
 

KL 

 1 - 

silna koncentracja (rozkład leptokurtyczny) 

KL 

 0 - 

słaba koncentracja (rozkład platokurtyczny)  

Generalnie, jeżeli będzie skrajna asymetria to koncentracja zawsze 

wystąpi.

 

5000

a

KL

5000

1

5000

5000

b

b

KL

background image

15 

29 

Współczynnik koncentracji Lorenza - przykład 

2

z

z

w

sk

1

i

sk

i

i

 

 

Liczba 

ludności 

[w 10 

tys.] 

Liczba 

gmin 

Ludność 

gminach 

Odsetek 

gmin 

[%] 

Odsetek 

ludności 

[%] 

Skumul. 

odsetek 

gmin [%] 

Skumul. 

odsetek 

ludności 

[%] 

Obliczanie 

pola (b) 

Rodzaj 

figury 

x

i

 

f

i

 

z

i

=x

f

i

 

w

z

i

 

w

i_skum 

z

i_skum 

10 

15 

0,5 

0,07 

0,5 

0,1 

0,016  trójkąt 

2 – 5 

220 

685 

11,0 

2,98 

11,5 

3,0 

17,098  trapez 

5 – 7 

500 

3400 

25,0 

14,78 

36,5 

17,8 

260,870  trapez 

7 – 10 

770 

6600 

38,5 

28,70 

75,0 

45,6 

1238,696  trapez 

10 - 20 

300 

4500 

15,0 

19,57 

90,0 

66,1 

844,565  trapez 

> 20  

200 

7800 

10,0 

33,91 

100,0 

100,0 

732,609  trapez 

suma 

2000 

23000 

100,0 

100,0 

3093,853 

  

11,5 

x

3813

0

6187

0

1

5000

8

3093

1

5000

1

,

,

,

b

KL

30 

Współczynnik koncentracji Lorenza - przykład 

2

z

z

w

sk

1

i

sk

i

i

 

 

Liczba 

ludności 

[w tys.] 

Liczba 

gmin 

Ludność 

gminach 

Odsetek 

gmin 

[%] 

Odsetek 

ludności 

[%] 

Skumul. 

odsetek 

gmin [%] 

Skumul. 

odsetek 

ludności 

[%] 

Obliczanie 

pola (b) 

Rodzaj 

figury 

x

i

 

f

i

 

z

i

=x

f

i

 

w

z

i

 

w

i_sk 

z

i_sk 

10 

15 

0,5 

0,07 

0,5 

0,1 

0,016  trójkąt 

2 – 5 

220 

685 

11,0 

2,98 

11,5 

3,0 

17,098  trapez 

5 – 7 

500 

3400 

25,0 

14,78 

36,5 

17,8 

260,870  trapez 

7 – 10 

770 

6600 

38,5 

28,70 

75,0 

45,6 

1238,696  trapez 

10 - 20 

300 

4500 

15,0 

19,57 

90,0 

66,1 

844,565  trapez 

> 20  

200 

7800 

10,0 

33,91 

100,0 

100,0 

732,609  trapez 

suma 

2000 

23000 

100,0 

100,0 

3093,853 

  

11,5 

x

3813

0

6187

0

1

5000

8

3093

1

5000

1

,

,

,

b

KL

background image

16 

31 

Współczynnik koncentracji Lorenza - przykład 

W obserwowanych 

gminach ludność 
zamieszkująca rejon  
nie miała tendencji do 
koncentrowania 
zamieszkania.   
W gminach o średniej 
wielkości 11,5 tys. 
mieszkańców  

 
Potwierdzają to: 

•mała wartość 

współczynnika 
koncentracji KL oraz 

•słaby „brzuch” krzywej 

koncentracji Lorenza 

 

0,0

20,0

40,0

60,0

80,0

100,0

0,0

20,0

40,0

60,0

80,0

100,0

sk

umulow

an

 od

se

tki 

lud

no

śc

z

i

skumulowane odsetki gmin w

i

Krzywa koncentracji Lorenza - wielobok 

koncentracji

32 

Podsumowanie 

Statystyczna analiza struktury powinna być przeprowadzana 

kompleksowo, 

tzn. z jednoczesnym uwzględnieniem dużej liczby 

parametrów, 

Każda grupa charakterystyk opisuje rozkład z innego punktu widzenia 
(miary przeciętne, zróżnicowania, asymetrii, spłaszczenia i koncentracji), 

Miary klasyczne

 

stosowane są do opisu struktur rozkładów typowych 

(jednomodalnych, o słabej asymetrii, symetrycznych) – są bardziej 
dokładne, 

Miary pozycyjne

 

są mniej dokładne – wykorzystuje się je do opisu struktur 

rozkładów nietypowych (skrajnie asymetrycznych, bi- lub wielomodalnych, o 
otwartych przedziałach klasowych), 

background image

17 

33 

Podsumowanie 

Wskaźnik podobieństwa struktur

 (w

p

) jest najprostszą miarą 

statystyczną pozwalającą ocenić podobieństwo kształtowania się 
badanej cechy w dwóch różnych zbiorowościach
 

 

 

Względny wskaźnik podobieństwa struktur

 

– do porównywania struktur 

różnych zbiorowości: 
 

 

 

 

gdzie: w

1i

,w

2i

 

– wskaźniki struktury, 

 

Z = 1

 

– porównywane struktury są identyczne, 

Z = 0

 - 

porównywane struktury są krańcowo odmienne. 

 

k

1

i

i

2

i

1

p

w

w

w

,

min

k

1

i

i

2

i

1

k

1

i

i

2

i

1

w

w

w

w

Z

,

max

,

min

34 

Wskaźnik podobieństwa struktur - przykład 

 
 
 
 
 
 

 

 

 
 
 
 

numer 

klasy 

czas 

dojazdu 

częstość 

A 

częstość 

B 

obliczenia wskaźnika 

i 

x

0i

 – x

1i

 

w

1i

 

w

2i

 

w

pi

=min{w

1i

,w

2i

} 

max{w

1i

,w

2i

1 

5 – 15 

0,1 

0,05 

0,05 

0,1 

2 

15 – 25 

0,2 

0,1 

0,10 

0,2 

3 

25 – 35 

0,35 

0,15 

0,15 

0,35 

4 

35 – 45 

0,2 

0,2 

0,20 

0,2 

5 

45 – 55 

0,1 

0,4 

0,10 

0,4 

6 

55 – 65 

0,05 

0,1 

0,05 

0,1 

razem 

 

1,00 

1,00 

0,65 

1,35 

48

0

35

1

65

0

Z

,

,

,

Wp=0,65