1
1
Metody probabilistyczne
Metody opisu struktury zbiorowości
Miary asymetrii i koncentracji
2
Analiza opisowa struktury zjawisk masowych
Miary asymetrii
charakteryzują
rodzaj i stopień odstępstwa od symetrii rozkładu badanej cechy,
czy przeważająca liczba jednostek tworzących badaną zbiorowość
ma wartości cechy wyższe czy niższe od przeciętnego poziomu.
2
3
Miary asymetrii
Miary asymetrii
Miary pozycyjne
Miary klasyczne
wskaźnik
skośności
współczynnik
skośności
wskaźnik
skośności
współczynik
asymetrii
współczynik
skośności
4
Najprostszą miarą asymetrii jest wskaźnik skośności (W
s
lub W
Q
).
Dla miar klasycznych
jest to różnica pomiędzy średnią arytmetyczną i
modalną.
Dla miar pozycyjnych
badamy odległości obu kwartyli od mediany.
wielkością mianowaną,
określa
jedynie kierunek asymetrii
,
nie informuje o jej sile
– gdyż jest wielkością nieunormowaną
Wskaźnik asymetrii - skośności
(W
s
lub W
Q
)
o
s
M
x
W
e
I
e
e
Q
M
Q
Q
Q
M
M
Q
W
2
3
1
3
3
5
Kierunek asymetrii rozkładu
Rozkład symetryczny badanej cechy,
średnia jest równa modalnej,
wskaźnik skośności jest równy zero.
Rozkłady niesymetryczne badanej cechy różnią się między sobą
kierunkiem i
siłą asymetrii.
0
o
s
M
x
W
6
Kierunek asymetrii rozkładu
Rozkład niesymetryczne badanej cechy -
asymetrią rozkładu
.
Dla miar klasycznych:
asymetria lewostronna, gdy:
asymetria prawostronna, gdy:
Dla miar pozycyjnych
będzie to:
asymetria lewostronna, gdy:
asymetria prawostronna, gdy:
0
o
s
M
x
W
0
o
s
M
x
W
0
1
3
Q
M
M
Q
W
e
e
Q
0
1
3
Q
M
M
Q
W
e
e
Q
4
7
Kierunek asymetrii rozkładu
Asymetria prawostronna
Dominują wartości mniejsze
od średniej
Asymetria lewostronna
Dominują wartości większe
od średniej
0
o
s
M
x
W
0
o
s
M
x
W
8
f
i
A
B
C
1
2
2
2
1
4
5
7
1
6
7
8
1
8
8
8,5
1
10
10
9,5
1
12
11
10
1
14
13
11
1
16
16
16
śr
9
9
9
odch
4,90
4,47
3,94
V
0,54
0,50
0,44
R
14
14
14
Q
1
5
6
7,5
Me
9
9
9
Q
3
13
12
10,5
Q
4
3
1,5
0
1
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
f
i
x
i
Zbiorowość A
0
1
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
f
i
x
i
Zbiorowość B
0
1
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16
f
i
x
i
Zbiorowość C
5
9
Współczynniki asymetrii A
s
A
Q
miary przybliżone
Dla porównania
kierunku i siły asymetrii
w dwóch lub więcej
zbiorowościach stosujemy współczynniki asymetrii.
dla miar klasycznych
dla miar pozycyjnych
s
M
x
A
o
s
Q
M
Q
Q
Q
Me
Me
Q
Q
Me
Me
Q
A
e
Q
2
2
3
1
1
3
1
3
10
Współczynniki asymetrii – A
Dla miar klasycznych
gdzie: s
– odchylenie standardowe
m
3
– moment standaryzowany rzędu trzeciego
szeregi szczegółowe
szeregi rozdzielczy punktowy
szeregi rozdzielczy przedziałowy
3
3
s
m
A
n
i
i
x
x
n
m
1
3
3
1
k
i
i
i
f
x
x
n
m
1
3
3
1
k
i
i
i
f
x
x
n
m
1
3
3
1
6
11
Kierunek i siła asymetrii
Kierunek asymetrii
Siła asymetrii
Rozkład
A, A
s
=0 - symetria
symetryczny
A, A
s
>0 - prawostronna
A, A
s
≈ 0 brak lub słaba
prawoskośny
A, A
s
<0 - lewostronna
A, A
s
→ 1 - silna
lewoskośny
A, A
s
≥ 2 - ekstremalnie silna
skrajnie asymetryczny
Siłą asymetrii:
0
– brak skośności,
0-
0,33 mówimy o małej skośności (niewyraźnej);
0,34-0,66
– średnia skośność,
0,67-
1 duża skośność (wyraźna),
1-
funkcyjna skośność.
12
Miary asymetrii -
przykład
klasa
stawka godzinowa
[zł/godz.]
liczba pracowników (f
i
)
i
x
0i
x
1i
firma A
firma B
firma C
1
2
4
15
15
20
2
4
6
30
105
50
3
6
8
60
75
50
4
8
10
30
75
70
5
10
12
15
30
10
suma
150
300
200
średnia
7
7
7
wariancja
4,47
4,47
4,47
odchylenie standardowe
2,11
2,11
2,11
odchylenie standardowe
(popr Shepparda)
0,33
0,33
0,33
7
13
Miary asymetrii -
przykład
15
15
20
30
105
50
60
75
50
30
75
70
15
30
10
0
20
40
60
80
100
120
firma A
firma B
firma C
[2;4)
[4;6)
[6;8)
[8;10)
[10;12)
14
Miary asymetrii -
przykład
przykładowe obliczenia dla firmy C
5
1
5
8
7
,
,
o
s
M
x
W
34
0
2
7
2
86
8
2
5
2
3
1
,
,
,
,
e
Q
M
Q
Q
W
71
0
11
2
5
1
,
,
,
s
M
x
A
o
s
09
0
83
1
2
34
0
2
2
3
1
,
,
,
Q
M
Q
Q
A
e
Q
Dane z wcześniejszych
obliczeń:
• M
o
= 8,5
• M
e
= 7,2
• Q
1
= 5,2
• Q
3
= 8,86
• s = 2,11
• = 7,0
x
8
klasa
Stawka
[zł/godz.]
środek
klasy
obliczanie m
3
we współczynniku
asymetrii (firma C)
i
x
0i
x
1i
f
i
1
2
4
3
20
-4
-64
-1280
2
4
6
5
50
-2
-8
-400
3
6
8
7
50
0
0
0
4
8
10
9
70
2
8
560
5
10
12
11
10
4
64
640
suma
200
-480
s=2,11
15
Miary asymetrii -
przykład
i
x
x
x
i
3
x
x
i
i
i
f
x
x
3
25
0
11
2
200
480
3
3
3
,
,
/
s
m
A
Obliczanie współczynnika asymetrii (A)
16
Miary asymetrii -
przykład
firma A
firma B
firma C
modalna
7
5,5
8,5
kwartyl I
5,5
5,14
5,20
kwartyl II (mediana)
7
6,8
7,2
kwartyl III
8,5
8,8
8,86
odchylenie ćwiartkowe
1,5
1,83
1,83
wskaźnik skośności (klas.)
0
1,5
-1,5
wskaźnik skośności (pozyc.)
0
0,34
-0,34
współcz. skośności (klas.)
0
0,71
-0,71
współcz. skośności (pozyc.)
0
0,09
-0,09
współcz. asymetrii (A)
0
0,25
-0,25
(licznik A, tj. m
3
)
0
2,4
-2,4
9
17
Miary asymetrii -
przykład
Struktura płac
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
2
4
6
8
10
12
stawka [zł/godz]
c
zę
s
to
ś
ć
firma A
firma B
firma C
18
Miary koncentracji i spłaszczenia
Zjawisko
koncentracji może być rozważane jako
nierównomierny podział ogólnej sumy wartości cechy pomiędzy
poszczególne jednostki badanej zbiorowości
Istnieje ścisły związek
pomiędzy koncentracją a
rozproszeniem:
im mniejsze rozproszenie
tym większa koncentracja.
I na odwrót .
10
19
Miary koncentracji
Do oceny stopnia koncentracji stosujemy dwie metody.
Metoda numeryczna
– wyznaczanie odpowiednich wskaźników
liczbowych:
współczynnik skupienia inaczej kurtoza,
współczynnik koncentracji Lorenza.
Metoda graficzna
– wykreślanie i analiza tzw. krzywej koncentracji
Lorenza
20
Współczynnik skupienia (kurtoza)
Dla miar klasycznych
.
gdzie: s
– odchylenie standardowe
Wyznaczanie wartości momentu centralnego m
4
szereg szczegółowy
szereg rozdzielczy punktowy
szereg rozdzielczy przedziałowy
4
4
s
m
K
n
i
i
x
x
n
m
1
4
4
1
k
i
i
i
f
x
x
n
m
1
4
4
1
k
i
i
i
f
x
x
n
m
1
4
4
1
EXCEL
=KURTOZA(liczba1;liczba2, …)
11
21
Współczynnik skupienia (kurtoza)
Dla miar pozycyjnych
gdzie:
D
1
– decyl rzędu 1
D
9
– decyl rzędu 9
)
(
*
2
1
9
1
3
D
D
Q
Q
K
p
rozkład
spłaszczony
rozkład
normalny
rozkład
wysmukły
K < 3
K = 3
K > 3
K
p
> 0,263
K
p
= 0,263
K
p
< 0,263
22
Współczynnik ekscesu K’
Współczynnik ekscesu
Kurtoza w rozkładzie normalnym jest zawsze równa trzy (K=3).
W praktyce policzoną kurtozę porównujemy z kurtozą rozkładu normalnego.
I tak jeżeli:
K>3 -
rozkład badanej cechy jest wyższy i smuklejszy od rozkładu
normalnego
K<3 -
odwrotnie; niższy i bardziej rozłożysty
K’>0
-
rozkład badanej cechy jest wyższy i smuklejszy od rozkładu
normalnego
K’<0
-
odwrotnie; niższy i bardziej rozłożysty
Zjawiska społeczne, gospodarcze, przyrodnicze są najczęściej opisywane tzw.
rozkładem normalnym.
3
4
4
s
m
K'
12
23
Współczynnik ekscesu K’ - przykład
klasa
Stawka
[zł/godz.]
środek
klasy
obliczanie m
4
w kurtozie (firma A)
i
x
0i
x
1i
f
i
1
2
4
3
15
-4
256
3840
2
4
6
5
30
-2
16
480
3
6
8
7
60
0
0
0
4
8
10
9
30
2
16
480
5
10
12
11
15
4
256
3840
suma
150
8640
s=2,11
4
2
11
2
150
8640
4
4
4
,
,
/
s
m
K
K<3 -
koncentracja wokół średniej stawki
godzinowej w firmie A jest mniejsza niż w przypadku
rozkładu normalnego (diagram jest niższy i bardziej
rozłożysty niż w rozkładzie normalnym);
rozproszenie jest większe niż w rozkładzie
normalnym.
6
0
3
11
2
150
8640
3
4
4
4
,
,
/
'
s
m
K
i
x
x
x
i
4
x
x
i
i
i
f
x
x
4
24
Krzywa koncentracji Lorenza
opisuje stopień koncentracji
(nierównomierności podziału globalnego zasobu cechy)
jednowymiarowego
rozkładu zmiennej losowej o wartościach
nieujemnych.
często wykorzystywana w ekonometrii do liczbowego wyrażania
koncentracji kapitału, nierównomierności zarobków, koncentracji
sprzedaży (np.20% sklepów sprzedaje 80% produktów, 10% firm
przewozi 85% towarów)
ma również zastosowania w ekologii.
zawiera się w kwadracie jednostkowym, przy czym jej końce to dolny
lewy i górny prawy wierzchołek kwadratu
pole pomiędzy nią a przekątną kwadratu nazywane jest wskaźnikiem
Giniego.
13
25
Krzywa koncentracji Lorenza
Kwadrat, w którym rysujemy krzywą
Lorenza, ma powierzchnię
100x100=10000
Im większa jest powierzchnia
pola (a), tym większa jest
koncentracja w badanym
zjawisku.
a
z
isk
[%]
w
isk
[%]
linia równomiernego
podziału
wskaźnik Giniego
krzywa Lorenza
a
z
isk
[%]
w
isk
[%]
linia równomiernego
podziału
wskaźnik Giniego
krzywa Lorenza
26
Krzywa koncentracji Lorenza
Krzywą koncentracji Lorenza rysujemy wykorzystując:
dane pogrupowane są w szereg rozdzielczy przedziałowy,
skumulowaną częstość dla liczebności (w
i sk
),
skumulowaną częstość dla wartości cechy (z
i sk
);
wartość cechy obliczamy w każdej klasie jako iloczyn f
i
*z
i
(tak jak
przy liczeniu średniej),
często obie częstości wyrażamy w %.
Wykres krzywej Lorenza:
dla każdej klasy wyznaczamy punkt o współrzędnych (w
i sk
,z
i sk
).
następnie łączymy te punkty odcinkami.
punkt (w
1_sk
,z
1_sk
) łączymy dodatkowo z punktem (0 , 0).
14
27
Współczynnik koncentracji Lorenza
Koncentracja całkowita
Koncentracja słaba
Brak koncentracji
Koncentracja duża
KL=1
KL=0,1
KL=0,7
KL=0
28
Współczynnik koncentracji Lorenza
współczynnik koncentracji Lorenza (KL) -
liczbowo siła
koncentracji. Jest on równy stosunkowi pola (a) do pola powierzchni
połowy kwadratu (5000):
Ponieważ łatwiej jest policzyć pole (b), to pole (a) wyznaczamy
z różnicy = 5000-b.
Pole (b) jest sumą pól trapezów prostokątnych (dla pierwszej klasy jest to
trójkąt prostokątny).
Ostateczny wzór na współczynnik koncentracji Lorenza (KL) ma postać:
KL
1 -
silna koncentracja (rozkład leptokurtyczny)
KL
0 -
słaba koncentracja (rozkład platokurtyczny)
Generalnie, jeżeli będzie skrajna asymetria to koncentracja zawsze
wystąpi.
5000
a
KL
5000
1
5000
5000
b
b
KL
15
29
Współczynnik koncentracji Lorenza - przykład
2
z
z
w
sk
1
i
sk
i
i
Liczba
ludności
[w 10
tys.]
Liczba
gmin
Ludność
w
gminach
Odsetek
gmin
[%]
Odsetek
ludności
[%]
Skumul.
odsetek
gmin [%]
Skumul.
odsetek
ludności
[%]
Obliczanie
pola (b)
Rodzaj
figury
x
i
f
i
z
i
=x
i
f
i
w
i
z
i
w
i_skum
z
i_skum
< 2
10
15
0,5
0,07
0,5
0,1
0,016 trójkąt
2 – 5
220
685
11,0
2,98
11,5
3,0
17,098 trapez
5 – 7
500
3400
25,0
14,78
36,5
17,8
260,870 trapez
7 – 10
770
6600
38,5
28,70
75,0
45,6
1238,696 trapez
10 - 20
300
4500
15,0
19,57
90,0
66,1
844,565 trapez
> 20
200
7800
10,0
33,91
100,0
100,0
732,609 trapez
suma
2000
23000
100,0
100,0
3093,853
11,5
x
3813
0
6187
0
1
5000
8
3093
1
5000
1
,
,
,
b
KL
30
Współczynnik koncentracji Lorenza - przykład
2
z
z
w
sk
1
i
sk
i
i
Liczba
ludności
[w tys.]
Liczba
gmin
Ludność
w
gminach
Odsetek
gmin
[%]
Odsetek
ludności
[%]
Skumul.
odsetek
gmin [%]
Skumul.
odsetek
ludności
[%]
Obliczanie
pola (b)
Rodzaj
figury
x
i
f
i
z
i
=x
i
f
i
w
i
z
i
w
i_sk
z
i_sk
< 2
10
15
0,5
0,07
0,5
0,1
0,016 trójkąt
2 – 5
220
685
11,0
2,98
11,5
3,0
17,098 trapez
5 – 7
500
3400
25,0
14,78
36,5
17,8
260,870 trapez
7 – 10
770
6600
38,5
28,70
75,0
45,6
1238,696 trapez
10 - 20
300
4500
15,0
19,57
90,0
66,1
844,565 trapez
> 20
200
7800
10,0
33,91
100,0
100,0
732,609 trapez
suma
2000
23000
100,0
100,0
3093,853
11,5
x
3813
0
6187
0
1
5000
8
3093
1
5000
1
,
,
,
b
KL
16
31
Współczynnik koncentracji Lorenza - przykład
W obserwowanych
gminach ludność
zamieszkująca rejon
nie miała tendencji do
koncentrowania
zamieszkania.
W gminach o średniej
wielkości 11,5 tys.
mieszkańców
Potwierdzają to:
•mała wartość
współczynnika
koncentracji KL oraz
•słaby „brzuch” krzywej
koncentracji Lorenza
0,0
20,0
40,0
60,0
80,0
100,0
0,0
20,0
40,0
60,0
80,0
100,0
sk
umulow
an
e
od
se
tki
lud
no
śc
i
z
i
skumulowane odsetki gmin w
i
Krzywa koncentracji Lorenza - wielobok
koncentracji
32
Podsumowanie
Statystyczna analiza struktury powinna być przeprowadzana
kompleksowo,
tzn. z jednoczesnym uwzględnieniem dużej liczby
parametrów,
Każda grupa charakterystyk opisuje rozkład z innego punktu widzenia
(miary przeciętne, zróżnicowania, asymetrii, spłaszczenia i koncentracji),
Miary klasyczne
stosowane są do opisu struktur rozkładów typowych
(jednomodalnych, o słabej asymetrii, symetrycznych) – są bardziej
dokładne,
Miary pozycyjne
są mniej dokładne – wykorzystuje się je do opisu struktur
rozkładów nietypowych (skrajnie asymetrycznych, bi- lub wielomodalnych, o
otwartych przedziałach klasowych),
17
33
Podsumowanie
Wskaźnik podobieństwa struktur
(w
p
) jest najprostszą miarą
statystyczną pozwalającą ocenić podobieństwo kształtowania się
badanej cechy w dwóch różnych zbiorowościach.
Względny wskaźnik podobieństwa struktur
– do porównywania struktur
różnych zbiorowości:
gdzie: w
1i
,w
2i
– wskaźniki struktury,
Z = 1
– porównywane struktury są identyczne,
Z = 0
-
porównywane struktury są krańcowo odmienne.
k
1
i
i
2
i
1
p
w
w
w
,
min
k
1
i
i
2
i
1
k
1
i
i
2
i
1
w
w
w
w
Z
,
max
,
min
34
Wskaźnik podobieństwa struktur - przykład
numer
klasy
czas
dojazdu
częstość
A
częstość
B
obliczenia wskaźnika
i
x
0i
– x
1i
w
1i
w
2i
w
pi
=min{w
1i
,w
2i
}
max{w
1i
,w
2i
}
1
5 – 15
0,1
0,05
0,05
0,1
2
15 – 25
0,2
0,1
0,10
0,2
3
25 – 35
0,35
0,15
0,15
0,35
4
35 – 45
0,2
0,2
0,20
0,2
5
45 – 55
0,1
0,4
0,10
0,4
6
55 – 65
0,05
0,1
0,05
0,1
razem
1,00
1,00
0,65
1,35
48
0
35
1
65
0
Z
,
,
,
Wp=0,65