Skośność i jej pomiar
Skośność (asymetria) określana jest jako
brak symetrii w rozłożeniu wartości cechy
względem ich średniej arytmetycznej, co jest
równoznaczne z niesymetrycznym rozłożeniem
jednostek statystycznych.
Jeśli w zbiorowości statystycznej opisywanej ze
względu na określoną cechę przeważają
liczebnie jednostki o wartościach cechy
niższych od średniej arytmetycznej to sytuację
tę określa się mianem skośności
prawostronnej, zaś w przypadku dominacji
jednostek o wartościach cechy wyższych od
średniej arytmetycznej - mówimy o skośności
lewostronnej.
Xśr
Me(x)
D(x)
Rozkład symetryczny
D(X) Me(x) Xśr
Rozkład asymetryczny prawostronnie
Xśr Me(x) D(X)
Rozkład asymetryczny lewostronnie
Miary skośności
Klasyfikacja:
a)
klasyczne miary skośności
:
- trzeci moment centralny
b)
pozycyjne miary skośności
:
-
relacja między średnią arytmetyczną i
dominantą,
- współczynniki skośności,
Podział miar
skośności
klasyczne
pozycyjne
absolutne:
•
moment trzeci
centralny –
m
3
(x)
względne:
•
moment trzeci
centralny
standaryzowany –
m
3
(t)
względne:
współczynniki
skośności – W
S
absolutne:
• pozycyjna
miara skośności,
np..
Me
Q
Q
2
3
1
Klasyczne miary skośności
Trzeci moment centralny M
3
(X)
- miara
mianowana, pozwala jedynie stwierdzić czy
skośność występuje i jaki ma kierunek
interpretacja uzyskanej wartości miary
skośności:
M
3
(X) = 0 - brak skośności
M
3
(X) > 0 - skośność prawostronna, tzn., że w
zbiorowości występuje przewaga jednostek o
wartościach cechy mniejszych od średniej
M
3
(X) < 0 - skośność lewostronna, tzn., że w
zbiorowości występuje przewaga jednostek o
wartościach cechy większych od średniej
-
szereg szczegółowy :
Trzeci moment centralny - m
3
(x) –
sposoby
obliczenia
N
x
x
x
m
N
i
i
1
3
3
)
(
- szereg rozdzielczy punktowy:
N
n
x
x
x
m
k
i
i
i
1
3
3
)
(
- szereg rozdzielczy przedziałowy:
N
n
x
i
x
m
k
i
i
o
x
1
3
3
)
(
Trzeci moment centralny standaryzowany
m
3
(t)
- miara niemianowana, pozwala określić
zarówno siłę, jak i kierunek skośności
)
(
)
(
)
(
3
3
3
x
S
x
m
t
m
interpretacja siły skośności:
m
3
(t) (0 ; 0,34) - skośność słaba (mała)
m
3
(t) <0,34 ; 0,67) - skośność średnia
(wyraźna)
m
3
(t) <0,67 ; 1> - skośność silna (duża)
m
3
(t) > 1 - skośność bardzo silna (bardzo
duża)
interpretacja kierunku skośności:
m
3
(t) = 0 - brak skośności
m
3
(t) > 0 - skośność prawostronna
m
3
(t) < 0 - skośność lewostronna
Trzeci moment centralny
standaryzowany
Miara skośności wyrażona tą postacią
przyjmuje jedynie wartości z przedziału
<-1;1>
x
s
x
m
x
m
t
m
3
3
3
*
3
Pozycyjne miary skośności
Absolutna miara skośności M
s
(X) – miara
pozycyjna, pozwala określić jedynie czy skośność
występuje i jaki ma kierunek
)
(
)
(
x
D
x
x
M
s
Ms = 0 - brak skośności
Ms > 0 - skośność prawostronna
Ms < 0 - skośność lewostronna
)
(x
D
x
)
(x
D
x
)
(x
D
x
Pozycyjna
miara
skośności:
-
miara
mianowana, pozwala jedynie określić czy w
dwóch środkowych ćwiartkach zbiorowości
występuje skośność i jaki ma kierunek
Me
Q
Q
2
3
1
interpretacja kierunku skośności:
- brak skośności,
tzn. że
kwartyl pierwszy i trzeci są tak samo oddalone od
mediany
- skośność prawostronna
tzn., że w zbiorowości występuje przewaga
jednostek o wartościach cechy mniejszych od
mediany
- skośność lewostronna tzn.,
że w zbiorowości występuje przewaga jednostek o
wartościach cechy większych od mediany
0
2
3
1
Me
Q
Q
0
2
3
1
Me
Q
Q
0
2
3
1
Me
Q
Q
Współczynnik skośności - W
s1
- miara
względna, pozwala określić zarówno siłę, jak i
kierunek skośności
)
(
)
(
)
(
1
x
S
x
D
x
x
W
s
interpretacja kierunku skośności:
W
s1
= 0 - brak skośności
W
s1
> 0 - skośność prawostronna
W
s1
< 0 - skośność lewostronna
interpretacja siły skośności:
W
s1
(0 ; 0,34) - skośność słaba (mała)
W
s1
<0,34 ; 0,67) - skośność średnia
(wyraźna)
W
s1
<0,67 ; 1> - skośność silna (duża)
W
s1
> 1 - skośność bardzo silna (bardzo duża)
Pozycyjny współczynnik skośności - W
s2
-
miara względna, pozwala określić zarówno siłę,
jak i kierunek skośności
1
3
1
3
2
2
)
(
Q
Q
Me
Q
Q
x
W
s
interpretacja kierunku skośności:
W
s2
= 0 - brak skośności
W
s2
> 0 - skośność prawostronna
W
s2
< 0 - skośność lewostronna
interpretacja siły skośności:
W
s2
(0 ; 0,34) - skośność słaba (mała)
W
s2
<0,34 ; 0,67) - skośność średnia
(wyraźna)
W
s2
<0,67 ; 1> - skośność silna (duża)
W
s2
> 1 - skośność bardzo silna (bardzo duża)
Koncentracja wartości cechy i jej
pomiar
Dwa sposoby rozumienia koncentracji:
-
kurtoza (poziom skupienia wartości
cechy wokół średniej arytmetycznej) –
m
4
(t),
-
nierównomierność rozłożenia globalnego
funduszu wartości cechy wśród jednostek
statystycznych badanej zbiorowości –
współczynnik koncentracji - k
Koncentracja jako kurtoza pozwala zbadać
skupienie
wartości
cechy
wokół
średniej
arytmetycznej, a tym samym pozwala zbadać
stopień spłaszczenia (lub wysmukłości) rozkładu
wartości cechy
Badanie
kurtozy
ma
największą
wartość
poznawczą w rozkładach symetrycznych.
Do badania kurtozy wykorzystuje się rozkład
normalny, który rządzi się regułą trzech odchyleń
standardowych.
)
(
)
(
x
S
x
x
x
S
x
typ
x
)
(x
S
x
)
(x
S
x
34,13
%
34,13
%
)
(
2 x
S
x
)
(
2 x
S
x
)
(
3 x
S
x
)
(
3 x
S
x
13,59
%
13,59
%
2,15%
2,15%
Rozkład normalny jest rozkładem symetrycznym
(brak skośności) tzn., że średnia dominanta i
mediana są sobie równe. W tym rozkładzie
najwięcej jednostek ma wartości cechy z
typowego obszaru zmienności:
Do badania kurtozy wykorzystuje się moment
czwarty centralny standaryzowany – m4(t). Jest to
miara klasyczna, niemianowana.
)
(
)
(
)
(
4
4
4
x
S
x
m
t
m
Interpretacja:
- koncentracja normalna tzn., że ok.
68% jednostek ma wartości cechy z typowego
obszaru zmienności; rozkład normalny
- koncentracja większa od normalnej
tzn., że więcej niż 68% jednostek ma wartości
cechy z typowego obszaru zmienności; rozkład
wysmukły (leptokurtyczny)
- koncentracja mniejsza od normalnej
- mniej niż 68% jednostek ma wartości cechy z
typowego
obszaru
zmienności;
rozkład
spłaszczony (platykurtyczny)
3
)
(
4
t
m
3
)
(
4
t
m
3
)
(
4
t
m
Czwarty moment centralny – sposoby obliczania:
-
szereg
szczegółowy
i
surowy
materiał
statystyczny:
N
x
x
x
m
N
i
i
1
4
4
)
(
- szereg rozdzielczy punktowy:
N
n
x
x
x
m
k
i
i
i
1
4
4
)
(
- szereg rozdzielczy przedziałowy:
N
n
x
x
x
m
k
i
i
i
1
4
4
)
(
Przykład:
Zbadać kurtozę rozkładu czasu dojazdu do
pracy (w min) pracowników pewnej firmy
<X
i0
– X
i1
)
n
i
45-55
55-65
65-75
75-85
85-95
40
50
60
30
20
Razem
200
Koncentracja jako nierównomierność
rozłożenia globalnego funduszu
wartości cechy
Globalny fundusz wartości cechy to
suma wartości badanej cechy
występujących u wszystkich jednostek
zbiorowości statystycznej.
W przypadku szeregu rozdzielczego
punktowego liczony jest on według wzoru:
a w przypadku szeregu przedziałowego
jako;
Badanie nierównomierności
(koncentracji) odbywa się przez
porównanie rozkładu tego funduszu i
rozłożenia jednostek statystycznych badanej
zbiorowości. Jeśli proporcje rozkładu
globalnego funduszu są odmienne niż
proporcje rozkładu jednostek statystycznych,
to występuje koncentracja w tym znaczeniu.
Badanie natężenia tak rozumianej
koncentracji może się odbywać graficznie –
przy wykorzystaniu krzywej Lorentza lub
analitycznie przy wykorzystaniu
współczynnika koncentracji
:
Poniższa tablica zawiera informacje dotyczące
struktury przedsiębiorstw woj. „D” według
wielkości zatrudnienia:
zatrudnienie
Liczba
przedsiębiorstw
1 -10
450
11 - 50
100
51 - 200
35
201 - 500
12
501 - 1000
3