Miary statystyczne


Analiza wyników badania statystycznego
 opis statystyczny
Miary statystyczne jednej cechy
(charakterystyki opisowe; parametry statystyczne)
¾ Miary poziomu warto ci (miary polo enia; miary tendencji
centralnej)
¾ Miary dyspersji (miary zmienno ci; rozproszenia;
zró nicowania)
¾ Miary sko no ci (miary asymetrii)
¾ Miary spÅ‚aszczenia (miary kurtozy)
Podzial ze wzgl du na zakres danych niezb dnych do wyliczenia
miar:
¾ Miary klasyczne (wykorzystywane s warto ci cechy
zaobserwowane u wszystkich jednostek)
¾ Miary pozycyjne (wykorzystywane s warto ci cechy tylko
niektórych jednostek)
Statystyka opisowa JU 12
Miary poziomu warto ci
Miary poziomu klasyczne
" rednia arytmetyczna
" rednia geometryczna
" rednia harmoniczna
X
rednia arytmetyczna
N
"xi
i=1
X =
Szereg prosty
N
z z
ni ni z
"xi "xi
i=1 i=1
X = = = ni'
"xi
z
N
i=1
Szereg punktowy
"ni
i=1
z z
ni ni z
"xi "xi
i=1 i=1
X = = = ni'
"xi
z
N
i=1
Szereg przedziałowy
"ni
i=1
N  liczebno ć ogólna;
ni  liczebno ć i-tego przedzialu; i=1, 2,& , z
n'  cz sto ć wzgl dna i-tego przedzialu;
i
xi  rodek i-tego przedzialu
Statystyka opisowa JU 13
Przykłady
Szereg prosty
Liczba przepracowanych godzin nadliczbowych pracowników
dwóch dzialów pewnego zakladu
Dzial U 2 5 5 7 7 8 9 9 9
Dzial P 3 3 4 5 6 6 7 7
Dzial U (N=9) Dzial P (N=8)
N N
"xi "xi
61 41
i=1 i=1
X = = = 6,78 X = = = 5,125
N 9 N 8
Szereg rozdzielczy punktowy
liczba miejsc Liczba
xi ni
noclegowych xi miejscowo ci ni
20 3 60
22 4 88
26 6 156
28 5 140
30 2 60
Razem N=20 504
z
ni
"xi
504
i=1
X = = = 25,2
z
20
"ni
i=1
Statystyka opisowa JU 14
Szereg rozdzielczy przedziałowy
Zaklad A
(xi0;xi1> ni ni'
xi xini
(1100; 1600> 5 0,05 1350 6750
(1600; 2100> 8 0,08 1850 14800
(2100; 2600> 15 0,15 2350 35250
(2600; 3100> 24 0,24 2850 68400
(3100; 3600> 15 0,15 3350 50250
(3600; 4100> 13 0,13 3850 50050
(4100; 4600> 11 0,11 4350 47850
(4600; 5100> 6 0,06 4850 29100
(5100; 5600> 3 0,03 5350 16050
N= 100 1 318500
z
ni
"xi
318500
i=1
X = = = 3185
z
100
"ni
i=1
Przeci tna placa pracowników zakladu A wynosi 3185 zl.
Statystyka opisowa JU 15
WÅ‚asno ci redniej arytmetycznej
xmin < X < xmax
1.
2. suma odchyle warto ci cechy od redniej jest równa zeru
(xi - X )= 0
"
3. rednia arytmetyczna sumy jest równa sumie rednich
arytmetycznych
X +Y = X +Y
4. je eli ka d z warto ci cechy powi kszymy (pomniejszymy)
o pewn stal c, to rednia arytmetyczna zwi kszy si
(zmniejszy) o t stal
Ä… c) = X Ä… c
"(xi
5. przeskalowanie warto ci cechy - je eli ka d z warto ci cechy
zwi kszymy (zmniejszymy) c razy, to rednia arytmetyczna
zwi kszy si (zmniejszy) c razy
xi
Å"c
X
"xi "
c
= X Å"c , =
N N c
6. przeskalowanie liczebno ci w szeregach punktowych
i przedziałowych - je eli ka d z liczebno ci klas zwi kszymy
(zmniejszymy) c razy, to rednia arytmetyczna nie ulegnie
zmianie
ni
(c Å" ni )
"xi "xi
c
= X , = X
ni
"(c Å" ni )
"
c
Statystyka opisowa JU 16
Miary poziomu pozycyjne
" Dominanta (moda; warto ć modalna)
" Mediana (warto ć rodkowa) i Kwantyle
- Kwartyle
- Decyle
- Centyle (percentyle)
Dominanta (moda) D  najcz ciej wyst puj ca warto ć
(wariant) cechy; jest to warto ć cechy, wokól której skupia si
najwi cej jednostek statystycznych
Wyznaczanie dominanty
Szereg rozdzielczy punktowy
D = xd gdy nd = max
liczba miejsc Liczba miejscowo ci
noclegowych xi
20 3
22 4
26 ( Dominanta 6(najwi ksza liczebno ć
28 5
30 2
Statystyka opisowa JU 17
Szereg rozdzielczy przedziałowy
Szacowanie dominanty
nd - nd -1
D H" xd 0 + hd
(nd - nd -1)+ (nd - nd +1)
gdzie
xd 0 - dolna granica przedzialu dominanty
hd - rozpi to ć przedzialu dominanty
nd - liczebno ć przedzialu dominanty
nd -1 - liczebno ć przedzialu poprzedzaj cego przedzial
dominanty
nd +1 - liczebno ć przedzialu nast puj cego po przedziale
dominanty
przykład Zaklad A
(xi0;xi1> ni
(1100; 1600> 5
(1600; 2100> 8
(2100; 2600> 15
(2600; 3100> (przedzial dominanty 24
(3100; 3600> 15
(3600; 4100> 13
(4100; 4600> 11
(4600; 5100> 6
(5100; 5600> 3
24 -15
D H" 2600 + 500 = 2793,75
(24 -15)+ (24 +15)
Statystyka opisowa JU 18
graficzne szacowanie dominanty
D

Rozklad (cechy w populacji) jest jednomodalny (monomodalny)
gdy wyst puje jedna dominanta, a wielomodalny (polimodalny)
gdy wyst puje wi cej ni jedna dominanta.




Statystyka opisowa JU 19
Mediana (warto ć rodkowa) M  jest warto ci cechy, która
dzieli zbiorowo ć na dwie liczebnie równe cz ci: do jednej z nich
nale jednostki statyst. o warto ciach cechy mniejszych lub
równych medianie, do drugiej jednostki o warto ciach cechy
wi kszych lub równych medianie.
Mediana jest warto ci cechy, jak przyjmuje jednostka zajmuj ca
pozycj rodkow w uporz dkowanym ci gu warto ci.
Wyznaczanie mediany
Szereg prosty
Liczebno ć N nieparzysta Liczebno ć N parzysta
M = x(N +1) 2 xN 2 + x(N +2) 2
M =
2
gdzie: gdzie:
(N +1) 2 N 2 (N + 2) 2
- numer jednostki i - numery
rodkowej dwóch jednostek rodkowych
przykład
Liczba przepracowanych godzin nadliczbowych pracowników
dwóch dzialów pewnego zakladu
Dzial U 2 5 5 7 7 8 9 9 9
Dzial P 3 3 4 5 6 6 7 7
Dzial U (N=9) Dzial P (N=8)
M = x(N +1) 2 = 7 xN 2 + x(N +2) 2
M = = 5,5
2
gdzie: gdzie:
(N +1) 2 = (9 +1) 2 = 5 N 2 = 8 2 = 4
(N + 2) 2 = (8 + 2) 2 = 5
Statystyka opisowa JU 20
Szereg rozdzielczy punktowy
przykład
liczba miejsc Liczba Skumulowana liczba
noclegowych xi miejscowo ci miejscowo ci
20 3 3
22 4 7
26 6 13
28 5 18
30 2 20
Razem N=20
liczba miejsc Liczba Skumulowana liczba
noclegowych xi miejscowo ci miejscowo ci
20 3 3
22 4 7
26 ( Mediana 6 13(miejscowo ci o
numerach od 8 do 13
28 5 18
30 2 20
N 2 = 20 2 = 10 (N + 2) 2 = (20 + 2) 2 = 11
;
xN 2 + x(N +2) 2 x10 + x11 26 + 26
M = = = = 26
2 2 2
Polowa badanych miejscowo ci dysponuje co najwy ej 26
miejscami noclegowymi, natomiast druga polowa miejscowo ci
co najmniej 26 miejscami noclegowymi.
Statystyka opisowa JU 21
Szereg rozdzielczy przedziałowy
Szacowanie mediany
m-1
ëÅ‚ öÅ‚
N +1 hm
ìÅ‚
M H" xm0 + -
i
"n ÷Å‚ nm
ìÅ‚ ÷Å‚
2
i=1
íÅ‚ Å‚Å‚
gdzie
xm0 - dolna granica przedzialu mediany
m-1
"ni
- suma liczebno ci przedzialów poprzedzaj cych
i=1
przedzial mediany
hm - rozpi to ć przedzialu mediany
nm - liczebno ć przedzialu mediany
N 2 = 50 (N + 2) 2 = 51
przykład Zaklad A (N=100) i
skumulowane
(xi0;xi1> ni
ni
(1100; 1600> 5 5
(1600; 2100> 8 13
(2100; 2600> 15 28
(2600; 3100> (przedzial mediany 24 52
(3100; 3600> 15 67
(3600; 4100> 13 80
(4100; 4600> 11 91
(4600; 5100> 6 97
(5100; 5600> 3 100
100 +1 500
ëÅ‚
M H" 2600 + - 28öÅ‚ = 3068,75
ìÅ‚ ÷Å‚
2 24
íÅ‚ Å‚Å‚
Statystyka opisowa JU 22
graficzne szacowanie mediany

M


Kwantyle Qj/v (przeci tne pozycyjne wy szych rz dów) 
uzyskujemy dziel c zbiorowo ć na wi cej ni dwie równe
liczebnie cz ci:
- na cztery cz ci - kwartyle Qj/4 (trzy kwartyle Q1/4; Q2/4; Q3/4)
- na dziesi ć cz ci - decyle Qj/10
- na sto cz ci - centyle (percentyle) Qj/100
gdzie j oznacza numer kwantyla i j=1, 2, & , v-1; v- liczba cz ci
Wyznaczanie kwantyli
Q = xjÅ"N v
j / v
Szereg prosty
Q = xk ,
j / v
Szereg rozdzielczy punktowy
gdzie k  przedzial j-tego kwantyla
Statystyka opisowa JU 23
Szereg rozdzielczy przedziałowy
k -1
ëÅ‚ öÅ‚
N hk
ìÅ‚
Q H" xk0 + j Å" -
j / v "n ÷Å‚ nk
i
ìÅ‚ ÷Å‚
v
i=1
íÅ‚ Å‚Å‚
gdzie
xk 0 - dolna granica przedzialu zawieraj cego j-ty kwantyl
k -1
"ni
- suma liczebno ci przedzialów poprzedzaj cych
i=1
przedzial j-tego kwantyla
hk - rozpi to ć przedzialu j-tego kwantyla
nk - liczebno ć przedzialu j-tego kwantyla
Uwaga:
Wyznaczanie kwantyli ma sens przy du ych liczebno ciach
badanych zbiorowo ci (zwlaszcza decyli i centyli).
Statystyka opisowa JU 24
przykład
Zaklad A (N=100)
(xi0;xi1> ni skumulowane ni
(1100; 1600> 5 5
(1600; 2100> 8 13
(2100; 2600> (przedzial Q1/4 15 28 (od 14 do 28)
(2600; 3100> (przedzial Q2/4 24 52 (od 29 do 52)
(3100; 3600> 15 67
(3600; 4100> (przedzial Q3/4 13 80 (od 68 do 91)
(4100; 4600> 11 91
(4600; 5100> 6 97
(5100; 5600> 3 100
Kwartyl 1 Q1/4 (j=1; v=4);
jÅ"N v = 1 Å"100 / 4 = 25
100 500
ëÅ‚1Å"
Q1/ 4 H" 2100 + -13öÅ‚ = 2500
ìÅ‚ ÷Å‚
4 15
íÅ‚ Å‚Å‚
Kwartyl 3 Q3/4 (j=3; v=4)
jÅ"N v = 3 Å"100 / 4 = 75
100 500
ëÅ‚3Å"
Q3/ 4 H" 3600 + - 67öÅ‚ = 3907,69
ìÅ‚ ÷Å‚
4 13
íÅ‚ Å‚Å‚
Kwartyl 2 Q2/4 (j=2; v=4)
jÅ"N v = 2 Å"100 / 4 = 50
2Å"100 500
ëÅ‚
Q2/ 4 H" 2600 + - 28öÅ‚ = 3068,75 = M
ìÅ‚ ÷Å‚
4 24
íÅ‚ Å‚Å‚
Statystyka opisowa JU 25
graficzne szacowanie kwartyli

M=Q2/4
Q1/4 =M Q3/4


Interpretacja
Q1/ 4 H" 2500 Q2/ 4 = M H" 3068,75 Q3/ 4 H" 3907,69
; ;
25% pracowników zakladu A najni ej zarabiaj cych otrzymuje
plac nie przekraczaj c 2500 zl, natomiast 25% pracowników
najlepiej zarabiaj cych uzyskuje plac wynosz c co najmniej
3908 zl. Polowa pracowników zarabia co najwy ej 3069 zl.
Statystyka opisowa JU 26
Miary rozproszenia
(miary zmienno ci; dyspersji; zró nicowania)
Miary rozproszenia klasyczne
" Wariancja
" Odchylenie standardowe
" Odchylenie przeci tne
Miary rozproszenia pozycyjne
" Rozst p
" Odchylenie ćwiartkowe
II podział miar rozproszenia
¾ Miary absolutne (bezwzgl dne)  posiadaj miano
badanej cechy;
" wszystkie miary w/w
¾ Miary stosunkowe (wzgl dne)  nie posiadaj miana;
" Współczynnik zmienno ci klasyczny
" Współczynnik zmienno ci pozycyjny
Statystyka opisowa JU 29
2
S (X )
Wariancja
- rednia arytmetyczna kwadratów odchyle
warto ci cechy od jej redniej arytmetycznej
Szereg prosty
N
2
(xi - X )
"
var X
2
i=1
S (X )= =
N N
Przykład
X - liczba przepracowanych godzin nadliczbowych pracowników
pewnego zakładu
Dział U 2 5 5 7 7 8 9 9 9
Dział P 3 3 4 5 6 6 7 7
X = 6,78
Dział U
(2 - 6,78)2 + (5 - 6,78)2 + + (9 - 6,78)2 =
2
S (X )=
9
= 5,06
X = 5,125
Dział P
(3 - 5,125)2 + (3 - 5,125)2 + + (7 - 5,125)2 =
2
S (X )=
8
= 2,36
Statystyka opisowa JU 30
Szereg rozdzielczy punktowy
z
2
(xi - X ) ni
"
2
i=1
S (X )=
z
"ni
i=1
Przykład X - liczba miejsc noclegowych
X = 25,2
liczba miejsc Liczba
2 2
(xi - X ) (xi - X ) ni
noclegowych miejscowo ci
xi ni
20 3 27,04 81,12
22 4 10,24 40,96
26 6 0,64 3,84
28 5 7,84 39,2
30 2 23,04 46,08
Razem N=20 211,2
211,2
2
S (X )= =10,56
20
Statystyka opisowa JU 31
Szereg rozdzielczy przedziałowy
z
2
(xi - X ) ni
"
2
i=1
S (X )=
z
i
"n
i=1
Przykład
X  wielko ć wynagrodzenia pracowników zakładu A
X = 3185
xi - X 2 - X 2 ni
(xi0;xi1> ni
(xi ) (xi )
(1100; 1600> 5 1350 3367225 16836125
(1600; 2100> 8 1850 1782225 14257800
(2100; 2600> 15 2350 697225 10458375
(2600; 3100> 24 2850 112225 2693400
(3100; 3600> 15 3350 27225 408375
(3600; 4100> 13 3850 442225 5748925
(4100; 4600> 11 4350 1357225 14929475
(4600; 5100> 6 4850 2772225 16633350
(5100; 5600> 3 5350 4687225 14061675
N= 100
96 027 500
96 027 500
2
S (X )= = 960 275
100
Statystyka opisowa JU 32
Najwa niejsze własno ci wariancji
2
S (X )e" 0
1.
2. wariancja jest ró nic mi dzy redni arytmetyczn
kwadratów warto ci cechy a kwadratem redniej arytmetycznej
2 2 2
S (X ) = X - X
Szereg rozdzielczy przedziałowy
z
2
i
"x ni
2 2
i=1
S (X )= - X
z
"ni
i=1
Statystyka opisowa JU 33
S(X )
Odchylenie standardowe - przeci tne odchylenie
(zró nicowanie) warto ci cechy od jej redniej arytmetycznej
2
S(X )= S (X )
Przykłady
Szereg prosty
Dział U Dział P
S(X )= 5,06 = 2,25 S(X )= 2,36 = 1,54
Przeci tne zró nicowanie liczby godzin nadliczbowych
przepracowanych przez pracowników wzgl dem redniej liczby
godzin nadliczbowych wynosi w dziale U 2,25 godz., a w dziale P
1,54 godz.
Szereg rozdzielczy punktowy
S(X ) = 10,56 = 3,25
X - liczba miejsc noclegowych
Przeci tne odchylenie liczby oferowanych miejsc noclegowych
w badanych miejscowo ciach od redniej liczby miejsc
noclegowych jest równe 3,25.
Szereg rozdzielczy przedziałowy
X  wielko ć wynagrodzenia pracowników zakładu A
S(X ) = 960 275 = 979,94
Statystyka opisowa JU 34
d(X )
Odchylenie przeci tne - rednia arytmetyczna modułów
odchyle warto ci cechy od jej redniej arytmetycznej
Szereg prosty
N
xi - X
"
i=1
d(X )=
N
Przykład
X - liczba przepracowanych godzin nadliczbowych pracowników
pewnego zakładu
Dział U 2 5 5 7 7 8 9 9 9
Dział P 3 3 4 5 6 6 7 7
X = 6,78
Dział U
2 - 6,78 + 5 - 6,78 + + 9 - 6,78
d(X )= =1,85
9
X = 5,125
Dział P
3 - 5,125 + 3 - 5,125 + + 7 - 5,125
d(X )= =1,38
8
Statystyka opisowa JU 35
Szereg rozdzielczy punktowy
z
xi - X ni
"
i=1
d(X )=
z
"ni
i=1
Szereg rozdzielczy przedziałowy
z
xi - X ni
"
i=1
d(X )=
z
"ni
i=1
Statystyka opisowa JU 36
Miary pozycyjne rozproszenia
Rozst p L  ró nica mi dzy skrajnymi warto ciami cechy;
okre la empiryczny obszar zmienno ci badanej cechy
L = xmax - xmin
Odchylenie ćwiartkowe Q  okre la przeci tne odchylenie 50%
rodkowych jednostek zbiorowo ci
Q3 / 4 - Q1/ 4
Q =
2
Przykład
X  wielko ć wynagrodzenia pracowników zakładu A
Q1/ 4 H" 2500 Q3/ 4 H" 3907,69
;
3907,69 - 2500
Q = = 703,85
2
Przeci tne odchylenie najbardziej typowych płac pracowników
zakładu A od warto ci rodkowej wynosi 703,85.
Statystyka opisowa JU 37
Typowy obszar zmienno ci  przedział warto ci cechy
najbardziej typowych dla badanej zbiorowo ci
Typowy obszar zmienno ci klasyczny
(X - S(X ); X + S(X ))
Typowy obszar zmienno ci pozycyjny
(M - Q;M + Q)
Przykład
X  wielko ć wynagrodzenia pracowników zakładu A
Typowy obszar zmienno ci klasyczny
X = 3185; S(X )= 979,94 (2205;4165)
Typowy obszar zmienno ci pozycyjny
M = 3068,75; Q = 703,85 (2365;3773)
Typowe wynagrodzenie pracowników etatowych zakładu A
mie ci si w przedziale (2205; 4165).
W ród 50% rodkowych warto ci wynagrodzenia pracowników
zakładu A za typowe nale y uznać wynagrodzenie z przedziału
(2365; 3773).
Statystyka opisowa JU 38
Miary stosunkowe (wzgl dne)
VXk okre la stopie
Współczynnik zmienno ci klasyczny
zró nicowania jednostek statyst. w całej zbiorowo ci
S(X )100%
VXk =
X
VXp okre la stopie
Współczynnik zmienno ci pozycyjny
zró nicowania jednostek w rodkowej cz ci rozkładu
Q
VXp = 100%
M
VX < 30% - zró nicowanie słabe
30% < VX < 60% - zró nicowanie wyra ne
VX > 60% - zró nicowanie silne
Przykład
X  wielko ć wynagrodzenia pracowników zakładu A
979,94
VXk = 100% = 30,77%
3185
703,85
VXp = 100% = 22,94%
3068,75
Statystyka opisowa JU 39
Asymetria (sko no ć) rozkładu
0,4
0,3
0,2
0,1
0
-5 -3 -1 1 3 5
D
X
Rozkład symetryczny
0,4
0,3
0,2
0,1
0
-6 -4 -2 0 2
D X
X D
Asymetria Asymetria
lewostronna prawostronna
(ujemna) (dodatnia)
Statystyka opisowa JU 40
Miary asymetrii (sko no ci)
" Współczynnik sko no ci
" Współczynnik asymetrii pozycyjny
" Współczynnik asymetrii klasyczny
Współczynnik sko no ci
X - D
S =
S(X )
S "(-1;1), gdy X = D S = 0
Współczynnik asymetrii pozycyjny
Q3/4 - 2M + Q1/4
Ap =
2Q
Ap "(-1;1)
0 - 0,35
- asymetria słaba
0,35 - 0,65
- asymetria umiarkowana
0,65 -1
- asymetria silna
Statystyka opisowa JU 41
Moment rz du r  rednia arytmetyczna r-tej pot gi odchyle
warto ci cechy od liczby a.
z
- a)r ni
"(xi
i=1
N
Gdy a=0  moment zwykły mr
Gdy a=  moment centralny er
X
Pierwszy moment zwykły a=0 i r=1
z
ni
"xi
i=1
m1 = = X
N
Drugi moment centralny a= i r=2
X
z
2
(xi - X ) ni
"
2
i=1
e2 = = S (X )
N
Trzeci moment centralny (moment centralny trzeciego rz du)
z
3
(xi - X ) ni
"
i=1
e3 =
N
Statystyka opisowa JU 42
Współczynnik asymetrii klasyczny
e3
Ak =
S3(X )
Ak "(- 2;2)
(praktycznie)
0 - 0,65
- asymetria słaba
0,65 -1,3
- asymetria umiarkowana
1,3 - 2
- asymetria silna
Przykład
X  wielko ć wynagrodzenia pracowników zakładu A
X = 3185; S(X )= 979,94; D = 2693,75
Q1/4 = 2500; M = 3068,75; Q3/4 = 3907,69; Q = 703,85
3185 - 2693,75
S = = 0,50
979,94
3907,69 - 2Å"3068,75 + 2500
Ap = = 0,19
2Å"703,85
Statystyka opisowa JU 43
3 3
xi
(xi0;xi1> ni
(xi - X ) (xi - X ) ni
(1100; 1600> 5 1350 -6178857875 -30894289375
(1600; 2100> 8 1850 -2379270375 -19034163000
(2100; 2600> 15 2350 -582182875 -8732743125
(2600; 3100> 24 2850 -37595375 -902289000
(3100; 3600> 15 3350 4492125 67381875
(3600; 4100> 13 3850 294079625 3823035125
(4100; 4600> 11 4350 1581167125 17392838375
(4600; 5100> 6 4850 4615754625 27694527750
(5100; 5600> 3 5350 10147842125 30443526375
N= 100
19 857 825 000
19 857 825 000
e3 = =198 578 250
100
S3(X )= 941 019 139,58
Ak = 0,21
Wysoko ć wynagrodzenia pracowników zakładu A
charakteryzuje si słab asymetri prawostronn
Statystyka opisowa JU 44


Wyszukiwarka