Analiza wyników badania statystycznego opis statystyczny Miary statystyczne jednej cechy (charakterystyki opisowe; parametry statystyczne) ¾ Miary poziomu warto ci (miary polo enia; miary tendencji centralnej) ¾ Miary dyspersji (miary zmienno ci; rozproszenia; zró nicowania) ¾ Miary sko no ci (miary asymetrii) ¾ Miary spÅ‚aszczenia (miary kurtozy) Podzial ze wzgl du na zakres danych niezb dnych do wyliczenia miar: ¾ Miary klasyczne (wykorzystywane s warto ci cechy zaobserwowane u wszystkich jednostek) ¾ Miary pozycyjne (wykorzystywane s warto ci cechy tylko niektórych jednostek) Statystyka opisowa JU 12 Miary poziomu warto ci Miary poziomu klasyczne " rednia arytmetyczna " rednia geometryczna " rednia harmoniczna X rednia arytmetyczna N "xi i=1 X = Szereg prosty N z z ni ni z "xi "xi i=1 i=1 X = = = ni' "xi z N i=1 Szereg punktowy "ni i=1 z z ni ni z "xi "xi i=1 i=1 X = = = ni' "xi z N i=1 Szereg przedziaÅ‚owy "ni i=1 N liczebno ć ogólna; ni liczebno ć i-tego przedzialu; i=1, 2,& , z n' cz sto ć wzgl dna i-tego przedzialu; i xi rodek i-tego przedzialu Statystyka opisowa JU 13 PrzykÅ‚ady Szereg prosty Liczba przepracowanych godzin nadliczbowych pracowników dwóch dzialów pewnego zakladu Dzial U 2 5 5 7 7 8 9 9 9 Dzial P 3 3 4 5 6 6 7 7 Dzial U (N=9) Dzial P (N=8) N N "xi "xi 61 41 i=1 i=1 X = = = 6,78 X = = = 5,125 N 9 N 8 Szereg rozdzielczy punktowy liczba miejsc Liczba xi ni noclegowych xi miejscowo ci ni 20 3 60 22 4 88 26 6 156 28 5 140 30 2 60 Razem N=20 504 z ni "xi 504 i=1 X = = = 25,2 z 20 "ni i=1 Statystyka opisowa JU 14 Szereg rozdzielczy przedziaÅ‚owy Zaklad A (xi0;xi1> ni ni' xi xini (1100; 1600> 5 0,05 1350 6750 (1600; 2100> 8 0,08 1850 14800 (2100; 2600> 15 0,15 2350 35250 (2600; 3100> 24 0,24 2850 68400 (3100; 3600> 15 0,15 3350 50250 (3600; 4100> 13 0,13 3850 50050 (4100; 4600> 11 0,11 4350 47850 (4600; 5100> 6 0,06 4850 29100 (5100; 5600> 3 0,03 5350 16050 N= 100 1 318500 z ni "xi 318500 i=1 X = = = 3185 z 100 "ni i=1 Przeci tna placa pracowników zakladu A wynosi 3185 zl. Statystyka opisowa JU 15 WÅ‚asno ci redniej arytmetycznej xmin < X < xmax 1. 2. suma odchyle warto ci cechy od redniej jest równa zeru (xi - X )= 0 " 3. rednia arytmetyczna sumy jest równa sumie rednich arytmetycznych X +Y = X +Y 4. je eli ka d z warto ci cechy powi kszymy (pomniejszymy) o pewn stal c, to rednia arytmetyczna zwi kszy si (zmniejszy) o t stal Ä… c) = X Ä… c "(xi 5. przeskalowanie warto ci cechy - je eli ka d z warto ci cechy zwi kszymy (zmniejszymy) c razy, to rednia arytmetyczna zwi kszy si (zmniejszy) c razy xi Å"c X "xi " c = X Å"c , = N N c 6. przeskalowanie liczebno ci w szeregach punktowych i przedziaÅ‚owych - je eli ka d z liczebno ci klas zwi kszymy (zmniejszymy) c razy, to rednia arytmetyczna nie ulegnie zmianie ni (c Å" ni ) "xi "xi c = X , = X ni "(c Å" ni ) " c Statystyka opisowa JU 16 Miary poziomu pozycyjne " Dominanta (moda; warto ć modalna) " Mediana (warto ć rodkowa) i Kwantyle - Kwartyle - Decyle - Centyle (percentyle) Dominanta (moda) D najcz ciej wyst puj ca warto ć (wariant) cechy; jest to warto ć cechy, wokól której skupia si najwi cej jednostek statystycznych Wyznaczanie dominanty Szereg rozdzielczy punktowy D = xd gdy nd = max liczba miejsc Liczba miejscowo ci noclegowych xi 20 3 22 4 26 ( Dominanta 6(najwi ksza liczebno ć 28 5 30 2 Statystyka opisowa JU 17 Szereg rozdzielczy przedziaÅ‚owy Szacowanie dominanty nd - nd -1 D H" xd 0 + hd (nd - nd -1)+ (nd - nd +1) gdzie xd 0 - dolna granica przedzialu dominanty hd - rozpi to ć przedzialu dominanty nd - liczebno ć przedzialu dominanty nd -1 - liczebno ć przedzialu poprzedzaj cego przedzial dominanty nd +1 - liczebno ć przedzialu nast puj cego po przedziale dominanty przykÅ‚ad Zaklad A (xi0;xi1> ni (1100; 1600> 5 (1600; 2100> 8 (2100; 2600> 15 (2600; 3100> (przedzial dominanty 24 (3100; 3600> 15 (3600; 4100> 13 (4100; 4600> 11 (4600; 5100> 6 (5100; 5600> 3 24 -15 D H" 2600 + 500 = 2793,75 (24 -15)+ (24 +15) Statystyka opisowa JU 18 graficzne szacowanie dominanty D
Rozklad (cechy w populacji) jest jednomodalny (monomodalny) gdy wyst puje jedna dominanta, a wielomodalny (polimodalny) gdy wyst puje wi cej ni jedna dominanta.
Statystyka opisowa JU 19 Mediana (warto ć rodkowa) M jest warto ci cechy, która dzieli zbiorowo ć na dwie liczebnie równe cz ci: do jednej z nich nale jednostki statyst. o warto ciach cechy mniejszych lub równych medianie, do drugiej jednostki o warto ciach cechy wi kszych lub równych medianie. Mediana jest warto ci cechy, jak przyjmuje jednostka zajmuj ca pozycj rodkow w uporz dkowanym ci gu warto ci. Wyznaczanie mediany Szereg prosty Liczebno ć N nieparzysta Liczebno ć N parzysta M = x(N +1) 2 xN 2 + x(N +2) 2 M = 2 gdzie: gdzie: (N +1) 2 N 2 (N + 2) 2 - numer jednostki i - numery rodkowej dwóch jednostek rodkowych przykÅ‚ad Liczba przepracowanych godzin nadliczbowych pracowników dwóch dzialów pewnego zakladu Dzial U 2 5 5 7 7 8 9 9 9 Dzial P 3 3 4 5 6 6 7 7 Dzial U (N=9) Dzial P (N=8) M = x(N +1) 2 = 7 xN 2 + x(N +2) 2 M = = 5,5 2 gdzie: gdzie: (N +1) 2 = (9 +1) 2 = 5 N 2 = 8 2 = 4 (N + 2) 2 = (8 + 2) 2 = 5 Statystyka opisowa JU 20 Szereg rozdzielczy punktowy przykÅ‚ad liczba miejsc Liczba Skumulowana liczba noclegowych xi miejscowo ci miejscowo ci 20 3 3 22 4 7 26 6 13 28 5 18 30 2 20 Razem N=20 liczba miejsc Liczba Skumulowana liczba noclegowych xi miejscowo ci miejscowo ci 20 3 3 22 4 7 26 ( Mediana 6 13(miejscowo ci o numerach od 8 do 13 28 5 18 30 2 20 N 2 = 20 2 = 10 (N + 2) 2 = (20 + 2) 2 = 11 ; xN 2 + x(N +2) 2 x10 + x11 26 + 26 M = = = = 26 2 2 2 Polowa badanych miejscowo ci dysponuje co najwy ej 26 miejscami noclegowymi, natomiast druga polowa miejscowo ci co najmniej 26 miejscami noclegowymi. Statystyka opisowa JU 21 Szereg rozdzielczy przedziaÅ‚owy Szacowanie mediany m-1 ëÅ‚ öÅ‚ N +1 hm ìÅ‚ M H" xm0 + - i "n ÷Å‚ nm ìÅ‚ ÷Å‚ 2 i=1 íÅ‚ Å‚Å‚ gdzie xm0 - dolna granica przedzialu mediany m-1 "ni - suma liczebno ci przedzialów poprzedzaj cych i=1 przedzial mediany hm - rozpi to ć przedzialu mediany nm - liczebno ć przedzialu mediany N 2 = 50 (N + 2) 2 = 51 przykÅ‚ad Zaklad A (N=100) i skumulowane (xi0;xi1> ni ni (1100; 1600> 5 5 (1600; 2100> 8 13 (2100; 2600> 15 28 (2600; 3100> (przedzial mediany 24 52 (3100; 3600> 15 67 (3600; 4100> 13 80 (4100; 4600> 11 91 (4600; 5100> 6 97 (5100; 5600> 3 100 100 +1 500 ëÅ‚ M H" 2600 + - 28öÅ‚ = 3068,75 ìÅ‚ ÷Å‚ 2 24 íÅ‚ Å‚Å‚ Statystyka opisowa JU 22 graficzne szacowanie mediany
M
Kwantyle Qj/v (przeci tne pozycyjne wy szych rz dów) uzyskujemy dziel c zbiorowo ć na wi cej ni dwie równe liczebnie cz ci: - na cztery cz ci - kwartyle Qj/4 (trzy kwartyle Q1/4; Q2/4; Q3/4) - na dziesi ć cz ci - decyle Qj/10 - na sto cz ci - centyle (percentyle) Qj/100 gdzie j oznacza numer kwantyla i j=1, 2, & , v-1; v- liczba cz ci Wyznaczanie kwantyli Q = xjÅ"N v j / v Szereg prosty Q = xk , j / v Szereg rozdzielczy punktowy gdzie k przedzial j-tego kwantyla Statystyka opisowa JU 23 Szereg rozdzielczy przedziaÅ‚owy k -1 ëÅ‚ öÅ‚ N hk ìÅ‚ Q H" xk0 + j Å" - j / v "n ÷Å‚ nk i ìÅ‚ ÷Å‚ v i=1 íÅ‚ Å‚Å‚ gdzie xk 0 - dolna granica przedzialu zawieraj cego j-ty kwantyl k -1 "ni - suma liczebno ci przedzialów poprzedzaj cych i=1 przedzial j-tego kwantyla hk - rozpi to ć przedzialu j-tego kwantyla nk - liczebno ć przedzialu j-tego kwantyla Uwaga: Wyznaczanie kwantyli ma sens przy du ych liczebno ciach badanych zbiorowo ci (zwlaszcza decyli i centyli). Statystyka opisowa JU 24 przykÅ‚ad Zaklad A (N=100) (xi0;xi1> ni skumulowane ni (1100; 1600> 5 5 (1600; 2100> 8 13 (2100; 2600> (przedzial Q1/4 15 28 (od 14 do 28) (2600; 3100> (przedzial Q2/4 24 52 (od 29 do 52) (3100; 3600> 15 67 (3600; 4100> (przedzial Q3/4 13 80 (od 68 do 91) (4100; 4600> 11 91 (4600; 5100> 6 97 (5100; 5600> 3 100 Kwartyl 1 Q1/4 (j=1; v=4); jÅ"N v = 1 Å"100 / 4 = 25 100 500 ëÅ‚1Å" Q1/ 4 H" 2100 + -13öÅ‚ = 2500 ìÅ‚ ÷Å‚ 4 15 íÅ‚ Å‚Å‚ Kwartyl 3 Q3/4 (j=3; v=4) jÅ"N v = 3 Å"100 / 4 = 75 100 500 ëÅ‚3Å" Q3/ 4 H" 3600 + - 67öÅ‚ = 3907,69 ìÅ‚ ÷Å‚ 4 13 íÅ‚ Å‚Å‚ Kwartyl 2 Q2/4 (j=2; v=4) jÅ"N v = 2 Å"100 / 4 = 50 2Å"100 500 ëÅ‚ Q2/ 4 H" 2600 + - 28öÅ‚ = 3068,75 = M ìÅ‚ ÷Å‚ 4 24 íÅ‚ Å‚Å‚ Statystyka opisowa JU 25 graficzne szacowanie kwartyli
M=Q2/4 Q1/4 =M Q3/4
Interpretacja Q1/ 4 H" 2500 Q2/ 4 = M H" 3068,75 Q3/ 4 H" 3907,69 ; ; 25% pracowników zakladu A najni ej zarabiaj cych otrzymuje plac nie przekraczaj c 2500 zl, natomiast 25% pracowników najlepiej zarabiaj cych uzyskuje plac wynosz c co najmniej 3908 zl. Polowa pracowników zarabia co najwy ej 3069 zl. Statystyka opisowa JU 26 Miary rozproszenia (miary zmienno ci; dyspersji; zró nicowania) Miary rozproszenia klasyczne " Wariancja " Odchylenie standardowe " Odchylenie przeci tne Miary rozproszenia pozycyjne " Rozst p " Odchylenie ćwiartkowe II podziaÅ‚ miar rozproszenia ¾ Miary absolutne (bezwzgl dne) posiadaj miano badanej cechy; " wszystkie miary w/w ¾ Miary stosunkowe (wzgl dne) nie posiadaj miana; " Współczynnik zmienno ci klasyczny " Współczynnik zmienno ci pozycyjny Statystyka opisowa JU 29 2 S (X ) Wariancja - rednia arytmetyczna kwadratów odchyle warto ci cechy od jej redniej arytmetycznej Szereg prosty N 2 (xi - X ) " var X 2 i=1 S (X )= = N N PrzykÅ‚ad X - liczba przepracowanych godzin nadliczbowych pracowników pewnego zakÅ‚adu DziaÅ‚ U 2 5 5 7 7 8 9 9 9 DziaÅ‚ P 3 3 4 5 6 6 7 7 X = 6,78 DziaÅ‚ U (2 - 6,78)2 + (5 - 6,78)2 + + (9 - 6,78)2 = 2 S (X )= 9 = 5,06 X = 5,125 DziaÅ‚ P (3 - 5,125)2 + (3 - 5,125)2 + + (7 - 5,125)2 = 2 S (X )= 8 = 2,36 Statystyka opisowa JU 30 Szereg rozdzielczy punktowy z 2 (xi - X ) ni " 2 i=1 S (X )= z "ni i=1 PrzykÅ‚ad X - liczba miejsc noclegowych X = 25,2 liczba miejsc Liczba 2 2 (xi - X ) (xi - X ) ni noclegowych miejscowo ci xi ni 20 3 27,04 81,12 22 4 10,24 40,96 26 6 0,64 3,84 28 5 7,84 39,2 30 2 23,04 46,08 Razem N=20 211,2 211,2 2 S (X )= =10,56 20 Statystyka opisowa JU 31 Szereg rozdzielczy przedziaÅ‚owy z 2 (xi - X ) ni " 2 i=1 S (X )= z i "n i=1 PrzykÅ‚ad X wielko ć wynagrodzenia pracowników zakÅ‚adu A X = 3185 xi - X 2 - X 2 ni (xi0;xi1> ni (xi ) (xi ) (1100; 1600> 5 1350 3367225 16836125 (1600; 2100> 8 1850 1782225 14257800 (2100; 2600> 15 2350 697225 10458375 (2600; 3100> 24 2850 112225 2693400 (3100; 3600> 15 3350 27225 408375 (3600; 4100> 13 3850 442225 5748925 (4100; 4600> 11 4350 1357225 14929475 (4600; 5100> 6 4850 2772225 16633350 (5100; 5600> 3 5350 4687225 14061675 N= 100 96 027 500 96 027 500 2 S (X )= = 960 275 100 Statystyka opisowa JU 32 Najwa niejsze wÅ‚asno ci wariancji 2 S (X )e" 0 1. 2. wariancja jest ró nic mi dzy redni arytmetyczn kwadratów warto ci cechy a kwadratem redniej arytmetycznej 2 2 2 S (X ) = X - X Szereg rozdzielczy przedziaÅ‚owy z 2 i "x ni 2 2 i=1 S (X )= - X z "ni i=1 Statystyka opisowa JU 33 S(X ) Odchylenie standardowe - przeci tne odchylenie (zró nicowanie) warto ci cechy od jej redniej arytmetycznej 2 S(X )= S (X ) PrzykÅ‚ady Szereg prosty DziaÅ‚ U DziaÅ‚ P S(X )= 5,06 = 2,25 S(X )= 2,36 = 1,54 Przeci tne zró nicowanie liczby godzin nadliczbowych przepracowanych przez pracowników wzgl dem redniej liczby godzin nadliczbowych wynosi w dziale U 2,25 godz., a w dziale P 1,54 godz. Szereg rozdzielczy punktowy S(X ) = 10,56 = 3,25 X - liczba miejsc noclegowych Przeci tne odchylenie liczby oferowanych miejsc noclegowych w badanych miejscowo ciach od redniej liczby miejsc noclegowych jest równe 3,25. Szereg rozdzielczy przedziaÅ‚owy X wielko ć wynagrodzenia pracowników zakÅ‚adu A S(X ) = 960 275 = 979,94 Statystyka opisowa JU 34 d(X ) Odchylenie przeci tne - rednia arytmetyczna modułów odchyle warto ci cechy od jej redniej arytmetycznej Szereg prosty N xi - X " i=1 d(X )= N PrzykÅ‚ad X - liczba przepracowanych godzin nadliczbowych pracowników pewnego zakÅ‚adu DziaÅ‚ U 2 5 5 7 7 8 9 9 9 DziaÅ‚ P 3 3 4 5 6 6 7 7 X = 6,78 DziaÅ‚ U 2 - 6,78 + 5 - 6,78 + + 9 - 6,78 d(X )= =1,85 9 X = 5,125 DziaÅ‚ P 3 - 5,125 + 3 - 5,125 + + 7 - 5,125 d(X )= =1,38 8 Statystyka opisowa JU 35 Szereg rozdzielczy punktowy z xi - X ni " i=1 d(X )= z "ni i=1 Szereg rozdzielczy przedziaÅ‚owy z xi - X ni " i=1 d(X )= z "ni i=1 Statystyka opisowa JU 36 Miary pozycyjne rozproszenia Rozst p L ró nica mi dzy skrajnymi warto ciami cechy; okre la empiryczny obszar zmienno ci badanej cechy L = xmax - xmin Odchylenie ćwiartkowe Q okre la przeci tne odchylenie 50% rodkowych jednostek zbiorowo ci Q3 / 4 - Q1/ 4 Q = 2 PrzykÅ‚ad X wielko ć wynagrodzenia pracowników zakÅ‚adu A Q1/ 4 H" 2500 Q3/ 4 H" 3907,69 ; 3907,69 - 2500 Q = = 703,85 2 Przeci tne odchylenie najbardziej typowych pÅ‚ac pracowników zakÅ‚adu A od warto ci rodkowej wynosi 703,85. Statystyka opisowa JU 37 Typowy obszar zmienno ci przedziaÅ‚ warto ci cechy najbardziej typowych dla badanej zbiorowo ci Typowy obszar zmienno ci klasyczny (X - S(X ); X + S(X )) Typowy obszar zmienno ci pozycyjny (M - Q;M + Q) PrzykÅ‚ad X wielko ć wynagrodzenia pracowników zakÅ‚adu A Typowy obszar zmienno ci klasyczny X = 3185; S(X )= 979,94 (2205;4165) Typowy obszar zmienno ci pozycyjny M = 3068,75; Q = 703,85 (2365;3773) Typowe wynagrodzenie pracowników etatowych zakÅ‚adu A mie ci si w przedziale (2205; 4165). W ród 50% rodkowych warto ci wynagrodzenia pracowników zakÅ‚adu A za typowe nale y uznać wynagrodzenie z przedziaÅ‚u (2365; 3773). Statystyka opisowa JU 38 Miary stosunkowe (wzgl dne) VXk okre la stopie Współczynnik zmienno ci klasyczny zró nicowania jednostek statyst. w caÅ‚ej zbiorowo ci S(X )100% VXk = X VXp okre la stopie Współczynnik zmienno ci pozycyjny zró nicowania jednostek w rodkowej cz ci rozkÅ‚adu Q VXp = 100% M VX < 30% - zró nicowanie sÅ‚abe 30% < VX < 60% - zró nicowanie wyra ne VX > 60% - zró nicowanie silne PrzykÅ‚ad X wielko ć wynagrodzenia pracowników zakÅ‚adu A 979,94 VXk = 100% = 30,77% 3185 703,85 VXp = 100% = 22,94% 3068,75 Statystyka opisowa JU 39 Asymetria (sko no ć) rozkÅ‚adu 0,4 0,3 0,2 0,1 0 -5 -3 -1 1 3 5 D X RozkÅ‚ad symetryczny 0,4 0,3 0,2 0,1 0 -6 -4 -2 0 2 D X X D Asymetria Asymetria lewostronna prawostronna (ujemna) (dodatnia) Statystyka opisowa JU 40 Miary asymetrii (sko no ci) " Współczynnik sko no ci " Współczynnik asymetrii pozycyjny " Współczynnik asymetrii klasyczny Współczynnik sko no ci X - D S = S(X ) S "(-1;1), gdy X = D S = 0 Współczynnik asymetrii pozycyjny Q3/4 - 2M + Q1/4 Ap = 2Q Ap "(-1;1) 0 - 0,35 - asymetria sÅ‚aba 0,35 - 0,65 - asymetria umiarkowana 0,65 -1 - asymetria silna Statystyka opisowa JU 41 Moment rz du r rednia arytmetyczna r-tej pot gi odchyle warto ci cechy od liczby a. z - a)r ni "(xi i=1 N Gdy a=0 moment zwykÅ‚y mr Gdy a= moment centralny er X Pierwszy moment zwykÅ‚y a=0 i r=1 z ni "xi i=1 m1 = = X N Drugi moment centralny a= i r=2 X z 2 (xi - X ) ni " 2 i=1 e2 = = S (X ) N Trzeci moment centralny (moment centralny trzeciego rz du) z 3 (xi - X ) ni " i=1 e3 = N Statystyka opisowa JU 42 Współczynnik asymetrii klasyczny e3 Ak = S3(X ) Ak "(- 2;2) (praktycznie) 0 - 0,65 - asymetria sÅ‚aba 0,65 -1,3 - asymetria umiarkowana 1,3 - 2 - asymetria silna PrzykÅ‚ad X wielko ć wynagrodzenia pracowników zakÅ‚adu A X = 3185; S(X )= 979,94; D = 2693,75 Q1/4 = 2500; M = 3068,75; Q3/4 = 3907,69; Q = 703,85 3185 - 2693,75 S = = 0,50 979,94 3907,69 - 2Å"3068,75 + 2500 Ap = = 0,19 2Å"703,85 Statystyka opisowa JU 43 3 3 xi (xi0;xi1> ni (xi - X ) (xi - X ) ni (1100; 1600> 5 1350 -6178857875 -30894289375 (1600; 2100> 8 1850 -2379270375 -19034163000 (2100; 2600> 15 2350 -582182875 -8732743125 (2600; 3100> 24 2850 -37595375 -902289000 (3100; 3600> 15 3350 4492125 67381875 (3600; 4100> 13 3850 294079625 3823035125 (4100; 4600> 11 4350 1581167125 17392838375 (4600; 5100> 6 4850 4615754625 27694527750 (5100; 5600> 3 5350 10147842125 30443526375 N= 100 19 857 825 000 19 857 825 000 e3 = =198 578 250 100 S3(X )= 941 019 139,58 Ak = 0,21 Wysoko ć wynagrodzenia pracowników zakÅ‚adu A charakteryzuje si sÅ‚ab asymetri prawostronn Statystyka opisowa JU 44