Wykład 2.
Statystyki opisowe dla szeregu statystycznego szczegółowego
Miary tendencji centralnej
Liczby zapamiętanych elementów w teście pamięci
szereg szczegółowy |
szereg szczegółowy |
||||
nieuporządkowany |
uporządkowany |
|
|||
lp_i |
xi |
|
lp_i |
xi |
|
1 |
16 |
|
1 |
x1= |
13 |
2 |
13 |
|
2 |
x2= |
14 |
3 |
14 |
|
3 |
x3= |
16 |
4 |
21 |
|
4 |
x4= |
17 |
5 |
19 |
|
5 |
x5= |
18 |
6 |
18 |
|
6 |
x6= |
19 |
7 |
26 |
|
7 |
x7= |
21 |
8 |
17 |
|
8 |
x8= |
26 |
suma |
144 |
|
|
|
|
Średnia arytmetyczna
=144/8=18,143
Dominanta, mediana, kwartyle - to przeciętne pozycyjne
Dominanta - wartość najczęściej występująca
Mediana (wartość środkowa) - wyznaczana z szeregu uporządkowanego
n - parzysta liczba obserwacji |
n nieparzyste |
W bieżącym przykładzie:
n=8, szereg jest parzysty
Kwartyle - oznaczane przez Q1, Q2=Me, Q3 dzielą populację na cztery równe części.
,
,
W bieżącym przykładzie
=
=(14 +16)/2=15, wartość Q1=15 stanowi górną granicę wyników niskich, dokładnie ¼ osób ma wyniki takie same lub niższe
wartość Q3=20 stanowi górną granicę wyników wysokich, dokładnie ¼ osób ma wyniki takie same lub wyższe
Wykład 3.
Miary rozproszenia dla cech ciągłych i porządkowych
Rozstęp zwykły
xmax-xmin= 26 - 13 = 13
Rozstęp kwartylowy
Q3 - Q1= 20 - 15 = 5
Odchylenie ćwiartkowe
,
Zalety rozstępu kwartylowego i odchylenia ćwiartkowego
- łatwy do obliczeń
- dobrze charakteryzuje zmienność w środkowej połowie wyników obserwacji
Wady rozstępu kwartylowego i odchylenia ćwiartkowego
- charakteryzują tylko zmienność w środkowej połowie wyników obserwacji
- nie uwzględniają zmienności na krańcach rozkładu
- nie wykorzystują całej informacji z próbki, nie są oparte na wszystkich pomiarach
- oparte są maksymalnie na czterech pomiarach
- jako miary względne nie umożliwiają porównania zróżnicowania zmiennych mierzonych na skalach różnej długości
- miara mało stabilna przy porównaniach prób różnej wielkości
Współczynnik zmienności względem mediany
,
Zalety współczynnika zmienności względem mediany
- dobrze charakteryzuje zmienność względem mediany w środkowej połowie przypadków
- umożliwia porównania zróżnicowania zmiennych mierzonych na skalach różnej długości
- miara łatwa w obliczeniach
Wady współczynnika zmienności względem mediany
- charakteryzuje tylko zmienność w środkowej połowie wyników obserwacji
- nie uwzględnia zmienności na krańcach rozkładu
- nie wykorzystuje całej informacji z próbki, nie jest oparty na wszystkich pomiarach
- oparty jest maksymalnie na czterech pomiarach
- miara mało stabilna przy porównaniach prób różnej wielkości, ale bardziej niż odchylenie ćwiartkowe czy rozstęp kwartylowy
Kwartylowy współczynnik zmienności
Zalety kwartylowego współczynnika zmienności
- dobrze charakteryzuje zmienność w środkowej połowie przypadków
- umożliwia porównania zróżnicowania zmiennych mierzonych na skalach różnej długości
Wady kwartylowego współczynnika zmienności
- charakteryzuje tylko zmienność w środkowej połowie wyników obserwacji
- nie uwzględnia zmienności na krańcach rozkładu
- nie wykorzystuje całej informacji z próbki, nie jest oparty na wszystkich pomiarach
- oparty jest maksymalnie na czterech pomiarach
Typowy przedział zmienności (zakres wyników przecietnych) obliczany na podstawie mediany i odchylenia ćwiartkowego
(Me - Q, Me + Q)=(17,5-2,5; 17,5+2,5)=(15, 20)
Wykład 4
Miary rozporoszenia dla cech ciągłych
Wariancja
Wariancja dla dużej próbki (n ≥30)
Wariancja dla małej próbki (n < 30)
Odchylenie standardowe
,
Odchylenie przeciętne
,
Współczynnik zmienności:
,
Typowy obszar zmienności cechy:
Asymetria:
Technika obliczeń wariancji i odchylenia standardowego
Lp, i |
xi |
xi |
- |
|
|
1,00 |
16,00 |
16-18,143 |
= |
-2,14 |
4,59 |
2,00 |
13,00 |
13-18,143 |
= |
-5,14 |
26,45 |
3,00 |
14,00 |
14-18,143 |
= |
-4,14 |
17,16 |
4,00 |
21,00 |
21-18,143 |
= |
2,86 |
8,16 |
5,00 |
19,00 |
19-18,143 |
= |
0,86 |
0,73 |
6,00 |
18,00 |
18-18,143 |
= |
-0,14 |
0,02 |
7,00 |
26,00 |
26-18,143 |
= |
7,86 |
61,73 |
8,00 |
17,00 |
17-18,143 |
= |
-1,14 |
1,31 |
suma |
144,00 |
|
|
|
120,16 |
Średnia arytmetyczna
=144/8=18,143
Wariancja dla dużej próbki (n ≥30) lub populacji generalnej
Wariancja dla małej próbki (n < 30)
Odchylenie standardowe
,
Współczynnik zmienności:
,
Typowy obszar zmienności cechy (wyniki przeciętne):
=(18,14 - 4,14; 18,14 + 4,14)=(14,0; 22,28)
Zalety odchylenia standardowego
- miara zmienności oparta na wszystkich pomiarach badanej populacji
- uwzględnia krańce rozkładu
- łatwo interpretowalna jako przeciętna odległość, której można się spodziewać stosunku do średniej, czy też jako przeciętne odchylenie od średniej
- miara stabilna przy porównaniach prób różnej wielkości
Wady odchylenia standardowego
- może zbytnio „uśredniać” rozproszenie przy małej niesymetrycznej populacji, w której dominują wyniki wysokie lub niskie
- może zbytnio „uśredniać” rozproszenie przy małej niesymetrycznej populacji, w której występuje bardzo duża różnica między wynikami skrajnymi
Prezentacja graficzna rozkładu cechy
Histogram liczebności
szereg szczegółowy |
|
|
|
||||
uporządkowany |
|
|
szereg |
|
|||
lp_i |
xi |
|
|
rozdzielczy |
|||
1 |
x1= |
13 |
|
k |
liczebność ni |
||
2 |
x2= |
14 |
|
13-16,25 |
n1 =3 |
||
3 |
x3= |
16 |
|
16,25-19,5 |
n2 =3 |
||
4 |
x4= |
17 |
|
19,5-22,75 |
n3 =1 |
||
5 |
x5= |
18 |
|
22,75-26 |
n4 =1 |
||
6 |
x6= |
19 |
|
|
|
||
7 |
x7= |
21 |
|
|
|
||
8 |
x8= |
26 |
|
|
|