STATYSTYKA OPISOWA 2 WYKŁAD 28.02. 2009
Opisowe charakterystyki rozkładów
Miary średnie - zwane też miarami poziomu wartości zmiennej, miarami położenia lub przeciętnymi.
Klasyczne - średnia arytmetyczna (x), średnia harmonomiczna, średnia geometryczna
Pozycyjne - kwartyl pierwszy (Q1) , mediana (kwartyl drugi) (Mx, Q2), kwartyl trzeci (Q3), dominanta (moda) (Dx)
Średnia arytmetyczna - to suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzielona przez liczbę tych jednostek.
WZÓR
=
=
Gdzie:
x - symbol średniej arytmetycznej
x1 - kwanty cechy mierzalnej
n- liczebność danej zbiorowości
Jeżeli warianty zmiennej występują z różną częstotliwością to oblicza się średnią ważoną.
Wzór na obliczenie średniej arytmetycznej z szeregów rozdzielczo punktowych:
=
=
Gdzie n1 (;=1,2…k) oznacza liczebność jednostek odpowiadająca poszczególnym wariantom zmiennej, a n jest sumą tych liczebności.
Przykład 1
Obliczyć średnią liczbę napraw badanych komputerów:
n= 32 komputery
x - liczba napraw
liczba napraw |
liczba komputerów |
suma napraw |
liczba skumulowana |
xi |
ni |
xi*ni |
nski |
0 |
5 |
5 |
5 |
1 |
6 |
6 |
11 |
2 |
10 |
20 |
21 |
3 |
5 |
15 |
26 |
4 |
4 |
16 |
30 |
5 |
2 |
10 |
32 |
suma |
32 |
67 |
|
=
=2,09
Interpretacja: Średnia liczba napraw dla badanych komputerów wynosi 2,09.
(Dx) Dominanta - jest to taka wartość cechy statystycznej która występuje najczęściej.
Dx= 2
Najczęściej komputerów miało 2 naprawy
Jeżeli największa liczebność (Ni) występuje więcej niż 1 raz to dominanty nie wyznaczamy.
(Mx) Mediana - dzieli zbiorowość uporządkowaną na 2 różne części w ten sposób że połowa jednostek ma wartość cechy mniejsze lub równe medianie, a połowa większe lub równe medianie.
Nm =
- miejsce mediany
Mx = 2
Połowa komputerów miała nie mniej niż 2 naprawy
Kwartyl pierwszy - dzieli zbiorowość uporządkowaną na 2 części w ten sposób że 25% jednostek ma wartość cechy mniejsze lub równe kwartylowi pierwszemu, a 75% jednostek ma wartości większe lub równe kwartylowi pierwszemu.
Nq1 =
- miejsce Q1
Q1 = 1
25% komputerów miało nie mniej niż 1 naprawę.
Kwartyl trzeci - dzieli zbiorowość uporządkowaną na dwie części w ten sposób że 75% jednostek ma wartości cechy większe lub równe kwartylowi trzeciemu.
NQ3 =
- miejsce Q3
Q3 = 3
X=
Gdzie:
X1=
- środek przedziału
koszt napraw |
liczba komputerów |
|
|
|
Yoi - Y1i |
ni |
x1 |
xi *ni |
nski |
0 - 100 |
9 |
50 |
450 |
9 |
100 - 200 |
6 |
150 |
900 |
15 |
200 - 300 |
3 |
250 |
750 |
18 |
300 - 400 |
7 |
350 |
2450 |
25 |
400 - 500 |
5 |
450 |
2250 |
30 |
500 - 600 |
2 |
550 |
1100 |
32 |
suma |
32 |
X |
7900 |
|
y=
Interpretacja: Średni koszt napraw komputerów wynosi 246,88
Dx = X0D+
Gdzie:
xoD - początek przedziału dominanty
nD - liczebność przedziału dominanty
nD-1 - liczebność przedziału poprzedzającego przedział dominanty
nD+1 - liczebność przedziału następnego po przedziale dominanty
hD - długość przedziału dominanty
Dx= 0+
Najwięcej komputerów charakteryzowało się kosztem napraw równym ok. 75 zlotych.
Nm
WZÓR
Mx= Xom+
nskm-1)
Gdzie:
xoM - początek przedziału mediany
nskM-1 - liczebność skumulowana odpowiadająca przedziałowi poprzedzającemu przedział mediany
hM - długość przedziału mediany
nM - liczebność przedziału mediany
Mx= 200+(16-15)
Połowa komputerów charakteryzuje się kosztem napraw nie większym niż 233,33 złotych.
Wzór na Q1 dla szeregu przedziałowego
Q1 = X0Qx + (
nskQ1)
Gdzie:
XoQ1 - początek przedziały kwartyla pierwszego
nskQ1-1 - liczebność skumulowana odpowiadająca
Interpretacja: 25% komputerów charakteryzuje się kosztem napraw nie większym niż 88,89 zł.
NQ3 =
<300-400) - przedział Q3
Q3 = XoQ3 + (
nskQ3-1)
Interpretacja: 75% komputerów charakteryzuje się kosztem napraw nie większym niż 385,71 zł.