Miary średnie
Opisowe charakterystyki
rozkładów
Miary średnie (zwane też miarami poziomu wartości
zmiennej, miarami położenia lub przeciętnymi) służą do
określania tej wartości zmiennej opisanej przez rozkład,
wokół której skupiają się wszystkie pozostałe wartości
zmiennej
Miary
rozproszenia
(zmienności,
zróżnicowania,
dyspersji) służące do badania stopnia zróżnicowania
wartości zmiennej
Miary asymetrii (skośności) służące do badania kierunku
zróżnicowania wartości zmiennej
Miary koncentracji służące do badania stopnia
nierównomierności rozkładu ogólnej sumy wartości
zmiennej pomiędzy poszczególne jednostki zbiorowości
lub do analizy stopnia skupienia poszczególnych jednostek
wokół średniej
Miary średnie
•Klasyczne: średnia
arytmetyczna ( ), średnia
harmoniczna, średnia
geometryczna
•Pozycyjne: kwartyl pierwszy
( Q
1
), mediana (kwartyl drugi)
(M
x
, Q
2
), kwartyl trzeci (Q
3
),
dominanta (moda) (D
x
)
x
Definicja:
Średnia arytmetyczna to suma wartości
zmiennej wszystkich jednostek badanej
zbiorowości podzielona przez liczbę tych
jednostek.
Wzór:
n
x
n
x
x
x
x
n
i
i
n
1
2
1
...
gdzie
:
x
- symbol średniej
arytmetycznej
i
x
- warianty cechy
mierzalnej
n
- liczebność badanej
zbiorowości
Jeżeli warianty zmiennej występują z różną
częstotliwością, to oblicza się średnią
arytmetyczną ważoną.
Wzór na obliczanie średniej arytmetycznej z
szeregów rozdzielczych punktowych:
n
n
x
n
n
x
n
x
n
x
x
k
i
i
i
k
k
1
2
2
1
1
...
gdzie n
i
(i=1,2,...k) oznacza liczebność jednostek
odpowiadającą poszczególnym wariantom
zmiennej, a n jest sumą tych liczebności.
Przykład 1. Obliczyć średnią liczbę
napraw badanych komputerów
xi
ni
xi*ni
0
5
0
1
6
6
2
10
20
3
5
15
4
4
16
5
2
10
suma
32
67
n = 32 komputery
X - liczba napraw (cecha
skokowa)
09
,
2
32
67
x
Interpretacja:
Średnia liczba napraw
dla badanych
komputerów wynosi
2,09.
Wzór na obliczanie średniej arytmetycznej z
szeregów rozdzielczych przedziałowych
n
n
x
n
n
x
n
x
n
x
x
k
i
i
i
o
k
k
o
o
o
1
2
2
1
1
...
gdzie
2
1
0
i
i
o
i
x
x
x
środek i-tego
przedziału
Przykład 2. Obliczyć średni koszt
naprawy badanych komputerów
n = 32 komputery
Y - koszt napraw (w zł) (cecha
ciągła)
88
,
246
32
7900
y
Interpretacja: Średni
koszt naprawy badanych
komputerów wynosi 246,88
zł
<Y0i - Y1i)
ni
0-100
9
50
450
100-200
6
150
900
200-300
3
250
750
300-400
7
350
2450
400-500
5
450
2250
500-600
2
550
1100
suma
32
X
7900
o
i
y
i
i
o
n
y
(zł)
Pozycyjne miary położenia
(średnie)
Dominanta (moda)
Mediana (kwartyl drugi)
Kwartyl pierwszy
Kwartyl trzeci
Dominanta (D
x
)
Jest to taka wartość cechy
statystycznej, która występuje
najczęściej.
Wyznaczanie dominanty
dla szeregu rozdzielczo-
punktowego
Szereg rozdzielczo-punktowy dla
przykładu 1:
xi
ni
0
5
1
6
2
10
3
5
4
4
5
2
suma
32
n = 32 komputery
X - liczba napraw (cecha
skokowa)
D
x
=2 Najwięcej komputerów (10) miało
2 naprawy.
Wyznaczanie dominanty
dla szeregu rozdzielczo-
przedziałowego
Szereg rozdzielczo-przedziałowy dla
przykładu 2:
<Y0i - Y1i)
ni
0-100
9
100-200
6
200-300
3
300-400
7
400-500
5
500-600
2
suma
32
n = 32 komputery
Y - koszt naprawy (w zł) (cecha
ciągła)
<0-100) przedział
dominanty
Wzór na dominantę dla
szeregu przedziałowego
D
D
D
D
D
D
D
D
x
h
n
n
n
n
n
n
x
D
1
1
1
0
Gdzie:
x
0D
- początek przedziału dominanty
n
D
- liczebność przedziału dominanty
n
D-1
- liczebność przedziału poprzedzającego
przedział dominanty
n
D+1
- liczebność przedziału następnego po
przedziale dominanty
h
D
- długość przedziału dominanty
Dla przykładu 2
zł
D
x
75
100
6
9
0
9
0
9
0
<Y0i - Y1i)
ni
0-100
9
100-200
6
200-300
3
300-400
7
400-500
5
500-600
2
suma
32
Najwięcej komputerów
charakteryzowało się
kosztem napraw równym
około 75 zł.
Mediana (M
x
)
Dzieli zbiorowość uporządkowaną
na dwie równe części w ten sposób
że: połowa jednostek ma wartości
cechy mniejsze lub równe medianie,
a połowa większe lub równe
medianie.
Wyznaczanie mediany dla szeregu rozdzielczo-
punktowego
xi
ni
nski
0
5
5
1
6
11
2
10
21
3
5
26
4
4
30
5
2
32
suma
32
X
16
2
32
2
n
N
M
-miejsce
mediany
M
x
= 2 Połowa
komputerów miała nie
więcej niż 2 naprawy.
Wyznaczanie mediany dla szeregu rozdzielczo-
przedziałowego
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
16
2
32
2
n
N
M
<200-300) - przedział
mediany
Wzór na medianę dla szeregu przedziałowego
M
M
skM
M
x
n
h
n
n
x
M
1
0
2
Gdzie:
x
0M
- początek przedziału mediany
n
skM-1
- liczebność skumulowana odpowiadająca
przedziałowi poprzedzającemu przedział mediany
h
M
- długość przedziału mediany
n
M
- liczebność przedziału mediany
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
Dla przykładu 2
zł
M
x
33
,
233
3
100
15
16
200
Połowa komputerów charakteryzuje się kosztem
napraw niewiększym niż 233,33 zł.
Kwartyl pierwszy (Q
1
)
Dzieli zbiorowość uporządkowaną
na dwie części w ten sposób że:
25% (1/4) jednostek ma wartości
cechy
mniejsze
lub
równe
kwartylowi pierwszemu, a 75% (3/4)
jednostek ma wartości większe lub
równe kwartylowi pierwszemu.
xi
ni
nski
0
5
5
1
6
11
2
10
21
3
5
26
4
4
30
5
2
32
suma
32
X
Wyznaczanie kwartyla pierwszego dla szeregu
rozdzielczo-punktowego
8
4
32
4
1
n
N
Q
-miejsce Q
1
Q
1
= 1 25% komputerów
miało nie więcej niż 1
naprawę.
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
Wyznaczanie kwartyla
pierwszego dla szeregu
rozdzielczo-przedziałowego
<0-100) - przedział Q
1
8
4
32
4
1
n
N
Q
Wzór na Q
1
dla szeregu przedziałowego
1
1
1
1
1
0
1
4
Q
Q
skQ
Q
n
h
n
n
x
Q
Gdzie:
x
0Q1
- początek przedziału kwartyla pierwszego
n
skQ1-1
- liczebność skumulowana odpowiadająca
przedziałowi poprzedzającemu przedział kwartyla
pierwszego
h
Q1
- długość przedziału kwartyla pierwszego
n
Q1
- liczebność przedziału kwartyla pierwszego
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
Dla przykładu 2
zł
Q
89
,
88
9
100
0
8
0
1
25% komputerów charakteryzuje się
kosztem napraw niewiększym niż
88,89 zł.
Kwartyl trzeci (Q
3
)
Dzieli zbiorowość uporządkowaną
na dwie części w ten sposób że:
75% (3/4) jednostek ma wartości
cechy
mniejsze
lub
równe
kwartylowi trzeciemu, a 25% (1/4)
jednostek ma wartości większe lub
równe kwartylowi trzeciemu.
xi
ni
nski
0
5
5
1
6
11
2
10
21
3
5
26
4
4
30
5
2
32
suma
32
X
Wyznaczanie kwartyla trzeciego dla szeregu
rozdzielczo-punktowego
24
4
32
3
4
3
3
n
N
Q
-miejsce Q
3
Q
3
= 3 75% komputerów
miało nie więcej niż 3
naprawy.
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
Wyznaczanie kwartyla
trzeciego dla szeregu
rozdzielczo-przedziałowego
<300-400) - przedział Q
3
24
4
32
3
4
3
3
n
N
Q
Wzór na Q
3
dla szeregu przedziałowego
3
3
3
3
1
0
3
4
3
Q
Q
skQ
Q
n
h
n
n
x
Q
Gdzie:
x
0Q3
- początek przedziału kwartyla trzeciego
n
skQ3-1
- liczebność skumulowana odpowiadająca
przedziałowi poprzedzającemu przedział kwartyla
trzeciego
h
Q3
- długość przedziału kwartyla trzeciego
n
Q3
- liczebność przedziału kwartyla trzeciego
<Y0i - Y1i)
ni
nski
0-100
9
9
100-200
6
15
200-300
3
18
300-400
7
25
400-500
5
30
500-600
2
32
suma
32
X
Dla przykładu 2
zł
Q
71
,
385
7
100
18
24
300
3
75% komputerów charakteryzuje się
kosztem napraw niewiększym niż
385,71 zł.