PODSTAWOWE MIARY TENDENCJI CENTRALNEJ
Miary klasyczne - stanowią wypadkową wszystkich wartości cechy wszystkich badanych
jednostek zbiorowości.
Średnią arytmetyczną ̅ w rozkładzie empirycznym nazywamy wyrażenie:
dla szeregu szczegółowego:
̅
∑
,
gdzie
,
są indywidualnymi obserwacjami w zbiorze danych, jest liczbą obserwacji
dla szeregu rozdzielczego:
- punktowego:
̅ ∑
∑
gdzie
,
są wyróżnionymi wartościami w rozkładzie, zaś
odpowiednimi
liczebnościami klasowymi.
- przedziałowego:
̅
∑
̇
∑
̇
,
̇ - środek i-tego przedziału klasowego. (metoda przybliżona)
Średniej arytmetycznej nie liczymy gdy
występują wartości nietypowe (skrajne)
przedziały skrajne są otwarte (nieograniczone)
zbiorowość jest niejednorodna.
Np. widownia teatru dla dzieci analizowana jest ze względu na wiek.
Miary pozycyjne
- wyznaczane są typową pozycją niektórych jednostek lub grup jednostek.
Medianą M
e
rozkładu empirycznego (uporządkowanego niemalejąco) nazywamy taką wartość cechy, że co
najmniej połowa jednostek zbiorowości ma wartość cechy nie większą (mniejszą lub równą) od niej i
równocześnie co najmniej połowa jednostek ma wartość cechy nie mniejszą (większą lub równą) od tej
wartości.
szereg szczegółowy lub rozdzielczy punktowy:
=
parzyste
jest
gdy
e,
nieparzyst
jest
gdy
n
x
x
n
x
n
n
n
,
2
,
2
2
2
2
1
szereg rozdzielczy przedziałowy:
i
i
i
sk
e
i
e
n
h
n
pozM
x
M
)
1
(
0
- dolna granica przedziału, w którym znajduje się wartość mediany,
– liczebność skumulowana przedziału poprzedzającego przedział mediany,
- odpowiednio rozpiętość i liczebność przedziału, w którym znajduje się mediana.
Decyle dzielą zbiorowość na 10 części.
Kwartyle dzielą zbiorowość na 4 części.
Q1 - kwartyl pierwszy (kwartyl rzędu ¼ ), dzieli zbiorowość uporządkowaną na dwie części w ten
sposób, że co najmniej 25% jednostek ma wartości cechy niższe lub równe i co najmniej 75% wyższe
lub równe od kwartyla pierwszego;
Q2 - kwartyl drugi (kwartyl rzędu ½, czyli mediana)
Q3 - kwartyl trzeci (kwartyl rzędu ¾), dzieli zbiorowość uporządkowaną na dwie części w ten
sposób, że co najmniej 75% jednostek ma wartości cechy niższe lub równe i co najmniej 25% wyższe
lub równe od kwartyla trzeciego.
i
i
i
sk
i
n
h
n
pozQ
x
Q
)
1
(
1
0
1
i
i
i
sk
i
n
h
n
pozQ
x
Q
)
1
(
3
0
3
- dolna granica przedziału, w którym znajduje się wartość kwartyla,
– liczebność skumulowana przedziału poprzedzającego przedział kwartyla,
- odpowiednio rozpiętość i liczebność przedziału, w którym znajduje się kwartyl.
Dominantą D
o
w rozkładzie empirycznym nazywamy wartość cechy występującą w tym rozkładzie
najczęściej, tzn. wartość, której odpowiada najwyższa liczebność (częstość).
szereg rozdzielczy przedziałowy:
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
h
w
w
w
w
w
x
h
n
n
n
n
n
n
x
D
1
1
1
0
1
1
1
0
0
2
gdzie:
- dolna granica przedziału, w którym występuje dominanta,
- rozpiętość tego przedziału,
- odpowiednio liczebność i częstość przedziału w którym występuje dominanta,
przedziału poprzedniego i następnego.
Dominanty nie należy liczyć gdy:
zbiorowość nie jest jednorodna (czyli górki)
największa liczebność znajduje się w pierwszym lub ostatnim przedziale
rozpiętości przedziałów sąsiadujących z przedziałem dominanty są różne (muszą być 3 równe
rozpiętości)
Jeśli wiele dominant – szereg wielomodalny, mówimy wtedy, że nie ma dominanty
MIARY DYSPERSJI
(rozproszenia, zróżnicowania, rozrzutu, zmienności)
Zadaniem miar dyspersji, zwanych również miarami zmienności jest wskazanie w jakim stopniu
poszczególne wartości jednostek zbiorowości statystycznej koncentrują się wokół wartości centralnej
badanej cechy, opisują rozkład cechy. Informują jak duże są różnice (odchylenia) między poszczególnymi
wartościami jednostek zbiorowości a przeciętną.
Dyspersją nazywamy zróżnicowanie jednostek zbiorowości ze względu na wartość badanej cechy.
Miary te dzielimy na:
klasyczne (wariancja, odchylenie standardowe)
pozycyjne ( rozstęp i odchylenie ćwiartkowe)
Są to miary bezwzględne posiadające jednostkę
Do względnych miar pozycyjnych zaliczamy współczynnik zmienności
Wariancją dla zbioru danych
nazywamy wyrażenie:
szereg szczegółowy:
∑
(
̅)
szereg rozdzielczy punktowy:
∑
̅
szereg rozdzielczy przedziałowy:
∑
̇
̅
gdzie
̇
- środek i-tego przedziału
Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji:
√
- wszystkie wartości cechy są jednakowe, brak zróżnicowania.
Rozstępem jest różnica między największą i najmniejszą wartością cechy w zbiorze.
Rozstęp (przedział) ćwiartkowy to różnica między kwartylem trzecim a pierwszym.
Odchyleniem ćwiartkowym jest połowa rozstępu ćwiartkowego, czyli wielkość
(samo w sobie nic nam nie mówi, ale potrzebne do współczynnika zmienności)
Współczynnik zmienności – gdy należy porównać stopień zróżnicowania dwóch lub więcej rozkładów.
miary klasyczne
̅
(jaki procent średniej stanowi miara rozrzutu)
miary pozycyjne
Współczynniki zmienności informują o sile dyspersji.
Ich duże wartości liczbowe świadczą o niejednorodności zbiorowości.
Im większy procent tym większe względne zróżnicowanie cechy w rozkładzie.
Współczynnik zmienności służy nam do porównywania zróżnicowania zbiorowości według kilku cech, lub
porównywania kilku zbiorowości według jednej cechy.
MIARY ASYMETRII SKOŚNOŚCI
Współczynnik asymetrii
( jeśli bardzo silna asymetria to A może przekroczyć granice przedziału)
̅
̅
̅ 〈 〉
〈 〉
̅
〈 〉
Szereg symetryczny
̅
Szereg niesymetryczny
asymetria prawostronna
̅
ponad połowa zbiorowości ma wartości mniejsze niż ̅
asymetria lewostronna
̅
ponad połowa zbiorowości ma wartości większe niż ̅
Im bliżej krańców przedziału tym bardziej asymetryczne
skrajna asymetria