Do najczęściej wykorzystywanych miar do opisu zbiorowości statystycznej należą:
Wskaźniki struktury
Wskaźniki natężenia
Miary opisujące tendencję centralną, czyli miary średnie
Miary dyspersji, czyli rozproszenia, zróżnicowania, rozrzutu
Miary asymetrii
Miary koncentracji
Wskaźnik struktury - mówi jaki jest udział wyróżnionej zbiorowości w całej zbiorowości
ni -liczba jednostek charakteryzujących się i-tym wariantem,
wartością cechy.
N-liczba jednostek zbiorowości
Inaczej wskaźnik struktury nazywa się odsetkiem, frakcją, procentem.
Do porównania rozkładu tej samej cechy w dwóch różnych zbiorowościach statystycznych stosuje się wskaźnik podobieństwa struktur.
Im wskaźnik Wp bliższy jest jedności tym bardziej podobne do siebie są rozkłady cech w tych zbiorowościach.
Klasyczne miary średnie: średnia arytmetyczna, harmoniczna, geometryczna i kwadratowa.
Średnia arytmetyczna jest to suma wartości cechy mierzalnej dla wszystkich jednostek statystycznych podzielna przez liczbę.
W przypadku szeregów rozdzielczych z przedziałami klasowymi umownym reprezentantem każdego przedziału jest środek tego przedziału. W związku z tym średnia arytmetyczna może być nieco zniekształcona.
Własności średniej arytmetycznej:
Średnia arytmetyczna jest wypadkową wszystkich wartości badanej cechy w związku z tym
Suma kwadratów odchyleń poszczególnych wartości badanej cechy od średniej arytmetycznej jest najmniejsza. Oznacza to, że średnia arytmetyczna jest najlepszą miarą średnią pod wieloma względami.
Średnia arytmetyczna ma również wady:
Jest bardzo wrażliwa na wartości nietypowe cechy, gdy takie wartości występują w szeregu to średniej arytmetycznej nie należy liczyć.
Przez obserwację nietypową rozumiemy obserwację skrajną, ale występującą w niewielkiej ilości mniej niż 10%.
Średniej arytmetycznej nie liczymy również gdy skrajne przedziały klasowe są otwarte, chyba że można je w sensowny sposób domknąć.
Średnią geometryczną liczymy wtedy gdy w szeregu występują znaczne różnice między obserwacjami.
Często stosuje się postać logarytmiczną.
Własności średniej geometrycznej:
Srednia geometryczna wychodzi równa zero gdy jedna z obserwacji jest równa zero.
Średnia geometryczna może być wartością urojoną gdy choć jedna z obserwacji jest wartością ujemną.
Stosujemy ją gdy wartości wyrażają zmiany stosunkowe.
Średnia harmoniczna - stosujemy ją dla wielkości stosunkowych.
Przykład :
Samochód z miasta A do B jechał z prędkością 50km/h natomiast z miasta B do C 70km/h jeżeli odległość między tymi miastami jest równa średnią prędkość na tej trasie należy liczyć jako średnią harmoniczną i otrzymamy taką samą wartość jak wtedy gdybyśmy przejechaną odległość na całej trasie podzielili przez czas przejazdu na całej trasie.
Średnia kwadratowa
Używana jest rzadko np. stosujemy ją we wzorze na odchylenia standardowe.
Średnie klasyczne charakteryzują się tym, że obliczane są ze wszystkich wartości cechy.
Średnie miary pozycyjne:
Mediana (wartość topologiczna) - to wartość jednostki statystycznej położonej w zbiorowości w ten sposób, że liczba jednostek mających wartość niemniejszą od mediany równa jest liczbie jednostek mających wartość niewiększą od mediany.
Własności mediany:
Nie zależy ona od wartości krańcowych.
Można ją wyznaczyć gdy wszystkie liczebności nie są dokładnie znane, wystarczy znać liczebność zbiorowości i jednostkę środkową.
Medianę można policzyć wtedy gdy nie można obliczyć średniej arytmetycznej. Medianę można policzyć na skali porządkowej (wtedy nie można obliczyć średniej arytmetycznej, harmonicznej, ani geometrycznej)
W szeregu rozdzielczym z przedziałami klasowymi:
Jest to wzór interpolacyjny wyprowadzony przy założeniu, że przedziale mediany cecha zachowuje się w sposób liniowy.
Najprostsza skala nazywa się skalą nominalną, np. ktoś jest protestantem, a ktoś katolikiem (nie wiemy kto jest lepszy).
Następna jest skala porządkowa, czyli jakaś hierarchia, np. wykształcenie wyższe jest lepsze niż średnie, a średnie lepsze niż zawodowe.
Skala interwałowa - możemy na niej liczyć odległości między wartościami, ale nie posiada ona zera bezwzględnego.
Skala ilorazowa - posiada odległości i ma zero bezwzględne.
Następnymi miarami pozycyjnymi są kwartyle:
Kwartyl pierwszy jest równy wartości cechy takiej, że ¼ zbiorowości ma wartości nie przekraczające tej cechy, a ¾ zbiorowości ma wartości niemniejsze od tej cechy.
Kwartyl trzeci analogicznie, tzn. jest to taka wartość cechy, że ¾ zbiorowości ma wartości nie przekraczające tej cechy.
Mediana jest drugim kwartylem.
Dominanta zwana wartością najczęstszą (zwana modą, wartością modalną, typową).
Dominanta jest to ta wartość cechy, która występuje w zbiorowości statystycznej najczęściej.
W szeregu szczegółowym obliczamy ją z definicji, natomiast w szeregu rozdzielczym z przedziałami klasowymi z następującego wzoru:
Wzór ten stosujemy gdy jest jeden przedział dominujący; rozpiętości przedziału dominanty poprzedniego oraz następnego są równe.
Własności dominanty:
Rozkład cechy musi posiadać jedną wyraźnie zaznaczoną wartość dominującą w przeciwnym razie mówimy o szeregach wielo modalnych. Szereg nie może być skrajnie asymetryczny z otwartym przedziałem dominującym (nie można wtedy w ogóle obliczać dominanty).
Miary dyspersji i asymetrii:
Dyspersja - to inaczej rozproszenie, zróżnicowanie, rozrzut, zmienność.
Przykład ilustrujący potrzebę stosowania miar dyspersji:
Rozważmy 2 grupy 10-cio osobowe o następujących wartościach wieku:
16,18,19,19,20,20,21,21,23,23
4,6,8,10,19,20,29,30,40,42
w obydwu grupach średnia wieku jest w przybliżeniu równa 20 lat, lecz obydwie grupy różnią się rozkładem wieku bardzo istotnie.
Miary zróżnicowania służą do tego by ocenić w jakim stopniu poszczególne wartości cechy koncentrują się wokół wartości średniej (jakie jest zróżnicowanie cechy w danej zbiorowości).
Miary dyspersji informują jak duże jest odchylenie pomiędzy poszczególnymi wartościami cechy, a wartością przeciętną.
Klasyczne miary dyspersji to:
odchylenie przeciętne,
wariomcja,
odchylenie standardowe.
Przydatne wzory i ich interpretacja:
ŚREDNIA ARYTMETYCZNA - przeciętnie każde z (jedn. Stat.) ma ......
numer mediany
MEDIANA - połowa (nazwa zbiorow.) ma (cecha stat.) nieprzekraczającą ....., a połowa niemniejszą
KWARTYL PIERWSZY - jedna czwarta (nazwa zbior.) ma (cecha) niewiększą niż….., a ¾ niemniejszą
KWARTYL TRZECI - tak samo jak pierwszy
ODCHYLENIE ĆWIARTKOWE - (cecha) (jednostka) odchyla się średnio od mediany o …, czyli o … tej średniej
DOMINANTA - dominują (jednostki) o (cecha) …
ODCHYLENIE STANDARDOWE - (cecha) (jednostka) odchyla się średnio od średniej arytmetycznej średnio o …, czyli o …tej średniej
WSPÓŁCZYNNIK SKOŚNOŚCI - ile jednostek (większość, mniejszość) ma wartość cechy mniejszą (większą) od średniej arytmetycznej.
ASYMETRIA - jaki rodzaj asymetrii wskazuje >0 - prawostronna ; <0 - lewostronna
1