Parametry statystyczne
Parametry statystyczne - są to wielkości liczbowe, które służą do opisu struktury zbiorowości statystycznej w sposób systematyczny |
Miary położenia |
Miary pozycyjne |
modalna kwantyle:
|
Miary przeciętne charakteryzują średni lub typowy poziom wartości cechy, wokół których skupiają się wszystkie pozostałe wartości analizowanej cechy |
średnia arytmetyczna średnia harmoniczna średnia geometryczna modalna |
Średnia arytmetyczna
Średnią arytmetyczną - definiuje się jako sumę wartości cechy mierzalnej podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej. |
szereg szczegółowy |
|
gdzie: n - liczebność zbiorowości próbnej (próby), xi - wariant cechy. Jest to tzn. średnia nieważna (prosta) - stosowana dla szeregów szczegółowych.
Średnia arytmetyczna ważona
szereg rozdzielczy punktowy |
|
szereg rozdzielczy z przedziałami klasowymi |
|
gdzie:
oznacza środek przedziału klasowego
Średnia arytmetyczna (średnia ważona) dla r-grup łącznie oraz średnich arytmetycznych cząstkowych
i liczebności i-tej grupie ni:
|
gdzie
jest sumą liczebności we wszystkich r-grupach.
Podstawiając w miejsce ni wskaźnik struktury wi otrzymamy zależności:
|
|
Wybrane właściwości średniej arytmetycznej
suma wartości cechy jest równa iloczynowi średniej arytmetycznej i liczebności zbiorowości:
lub dla szeregu rozdzielczego
,
średnia arytmetyczna spełnia warunek:
,
suma odchyleń poszczególnych wartości cechy od średniej równa się zero:
lub
,
Suma kwadratów odchyleń poszczególnych wartości cechy od średniej jest minimalna:
lub
,
średnią arytmetyczną można liczyć w zasadzie dla szeregów o zamkniętych przedziałach klasowych; jeżeli liczebność w otwartym przedziale klasowym stanowi niewielki odsetek, (praktycznie do 5%) możliwe jest domknięcie przedziałów klasowych oraz obliczenie średniej w innym przypadku do określenia zjawiska stosuje się parametry pozycyjne,
średnia arytmetyczna jest wrażliwa na skrajne wartości cechy,
średnia arytmetyczna z próby jest dobrym przybliżeniem wartości przeciętnej.
Średnia harmoniczna
Średnią harmoniczną - stosuje się wtedy, gdy wartości cechy są podane w przeliczeniu na stałą jednostkę innej zmiennej, czyli w postaci wskaźników natężenia, wagi natomiast w jednostkach liczników tych cech, np. prędkość pojazdu w km/h. |
szereg szczegółowy |
|
szereg rozdzielczy |
|
Przyjmując, że waga
oraz
:
|
Średnia geometryczna
Średnią geometryczną - stosuje się w badaniach średniego tempa zmian zjawisk, a więc gdy zjawiska są ujmowane dynamicznie. |
|
Modalna
Modalna Mo (dominanta D, moda, wartość najczęstsza - jest to wartość cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej |
Dla szeregów szczegółowych oraz szeregów rozdzielczych punktowych modalna odpowiada wartości cechy o największej liczebności (częstości).
W szeregach rozdzielczych z przedziałami klasowymi bezpośrednio można określić tylko przedział, w którym modalna występuje, jej przybliżoną wartość wyznacza się graficznie z histogramu liczebności (częstości) lub ze wzoru interpolacyjnego:
|
gdzie:
m - numer przedziału (klasy), w którym występuje modalna,
- dolna granica przedziału, w którym występuje modalna,
nm - liczebność przedziału modalnej, tzn. klasy o numerze m,
nm-1; nm+1 - liczebność klas poprzedzającej i następnej, o numerach m - 1 i m + 1,
hm - rozpiętość przedziału klasowego, w którym występuje modalna.
Kwantyle
Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach. |
Kwartyl pierwszy Q1 |
dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q1, a 75% równe bądź wyższe od tego kwartyla |
Kwartyl drugi (mediana Me) |
dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa |
Kwartyl trzeci Q3 |
dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q3, a 25% równe bądź wyższe od tego kwartyla |
Decyle |
np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pierwszego |
Kwartyl drugi (mediana Me)
Dla szeregu szczegółowego
Dla szeregu rozdzielczego (graficznie lub analitycznie)
gdzie:
m - numer przedziału (klasy), w które występuje mediana,
- dolna granica przedziału, w którym występuje mediana
nm - liczebność przedziału mediany, tzn. klasy o numerze m,
- suma liczebności przedziałów poprzedzających przedział mediany, czyli liczebność skumulowana,
hm - rozpiętość przedziału klasowego, w którym jest mediana,
NMe - pozycja mediany, czyli
Kwartyl pierwszy Q1 i trzeci Q3
Dla szeregu szczegółowego kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch częściach zbiorowości, które powstały po wyznaczeniu mediany, ponownie wyznacza się medianę; mediana w pierwszej części odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu.
Dla szeregu rozdzielczego wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
Kwartyl pierwszy Q1
Kwartyl trzeci Q3
gdzie:
m - numer przedziału (klasy), w którym występuje odpowiadający mu kwartyl,
- dolna granica tego przedziału,
nm - liczebność przedziału, w którym występuje odpowiedni kwartyl,
- liczebność skumulowana do przedziału poprzedzającego kwartyl,
hm - rozpiętość przedziału klasowego, w którym jest odpowiedni kwartyl.
Miary zmienności (rozproszenia, dyspersji) |
Miary klasyczne |
Miary pozycyjne |
wariancja odchylenie standardowe odchylenie przeciętne współczynnik zmienności |
rozstęp odchylenie ćwiartkowe współczynnik zmienności |
Rozstęp
Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy, nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości. |
Wariancja
Wariancja - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości. |
szereg szczegółowy |
|
szereg rozdzielczy punktowy |
|
szereg rozdzielczy z przedziałami klasowymi |
|
Wykonując proste przekształcenia algebraiczne, otrzymamy:
szereg szczegółowy |
|
szereg rozdzielczy |
|
Odchylenie standardowe, odchylenie przeciętne
Odchylenie standardowe s - jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej. |
Typowy obszar zmienności cechy - około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiada wartości cechy w tym przedziale:
Odchylenie przeciętne
Odchylenie przeciętne d - jest to średnia arytmetyczna bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej. |
szereg szczegółowy |
|
szereg rozdzielczy |
|
Pomiędzy odchyleniem przeciętnym i standardowym, dla tego samego szeregu, zachodzi relacja: d < s.
Odchylenie ćwiartkowe
Odchylenie ćwiartkowe Q - jest to parametr określający odchylenie wartości cechy od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych. |
Typowy obszar zmienności cechy:
Współczynnik zmienności
Współczynnik zmienności - jest ilorazem bezwzględnej mary zmienności cechy i średniej wartości tej cechy, jest wielkością niemianowaną, najczęściej podawaną w procentach. |
Klasyczne współczynniki zmienności:
|
|
|
Pozycyjne współczynniki zmienności:
oraz
Współczynnik zmienności stosuje się w porównaniach zróżnicowania:
kilku zbiorowości pod względem tej samej cechy,
tej samej zbiorowości pod względem kilku różnych cech.
Miary asymetrii |
wskaźnik skośności współczynnik skośności |
Rozkłady różnią się między sobą kierunkiem i siła asymetrii (miary klasyczne):
dla szeregów symetrycznych
jeżeli
asymetria prawostronna
jeżeli
asymetria lewostronna.
Wskaźnik skośności |
Wskaźnik skośności można wyznaczyć również przy pomocy miar pozycyjnych:
w rozkładzie symetrycznym:
przy asymetrii prawostronnej:
przy asymetrii lewostronnej:
Współczynniki skośności (asymetrii) - są stosowane w porównaniach, do określenia siły oraz kierunku asymetrii, są to liczby niemianowane, im większa ich wartość tym silniejsza asymetria. |
klasyczne |
|
pozycyjny |
Pozycyjny współczynnik asymetrii określa kierunek i siłę asymetrii jednostek znajdujących się miedzy pierwszym z trzecim kwartylem.
Miary koncentracji |
współczynnik skupienia (koncentracji) (kurtoza) współczynnik koncentracji Lorenza |
Współczynnik skupienia (koncentracji) (kurtoza) K - jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartość współczynnika tym bardziej wysmukła krzywa liczebności, większa koncentracja wartości cech wokół średniej. |
gdzie:
szereg szczegółowy |
|
szereg rozdzielczy |
|
Jeżeli przyjmiemy, że zbiorowość ma rozkład normalny, to K = 3, są bardziej spłaszczony rozkład od normalnego ma K < 3, a brdziej wysmukły K > 3. Stąd:
1