PARAMETRY STOSOWANE W STATYSTYCE OPISOWEJ
Lp. |
Nazwa parametru |
Miara |
Miary |
|
|
|
klasyczna |
pozycyjna |
|
1 |
MIARY TENDENCJI CENTRALNEJ |
x- średnia arytmetyczna |
D - dominanta M - mediana Q - kwartyle |
Absolutne (wyrażone w jednostce miary danej cechy) |
2 |
MIARY DYSPERSJI (zróżnicowania, zmienności, rozrzutu, rozproszenia) |
d- odchylenie przeciętne S - odchylenie standardowe S2 -wariancja |
R - rozstęp(obszar zmienności) Rq - rozstęp kwartylowy Rd - rozstęp decylowy Q - odchylenie ćwiartkowe Qd - odchylenie decylowe |
Absolutne |
|
|
Vd, Vs - współczynnik zmienności |
Vq - współczynnik zróżnicowania kwartylowego Vd - współczynnik zróżnicowania decylowego |
Stosunkowe (wyrażone w procentach lub liczbach niemianowanych) |
3 |
MIARY ASYMETRII (skośności) |
A1 - klasyczny współczynnik asymetrii |
A2 - pozycyjny współczynnik asymetrii |
Stosunkowe |
|
|
A3 - współczynnik skośności |
|
|
4 |
MIARY SKUPIENIA (spłaszczenia) |
- klasyczny współczynnik skupienia |
- pozycyjny współczynnik skupienia |
Stosunkowe |
5 |
MIARY KONCENTRACJI |
K1 - współczynnik Lorenza k2 - współczynnik Gini'ego |
Stosunkowe |
I MIARY TENDENCJI CENTRALNEJ - miary położenia, wskazują miejsce, w którym leży wartość najlepiej reprezentująca wszystkie jednostki wchodzące w skład danej zbiorowości. Miary te charakteryzują średni lub typowy poziom wartości cechy. Są to takie wartości, wokół których skupiają się pozostałe wartości analizowanej cechy.
1. SREDNIA ARYTMETYCZNA X - iloraz sumy pomiarów przez ich liczbę.
Własności:
Suma odchyleń wszystkich pomiarów od średniej wynosi 0;
Średnia spełnia warunek: x min X x max;
Daje prawdziwą charakterystykę tylko zbiorowości jednorodnej ze względu na badaną cechę (tzn. o rozkładzie symetrycznym i umiarkowanie symetrycznym);
Dla obliczania X potrzebna jest znajomość wszystkich wartości cechy;
Jeżeli przedziały klasowe są otwarte, to domyka się je określonymi wartościami cechy;
X jest bardzo wrażliwa na skrajne wartości cech jednostek; nie liczymy jej, gdy cecha ma rozkład skrajnie asymetryczny, U - kształtny lub wielomodalny.
2. MEDIANA M - miernik pozycyjny, podający pozycję pewnego typowego (lub nietypowego) przypadku w stosunku do innych przypadków.
Własności:
Dzieli zbiorowość na 2 połowy; połowa pomiarów jest mniejsza lub równa od wartości M, a połowa jest większa lub równa od M.;
Gdy liczba pomiarów jest nieparzysta - M to środkowy pomiar (w uporządkowanym szeregu);
Gdy liczba pomiarów jest parzysta - M to średnia arytmetyczna dwóch środkowych pomiarów (w uporządkowanym szeregu);
Średnia a mediana:
Średnia zużywa więcej informacji niż M (obliczając X korzystamy ze wszystkich pomiarów, M to tylko pewien pojedynczy pomiar)
Zmiany wartości pomiarów ekstremalnych wpływają na wartość średniej a nie wpływają na wartość M dopóki nie zmieni się wartość pomiaru środkowego.
3. DOMINANTA (wartość modalna) przypadek najczęstszy
4. KWARTALE
Pierwszy - liczba, od której1/4 pomiarów jest mniejsza lub równa
Drugi - równy M
Trzeci - liczba, od której ¾ pomiarów jest mniejsze lub równe
5. DECYLE - liczby, od których np. 1/10, 2/10, 3/10 pomiarów jest mniejsze lub równe
II.MIARY DYSPERSJI - miary zróżnicowania; dokonując pomiarów w danej zbiorowości uzyskane wyniki różnią się między sobą. Im bardziej wartości cechy jednostek skupione są wokół swej średniej, tym mniejsze jest zróżnicowanie jednostek i na odwrót.
1. ROZSTĘP R - różnica między najwyższym i najniższym pomiarem; opiera się na dwóch ekstremalnych pomiarach, więc może nie dawać prawdziwego obrazu
2. ODCHYLENIE SREDNIE d (przeciętne) - Określa o ile jednostki danej zbiorowości różnią się średnio od X; mówi o przeciętnej odległości między pomiarem a średnią.
3. ODCHYLENIE ĆWIARTKOWE Q - określa odchylenie wartości cechy od M; mierzy poziom zróżnicowania tylko w 50% populacji.
4. ODCHYLENIE STANDARDOWE S(x) - określa przeciętne zróżnicowanie poszczególnych wartości cechy od X
5. WSPÓŁCZYNNIK ZMIENNOŚCI V - obliczamy go dzieląc S(x) lub d przez wartość X. Mówi o jednorodności badanej zbiorowości statystycznej, określa siłę rozproszenia
Własności:
Służy do porównania kilku zbiorowości pod względem tej samej cechy
Lub tej samej zbiorowości pod względem kilku różnych cech.
V e <0, 100%>
0 - 20% - zróżnicowanie cechy słabe
20 - 40% - umiarkowane
40 - 60% - silne
60% i więcej - b. silne
ZWIĄZKI MIĘDZY MIARAMI DYSPERSJI:
1. Q < d < S(x)
2. d/S(x)=4/5
3. Q/S(x)= 2/3
4. Jeżeli rozkład zbiorowości jest normalny, to wielkości poszczególnych parametrów rozproszenia można określić na podstawie zależności:
Q=0,845 d = 0,675 S(x)
d=1,183 Q = 0,798 S(x)
S(x) = 1,483 Q = 1,253 d
REGUŁA TRZECH SIGM:
Wyznaczenie S(x) umożliwia ocenę przeciętnego wahania wartości cechy wokół X.
Reguła trzech sigm mówi, że wystąpienie wartości poza przedziałem <X - 3S(x); X +3S(x)> jest mało prawdopodobne.
W przypadku rozkładu normalnego (lub zbliżonego do normalnego):
około 68% jednostek zbiorowości charakteryzuje się tym, że wartości cechy dla tych jednostek nie różnią się od średniej arytmetycznej (in+ i in-) więcej niż o jedno S(x), tzn. około 68% jednostek zbiorowości mieści się w przedziale: <X - S(x); X +S(x)>
około 95% jednostek zbiorowości mieści się w przedziale: <X - 2S(x); X +2S(x)>
około 99,7% jednostek zbiorowości mieści się w przedziale <X - 3S(x); X +3S(x)>
Parametry stosowane w statystyce opisowej
2