Parametry statystyczne
Parametry statystyczne - są to wielkości liczbowe, które służą do opisu struktury zbiorowości statystycznej w sposób systematyczny
Miary położenia
Miary pozycyjne
modalna kwantyle:
Miary przeciętne charakteryzują średni lub typowy poziom wartości cechy, wokół których skupiają się wszystkie pozostałe wartości analizowanej cechy
średnia arytmetyczna średnia harmoniczna średnia geometryczna modalna
Średnia arytmetyczna
Średnią arytmetyczną - definiuje się jako sumę wartości cechy mierzalnej podzieloną przez liczbę jednostek skończonej zbiorowości statystycznej.
szereg szczegółowy
gdzie: n - liczebność zbiorowości próbnej (próby), xi - wariant cechy. Jest to tzn. średnia nieważna (prosta) - stosowana dla szeregów szczegółowych. Średnia arytmetyczna ważona szereg rozdzielczy punktowy
szereg rozdzielczy z przedziałami klasowymi
gdzie:
Średnia arytmetyczna (średnia ważona) dla r-grup łącznie oraz średnich arytmetycznych cząstkowych
gdzie Podstawiając w miejsce ni wskaźnik struktury wi otrzymamy zależności:
Wybrane właściwości średniej arytmetycznej
Średnia harmoniczna
Średnią harmoniczną - stosuje się wtedy, gdy wartości cechy są podane w przeliczeniu na stałą jednostkę innej zmiennej, czyli w postaci wskaźników natężenia, wagi natomiast w jednostkach liczników tych cech, np. prędkość pojazdu w km/h.
szereg szczegółowy
szereg rozdzielczy
Przyjmując, że waga
Średnia geometryczna
Średnią geometryczną - stosuje się w badaniach średniego tempa zmian zjawisk, a więc gdy zjawiska są ujmowane dynamicznie.
Modalna
Modalna Mo (dominanta D, moda, wartość najczęstsza - jest to wartość cechy statystycznej, która w danym rozdziale empirycznym występuje najczęściej
Dla szeregów szczegółowych oraz szeregów rozdzielczych punktowych modalna odpowiada wartości cechy o największej liczebności (częstości). W szeregach rozdzielczych z przedziałami klasowymi bezpośrednio można określić tylko przedział, w którym modalna występuje, jej przybliżoną wartość wyznacza się graficznie z histogramu liczebności (częstości) lub ze wzoru interpolacyjnego:
gdzie: m - numer przedziału (klasy), w którym występuje modalna,
nm - liczebność przedziału modalnej, tzn. klasy o numerze m, nm-1; nm+1 - liczebność klas poprzedzającej i następnej, o numerach m - 1 i m + 1, hm - rozpiętość przedziału klasowego, w którym występuje modalna.
Kwantyle
Kwantyle - definiuje się jako wartości cechy badanej zbiorowości, przedstawionej w postaci szeregu statystycznego, które dzielą zbiorowość na określone części pod względem liczby jednostek, części te pozostają do siebie w określonych proporcjach.
Kwartyl pierwszy Q1 dzieli zbiorowość na dwie części w ten sposób, że 25% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q1, a 75% równe bądź wyższe od tego kwartyla
Kwartyl drugi (mediana Me) dzieli zbiorowość na dwie równe części; połowa jednostek ma wartości cechy mniejsze lub równe medianie, a połowa wartości cechy równe lub większe od Me; stąd nazwa wartość środkowa
Kwartyl trzeci Q3 dzieli zbiorowość na dwie części w ten sposób, że 75% jednostek zbiorowości ma wartości cechy niższe bądź równe kwartylowi pierwszemu Q3, a 25% równe bądź wyższe od tego kwartyla
Decyle np. decyl pierwszy oznacza, że 10% jednostek ma wartości cechy mniejsze bądź równe od decyla pierwszego, a 90% jednostek wartości cechy równe lub większe od decyla pirwszego
Kwartyl drugi (mediana Me) Dla szeregu szczegółowego
Dla szeregu rozdzielczego (graficznie lub analitycznie)
gdzie: m - numer przedziału (klasy), w które występuje mediana,
nm - liczebność przedziału mediany, tzn. klasy o numerze m,
hm - rozpiętość przedziału klasowego, w którym jest mediana,
NMe - pozycja mediany, czyli Kwartyl pierwszy Q1 i trzeci Q3 Dla szeregu szczegółowego kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch częściach zbiorowości, które powstały po wyznaczeniu mediany, ponownie wyznacza się medianę; mediana w pierwszej części odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu. Dla szeregu rozdzielczego wyznaczenie kwartyli poprzedza się ustaleniem ich pozycji:
Kwartyl pierwszy Q1
Kwartyl trzeci Q3
gdzie: m - numer przedziału (klasy), w którym występuje odpowiadający mu kwartyl,
nm - liczebność przedziału, w którym występuje odpowiedni kwartyl,
hm - rozpiętość przedziału klasowego, w którym jest odpowiedni kwartyl.
Miary zmienności (rozproszenia, dyspersji)
Miary klasyczne Miary pozycyjne
wariancja odchylenie standardowe odchylenie przeciętne współczynnik zmienności rozstęp odchylenie ćwiartkowe współczynnik zmienności
Rozstęp
Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy, nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości.
Wariancja
Wariancja - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.
szereg szczegółowy
szereg rozdzielczy punktowy
szereg rozdzielczy z przedziałami klasowymi
Wykonując proste przekształcenia algebraiczne, otrzymamy:
szereg szczegółowy
szereg rozdzielczy
Odchylenie standardowe, odchylenie przeciętne
Odchylenie standardowe s - jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.
Typowy obszar zmienności cechy - około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiada wartości cechy w tym przedziale:
Odchylenie przeciętne
Odchylenie przeciętne d - jest to średnia arytmetyczna bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej.
szereg szczegółowy
szereg rozdzielczy
Pomiędzy odchyleniem przeciętnym i standardowym, dla tego samego szeregu, zachodzi relacja: d < s.
Odchylenie ćwiartkowe
Odchylenie ćwiartkowe Q - jest to parametr określający odchylenie wartości cechy od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych.
Typowy obszar zmienności cechy:
Współczynnik zmienności
Współczynnik zmienności - jest ilorazem bezwzględnej mary zmienności cechy i średniej wartości tej cechy, jest wielkością niemianowaną, najczęściej podawaną w procentach.
Klasyczne współczynniki zmienności:
Pozycyjne współczynniki zmienności:
oraz
Współczynnik zmienności stosuje się w porównaniach zróżnicowania:
Miary asymetrii
wskaźnik skośności współczynnik skośności
Rozkłady różnią się między sobą kierunkiem i siła asymetrii (miary klasyczne):
Wskaźnik skośności
Wskaźnik skośności można wyznaczyć również przy pomocy miar pozycyjnych:
Współczynniki skośności (asymetrii) - są stosowane w porównaniach, do określenia siły oraz kierunku asymetrii, są to liczby niemianowane, im większa ich wartość tym silniejsza asymetria.
klasyczne
pozycyjny
Pozycyjny współczynnik asymetrii określa kierunek i siłę asymetrii jednostek znajdujących się miedzy pierwszym z trzecim kwartylem.
Miary koncentracji
współczynnik skupienia (koncentracji) (kurtoza) współczynnik koncentracji Lorenza
Współczynnik skupienia (koncentracji) (kurtoza) K - jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartość współczynnika tym bardziej wysmukła krzywa liczebności, większa koncentracja wartości cech wokół średniej.
gdzie: szereg szczegółowy
szereg rozdzielczy
Jeżeli przyjmiemy, że zbiorowość ma rozkład normalny, to K = 3, są bardziej spłaszczony rozkład od normalnego ma K < 3, a brdziej wysmukły K > 3. Stąd:
|