Miary zmienności (rozproszenia, dyspersji)
MIARY ZMIENNOŚCI
Na zjawiska masowe oddziałują dwa rodzaje przyczyn:
Główne (wywołujące zmienność systematyczną)
Uboczne (wywołujące zmienność przypadkową)
Przybliżonym miernikiem składnika systematycznego zbiorowości są miary przeciętne (średnie). Odchylenia wartości poszczególnych jednostek zbiorowości od wartości średniej powstają pod wpływem przyczyn przypadkowych(ubocznych).
Do pomiaru tych odchyleń wykorzystuje się miary zmienności (zróżnicowania, dyspersji, rozproszenia).
Dyspersja to zróżnicowanie jednostek badanej zbiorowości ze względu na wartość badanej cechy statystycznej. Siłę dyspersji można oceniać
za pomocą miar:
Klasycznych
Pozycyjnych.
Punktem odniesienia w miarach klasycznych jest średnia arytmetyczna, zaś miary pozycyjne wyznaczane są przede wszystkim na podstawie kwartyli.
Miary klasyczne:
Wariancja
Odchylenie standardowe
Odchylenie przeciętne (dewiata)
Współczynnik zmienności*.
* - jeśli do jego wyliczenia wykorzystywana jest średnia arytmetyczna oraz odchylenie standardowe)
Miary pozycyjne:
Empiryczny obszar zmienności (rozstęp, amplituda wahań, pole rozsiania)
Odchylenie ćwiartkowe
Współczynnik zmienności**.
** - jeśli do jego wyliczenia wykorzystywana jest mediana oraz odchylenie ćwiartkowe)
Najczęściej stosowane miary rozproszenia:
Obszar zmienności
Wariancja
Odchylenie standardowe
Współczynnik zmienności.
OBSZAR ZMIENNOŚCI
określa się różnicę pomiędzy największą a najmniejszą wartością zmiennej, tzn.:
Miara ta ma niewielką wartość poznawczą, gdyż obszar zmienności uzależniony jest
od wartości skrajnych, które często różnią się istotnie od wszystkich pozostałych wartości zmiennej. Na obszar zmienności wpływają tylko wartości skrajne, pozostałe zaś nie mają żadnego wpływu na wynik. Obszar zmienności wykorzystywany jest jedynie przy wstępnej ocenie rozproszenia.
WARIANCJĄ określa się średnią arytmetyczną z sumy kwadratów odchyleń poszczególnych wartości cechy statystycznej od średniej arytmetycznej całej zbiorowości statystycznej. Wariancję wyznacza się z następujących wzorów:
- dla szeregu szczegółowego:
dla szeregu rozdzielczego punktowego:
dla szeregu rozdzielczego przedziałowego
Podstawowe właściwości wariancji:
Jest zawsze liczbą nieujemną
Jest zawsze wielkością mianowaną, tzn. wyrażoną w jednostkach badanej cechy statystycznej. Miano wariancji zawsze jest kwadratem jednostki fizycznej, w jakiej mierzona jest badana cecha
Im zbiorowość statystyczna jest bardziej zróżnicowana, tym wartość wariancji jest wyższa
ODCHYLENIE STANDARDOWE S
jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.
Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji:
gdzie:
- odchylenie standardowe
- wariancja.
Odchylenie standardowe określa, o ile wszystkie jednostki statystyczne danej zbiorowości różnią się średnio od wartości średniej arytmetycznej badanej zmiennej.
Odchylenie standardowe jest obok średniej arytmetycznej najczęściej stosowanym parametrem statystycznym
Jest wielkością obliczoną na podstawie wszystkich obserwacji danego szeregu
Im zbiorowość jest bardziej zróżnicowana, tym większa jest wariancja i oczywiście odchylenie standardowe
Z odchyleniem standardowym łączy się pojęcie zmiennej standaryzowanej (unormowanej) dla rozkładu empirycznego cechy mierzalnej
W statystyce odchylenie standardowe wykorzystywane jest do tworzenia typowego obszaru zmienności statystycznej. W obszarze takim mieści się około 2/3 wszystkich jednostek badanej zbiorowości statystycznej.
Typowy obszar zmienności określa wzór:
Użyteczność kategorii typowego obszaru zmienności sprowadza się przede wszystkim do rozdziału jednostek statystycznych
na typowe (tzn. występujące stosunkowo często) i nietypowe (tzn. występujące stosunkowo rzadko).
Z odchyleniem standardowym wiąże się tzw. Reguła trzech sigm, oparta na nierówności Czybyszewa, która mówi, że wystąpienie obserwacji o wartości cechy poza przedziałem
Jest mało prawdopodobne
Odchylenie standardowe spełnia regułę trzech sigm w przypadku rozkładu normalnego lub zbliżonego do normalnego ponad 2/3 wszystkich zaobserwowanych wartości zmiennej (68,28%) różni się od średniej nie mniej niż o wartość odchylenia standardowego (+-s), 95,45% obserwacji różni się od średniej maksymalnie o dwa odchylenia standardowe, natomiast 99,73% obserwacji mieści się w przedziale średnia do +-3 odchylenia standardowe
Rozkład normalny
Własności rozkładu normalnego
Jest symetryczny
Ma kształt dzwonu
Jego średnia arytmetyczna, mediana i modalna wypadają w tym samym miejscu krzywej
Dwa końce krzywej praktycznie nigdy nie dotykają osi poziomej
ODCHYLENIE STANDARDOWE
Typowy obszar zmienności cechy
Reguła trzech sigm
ODCHYLENIE PRZECIĘTNE D
Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej.
Odchyleniem przeciętnym d nazywa się średnią arytmetyczną z bezwzględnych odchyleń wartości zmiennej x od średniej arytmetycznej. Odchylenie przeciętne wyznaczamy z następujących wzorów:
dla szeregu szczegółowego:
gdzie:
n - liczebność badanej zbiorowości
- wartości przyjmowane przez cechę mierzalną
- średnia arytmetyczna badanej zbiorowości
dla szeregu rozdzielczego punktowego:
dla szeregu rozdzielczego przedziałowego:
gdzie: środek i-tego przedziału klasowego
WARIANCJA OGÓLNA
Jeżeli całą zbiorowość podzielimy według określonych kryteriów na r grup, to wariancja dla całej zbiorowości, tzw. wariancja ogólna, będzie sumą dwóch składników:
średniej arytmetycznej wewnątrzgrupowych wariancji wartości cechy tzw. wariancji wewnątrzgrupowej,
wariancji średnich grupowych wartości tej zmiennej, tzw. wariancji międzygrupowej.
Wariancja ogólna nosząca nazwę równości wariancyjnej wyraża się wzorem :
Gdzie:
Przy czym:
- wariancja wewnątrzgrupowa
- wariancja międzygrupowa
- średnie cząstkowe wyznaczone na podstawie
- średnia arytmetyczna próby lub populacji wyznaczona na podstawie
N – suma liczebności we wszystkich r- grupach
Przykład
Właściciel zakładu zatrudniający dwóch pracowników, dokonał pomiarów czasu wykonywania detali. Okazało się, że robotnik A pracował przy wykonaniu detalu średnio 16 min, a zróżnicowanie mierzone wariancją wynosiło 7,6 minuty, wartości te zostały wyznaczone na podstawie obserwacji nA= 5 detali. Robotnik B na podstawie obserwacji czasów nB = 10 detali, miał średni czas równy 15,4 min, a wariancję 17,24.Należy wyznaczy zróżnicowanie czasu wykonania detali w tym zakładzie.
Średni czas wykonania detalu w zakładzie wynosi 15,6 min.
Wariancja wewnątrzgrupowa czasu wykonania detalu wynosi
Wariancja międzygrupowa
Wariancja ogólna jest sumą dwóch powyższych składników
Miary dyspersji (rozproszenia), jak i wartości średnie są liczbami mianowanymi. Fakt ten umożliwia bezpośrednie porównywania miar dyspersji obliczonych dla różnych szeregów.
Jeżeli badane zjawisko mierzone jest w różnych jednostkach miary lub kształtuje się na niejednakowym poziomie, wówczas do oceny rozproszenia należy stosować współczynnik zmienności.
WSPÓŁCZYNNIK ZMIENNOŚCI jest ilorazem odchylenia przeciętnego lub odchylenia standardowego oraz średniej
Lub
(zamiast może być inna średnia, np. mediana)
Współczynnik zmienności może być wyrażony w procentach. Współczynnik ten zastępuje bezwzględne miary dyspersji
Współczynnik zmienności stosuje się zwykle w porównaniach, gdy chcemy ocenić zróżnicowanie:
Kilku zbiorowości pod względem tej samej cechy,
Tej samej zbiorowości pod względem kilku różnych cech.
Województwa Polski scharakteryzowano przez dwie cechy: powierzchnię X i liczbę ludności Y.
Należy obliczy dla powyższych cech współczynniki zmienności
Wyznaczone dla cechy X parametry przedstawiają się następująco:
Wyznaczone dla cechy Y parametry przedstawiają się następująco:
Obliczone współczynniki zmienności wskazują, że zarówno pod względem powierzchni jak i liczby ludności województwa są silnie zróżnicowane, przy czym różnią się one znacznie bardziej pod względem liczby mieszkańców
powierzchnia
liczba ludności
Współczynnik zmienności charakteryzuje stosunek nasilenia przyczyn ubocznych do przyczyn głównych
Wartości liczbowe współczynników zmienności najczęściej są podawane w procentach. Przyjmuje się, że jeżeli współczynnik zmienności jest poniżej 10%, to cechy wykazują zróżnicowanie nieistotne statystycznie. Duże wartości tego współczynnika świadczą o zróżnicowaniu a więc niejednorodności zbiorowości.