MIARY ZMIENNOŚCI : ZRÓŻNICOWANIA, DYSPERSJI, ROZRZUTU.
Rozważamy dwie grupy osób, badaną cechą niech będą zarobki:
A B
999zł 100zł
1000zł 1000zł
1001zł 1900zł
Widzimy że obie zbiorowości są bardzo różne jeżeli chodzi o rozkład zarobków, natomiast średnia w grupie A jest równa średniej w grupie B
Wartości średnie nie dają wie wyczerpującej charakterystyki struktury zbiorowości.
Nie informują nas o stopniu zmienności ( dyspersji) badanej cechy.
DYSPERSJA
To zróżnicowanie jednostek zbiorowości statystycznej ze względu na wartości badanej ceny
MIARY ZMIENNOŚCI:
KLASYCZNE POZYCYJNE
Wariancjia Rozstęp
Odchylenie Standardowe Odchylenie ćwiartkowe
Współczynnik Zmienności Współczynnik zminności
MIARY KLASYCZNE
Zbiorowość A :
Xi |
Xi-X |
( Xi - X ) ² |
900 |
-100 |
10 000 |
1 000 |
0 |
0 |
|
ODCHYLENIE = √200000/3 = 82
W zbiorowości A zarobki poszczególnych pracowników różnią się przeciętnie od średnich zarobków ( 1000zł ) o Plus/ minus 82 zł
Zbiorowość B
Xi |
Xi- X |
(Xi-X)² |
100 |
-900 |
81 0000 |
1000 |
0 |
0 |
1900 |
900 |
810000 |
RAZEM |
X |
162 00 00 |
ODCHYLENIE √162 00 00/3= 735ZŁ
W zbiorowości B zarobki poszczególnych pracowników różnią się przeciętnie od średnih zarobków(1000zł) plus /minus 735zł
ODHYLENIE STANDARDOWE:
Jest to wielkość o jaką średnio odchylają się poszczególne wartości cechy od średniej arytmetycznej.
ODCHYLENIE STANDARDOWE TO:
Pierwiastek kwadratowy z wariancji.
ƍ= √ƍ²
WARIANCJA
Szereg szczegółowy:
Szereg rozdzielczy - punktowy
Szereg rozdzielczy
WARIANCJA
To przeciętne kwadratowe odchylenie poszczególnych wyników od jej średniej.
WŁASNOŚCI ODCHYLENIA STANDARDOWEGO I WARIANCJI.
Do obliczania tych charakterystyk potrzebna jest znajomość wszystkich wartości cech.
Wartość wariancji nie ulega zmianie, gdy w miejsce liczebności wstawimy odsetki.
Wariancja obliczana na podstawie szeregów rozdzielczych przedziałowych jest wartością zawyżoną.
Przeszacowanie wartości wariancji jest tym większa, im mniejsza jest liczba klas.
W Elu zmniejszenia popełnionego błędu stosujemy poprawkę Shepparda.
1/12 h ²
Poprawkę Shepparda możemy stosować , tylko w szeregu rozdzielzym o równych rozpiętośiach.
. ODCHYLENIE STANDARDOWE:
jest charakterystyka bardzo cenną, często wykorzystywaną w badaniach statystycznych .jest precyzyjną i logiczną miara zmienności , przy której inne miary można traktować jako drugorzędne .
miary pozycyjne
ROZSTEP- to różnica między największą i najmniejszą zaobserwowaną wielkością:
Q = ½ ( Q3 - Q1)
Odchylenie ćwiartkowe mierzy poziom zróżnicowania tylko części jednostek badanej zbiorowości, pozostałej po odrzuceniu 25%jednostek o wartościach najniższych, oraz 25 % jednostek o wartościach najwyższych.
Omówienie dotąd miary dyspersji są miarami bezwzględnymi, gdyż wyrażamy je w takich samych jednostkach jak wartości badanej zmiennej.
Nie pozwala to na porównanie zmienności cech o różnych miarach. Nie można również porównać pod względem tej samej cechy 2( lub kilku) zbiorowości bd. na różnym poziomie.
Dlatego też w analizie dyspersji stosuje się względną miarę zróżnicowania - współczynnik zmienności.
WSPÓŁCZYNNIK ZMIENNOŚCI:
To stosunek odchylenia standardowego do średniej arytmetycznej.
Stwierdzam , że ƍ = 20 ma zupełnie inne znaczenie, gdy dane stanu rachunku bankowego są rzędu 150-160 zł niż wtedy, gdy dane rzędu milionów zł
Po porównaniu obu przypadków widzimy, że absolutna miara rozpuszczenia ,jaką jest odchylenie standardowe, nie przekazuje wiele informacji.
V=
Współczynnik zmienności został celowo tak zbudowany, by mógł służyć jako relatywna miara rozproszenia. Pokazuje on rozproszenie w stosunku do średniej, czyli do przeciętnej wartości wyników obserwacji ( danych )
Wartość liczbowa współczynników zmienności najczęściej podawane są w procentach . Przyjmuje się ,że jeżeli współczynnik zmienności jest poniżej 10% , to cechy te wykazują zróżnicowanie statystyczne nieistotne.
DLA MIAR POZOSTAŁYCH STOSUJEMY :
V me = Q/me razy 100%
MIARY ASYMETRII
Z punktu widzenia potrzeb analizy statystycznej istotny jest nie tylko przeciętny poziom i wewnętrzne zróżnicowanie zbiorowości, ale również to, czy przeważająca liczba jednostek znajduje się powyżej , czy poniżej przeciętnego poziomu badanej cechy.
Problem ten wiąże się z oceną asymetrii ( skośności) rozkładu.
Asymetrię najłatwiej jest określić poprzez porównanie:
• dominanty
• mediany
• średniej arytmetycznej
ROZKŁAD SYMETRYCZNY
X = Me = D
X - D = 0
Wszystkie średnie
• Średnia arytmetyczna
• Dominanta
• Mediana
Są sobie równe.
X = Me = D
ASYMETRIA UJEMNA
Szereg Skośny Lewostronnie
X < Me < D
X- D < 0
X D
Większość Jednostek jest większa od średniej arytmetycznej.
ASYMETRIA UJEMNA
Szereg skośny Prawostronnie
X > Me > D
X - D > 0
D X
Większość jednostek w zbiorowości jest mniejsza od średniej arytmetycznej.
Najczęściej używaną miarą asymetrii jest:
• współczynnik skośności A
A=
A
Wartość bezwzględna współczynnika skośności określa siłę asymetrii. Im miernik ten jest bliższy jedności, tym większa asymetria.
Znak przy współczynniku określa kierunek asymetrii.
• (+) asymetria prawostronnie dodatnia
• (-) asymetria lewostronnie ujemna
Jeżeli nie możemy obliczyć średniej arytmetycznej lub dominanty, to możemy zastosować pozycyjna miarę asymetrii.
Wskaźnik asymetrii:
W
Wskaźnik ten mierzy asymetrię tylko środkowej części zbiorowości.
Do klasycznych współczynników asymetrii należy:
WSPÓŁCZYNNIK ASYMATRII A
A= gdzie m3moment centralny trzeciego rzędu A € ( -1; 1 )
DLA SZEREGU SZCZEGÓŁOWEGO :
DLA SZEREGU ROZDZIELCZEGO
Jest to precyzyjna miara asymetrii ale jest kłopotliwa pod względem rachunkowym i jest nieodporna na występowanie wartości nietypowych.
Np.: Jakie znaczenie ma uzyskana informacja o wielkości odchylenia Standardowego?
Odp: Stwierdzenie że ƍ=20 ma zupełnie inne znaczenie, gdy dane - stanu rachunku bankowego - są rzędu 150-160 zł niż wtedy gdy dane są rzędu miliona złotych .
26.10.09 r