Statystyka- wykłady.
02.10.07
Pakiety statystyczne:
Statistica.pl
SPSS
GUS- Główny Urząd Statystyczny; zajmuje się zbieraniem informacji o państwie (np. o gospodarce, rolnictwie).
Statystyka
Opisowa:
|
Indukcyjna:
|
Korelacja i współczynnik korelacji
(dotyczy obu)
09.10.07
Statystyka- badania ilościowe.
Problemy statystyczne:
Uogólnianie wyników z próby na populację,
Weryfikacja hipotez statystycznych,
Wybory
Do Sejmu:
41 okręgów,
proporcjonalny system, ale nie ma możliwości idealnej proporcji,
podział głosów na mandaty (w okręgach), aby partia mogła przeliczać głosy na mandaty to musi przekroczyć w skali kraju próg wyborczy (5%- partia, 8%- koalicja),
w Polsce funkcjonują dwie metody przeliczania głosów na mandaty:
Saint Legue (1882)- dzieli się liczbę głosów partii (koalicji) przez kolejne liczby nieparzyste: 1,3,5,7... (w Polsce zmodyfikowana wersja: zamiast 1- 1,4)
D' Honta (1910)- (...) przez kolejne liczby naturalne: 1,2,3,4...
Np. 2001 rok- Okręg Wyborczy nr 3 we Wrocławiu- 14 mandatów
SLD-UP 163.974
PO 74.658 dzielimy i ile dzielników
PiS 42.974 tyle mandatów;
Samoobrona 39.523
LPR 32.913
PSL 19.841
Do Senatu:
40 okręgów,
2 lub 3 mandaty w okręgu,
wybory większościowe, wielomandatowe (w okręgu wygrywa ten, kto miał najwięcej głosów.
16.10.07
Statystyka- nauka o metodach ilościowych badań procesów zjawisk masowych.
Prawidłowości statystyczne- obserwujemy w wyniku badania statystycznego (pod warunkiem, że wystarczająco dużo jednostek podlega badaniu).
Zbiorowość statystyczna- (populacja, masa), zbiór elementów podlegających badaniu statystycznemu.
Jednostka statystyczna- element zbiorowości statystycznej, element podlegający badaniu statystycznemu.
Cecha statystyczna- właściwość badanej jednostki statystycznej.
Rodzaje cech (trzy koncepcje):
stałe (taka sama dla wszystkich jednostek),
zmienne (różna).
jakościowe,
ilościowe.
nominalne,
porządkowe, wg skal pomiaru
interwałowe (przedziałowe),
ilorazowe (stosunkowe).
Charakterystyka zbiorowości pod względem:
rzeczowym: kto? co? Za pomocą cech stałych badacz definiuje zbiorowość
czasowym: kiedy? (cechy stałe nie podlegają badaniu)
przestrzennym: gdzie?
23.10.07
Cechy:
niezmierzalne- cechy, właściwości jednostek, które wyraża się za pomocą słów (zmienne jakościowe nie podlegają już podziałowi),
mierzalne- wyraża się za pomocą liczb (zmienne ilościowe)
Zmienne ilościowe
z. skokowe(dyskretne) z. quasiciągłe z.ciągłe
zmienne skokowe- takie cechy, które zmieniają się o pewien „skok”, o pewną stałą np. {1,2,3,4},
zmienne ciągłe- przyjmują każdą (dowolną) wartość z jakiegoś przedziału np. {4,759; 24,0; ...}
zmienne quasiciągłe- znajdują się pomiędzy dwoma powyższymi np. zarobki, które traktuje się jako zmienną ciągłą.
*Powyższy podział nie jest dostatecznie ostry, jeśli potraktuje się go ogólnie.
Skale pomiaru: niższego rzędu
nominalna zm. jakościowe
porządkowa
interwałowa, zm. ilościowe
ilorazowa. wyższego rzędu
Podział ten to duże uproszczenie
Skala nominalna- tylko podział na kategorie (podział rozłączny i wyczerpujący), dana jednostka zostaje tylko zakwalifikowana do danej kategorii; nie można porównywać ze sobą danych mówiąc, że coś jest lepsze a coś gorsze; kategorie nie są ułożone po kolei; zmienne w skali nominalnej to np. płeć, wiek, kolory(oczu, włosów),
Skala porządkowa- to, co w porządkowej + porównanie między jednostkami należącymi do dwóch różnych kategorii, np. wykształcenie- można powiedzieć, że ktoś ma lepsze bądź gorsze wykształcenie, wyższe lub niższe; wiek- ktoś jest w wieku przedprodukcyjnym, produkcyjnym, poprodukcyjnym,
Skala interwałowa- można mówić, że coś jest większe lub mniejsze o konkretną wartość, np. temperatura, gdyż nie można powiedzieć ile razy wyższa bądź niższa, ponieważ inaczej będzie to wyglądało w stopniach Celsjusza, a inaczej Fahrenheita,
Skala ilorazowa- to, co w interwałowej + ile razy większe.
*Rozróżnienie dwóch ostatnich skal z punktu widzenia socjologa jest nieostre-> obie skale są skalami ilościowymi.
Pytanie: W jakiej skali mierzymy wiek?
Maksymalnie wiek mierzymy w skali ilorazowej, ale możemy też w skalach niższego rzędu, zależy to od problemu badawczego i celu badań.
Wiek w skali nominalnej możemy podzielić na parzystą i nieparzystą liczbę lat- wówczas nie wiemy, kto jest młodszy, a kto starszy, więc wówczas nie będzie to skala porządkowa.
Problemy związane ze skalą porządkową
Skala Likerta.
Np. Czy P. zdaniem, sprawy w Polsce idą w dobrym kierunku?
Zdecydowanie tak,
Raczej tak,
Nie mam zdania,
Raczej nie,
Zdecydowanie nie
Skalę L. można przedstawić także w ten sposób
1-zdecydowanie tak
10-zdecydowanie nie
*Przy 7 kategoriach możemy skalę porządkową traktować jako skalę ilościową.
Mało danych, gdyż nie wiemy dlaczego ktoś nie ma zdania na dany temat czy dlatego, że ktoś nic nie wie na dany temat, czy ma dużą wiedzę, ale jest niezdecydowany.
Problemy z odpowiedziami:
Nie mam zdania,
Nie powiem,
Nie wiem,
Trudno powiedzieć,
Ani tak, ani nie,
W skali porządkowej możemy mieć jeszcze inną sytuację- numerujemy jednostki (np. wszystkich studentów od najmłodszego do najstarszego); jest to nadawanie rang.
Problem polega na tym, że dwie jednostki mają tę samą wielkość (np. dwie osoby urodzone tego samego dnia).
Występują wówczas tzw. rangi wiązane.
1
2 rangi wiązane- są na tym samym miejscu, mają ten sam wynik.
2
2
3
3
3
3
4
1
2 miejsce (np. w konkursie)- najlepsze do obliczeń
3
4
1 np. miejsce na olimpiadzie- są dwa drugie miejsca, a potem jest czwarte
2 (brak trzeciego)
2
4
Operacjonalizacja zmiennych- proces, sposób na przejście ze zmiennej teoretycznej do zmiennej empirycznej.
Zmienna teoretyczna- to problem np. agresja, wykształcenie; w wyniku operacjonalizacji otrzymujemy zmienną empiryczną, która jest zmierzona w jednej ze skal.
30.10.07 , 06.11.07, 20.11.07
operacjonalizacja zmiennych
Problem zmienna empiryczna
(zmienna teoretyczna)
1 2 3 4 n
(jedna lub wiele zmiennych)
Zmienna zależna- jest tym, co mierzymy, aby ocenić skutki działania zmiennej niezależnej.
Zmienna niezależna- ta, której wpływ chcemy zbadać.
Badanie statystyczne- musi dotyczyć zbiorowości statystycznej, ma informować o zależnościach(prawidłowościach) dotyczących całej zbiorowości a nie cechach poszczególnych jednostek.
Wybór metody statystycznej- zależy od zbiorowości, celu badania, tematu, od szczegółowości badania, środków finansowych, możliwości technicznych.
Szacunki interpolacyjne- szacowanie nieznanych wartości zmiennych, kiedy znamy wartości sąsiednie.
Szacunki ekstrapolacyjne- kiedy wykraczamy poza zbiór znanych nam wartości przy szacowaniu nieznanych wartości.
Rodzaje badań statystycznych:
Badania ciągłe- robione nieprzerwanie, np. liczba urodzeń i zgonów, PKB, rejestracja bieżąca,
Badania okresowe- robione w równych odstępach czasowych np. spisy powszechne,
Badania doraźne- jednorazowe, przeprowadzane w szczególnych okolicznościach.
Etapy przygotowania badania statystycznego:
przygotowanie( organizacja) badania
jaki cel badania,
wybranie metody,
zdefiniowanie zbiorowości statystycznej,
jaki problem,
jak wygląda operacjonalizacja,
czy badanie pełne, czy nie; jeśli nie to jak dobieramy próbę (wylosowanie próby),
zdefiniowanie jednostki (również cechy stałe pod względem rzeczowym, czasowym)
*Elementy tego etapu nie powinny później ulegać zmianie podczas badania, gdyż wszystkie jednostki powinny zostać przebadane w ten sam sposób; aby wykryć ewentualne błędy- badanie pilotażowe i po nim ewentualne poprawki.
*W tym etapie elementy statystyczne: wylosowanie próby, losowy dobór próby, błąd statystyczny, wzory na liczebność próby.
obserwacja statystyczna:
uzależniony od metody, próby, czego dotyczy badanie (ogólne odpowiedzi na punkt pierwszy)
ustalenie wartości, wariantów cech jednostek badanej społeczności,
obserwacja statystyczna polega na ustaleniu wariantów lub odmian cech jakościowych lub ustaleniu wartości cech ilościowych u wszystkich jednostek zbiorowości lub u jednostek próby,
materiał statystyczny- zbiór danych zebranych w wyniku obserwacji:
pierwotny- takie dane, które są zebrane specjalnie do badania statystycznego,
wtórny- dane statystyczne zebrane z innych powodów i wykorzystane do badania statystycznego,
surowy materiał statystyczny- zbiór w pierwotnej postaci, nieprzekształcone, bez obróbki,
*błędy wynikające z nieuwagi, nieumyślne, techniczne i błędy systematyczne(gdy wielokrotnie powtarzane np. przez ankieterów) prowadzą do zniekształcania odpowiedzi,
kontrola badań ilość (np. czy 100 ankiet) i merytoryczna (czy pytania dobrze zadane, czy występują błędy językowe itd.),
przyporządkowanie każdej jednostce konkretnej zmiennej.
opracowanie i prezentacja materiału statystycznego:
grupowanie danych (wyodrębnienie z całej próby różnych grup)- różne sposoby w zależności od celu badania,
rodzaje grupowań:
proste (ze względu na jedną cechę)
np. mężczyźni- kobiety,
złożone (więcej cech branych pod uwagę- 1.
cechy powiązane, uzupełniające się)
np. płeć + bezrobocie
*Grupowanie musi być wyczerpujące i rozłączne, jeśli badania są cykliczne to sensowne jest grupowanie danych tak jak wcześniejsze (możliwość porównań), liczba grup nie powinna być zbyt duża, a jednostki należące do tej samej grupy powinny być jednorodne lub względnie jednorodne.
typologiczne- grupy wyodrębniane ze
względu na cechy jakościowe, 2.
wariancyjne- stosuje się cechę ilościową
zliczanie danych,
prezentacja materiału statystycznego:
graficzne przedstawienie danych,
histogram
krzywa kumulacyjna
diagram
tablice
tabelaryczne przedstawienie danych (w tym ciąg liczb),
*Rozkład a szereg:
rozkład:
rozkład statystyczny,
rozkład częstotliwości,
liczebności,
empiryczny,
szereg:
szereg statystyczny- zbiór wyników obserwacji jednostek zaprezentowany wg pewnej cechy,
rodzaje:
szeregi wyliczające (szczegółowe)- uporządkowany ciąg liczb rosnąco lub malejąco (wg wartości badanej cechy)
szeregi rozdzielcze
dla cech mierzalnych
punktowe- dla cech skokowych, konkretnej wartości przyporządkowana liczebność np.,
Liczba dzieci |
Liczba rodzin |
0 |
20 |
1 |
23 |
2 |
40 |
3 |
4 |
przedziałowe (klasowe)- dla cech skokowych i ciągłych np.
Przedział |
Liczebność |
0-5 |
3 |
5-10 |
2 |
10-15 |
10 |
dla cech niemierzalnych- są słowami cech jakościowych np.
Wyznanie |
Liczebność |
Katolicy |
15 |
Protestanci |
20 |
szeregi czasowe(momentów, okresów)
szeregi przestrzenne:
charakterystyka:
dla cech niemierzalnych- słowa np. wyznanie: Żydzi, katolicy, z drugiej strony ilość,
szeregi szczegółowe- szereg nieuporządkowany lub uporządkowany- wartości lub odmiany cech uporządkowane rosnąco, malejąco lub występujące obok siebie (szereg szczegółowy- uporządkowany ciąg liczb),
szeregi punktowe- cechy skokowe (konkretne wartości z jednej strony, z drugiej liczebność),
szeregi przedziałowe- i dla skokowych i dla przedziałowych, gdyż w jednym i w drugim przypadku mamy do czynienia z przedziałami
Tworzenie przedziałów (dwie koncepcje):
humanistyczna- górna granica przedziału poprzedzającego nie jest równa dolnej granicy przedziału następnego
0-4
5-9
10-14 itd.
Lukę:
albo dzielimy na pół dodając po połowie do każdego z sąsiadujących przedziałów, a pomiar równy granicom sąsiadujących przedziałów kwalifikujemy do przedziału o wyższej wartości,
albo zaliczamy całą do przedziału o niższych wartościach.
*Badacz sam decyduje o sposobie konstrukcji szeregu przedziałowego.
koncepcja II- ekonomiczna:
0-5
5-10
10-15
Może ona być interpretowana także na dwa sposoby- jeśli nie ma wskazówek to nie wiadomo jak zinterpretować, dlatego czasami zaznaczane są przedziały w nawiasach <...)- lewostronnie zamknięty, czyli liczbę z lewej strony zaliczamy do tego przedziału, lub niekiedy wskazówki są pisane słownie np. pomiar równy 5 kwalifikujemy do przedziału 5-10.
Istnieją również wzory, które pozwalają obliczyć liczbę przedziałów oraz ich szerokość. Wydaje się jednak, że najwygodniej jest stosować przedziały o równej szerokości, np. 2,5,10, gdyż istnieje możliwość porównania z innymi zbiorowościami, porównanie tej samej zbiorowości w różnych okresach, przejrzystość w prezentacji wyników.
Wzory na liczbę przedziałów(liczba przedziałów uzależniona od N np. N=100 k=√100=10)
k=√N k- liczba przedziałów
k=3/4√N
k=1+ 3,322 log N
interwał (szerokość przedziału)
*Przedziały nie muszą być sobie równe, a skrajne przedziały mogą być otwarte.
opis lub wnioskowanie statystyczne:
Opis statystyczny ma charakter sumaryczny, dotyczy całej zbiorowości a nie poszczególnych jednostek. Opisu statystycznego dokonujemy za pomocą miar (średnia, odchylenie standardowe). Dotyczy zbiorowości lub próby.
Wnioskowanie statystyczne- jest związane z badaniem reprezentatywnym na próbie losowej, gdy wyniki uzyskane z tej próby są uogólnione na całą populację.
Charakterystyki opisowe struktury zbiorowości (miary statystyczne), które można obliczyć lub wskazać dla danej próby czy też zbiorowości. W oparciu o charakterystyki opisowe możemy przystąpić do analizy i wyciągnięcia wniosków z danych. Cel- zaobserwowanie prawidłowości w zbiorowości.
populacja próba
parametr statystyka(estymator) -miara statystyczna
*średnia w próbie jest estymatorem odpowiedniego parametru w populacji
**estymacja- szacowanie
27.11.07
Charakterystyki opisowe struktury zbiorowości- miary statystyczne.
Dokonując analizy struktury badanej zbiorowości statystyka proponuje kilkanaście miar statystycznych, które pozwalają przejść od wiadomości dotyczących poszczególnych jednostek do wiadomości dotyczących całej zbiorowości. Miary te należą do czterech grup: m. średnie, m. zróżnicowania, m. asymetrii, m. koncentracji.
Miary te służą, by lepiej niż graficznie przedstawić dane, by móc: opisać prawidłowości zachodzące w badanej zbiorowości, porównywać dwie różne zbiorowości pod względem tej samej zmiennej, porównać w ramach tej samej zbiorowości dwie lub więcej zmiennych. Dwie pierwsze kategorie są najistotniejsze dla socjologa.
Miary średnie(tendencji centralnej, położenia, przeciętne poziomu wartości zmiennej)- służą do tego, aby za pomocą jakiejś liczby określić wokół jakiej wartości rozmieszczone są wszystkie wartości danej zbiorowości.
Klasyczne (charakteryzują zbiorowość na podstawie wszystkich wartości szeregu):
Średnia asymetryczna
Średnia harmoniczna
Średnia harmoniczna
Pozycyjne (są wartościami konkretnych wyrazów szeregu, w szeregu wyróżniają się pod jakimś względem:
Dominanta (modalna)
Kwantyle:
kwartyle,
kwintyle,
decyle,
centyle,
mediana
Miary zróżnicowania (rozproszenia, zmienności, dyspersji)- mówią o rozproszeniu jednostek.
Klasyczne:
Odchylenie standardowe,
Odchylenie średnie(przeciętne),
Wariancja,
Współczynnik zmienności*,
Pozycyjne:
Odchylenie ćwiartkowe,
Rozstęp,
Współczynnik zmienności,
*w zależności od stosowanego wzoru.
Miary asymetrii(skośności)- służą do badania kierunku zróżnicowania danej zmiennej.
Miary koncentracji- służą do tego, by określić wokół jakiej wartości koncentrują się badane jednostki lub w jaki sposób koncentrują się wokół średniej.
Miary te służą do tego:
by lepiej niż graficznie przedstawić dane,
by opisać badaną zbiorowość,
by opisać prawidłowości zachodzące w badanej zbiorowości,
by porównać dwie różne zbiorowości pod względem tej samej zmiennej,
by porównać w ramach tej samej zbiorowości dwie lub większą liczbę zmiennych.
Charakterystyka miary statystycznej:
nazwa
do jakiej grupy należą,
symbol,
sposób wskazania lub obliczania (wzór)- uzależniony od sposobu prezentacji danych,
własności,
interpretacja
Średnia arytmetyczna- symbole: x, y, M suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzielona przez liczbę tych jednostek.
Wzory:
dla szeregu punktowego:
dla szeregu przedziałowego:
dla szeregu szczegółowego:
Suma odchyleń wszystkich pomiarów od średniej wynosi 0:
11.12.07
Mediana- symbole Me lub Md (miara średnia pozycyjna)- dzieli zbiorowość na dwie części; nie można mówić że jedna połowa jest większa, a druga mniejsza od mediany, gdyż wszystkie wartości mogą mieć tę samą wartość. Dlatego bezpieczniej mówić, że połowa nie większa i połowa nie mniejsza.
Wzory:
dla szeregu szczegółowego:
parzystego,
nieparzystego;
Jeśli 9 pomiarów to (9+1)/2 czyli podstawiamy wartość piątego pomiaru w szeregu.
*Ważne, żeby szereg był uporządkowany!
N |
Liczebność skumulowana |
23 |
39 |
50 |
57 |
58 |
dla szeregu punktowego:
xi zmienna |
fi ni jednostka |
Liczba dzieci |
Liczba rodzin |
0 |
23 |
1 |
16 |
2 |
11 |
3 |
7 |
4 |
1 |
Potrzebna liczebność skumulowana
Wskazując medianę w szeregu rozdzielczym punktowym korzystamy ze wzorów dla szeregu szczegółowego. Znaczenie ma zatem to, czy szereg jest parzysty, czy nieparzysty. Wskazanie mediany ułatwia skumulowanie liczebności. Kumulacja polega na narastającym sumowaniu liczebności dotyczących poszczególnych wariantów cech, zatem wartości dla szeregów parzystych lub wartości nieparzystych odczytujemy z wartości skumulowanej.
szereg przedziałowy
Wiek |
Ilość osób |
Liczebność skumulowana |
0-5 |
15 |
15 |
5-10 |
22 |
37 |
10-15 |
13 |
50 |
15-20 |
7 |
57 |
20-25 |
2 |
N=59 |
Połowa=29,5
a)
i
we wzorze a i b występują F, które mają różne znaczenie
b)
c)
Wzory a i c- objaśnienia:
l (x Me)- dolna granica przedziału, w którym znajduje się mediana,
N- liczebność zbiorowość,
F- liczebność skumulowana odpowiadająca dolnej granicy przedziału zawierającego medianę (wartość skumulowana do przedziału z medianą), suma liczebności od pierwszego przedziału, do tego w którym znajduje się mediana,
f (n Me)- liczebność przedziału, w którym znajduje się mediana,
i ( i Me)- szerokość przedziału, w którym znajduje się mediana.
Wzór b:
l- górna granica przedziału, którym mediana,
F- liczebność skumulowana odpowiadająca górnej granicy przedziału z medianą
Wskazówki:
a) Wskazanie przedziału, w którym jest mediana czyli N/2 i szukamy, gdzie w wartości skumulowanej znajduje się ta wartość
( wynik musi się mieścić w przedziale 5-10)
22
X=15 x=37
Wskazany
przedział
5 x16 x17 10
5
x=29,5
czyli: 5+ (29,5 -15)* 5/22
(a-dodajemy tyle odcinków, aby dojść do środkowego w b- odejmujemy tyle przedziałów, żeby dojść do wartości środkowej )
założenie: pomiary są równo rozmieszczone w tym przedziale.
b)
Interpretacja Mediany- połowa pomiarów nie większa niż wartość mediany a połowa pomiarów nie mniejsza. Na wartość mediany nie mają wpływu wartości skrajne.
Kwartyle- są to wartości cechy badanej w zbiorowości, które dzielą zbiorowość na określone części ze względu na liczby jednostek; części te nie muszą być równe- niezbędne szeregi uporządkowane.
Kwartyle:
Q1- kwartyl pierwszy (dolny), 25% jednostek ma wartości cechy niższe, a 75% wyższe od kwartyla drugiego (lub równe)
Q2- kwartyl drugi (mediana),
Q3- kwartyl górny, 75% jednostek ma wartości niższe lub równe, a 25% większe lub równe.
zbiorowość
Q1 Q2 Q3
Md
Każdy kwartyl dzieli zbiorowość na dwie części. Aby obliczać kwartyle zbiorowość musi być dość liczna, dlatego kwartyli dla szeregów szczegółowych raczej się nie wskazuje. Kwartyle najczęściej oblicza się dla szeregów przedziałowych.
Kwartyl pierwszy i trzeci oblicza się przy zbiorowościach dostatecznie dużych, przy czym nie wiadomo ile dokładnie powinna wynosić dolna granica zbiorowości.
Dla szeregów rozdzielczych wzory są analogiczne jak dla mediany:
Decyle- dzielą zbiorowość na 10 części (jest 9 decyli, 5 decyl to mediana)
Np. decyl 7 dzieli zbiorowość, tak że 70% wszystkich wartości jest mniejszych bądź równych wartości 7 decyla, a 30% jest większych bądź równych tej wartości.
Centyle (pencentyle)- dzielą zbiorowość na 100 części (99 centyli, 50 centyl to mediana).
18.12.07
Miary zróżnicowania(dyspersji, rozproszenia):
miary klasyczne:
odchylenie standardowe,
odchylenie średnie,
wariancja,
współczynnik zmienności,
miary pozycyjne:
odchylenie ćwiartkowe,
współczynnik zmienności,
rozstęp.
Miary zróżnicowania mają informować o tym w jakim stopniu różnią się jednostki w danej zbiorowości. Naturalną jest próba oceny tego zróżnicowania polegająca na tym, że porównujemy wszystkie jednostki do średniej, ponieważ:
Σ(xi -x)=0 (zawsze suma odchyleń jest równa zero)
to wykorzystujemy na dwa sposoby
Σ|xi -x| lub Σ(xi -x)2
Odchylenie standardowe- pierwiastek kwadratowy z ilorazu sumy kwadratów różnic poszczególnych pomiarów i średniej przez liczbę tych pomiarów.
Symbol odchylenia standardowego:
s- jako estymator, statystyka (czyli dla próby) lub
δ- jako parametr (czyli dla populacji).
Wzory:
dla szeregu szczegółowego:
dla szeregu punktowego
dla szeregu przedziałowego
Wariancja (s2)- kwadrat odchylenia standardowego
lub
Odchylenie średnie(przeciętne)- iloraz sumy modułów różnic pomiarów od średniej przez liczbę tych pomiarów.
Symbol odchylenia średniego- d.
Wzory:
dla szeregu szczegółowego
dla szeregu punktowego
dla szeregu przedziałowego
Interpretacja: każdy pomiar jest oddalony od średniej np. o 5.
Odchylenie średnie(podobnie jak odchylenie standardowe) może najmniej wynosić zero. Górna granica w obu przypadkach nie jest określona.
d<s zależność ta występuje zawsze
wykluczając przypadek z 0
Współczynnik zmienności- istnieją cztery sposoby definiowania tego współczynnika (w zależności jakimi danymi dysponujemy). Służy on do porównywania zróżnicowania dwóch (lub więcej) zbiorowości lub zmiennych.
Dzięki niemu możemy odpowiadać na pytania typu „Która ze zbiorowości jest bardziej zróżnicowana” warunkiem jest, żeby współczynnik w obu (lub więcej) zbiorowościach był liczony z tego samego wzoru.
Współczynnik zmienności ma zastosowanie tylko w statystyce opisowej.
Symbol: v
Wzory:
100% lub
najlepiej liczyć z tych wzorów
100%
Rozstęp (empiryczny rozmiar zmienności)- różnica pomiędzy wielkością największą a wielkością najmniejszą w badanej zbiorowości
Symbol: R
Wzór:
R= x max- x min
w szeregu szczegółowym x N- x1
w szeregu punktowym x N- x1
w szeregu przedziałowym dwie możliwości:
górna granica ostatniego przedziału minus dolna granica pierwszego przedziału,
środki skrajnych przedziałów.
08.01.08
Która ze zbiorowości jest bardziej zróżnicowana?
s1=20 nie można powiedzieć, gdyż nie znamy średniej
s2=30
s1=10 podobnie jak w a.
s2=10
v1=80% bardziej zróżnicowane v1
v2=20%
v1=30% takie samo zróżnicownie
v2=30%
d1=3 nie można powiedzieć
s2=2
np. 1,2,3 x = 2
101,102,103 x=2
Powoływanie się na v, aby dowiedzieć się z jakimi rzędami liczb mamy do czynienia.
Tabela 1. Zadowolenie z życia
|
Wielka Brytania |
Niemcy |
Włochy |
USA |
Średnia |
6,7 |
6,7 |
6,6 |
6,5 |
Odchylenie standardowe |
|
|
3,2 |
1,3 |
Warunek zastosowania- bardziej zróżnicowana
Takie same średnie (więcej ludzi bardziej zadowolonych
i mniej zadowolonych)
reszta wokół średniej
Tabela 2. Poparcie względem aborcji
|
Stan 1 |
Stan 2 |
Stan 3 |
Stan 4 |
Średnia |
5,48 |
4,82 |
3,67 |
5,82 |
Odchylenie standardowe |
2,9 |
2,9 |
2,8 |
2,7 |
Współczynnik zmienności |
0,53 |
0,60 |
0,76 |
0,46 |
Na przykładzie tabeli dwa widać, że do porównywania dwóch zbiorowości, jeśli średnie są różne może służyć tylko współczynnik zmienności, który pokazuje relatywne zróżnicowanie w stosunku do średniej.
Zadanie 1
I |
II |
K1= 4 |
M1=8 |
K2= 4 |
M2=2 |
x1 =4 x2 =4
s- najmniej 0 najwięcej średnia
v- zawiera się od 0 do 1 (lub 0% do 100%)
1