Miary tendencji
centralnej
Tendencja centralna to inaczej przeciętna
wartość wyników pomiarów. Wartość ta jest
zazwyczaj bliska punktowi największego
skupienia pomiarów i można ją uwazać za
najbardziej typową dla całego zbioru.
Powszechnie stosowane miary tendencji
centralnej to:
· średnia arytmetyczna
· mediana
· modalna, dominanta
Własności
średniej
arytmetycznej
(M)
Średnia arytmetyczna to suma zbioru pomiarów
podzielona
przez
liczbę
pomiarów
w
zbiorze.Oznacza się ją często przez M (od ang.
mean)
M = (p
1
+p
2
+....p
N
)/N= (p
i
)/N
Niektóre właściwości średniej:
suma odchyleń wszystkich pomiarów od
średniej arytmetycznej jest równa zeru
suma kwadratów odchyleń od średniej
arytmetycznej jest mniejsza niż suma kwadratów
odchyleń od dowolnej innej wartości.
Mediana (Me)
Mediana jest wartością dzielącą wszystkie pomiary na
pół, tak że połowa pomiarów mieści się poniżej niej, a
połowa powyżej. Medianę oblicza się najczęściej wtedy
gdy pojawiają się bardzo nietypowe wyniki, a nie ma
powodów aby je eliminować
Znajdowanie mediany dla nieparzystej liczby pomiarów
– jest to wynik środkowego pomiaru (wyznaczanie
mediany dla zarobków w tys. zł:
3, 2, 70, 1, 2; Me = 2 ; M = 15,6
Znajdowanie mediany dla parzystej liczby pomiarów –
jest to średni wynik dwóch środkowych osób
(dla zarobków 3, 2,70, 1; Me = 2,5 = (2+3)/2
Znajdowanie mediany dla przedziałów klasowych
Skośność rozkładu a miary tendencji
centralnej
Dominanta (w literaturze częściej nazywana
modalną lub modą Md) jest wartością występującą
najczęściej w rozkładzie wyników.
Związki między wartościami średniej a mediany w
zależności od skośności rozkładu):
(a) dla rozkładu częstości (wyraźnie) skośnego
dodatnio - średnia jest większa niż mediana, zaś
mediana większa niż dominanta
(b) dla rozkładu częstości (wyraźnie) skośnego
ujemnie - średnia jest mniejsza niż mediana., zaś
mediana mniejsza niż dominanta
Skośność a miary tendencji
centralnej
Średnia
3,67
Mediana
3,50
Dominanta
3
Skośność
,857
Dla rozkładu wyraźnie
skośnego dodatnio:
M> Me> Md
STU_CD
5,00
4,50
4,00
3,50
3,00
rozkład ocen studenta CD
rozkład skośny dodatnio
C
zę
st
oś
ć
3,5
3,0
2,5
2,0
1,5
1,0
,5
0,0
Odch.Std = ,82
Średnia = 3,67
N = 6,00
Miary zmienności (rozproszenia)
wyników rozkładu
Oprócz znajomości tendencji centralnej dla danego
rozkładu wyników, podstawową własnością rozkładu jest
zmienność (rozproszenie) wyników.
Oceny Studenta A: 4, 4, 4
Oceny studenta B: 2, 4, 6
Zmienność różnych właściwości, jako podstawa badań
empirycznych.
Podstawowe miary zmienności:
rozstęp, wariancja, odchylenie standardowe.
Miary zmienności
Rozstęp jest rozumiany jako różnica między
największym i najmniejszym pomiarem
Rozstęp dla studenta A =4-4= 0; dla studenta B = 6-2=4
Wariancja (variance) jest to suma kwadratów odchyleń
wszystkich wyników od średniej dzielona przez liczbę
wyników minus 1.
Wariancja = s
2
= (x
i
- M)
2
/(N-1)
Odchylenie standardowe (SD – standard deviation)
to pierwiastek z wariancji.
SD = (s
2
)
Kolejne kroki obliczania wariancji i
odchylenia standardowego (
na przykładzie
ocen studenta B: 2, 4, 6 i A: 4, 4, 4)
1. Obliczyć średnią (M = 4).
2. Obliczyć odchylenia od średniej (odjąć średnią od każdego
wyniku: -2, 0, 2).
3. Obliczyć kwadraty odchyleń od średniej (4, 0, 4).
4. Obliczyć sumę kwadratów odchyleń od średniej (4+0+4=8).
5. Obliczyć średnią kwadratów odchyleń od średniej
(poprzednią sumę podzielić przez liczbę przypadków minus 1;
8/2 = 4).
Obliczyliśmy wariancję
s
2
= 4.
6. Obliczamy odchylenie standardowe = pierwiastek z
wariancji
SD = 2.
Wariancja i odchylenie standardowe dla ocen studenta A = 0
(brak zmienności wyników)
Wpływ dodawania wartości stałej na
miary tendencji centralnej i miary
rozproszenia
Dodanie wartości stałej
do wszystkich wyników
zmienia średnią, medianę i
dominantę (modalną) o tę
wartość. Nie zmienia
wariancji i odchylenia
standardowego.
Np. aby zlikwidować liczby
ujemne dla zbioru danych:
2, 3, -3, -4, 2; dodano do
wszystkich wyników
wartość stałą 5, nowe
dane:
7, 8, 2, 1, 7
Statystyki
5
5
6
6
,00
5,00
2,00
7,00
2
7
3,24
3,24
10,50
10,50
7
7
Ważne
Braki danych
N
Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp
D1
D1_P_5
Wpływ mnożenia przez wartość stałą na
miary tendencji centralnej i miary
rozproszenia
Pomnożenie wszystkich wyników przez stałą zmienia
średnią, medianę i dominantę – są one iloczynem
poprzedniej wartości i stałej.
Zmienia również wariancję (poprzednia wartość razy
kwadrat stałej) oraz odchylenie standardowe (poprzednia
wartość razy wartość bezwzględna stałej).
Analogiczne zmiany zachodzą w przypadku dzielenia
wyników przez stałą.
Weżmy np. kilka czasów reakcji wyrażonych w
mikrosekundach (800; 1600; 1800; 600) i zamieńmy je na
sekundy (0,8; 1,6; 1,8; 0,6)
Dzielenie wszystkich wyników przez stałą -
przykład
Statystyki
4
4
7
7
1200,00
1,2000
1200,00
1,2000
600
a
,60
a
588,78
,5888
346666,67
,3467
1200
1,20
Ważne
Braki danych
N
Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp
T1
T1_1000
Istnieje wiele wartości modalnych. Podano wartość najmniejszą.
a.
Wyniki standardowe
(standaryzowane) – wartości “z”
Wyniki w takiej postaci, w jakiej zostały pierwotnie uzyskane w
badaniu, określa się mianem wyników surowych. Dla
porównania wyników osiąganych na różnych skalach (np.
porównania ocen przy różnych skalach oceniania, lub wyników
testów o różnej ilości punktów) przekształca się wyniki surowe
na wyniki wyrażone w jednostkach odchylenia standardowego –
są to wyniki standardowe (nazywane w SPSS
standaryzowanymi), czyli tzw. wartości „z”.
z
i
= (x
i
– M)/SD
M – średnia (mean)
SD – odchylenie standardowe (standard deviation)
wartość standaryzowana “z” danego wyniku “x” = wynik
surowy (x
i
) minus średnia (M) dzielone przez odchylenie
standardowe (SD)
Hipotetyczne stopnie studenta SWPS w
sesji :
6, 2, 4+, 3+, 4
zamiana na wyniki standardowe
średnia M = 4;
wariancja s
2
= (4+4+0,25+0,25+0)/4 = 2,12
odchylenie standardowe SD = 1,46
wartości standaryzowane “z” poszczególnych wyników:
z
1
= (6 – 4)/1,46 = 1,37 (dodatnia wartość “z”)
z
2
= (2 - 4)/1,46 = -1,37 (ujemna wartość “z”)
z
3
= (4,5 - 4)/1,46 = 0,34 (lekko dodatnia wartość „z”)
z
4
= (3,5 - 4)/1,46 = -0,34 (lekko ujemna wartość „z”)
z
5
= (4 - 4)/1,46 = 0 (wynik równy średniej)
Właściwości wyników standardowych
“z” dla danej próby wyników:
średnia wyników „z” = 0; wariancja = 1
wyniki „z” bliskie średniej M są bliskie
wartości “0”,
wyniki dokładnie równe średniej są równe
zeru.
wyniki “z” mniejsze od średniej M są ujemne
wyniki “z” większe od średniej M są dodatnie
PYTANIE EGZAMINACYJNE
(termin A, 1999/2000)
Anna otrzymała ocenę 5 z egzaminu (średnia ocen w
jej grupie 3, wariancja ocen 4). Marek otrzymał
ocenę 3,5 z egzaminu (średnia ocen w jego grupie
2,5; odchylenie standardowe ocen 1,5). Który ze
studentów wypadł lepiej na tle swojej grupy?
A.
Anna i Marek jednakowo
B.
Marek
C.
Anna
D.
Nie da się tego określić
C