Wykład 2
Miary zmienności
Standaryzacja
Prof. Grzegorz Sędek
Krótkie przypomnienie
Rodzaj miary tendencji centralnej
Skala:
Modalna/
dominanta
Mediana
Średnia
nominalna
porządkowa
ilościowe
Krótkie przypomnienie
Rodzaj miary tendencji centralnej
Skala:
Modalna/
dominanta
Mediana
Średnia
nominalna
porządkowa
ilościowe
Miary zmienności
(rozproszenia) wyników
rozkładu
• Oprócz znajomości tendencji centralnej dla danego rozkładu wyników,
podstawową własnością rozkładu jest zmienność (rozproszenie)
wyników.
• Oceny Studenta A: 4, 4, 4
• Oceny studenta B: 2, 4, 6
Zmienność różnych właściwości/
cech, jako podstawa badań
empirycznych.
Podstawowe miary zmienności:
rozstęp
wariancja
odchylenie standardowe
Miary zmienności
• Rozstęp jest rozumiany jako różnica między
największym i najmniejszym pomiarem
• Rozstęp dla studenta A =4-4= 0; dla studenta B = 6-
2=4
• Wariancja (variance) jest to suma kwadratów
odchyleń wszystkich wyników od średniej dzielona
przez liczbę wyników minus 1.
Wariancja = s
2
= (x
i
- M)
2
/(N-1)
• Odchylenie standardowe (SD – standard deviation)
to pierwiastek z wariancji.
SD = (s
2
)
Oceny studenta A: 4,
4, 4
Oceny studenta B: 2,
4, 6
Kolejne kroki obliczania
wariancji i odchylenia
standardowego
1. Obliczyć średnią (M = 4).
2. Obliczyć odchylenia od średniej (odjąć
średnią od każdego wyniku: -2, 0, 2).
3. Obliczyć kwadraty odchyleń od średniej
(4, 0, 4)
4. Obliczyć sumę kwadratów odchyleń od
średniej (4+0+4=8)
5. Obliczyć średnią kwadratów odchyleń od
średniej (poprzednią sumę podzielić
przez liczbę przypadków minus 1; 8/2 =
4).
Obliczyliśmy wariancję
s
2
=
4.
6. Obliczamy odchylenie standardowe =
pierwiastek z wariancji
SD = 2.
Wariancja i odchylenie standardowe dla
ocen studenta A = 0 (brak zmienności
wyników)
Oceny studenta A: 4,
4, 4
Oceny studenta B: 2,
4, 6
Wyniki
surowe
Wynik –
średnia
Kwadrat
różnicy
4
0
0
4
0
0
4
0
0
2
-2
4
4
0
0
6
2
4
Średnia=
4
Suma=0
Suma=0
Średnia=
4
Suma=0
Suma=8
Wpływ dodawania wartości stałej na
miary tendencji centralnej i miary
rozproszenia
• Dodanie wartości stałej do
wszystkich wyników
zmienia średnią, medianę i
dominantę (modalną) o tę
wartość. Nie zmienia
wariancji i odchylenia
standardowego.
Np. aby zlikwidować liczby
ujemne dla zbioru danych:
2, 3, -3, -4, 2; dodano do
wszystkich wyników
wartość stałą 5, nowe
dane:
7, 8, 2, 1, 7
Statystyki
5
5
6
6
,00
5,00
2,00
7,00
2
7
3,24
3,24
10,50
10,50
7
7
Ważne
Braki danych
N
Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp
D1
D1_P_5
Wpływ mnożenia przez wartość stałą na
miary tendencji centralnej i miary
rozproszenia
• Pomnożenie wszystkich wyników przez stałą zmienia
średnią, medianę i dominantę – są one iloczynem
poprzedniej wartości i stałej.
• Zmienia również wariancję (poprzednia wartość razy
kwadrat stałej) oraz odchylenie standardowe (poprzednia
wartość razy wartość bezwzględna stałej).
• Analogiczne zmiany zachodzą w przypadku dzielenia
wyników przez stałą.
• Weżmy np. kilka czasów reakcji wyrażonych w
mikrosekundach (800; 1600; 1800; 600) i zamieńmy je na
sekundy (0,8; 1,6; 1,8; 0,6)
Dzielenie wszystkich wyników przez stałą -
przykład
Statystyki
4
4
7
7
1200,00
1,2000
1200,00
1,2000
600
a
,60
a
588,78
,5888
346666,67
,3467
1200
1,20
Ważne
Braki danych
N
Średnia
Mediana
Dominanta
Odchylenie standardowe
Wariancja
Rozstęp
T1
T1_1000
Istnieje wiele wartości modalnych. Podano wartość najmniejszą.
a.
Wyniki standardowe (standaryzowane)
– wartości “z”
• Wyniki w takiej postaci, w jakiej zostały pierwotnie uzyskane
w badaniu, określa się mianem wyników surowych. Dla
porównania wyników osiąganych na różnych skalach (np.
porównania ocen przy różnych skalach oceniania, lub
wyników testów o różnej ilości punktów) przekształca się
wyniki surowe na wyniki wyrażone w jednostkach odchylenia
standardowego – są to wyniki standardowe (nazywane w
SPSS standaryzowanymi), czyli tzw. wartości „z”.
• z
i
= (x
i
– M)/SD
M – średnia (mean)
SD – odchylenie standardowe (standard deviation)
wartość standaryzowana “z” danego wyniku “x” = wynik
surowy (x
i
) minus średnia (M) dzielone przez odchylenie
standardowe (SD)
Hipotetyczne stopnie studenta SWPS w sesji :
6, 2, 4+, 3+, 4
zamiana na wyniki standardowe
średnia M = 4;
wariancja s
2
= (4+4+0,25+0,25+0)/4 = 2,12
odchylenie standardowe SD = 1,46
wartości standaryzowane “z” poszczególnych wyników:
z
1
= (6 – 4)/1,46 = 1,37 (dodatnia wartość “z”)
z
2
= (2 - 4)/1,46 = -1,37 (ujemna wartość “z”)
z
3
= (4,5 - 4)/1,46 = 0,34 (lekko dodatnia wartość „z”)
z
4
= (3,5 - 4)/1,46 = -0,34 (lekko ujemna wartość „z”)
z
5
= (4 - 4)/1,46 = 0 (wynik równy średniej)
Właściwości wyników standardowych “z”
dla danej próby wyników:
średnia wyników „z” = 0; wariancja = 1
wyniki „z” bliskie średniej M są bliskie
wartości “0”,
wyniki dokładnie równe średniej są równe
zeru.
wyniki “z” mniejsze od średniej M są ujemne
wyniki “z” większe od średniej M są dodatnie