Normalizacja testu
Wynik uzyskany w teście to tzw. wynik surowy.
Nie daje on jeszcze podstawy do oceny poziomu
mierzonej cechy badanego.
Na podstawie wyników surowych nie można
porównać dwóch osób przebadanych danym
testem, ani wyników w dwóch różnych testach.
Normy są układem odniesienia dla wyniku
testowego; nadają mu znaczenie i podstawę
interpretacji. („Jak badany wypada na tle innych?”)
Normy pokazują:
a.
czy na tle określonej populacji otrzymany
wynik surowy jest wynikiem przeciętnym,
niskim czy może wysokim;
b.
na ile odbiega od wyniku przeciętnego;
c.
jak ocenić aktualny wynik z innymi wynikami
tej osoby (także w tym samym teście).
Wyniki standaryzowane
z
X
X
s
= −
z = wynik standaryzowany,
X = wynik surowy,
X = średnia arytmetyczna,
s = odchylenie standardowe
Wynik standaryzowany z wskazuje na odległość
wyniku od średniej wyrażoną w jednostkach odchylenia
standardowego.
Rozkład wyników wyrażonych w jednostkach z, czyli
rozkład standaryzowany
, ma zawsze (z definicji) taką
samą średnią X = 0 i takie same odchylenie standardowe
s = 1, co pozwala porównywać standaryzowane wyniki
różnych testów / pomiarów.
Odchylenie standardowe ma interpretację jeśli znamy
rozkładu z którego pochodzi.
Zazwyczaj interpretuje się z jako odchylenie
standardowe w rozkładzie normalnym.
Należy pamiętać że standaryzacja nie zmienia rozkładu
wyników (nie normalizuje go). Wyniki standaryzowane
mają dokładnie taki sam rozkład jak wyniki surowe. Jeśli
nie znamy rozkładu wyników nie wiemy jak interpretować
z.
Przykład:
Załóżmy, że zmienna „wzrost” ma w populacji A rozkład
normalny ze średnią X = 175cm i odchyleniem
standardowym
σ
= 5 cm.
Wyniki wyrażone w cm (skala stosunkowa) możemy zamienić
na z, np.:
X1 = 178
z = (178-175)/5 = 3/5 = 0.6
X2 = 162
z = (162-175)/5 = -13/5 = -2.6
X3 = 175
z = 0.
Z przykładu widać, że możemy w tym wypadku traktować
z jako jednostki skali interwałowej (tj. jako jednostki równe)
wyrażające odległość wyniku od średniej w populacji.
Najpopularniejsza typologia wyników standardowych:
-2z i poniżej - wyniki bardzo niskie (ok. 2,27%
populacji)
-1z do –2z - wyniki niskie (około 13,59%
populacji)
-1z do +1z - wyniki przeciętne (około 68%
populacji)
+2z i powyżej - wyniki bardzo wysokie (około
2,27% populacji)
Skale standardowe o rozkładzie normalnym
Niedogodnością wyników standaryzowanych (jako
sposobu wyrażania wyników testu) jest to, że mogą
przybierać zarówno wartości dodatnie i ujemne.
Skale standardowe o rozkładzie normalnym:
••••
stenowa,
••••
staninowa,
••••
tetronowa,
••••
tenowa (T),
••••
dewiacyjny iloraz inteligencji.
Tworzenie skal o rozkładzie normalnym:
- normalizacja rozkładu i zamiana wyników surowych
na wyniki standaryzowane - z
- zamiana z na umowne wartości, charakterystyczne dla
danej skali
ogólny wzór transformacji:
jednostka nowej skali = (S) (z) + M
M – średnia, S – odchylenie standardowe, z – wynik
standardowy.
Skala
Odchylenie
standardow
e
Średnia
rozkładu
Liczba
jednostek
(zakres skali)
Stenowa
2 steny
5,5 sten
10 (1-10)
(
±±±±
2.25 z)
Staninowa
2 staniny
5 stanin
9 (1-9)
(
±±±±
2 z)
Tetronowa
4 tetrony
10 tetrona
21 (0-20)
(
±±±±
2.5 z)
Tenowa (T)
10 tenów
50 tena
101 (0-100)
(
±±±±
5 z)
Iloraz
inteligencji
15
100
nie określone
Co uzasadnia normalizowanie wyników?
••••
Przyjmuje się, że rozkład większości cech w populacji
jest normalny.
••••
Rozkład zmiennej z próby może odbiegać od
normalnego nawet jeśli w populacji jest on normalny
(błąd próby). W takim wypadku normalizacja
poprawia błąd związany z pobieraniem próby.
••••
Jeśli zmienna ma rozkład normalny nie znaczy to
jeszcze, że rozkład wyników testu musi być też
normalny. Na przykład, jeśli test będzie za trudny
rozkład wyników będzie skośny w lewo, mimo że sama
zmienna ma rozkład normalny.
••••
Ten sam test może mieć różny rozkład w różnych
populacjach (wyniki należy więc normalizować dla
każdej populacji oddzielnie).
••••
Interpretacja wyników o rozkładzie normalnym jest
wygodniejsza niż interpretacja wyników mających inny
rozkładach, lub wyników o rozkładzie nieznanym.
Jaką skalę standardową wybrać?
Skale różnią się dokładnością. Na przykład , 1 sten = 0.5 s
a 1 Ten = 0.10 s. Wybór skali powinien uwzględniać
rzeczywistą dokładność pomiaru (i informować o tym
użytkownika testu).
Jeśli test jest nierzetelny (duży błąd pomiaru) należy
wybrać skalę standardową o „grubych” jednostkach. Jeśli
pomiar pozwala na dokładne różnicowanie wartości
zmiennej można wybrać skalę bardziej dokładną.
Najczęściej podaje się normy w skali centylowej oraz (jeśli
to możliwe) w jednej ze skal o rozkładzie normalnym.
n-ty centyl to punkt na skali wyników surowych poniżej
którego znajduje się (w populacji) n% obserwacji.