Normalizacja testu
Wynik uzyskany w teście to tzw. wynik surowy. Nie daje on jeszcze podstawy do oceny poziomu mierzonej cechy badanego.
Na podstawie wyników surowych nie można porównać dwóch osób przebadanych danym testem, ani wyników w dwóch różnych testach.
Normy są układem odniesienia dla wyniku testowego; nadają mu znaczenie i podstawę interpretacji. („Jak badany wypada na tle innych?”)
Normy pokazują:
a. czy na tle określonej populacji otrzymany wynik surowy jest wynikiem przeciętnym, niskim czy może wysokim;
b. na ile odbiega od wyniku przeciętnego;
c. na ile odbiega od wyniku przeciętnego;
d. jak ocenić aktualny wynik z innymi wynikami tej osoby (także w tym samym teście).
Wyniki standaryzowane
z = wynik standaryzowany,
X = wynik surowy,
=
średnia arytmetyczna,
s = odchylenie standardowe
Wynik standaryzowany z wskazuje na odległość wyniku od średniej wyrażoną w jednostkach odchylenia standardowego.
Rozkład
wyników wyrażonych w jednostkach z,
czyli rozkład standaryzowany, ma zawsze (z definicji) taką samą
średnią
=
0 i takie same odchylenie standardowe
s
= 1, co pozwala porównywać standaryzowane wyniki różnych testów
/ pomiarów.
Odchylenie standardowe ma interpretację jeśli znamy rozkładu z którego pochodzi.
Zazwyczaj interpretuje się z jako odchylenie standardowe w rozkładzie normalnym.
Należy pamiętać że standaryzacja nie zmienia rozkładu wyników (nie normalizuje go). Wyniki standaryzowane mają dokładnie taki sam rozkład jak wyniki surowe. Jeśli nie znamy rozkładu wyników nie wiemy jak interpretować z.
Przykład:
Załóżmy,
że zmienna „wzrost” ma w populacji A rozkład normalny ze
średnią
= 175cm i odchyleniem standardowym
= 5 cm.
Wyniki wyrażone w cm (skala stosunkowa) możemy zamienić na z, np.:
X1 = 178 z = (178-175)/5 = 3/5 = 0.6
X2 = 162 z = (162-175)/5 = -13/5 = -2.6
X3 = 175 z = 0.
Z
przykładu widać, że możemy w tym wypadku traktować
z
jako jednostki skali interwałowej (tj. jako jednostki równe)
wyrażające odległość wyniku od średniej w populacji.
Najpopularniejsza typologia wyników standardowych:
-2z i poniżej - wyniki bardzo niskie (ok. 2,27% populacji)
-1z do –2z - wyniki niskie (około 13,59% populacji)
-1z do +1z - wyniki przeciętne (około 68% populacji)
+2z i powyżej - wyniki bardzo wysokie (około 2,27% populacji)
Niedogodnością wyników standaryzowanych (jako sposobu wyrażania wyników testu) jest to, że mogą przybierać zarówno wartości dodatnie i ujemne.
Skale standardowe o rozkładzie normalnym:
stenowa,
staninowa,
tetronowa,
tenowa (T),
dewiacyjny iloraz inteligencji.
Tworzenie skal o rozkładzie normalnym:
- normalizacja rozkładu i zamiana wyników surowych
na wyniki standaryzowane - z
- zamiana z na umowne wartości, charakterystyczne dla danej skali
ogólny wzór transformacji:
jednostka nowej skali = (S) (z) + M
M – średnia, S – odchylenie standardowe, z – wynik standardowy.
Skala |
Odchylenie standardowe |
Średnia rozkładu |
Liczba jednostek (zakres skali) |
Stenowa
|
2 steny |
5,5 sten |
10 (1-10) (± 2.25 z) |
Staninowa
|
2 staniny |
5 stanin |
9 (1-9) (± 2 z) |
Tetronowa
|
4 tetrony |
10 tetrona |
21 (0-20) (± 2.5 z) |
Tenowa (T)
|
10 tenów |
50 tena |
101 (0-100) (± 5 z) |
Dewiacyjny I.I.
|
15 |
100 |
nie określone |
Co uzasadnia normalizowanie wyników?
Przyjmuje się, że rozkład większości cech w populacji jest normalny.
Rozkład zmiennej z próby może odbiegać od normalnego nawet jeśli w populacji jest on normalny (błąd próby). W takim wypadku normalizacja poprawia błąd związany z pobieraniem próby.
Jeśli zmienna ma rozkład normalny nie znaczy to jeszcze, że rozkład wyników testu musi być też normalny. Na przykład, jeśli test będzie za trudny rozkład wyników będzie skośny w lewo, mimo że sama zmienna ma rozkład normalny.
Ten sam test może mieć różny rozkład w różnych populacjach (wyniki należy więc normalizować dla każdej populacji oddzielnie).
Interpretacja wyników o rozkładzie normalnym jest wygodniejsza niż interpretacja wyników mających inny rozkładach, lub wyników o rozkładzie nieznanym.
Jaką skalę standardową wybrać?
Skale różnią się dokładnością. Na przykład , 1 sten = 0.5 s
a 1 Ten = 0.10 s. Wybór skali powinien uwzględniać rzeczywistą dokładność pomiaru (i informować o tym użytkownika testu).
Jeśli test jest nierzetelny (duży błąd pomiaru) należy wybrać skalę standardową o „grubych” jednostkach. Jeśli pomiar pozwala na dokładne różnicowanie wartości zmiennej można wybrać skalę bardziej dokładną.
Najczęściej podaje się normy w skali centylowej oraz (jeśli to możliwe) w jednej ze skal o rozkładzie normalnym.
n-ty centyl to punkt na skali wyników surowych poniżej którego znajduje się (w populacji) n% obserwacji.