Psychometria 2009
Wykład 6
Normalizacja wyników
testowych
• Wynik surowy, nieodniesiony do innych
wyników, jest zazwyczaj
nieinterpretowalny
• NORMY - wyniki przeliczone
(uzyskane na podstawie badań
normalizacyjnych), pozwalające
określić natężenie danej cechy u
danej jednostki w odniesieniu do
natężenia typowego dla populacji
Przeznaczenie skal
standardowych
• ocena wyników jednostki w
porównaniu z wynikami typowymi
dla populacji
• porównywanie wyników w różnych
testach
• Punkt wyjścia dla większości
procedur standaryzacji: wyniki
standaryzowane z
z – wynik
standaryzowany
x
i
– wynik surowy
x – średnia
s – odchylenie
standardowe
Najczęściej spotykane
skale standardowe
• Skala tenowa
• Skala stenowa
• Skala centylowa
• Dewiacyjny iloraz IQ (WAIS
Wechslera)
Ogólny wzór na
transformację wyników na
skale standardowe
JS = s * z + M
JS – jednostka standardowa
s – odchylenie standardowe nowej skali
z – wynik standardowy skali wyjściowej
M = średnia nowej skali
Skala tenowa T (McCall,
1922)
• średnia: 50,0
• odchylenie standardowe: 10,0
• zakres: 0-100 tenów (-5 OS do +5 OS)
• dokładność: 0,1 OS
• intepretacja: (np. MMPI (WISKAD),
ACL):
– wyniki zaniżone: 0-29
– wyniki w normie: 30-70
– wyniki podwyższone: 71-100
Skala tenowa
• dla wyników surowych o
rozkładzie normalnym:
T = 10z + 50
Skala stenowa
• 10 jednostek, zwanych stenami
(standard ten)
• średnia 5,5, OS 2,0
• zakres od 1 do 10 stenów (-2,25 OS do
2,25OS)
Przeliczanie na skalę
stenową
sten = 2z + 5,5
Sten
Zakres OS
1
poniżej -2,00
2
-2,00 do -1,51
3
-1,51 do -1,01
4
-1,00 do -0,51
5
-0,51 do -0,01
6
0,00 do 0,49
7
0,50 do 0,99
8
1,00 do 1,49
9
1,50 do 1,99
10
powyżej 2,00
Interpretacja skali
stenowej 1
• steny 5 i 6: wyniki w normie
• steny 7-10: wyniki podwyższone
• steny 1-4: wyniki obniżone
Interpretacja skali
stenowej 2
• sten 1:
wyniki bardzo niskie
• sten 2 i 3: wyniki niskie
• sten 4: wyniki obniżone
• sten 5 i 6: wyniki w normie
• sten 7:
wyniki podwyższone
• sten 8 i 9: wyniki wysokie
• sten 10:
wyniki bardzo wysokie
Problem pozorny
• Rozkład liczebności w
poszczególnych stenach w grupie,
jeśli nie istnieją normy –
problem
źle postawiony
Sten
Procent powierzchni
pod krzywą
10
2
9
5
8
9
7
15
6
19
5
19
4
15
3
9
2
5
1
2
Jaki procent osób w grupie
ma wyniki w granicach
danych stenów
• Pytanie to ma empiryczny sens
wyłącznie wtedy, gdy istnieją
normy niezależne
• Jeśli normy wygenerowane są na
tej samej próbie, dla której
stawiane jest to pytanie, to jest
ono bezsensowne
Obliczanie stenów
• Każdy sten jest równy 0,5
odchylenia standardowego
wyników surowych
Skala centylowa
(rangowa)
• Skala NIE OPARTA NA WYNIKACH
STANDARDOWYCH z
• Centyl - procent osób uzyskujących
wyniki niższe od danego.
– np. jeśli 40 p. to 64 centyl, to 64% osób
uzyskuje wyniki od zera do 39
• zastosowanie uniwersalne, zmienne
"psychologiczne", a także medyczne
(np. normy rozwojowe dla wzrostu i
wagi ciała dzieci w różnym wieku)
Trudności ze skalą
centylową
• „prostokątny”
(równoprawdopodobny) rozkład
• = każdy centyl zdarza się
jednakowo często
• … co nie ma miejsca w skali
tenowej czy stenowej
SIATKA CENTYLOWA
WYSOKOŚCI CIAŁA
CHŁOPCÓW
Opracowano dla dzieci
warszawskich R.
Kurniewicz-Witczakowa,
wsp. l. Mięsowicz, Z.
Niedźwiecka, M.
Pietrzak. (IMiDz,W-wa,
1980)
Dewiacyjny iloraz IQ
• wyniki surowe (WS):
– suma punktów dla każdej z 11 podskal
• wyniki przeliczone:
– jednolita skala o średniej 10,0 i OS=3,0
• dewiacyjny iloraz inteligencji (IQ):
– średnia: 100,0; OS=15,0
• zakres dla skali WAIS-R: 45 do 145
WP
Jednostki OS
Ocena jakościowa
16-19
2,00 do 3,00 bardzo wysoki
poziom
14-15
1,33 do 1,66 wysoki poziom
13
1,00
poziom powyżej
przeciętnej
8-12
-0,66 do 0,66 przeciętny poziom
7
-1,00
poziom poniżej
przeciętnej
5-6
-1,66 do -1,33 niski poziom
1-4
-3,00 do -2,00 bardzo niski poziom
Wyniki surowe a
przeliczone
• W badaniach poszukujących związku między
zmiennymi używamy wyników surowych
• W badaniach mających na celu diagnozę
indywidualną używamy wyników
przeliczonych (norm)
• W badaniach poszukujących specyfiki osób o
określonych wynikach przeliczonych –
używamy wyników przeliczonych.
Konieczne są wtedy normy niezależne od
próby badawczej.
Normy a diagnoza
dychotomiczna
• Czułość (Sensitivity)
• Swoistość (Specificity)
• Wartość predykcyjna dodatnia
(Positive Predictive Value; PPV)
• Wartość predykcyjna ujemna
(Negative Predictive Value)
• Krzywe ROC (Receiver Operating
Characteristic)
Czułość
• Iloraz wyników prawdziwie dodatnich
przez sumę prawdziwie dodatnich i
fałszywie ujemnych
• Zdolność do diagnozowania choroby u
chorych i różnicowania ich od zdrowych
• Czułość 100% = wśród prawdziwie
chorych wszyscy zdiagnozowani są jako
chorzy
• Wysoka czułość = niskie
prawdopodobieństwo błędu II rodzaju
• beta = 1 - czułość
Swoistość
• Iloraz wyników prawdziwie ujemnych
do sumy prawdziwie ujemnych i
fałszywie dodatnich.
• Zdolność do diagnozowania zdrowia u
zdrowych i odróżniania ich od chorych
• Swoistość 100% = wśród prawdziwie
zdrowych wszyscy są zdiagnozowani
jako zdrowi przez test
• Wysoka swoistość = niskie
prawdopodobieństwo błędu I rodzaju
• alfa = 1 - swoistość
CAGE
• Czy w Twoim życiu miały miejsce takie okresy,
kiedy odczuwałeś/aś konieczność ograniczenia
swojego picia ?
• Czy zdarzyło się, że osoby z bliskiego Ci otoczenia
denerwowały Cię uwagami na temat Twojego
picia ?
• Czy zdarzało się, że odczuwałeś wyrzuty sumienia,
poczucie winy, lub wstyd z powodu swego picia ?
• Czy zdarzało Ci się, że rano po przebudzeniu
pierwszą rzeczą było wypicie alkoholu dla
„uspokojenia nerwów” lub „postawienia na nogi” ?
• Uzyskanie co najmniej dwóch twierdzących
odpowiedzi na powyższe pytania wskazuje na
znaczne prawdopodobieństwo uzależnienia od
alkoholu.
• Przetarg między czułością a
swoistością
1,0
0,8
0,6
0,4
0,2
0,0
1 - Swoistość
1,0
0,8
0,6
0,4
0,2
0,0
C
zu
ło
ść
Krzywa ROC
Wartość predykcyjna
dodatnia
• proporcja osób prawdziwie chorych
wśród zdiagnozowanych jako chorzy
• zdiagnozowani jako chorzy mogą być
prawdziwie chorzy oraz zdrowi
• Test o 100% PPV zawiera wśród
zdiagnozowanych jako chorzy wyłącznie
chorych
• PPV = prawdopodobieństwo
rzeczywistej choroby u
zdiagnozowanych jako chorzy
Wartość predykcyjna
ujemna
• proporcja osób prawdziwie zdrowych
wśród zdiagnozowanych jako zdrowi
• zdiagnozowani jako zdrowi mogą być
prawdziwie zdrowi oraz chorzy
• Test o 100% NPV zawiera wśród
zdiagnozowanych jako zdrowi wyłącznie
zdrowych
• NPV = prawdopodobieństwo
rzeczywistego zdrowia u
zdiagnozowanych jako zdrowi
Rzeczywisty stan
zdrowia
Razem
chory
zdrowy
Wyniki
testu
chory
a
b
a+b
zdrowy
c
d
c+d
Razem
a+c
b+d
n =
a+b+c+d
Czułość = a / (a + c)
Swoistość = d / (b + d)
Wartość predykcyjna dodatnia = a / (a +
b)
Wartość predykcyjna ujemna = d / (c + d)
• Czułość: zdolność do wykrycia
choroby
• Swoistość: zdolność do wykrycia
zdrowia
• Wartość predykcyjna dodatnia:
prawdopodobieństwo choroby u
zdiagnozowanych jako chorzy
• Wartość predykcyjna ujemna:
prawdopodobieństwo zdrowia u
zdiagnozowanych jako zdrowi
BIRADS
Razem
Zm.
złośliwa
Zm.
niezłośliw
a
Wyniki
testu
Zm.
złośliwa
15
6
21
Zm.
niezłośliw
a
1
11
12
Razem
16
17
33
Czułość = 93,75%
Swoistość = 64,71%
Wartość predykcyjna dodatnia = 71,43%
Wartość predykcyjna ujemna = 91,76%