Wykład 7
TRAFNOŚĆ POMIARU
TESTEM: PODSTAWOWE
POJĘCIA ORAZ METODY I
WSKAŹNIKI
Pojęcie trafności pomiaru
Trafność pomiaru testem to:
a). stopień, w jakim test mierzy
cechę, jaką ma mierzyć,
b). stopień dokładności
przewidywania określonych kryteriów
praktycznych.
Rodzaje trafności pomiaru
Trafność pomiaru obejmuje trzy
rodzaje:
a). trafność treściową (wewnętrzną),
b). trafność kryterialną
(diagnostyczną i prognostyczną),
c). trafność teoretyczną.
Trafność treściowa - definicja
Trafność treściowa (wewnętrzna)
-
reprezentatywność danej puli pozycji
dla uniwersum pozycji mierzących
daną cechę.
Trafność kryterialna -
definicja
Trafność kryterialna
- stopień, w
jakim test pozwala na przewidywanie
określonego kryterium
zewnętrznego, np. powodzenia
zawodowego, szkolnego,
wypadkowości, diagnozy klinicznej,
itp. Trafność kryterialna obejmuje
trafność diagnostyczną
(stopień, w
jakim test pozwala na ocenę
aktualnego kryterium) oraz
trafność
prognostyczną
(stopień, w jakim test
pozwala na ocenę przyszłego
kryterium).
Trafność kryterialna -
szacowanie
Trafność kryterialna
jest szacowana
na podstawie korelacji między
wynikami testu a określonym
kryterium pozatestowym; z tego
względu kluczowym aspektem jest
rzetelność (jak i trafność) samego
kryterium, użytego do badania
trafności testu.
Trafność kryterialna -
poprawka na nierzetelność
kryterium
Poprawka na nierzetelność
kryterium:
r
kt
r
s-kt
= --------------
R
tt-k
gdzie r
s-kt
- współczynnik korelacji
skorygowany, r
kt
- współczynnik
korelacji przed skorygowaniem, a R
tt-k
współczynnik rzetelności kryterium.
Standardowy błąd estymacji
kryterium
Standardowy błąd estymacji wyników
kryterium na podstawie wyników
testu:
S
be
= S
k
(1 - r
kt
2
),
gdzie S
k
- odchylenie standardowe
wyników kryterium, a r
kt
-
współczynnik korelacji testu z
kryterium.
Wykład 8
TRAFNOŚĆ TEORETYCZNA
POMIARU TESTEM
Trafność teoretyczna -
pojęcie
Trafność teoretyczna
- zgodność
treści mierzonej przez test z
konstruktem teoretycznym (trafność
zorientowana na konstrukt) -
określenie jaką treść psychologiczną
mierzy test.
Metody szacowania trafności
teoretycznej
1). Metody bazujące na analizie
związku pomiędzy konstruktem a
zachowaniem:
a). metoda zmian nieprzypadkowych,
b). metoda sprawdzania różnic
międzygrupowych,
c). metoda badania procesu
rozwiązywania testu;
Metody szacowania trafności
teoretycznej (c.d.)
2). Metody bazujące na analizie
macierzy korelacji pomiędzy testem,
a innymi testami przeznaczonymi do
badania danego konstruktu:
a). metoda badania wewnętrznej
struktury testu,
Metody szacowania trafności
teoretycznej (c.d.)
b). metoda analizy macierzy korelacji
i analizy czynnikowej (eksploracyjnej
i konfirmacyjnej) danego testu oraz
testów, badających ten sam
konstrukt;
c). badanie trafności
konwergencyjnej i dyskryminacyjnej
(zbieżnej i rozbieżnej) za pomocą
analizy macierzy Wielu Cech- Wielu
Metod wg Campbella i Fiskego
Wykład 9
STRATEGIE KONSTRUOWANIA
TESTÓW
Strategie konstruowania
testów
1). teoretyczna (dedukcyjna)
2). zewnętrzna (kryterialna)
3). wewnętrzna (indukcyjna)
Porównanie strategii
konstrukcji testów
Aspekty opisu strategii:
a). dostępność teorii psychologicznej
w strategii: dedukcyjna ("teoria"),
kryterialna ("wiedza"), indukcyjna
("metodologia");
Porównanie strategii
konstrukcji testów (c.d.)
b). model psychometryczny
zastosowany do konstrukcji testu:
teoretyczna - analiza pozycji
(korelacja pozycja-skala, zewnętrzna
- analiza pozycji (korelacja pozycja-
kryterium), indukcyjna -
eksploracyjna analiza czynnikowa;
Porównanie strategii
konstrukcji testów (c.d.)
c). efekt finalny: w zakresie
psychologicznym, diagnostycznym i
psychometrycznym - każda strategia
ma swoje zalety i wady - zależnie od
typu problemu należy stosować różne
strategie.
Wykład 10
PROCEDURA (PROCES)
KONSTRUKCJI TESTU
Procedura (proces)
konstrukcji testów
Etap I - wybór strategii
Etap II - analiza podstaw
teoretycznych narzędzia
Etap III - generowanie wskaźników
będących deskrypcją cech
psychologicznych
Etap IV - zapisywanie pozycji
testowych
Pozycja testowa - definicja
Pozycja testowa
to sformalizowany
wskaźnik danej cechy
psychologicznej, a więc zdanie
(twierdzenie lub pytanie) opisujące
określone zachowanie (lub zadanie
wyzwalające określone zachowanie)
oraz skala rejestrująca to zachowanie
(opcje odpowiedzi o określonym
formacie oraz reguła przekształcania
odpowiedzi w wynik liczbowy).
Procedura (proces)
konstrukcji testów
Etap V - przygotowanie testu do
badań: przyjęcie nazwy testu,
zaopatrzenie go w instrukcję oraz
wprowadzenie losowej kolejności
pozycji w inwentarzach lub
uporządkowania ich według stopnia
trudności
Etap VI - przeprowadzenie badań
listą pozycji i opracowanie
psychometryczne zebranych danych,
w rezultacie czego uzyskuje się
finalną wersję testu
Warunki poprawności badań
konstrukcyjnych
Kilka prób (uniknięcie zjawiska
„zyskiwania na przypadku) w celu
„walidacji krzyżowej”
Próby bardzo liczebne - mnożnik 5 -
10 osób badanych na jedną pozycję
testową („psychometria nie toleruje
małych prób”)
Próby maksymalnie zróżnicowane
demograficznie (płeć, wiek,
wykształcenie, zawód, miejsce
zamieszkania, itp.)
Analiza pozycji i pojęcie
mocy dyskryminacynej
Analiza pozycji - rodzaj analizy
psychometrycznej, który obejmuje
wskaźnik
trudności
pozycji,
moc
dyskryminacyjną
oraz
trafność
zewnętrzną
pozycji).
Moc dyskryminacyjna
- wskaźnik
stopnia, w jakim pozycja mierzy
cechę, którą mierzy cały test
(oceniana poprzez korelację pozycja-
skala).
Pojęcie trudności i trafności
zewnętrznej pozycji
Trudność
pozycji - proporcja
odpowiedzi zgodnych z kluczem
(średnia pozycji w relacji do
możliwego maksymalnie wysokiego
wyniku).
Trafność zewnętrzna
pozycji -
wskaźnik stopnia, w jakim pozycja
mierzy kryterium pozatestowe
(oceniana poprzez korelację pozycja-
kryterium).
Miary mocy
dyskryminacyjnej
Współczynnik korelacji dwuseryjnej
Współczynnik korelacji punktowo-
dwuseryjnej
Współczynnik korelacji punktowo-
czteropolowej
Skorygowany współczynnik
korelacji pozycja-skala
Współczynnik korelacji
dwuseryjnej
(M
p
- M
q
)
---------------
S
r
bis
= -----------------------
(p q)
--------
y
Współczynnik korelacji
dwuseryjnej
gdzie M
p
- to średnia wyników w skali tych
osób, które odpowiedziały na daną pozycję
zgodnie z kluczem, M
q
- to średnia wyników
w skali tych osób, które odpowiedziały na
daną pozycję niezgodnie z kluczem, S -
odchylenie standardowe wyników w całym
teście, p - to proporcja tych osób, które
odpowiedziały na daną pozycję zgodnie z
kluczem, q - to proporcja tych osób, które
odpowiedziały na daną pozycję niezgodnie
z kluczem, zaś y - to rzędna rozkładu
normalnego odpowiadająca proporcji p.
Współczynnik korelacji
-punktowo dwuseryjnej
(M
p
- M
q
)
----------------
S
r
p-bis
= -------------------
(p q)
Współczynnik korelacji
punktowo-dwuseryjnej
gdzie M
p
- to średnia wyników w skali tych
osób, które odpowiedziały na daną pozycję
zgodnie z kluczem, M
q
- to średnia wyników
w skali tych osób, które odpowiedziały na
daną pozycję niezgodnie z kluczem, S -
odchylenie standardowe wyników w całym
teście, p - to proporcja tych osób, które
odpowiedziały na daną pozycję zgodnie z
kluczem, q - to proporcja tych osób, które
odpowiedziały na daną pozycję niezgodnie
z kluczem.
Współczynnik korelacji
punktowo-czteropolowej
(phi)
f
g
- f
d
phi = ------------
(p q)
Współczynnik korelacji
punktowo-czteropolowej
gdzie f
g
- to proporcja osób w górnej
połowie próby, które odpowiedziały
na daną pozycję zgodnie z kluczem, f
d
- to proporcja osób w dolnej połowie
próby, które odpowiedziały na daną
pozycję zgodnie z kluczem, p - to
proporcja osób w całej próbie, które
odpowiedziały na daną pozycję
zgodnie z kluczem, q - to proporcja
tych osób, które odpowiedziały na
daną pozycję niezgodnie z kluczem.
Miary trafności zewnętrznej
pozycji oraz treści
czynnikowej
Trafność zewnętrzna - korelacja z
kryterium (r-Pearsona albo korelacje
stosowane do oceny mocy
dyskryminacyjnej)
Analiza czynnikowa pozycji - ładunek
czynnikowy (korelacja pozycji z
czynnikiem) oraz wskaźniki
różnicowe:
W
r
= F
2
- (F
a
2
+ F
b
2
+ F
c
2
+ ... + F
z
2
)
Miary trafności zewnętrznej
pozycji oraz treści
czynnikowej
gdzie W
r
- wynik różnicowy, F
2
-
ładunek na odpowiadającym pozycji
("własnym") czynniku, zaś F
a
2
, F
b
2
do
F
z
2
- ładunki na innych czynnikach (od
czynnika "A" do "Z").
Teoria odpowiadania na
pozycje testowe - założenia
Odpowiedzi osoby badanej są
zmiennymi obserwowalnymi,
uwarunkowanymi przez cechę -
zmienną latentną;
odpowiedzi na poszczególne pozycje są
statystycznie niezależnie - ich
skorelowanie wynika z cechy;
związek między rozwiązaniem pozycji a
cechą może być opisany przez „krzywą
charakterystyczną pozycji”
Parametry „krzywej
charakterystycznej”
Parametr „trudności”
Parametr mocy dyskryminacyjnej
Parametr „zgadywania”
Parametr „nieuważności”
Zwykle są stosowane model dwu-
parametryczne (wymagają
zastosowania nieliniowej regresji)
0
0,2
0,4
0,6
0,8
1
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Standaryzowany wynik w ca³ym teœcie (nasilenie mierzonej cechy)
P
ra
w
d
o
p
o
d
o
b
ie
ñ
st
w
o
r
o
zw
i¹
za
n
ia
d
a
n
e
j
p
o
zy
cj
i
Rycina 16. „Krzywa
charakterystyczna” pozycji
testowej
Rycina 17. Różne formy „krzywej
charakterystycznej” pozycji
testowej
0
0,2
0,4
0,6
0,8
1
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Wynik w ca³ym teœcie
P
ra
w
d
o
p
o
d
o
b
ie
ñ
st
w
o
r
o
zw
i¹
za
n
ia
d
a
n
e
j
p
o
zy
cj
i
0
0,2
0,4
0,6
0,8
1
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Standaryzowany wynik w całym teście (nasilenie mierzonej cechy)
P
ra
w
d
o
p
o
d
o
b
ie
ń
st
w
o
r
o
zw
ią
za
n
ia
d
an
ej
p
o
zy
cj
i
Rycina 17a. „Krzywa
charakterystyczna” pozycji testowej
nr 35 ze skali REM inwentarza FCZ-KT
0
0,2
0,4
0,6
0,8
1
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Standaryzowany wynik w całym teście (nasilenie mierzonej cechy)
P
ra
w
d
o
p
o
d
o
b
ie
ń
st
w
o
r
o
zw
ią
za
n
ia
d
an
ej
p
o
zy
cj
i
Rycina 17b. „Krzywa
charakterystyczna” pozycji testowej
nr 102 ze skali REM inwentarza FCZ-
KT
Procedura (proces)
konstrukcji testów
Etap VII - przygotowanie testu do
praktycznego stosowania:
normalizacja oraz publikacja testu.
Wykład 11
CZYNNIKI
ZNIEKSZTAŁCAJĄCE WYNIKI
TESTOWE
Czynniki zniekształcające
wyniki testowe
a). zgadywanie.
b). tendencja do udzielania
odpowiedzi społecznie aprobowanych
albo społecznie nie aprobowanych:
- tendencja do dysymulowania
(aprobata społeczna),
- tendencja do symulowania;
Czynniki zniekształcające
wyniki testowe
c). style odpowiadania
- tendencja do lateralizacji (style
graficzne);
- tendencja do zgadzania się lub
zaprzeczania;
- tendencja do udzielania odpowiedzi
ekstremalnych albo centralnych przy
wielokategorialnych formatach
odpowiedzi (np. wybieranie znaków
zapytania lub wyłącznie kategorii
krańcowych);
Czynniki zniekształcające
wyniki testowe
- tendencja do udzielania odpowiedzi
losowych (zgadywania);
- tendencja do udzielania odpowiedzi
niekonsekwentnych;
- tendencja do udzielania odpowiedzi
niezdecydowanych (opuszczenia);
- tendencja do udzielania odpowiedzi
impulsywnych;
Czynniki zniekształcające
wyniki testowe
- tendencja do udzielania odpowiedzi
produktywnych;
- tendencja do udzielania odpowiedzi
pozornie oryginalnych (odwrotność
aprobaty);
- tendencja do udzielania odpowiedzi
konwencjonalnych.
Tendencja do dysymulowania
- definicja
Dysymulacja
- świadoma lub
nieświadoma tendencja osoby
badanej do przedstawiania się w
nieprawdziwie korzystnym
świetle.
Tendencja do dysymulowania
a aprobata społeczna
Dysymulacja najczęściej wiązana jest
ze zmienną
aprobaty społecznej
,
która jest rozumiana jako tendencja
osoby badanej do kierowania się
społecznym wartościowaniem
zachowania przy odpowiadaniu i
prowadzi do zaprzeczania posiadania
cech społecznie niepożądanych oraz
przypisywania sobie cech społecznie
pożądanych.
Aprobata społeczna
Aprobata społeczna jako
styl
odpowiadania
(czy inaczej postawa
wobec badania) to tendencja
jednostki do kierowania się przy
odpowiadaniu nie tyle faktycznym
zachowaniem, czy treścią pytania,
ale społeczną oceną, jaką pociąga za
sobą dana odpowiedź.
Tendencja do dysymulowania
i aprobata społeczna c.d.
Aprobata jako
cecha
to tendencja
podmiotu do takiego modulowania
zachowania (każdego - testowego,
jak i realnego, pozatestowego), by
było ono zgodne ze społecznym
wartościowaniem - normami
społecznymi, akceptacją otoczenia.
Metody kontroli
(eliminowania) wpływu
aprobaty
Na etapie konstrukcji
kwestionariusza:
1). Pozycje neutralne,
2). Pozycje subtelne pod względem
trafności fasadowej,
3). Specjalne formułowanie językowe
pozycji,
4). Aprobata społeczna jako zmienna
moderacyjna,
Metody kontroli
(eliminowania) wpływu
aprobaty
5). Analiza podatności pozycji przez
manipulowanie instrukcją,
6). Analizy itemmetryczne,
7). Korelacje pozycji ze skalami
mierzącymi aprobatę społeczną;
Metody kontroli
(eliminowania) wpływu
aprobaty
Na etapie stosowania
kwestionariusza:
8). Instrukcja "szczerości",
9). Zmiana procedury badania -
komputeryzacja testu,
Metody kontroli
(eliminowania) wpływu
aprobaty
10). Skala kontrolna aprobaty
społecznej, na podstawie której
odrzuca się respondentów o
wysokich wynikach lub koryguje
wyniki skal treściowych przez
doliczanie tzw. poprawek
korekcyjnych,
11). Wprowadzenie do diagnozy
psychologicznej szacowania cech.
Tendencja do symulowania -
definicja
Tendencja do
symulowania
-
świadome lub nieświadome
udzielanie odpowiedzi,
bezpodstawnie
przedstawiających
osobę badaną w
niekorzystnym
świetle
, np. wskazujących na
istnienie określonych zaburzeń
zachowania czy niepożądanych cech
osobowości.
Tendencja do symulowania
(c.d.)
Tendencja do symulowania jest
zarówno
postawą
wobec badania,
(styl odpowiadania, np."super-
szczerość"), jak trwałym syndromem
cech
osobowości, związanym z
tendencjami agrawacyjnymi,
obniżoną samooceną,
ekscentrycznością i zaburzeniami
psychicznymi. Kontrolowanie
tendencji do symulacji umożliwiają
specjalne skale kontrolne.
Styl odpowiadania - definicja
Styl odpowiadania
- tendencja osoby
badanej do wybierania określonej
opcji odpowiedzi, niezależnie od
treści pytania.
Kontrolowanie stylów
odpowiadania:
a). wyrównanie liczby pozycji
diagnostycznych na "tak" i "nie",
(tendencja do zgadzania się i
zaprzeczania)
b). eliminowanie odpowiedzi
pośrednich (centralny styl
odpowiadania) lub stosowanie skal
kontrolnych, bazujące na zliczaniu
odpowiedzi centralnych,
niezdecydowanych).
Kontrolowanie stylów
odpowiadania:
c). stosowanie skal kontrolnych, np.
skali konsekwencji (nieuważność) lub
konstruowanie skal statystycznych
do kontroli stylu (bazujących na
porównaniu proporcji odpowiedzi, np.
potakujących czy negujących w
skalach treściowych).
Zgadywanie - definicja
Zgadywanie
jest specyficznym
czynnikiem zniekształcającym wyniki
testów zdolności, związanym z
udzielaniem odpowiedzi losowych,
gdy badani nie znają właściwych
odpowiedzi
(„jak nie wiem, to będę
strzelał”)
.
Kontrolowanie zgadywania
a). poprzez instrukcję testową:
wyrównywanie tendencji do
zgadywania (zachęcanie do
zgadywania) lub eliminowanie
zgadywania (informacja o stosowaniu
korekty wyników);
Kontrolowanie zgadywania
b). zastosowanie statystycznej
poprawki na zgadywanie:
B
K = P - ---------
m - 1
gdzie K - liczba odpowiedzi bez
zgadywania, P - liczba poprawnych
odpowiedzi w teście, B - liczba błędnych
odpowiedzi, m - liczba opcji odpowiedzi w
zadaniach testowych.
Wykład 12
STRATEGIE KULTUROWEJ
ADAPTACJI TESTÓW
Kulturowa adaptacji testów
Kulturowa adaptacja testu
-
przystosowanie wersji oryginalnej
testu do innej specyfiki kulturowej.
Adaptacja testu oznacza konieczność
wprowadzenia specjalnych procedur
przystosowujących (decentrujących -
uniwersalizujących lub centrujących
na kulturze adaptacji), w przeciwnym
razie stosowanie takiego narzędzia
prowadzi nieuchronnie do
stronniczości lub faworyzacji
kulturowej.
Aspekty równoważności
kulturowo adaptowanych
testów
Aspekty równoważności kulturowej
testu:
a). równoważność teorii
psychologicznych,
b). równoważność wymiarów
psychologicznych
c). równoważność pojęć
psychologicznych,
d). równoważność wskaźników cech -
zachowań,
e). równoważność procedury
badania.
Kryteria równoważności
kulturowowo adaptowanych
testów
Kryteria równoważności testu:
a). równoważność fasadowa (forma
testu),
b). równoważność psychometryczna
(wskaźniki dobroci pomiaru),
c). równoważność funkcjonalna
(równoważność psychologiczna),
d). wierność tłumaczenia,
e). wierność rekonstrukcji.
Strategie kulturowej adaptacji
testów
Transkrypcja
Translacja
Trawestacja
Parafraza
Rekonstrukcja
Trankskrypcja
Transkrypcja
- maksymalnie wierne
tłumaczenie oryginalnych pozycji
(założenie, że zarówno konstrukty,
jak i zachowania są uniwersalne czy
inaczej równoważne kulturowo).
Celem adaptacji jest dochowanie
wierności tłumaczenia oraz wierności
fasadowej testu. Adaptacje
transkrypcyjne są "niezręczne"
językowo i wykazują szereg wad
psychometrycznych.
Translacja
Translacja
- wierne tłumaczenie
finalnej puli oryginalnych pozycji, ale
z możliwością wprowadzenia
niezbędnych modyfikacji językowych
(założenie, że konstrukty, jak i
zachowania są uniwersalne
kulturowo, ale nie są uniwersalne
pojęcia używane w danej kulturze do
opisu zachowania).
Trawestacja
Trawestacja
- swobodne tłumaczenie
oryginału z wprowadzaniem wielu
modyfikacji, sugerowanych
względami językowymi i
psychologicznymi: treściowymi lub
psychometrycznymi (założenie, że
konstrukty psychologiczne są
uniwersalne, ale nie są uniwersalne
pojęcia
Trawestacja (c.d.)
używane w danej kulturze do opisu
zachowania i nie zawsze uniwersalne
są same zachowania - część
zachowań ma charakter emikalny).
Trawestacja prowadzi do uzyskania
dostosowanych do danej kultury
formy testu, ale może się on różnić
od oryginału.
Parafraza
Parafraza
- opracowanie nowego
narzędzia, dla którego inspiracją jest
test oryginalny. Pozycje oryginalne
są wykorzystywane tylko częściowo,
większość pozycji jest generowana
na bazie pozycji oryginalnych
(założenie, że konstrukty
psychologiczne są uniwersalne
kulturowo, ale z reguły nie są
uniwersalne zachowania - tylko część
z nich
Parafraza (c.d.)
ma charakter etikalny, tj.
równoważny kulturowo.
Parafraza jest bardzo czasochłonna,
ale prowadzi do uzyskania w pełni
dostosowanych do danej kultury
adaptacji testu.
Rekonstrukcja
Rekonstrukcja
- opracowanie
całkowicie nowego narzędzia, dla
którego inspiracją jest oryginalny
model teoretyczny i strategia
konstrukcji (założenie, że zachowania
z reguły nie są uniwersalne
kulturowo, ale możliwe że nie są
uniwersalne również konstrukty
psychologiczne).
Rekonstrukcja (c.d.)
Rekonstrukcja może prowadzić do
uzyskania innej niż oryginalna wersji
testu i jest najbardziej czasochłonną
strategią adaptacji, ale prowadzi do
uzyskania całkowicie dostosowanych
kulturowo wersji testu.
Adaptacja demograficzna
testów
Adaptacja demograficzna
-
przystosowanie testu
przeznaczonego do badania
określonej grupy do stosowania w
innej grupie demograficznej.
Adaptacja demograficzna testu, tak
jak adaptacja kulturowa, oznacza
konieczność wprowadzenia
specjalnych procedur
przystosowujących
Adaptacja demograficzna
testów
(decentrujących - uniwersalizujących
lub centrujących na kulturze danej
grupy), w przeciwnym razie
stosowanie testu prowadzi
nieuchronnie do stronniczości lub
faworyzacji demograficznej (np.
seksizmu).
Aspekty adaptacji
demograficznej testów
Płeć
Wiek
Niepełnosprawność
Rasa
Klasa społeczna (status społeczno-
ekonomiczny)?
Środowisko
Podkultura?
Wykład 13
NORMALIZACJA WYNIKÓW TESTU
Skale normalizacyjne
1). o rozkładzie prostokątnym:
- skala centylowa
- skala decylowa,
2). o rozkładzie normalnym:
a). znormalizowane wartości
standardowe "z" (skala ciągła),
Skale normalizacyjne
b). dzielące rozkład wg średniej
(-) skala stenowa
c). obejmujące wartości średnie
(-) skala staninowa
(-) skala tetronowa
(-) skala tenowa
(-) skala dewiacyjnego ilorazu
inteligencji
Skala centylowa
Rozkład po transformacji wyników surowych =
prostokątny („uskokowniony”)
Mediana = 50
Liczba jednostek skali = 101 centyli
Zakres = od 0 do 100 centyla
Skok skali = 1 centyl (1% wyników, poza centylami
krańcowymi - 0 oraz 100, które obejmują po 0,5%
obserwacji)
Skala decylowa
Rozkład po transformacji wyników surowych =
prostokątny („uskokowniony”)
Mediana = 5,0
Liczba jednostek skali = 11 decyli
Zakres = od 0 do 10 decyla
Skok skali = 1 decyl (10% wyników, poza decylami
krańcowymi - 0 oraz 10, które obejmują po 5%
obserwacji)
Skala jednostek
znormalizowanych „z”
Rozkład po transformacji wyników surowych =
normalny („ciągły”)
Średnia = 0,0
Odchylenie standardowe = 1,0
Skok skali = praktycznie 0,01
Różnicowanie = dowolny zakres
Przeznaczenie = skala podstawowa, stanowiąca
punkt wyjścia do transformacji wyników surowych
na inne skale znormalizowane
Formuła transformacyjna
y = zS
y
+ M
y
gdzie y - wynik w znormalizowanej
skali standardowej, z -
znormalizowany wynik standardowy,
S
y
- odchylenie standardowe danej
skali standardowej, M
y
- średnia
wyników danej skali standardowej)
Skala stenowa
Rozkład po transformacji wyników surowych =
normalny („uskokowniony”)
Średnia = 5,5 (między 5 a 6 stenem)
Odchylenie standardowe = 2,0
Liczba jednostek skali = 10 stenów
Zakres = od 1 do 10 stena
Skok skali = 1 sten (0,5 odchylenia standardowego
jednostek znormalizowanych „z”)
Różnicowanie = wartości od -2 do +2 jednostek
znormalizowanych „z” (steny krańcowe powyżej 2
S)
Przeznaczenie = różnicowanie w obrębie „normy”
Skala staninowa
Rozkład po transformacji wyników surowych =
normalny („uskokowniony”)
Średnia = 5,0 (obejmuje średnią)
Odchylenie standardowe = 2,0
Liczba jednostek skali = 9 stanin
Zakres = od 1 do 9 stanina
Skok skali = 1 stanin (0,5 odchylenia
standardowego jednostek znormalizowanych „z”)
Różnicowanie = wartości od -1,75 do +1,75
jednostek znormalizowanych „z” (staniny krańcowe
powyżej 1,75 S)
Przeznaczenie = różnicowanie w obrębie „normy”
Skala tetronowa
Rozkład po transformacji wyników surowych =
normalny („uskokowniony”)
Średnia = 10,0 (obejmuje średnią)
Odchylenie standardowe = 4,0
Liczba jednostek skali = 21 tetronów
Zakres = od 0 do 20 tetrona
Skok skali = 1 tetron (0,25 odchylenia
standardowego jednostek znormalizowanych „z”)
Różnicowanie = wartości od -2,325 do +2,325
jednostek znormalizowanych „z” (tetrony krańcowe
powyżej 2,325 S)
Przeznaczenie = różnicowanie w obrębie „normy” i
„patologii”
Skala tenowa
Rozkład po transformacji wyników surowych =
normalny („uskokowniony”)
Średnia = 50 (obejmuje średnią)
Odchylenie standardowe = 10,0
Liczba jednostek skali = 100 tenów
Zakres = od 1 do 100 tena
Skok skali = 1 ten (0,1 odchylenia standardowego
jednostek znormalizowanych „z”)
Różnicowanie = wartości od -5 do +5 jednostek
znormalizowanych „z” (teny krańcowe powyżej 5 S)
Przeznaczenie = różnicowanie w obrębie „normy’ i
„patologii”
Skala dewiacyjnego ilorazu
inteligencji
Rozkład po transformacji wyników surowych =
normalny („uskokowniony”)
Średnia = 100,0 (obejmuje średnią)
Odchylenie standardowe = 15,0
Liczba jednostek skali = 200 jednostek II
Zakres = od 0 do 200 jednostek II
Skok skali = jednostka II (1/15 odchylenia
standardowego jednostek znormalizowanych „z”)
Różnicowanie = wartości praktycznie od -6 do +6
jednostek znormalizowanych „z” (jednostki
krańcowe powyżej 6 S)
Przeznaczenie = różnicowanie w obrębie „normy” i
„patologii”
Kryteria wyboru danej skali
normalizacyjnej
Kształt rozkładu wyników surowych
(reguła: rozkłady skośne - skale
prostokątne)
Liczba stopni skali w stosunku do zakresu
rozkładu wyników surowych (reguła: 1 do 2
lub 3)
Rzetelność pomiaru i wielkość
standardowego błędu pomiaru (reguła: gdy
SBP duże - raczej skala o mniejszej liczbie
wartości);
Przeznaczenie - różnicowanie w obrębie
„normy” czy „patologii” (reguła:
różnicowanie w obrębie „patologii” - skala
o większym zakresie)
Zagadnienie specjalne -
normy aktuarialne
Normy aktuarialne
to
normy, w które zostały
wbudowane dane
trafnościowe
Wykład 14
INTERPRETACJA WYNIKÓW
TESTOWYCH I ZASADY
KORZYSTANIA Z
PODRĘCZNIKÓW TESTOWYCH
Rodzaje interpretacji
wyników testowych
Interpretacja kliniczna
Interpretacja statystyczna
Interpretacja kliniczna
Zakłada interpretację profilu
testowego na podstawie treści
psychologicznej poszczególnych skal i
agregację tej treści poprzez ustalenie
sensu danej konfiguracji cech.
Interpretacja kliniczna wiąże się z
idiograficznym podejściem do
diagnostyki psychologicznej i w jej
efekcie formułowane są wnioski raczej
jakościowe niż ilościowe, a jeśli
ilościowe - to są one mało precyzyjne.
Interpretacja statystyczna
Zakłada raczej mechaniczne łączenie
skal, poprzez tworzenie agregatów nie
tyle psychologicznych, ile
statystycznych, np. poprzez tworzenie
baterii testów predykcyjnych
określonego kryterium (stanu zdrowia
psychicznego, powodzenia zawodowego,
itp.). Dla każdego z tych wskaźników
możliwe jest określenie pewności
wnioskowania czy dokładności diagnozy.
Interpretacja statystyczna
Interpretacja statystyczna
wymaga sformalizowania procesu
wnioskowania na podstawie
uzyskanych danych. Wiąże się ona z
nomotetycznym podejściem do
diagnostyki psychologicznej i
dostarcza przede wszystkim
wyników ilościowych.
Interpretacja kliniczna a
interpretacja statystyczna
Predykcja zachowania jednostki jest
bardziej trafna przy podejściu
statystycznym niż klinicznym.
Podejście statystyczne jest jednak
krytykowane za mechaniczność
analizy danych i sprowadzenie udziału
psychologa w diagnozie do roli
“technika” rozdzielającego testy,
obliczającego ich
Interpretacja kliniczna a
interpretacja statystyczna
wyniki i odczytującego ich
znaczenie z tabel aktuarialnych. Z
tych względów postuluje się
łączenie obu podejść albo
akcentuje się konieczność
wypracowania nowych modeli
diagnostycznych.
Struktura podręcznika
testowego
prezentacja teoretycznych podstaw
testu;
opis procedury konstrukcji
dane, ilustrujące rzetelność i trafność
pomiaru (wraz z charakterystyką orób);
procedura praktycznego stosowania
testu i obliczania wyników;
procedura interpretacji wyników testu;
tabele normalizacyjne.
Co musi zawierać podręcznik
testowy?
Podręcznik musi zawierać precyzyjny
opis testu: jego przeznaczenie,
wskazówki dotyczące procedury
badania testem i obliczania wyników,
pełne dane ilustrujące charakterystykę
psychometryczną, opis procedury
normalizacji oraz normy, precyzować
zasady interpretacji oraz zawierać
informację o możliwej stronniczości
czy ograniczeniach stosowania testu.
THE END