Psychometria 2009, Wykład 5, Trafność

background image

Psychometria 2009

Wykład 5

Trafność

background image

• Trafność testu - odnosi się do pytania

o to, co jest mierzone przez test

• APA: Pojęcie trafności dotyczy

poprawności wniosków

wyprowadzanych na podstawie

wyników testowych lub innych form

badania

• Brzeziński (1996): trafność sprowadza

się do dwóch pytań:

– jakie wnioski można wyciągnąć na temat

tego, co jest mierzone przez test

– jakie wnioski można sformułować o

innych (pozatestowych) zachowaniach

background image

• Przykłady narzędzi szczególnie

narażonych na nietrafność:

– pomiar wyznawanych wartości
– pomiar sumienności podczas

kwalifikowania do pracy

– pomiar neurotyczności u kandydatów

na komandosów

background image

• Walidacja = ustalanie trafności

testu

background image

Trzy aspekty trafności

• Trafność kryterialna

– trafność diagnostyczna
– trafność prognostyczna

• Trafność treściowa
• Trafność teoretyczna

Są to nie tyle trzy rodzaje trafności,

co trzy sposoby ustalania trafności.

background image

„O trafności kryterialnej mówimy

wtedy, gdy na podstawie wyników
testowych wnioskuje się o
przypuszczalnej pozycji badanego
względem innej zmiennej – tzw.
kryterium” (Standardy dla testów
stosowanych w psychologii i
pedagogice,
APA)

background image

Trafność kryterialna -

diagnostyczna

• Pytanie o to, czy test jest w stanie

określić, czy w danej chwili dana osoba

odznacza się pewnymi właściwościami

• Metoda badania: określanie zgodność

testu z kryterium zewnętrznym

– korelacja wyników testu z inną metodą,

mierzącą to samo, co wyniki w teście

– narzędzie testowe oraz kryterialne

stosowane w tym samym momencie

background image

Trafność kryterialna -

prognostyczna

• pytanie o to, czy wyniki w teście

skutecznie prognozują zachowanie się

jednostki w przyszłości

• Metoda badania: określanie zgodności

testu z rzeczywistym zachowaniem się

jednostki w przyszłości

– korelacja wyników w teście z narzędziem

określającym zachowanie się jednostki

– narzędzie kryterialne stosowane po

określonym czasie od zastosowania

narzędzia testowanego

background image

Narzędzia kryterialne

• Kryteria bezpośrednie i pośrednie
• Problemy z określaniem trafności

kryterialnej:

– kryteria bezpośrednie dostępne są

rzadko, a pośrednie same wymagają

określenia ich trafności (i rzetelności)

– w praktyce psycholodzy określają

trafność zwykle przez skorelowanie

wyników swojego testu z innym testem

mierzącym to samo

background image

Trafność treściowa

(wewnętrzna, logiczna)

• Pytanie o to, czy zachowania obejmowane

przez test są reprezentatywną próbką
wszystkich zachowań ujawniających się w
danej sferze

• „…aby potwierdzić trafność treściową zbioru

wyników otrzymanych w teście, należy
wykazać, że zachowania demonstrowane w
badaniu testowym są reprezentatywną próbką
zachowań ujawniających się w interesującej
badacza sferze” (Stadardy… APA)

background image

• brak jest bezpośredniej empirycznej

metody weryfikowania tego rodzaju

trafności

– pozostają jedynie metody analizy jakościowej
– zgodność sędziów kompetentnych (Lawshe,

1975):

1.pozycja ta ma zasadnicze znaczenie dla testu
2.pozycja ta jest użyteczna, jednak nie ma

zasadniczego znaczenia

3.pozycja ta nie powinna się znaleźć w obrębie

testu

background image

Trafność teoretyczna

• Jakie konstrukty wyjaśniają

wariancję wyników
rozwiązywanego testu (Cronbach i
Meehl, 1955)

• t. teoretyczna jest to stopień, w

jakim test mierzy konstrukt
teoretyczny lub cechę

background image

Trafność teoretyczna

• t. kryterialna - kładzie nacisk na

pragma-tyczną sensowność i

użyteczność testu

• t. treściowa - kładzie nacisk na

"prawomocność" testu i jego

reprezentatywność dla mierzonego

zachowania

• t. teoretyczna - kładzie nacisk na to,

jakie zjawiska psychologiczne

(konstrukty, cechy), decydujące o

określonych zachowaniach,

obejmowane są przez dany test

background image

Metody badania trafności

teoretycznej

• analiza różnic międzygrupowych
• badanie aspektu zbieżnego i

różnicowego

• analiza struktury wewnętrznej testu
• analiza zmian nieprzypadkowych

wyników testu

• analiza procesu rozwiązywania testu
• analiza czynnikowa

background image

Analiza różnic

międzygrupowych

• różne grupy ludzi, skutecznie

zróżnicowane pod względem pewnego

konstruktu, powinny uzyskiwać różne

wyniki w teście

• np. test siły ego:

– osoby o wysokiej sile ego powinny

rzadziej korzystać z psychoterapii niż

osoby o niskiej sile ego

– tym samym, osoby rzadziej korzystające

z psychoterapii powinny uzyskiwać inne

wyniki w teście niż osoby częściej

korzystające z psychoterapii

background image

Badanie aspektu zbieżnego i

różnicowego

• trafny test powinien wyżej korelować z

innymi narzędziami mierzącymi to
samo,

oraz

niżej z innymi narzędziami

mierzącymi co innego

• wysoka korelacja między testami tej

samej cechy świadczy o trafności
zbieżnej (TZ)

• niska korelacja z testami innych cech

świadczy o trafności różnicowej (TR)

background image

• metoda macierzy wielu cech-wielu

metod WCWM) (MTMM):

– co najmniej dwie cechy, każda

mierzona przez co najmniej dwie
metody (zalecane trzy cechy i trzy
metody)

– metody wielowymiarowe określają,

czy interkorelacje między testami
mierzącymi to samo są wyższe niż
między testami mierzącymi co innego

background image

IPSA

Oceny równieśników

IPSA

Mściwość Agr. fiz. Agr. słow. Mściwość Agr. fiz. Agr. słow.

Mściwość

-

Agr. fizyczna

0,55

-

Agr. słowna

0,39

0,42

Oceny równieśników

Mściwość

0,33

0,36

0,05

-

Agr. fizyczna

0,30

0,35

0,00

0,91

-

Agr. słowna

0,32

0,32

0,07

0,86

0,86

-

background image

Campbell i Fiske, 1959

• Współczynniki TZ (kolor czerwony)

powinny być istotnie różne od zera
i na tyle wysokie, by warto było
dalej badać trafność tych testów

• Współczynniki TZ powinny być

wyższe niż współczynniki TR dla
różnych cech – różnych metod
(kolor czarny)

background image

Drwal (1995): „W psychologii nadal
dominują badania nad trafnością
zbieżną i często się zdarza, że twórca
nowego testu jest zadowolony z
każdej istotnej korelacji, jaką może
podać, nie zauważając, że niektóre w
gruncie rzeczy kompromitują
trafność jego testu”

background image

Analiza struktury testu

• Dotyczy zgodności wewnętrznej

background image

Analiza zmian

nieprzypadkowych

wyników testu

• test i retest, ale przedzielone

manipulacją obliczoną na zmianę
wyników testu w określonym
kierunku

• np. skala relaksu - wykonana po

treningu relaksacyjnym

background image

Analiza procesu

rozwiązywania testu

• zastosowanie dodatkowej techniki

(wywiadu, kwestionariusza itp.)
badającego myśli i odczucia osób
badanych podczas rozwiązywania
testu

background image

Analiza czynnikowa

• Test mierzący jedną cechę powinien

ujawnić jeden czynnik, ewentualnie
kilka skorelowanych czynników

• Testy mierzące więcej cech

(kwestionariusze) - każda mierzona
cecha powinna ujawniać się jako
czynnik

background image

Analiza czynnikowa

eksploracyjna vs.

konfirmacyjna

• Eksploracyjna analiza czynnikowa (EFA)

– jest techniką eksploracyjną
– wymaga podjęcia wielu arbitralnych decyzji
– nie nadaje się do weryfikowania hipotez

• Konfirmacyjna analiza czynnikowa (CFA)

– umożliwia weryfikację hipotez (modeli):

• liczba czynników
• treść czynników
• skorelowanie czynników

background image

1. Opinie innych ludzi są dla mnie bardzo ważne.
2. Łatwo ulegam wpływom innych ludzi
3. Horrory wywierają na mnie bardzo silne wrażenie.
4. Kiedy się na czymś koncentruję, jestem tym

bardzo zaabsorbowany(a).

5. Łatwo mogę zapomnieć o wszystkim, kiedy

słucham swojej ulubionej muzyki.

6. Jestem osobą podatną na sugestie.
7. Łatwo przychodzi mi koncentrowanie się na tym,

co robię.

8. Zdarza mi się, że podczas oglądania filmu, sztuki

w teatrze lub w telewizji mogę tak bardzo się w

nią zaangażować, że zapominam o sobie i o tym co

mnie otacza i traktuję tę sztukę tak, jakby to było

rzeczywiste zdarzenie, w którym biorę udział.

9. Łatwo się wzruszam (płaczę) kiedy oglądam

sentymentalne filmy.

background image
background image

Podstawowe informacje w

CFA

• Istotność statystyczna dopasowania

modelu

– test chi-kwadrat

Wyniki istotne statystycznie świadczą

o NIEDOPASOWANIU modelu

• Parametry ścieżkowe
• Indeksy dopasowania (goodness-of-fit)
• Indeksy modyfikacyjne

background image

I n t e lig e n c ja

w e r b a ln a

I n t e lig e n c ja

n ie w e r b a ln a

S ło w n ik

W ia d o m o ś c i

A r y t m e t y k a

S y m b o le c y f r

P o w t a r z a n ie

c y f r

1

0 , 6 5

0 , 8 9

0 , 9 5

0 , 7 2

1

0 , 2 5

0 , 3 7

0 , 3 1

0 , 1 2

0 , 3 1

background image

Trafność fasadowa

• błędne rozumienie: "test jest trafny, jeśli

wygląda na trafny"

• właściwe rozumienie: "test powinien w

oczach osób badanych wyglądać na
trafny"

• "trafność fasadowa dotyczy sposobu, w

jaki badani reagują na wygląd testu i na
metodę testowania" (Bechtoldt, 1968)

background image

Czy zawsze konieczne jest

badanie trafności?

• Nie.
• „Trafność na mocy założenia”
• Trudno polemizować z trafnością termometru czy

ciśnieniomierza

• W psychologii: : np. w testach pamięci (w testach

inteligencji już ryzykowne)

• Konieczna jednak ostrożność: Mosier (1947):

dwa testy mierzące umiejętność porządkowania

według alfabetu korelowały z sobą na poziomie

0,0, a z kryteriami odpowiednio: 0,09 i 0,00

– mogło to być spowodowane niską rzetelnością, ale jeśli

można wykazać rzetelność wewnętrzną dwóch testów

mierzących to samo, to nie mogą one z sobą korelować

nisko, jeśli oba są rzetelne

background image

• „fizycy nie mówią o ustalaniu

trafności procedury pomiarowej,
tylko o ustalaniu trafności teorii
naukowych” (Frank, 1956)

background image

• Trafność kryterialna
• Trafność treściowa
• Trafność teoretyczna
• Guion (1980): Trynitarna doktryna

trafności

• = „nie może być tak, że jak komuś nie

udało się wykazać trafności na jeden
aspekt, to ma jeszcze dwie szanse”

Różne rodzaje trafności,

aspekty trafności, metody

badania trafności?

background image

Słabości koncepcji

trynitarnej

• trafność teoretyczna jest jednak

nadrzędna; trafność kryterialna to zaledwie
metoda, a treściowa - problem raczej
metodologiczny (Guion, 1980: ustalanie
trafności treściowej to w gruncie rzeczy
procedura poprawnego konstruowania
testu

• W innym ujęciu: trafność kryterialna, a

nawet treściowa, to dwa szczególne
przypadki trafności teoretycznej.

background image

Poprawka na tłumienie korelacji: powinna

być stosowana również w wypadku badania

trafności

Analizy trafności kryterialnej, podobnie jak

rzetelności, są wrażliwe na „spłaszczenie”

wariancji

– Np. gdyby określać trafność narzędzia mierzącego

nadawanie się do zawodu przedstawiciela

handlowego, to próba będzie spłaszczona, bo

chyba kandydaci pewnego rodzaju ubiegają się o

taką pracę; często zresztą już w tym zawodzie

pracowali.

Długość testu a jego trafność - ponieważ im

test jest dłuższy, tym jest rzetelniejszy, a

rzetelność ogranicza trafność, zatem im test

dłuższy, tym bardziej

Guilford, 1954: Praca nad kryterium powinna

zajmować tyle czasu, co konstrukcja testu

background image

Przykłady badań trafności

FCZ-KT

• Trafność czynnikowa - analizy

czynnikowe

• Trafność teoretyczna:

– reaktywność emocjonalna zwiększa

wpływ stresorów na psychikę

– pacjenci depresyjni:

• obniżone wyniki w Żwawości,

Wytrzymałości i Aktywności

• podwyższone wyniki w reaktywności

emocjonalnej i perseweratywności

background image

EPQ-R - trafność

teoretyczna

Należało oczekiwać:
• dodatniej korelacji skal P i N ze

schizotypią i Pogranicznymi

Zaburzeniami Osobowości

• dodatniej korelacji skali K z aprobatą

społeczną

• dodatniej korelacji skali P ze skalą

Machiawelizmu

• dodatniej korelacji skali P z twórczością

background image

WAIS-R

przykłady trafności

diagnostycznej

• organiczne uszkodzenie mózgu

(zwłaszcza testy bezsłowne)

• neurotyzm (gorsze wyniki w testach

wymagających natychmiastowego
wysiłku
)

• urzędnicy i nauczyciele - lepsi w

testach słownych; robotnicy i
mechanicy - w bezsłownych


Document Outline


Wyszukiwarka

Podobne podstrony:
Psychometria 2009, Wykład 11, Inwentarz MMPI
Psychometria 2009, Wykład 9, Techniki projekcyjne
Psychometria 2009, Wykład 13, STATISTICA
Psychometria 2009, Wykład 12, WAIS R Skala Inteligencji Wechslera
Psychometria 2009, Wykład 10, Źródła błędów w testowaniu; Kontrowersje wokół inteligencji
Psychometria 2009, Wykład 2, Klasyczna teoria testu
Psychometria 2009, Wykład 6, Normalizacja
Psychometria 2009, Wykład 1, Definicje i historia psychometrii
Psychometria 2009, Wykład 7, Item Response Theory
Psychometria 2009, Wykład 3, Konstruowanie kwestionariusza psychologicznego
Psychometria 2009, Wykład 11, Inwentarz MMPI
Psychometria 2009, Wykład 9, Techniki projekcyjne
Psychologia w zarzadzaniu Wyklady 2009-2010
szafraniec psychologia spoleczna wyklad 2009-2010
Praca psychoterapeutyczna z DDA wykład SWPS
Psychologia ogólna Historia psychologii Sotwin wykład 7 Historia myśli psychologicznej w Polsce
Psychologia penitencjarna wykład 9
09.10.2012, Psychologia ogólna - wykłady

więcej podobnych podstron