trafność testu

background image

Psychometria, metoda
testów

Psychometria, metoda
testów

Trafność testu

background image

Trafność testu

Trafność testu

Poprzez trafność rozumie się zazwyczaj:

stopień, w jakim test mierzy cechę, którą ma
mierzyć;

stopień dokładności przewidywania określonych
kryteriów zewnętrznych – możliwość opisu
zachowań pozatestowych na podstawie badania
testem.

Druga z wymienionych formuł określających trafność jest
ważniejsza. Nadto, tak rozumiana trafność jest najważniejszą
własnością testu
z punktu widzenia psychologa. Celem niemal wszystkich
diagnoz jest opis lub przewidywanie funkcjonowania osoby
badanej w „realnym życiu”. Zatem informacja o trafności
określa nie tylko status
– „dobroć” pomiarową – narzędzia, ale także stanowi
wskazówki interpretacyjne dla diagnosty.

background image

„Święta Trójca” (czwórca – ?)
trafności

„Święta Trójca” (czwórca – ?)
trafności

W podręcznikach psychometrii wymienia się

zazwyczaj trzy rodzaje trafności:

teoretyczną (ang. construct),

kryterialną,

diagnostyczną,

prognostyczną,

treściową (wewnętrzną).
Wymieniana niekiedy jest także pseudo-trafność:

fasadowa.
Pamiętać należy o tym, iż są to przede

wszystkim aspekty trafności, którym

odpowiadają techniki walidowania testów.

background image

Trafność a rzetelność
pomiaru

Trafność a rzetelność
pomiaru

rzetelność jest podstawą – warunkiem
koniecznym trafności

rzetelność stanowi górną granicę
trafności
– jest niemożliwe, aby trafność była
większa od rzetelności; testy o dużej
trafności pomiaru są zarazem bardzo
rzetelne (jednak ta zależność
nie jest odwrotna)

background image

Trafność treściowa

Trafność treściowa

zakres, w jakim pozycje testowe reprezentują
uniwersum pozycji testowych (czy też zachowań
związanych z cechą); stopień w jakim pozycje
testowe stanowią reprezentatywną próbkę zachowań

nie może być mierzona, sprowadza się do oceny – czy
wskaźniki spełniają kryteria definicyjne cech

pozycje o dużej trafności treściowej charakteryzuje dobra
charakterystyka psychometryczna – są one osiowymi
wskaźnikami danej cechy

trafność treściowa jest koniecznym, choć niewystarczającym
warunkiem innych rodzajów trafności

większość podręczników utożsamia trafność treściową i
trafność wewnętrzną, ten drugi rodzaj trafności może być
jednak rozumiany bardziej ogólnie – jako stopień w jakim
postać narzędzia odpowiada koncepcji założonej przez
konstruktora testu

background image

Przykład - analiza trafności treściowej
skali ekstrawersji z kwestionariusza EPQ-
RS (1)

Przykład - analiza trafności treściowej
skali ekstrawersji z kwestionariusza EPQ-
RS (1)

Według definicji zawartej w podręczniku do kwestionariusza EPQ-R
ekstrawertyk jest towarzyski, ma wielu przyjaciół, odczuwa potrzebę
rozmowy z innymi, nie lubi samotności. Ogólnie uważa się go za
jednostkę impulsywną i działającą bez zastanowienia. Lubi zajmować
się działalnością praktyczną. Introwertyk woli czytać książki niż
przebywać w towarzystwie, jest powściągliwy, bardzo wymagający w
doborze przyjaciół, nie jest impulsywny, lubi wieść uporządkowany
tryb życia.

Strelau (1998) podkreśla, że Eysenck nie podaje typowych definicji
wymiarów osobowości, opisując je w kategoriach korelacji z cechami
źródłowymi. Ekstrawersja jest cechą nadrzędną dla takich cech jak:

towarzyskość, aktywność, dominacja,

towarzyskość, aktywność, dominacja,

poszukiwanie doznań, beztroska, wybuchowość,

poszukiwanie doznań, beztroska, wybuchowość,

śmiałość, asertywność, żywość

śmiałość, asertywność, żywość

background image

Przykład - analiza trafności treściowej
skali ekstrawersji z kwestionariusza EPQ-RS
(2)

Przykład - analiza trafności treściowej
skali ekstrawersji z kwestionariusza EPQ-RS
(2)

1.

Czy jesteś osobą rozmowną?

2.

Czy masz żywe usposobienie?

3.

Czy masz wielu przyjaciół?

4.

Czy lubisz robić rzeczy wymagające szybkiego działania?

5.

Czy zwykle przejawiasz inicjatywę przy zawieraniu nowych
znajomości?

6.

Czy łatwo Ci rozkręcić towarzystwo na nudnym przyjęciu?

7.

Czy w towarzystwie masz skłonność do trzymania się na uboczu? (*)

8.

Czy lubisz przebywać wśród ludzi?

9.

Czy przeważnie milczysz w towarzystwie innych ludzi? (*)

10.

Czy lubisz jak wokół Ciebie jest dużo ruchu i ciągle coś się dzieje?

11.

Czy ludzie uważają Cię za osobę o bardzo żywym usposobieniu?

12.

Czy potrafisz rozkręcić zabawę na przyjęciu?

background image

Trafność fasadowa

Trafność fasadowa

dotyczy wyglądu testu – wrażenia, jakie wywiera na
osobach badanych, odnoszącego się do przeznaczenia
testu

kwestionariusze, które charakteryzuje wysoka trafność
fasadowa, są szczególnie podatne na zniekształcenia

ze względu na ten efekt w przypadku niektórych testów,
szczególnie z obszaru psychologii klinicznej, cel badania
bywa maskowany np. poprzez odpowiednią manipulację
nazwą (tytułem) kwestionariusza

z drugiej strony, budząca zaufanie postać testu może
pełnić istotną rolę w budowaniu pozytywnego stosunku
osoby badanej do sytuacji, w której stosowany jest test,
jak i do diagnozy oraz osoby psychologa

background image

Przykład - trafność fasadowa (1)

Przykład - trafność fasadowa (1)

background image

Przykład - trafność fasadowa (2)

Przykład - trafność fasadowa (2)

background image

Trafność kryterialna (1)

Trafność kryterialna (1)

stopień w jakim test koreluje z określonym
kryterium zewnętrznym

określenie zewnętrznego kryterium i jego własności jest
kluczową i trudną kwestią w badaniach trafności
kryterialnej

standardowe postępowanie zakłada prowadzenie badań
zgodnie
z taką procedurą, która pozwala na określenie rzetelności
kryterium, np. w przypadku diagnoz klinicznych

właściwymi technikami analizy danych w badaniach
trafności kryterialnej są techniki korelacyjne

w przypadku zastosowania baterii testów do predykcji
kryterium, dobrą strategią jest użycie analizy regresji, lub
analizy dyskryminacyjnej – w celu opracownia baterii
testów o wysokiej trafności i niskiej redundancji
pomiarowej

background image

Trafność kryterialna (2)

Trafność kryterialna (2)

trafność diagnostyczna odnosi się do stopnia, w jakim
wyniki testowe pozwalają na ocenę kryterium, przy
założeniu, że występują one w tym samym czasie

trafność prognostyczna odnosi się natomiast do stopnia,

w jakim wyniki testu umożliwiają przewidywanie
kryterium, które występować będzie znacznie później

trafność diagnostyczna jest warunkiem koniecznym,
ale nie wystarczającym trafności prognostycznej - testy
prognostyczne muszą diagnozować, ale diagnozowanie
nie gwarantuje prognozowania

background image

Trafność kryterialna (3)

Trafność kryterialna (3)

ocena współczynników trafności kryterialnej może być
korygowana ze względu na nierzetelność kryterium,
możliwa jest też korekta obliczana ze względu na
nierzetelność testu
oraz nierzetelność kryterium

w przypadku estymacji wyników kryterium na podstawie
testu, stosowanej w celu selekcji osób badanych, pamiętać
należy
o estymacji przedziału ufności uwzględniającego
standardowy błąd estymacji kryterium

trafność kryterialna nie jest własnością stałą, będzie
zmieniać się w wyniku ograniczania zmienności kryterium,
lub zmienności między osobami badanymi testem

ponieważ wartość współczynnika trafności kryterialnej
może być także efektem czynników losowych, ważne jest
stosowanie tzw. walidacji krzyżowej

background image

Przykład (1)

Przykład (1)

Korelacja między aktywnością (skala z FCZ-KT
Zawadzkiego i Strelaua) a formą spędzania urlopu
(aktywnie lub nie)

– obliczona dla ogółu osób badanych
(N=1474)

0,32**

– obliczona dla osób o wysokiej aktywności
(N=303, kryterium - co najmniej
podwyższony wynik na skali aktywności)

0,17*

background image

Przykład (2)

Przykład (2)

Korelacje między skalami kwestionariusza EPQ-R
Eysencka a przeciętną ilością wypijanych
filiżanek kawy, uzyskane na próbach z dwu
regionów Polski

N E

P

L

katowickie

(N=517)

0,02 0,11 0,03 0,01

łódzkie (N=480)

0,01 0,21* 0,09 0,04

background image

Przykład (3a)

Przykład (3a)

Predykcja zaburzeń zdrowia psychicznego za pomocą
kwestionariuszy CISS i FCZ-KT.

Równanie regresji oparte na danych z subpopulacji (Śląsk):

predyktor_1 = 0,78wrs - 0,71rem + 0,45akt + 0.39copza

- 1.27copemo + 0.33copun + 173.23

Równanie regresji oparte na danych z próby ogólnopolskiej:
predyktor_2 = 0.51wrs - 1.02rem + 0.38copza - 1.18copemo
+ 0.96coptow + 177.91

background image

Przykład (3b)

Przykład (3b)

Korelacje między wskaźnikiem zaburzeń zdrowia
psychicznego a predyktorami opartymi na równaniach
regresji.

Próba ogólnopolska:
Predyktor 1

Predyktor 2

R=0,59**R=0,62** N=1596

Korelacje dla tych samych predyktorów
w próbie osób z wyższym wykształceniem
R=0,65**R=0,70** N=187

background image

Poprawka na
nierzetelność

Poprawka na
nierzetelność

Możliwe jest obliczanie współczynników trafności,
których wartość będzie skorygowana ze względu na
nierzetelność za równo testu, jak i zewnętrznego
kryterium. Estymowana ocena związku między
zmiennymi będzie odpowiadać takiej wartości
korelacji – jaką uzyskalibyśmy stosując dokonale
rzetelny test i doskonale rzetelne kryterium.
W tym celu posługujemy się wzorem:

r

TG

- estymowany współczynnik korelacji między

wynikami prawdziwymi zmiennych t i g; r

tg

- otrzymany

współczynnik między zmiennymi; r

tt

- rzetelnośc testu t,

r

gg

- rzetelność kryterium g.

r

r

r r

TG

tg

tt gg

 /

background image

Trafność teoretyczna

Trafność teoretyczna

trafność teoretyczna to taki rodzaj trafności, który

świadczy o zgodności zmiennej mierzonej przez test

z konstruktem teoretycznym

oznacza to identyfikację „treści psychologicznej”

mierzonej przez test

w odróżnieniu od trafności kryterialnej, istotą

trafności teoretycznej jest możliwość

przewidywania kryteriów psychologicznych, a nie

kryteriów „pozatestowych”

w praktyce ocena trafności teoretycznej polega na

prowadzeniu badań, w których weryfikowane są

twierdzenia teoretyczne, w sytuacji skrajnej badania

takie mogą prowadzić nawet do modyfikacji teorii

background image

Metody badania trafności
teoretycznej

Metody badania trafności
teoretycznej

analiza związków między
konstruktem
a zachowaniem

analiza macierzy korelacji

background image

Analiza związku między konstruktem a
zachowaniem (1)

Analiza związku między konstruktem a
zachowaniem (1)

metoda badania zmian nieprzypadkowych:

– odwołuje się do dwukrotnego pomiaru
– jest pseudo-eksperymentalna, między pomiarami
następuje manipulacja, która prowadzić ma do
uzasadnionych zmian w wynikach testu

metoda badania procesu rozwiązywania testu:

– w metodzie tej sprawdzany jest sposób w jaki test jest
rozwiązywany, np. czy angażowane są takie procesy
poznawcze, które wiążą się określonym typem zdolności
– możliwe jest stosowanie „wariantów” zadań testowych

w celu precyzyjnej analizy procesu rozwiązywania zadań

background image

Analiza związku między konstruktem a
zachowaniem (2)

Analiza związku między konstruktem a
zachowaniem (2)

metoda sprawdzania różnic międzygrupowych:

– weryfikuje hipotezę teoretyczną o zróżnicowaniu grup
– najczęściej skrajnych, kontrastowych – w zakresie
mierzonej zmiennej lub zmiennych
– grupy mogą być dobierane ze względu na kryteria
demograficzne
lub psychologiczne
– możliwa jest analiza różnic międzygrupowych
w sytuacjach eksperymentalnych

background image

Analiza macierzy korelacji

Analiza macierzy korelacji

metoda badania wewnętrznej struktury testu:

– w najprostszym przypadku testowane są związki między skalami
w teście, lub podskalami a skalą ogólną
– niekiedy badana jest tzw. trafność czynnikowa oparta na analizie
czynnikowej

metoda analizy korelacji testu walidowanego i innych
testów:

– w uproszczonej formie polega na analizie korelacji walidowanego
testu z grupą narzędzi mierzących tę samą zmienną i/lub korelacji z
innymi kryteriami
– w postaci bardziej zaawansowanej odwołuje się do analizy
czynnikowej prowadzonej na skalach zestawu narzędzi
diagnostycznych

metoda wielu cech - wielu metod Campbella i Fiskego

background image

Przykład (4a)

Przykład (4a)

background image

Przykład (4b)

Przykład (4b)

USA

POLSKA

1: A, F, H, N, Q2

I: A, F, H, N, Q2

2: C, L, O, Q4 II: C, L, O, Q4
3: A, I, M, Q1 III: M, Q1
4: E, H, L, Q1 IV: I, E, O, C
5: F, G, M, Q3 V: G, Q3
Czynniki 1 i 2: bez zmian. Czynnik 3 i 5: następuje
"zawężenie" czynnika wobec danych opisujacych
oryginalne rozwiązanie. Czynnik 4: inna
konfiguracja, niezależność w adaptacji jest
„uwikłana” emocjonalnie.

background image

Przykład (5)

Przykład (5)

background image

Metoda „wielu cech – wielu metod”
Campbella i Fiskego

Metoda „wielu cech – wielu metod”
Campbella i Fiskego

najbardziej zaawansowana formalnie technika analizy
macierzy korelacji, możliwe jest jednak stosowanie
„uproszczonej formy” tego paradygmatu

odwołuje się do pomiaru co najmniej dwu lub więcej
niezależnych cech za pomocą dwu niezależnych metod

aby dany test uznać za trafny należy wykazać zarówno
trafność zbieżną (konwergentną), jak i trafność
różnicową (dyksryminatywną)

Skala ma korelować z innym pomiarem podobnej zmiennej
(aspekt konwergentny), ale nie powinna korelować z miarami
innych zmiennych i innymi skalami wewnątrz tej samej metody
(aspekt dyskryminatywny).

background image

Przykład (6)

Przykład (6)

Korelacje między kwestionariuszami FCZ-KT i NEO-FFI
jako dane pozwalające na ocenę trafności dwu skal
zgodne z paradygmatem Campbella i Fiskego.

NEU EKS OTW UGD SUM

Żwawość

-0,39* 0,28* 0,11

0,11

0,32

Perseweratywność

0,49* -0,06 0,09

0,09

0,06

Wrażliwość sensoryczna

-0,08 0,08 0,30* 0,30* 0,12

Reaktywność emocjonalna

0,64** -0,29* -0,13 -0,02 -0,15

Wytrzymałość

-0,44* 0,24* 0,10

0,07 0,20*

Aktywność

-0,20* 0,63** 0,25* -0,19* -0,02

background image

Kilka ważnych stwierdzeń

Kilka ważnych stwierdzeń

trzy (a nawet cztery) odmiany trafności są aspektami
trafności wzajemnie zależnymi

wymóg trafności dotyczy przede wszystkim możliwości
interpretacyjnych zastosowania narzędzia –
diagnozowania zazwyczaj w kontekście teorii
psychologicznej

ważnym jest, aby test był walidowany wieloma
metodami sprawdzającymi różne aspekty trafności

współczynniki trafności – podobnie jak współczynniki
rzetelności – nie są cechą narzędzia, są własnością
pomiaru testem realizowanego na konkretnej grupie
osób badanych


Document Outline


Wyszukiwarka

Podobne podstrony:
Trafność testu, Psychologia, Statystyka, psychometria
18 Badanie słuchu fonemowego z uzyciem testu sylab nagłosowychid 17648 ppt
opracowanie testu
Odpowiedzi do testu 1 poziom podstawowy id 332449
odpowiedzi do testu id 332437 Nieznany
klucz do testu II Stopień
Rozwiazanie Testu SP, ^ Turystyka i Rekreacja GWSH Katowice, 3 semestr, podstawy przedsiebiorcz
Pytania do testu 2013, WSZOP- Wyższa Szkoła Zarządzania Ochroną Pracy, Choroby zawodowe
4 strona testu B-9A-6, Konspekty Instruktorskie, Instruktor kat C+E, Instruktor nauki jazdy (superma
Badanie dokładności geometrycznej obrabiarki CNC FV 580A z zastosowaniem testu QC10
Koncepcja testu
Poetyka, analiza i interpretacja Testu Lema
odp do testu l
pytania z testu z odpowiedziami
JAVASCRIPT Kod kodu testu z JavaScript do pracy kontrolnej
odpowiedzi do testu z żyweinia
opracowane pytania do testu z wytrzymki(2)
Klucz do testu Aminy, amidy, aminokwasy, białka i sacharydy(1)
Klucz do testu I A PRACA I ENERGIA

więcej podobnych podstron