Psychometria 2009, Wykład 2, Klasyczna teoria testu

background image

Psychometria 2009

Wykład 2

Klasyczna teoria

testu

background image

Whatever exists, exists in some

amount."

E. L. Thorndike.

background image

Założenia klasycznej teorii testu

(Gulliksen, 1950)

• do psychologii można zaadaptować model pomiaru

pochodzący z fizyki

• podobnie jak każdy obiekt fizyczny ma określone

wartości swoich cech fizycznych, niezależne od aktu

pomiaru i natury narzędzia badawczego, tak każdy

człowiek ma nieznane prawdziwe wartości cech

psychologicznych

• podczas pomiaru obserwujemy wartości prawdziwe

mierzonej cechy, zakłócone błędem równym różnicy

miedzy obserwowaną wartością wyniku pomiaru a

nieobserwowalną wartością prawdziwą mierzonej

cechy

background image

Rzetelność

• Klasyczna teoria testu (Gulliksen, 1950)

– „psychometryczne opracowanie
problemu rzetelności i błędu pomiaru”

• Rzetelność jest miarą dokładności

pomiaru

background image

X

t

= X

+ X

e

,

gdzie:

X

t

: wynik otrzymany

X

: wynik prawdziwy

X

e

: składnik błędu

background image

2

2

t

tt

s

s

r

gdzie:

r

tt

- rzetelność

s

2

- wariancja wyników

prawdziwych

s

2

t

- wariancja wyników

otrzymanych

var

t

= var

+ var

e

background image

Wynik prawdziwy

(Gulliksen, 1950)

• Wynik prawdziwy to granica, do

jakiej zmierza przeciętna wyników
i-tej osoby w danej liczbie testów
równoległych, jeśli ta liczba
wzrasta nieograniczenie

background image

Wynik prawdziwy

(Guilford, 1954)

• średnia z nieskończenie wielu

badań tym samym testem

• wynik danej osoby otrzymany w

idealnych warunkach idealnym
narzędziem pomiarowym

background image

Składnik błędu (Guilford,

1954)

• różnica między wynikiem

prawdziwym a wynikiem
otrzymanym

• wartość dodatnia lub ujemna

będąca funkcją warunków
testowania konkretnej osoby w
konkretnym badaniu

background image

„Błąd” pomiaru

• Pojęcie ”błędu” nie zawsze powinno być

rozumiane dosłownie, jako niedokładność

• W metodologii ogólnej: „błąd” to

niedokładność plus wszystko to, czego

nie badamy

• W psychometrii: fluktuacja cechy może

nie być błędem, lecz przedmiotem

pomiaru

• Dwie najbardziej stałe cechy w

psychologii: IQ i… podatność hipnotyczna

background image

Założenia klasycznej teorii

testów

• Średnia arytmetyczna błędów wynosi

zero

• Korelacja wyniku prawdziwego i

składnika błędu jest zerowa

• Korelacja składników błędu dwóch

testów równoległych (czyli dwóch
kolejnych pomiarów) jest zerowa

• Korelacja składników błędu w teście i

reteście tym samym testem jest zerowa

background image

• Z założenia o istnieniu wyniku

prawdziwego, niezależnego od aktu

pomiaru, oraz z założenia o

losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno

w dwóch kolejnych pomiarach

przynieść takie same wyniki

– różnice między wynikami dwóch

kolejnych pomiarów są odbiciem

błędów pomiaru i mogą służyć do jego

szacowania

– (podobnie zachowają się wersje

idealnie równoległe)

background image

• Błędy systematyczne

(skorelowane)

• Błędy losowe (nieskorelowane)

– Klasyczna teoria testu i wskaźniki

rzetelności dotyczą wyłącznie błędów
losowych

background image

Szacowanie składnika

błędu

• Z założenia o istnieniu wyniku prawdziwego,

niezależnego od aktu pomiaru, oraz z

założenia o losowości błędów, wynika, że:

– idealne narzędzie badawcze powinno w dwóch

kolejnych pomiarach przynieść takie same wyniki

– różnice między wynikami dwóch kolejnych

pomiarów są odbiciem błędów pomiaru i mogą

służyć do jego szacowania

– (podobnie zachowają się wersje idealnie

równoległe)

background image

• Rzetelność jest zatem równa teoretycznej

wartości współczynnika korelacji w dwóch

kolejnych badaniach (twierdzenie przydatne

empirycznie)

• Rzetelność jest też równa kwadratowi

korelacji między wynikiem prawdziwym a

wynikiem otrzymanym (twierdzenie mniej

przydatne empirycznie)

• Najprościej mówiąc, test rzetelny to taki,

którego wyniki korelują wysoko z sobą przy

powtórzeniu badania

background image

Długość testu a jego

rzetelność

• Im dłuższy test (im więcej pozycji

zawiera) tym jest rzetelniejszy, to jest,
tym mniejszym jest obciążony błędem

Im więcej składowych znajduje się w

teście, tym bliższy jest on wynikowi
prawdziwemu na mocy definicji
stwierdzającej, że wynik prawdziwy to
średnia z nieskończenie wielu testów
równoległych

background image

• Rzetelność a wskaźniki rzetelności
• Bezpośrednie badanie rzetelności:

– kalibracja
– seria pomiarów

(w psychologii ani jedno, ani drugie nie jest

możliwe)

Pośrednie badanie rzetelności:

wskaźniki rzetelności

background image
background image

Krytyka aksjomatyki

Gulliksena

• Thorndike (1964): ponieważ wyniki

prawdziwe nie są mierzalne bezpośrednio,
są one mitem i nie mogą mieć znaczenia
teoretycznego

– przyjęcie tego poglądu odrzucałoby całą

statystykę inferencyjną, która dotyczy głównie
szacowania nieobserwowalnych parametrów

– wyniki prawdziwe nie są mierzalne

bezpośrednio, ale są szacowalne, z błędem nie
wykluczającym teoretycznej ani praktycznej
użyteczności

background image

Krytyka aksjomatyki

Gulliksena

• Poważniejszy zarzut (Lord i Novick,

1968): nieweryfikowalność założenia
o losowości błędu pomiaru, czyli
postulatu, że średni błąd wynosi
zero. Stopień prawdziwości tego
założenia nie jest szacowalny (w
przeciwieństwie do
nieobserwowalnych parametrów)

background image

• Rzetelność odnosi się do:

– stabilności
– równoważności
– spójności

wyników testowych.

background image

Rzetelność – właściwość

testu

czy zbioru wyników?

• Rzetelność jest właściwością zbioru

wyników uzyskanego na konkretnej

populacji, a nie testu

• Stwierdzenie: „rzetelność testu X

wynosi 0,87” jest skrótem myślowym

• Oszacowanie rzetelności testu może

się różnić w różnych populacjach, np.

IQ szacowane w próbie pobranej z

populacji generalnej i z populacji

studentów

background image

• Wszystkie metody szacowania

rzetelności oparte są na badaniu
zgodności między zbiorami
wyników, dotyczących tej samej
cechy

background image

• Współczynniki rzetelności, jak

wszystkie miary oparte na
korelacji, są wrażliwe na wielkość
wariancji w próbie

• Mogą być generalizowane tylko na

tę populację, z której pobrano
próbę

background image

YIELD1 vs. YIELD2

Wsp. korelacji = ,74

YIELD1

Y

IE

LD

2

-2

0

2

4

6

8

10

12

14

-2

0

2

4

6

8

10

12

14


Document Outline


Wyszukiwarka

Podobne podstrony:
Psychometria 2010, Wykład 2, Klasyczna teoria testu p
Slajdy, Wyklad 3[1][1] Klasyczna teoria testu
Psychometria 2009, Wykład 11, Inwentarz MMPI
Psychometria 2009, Wykład 9, Techniki projekcyjne
Psychometria 2009, Wykład 5, Trafność
Psychometria 2009, Wykład 13, STATISTICA
Psychometria 2009, Wykład 12, WAIS R Skala Inteligencji Wechslera
Psychometria 2009, Wykład 10, Źródła błędów w testowaniu; Kontrowersje wokół inteligencji
Psychometria 2009, Wykład 6, Normalizacja
Psychometria 2009, Wykład 1, Definicje i historia psychometrii
Psychometria 2009, Wykład 7, Item Response Theory
Psychometria 2009, Wykład 3, Konstruowanie kwestionariusza psychologicznego
Psychometria 2009, Wykład 11, Inwentarz MMPI
Psychometria 2009, Wykład 9, Techniki projekcyjne
Psychometria 2009, Wykład 5, Trafność
Psychologia osobowości dr Kofta wykład 9 Poznawcza teoria Ja

więcej podobnych podstron