Trudno pozycji Moc dyskryminacyjna
informuje w jakim stopniu pytanie/zadanie ró nicuje dan
stosunek liczby osób, które udzieli y prawid owej
populacj , ze wzgl du na mierzon cech
(zgodnej z kluczem i diagnostycznej) odpowiedzi na
w rozumieniu operacyjnym korelacja mi dzy pozycj
pytanie, do ogó em przebadanej liczby osób
a skal ; obliczanie takich korelacji wymaga spe nienia
zazwyczaj wyra any jako odsetek osób, które zna y
specyficznych za jedna z korelowanych zmiennych
prawid ow odpowied na pytanie
jest mierzona na skali nominalnej, druga na przedzia owej
przyjmuje paradoksalne warto ci wysoka warto
warto ujemna wskazuje na to, e badacz pomyli si
wskazuje na atwe pytania
ustalaj c klucz mo na to traktowa jako dyskwalifikacj
stosowany zazwyczaj w przypadku testów wiedzy pozycji mimo znacz cej warto ci bezwzgl dnej m.d.
najlepiej ró nicuj cymi pytaniami s pytania o przeci tnym przyjmuje si , e moc dyskryminacyjna musi mie
stopniu trudno ci pozwalaj na dokonanie najwi kszej warto > 0,20, aby pozycja by a w czana do skali
liczby porówna mi dzy osobami w próbie (oko o 5% wspólnej wariancji ze skal )
warto ci mocy dyskryminacyjnych maksymalizuj si dla
pyta o przeci tnej trudno ci
17 18
Metody obliczania mocy dyskryminacyjnych (1) Metody obliczania mocy dyskryminacyjnych (2)
wspó czynnik korelacji biseryjnej (dwuseryjnej) pakiety statystyczne obliczaj skorygowane korelacje
pozycja-skala (corrected item-total correlation)
rozk ad wyników cechy mierzonej przez dan pozycj
winien by zmienn ci o normalnym rozk adzie
korekta polega na wy czeniu z sumy wyniku ogólnego
rozk ad wyników ogólnych w te cie winien tak e by pytania, dla którego obliczana jest moc dyskryminacyjna
rozk adem normalnym
obliczane w taki sposób warto ci mocy dyskryminacyjnej s
bardziej surowe (ni sze) ni w przypadku wspó czynników
wspó czynnik korelacji punktowo-dwuseryjnej
prezentowanych na poprzedniej folii
rozk ad wyników cechy mierzonej przez dan pozycj jest
dwukategorialny zmienna jest dyskretna
wyniki ogólne w te cie maj rozk ad normalny (jak wy ej)
wspó czynnik korelacji punktowo-czteropolowej
nie mo na przyj za wymienionych wy ej
zarówno wynik pozycji, jak i wynik ogólny traktowane
jako zmienne dychotomiczne
19 20
Inne miary dobroci pozycji
Problemy z form narz dzia
w przypadku narz dzi tworzonych zgodnie ze
" wynikaj ce ze specyfiki kwestionariuszy
strategi kryterialn miar dobroci pozycji jest jej
korelacja z zewn trznym kryterium niejednoznaczno kwantyfikatorów cz sto ci
konsekwencj takiego podej cia (i zastosowanej dost pno zachowania w do wiadczeniu
strategii analizy danych) jest tworzenie skal mniej
przesadne uogólnienia i poj cia abstrakcyjne
homogenicznych, mniej rzetelnych, jednak bardziej
d blisko ci
trafnych kryterialnie i tre ciowo
" wynikaj ce wprost ze specyfiki j zyka
w zale no ci od przyj tych za dotycz cych
negacje, u ycie strony biernej, podwójne przeczenia,
kryterium stosuje si :
komplikacja gramatyczna, zdania z one, trudne
model wielokrotnej regresji liniowej
i rzadko u ywane s owa
analiz dyskryminacyjn
21 22
Format odpowiedzi
wielko zestawu opcji lub wersji odpowiedzi,
liczba kategorii odpowiedzi oferowanych osobie
badanej do wyboru.
ilo opcji odpowiedzi
konsekwencje u ycia zbyt w skiego, lub zbyt szerokiego
formatu odpowiedzi
problem opcji rodkowej ?
preferencje formatu odpowiedzi wynikaj ce
z charakterystyk osób badanych
23
Próba klasyfikacji b dów pomiaru
Psychometria, metoda testów
" d systematyczny, w rozumieniu klasycznej teorii
testów, nie wi e si z nierzetelno ci testu, wiadczy
raczej o inwalidacji narz dzia
Rzetelno testu psychologicznego
" d losowy powoduje obni enie rzetelno ci pomiaru
testem, mo e by konsekwencj :
wyk ad 5
konstrukcji testu,
sytuacji testowania,
ej oceny wyników.
1 2
Podstawy teorii rzetelno ci (1) Podstawy teorii rzetelno ci (2)
" Twierdzenie 1:
" Twierdzenie 2:
X X
Xx t e
Wynik otrzymany w rezultacie pomiaru testem sk ada si z wyniku M M M M
x t e t
prawdziwego i b du pomiaru.
rednia wyników otrzymanych w rezultacie pomiaru testem jest sum
" Za enia:
redniej wyników prawdziwych i redniej b dów pomiaru (równej zeru).
1. Warto oczekiwana b du pomiaru
" Twierdzenie 3:
rednia) jest równa zeru.
0
e
2. Wynik prawdziwy jest nieskorelowany 2 2 2
z b dem pomiaru.
s s s
0 x t e
rte
Zmienno wyników otrzymanych jest sum wariancji wyników
3. dy pomiarów s nieskorelowane.
prawdziwych i wariancji b du.
0
re1e 2
3 4
Idea testu równoleg ego Podstawy teorii rzetelno ci (3)
" Kolejne za enia:
" Dwa testy s testami równoleg ymi, je eli spe nione s
1. Mo na oczekiwa , e wyniki otrzymane i prawdziwe
cztery warunki:
skorelowane. Korelacj tak nazywamy wska nikiem
1.
rzetelno ci.
Ma Mb rednia wyników otrzymanych w te cie A równa
si redniej wyników otrzymanych w te cie B.
2. Mo na wykaza , e korelacja mi dzy dwoma testami
2. Odchylenie standardowe wyników otrzymanych
równoleg ymi równa jest wspó czynnikowi rzetelno ci -
sa sb w te cie A równa si odchyleniu standardowemu
kwadratowi wska nika rzetelno ci, stosunkowi wariancji
wyników otrzymanych w te cie B.
wyników prawdziwych do wyników otrzymanych.
3. Interkorelacje w te cie A s takie same jak
Ka dy wspó czynnik rzetelno ci mo na interpretowa jako
interkorelacje w te cie B.
riaja ribjb
odsetek wariancji wyników otrzymanych determinowanych
4. Test A (wyniki otrzymane) koreluje
przez wariancj wyników prawdziwych.
raZ rbZ z zewn trznym kryterium tak samo jak test B.
rxt rtt
5 6
Interpretacja warto ci wspó czynników rzetelno ci
Podstawy teorii rzetelno ci (4)
" rtt > 0,90 bardzo rzetelny pomiar, test mo e by stosowany
" Twierdzenie 4:
zarówno w badaniach naukowych, jak i do formu owania
diagnoz indywidualnych
2 2 Rzetelno pomiaru to
stosunek wariancji
st2 sx se " 0,90 > rtt > 0,80 rzetelny pomiar, test mo e by
wyników prawdziwych
stosowany w badaniach naukowych, jak i do diagnoz
rtt
do wariancji wyników
2 2
indywidualnych, które b mniej precyzyjne
otrzymanych.
sx sx
" 0,80 > rtt > 0,70 przeci tna rzetelno , test powinien by
stosowany jedynie w badaniach naukowych
" Twierdzenie 5:
" 0,70 > rtt > 0,60 niska rzetelno , test mo e by
stosowany warunkowo w badaniach naukowych
SEM se sx (1 rtt ) " 0,60 > rtt > 0,50 w tpliwa rzetelno pomiaru,
test bezu yteczny
Standardowy b d pomiaru jest odchyleniem standardowym rozk adu
dów pomiaru wokó wyniku otrzymanego.
7 8
Formu a obliczania przedzia u ufno ci
Przyk ad: SEM a rtt i
dla wyniku otrzymanego
" Przedzia ufno ci dla wyniku otrzymanego pozwala na
okre lenie granic, w których - z przyj tym
prawdopodobie stwem - znajduje si wynik prawdziwy osoby
badanej; przedzia ten budujemy wed ug formu y:
Xt Xx z /2SEM; Xx z /2SEM
sta a z /2 przyjmuje nast puj ce warto ci:
wysoka rzetelno i niski standard wnioskowania
0,15 0,10 0,05 0,01
wysoka rzetelno i wysoki standard wnioskowania
z /2 1,44 1,64 1,96 2,58 niska rzetelno i niski standard wnioskowania
niska rzetelno i wysoki standard wnioskowania
bardzo niska rzetelno i wysoki standard wnioskowania
9 10
Standardowy b d ró nicy mi dzy dwoma wynikami
SEM a SEE
" Lord i Novick zaproponowali inne ni Gulliksen rozumienie
" Oceniaj c istotno ró nicy mi dzy dwoma wynikami
standardowego b du pomiaru - standardowy b d estymacji
pos ugujemy si wzorem:
wyniku otrzymanego, który jest charakter zale y od wyniku
2 2
prawdziwego.
SEM (SEM SEMY )
X Y X
d ten ma rozk ad symetryczny wokó wyniku prawdziwego
" Gdy obliczamy ró nic mi dzy wynikami dwóch testów,
i niesymetryczny wokó wyniku otrzymanego
ci le - jest symetryczny dla wyników rednich i sko ny dla przyjmuje on posta :
wyników skrajnych).
2 2
SEM S (1 rxx ) SY (1 ryy )
" W praktyce jednak, bardziej zachowawcze jest stosowanie
X Y X
SEM, a ró nica jest subtelna, wynika to z nast puj cej relacji:
" Gdy obliczamy ró nic mi dzy wynikami dwóch osób
badanych tym samym testem:
SEE SEM rtt
SEM S 2(1 rtt )
X Y X
11 12
Psychometria, metoda testów Metody szacowania rzetelno ci
" dwukrotne badanie tym samym testem
" porównanie form równoleg ych testu
" porównanie cz ci (np. po ówek) testu
Metody szacowania rzetelno ci
" oparte na analizie w ciwo ci statystycznych pozycji
testowych
wyk ad 6
" oparte na analizie zwi zków itemów z ogólnym
wynikiem testu
" badanie stopnia zgodno ci s dziów kompetentnych
oceniaj cych odpowiedzi testowe
13 14
Dwukrotne badanie tym samym testem Porównanie form równoleg ych testu
metoda estymacji stabilno ci bezwzgl dnej testu odwo uje metoda ta podobnie jak omówione wcze niej odwo uje
si do dwukrotnego pomiaru tym samym testem tej samej si do dwukrotnego badania grupy osób badanych, jednak
grupy osób badanych, mi dzy pomiarami mija jaki czas w miejsce dwukrotnego u ycia tego samego testu u ywane
(inna nazwa badanie sta ci); dwie wersje równoleg e
metoda ta jest wra liwa na przypadkowe zmiany dotycz ce
w przypadku dokonania pomiarów bez przerwy czasowej
osoby badanej i warunków badania
metoda nazywana jest estymacj równowa no ci
metoda estymacji wiarygodno ci testu, podobnie jak wy ej mi dzytestowej; pozwala okre li zwi zek mi dzy b dem
jest to dwukrotne badanie tej samej grupy, jednak mi dzy pomiaru a ró nicami wersji, zatem oceni zwi zek
pomiarami nie ma przerwy badanie drugie nast puje rzetelno ci i specyficznych tre ci pyta
zaraz po zako czeniu pierwszego;
wspó czynnik stabilno ci wzgl dnej uzyskujemy dokonuj c
metoda pozwala oceni chwilowe nie trwaj ce d ej ni
pomiarów wersjami równoleg ymi z odst pstwem czasu;
samo badanie i zwi zane z osob badan czynniki
uzyskana informacja o ródle b du dotyczy zarówno
zak ócaj ce pomiar np. zm czenie, lub fluktuacje uwagi
zmienno ci intraindywidualnej, jak i tre ci pyta
15 16
Metody oparte na analizie w ciwo ci
Porównanie cz ci (np. po ówek) testu
statystycznych pozycji testowych
estymacja zgodno ci wewn trznej opiera si na
metoda po ówkowa pozwala okre li wspó czynnik
jednokrotnym badaniu, w ogólnym rozumieniu
równowa no ci mi dzypo ówkowej; odwo uje si do
wspó czynniki tego rodzaju s redni wszystkich mo liwych
jednokrotnego pomiaru jednym testem; de facto
post powanie takie przypomina omówiony wcze niej wspó czynników równowa no ci mi dzypo ówkowej
wspó czynnik równowa no ci mi dzytestowej
odwo uj cych si do ró nych przepo owie
test mo e by podzielony na po owy: losowo,
metody tego typu odwo uj si do tzw. wzorów KR20
lub z uwzgl dnieniem statystyk opisuj cy poszczególne
i KR21 opracowanych przez Kuder i Richardson, oraz
pytania, albo po prostu na pytania o numerach parzystych
formu y obliczania przedstawionej przez Cronbacha
vs. pytania o numerach nieparzystych
wspó czynniki tego typu maksymalizuj si dla skal
ocenianym ród em b du s ró nice mi dzy po ówkami
jednorodnych czynnikowo (homogenicznych), w których
dotycz ce specyficznych tre ci pyta
poszczególne pozycje s wzgl dem siebie równoleg e;
ród em b du jest zatem heterogeniczno pyta i ich tre ci
17 18
Metody oparte na analizie zwi zków
Ocena stopnia zgodno ci s dziów kompetentnych
itemów z ogólnym wynikiem testu
metoda stosowana niezbyt cz sto, zazwyczaj w przypadku
metody tego typu pozwalaj na okre lenie rzetelno ci
narz dzi, gdzie odpowiedzi osoby badanej podlegaj
w oparciu o jednokrotne badanie
swobodnej ocenie diagnosty
w sensie operacyjnym obliczane wska niki s pochodnymi
w celu oceny zgodno ci kilku zestawów ocen tego samego
mocy dyskryminacyjnych korelacji mi dzy pozycjami
materia u, dokonanych przez kilku niezale nie pracuj cych
a wynikami ogólnymi w skali
diagnostów s dziów kompetentnych oblicza si np.
w celu obliczenia tak budowanych wspó czynników
wspó czynnik zgodno ci s dziów W-Kendalla.
rzetelno ci stosuje si wzory zaproponowane przez
ród em wariancji b du mog by niedostatki pracy
Spearmana-Browna lub Gulliksena
diagnostów lub niedostatki klucza wed ug którego
ród em b du jest dobór tre ci itemów
dokonywane s oceny
19 20
Czynniki wp ywaj ce na rzetelno pomiaru Przyk ad - rzetelno a zakres pomiaru
" ugo testu
" jako pyta
" homogeniczno wymiaru
(jednorodno grupy pyta )
" zakres mierzonej cechy
21 22
Przyk ad - analiza rzetelno ci (1) Przyk ad - analiza rzetelno ci (2)
R E L I A B I L I T Y A N A L Y S I S
Re l i abi l i t y Coe f f i c i e nt s
I t e m- t ot al St at i s t i c s
Sc al e Sc a l e Co r r e c t e d
M an Var i a nc e I t e m- Al pha
e
N of I t e ms = 20 Al pha = , 8390
i f I t e m i f I t e m Tot al i f I t e m
De l e t e d De l e t e d Cor r e l at i on De l e t e d
N of I t e ms = 18 Al pha = , 8277
VAR000 10 83 , 8901 43, 9 211 - , 4012 , 4 356
VAR000 11 82 , 8571 40, 1 016 - , 0256 , 3 810
VAR000 12 82 , 4945 39, 0 305 , 0746 , 3 642
VAR000 14 82 , 4835 35, 8 747 , 3365 , 3 108 N of I t e ms = 16 Al pha = , 8371
VAR000 15 82 , 9011 35, 5 790 , 3510 , 3 062
VAR000 30 82 , 5385 35, 3 402 , 4069 , 2 982
VAR000 32 82 , 5934 34, 3 995 , 5299 , 2 762
N of I t e ms = 14 Al pha = , 8423
Re l i abi l i t y Coe f f i c i e nt s N of I t e ms = 12 Al pha = , 8357
N of Cas e s = 91, 0 N of I t e ms = 35
Al pha = , 3704
23 24
Wzory prorocze Spearmana i Browna
" Pozwalaj na okre lenie rzetelno ci testu n-krotnie wyd onego
nrtt
rtt
n
1 (n 1)rtt
n - wielko przed enia testu, rtt - rzetelno testu przed przed eniem,
rttn - rzetelno testu po n-krotnym przed eniu
" Powy szy wzór mo na przekszta ci , aby okre la krotno
przed enia
rtt (1 rtt )
n
n
rtt (1 rtt )
n
rttn - po dana rzetelno testu po n-krotnym wyd eniu, rtt - pierwotna
rzetelno testu
25
Psychometria, metoda testów
Trafno testu
Poprzez trafno rozumie si zazwyczaj:
" stopie , w jakim test mierzy cech , któr ma mierzy ;
" stopie dok adno ci przewidywania okre lonych kryteriów
zewn trznych mo liwo opisu zachowa pozatestowych
na podstawie badania testem.
Trafno testu
Druga z wymienionych formu okre laj cych trafno jest wa niejsza.
Nadto, tak rozumiana trafno jest najwa niejsz w asno ci testu
z punktu widzenia psychologa. Celem niemal wszystkich diagnoz jest
opis lub przewidywanie funkcjonowania osoby badanej w realnym
yciu . Zatem informacja o trafno ci okre la nie tylko status
dobro pomiarow narz dzia, ale tak e stanowi wskazówki
interpretacyjne dla diagnosty.
1 2
wi ta Trójca (czwórca ?) trafno ci
Trafno a rzetelno pomiaru
W podr cznikach psychometrii wymienia si zazwyczaj trzy
" rzetelno jest podstaw warunkiem
rodzaje trafno ci:
koniecznym trafno ci
" teoretyczn (ang. construct),
" rzetelno stanowi górn granic trafno ci
" kryterialn ,
jest niemo liwe, aby trafno by a wi ksza od
diagnostyczn ,
prognostyczn , rzetelno ci; testy o du ej trafno ci pomiaru s
" tre ciow (wewn trzn ). zarazem bardzo rzetelne (jednak ta zale no
Wymieniana niekiedy jest tak e pseudo-trafno :
nie jest odwrotna)
" fasadowa.
Pami ta nale y o tym, i s to przede wszystkim aspekty
trafno ci, którym odpowiadaj techniki walidowania testów.
3 4
Przyk ad - analiza trafno ci tre ciowej
Trafno tre ciowa
skali ekstrawersji z kwestionariusza EPQ-RS (1)
zakres, w jakim pozycje testowe reprezentuj uniwersum " Wed ug definicji zawartej w podr czniku do kwestionariusza EPQ-R
ekstrawertyk jest towarzyski, ma wielu przyjació , odczuwa potrzeb
pozycji testowych (czy te zachowa zwi zanych z cech );
rozmowy z innymi, nie lubi samotno ci. Ogólnie uwa a si go za
stopie w jakim pozycje testowe stanowi reprezentatywn
jednostk impulsywn i dzia aj bez zastanowienia. Lubi zajmowa si
próbk zachowa dzia alno ci praktyczn . Introwertyk woli czyta ksi ki ni przebywa
w towarzystwie, jest pow ci gliwy, bardzo wymagaj cy w doborze
nie mo e by mierzona, sprowadza si do oceny czy wska niki
przyjació , nie jest impulsywny, lubi wie uporz dkowany tryb ycia.
spe niaj kryteria definicyjne cech
" Strelau (1998) podkre la, e Eysenck nie podaje typowych definicji
pozycje o du ej trafno ci tre ciowej charakteryzuje dobra charakterystyka
wymiarów osobowo ci, opisuj c je w kategoriach korelacji z cechami
psychometryczna s one osiowymi wska nikami danej cechy
ród owymi. Ekstrawersja jest cech nadrz dn dla takich cech jak:
trafno tre ciowa jest koniecznym, cho niewystarczaj cym warunkiem
towarzysko , aktywno , dominacja,
innych rodzajów trafno ci
poszukiwanie dozna , beztroska, wybuchowo ,
wi kszo podr czników uto samia trafno tre ciow i trafno
mia , asertywno , ywo
wewn trzn , ten drugi rodzaj trafno ci mo e by jednak rozumiany
bardziej ogólnie jako stopie w jakim posta narz dzia odpowiada
koncepcji za onej przez konstruktora testu
5 6
Przyk ad - analiza trafno ci tre ciowej
Trafno fasadowa
skali ekstrawersji z kwestionariusza EPQ-RS (2)
dotyczy wygl du testu wra enia, jakie wywiera na osobach
1. Czy jeste osob rozmown ?
badanych, odnosz cego si do przeznaczenia testu
2. Czy masz ywe usposobienie?
3. Czy masz wielu przyjació ? kwestionariusze, które charakteryzuje wysoka trafno
fasadowa, s szczególnie podatne na zniekszta cenia
4. Czy lubisz robi rzeczy wymagaj ce szybkiego dzia ania?
5. Czy zwykle przejawiasz inicjatyw przy zawieraniu nowych znajomo ci?
ze wzgl du na ten efekt w przypadku niektórych testów,
6. Czy atwo Ci rozkr ci towarzystwo na nudnym przyj ciu? szczególnie z obszaru psychologii klinicznej, cel badania bywa
7. Czy w towarzystwie masz sk onno do trzymania si na uboczu? (*) maskowany np. poprzez odpowiedni manipulacj nazw
(tytu em) kwestionariusza
8. Czy lubisz przebywa w ród ludzi?
9. Czy przewa nie milczysz w towarzystwie innych ludzi? (*)
z drugiej strony, budz ca zaufanie posta testu mo e pe ni
10. Czy lubisz jak wokó Ciebie jest du o ruchu i ci gle co si dzieje? istotn rol w budowaniu pozytywnego stosunku osoby badanej
11. Czy ludzie uwa aj Ci za osob o bardzo ywym usposobieniu? do sytuacji, w której stosowany jest test, jak i do diagnozy oraz
osoby psychologa
12. Czy potrafisz rozkr ci zabaw na przyj ciu?
7 8
Przyk ad - trafno fasadowa (1) Przyk ad - trafno fasadowa (2)
9 10
Trafno kryterialna (1) Trafno kryterialna (2)
stopie w jakim test koreluje z okre lonym
kryterium zewn trznym trafno diagnostyczna odnosi si do stopnia, w jakim
wyniki testowe pozwalaj na ocen kryterium, przy
okre lenie zewn trznego kryterium i jego w asno ci jest kluczow
i trudn kwesti w badaniach trafno ci kryterialnej za eniu, e wyst puj one w tym samym czasie
standardowe post powanie zak ada prowadzenie bada zgodnie
trafno prognostyczna odnosi si natomiast do stopnia,
z tak procedur , która pozwala na okre lenie rzetelno ci
w jakim wyniki testu umo liwiaj przewidywanie
kryterium, np. w przypadku diagnoz klinicznych
kryterium, które wyst powa b dzie znacznie pó niej
ciwymi technikami analizy danych w badaniach trafno ci
trafno diagnostyczna jest warunkiem koniecznym,
kryterialnej s techniki korelacyjne
ale nie wystarczaj cym trafno ci prognostycznej - testy
w przypadku zastosowania baterii testów do predykcji kryterium,
prognostyczne musz diagnozowa , ale diagnozowanie nie
dobr strategi jest u ycie analizy regresji, lub analizy
gwarantuje prognozowania
dyskryminacyjnej w celu opracownia baterii testów o wysokiej
trafno ci i niskiej redundancji pomiarowej
11 12
Trafno kryterialna (3) Przyk ad (1)
ocena wspó czynników trafno ci kryterialnej mo e by
Korelacja mi dzy aktywno ci (skala z FCZ-KT Zawadzkiego i
korygowana ze wzgl du na nierzetelno kryterium, mo liwa
Strelaua) a form sp dzania urlopu (aktywnie lub nie)
jest te korekta obliczana ze wzgl du na nierzetelno testu
oraz nierzetelno kryterium
obliczona dla ogó u osób badanych
w przypadku estymacji wyników kryterium na podstawie testu,
(N=1474) 0,32**
stosowanej w celu selekcji osób badanych, pami ta nale y
o estymacji przedzia u ufno ci uwzgl dniaj cego standardowy
obliczona dla osób o wysokiej aktywno ci
d estymacji kryterium (N=303, kryterium - co najmniej
trafno kryterialna nie jest w asno ci sta , b dzie zmienia si podwy szony wynik na skali aktywno ci) 0,17*
w wyniku ograniczania zmienno ci kryterium, lub zmienno ci
mi dzy osobami badanymi testem
poniewa warto wspó czynnika trafno ci kryterialnej mo e
by tak e efektem czynników losowych, wa ne jest stosowanie
tzw. walidacji krzy owej
13 14
Przyk ad (2) Przyk ad (3a)
Predykcja zaburze zdrowia psychicznego za pomoc
Korelacje mi dzy skalami kwestionariusza EPQ-R
kwestionariuszy CISS i FCZ-KT.
Eysencka a przeci tn ilo ci wypijanych fili anek kawy,
uzyskane na próbach z dwu regionów Polski
Równanie regresji oparte na danych z subpopulacji ( sk):
predyktor_1 = 0,78wrs - 0,71rem + 0,45akt + 0.39copza
N E P L
- 1.27copemo + 0.33copun + 173.23
katowickie (N=517) 0,02 0,11 0,03 0,01
Równanie regresji oparte na danych z próby ogólnopolskiej:
predyktor_2 = 0.51wrs - 1.02rem + 0.38copza - 1.18copemo
ódzkie (N=480) 0,01 0,21* 0,09 0,04
+ 0.96coptow + 177.91
15 16
Przyk ad (3b) Poprawka na nierzetelno
" Mo liwe jest obliczanie wspó czynników trafno ci, których
Korelacje mi dzy wska nikiem zaburze zdrowia psychicznego
warto b dzie skorygowana ze wzgl du na nierzetelno
a predyktorami opartymi na równaniach regresji.
za równo testu, jak i zewn trznego kryterium. Estymowana
ocena zwi zku mi dzy zmiennymi b dzie odpowiada
Próba ogólnopolska:
takiej warto ci korelacji jak uzyskaliby my stosuj c
Predyktor 1 Predyktor 2
dokonale rzetelny test i doskonale rzetelne kryterium.
W tym celu pos ugujemy si wzorem:
R=0,59** R=0,62** N=1596
rTG rtg / rttrgg
Korelacje dla tych samych predyktorów
w próbie osób z wy szym wykszta ceniem
rTG - estymowany wspó czynnik korelacji mi dzy wynikami
prawdziwymi zmiennych t i g; rtg - otrzymany wspó czynnik
R=0,65** R=0,70** N=187
mi dzy zmiennymi; rtt - rzetelno c testu t, rgg - rzetelno
kryterium g.
17 18
Metody badania trafno ci teoretycznej
Trafno teoretyczna
" trafno teoretyczna to taki rodzaj trafno ci, który
wiadczy o zgodno ci zmiennej mierzonej przez test
z konstruktem teoretycznym
" oznacza to identyfikacj tre ci psychologicznej
" analiza zwi zków mi dzy konstruktem
mierzonej przez test
" w odró nieniu od trafno ci kryterialnej, istot trafno ci
a zachowaniem
teoretycznej jest mo liwo przewidywania kryteriów
psychologicznych, a nie kryteriów pozatestowych
" analiza macierzy korelacji
" w praktyce ocena trafno ci teoretycznej polega na
prowadzeniu bada , w których weryfikowane s
twierdzenia teoretyczne, w sytuacji skrajnej badania takie
mog prowadzi nawet do modyfikacji teorii
19 20
Analiza zwi zku mi dzy konstruktem a zachowaniem (1) Analiza zwi zku mi dzy konstruktem a zachowaniem (2)
metoda badania zmian nieprzypadkowych:
metoda sprawdzania ró nic mi dzygrupowych:
odwo uje si do dwukrotnego pomiaru
weryfikuje hipotez teoretyczn o zró nicowaniu grup najcz ciej
skrajnych, kontrastowych w zakresie mierzonej zmiennej lub
jest pseudo-eksperymentalna, mi dzy pomiarami nast puje
zmiennych
manipulacja, która prowadzi ma do uzasadnionych zmian w wynikach
testu
grupy mog by dobierane ze wzgl du na kryteria demograficzne
lub psychologiczne
metoda badania procesu rozwi zywania testu:
mo liwa jest analiza ró nic mi dzygrupowych
w metodzie tej sprawdzany jest sposób w jaki test jest rozwi zywany,
w sytuacjach eksperymentalnych
np. czy anga owane s takie procesy poznawcze, które wi si
okre lonym typem zdolno ci
mo liwe jest stosowanie wariantów zada testowych
w celu precyzyjnej analizy procesu rozwi zywania zada
21 22
Analiza macierzy korelacji
Przyk ad (4a)
metoda badania wewn trznej struktury testu:
w najprostszym przypadku testowane s zwi zki mi dzy skalami I II III IV V
M niekonwencjonalno 0,98
w te cie, lub podskalami a skal ogóln
Q1 otwarto na zmiany 0,43
niekiedy badana jest tzw. trafno czynnikowa oparta na analizie A serdeczno 0,76
Q2 samodzielno -0,59
czynnikowej
F ywotno 0,49 -0,32
N tajemniczo -0,47
metoda analizy korelacji testu walidowanego i innych testów:
H mia 0,45 -0,40
E dominacja -0,77
w uproszczonej formie polega na analizie korelacji walidowanego testu
I wra liwo 0,33
z grup narz dzi mierz cych t sam zmienn i/lub korelacji z innymi Q4 napi cie 0,75
C stabilno emocjonalna -0,30 -0,61
kryteriami
O niepewno siebie 0,35 0,46 0,36
L nieufno 0,45
w postaci bardziej zaawansowanej odwo uje si do analizy czynnikowej
G wiadomo zasad 0,61
prowadzonej na skalach zestawu narz dzi diagnostycznych
Q3 perfekcjonizm 0,59
metoda wielu cech - wielu metod Campbella i Fiskego
23 24
Przyk ad (4b) Przyk ad (5)
USA POLSKA
1: A, F, H, N, Q2 I: A, F, H, N, Q2
2: C, L, O, Q4 II: C, L, O, Q4
3: A, I, M, Q1 III: M, Q1
4: E, H, L, Q1 IV: I, E, O, C
5: F, G, M, Q3 V: G, Q3
Czynniki 1 i 2: bez zmian. Czynnik 3 i 5: nast puje
"zaw enie" czynnika wobec danych opisujacych oryginalne
rozwi zanie. Czynnik 4: inna konfiguracja, niezale no w
adaptacji jest uwik ana emocjonalnie.
25 26
Metoda wielu cech wielu metod
Przyk ad (6)
Campbella i Fiskego
Korelacje mi dzy kwestionariuszami FCZ-KT i NEO-FFI jako dane
najbardziej zaawansowana formalnie technika analizy
pozwalaj ce na ocen trafno ci dwu skal zgodne z paradygmatem
macierzy korelacji, mo liwe jest jednak stosowanie
Campbella i Fiskego.
uproszczonej formy tego paradygmatu
odwo uje si do pomiaru co najmniej dwu lub wi cej
niezale nych cech za pomoc dwu niezale nych metod
aby dany test uzna za trafny nale y wykaza zarówno
trafno zbie (konwergentn ), jak i trafno ró nicow
(dyksryminatywn )
Skala ma korelowa z innym pomiarem podobnej zmiennej
(aspekt konwergentny), ale nie powinna korelowa z miarami innych
zmiennych i innymi skalami wewn trz tej samej metody
(aspekt dyskryminatywny).
27 28
Kilka wa nych stwierdze
" trzy (a nawet cztery) odmiany trafno ci s aspektami
trafno ci wzajemnie zale nymi
" wymóg trafno ci dotyczy przede wszystkim mo liwo ci
interpretacyjnych zastosowania narz dzia diagnozowania
zazwyczaj w kontek cie teorii psychologicznej
" wa nym jest, aby test by walidowany wieloma metodami
sprawdzaj cymi ró ne aspekty trafno ci
" wspó czynniki trafno ci podobnie jak wspó czynniki
rzetelno ci nie s cech narz dzia, s w asno ci pomiaru
testem realizowanego na konkretnej grupie osób badanych
29
Psychometria, metoda testów Standaryzacja (1)
" Poprzez standaryzacj testu rozumie si zazwyczaj
ujednolicony sposób pos ugiwania si testem.
Standaryzacja ma na celu minimalizowanie wp ywu
czynników zak ócaj cych pomiar, b cych
Standaryzacja testu,
efektem:
czynniki zak ócaj ce pomiar, skale kontrolne
post powania osoby prowadz cej badanie;
warunków, w jakich badanie jest przeprowadzane.
" W szerszym znaczeniu, standaryzacja to
ujednolicony ogó czynno ci zwi zanych z
prowadzeniem badania i opracowywaniem wyniku.
1 2
Standaryzacja (2) Post powanie diagnostyczne
Dobrze wystandaryzowany test sk ada si z:
" Wywiad, ustalenie celu diagnozy
instrukcji dla osoby badanej, okre lonego materia u
testowego, klucza zasad oceny wyników, " Formu owanie hipotez, lektura podr cznika
last but not least regu interpretacji wyniku.
" Uzyskanie zgody na badanie
W wyniku standaryzacji test winien by
" Przygotowanie i przeprowadzenie badania
obiektywny, jego wynik powinien by niezale ny od
osoby diagnozuj cej.
" Opracowanie wyników
Konsekwencj odst pstw od procedury
" Interpretacja wyników w wietle celu badania
standaryzacji jest kompletna zmiana pozosta ych
asno ci testu, przede wszystkim obiektywno ci,
i postawionych hipotez
ale tak e w nie mniejszym stopniu rzetelno ci,
" Przekazanie informacji zwrotnej
trafno ci i znaczenia norm.
3 4
Strategia lektury podr cznika Przyk ad wadliwy materia
Rok publikacji, autor, wydawca
Obok podanego s owa napisz inne, zaczynaj ce si na
Zastosowania, przedmiot pomiaru
podan liter , które ma takie samo lub podobne znaczenie.
Normy, opis próby normalizacyjnej
Liczba kropek równa jest liczbie liter, które nale y dopisa .
Trafno : teoretyczna i kryterialna
Rzetelno : zgodno i stabilno , wspó czynniki SEM
1. WABI - N . . .
Statystyki opisuj ce rozk ad zmiennych: sko no , kurtoza,
trudno
Parametry specjalne np. korelacje z miarami aprobaty
spo ecznej, punkty odsiewowe 2. SAMOTNIK - O . . . . . .
Regu y interpretacji np. analiza profilowa
Procedura badawcza
5 6
Przyk ad starzenie norm
Przyk ad starzenie materia u
" WAIS-R-PL (1996)
Ile jest województw w Polsce?
Co to jest winieta?
" 16PF Cattella w przek adzie Choynowskiego (196?)
Pracuj c w fabryce, czy wola by : a) by kierownikiem hali
maszyn; b) przyjmowa ludzi do pracy?
Czy uwa asz, e nale y raczej: a) utrzyma siln armi ; Szustrowa i Jaworowska (1992) w podr czniku do Testu
b) krzewi przyja mi dzy narodami?
Matryc Ravena (wersja kolorowa) prezentuj zmian
Czy zanik zmys u pi kna pod wp ywem uprzemys owienia rozk adu mierzonej zmiennej w populacjach
i mechanizacji wydaje Ci si zagadnieniem równie wa nym dziewi ciolatków badanych w latach 1980 (linia
jak wiele bol czek ycia codziennego?
niebieska) i 1991 (linia czerwona).
8
7
Wyszukiwarka
Podobne podstrony:
Optymalizacja zapasów w przedsiębiorstwie i łańcuchu dostaw Wersja do drukuWersja do druku Test 5 41 50wersja do druku Przepiękna modlitwa do Ducha ŚwiętegoWersja do druku` wymiana opiekunekWykłady 1,2,3[2011]do drukuZarządzanie jakością w łańcuchu dostaw Wersja do drukuSamoobsługa logistyczna i zlecone systemy logistyczne Wersja do drukuInne Więziennictwo na progu XXI wieku wersja do drukuBankructwo państwa to nie koniec świata (wersja do druku)Środki transportu w systemach dystrybucji Wersja do drukuNowoczesne technologie w optymalizacji łańcuchów dostaw Wersja do drukuWersja do druku Test 6 51 60wersja do druku Przepiękna modlitwa do Ducha ŚwiętegoSkuteczna modlitwa do Świętej Rity w sprawach bardzo beznadziejnych wersja do drukuEfektywność systemów dystrybucji Wersja do drukuZarządzanie zintegrowanym łańcuchem dostaw na przykładzie przemysłu motoryzacyjnego cz II WersjaInstrukcja o gospodarowaniu wbk wersja do drukuZarządzanie Inwestycjami wykłady wersja do wydrukuwięcej podobnych podstron