Psychometria, metoda
testów
Psychometria, metoda
testów
Standaryzacja testu,
czynniki zakłócające pomiar, skale kontrolne
Standaryzacja (1)
Standaryzacja (1)
Poprzez standaryzację testu rozumie się
zazwyczaj ujednolicony sposób posługiwania się
testem. Standaryzacja ma na celu
minimalizowanie wpływu czynników
zakłócających pomiar, będących efektem:
– postępowania osoby prowadzącej badanie;
– warunków, w jakich badanie jest
przeprowadzane.
W szerszym znaczeniu, standaryzacja to
ujednolicony ogół czynności związanych z
prowadzeniem badania i opracowywaniem
wyniku.
Standaryzacja (2)
Standaryzacja (2)
Dobrze wystandaryzowany test składa
się z: instrukcji dla osoby badanej,
określonego materiału testowego, klucza
– zasad oceny wyników,
last but not least – reguł interpretacji
wyniku.
W wyniku standaryzacji test winien być
obiektywny, jego wynik powinien być
niezależny od osoby diagnozującej.
Konsekwencją odstępstw od procedury
standaryzacji jest kompletna zmiana
pozostałych własności testu, przede
wszystkim obiektywności, ale także – w
nie mniejszym stopniu – rzetelności,
trafności i znaczenia norm.
Postępowanie
diagnostyczne
Postępowanie
diagnostyczne
Wywiad, ustalenie celu diagnozy
Formułowanie hipotez, lektura podręcznika
Uzyskanie zgody na badanie
Przygotowanie i przeprowadzenie badania
Opracowanie wyników
Interpretacja wyników w świetle celu
badania
i postawionych hipotez
Przekazanie informacji zwrotnej
„Strategia” lektury
podręcznika
„Strategia” lektury
podręcznika
–
Rok publikacji, autor, wydawca
–
Zastosowania, przedmiot pomiaru
–
Normy, opis próby normalizacyjnej
–
Trafność: teoretyczna i kryterialna
–
Rzetelność: zgodność i stabilność, współczynniki
SEM
–
Statystyki opisujące rozkład zmiennych:
skośność, kurtoza, trudność
–
Parametry „specjalne” np. korelacje z miarami
aprobaty społecznej, punkty odsiewowe
–
Reguły interpretacji np. analiza profilowa
–
Procedura badawcza
Przykład – wadliwy
materiał
Przykład – wadliwy
materiał
Obok podanego słowa napisz inne, zaczynające
się na podaną literę, które ma takie samo lub
podobne znaczenie. Liczba kropek równa jest
liczbie liter, które należy dopisać.
1. WABIĆ
- N . . .
2. SAMOTNIK - O . . . . . .
Przykład – „starzenie”
materiału
Przykład – „starzenie”
materiału
WAIS-R-PL (1996)
–
Ile jest województw w Polsce?
–
Co to jest winieta?
16PF Cattella w przekładzie Choynowskiego (196?)
–
Pracując w fabryce, czy wolałbyś: a) być kierownikiem hali
maszyn; b) przyjmować ludzi do pracy?
–
Czy uważasz, że należy raczej: a) utrzymać silną armię;
b) krzewić przyjaźń między narodami?
–
Czy zanik zmysłu piękna pod wpływem uprzemysłowienia
i mechanizacji wydaje Ci się zagadnieniem równie ważnym
jak wiele bolączek życia codziennego?
Przykład – „starzenie”
norm
Przykład – „starzenie”
norm
Szustrowa i Jaworowska (1992) w
podręczniku do Testu Matryc Ravena (wersja
kolorowa) prezentują zmianę rozkładu
mierzonej zmiennej w populacjach
dziewięciolatków badanych w latach 1980
(linia niebieska) i 1991 (linia czerwona).
Przykład – standaryzacja prezentacji
materiału
Przykład – standaryzacja prezentacji
materiału
Przykład – standaryzacja oceny
wytworu (1)
Przykład – standaryzacja oceny
wytworu (1)
30
o
- źle
25
o
-
dobrze
Przykład – standaryzacja oceny
wytworu (2)
Przykład – standaryzacja oceny
wytworu (2)
Winieta: kompozycja rysunkowa, często figuralna;
umieszczana jako ozdoba na karcie tytułowej książki,
na początku lub końcu rozdziału, ustępu lub strony.
2 pkt.: niewielka rycina na stronie tytułowej książki,
ozdobnik graficzny w książkach przedzielający
rozdziały, ozdobny początek rozdziału.
1 pkt: to pierwsza strona gazety, wewnętrzna strona
książki, pierwsza strona książki, może być ozdobna ...
obwoluta książki, okładka książki, coś ozdobnego w
książce.
0 pkt.: coś z gazetą, tytuł np. w gazecie, stare słowo,
szyld, część działa lub armaty
Paradoksalne efekty
standaryzacji
Paradoksalne efekty
standaryzacji
Matczak (1994) prezentuje wyniki badań ilustrujące
„paradoksalne” efekty standaryzacji. Standaryzacja
procedury badawczej pozornie ujednolica warunki
badania dla psychologicznie zróżnicowanych osób
badanych, jednocześnie stawiając osoby badane w
faktycznie różnych sytuacjach.
–
interakcyjny efekt reaktywności emocjonalnej i warunków
badania (anonimowe lub nie) na wyniki TMS - wysoko reaktywni
uzyskiwali wyższe wyniki w sytuacji badania anonimowego
–
informacja o dużej trudności zadań prezentowana w instrukcji
wpływała silnie na osoby refleksyjne, jednak kierunek tego
wpływu (astenizujacy lub stymulujacy) zależny był od
reaktywności
Informacja zwrotna
Informacja zwrotna
Dawniej – Powiedzieć badanemu jak
najmniej i nic, co mogłoby wzbudzić w
nim lęk lub inne negatywne emocje. Jeśli
przekazywać, to tylko „dobre wieści”.
Dziś – Badany (jego pełnomocnik lub
opiekun) ma prawo poznać swoje wyniki
i ich interpretacje.” (Standardy.. J2.1)
Kto może informować o
wynikach
Kto może informować o
wynikach
Tylko osoba odpowiednio
wykwalifikowana
–
sama dobrze rozumie wyniki i ich
interpretacje
–
umie odpowiadać na pytania
badanego dotyczące wyników
Co mówić
Co mówić
jaki jest wynik
jakie są alternatywne interpretacje
wyniku
jakie są możliwe ograniczenia
wyniku
Jak mówić?
Jak mówić?
nawiązać kontakt z badanym
mówić w sposób zrozumiały dla odbiorcy:
–
unikać „psychometryzowania”
–
unikać „psychologizowania”
unikać etykietowania
włączać badanego do interpretowania
wyników
starać się, by badany zaakceptował
przedstawione mu informacje
O czym jeszcze trzeba
pamiętać?
O czym jeszcze trzeba
pamiętać?
badany może (ale nie musi)
potrzebować porady
respektując prawo badanego do
poznania wyników testowych,
psycholog musi zrobić wszystko, by
chronić test
Zastosowania
komputerów
Zastosowania
komputerów
aktuarialne bazy danych – odwołujące się do bardzo
licznych prób oraz danych ze źródeł nie tylko
testowych; możliwość diagnozy na podstawie
podobieństwa do odpowiedniej grupy przypadków
systemy interpretacyjne – programy, które po
wprowadzeniu danych testowych umożliwiają
diagnozę psychologiczną, dokonują interpretacji
wyników, porównań ze specyficznymi profilami oraz
sugerują ewentualną konieczność uzupełnienia
danych i dalszych badań
testy komputerowe – specjalne programy w
najprostszej postaci eksponujące materiał testowy,
zbierające
i przetwarzające informację
Komputerowe wersje
testów
Komputerowe wersje
testów
wykazują korzystną charakterystykę psychometryczną,
są mniej podatne na zniekształcenia
pozwalają na rejestrację szeregu parametrów
odpowiedzi, niedostępnych w badaniu tradycyjnym np.
czasu odpowiedzi na poszczególne pozycje testowe
umożliwiają wprowadzanie nowych procedur testowych
w postaci testów „dynamicznych”, w których program
decyduje o kolejności zadawanych pytań, tak aby
diagnoza – o wysokich własnościach
psychometrycznych – mogła być postawiona za pomocą
możliwie małego zestawu zadań testowych
Symulacja i dysymulacja
(1)
Symulacja i dysymulacja
(1)
Dysymulacja oznacza świadomą lub nieświadomą
tendencję osoby badanej do przedstawiania się
w korzystnym świetle.
Aprobata społeczna rozumiana jest jako tendencja
do kierowania się przy odpowiadaniu na pytania
społecznym wartościowaniem zachowania i
przejawia się w zaprzeczaniu posiadania cech
społecznie niepożądanych oraz przypisywaniu
sobie cech społecznie pożądanych.
Symulacja to świadoma lub nieświadoma
tendencja do bezpodstawnego przedstawiania się
w niekorzystnym świetle.
Symulacja i dysymulacja
(2)
Symulacja i dysymulacja
(2)
aprobatę społeczną można traktować jako styl
odpowiadania, lub jako cechę osobowości
aprobata społeczna może mieć charakter
samooszukiwania, jak i sprawiania wrażenia
aprobata społeczna może być kontrolowana:
–
podczas konstrukcji kwestionariusza, np. poprzez stosowanie
zrównoważonych opcji odpowiedzi, stosowanie tzw. „pozycji
subtelnych”, unikanie wielkich kwantyfikatorów czasu, usuwanie
z kwestionariusza pytań silnie obciążonych aprobatą społeczną
–
podczas stosowania kwestionariusza poprzez użycie skal
kontrolnych lub manipulację instrukcją, w przypadku badań
grupowych – regresyjne „wytrącanie” wariancji związanej z
aprobatą społeczną
Przykład pytań mierzących aprobatę
społeczną (skala IM z 16PF)
Przykład pytań mierzących aprobatę
społeczną (skala IM z 16PF)
Potrafię zmylić ludzi będąc dla nich miłym, a
naprawdę ich nie lubić.
Jestem skłonny(-a) pomagać ludziom.
a. zawsze, b. czasami.
Robię uszczypliwe uwagi w stosunku do ludzi, którzy
moim zdaniem na to zasługują.
a. czasami, b. nigdy
Wykorzystuję innych ludzi.
a. czasami, b. nigdy
Zdarzyło mi się mówić rzeczy, które raniły uczucia
innych.
Przykład pytań obciążonych
aprobatą społeczną
Przykład pytań obciążonych
aprobatą społeczną
Jestem osobą, która: a. zawsze robi praktyczne
rzeczy, które muszą zostać zrobione; b. „buja w
obłokach” i coś sobie wymyśla.
(NIEKONWENCJONALNOŚĆ, r=0,32)
Jeśli muszę coś zrobić, to najprawdopodobniej: a.
odłożę to na ostatnią chwilę; b. zacznę to robić
od razu. (PERFEKCJONIZM, r=0,32)
Nauczyłem(-am) się cierpliwości wobec różnych
ludzi. (NAPIĘCIE, r=0,28)
Ubieram się raczej: a. skromnie i schludnie; b. w
sposób zwracający uwagę.
(ŻYWOTNOŚĆ, r=0,24)
Przykład – „uwolnienie” pytania
od wpływu aprobaty społecznej
Przykład – „uwolnienie” pytania
od wpływu aprobaty społecznej
Ubieram się raczej:
a. skromnie i schludnie, b. w sposób zwracający
uwagę.
r=0,24*; A - 69%, ? - 19%, B - 12%
Ubieram się raczej:
a. skromnie i schludnie, b. wyszukanie i
elegancko.
r=0,10; A - 69%, ? - 12%, B - 19%
Przykład – obciążenie a.s. skal NEO-FFI i
EPQ-R
Przykład – obciążenie a.s. skal NEO-FFI i
EPQ-R
NEO-FFI Costy i McCrae
EPQ-R Eysencka, Eysenck i Baretta
NEU
EXT
OTW UGD
SUM
-0,15* 0,03
-0,08
0,36** 0,47**
NEU EXT
PSY
-0,02 0,07
-0,38**
Style odpowiadania
Style odpowiadania
Styl odpowiadania – tendencja osoby badanej do
wybierania określonej opcji odpowiedzi niezależnie
od treści pytania kwestionariuszowego; np.
tendencja do zgadzania się,
albo – do zaprzeczania, udzielania odpowiedzi
przypadkowych („strzelanie”), – nieuważnych
(opuszczenia).
Style odpowiadania mogą być kontrolowane przez:
–
precyzyjne formułowanie treści pytań
–
wyrównanie proporcji odpowiedzi
diagnostycznych tak/nie
–
stosowanie skal kontrolnych
Przykład – style
odpowiadania
Przykład – style
odpowiadania
Kwestionariusz 16PF umożliwia budowanie dwu
wskaźników kontrolnych: potakiwania i „strzelania”
Uzyskano następujące korelaty tych dwu stylów
odpowiadania:
potakiwanie - ekstrawersja, neurotyzm, niska inteligencja,
styl typowy dla osób starszych i niewykształconych
„strzelanie” - otwartość na doświadczenie, niska
sumienność, niska inteligencja,
styl charakterystyczny dla osób młodych oraz mężczyzn
między tymi dwoma wskaźnikami uzyskano stosunkowo
silną ujemną korelację
Poprawka na zgadywanie
(1)
Poprawka na zgadywanie
(1)
P
P
B
m
K
1
W przypadku testów wiedzy możliwa jest
korekta wyniku otrzymanego poprzez
zastosowanie tzw. poprawki na zgadywanie,
obliczanej według wzoru:
gdzie: P
k
- wynik po korekcie, P - wynik
surowy (otrzymany), B - liczba błędnych
odpowiedzi, m - liczba opcji odpowiedzi w
zadaniach.
Poprawka na zgadywanie
(2)
Poprawka na zgadywanie
(2)
stosowanie poprawki na zgadywanie uzasadnione jest
tylko
w testach z ograniczeniem czasowym
w przypadku testów, gdzie osoby badane mogą
„rozwiązywać” wszystkie zadania stosowanie
poprawki na zgadywanie jest nieuzasadnione
warunkiem stosowania poprawki na zgadywanie jest
taka postać wszystkich zadań, iż wszystkie opcje
odpowiedzi są równie atrakcyjne
stosowanie poprawki na zgadywanie ma sens
szczególnie w przypadku testów składających się z
zadań o małej liczbie opcji odpowiedzi (n<4)
poprawkę na zgadywanie szczególnie warto stosować
w przypadku trudnych testów, gdyż nasilają one
tendencję do zgadywania