wykłady 7 -14, psychologia, psychometria


Wykład 7

TRAFNOŚĆ POMIARU TESTEM: PODSTAWOWE POJĘCIA ORAZ METODY I WSKAŹNIKI

Trafność pomiaru testem to:a). stopień, w jakim test mierzy cechę, jaką ma mierzyć (trafność teoretyczna czy inaczej trafność zorientowana na konstrukt);

b). stopień dokładności przewidywania określonych kryteriów praktycznych (trafność kryterialna lub inaczej trafność podejmowanych decyzji).

Trafność a założenia KTT

Pojęcie trafności odwołuje się do założeń Klasycznej Teorii Testów, zgodnie z którymi wyniki prawdziwe i błędy pomiaru są nieskorelowane, jak i błędy są nieskorelowane (rtb = 0 oraz rbb = 0), co oznacza, że obserwowane korelacje (między pozycjami, testem i innymi testami oraz testem a kryteriami) są korelacjami wyników prawdziwych.

Trafność a rzetelność pomiaru

Źródła wariancji przy analizie rzetelności i trafności


(A) Systematyczna wariancja wspólna z innymi testami.

(B) Systematyczna wariancja specyficzna dla danego testu.

(C) Wariancja błędu (losowa).


Rzetelność i trafność

Rodzaje trafności pomiaru

Trafność pomiaru obejmuje trzy rodzaje:

a). trafność treściową (wewnętrzną),

b). trafność kryterialną (diagnostyczną i prognostyczną),

c). trafność teoretyczną.

Trafność treściowa (wewnętrzna) - reprezentatywność danej puli pozycji dla uniwersum pozycji mierzących daną cechę.

Trafność treściowa (wewnętrzna) - reprezentatywność danej puli pozycji dla uniwersum pozycji mierzących daną cechę. Trafność treściowa jest wstępnym aspektem trafności teoretycznej. Trafność fasadowa jest natomiast karykaturą trafności i nie powinna być przesłanką do budowania sądu o faktycznej trafności testu.

Analiza trafności treściowej jest niezbędnym etapem prac konstrukcyjnych testu (zanim jeszcze test został całkowicie opracowany, za wyjątkiem kwestii krytyki testu, gdy chcemy wykazać, że test jest nietrafny treściowo, np. treść pozycji testowych nie obejmuje ważnych aspektów cechy).

Etapy oceny trafności treściowej

Trafność kryterialna - szacowanie

Trafność kryterialna jest szacowana na podstawie korelacji między wynikami testu a określonym kryterium pozatestowym; z tego względu kluczowym aspektem jest rzetelność (jak i trafność) samego kryterium, użytego do badania trafności testu.

Trafność kryterialna - poprawka na nierzetelność kryterium

Poprawka na nierzetelność kryterium:

rkt

rs-k = --------------

Rtt-k

rs-k - skorygowany współczynnik korelacji, rkt - współczynnik korelacji przed skorygowaniem, Rtt-k współczynnik rzetelności kryterium.

Trafność kryterialna - poprawka na nierzetelność kryterium i testu

Poprawka na nierzetelność kryterium i testu:

rkt

rs-kt = --------------

Rtt-k Rtt-t

rs-kt - skorygowany współczynnik korelacji, rkt - współczynnik korelacji przed skorygowaniem, Rtt-k współczynnik rzetelności kryterium, Rtt-t -współczynnik rzetelności testu.

Trafność kryterialna - dane z meta-analiz

0x01 graphic

Trafność kryterialna - inne meta-analizy

0x01 graphic
0x01 graphic

Podsumowanie

Korelacje cech osobowości z diagnozą medyczną (stan zdrowia) wynosiły ok. 0,20 dla raka płuca i zawału serca. Zbliżone dane zostały uzyskane w innych badaniach (Zawadzki, 2001).

Mischel (1968) określił współczynniki trafności skal badających cechy osobowości z kryteriami (stan zdrowia, powodzenie zawodowe) mianem „współczynników osobowości”, które nie przekraczają wartości 0,30.

Wykład 8

TRAFNOŚĆ TEORETYCZNA POMIARU TESTEM

Trafność teoretyczna - zgodność treści mierzonej przez test z konstruktem teoretycznym (trafność zorientowana na konstrukt) - określenie jaką treść psychologiczną mierzy test.

Metody szacowania trafności teoretycznej

1). Metody bazujące na analizie związku pomiędzy konstruktem a zachowaniem:

a). metoda zmian nieprzypadkowych,

b). metoda sprawdzania różnic międzygrupowych,

c). metoda badania procesu rozwiązywania testu;

2). Metody bazujące na analizie macierzy korelacji pomiędzy testem, a innymi testami przeznaczonymi do badania danego konstruktu:

a). metoda badania wewnętrznej struktury testu,

b). metoda analizy macierzy korelacji i analizy czynnikowej (eksploracyjnej i konfirmacyjnej) danego testu oraz testów, badających ten sam konstrukt;

c). badanie trafności konwergencyjnej i dyskryminacyjnej (zbieżnej i rozbieżnej) za pomocą analizy macierzy Wielu Cech- Wielu Metod wg Campbella i Fiskego

Analiza zmian nieprzypadkowych

Założenia:

Wniosek:

Analiza różnic międzygrupowych

Celem tej metody jest ocena różnic w wynikach testu, uzyskanych przez różne grupy demograficzne, wyodrębnione na podstawie predykcji bazującej na analizie konstruktu teoretycznego (konfiguracja tych różnic jest oczekiwana na podstawie teorii).

Różnice międzygrupowe we wrażliwości i wytrzymałości

Hipotezy:

0x08 graphic

Wnioski:

Wady metody

Wady metody - badania Nyborga

Nyborg (1995) prowadził badania dotyczące związku między poziomem hormonów a wykonywaniem różnych zawodów. Podstawowa hipoteza głosiła, że im wyższy jest poziom męskich hormonów, tym za bardziej zmaskulinizowany uznawany jest dany zawód, zaś im wyższy jest poziom żeńskich hormonów, tym za bardziej sfeminizowany uznawany jest dany zawód. Pielęgniarstwo jest typowym zawodem kobiecym i pielęgniarki wykazują najwyższy poziom żeńskich hormonów. Oczekiwano zatem, że pielęgniarze powinni wykazywać najniższy poziom męskich hormonów, podczas gdy w rzeczywistości wykazywali najwyższy poziom ze wszystkich grup zawodowych!

Analiza procesu rozwiązywania testu

Analiza wewnętrznej struktury testu

Dwie grupy metod:

Analiza korelacji między pozycjami

Analiza czynnikowa

Analiza czynnikowa jest metodą dekompozycji macierzy korelacji pomiędzy zmiennymi, prowadzącej do uzyskania wiązek zmiennych, które reprezentują zbliżoną treść psychologiczną (odnoszą się do zbliżonych lub wręcz identycznych konstruktów - cech psychologicznych).

Zmienne są grupowane w wiązki na podstawie ich korelacji w taki sposób, aby korelacje w obrębie wiązki były jak najwyższe, zaś między wiązkami jak najniższe. Idea analizy czynnikowej bazuje na tzw. „równaniu czwórkowym” Spearmana.

Przykład

Wniosek - oba testy mierzą tę samą cechę.

Wniosek - wszystkie testy są jednakowo dobrymi miarami tej samej cechy.

Wniosek - testy A i B są dobrymi miarami cechy ogólnej, zaś test C mierzy bardziej specyficzną treść i jest gorszą miarą cechy ogólnej niż testy A i B.

Wniosek - istnieje nie tylko cecha ogólna (badana przez wszystkie testy - każdy z nich jest dobrą miarą tej cechy do wysokości korelacji 0,50), ale przede wszystkim istnieją dwie odmienne, choć skorelowane cechy; jedna wiązka (czynnik) mierzy pierwszą cechę (testy A i B), zaś druga wiązka bada drugą cechę (testy C i D).

Analiza mocy dyskryminacyjnej

Celem tej analizy jest ocena w jakim stopniu wszystkie pozycje mierzą tę samą treść; najczęściej używany jest skorygowany współczynnik pozycja-skala. Analiza ta jest dokonywana dla pozycji tworzących daną skalę oraz oddzielnie dla każdej ze skal testów wieloskalowych.

Analiza czynnikowa pozycji

Celem eksploracyjnej analizy czynnikowej pozycji jest wykazanie, że pozycje tworzące daną skalę mają najwyższe korelacje (ładunki czynnikowe) z odpowiadającymi im czynnikami (odzwierciedlającymi określoną treść psychologiczną) oraz najniższe z innymi czynnikami (tworzącymi inne wiązki pozycji). Analiza jest przeprowadzana na wszystkich pozycjach testu.

0x01 graphic
0x01 graphic

Wnioski

Moc dyskryminacyjna:

Uwaga

Znak minus przed numerem pozycji wskazuje, że odpowiedź negująca jest zgodna z kluczem - wyniki tych pozycji powinny zostać zrekodowane. Zabieg ten jest niezbędny dla obliczenia mocy dyskryminacyjnej (wszystkie korelacje muszą być pozytywne), ale opcjonalne dla analizy czynnikowej - ładunki mogą być zarówno pozytywne, jak i negatywne.

Wnioski

Eksploracyjna analiza czynnikowa: wszystkie pozycje wykazały wyższe korelacje z odpowiadającymi im czynnikami. Najlepsze są skale E i N, skale K, a zwłaszcza P są gorsze.

Optymalny wzór tych korelacji powinien być „czarno-biały”. W praktyce testów psychologicznych nigdy się to nie zdarza.

Analiza korelacji pomiędzy skalami testu

Dwie formy analizy:

Analiza korelacji pomiędzy testami

Dwie formy analizy:

Korelacje z innymi testami

Celem tej analizy jest ocena wielkości wariancji dzielonej przez test z innymi testami. Analiza ta wymaga uwzględnienia skal mierzących te same i odmienne konstrukty w celu wykazania trafności konwergencyjnej i dyskryminacyjnej (oceniana skala powinna korelować ze skalami badającymi zbliżone konstrukty oraz nie korelować ze skalami mierzącymi odmienne konstrukty).

Przykład badań walidacyjnych NEO-FFI

Hipotezy:

Wszystkie te korelacje są wskaźnikiem trafności konwergencyjnej (zbieżnej).

Wszystkie te korelacje są z kolei wskaźnikiem trafności dyskryminacyjnej (różnicowej).

0x01 graphic

Wnioski

Analiza czynnikowa testów

Dwie formy analizy:

0x01 graphic

Źródła wariancji w analizie czynnikowej

Inne źródła zmienności:

Eksploracyjna analiza czynnikowa

0x01 graphic
0x01 graphic

Skala Neurotyczności z NEO-FFI

(A1) = 0,772 = 0,59 (wariancja specyficzna dla neurotyczności)

(A2) = 0,08 (wariancja wspólna z pozostałymi czterema cechami) = (-0,202;4%E)+(-0,172;3%C)+(-0,032;A)+(-0,102;1%O).

Wariancja wspólna (A1+A2=h2) = 0,59+0,08=0,67.

Wariancja unikatowa = 1-h2 = 1-0,67=0,33 (błąd pomiaru + systematyczna wariancja specyficzna dla skali N z NEO-FFI).

Skala Neurotyczności z EPQ-R

(A1) = 0,852 = 0,72 (wariancja specyficzna dla neurotyczności)

(A2) = 0,02 (wariancja wspólna z pozostałymi czterema cechami) = (-0,062;E)+(-0,022;C)+(-0,012;A)+(-0,142;2%O).

Wariancja wspólna (A1+A2=h2) = 0,72+0,02=0,74.

Wariancja unikatowa = 1-h2 = 1-0,74=0,26 (błąd pomiaru + systematyczna wariancja specyficzna dla skali N z EPQ-R).

Wniosek

Skala Neurotyczności z NEO-FFI wykazuje gorszą trafność konwergencyjną (59% w porównaniu do 72%) oraz dyskryminacyjną (8% w odniesieniu do 2%) niż skala Neurotyczności z EPQ-R (obie skale mają zbliżoną zgodność wewnętrzną wynoszącą około 0,85). Błąd pomiaru jest równy 15%, unikatowa systematyczna wariancja specyficzna dla skali z NEO-FFI = 18% oraz EPQ-R = 11%).

0x08 graphic

Wniosek

Skala Otwartości wykazuje słabą trafność konwergencyjną oraz dyskryminacyjną. Inne skale wykazują wysoką trafność konwergencyjną, ale skala Neurotyczności, Ugodowości i Sumienności wykazuje także słabą trafność dyskryminacyjną. Najlepsza jest skala Ekstrawersji.

Trafność innych skal

Konfirmacyjna analiza czynnikowa testów

Celem tej analizy jest ocena trafności konwergencyjnej i dyskryminacyjnej skal testu, przez porównanie modelu teoretycznego i empirycznej struktury skal.

Przykład Inwentarza Struktury Temperamentu (KST) Rusalova

Analiza konfirmacyjna skal KST - analiza wewnętrznej struktury testu (analiza konfirmacyjna podobnie do analizy eksploracyjnej może być zrealizowana na poziomie pozycji, skal danego testu, jak i całych testów).

Dwa czynniki wpływające na temperament: geny i środowisko. Wrodzona (pierwotna) struktura temperamentu obejmuje: ergiczność, plastyczność, tempo i emocjonalność. Cechy te różnicują się się pod wpływem czynników środowiskowych na cechy społeczne i przedmiotowe.

KST zawiera osiem skal:

Hipotezy i modele

0x01 graphic
0x01 graphic

Wskaźniki „dobroci dopasowania”

0x08 graphic

Wnioski

Analiza macierzy Wielu Cech - Wielu Metod

Macierz WC-WM (ang. MTMM matrix) jest przygotowywana w celu formalnej oceny trafności konwergencyjnej i dyskryminacyjnej pomiary testem. Analiza ta wymaga wprowadzenia przynajmniej dwóch metod oraz dwóch cech.

Rodzaje korelacji w macierzy WC-WM

Wymóg trafności konwergencynej

Wymóg trafności dyskryminacyjnej

Macierz WC-WM dla samoopisu i szacowania z użyciem NEO-FFI

Kwestionariusz: NEO-FFI

Miary: samoopis (s) and szacowanie (sz)

Korelacje:

0x08 graphic

Wnioski

Podsumowanie

Pojęcie trafności zbieżnej i różnicowej jest kluczowe dla zrozumienia trafności teoretycznej, choć zazwyczaj jest ograniczane tylko do analizy macierzy Wc-WM. Test powinien mierzyć określoną cechę i nie mierzyć innych cech (ani jakichkolwiek innych charakterystyk indywidualnych, a zatem także stylów odpowiadania czy stanów psychologicznych).

Pojęcie trafności konwergencyjnej i dyskryminacyjnej może odnosić się zarówno do trafności teoretycznej, jak i kryterialnej. Test jest nietrafny, jeśli niczego nie przewiduje lub nie mierzy (brak trafności konwergencyjnej). Test jednak jest także nietrafny, jeśli przewiduje lub mierzy wszystko (brak trafności różnicowej).

Narzędzie, które diagnozuje wszystko, nie mierzy niczego w szczególności.

Wykład 9

STRATEGIE KONSTRUOWANIA TESTÓW

Strategie konstruowania testu

1). teoretyczna (dedukcyjna) - podstawa teoretyczna dla strategii empirycznych, choć może też być stosowana samodzielnie (do diagnozy raczej cech).

2). zewnętrzna (kryterialna) - do diagnozy typów (eksploracyjna lub połączona z teoretyczną).

3). wewnętrzna (indukcyjna) - do diagnozy cech (eksploracyjna lub połączona z teoretyczną).

4). sekwencyjne lub połączone

Porównanie strategii konstrukcji testów

Aspekty opisu strategii:

a). dostępność teorii psychologicznej w strategii: dedukcyjna ("teoria"), kryterialna ("wiedza"), indukcyjna ("metodologia");

b). model psychometryczny zastosowany do konstrukcji testu: teoretyczna - analiza pozycji (korelacja pozycja-skala, zewnętrzna - analiza pozycji (korelacja pozycja-kryterium), indukcyjna - eksploracyjna analiza czynnikowa;

c). efekt finalny: w zakresie psychologicznym, diagnostycznym i psychometrycznym - każda strategia ma swoje zalety i wady - zależnie od typu problemu należy stosować różne strategie.

Wykład 10

PROCEDURA (PROCES) KONSTRUKCJI TESTU

Etap I - wybór strategii (cel badań - pytania badawcze, rodzaj badanego konstruktu: cecha albo typ) oraz plan budowy narzędzia (w tym także skale kontrolne).

Niezbędna jest wiedza dotycząca danego konstruktu oraz wiedza z metodologii, psychometrii i diagnostyki psychologicznej.

Etap II - analiza podstaw teoretycznych narzędzia: teorii, wiedzy lub metodologii (trafność treściowa lub prototypowość).

Etap III - generowanie wskaźników będących deskrypcją cech psychologicznych.

Etap IV - zapisywanie pozycji testowych (rodzaj pozycji, zachowania, format odpowiedzi) i ocena ich własności formalnych.

Składniki definicyjne

Antonovsky (1995) przy tworzeniu Kwestionariusza Poczucia Koherencji w postaci przestrzeni Kartezjańskiej, zbudowanej poprzez wyodrębnienia podwymiarów poczucia koherencji oraz fasad reprezentujących różne aspekty reagowania na bodźce. W ramach podwymiarów wyodrębnione zostało poczucie zrozumiałości, zaradności i sensowności (E1-3), zaś w obrębie fasad: modalność bodźca (A1-3: instrumentalny, poznawczy i afektywny), źródło bodźca (B1-3: wewnętrzne, zewnętrzne i wewnętrzno- zewnętrzne), stawiany jednostce wymóg (C1-3: konkretny, rozproszony i abstrakcyjny) oraz czas reakcji (D1-3: przeszła, teraźniejsza i przyszła). Określona kombinacja złożona z elementów składowych każdej fasady oraz podwymiaru stanowiła profil, ułatwiający generowanie pozycji.

Przykładowo, pytanie „Nawet ludzie o silnym charakterze czasami czują się przegrani w pewnych sytuacjach. Jak często w przeszłości tak się czułeś?” (Anotonovsky, 1995, s. 83) zostało zbudowane przez operacjonalizację profilu: A3, B1, C3, D1 i E2 (bodziec afektywny, pochodzenia wewnętrznego, o wymaganiach abstrakcyjnych, odnoszący się do przeszłości i odwołujący się do poczucia zaradności). Dla całego konstruktu dało to możliwość stworzenia 243 pozycji, praktycznie pokrywających cały zakres jego treści oraz jednocześnie nie duplikujących się wzajemnie.

Pozycja testowa to sformalizowany wskaźnik danej cechy psychologicznej, a więc zdanie (twierdzenie lub pytanie) opisujące określone zachowanie (lub zadanie wyzwalające określone zachowanie) oraz skala rejestrująca to zachowanie (opcje odpowiedzi o określonym formacie oraz reguła przekształcania odpowiedzi w wynik liczbowy).

Proces tworzenia pozycji:

Decyzje wstępne:

Generowanie pozycji

Źródła pozycji:

Nowe pozycje:

Ocena trafności treściowej lub typowości pozycji

Procedura analizy:

Zapisywanie pozycji

Wymagania:

Konsekwencje:

Własności formalne pozycji - Model Angleitnera i wsp. (1986):

Zrozumiałość

Zalecenia

Niejasność - wieloznaczność interpretacyjna, możliwość przypisania wielu różnych znaczeń pozycji - interpretowania jej treści na wiele sposobów, z których każdy jest poprawny językowo i dopuszczalny z punktu widzenia formy gramatycznej.

Źródła:

Zalecenia

Ogólność-abstrakcyjność

Ogólność wynika z abstrakcyjności pojęć użytych do opisu zachowania, sytuacji czy cech osobowych. Pozycja ogólna zakłada konieczność integracji informacji, uzupełniania jej przez konkluzje, uogólniania zachowań z różnych sytuacji czy dokonania porównań z niespecyficznymi standardami.

Dostępność w doświadczeniu - zalecenia

Analizy itemmetryczne

Brak możliwości zbudowania pozycji doskonałej, ale pozycje wadliwe skutkują pogorszeniem charakterystyki psychometrycznej.

Opcje odpowiedzi

- Słaby status opcji centralnej :

1). odpowiedź osoby badanej oznacza, że jej zachowanie zależy od sytuacji;

2). odpowiedź osoby badanej wynika z trudności w ocenie własnego zachowania;

3). odpowiedź osoby badanej wskazuje, że nie potrafiła ona jednoznacznie rozkodować treści pozycji (pozycja jest niejasna); odpowiedź osoby badanej wskazuje, że faktycznie ma przeciętne nasilenie cechy.

- Dwumodalne rozkłady odpowiedzi.

Format może być nieparzysty, ale opcja pośrednia musi wskazywać na umiarkowanie nasilenie cechy.

- Wady formatów dwukategorialnych:

1). Zmuszają do udzielenia zdecydowanej odpowiedzi.

2). Nie gwarantują odpowiedniego zróżnicowania odpowiedzi.

- Wady formatów wielokategorialnych:

1). Są trudne poznawczo, zwłaszcza dla o.b. gorzej wykształconych.

2). Pozorne zróżnicowanie - tendencje do zawężania formatu.

Optymalna szerokość formatu

7 + 2 (5 - 9)

5 - 7

2 - 5

Inne aspekty formatu

Etap VI - ważenie pozycji lub opcji odpowiedzi

Etap VII - przygotowanie testu do badań: przyjęcie nazwy testu, zaopatrzenie go w instrukcję oraz wprowadzenie losowej kolejności pozycji w inwentarzach lub uporządkowania ich według stopnia trudności (wybór procedury badania);

Etap VIII - badania i analiza psychometryczna

Cel - uzyskanie finalnej wersji inwentarza: przeprowadzenie badań listą pozycji i analiza psychometryczna danych.

Przebieg badań - te same warunki i to samo narzędzie co w badaniach docelowych.

Badania

Dobór próby:

Przygotowanie do analizy danych

Analiza psychometryczna

Analiza pozycji - rodzaj analizy psychometrycznej, który obejmuje wskaźnik trudności pozycji, moc dyskryminacyjną oraz trafność zewnętrzną pozycji).

Moc dyskryminacyjna - wskaźnik stopnia, w jakim pozycja mierzy cechę, którą mierzy cały test (oceniana poprzez korelację pozycja-skala).

Trudność pozycji - proporcja odpowiedzi zgodnych z kluczem (średnia pozycji w relacji do możliwego maksymalnie wysokiego wyniku).

Trafność zewnętrzna pozycji - wskaźnik stopnia, w jakim pozycja mierzy kryterium pozatestowe (oceniana poprzez korelację pozycja-kryterium).

Miary mocy dyskryminacyjnej

0x08 graphic

Mp - to średnia wyników w skali tych osób, które odpowiedziały na daną pozycję zgodnie z kluczem, Mq - to średnia wyników w skali tych osób, które odpowiedziały na daną pozycję niezgodnie z kluczem, S - odchylenie standardowe wyników w całym teście, p - to proporcja tych osób, które odpowiedziały na daną pozycję zgodnie z kluczem, q - to proporcja tych osób, które odpowiedziały na daną pozycję niezgodnie z kluczem, zaś y - to rzędna rozkładu normalnego odpowiadająca proporcji p.

0x08 graphic

Mp - to średnia wyników w skali tych osób, które odpowiedziały na daną pozycję zgodnie z kluczem, Mq - to średnia wyników w skali tych osób, które odpowiedziały na daną pozycję niezgodnie z kluczem,

S - odchylenie standardowe wyników w całym teście, p - to proporcja tych osób, które odpowiedziały na daną pozycję zgodnie z kluczem, q - to proporcja tych osób, które odpowiedziały na daną pozycję niezgodnie z kluczem.

0x08 graphic
fg - to proporcja osób w górnej połowie próby, które odpowiedziały na daną pozycję zgodnie z kluczem, fd - to proporcja osób w dolnej połowie próby, które odpowiedziały na daną pozycję zgodnie z kluczem,

p - to proporcja osób w całej próbie, które odpowiedziały na daną pozycję zgodnie z kluczem,

q - to proporcja tych osób, które odpowiedziały na daną pozycję niezgodnie z kluczem.

Trafność zewnętrzna - korelacja z kryterium (r-Pearsona albo korelacje stosowane do oceny mocy dyskryminacyjnej)

Analiza czynnikowa pozycji - ładunek czynnikowy (korelacja pozycji z czynnikiem) oraz wskaźniki różnicowe:

Wr = F2 - (Fa2 + Fb2 + Fc2 + ... + Fz2)

Wr - wynik różnicowy, F2 - ładunek na odpowiadającym pozycji ("własnym") czynniku, zaś Fa2, Fb2 do Fz2 - ładunki na innych czynnikach (od czynnika "A" do "Z").

Teoria odpowiadania na pozycje testowe - założenia

Parametry „krzywej charakterystycznej”

Zwykle są stosowane model dwu-parametryczne (wymagają zastosowania nieliniowej regresji)

0x01 graphic
0x01 graphic

0x01 graphic
0x01 graphic

Etap IX - analizy weryfikacyjne finalnej wersji inwentarza: rzetelność i trafność (te same oraz inne aspekty).

Weryfikacja - bo inna skala (długość, kompozycja pozycji).

Analiza trafności i rzetelności pomiaru

Etap X - normalizacja wyników testu (skale standardowe o rozkładzie normalnym, skale rangowe, punkty odsiewowe wraz z obszarem niepewności diagnozy).

Rodzaje norm:

(A) normy ogólne bez podziału ze względu na żadną ze zmiennych demograficznych,

(B) normy dla danej kategorii zmiennej demograficznej, ale bez podziału ze względu na inne zmienne (np. dla wszystkich kobiet, bez podziału na wiek),

(C) normy dla określonej kategorii kolejnej zmiennej demograficznej, bez podziału na inne zmienne (np. dla osób o danym wieku, bez podziału na płeć), itd.

(D) normy z zastosowaniem wszystkich zmiennych demograficznych.

Kwestie specyficzne norm

Etap XI - publikacja testu.

Etap XII - rewizja testu (po maksimum 25 latach albo wcześniej po stwierdzeniu ewidentnych wad diagnostycznych).

Wykład 11

CZYNNIKI ZNIEKSZTAŁCAJĄCE WYNIKI TESTOWE

Czynniki zniekształcające wyniki testowe

a). zgadywanie.

b). tendencja do udzielania odpowiedzi społecznie aprobowanych albo społecznie nie aprobowanych:- tendencja do dysymulowania (aprobata społeczna),

c). style odpowiadania

Style odpowiadania - tendencja osoby badanej do wybierania określonej opcji odpowiedzi niezależnie od treści pozycji kwestionariuszowej: tendencja do zgadzania się albo zaprzeczania, udzielania odpowiedzi ekstremalnych albo centralnych (pośrednich), udzielania odpowiedzi nieuważnych lub niekonsekwentnych, losowych (przypadkowych), niezdecydowanych (opcje „?” lub opuszczenia odpowiedzi), produktywnych, impulsywnych, pozornie oryginalnych, konwencjonalnych oraz lateralizacji (style graficzne).

Konieczne jest rozróżnienie tendencji ogólnej (podatność narzędzia lub procedury badania) oraz różnic indywidualnych w stosowaniu stylu - skale kontrolne badają różnice indywidualne, wyjątkowo mogą być zastosowane do analizy sytuacji badania.

Źródła stylów odpowiadania

Zalecenia

Dysymulowanie - tendencja osoby badanej do przedstawiania się w nieprawdziwie korzystnym świetle, która wiązana jest ze zmienną aprobaty społecznej (tendencją osoby badanej do kierowania się społecznym wartościowaniem zachowania przy odpowiadaniu, co prowadzi do zaprzeczania posiadania cech społecznie niepożądanych oraz przypisywania sobie cech społecznie pożądanych).

Aprobata społeczna jako styl odpowiadania (czy inaczej postawa wobec badania) to tendencja jednostki do kierowania się przy odpowiadaniu nie tyle faktycznym zachowaniem, czy treścią pytania, ale społeczną oceną, jaką pociąga za sobą dana odpowiedź.

Aprobata jako cecha to tendencja podmiotu do takiego modulowania zachowania (każdego - testowego, jak i realnego, pozatestowego), by było ono zgodne ze społecznym wartościowaniem - normami społecznymi, akceptacją otoczenia.

Zalecenia - unikanie obciążenia

1). Pozycje neutralne.

2). Pozycje subtelne pod względem trafności fasadowej.3). Specjalne formułowanie językowe pozycji - tzw. zdania zmodalizowane, unikanie dużych kwantyfikatorów czasu.4). Zmiana procedury badania - komputeryzacja lub wykorzystanie szacowania cech.

Zalecenia - identyfikacja pozycji obciążonych

5). Aprobata społeczna jako zmienna moderacyjna.

6). Analiza podatności pozycji przez manipulowanie instrukcją („dobry” profil).

7). Analizy itemmetryczne.

8). Korelacje pozycji ze skalami mierzącymi aprobatę społeczną.Identyfikacja pozycji obciążonych - usunięcie albo przeformułowanie.

Metody kontroli (eliminowania) wpływu aprobaty

Na etapie stosowania kwestionariusza:

8). Instrukcja "szczerości",

9). Zmiana procedury badania - komputeryzacja testu,

10). Skala kontrolna aprobaty społecznej, na podstawie której odrzuca się respondentów o wysokich wynikach lub koryguje wyniki skal treściowych przez doliczanie tzw. poprawek korekcyjnych,11). Wprowadzenie do diagnozy psychologicznej szacowania cech.

Dysymulacja i symulacja

Konieczne jest rozróżnienie tendencji ogólnej (podatność narzędzia lub procedury badania) oraz różnic indywidualnych w dysymulowaniu czy symulowaniu - skale kontrolne badają różnice indywidualne, wyjątkowo mogą być zastosowane do analizy sytuacji badania.

Symulowanie - tendencja osoby badanej do udzielania odpowiedzi, bezpodstawnie przedstawiających osobę badaną w niekorzystnym świetle, np. wskazujących na istnienie określonych zaburzeń zachowania czy niepożądanych cech osobowości.

Tendencja do symulowania jest zarówno postawą wobec badania, (styl odpowiadania, np."super-szczerość"), jak trwałym syndromem cech osobowości, związanym z tendencjami agrawacyjnymi, obniżoną samooceną, ekscentrycznością i zaburzeniami psychicznymi. Kontrolowanie tendencji do symulacji umożliwiają specjalne skale kontrolne.

Symulowanie

Zalecenia - unikanie obciążenia

Zalecenia - identyfikacja pozycji obciążonych

Skale kontrolne

Funkcja skal kontrolnych polega na diagnozowaniu indywidualnych stylów odpowiadania na pozycje kwestionariuszowe, które są ekspresją postaw wobec badania inwentarzem osobowości. Postawy te nie wiążą się treściowo z badanymi cechami osobowości, ale powodują zniekształcenie uzyskiwanych wyników skal.

Czynniki te mogą być zatem traktowane jako tzw. zmienne „tłumiące” lub moderujące. Będą one zatem prowadziły do obniżenia wartości diagnostycznej inwentarza - trafności pomiaru, a niekiedy także i rzetelności pomiaru.

Rodzaje skal kontrolnych:

Skale kontrolne MMPI

Skala L była przeznaczona do diagnozowania dysymulacji i została zbudowana z pozycji opisujących zachowania społecznie pożądane, ale występujące rzadko u przeciętnej osoby. Uważa się, że diagnozuje ona tzw. naiwną tendencję do dysymulowania.

Skala K była przeznaczona do diagnozowania tendencji do przedstawiania „nadmiernie pozytywnego” obrazu siebie, ale zbudowano ją kryterialnie, wyodrębniając pozycje różnicujące grupę osób zdrowych oraz osób chorych o „normalnym” profilu, które podejrzewano zatem o dysymulację. Obu skalom przypisywano funkcję zmiennych tłumiących, a zatem prowadzących do uzyskania przez osobę nieprawdziwie „normalnego” profilu.

Skala F miała wykrywać tendencję do udzielania odpowiedzi nieuważnych i nieprzemyślanych. Wybrano do niej pozycje, które były bardzo rzadko potwierdzane w próbie normalizacyjnej. Pozycje te miały jednak charakter kliniczny i opisywały niezwykłe zachowania, z których każde stawiało osobę badaną w niekorzystnym świetle. Faktycznie zatem skala nieuważności zaczęła pełnić rolę skali symulacji. Ostatnia skala badała tendencję do wybierania odpowiedzi pośrednich („?”, czyli odpowiedzi „nie potrafię powiedzieć”). Jej wyniki obliczono jako liczbę odpowiedzi pośrednich na wszystkie pozycje MMPI. Miała ona diagnozować styl odpowiadania, wynikający z nadmiernej ostrożności czy niezdecydowania, a prowadzący do obniżenia wyników skal klinicznych.

Skale kontrolne MMPI-II

II wersja MMPI zawiera aż 9 skal kontrolnych - obok czterech tradycyjnych skal kontrolnych („?”, L, F i K), wprowadzono aż pięć dalszych: VRIN, TRIN, F(b), F(p) oraz S.

Skala VRIN (Variable Response Inconsistency) pozwala na ocenę zmienności odpowiedzi na zbiór, opozycyjnych w treści, par pozycji - wysoki wynik w tej skali, oznaczający udzielenie tej samej odpowiedzi na oba stwierdzenia z każdej pary, pozwala na ocenę niekonsekwencji odpowiadania. Z kolei skala TRIN (True Response Inconsistency) bazuje na liczbie odpowiedzi konfirmacyjnych na oba stwierdzenia pary i informuje o tendencji do zgadzania się, podczas gdy liczba odpowiedzi negujących - o tendencji do zaprzeczania.

Skala F(b) (Inpatient Psychopathology Scale) została zbudowana na końcowych pozycjach inwentarza MMPI-2 i - jako wariant skali F - pozwala na ocenę losowości odpowiedzi, następującej w efekcie zmęczenia i utraty motywacji, przy wypełnianiu tego długiego inwentarza.

Z kolei skala F(p) (Inpatient Psychopathology Scale) bada tendencję do symulowania u osób, wykazujących zaburzenia psychiczne.

Wreszcie skala S (Superlative Self-Presentation Scale) pozwala na ocenę bardziej wyrafinowanej formy dysymulowania niż tradycyjnie stosowana skala K wraz z pięcioma szczegółowymi komponentami tej tendencji.

Skale kontrolne 16 PF-V

W 5. edycji 16 PF wprowadzono trzy skale kontrolne: aprobaty społecznej (w wersji skali do badania „sprawiania wrażenia”), tendencji do „zgadzania się” oraz tendencji do udzielania „odpowiedzi przypadkowych” (ang. infrequency). Tendencja do udzielania „odpowiedzi przypadkowych” („strzelania”) jest diagnozowana na podstawie wybierania przez osobę badaną szczególnie rzadko zaznaczanych w całej próbie opcji odpowiedzi (z trójstopniowej skali) na pulę pozycji treściowych (zliczana jest suma wybranych takich opcji w puli różnorodnych pozycji). Tendencja do „zgadzania się” jest oceniana na podstawie wybierania przez osobę badaną odpowiedzi potwierdzających na pozycje wybrane z różnych skal treściowych (zliczana jest suma odpowiedzi potakujących na pulę zróżnicowanych treściowo pozycji).

Skala aprobaty zawiera pozycje, które nie są włączane do skal treściowych i diagnozuje uogólnioną tendencję do kierowania się aprobatą społeczną przy odpowiadaniu. Godnym uwagi jest także fakt, że w 5. edycji 16PF zmieniono nieco status skali rozumowania (B). Pozycje z tej skali zamieszczone są na końcu inwentarza, a sama skala staje się do pewnego stopnia skalą kontrolną. Służy ona nadal do oceny zdolności i jej wyniki są uwzględniane w profilu cech, tak jak w wersji pierwotnej. Jednocześnie jednak - poprzez badanie sprawności rozumowania na końcu kwestionariusza - informuje o zasobach uwagi, którymi dysponowała osoba badana po męczącej i długotrwałej pracy, związanej z wypełnieniem 16PF.

Zgadywanie jest specyficznym czynnikiem zniekształcającym wyniki testów zdolności, związanym z udzielaniem odpowiedzi losowych, gdy badani nie znają właściwych odpowiedzi („jak nie wiem, to będę strzelał”).

Kontrolowanie zgadywania

a). poprzez instrukcję testową: wyrównywanie tendencji do zgadywania (zachęcanie do zgadywania) lub eliminowanie zgadywania (informacja o stosowaniu korekty wyników);

b). zastosowanie statystycznej poprawki na zgadywanie:

B

K = P - ---------

m - 1

gdzie K - liczba odpowiedzi bez zgadywania, P - liczba poprawnych odpowiedzi w teście, B - liczba błędnych odpowiedzi, m - liczba opcji odpowiedzi w zadaniach testowych.

Wykład 12

STRATEGIE KULTUROWEJ ADAPTACJI TESTÓW

Kulturowa adaptacja testu - przystosowanie wersji oryginalnej testu do innej specyfiki kulturowej. Adaptacja testu oznacza konieczność wprowadzenia specjalnych procedur przystosowujących (decentrujących - uniwersalizujących lub centrujących na kulturze adaptacji), w przeciwnym razie stosowanie takiego narzędzia prowadzi nieuchronnie do stronniczości lub faworyzacji kulturowej.

Aspekty równoważności kulturowej testu:

a). równoważność teorii psychologicznych,

b). równoważność wymiarów psychologicznych

c). równoważność pojęć psychologicznych,

d). równoważność wskaźników cech - zachowań,

e). równoważność procedury badania.

Kryteria równoważności testu:

a). równoważność fasadowa (forma testu),

b). równoważność psychometryczna (wskaźniki dobroci pomiaru),c). równoważność funkcjonalna (równoważność psychologiczna),

d). wierność tłumaczenia,

e). wierność rekonstrukcji.

Adaptacja demograficzna testów

Adaptacja demograficzna - przystosowanie testu przeznaczonego do badania określonej grupy do stosowania w innej grupie demograficznej. Adaptacja demograficzna testu, tak jak adaptacja kulturowa, oznacza konieczność wprowadzenia specjalnych procedur przystosowujących (decentrujących - uniwersalizujących lub centrujących na kulturze danej grupy), w przeciwnym razie stosowanie testu prowadzi nieuchronnie do stronniczości lub faworyzacji demograficznej (np. seksizmu).

Aspekty adaptacji demograficznej testów

Wykład 13

NORMALIZACJA WYNIKÓW TESTU

Normy

Normy testowe są niezbędne dla poprawnej interpretacji wyników testu. Wynik surowy jest nieinterpretowalny bez informacji o wynikach, otrzymanych przez osoby badane z odpowiedniej grupy odniesienia. Są dwa rodzaje norm: wyniki progowe (pomiędzy grupami kontrastowymi) oraz normy bazujące na rozkładzie wyników testu (w grupie odniesienia - normalizacyjnej).

Wyniki progowe

Wyniki progowe (punkty odsiewowe) są stosowane w podejściu zorientowanym na trafność kryterialną. Celem tych norm jest uzyskanie diagnozy jakościowej - klasyfikacji osób badanych do jednej z dwóch (czy kilku) grup, skontrastowanych ze względu na określone kryterium. Punkty odsiewowe służą jako norma dla wyników testu - wskazują co oznacza wysoki i niski wynik testu.

0x01 graphic
0x01 graphic

Wynik progowy jest zazwyczaj wyrażany w formie, przykładowo „10/11” (najwyższy wynik w jednej grupie/najniższy wynik w drugiej grupie). Wynik progowy jest uzyskiwany poprzez krzywoliniową regresję jako punkt pozwalający na najlepsze zróżnicowanie obu grup: poniżej tego wyniku osoba badana ma mniej niż 50% szans, że należy do jednej grupy, zaś powyżej, że ma powyżej 50% szans na przynależność do drugiej grupy.

Normy bazujące na rozkładzie wyników testu

Celem norm opartych na rozkładzie wyników w grupie normalizacyjnej jest uzyskanie diagnozy ilościowej - ocena intensywności mierzonej cechy (jako własności różnicowej w grupie odniesienia). Istnieją dwa rodzaje norm: normy rangowe (porządkowa skala pomiarowa) oraz skale standaryzowane (przedziałowa skala pomiarowa).

Normy rangowe: skala centylowa

Skala centylowa jest wybierana, gdy rozkład wyników testu znacznie odbiega od rozkładu normalnego (rozkład jest asymetryczny, ma nieprawidłową gęstość i nie może być przetransformowany w rozkład normalny). Punktem odniesienia (standardem wykonania testu) jest mediana - centyle wskazują na częstość uzyskania danego wyniku w grupie normalizacyjnej.

Charakterystyka skali centylowej

Rozkład po transformacji wyników surowych = prostokątny („uskokowniony”)

Mediana = 50

Liczba jednostek skali = 101 centyli

Zakres = od 0 do 100 centyla

Skok skali = 1 centyl (1% wyników, poza centylami krańcowymi - 0 oraz 100, które obejmują po 0,5% obserwacji)

Zalety i wady skali centylowej

Zaleta:

Wada:

Skale standardowe bazujące na rozkładzie normalnym

Normy wyników testu bazujące na rozkładzie normalnym wymagają transformacji wyników surowych na skale standardowe. Skale te umożliwiają osiągnięcie zasadniczego celu pomiaru psychologicznego: ilościowej oceny na skali przedziałowej (wiele kategorii wyników oraz równe różnice między nimi dla całego wymiaru).

Cel transformacji wyników surowych na skale standardowe

Rodzaje skal standardowych

a). Znormalizowana skala ciągła - jednostki "z",

b). znormalizowane skale uskokowione:

dzielące rozkład wg średniej

(-) skala stenowa

obejmujące wartość średniej

(-) skala staninowa

(-) skala tetronowa

(-) skala wyników przeliczonych (WAIS-R)

(-) skala tenowa

(-) skala dewiacyjnego ilorazu inteligencji

Skala jednostek znormalizowanychz

Rozkład po transformacji wyników surowych = normalny („ciągły”)

Średnia = 0,0

Odchylenie standardowe = 1,0

Skok skali = praktycznie 0,01

Różnicowanie = dowolny zakres

Przeznaczenie = skala podstawowa, stanowiąca punkt wyjścia do transformacji wyników surowych na inne skale znormalizowane

Formuła transformacyjna

y = zSy + My

gdzie y - wynik w znormalizowanej skali standardowej, z - znormalizowany wynik standardowy,

Sy - odchylenie standardowe danej skali standardowej, My - średnia wyników danej skali standardowej)

Skala stenowa

Rozkład po transformacji wyników surowych = normalny („uskokowiony”)

Średnia = 5,5 (między 5 a 6 stenem)

Odchylenie standardowe = 2,0

Liczba jednostek skali = 10 stenów

Zakres = od 1 do 10 stena

Skok skali = 1 sten (0,5 odchylenia standardowego jednostek znormalizowanych „z”)

Różnicowanie = wartości od -2 do +2 jednostek znormalizowanych „z” (steny krańcowe powyżej 2 S)

Przeznaczenie = różnicowanie w obrębie „normy”

Skala staninowa

Rozkład po transformacji wyników surowych = normalny („uskokowiony”)

Średnia = 5,0 (obejmuje średnią)

Odchylenie standardowe = 2,0

Liczba jednostek skali = 9 stanin

Zakres = od 1 do 9 stanina

Skok skali = 1 stanin (0,5 odchylenia standardowego jednostek znormalizowanych „z”)

Różnicowanie = wartości od -1,75 do +1,75 jednostek znormalizowanych „z” (staniny krańcowe powyżej 1,75 S)

Przeznaczenie = różnicowanie w obrębie „normy”

Skala tetronowa

Rozkład po transformacji wyników surowych = normalny („uskokowiony”)

Średnia = 10,0 (obejmuje średnią)

Odchylenie standardowe = 4,0

Liczba jednostek skali = 21 tetronów

Zakres = od 0 do 20 tetrona

Skok skali = 1 tetron (0,25 odchylenia standardowego jednostek znormalizowanych „z”)

Różnicowanie = wartości od -2,325 do +2,325 jednostek znormalizowanych „z” (tetrony krańcowe powyżej 2,325 S)

Przeznaczenie = różnicowanie w obrębie „normy” i „patologii

Skala tenowa

Rozkład po transformacji wyników surowych = normalny („uskokowiony”)

Średnia = 50 (obejmuje średnią)

Odchylenie standardowe = 10,0

Liczba jednostek skali = 100 tenów

Zakres = od 1 do 100 tena

Skok skali = 1 ten (0,1 odchylenia standardowego jednostek znormalizowanych „z”)

Różnicowanie = wartości od -5 do +5 jednostek znormalizowanych „z” (teny krańcowe powyżej 5 S)

Przeznaczenie = różnicowanie w obrębie „normy' i „patologii”

Skala dewiacyjnego ilorazu inteligencji

Rozkład po transformacji wyników surowych = normalny („uskokowiony”)

Średnia = 100,0 (obejmuje średnią)

Odchylenie standardowe = 15,0

Liczba jednostek skali = 200 jednostek II

Zakres = od 0 do 200 jednostek II

Skok skali = jednostka II (1/15 odchylenia standardowego jednostek znormalizowanych „z”)

Różnicowanie = wartości praktycznie od -6 do +6 jednostek znormalizowanych „z” (jednostki krańcowe powyżej 6 S)

Przeznaczenie = różnicowanie w obrębie „normy” i „patologii”

Kryteria wyboru danej skali normalizacyjnej

0x01 graphic
0x01 graphic

Interpretacja nasilenia cechy bazująca na staninach

Interpretacja wyników różnicowych testu

Nasilenie cechy, wyrażonej w wynikach testu jest proporcjonalne do wielkości odbiegania go od średniej (punktu odniesienia, czy inaczej standardu wykonania) oraz częstości (wynik częsty = typowy, wynik rzadki = ekstremalny). Im bardziej odchylony i rzadko spotykany jest dany wynik, tym większe (lub mniejsze) nasilenie badanej cechy.

Kwestie specjalne norm

Normy generalne czy lokalne (poradnictwo i dobór);

Aktualizacja norm i normy „kroczące” (liczebność grupy normalizacyjnej, trendy uzyskiwanych wyników);

Normy dla wszystkich i odrębne normy dla grup demograficznych (kryteria - analiza demograficznej stronniczości wyników testu).

Normy aktuarialne to normy, w które zostały wbudowane dane trafnościowe

Wykład 14

INTERPRETACJA WYNIKÓW TESTOWYCH I ZASADY KORZYSTANIA Z PODRĘCZNIKÓW TESTOWYCH

Interpretacja kliniczna

Zakłada interpretację profilu testowego na podstawie treści psychologicznej poszczególnych skal i agregację tej treści poprzez ustalenie sensu danej konfiguracji cech. Interpretacja kliniczna wiąże się z idiograficznym podejściem do diagnostyki psychologicznej i w jej efekcie formułowane są wnioski raczej jakościowe niż ilościowe, a jeśli ilościowe - to są one mało precyzyjne.

Interpretacja statystyczna

Zakłada raczej mechaniczne łączenie skal, poprzez tworzenie agregatów nie tyle psychologicznych, ile statystycznych, np. poprzez tworzenie baterii testów predykcyjnych określonego kryterium (stanu zdrowia psychicznego, powodzenia zawodowego, itp.). Dla każdego z tych wskaźników możliwe jest określenie pewności wnioskowania czy dokładności diagnozy. Interpretacja statystyczna wymaga sformalizowania procesu wnioskowania na podstawie uzyskanych danych. Wiąże się ona z nomotetycznym podejściem do diagnostyki psychologicznej i dostarcza przede wszystkim wyników ilościowych.

Predykcja zachowania jednostki jest bardziej trafna przy podejściu statystycznym niż klinicznym. Podejście statystyczne jest jednak krytykowane za mechaniczność analizy danych i sprowadzenie udziału psychologa w diagnozie do roli “technika” rozdzielającego testy, obliczającego ich wyniki i odczytującego ich znaczenie z tabel aktuarialnych. Z tych względów postuluje się łączenie obu podejść albo akcentuje się konieczność wypracowania nowych modeli diagnostycznych.

0x01 graphic

34

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic



Wyszukiwarka

Podobne podstrony:
Wykład 14, psychologia, II rok, procesy poznawcze cz. II
Wykłady opracowanie, Psychologia dzienna W 6 będy, pytania i erystyka (psychologia 14 W6), PYTANIA
Psychologia rozwojowa - Wojciechowska - wykład 14 - Umieranie i śmierć, Psychologia rozwojowa
Podstawy psychologii - wyklad 14 [09.11.2001], ☆♥☆Coś co mnie kręci psychologia
Wyklad 14. PRCz, Psychologia USWPS Warszawa, Psychologia rozwoju człowieka - Bokus
WYKLAD 14, Sesja, Rok 2 sem 1, WYKŁAD Psychologia osobowości
zagadnienia wyklad 14, fizjoterapia, psychologia
S1 Wprowadzenie do psychologii Andrzej Gołąb wykład 13 i 14, Psychologia WSFiZ I semestr, Wprowadzen
Wykład II 14, psychologia osobowości
Psychologia rozwojowa Teoplitz wykład 14 Starość
Etyka psychologiczna wykład 14 Problemy etyczne związane z nauczaniem psychologii
Psychologia rozwojowa - Brzezińska - wykład 14 - Dzieciństwo pierwszy rok życia, Pierwsze trzy lata

więcej podobnych podstron