psychometria - Hornowska opracowanie, Psychometria


Trafność czyli określanie obszaru zastosowania testu

Trafność jest to dokładność z jaką test mierzy to, co ma mierzyć

Trafność jest to stopień, w jakim test jest w stanie osiągnąć stawiane mu cele

Trafność testu wskazuje na wielkość błędu spowodowanego rozbieżnością między zamierzeniami autora testu a tym, co test faktycznie mierzy

Trafność odzwierciedla relację jaka zachodzi między koncepcją właściwości psychologicznej a użytymi wskaźnikami tej właściwości, czyli adekwatność operacjonalizacji wielkości psychologicznej

Rodzaje trafności z punktu widzenia celu, jakiemu służy test

(a) ocenianie, na podstawie pomiaru testowego, całokształtu zachowań, których próbkę pobiera test - na przykład, ocena całokształtu wiadomości z geografii (trafność treściowa, [logiczna], [wewnętrzna])

(b) ocenianie posiadania przez osobę badaną - w czasie teraźniejszym lub przyszłym - określonej właściwości psychologicznej innej niż ta, którą test bezpośrednio mierzy (trafność kryterialna)

(c) pomiar nasilenia u osoby badanej hipotetycznej właściwości, czyli psychologicznego konstruktu, o którym mają świadczyć odpowiedzi na bodźce testowe (trafność teoretyczna)

Trafność fasadowa

trafność treściową należy odróżnić od tzw. trafności fasadowej (ang. face validity).

trafność fasadowa dotyczy nie tego, co test rzeczywiście mierzy, lecz tego, co `wydaje się mierzyć'

trafność fasadowa opisuje, jak spostrzegają test osoby badane i czy - z ich punktu widzenia - wydaje się on trafnie mierzyć to, co ma mierzyć.

trafność fasadowa zapewnia, że dany test wydaje się - w opinii osób badanych - adekwatny do określonego celu.

Trafność treściowa

(inaczej trafność wewnętrzna lub logiczna) zakres w jakim pozycje testowe właściwie reprezentują uniwersum pozycji testowych lub interesujący nas konstrukt zakres, w jakim treść testu stanowi reprezentatywną próbę dziedziny, która ma być przedmiotem pomiaru aby potwierdzić trafność treściową zbioru wyników otrzymanych w teście należy wykazać, że zachowania demonstrowane w badaniu testowym są reprezentatywną próbką zachowań ujawniających się w interesującej badacza sferze

Trafność kryterialna

Kryterium jest to zachowanie czy właściwość, o której chcemy wnioskować z wyniku ocenianego testu.

Kryterium jest to zmienna pozatestowa. Kryterium jest zewnętrzne w stosunku do testu.

Kryterium jest pomiarem innej zmiennej, niż ta która mierzy interesujący nas test

Trafność kryterialna jest to stopień zgodności pomiarów otrzymanych za pomocą testu, którego

trafność oceniamy oraz pomiarów otrzymanych w wyniku oceny kryterium

Rodzaje trafności kryterialnej

Różnica pomiędzy trafnością diagnostyczną a trafnością prognostyczną nie polega na różnicy w czasie zbierania danych kryterialnych, lecz na tym, że różne są przedmioty badania: przy diagnozie obchodzi nas stwierdzenie stanu istniejącego, przy prognozie - prawdopodobieństwo wystąpienia pewnych skutków stanu aktualnego

Trafność diagnostyczna:

kryterium dla naszego testu jest pomiar zachowania czy cechy aktualnie występującej u osoby badanej

Trafność prognostyczna:

kryterium dla naszego testu jest pomiar zachowania czy cechy mającej wystąpić w przyszłości u osoby badanej

Kontaminacja kryterium:

wyniki testowe nie mogą wpływać na pozycję jednostki w zakresie branego pod uwagę kryterium

Trafność teoretyczna

Konieczność określenia trafności teoretycznej występuje wtedy, kiedy test ma być interpretowany jako miara pewnego atrybutu lub pewnej właściwości. Konieczność określenia trafności teoretycznej występuje wtedy, kiedy test ma być interpretowany jako miara pewnego atrybutu lub pewnej właściwości.

Sposoby badania trafności teoretycznej

(1) Analiza różnic międzygrupowych - procedura testowania hipotez o różnym zachowaniu się dwóch grup osób. Hipotezy te wyprowadzane są z teorii mierzonej cechy a badane grupy różnią się ze względu na ogólny wynik w teście (grupa o niskich wynikach vs. grupa o wysokich wynikach)

(2) Analiza macierzy korelacji - ocena trafności teoretycznej na podstawie wysokości współczynników korelacji z podobnymi testami (wysokie) i współczynnikami korelacji z testami mierzącymi inne cechy (niskie); zwłaszcza metoda analizy macierzy "wielu cech-wielu metod" Campbella i Fiskego

(3) Analiza czynnikowa - wykrywanie czynników odpowiedzialnych za współzmienność wyników testów korelujących ze sobą

(4) Analiza struktury wewnętrznej testu - jeżeli można przyjąć w świetle teorii, że mierzona cecha jest cechą homogeniczną, to wysoki współczynnik zgodności wewnętrznej może być traktowany jako dowód trafności teoretycznej

(5) Analiza zmian nieprzypadkowych wyników testu - porównywanie wyników dwukrotnego badania tym samym testem. W przerwie między badaniami wprowadza się manipulację eksperymentalną, wyprowadzoną z teorii mierzonej cechy. Wynik porównywania powinien być zgodny z założonymi efektami manipulacji.

(6) Analiza procesu rozwiązywania testu - gdy test zawiera zadania do rozwiązania lub polecenia do wykonania to obserwacja kolejności wykonywanych czynności, elementów zadania sprawiających najwięcej trudności, elementów pomijanych, popełnianych błędów dostarcza informacji o mierzonym konstrukcje

Normy czyli nadawanie znaczenia wynikom testowym

Możemy wyróżnić trzy koncepcje normy: normę definiowaną przez kryterium teoretyczne, kryterium kulturowe i kryterium statystyczne.

Zgodnie z kryterium teoretycznym norma wyznaczona jest przez jakąś teorię (koncepcję) psychologiczną. Zasadniczym znaczeniem terminu norma jest pewien wzór (model) wynikający z przyjętej teorii, pozostałe zaś znaczenia mieszczą się w tych ramach.

Według kryterium kulturowego normę określają przepisy i wzory kulturowe. Bez względu na treść tych wzorów istotą normy jest zgodność z takim przepisem.

Natomiast według kryterium statystycznego normą jest to, co jest opisywane jako „zachowanie większości” czy jako „zachowanie średnie lub przeciętne”

Normy czyli nadawanie znaczenia wynikom testowym

Normą - w sensie psychometrycznym - jest standard ilościowy, wyznaczony przez średnią, medianę lub inną miarę tendencji centralnej obliczoną dla grupy przedstawicieli danego typu (gatunku).

Normą jest typowe zachowanie (typowy wynik w teście) otrzymany dla określonej grupy osób.

W psychometrii przyjmujemy statystyczne rozumienie normy. Norma nie oznacza standardu „dobrego” wykonania testu; norma opisuje poziom typowego wykonania testu przez osoby należące do określonej grupy.

Rodzaje norm

ze względu na sposób definiowania grupy odniesienia

normy ogólnokrajowe

normy lokalne

ze względu na sposób ich konstrukcji

typu standardowego

typu rangowego

typu równoważnikowego

normy wymagań

0x01 graphic

0x01 graphic

Czynniki zniekształcające wyniki testowe

Na wyniki testowe wpływają nie tylko zmienne treściowe -

określone rodzaje zdolności czy cech osobowości.

Wyniki testowe mogą też być zniekształcane przez określone

czynniki pozatreściowe.

Strategie (style) odpowiadania na pozycje kwestionariusza

Lub

Jest to obserwowana skłonność osób badanych do udzielania

odpowiedzi niezależnie od treści pozycji testowych.

Jest to trwała dyspozycja do reagowania w określony sposób

w różnych obszarach treściowych.

Strategie (style) odpowiadania na pozycje kwestionariusza

ZASADY OGÓLNE

Strategie są stałe i trwałe

Strategie odpowiadania powodują, że wyniki testowe są bardziej

wieloznaczne

Strategie odpowiadania są silniejsze w sytuacjach

niejednoznacznych i nieustrukturowanych

Testy trudne wyzwalają strategie odpowiadania

Strategie (style) odpowiadania na pozycje kwestionariusza

Tendencja do potakiwania (Cronbach, 1946)

Skłonność osób badanych do uznawania, że charakteryzują je różne twierdzenia danego kwestionariusza, niezależnie od tego jaka jest ich treść. Jest to stała dyspozycja do odpowiadania ”prawda", "zgadzam się", "tak".

Strategie (style) odpowiadania na pozycje kwestionariusza

Strategia semantyczna (Cronbach, 1946)

Każda osoba badana może inaczej interpretować kategorie odpowiedzi typu "czasami", "nie lubię" czy "trochę się zgadzam". Tworzące się w ten sposób stałe błędy mogą się kumulować i obciążać wyniki.

Strategie (style) odpowiadania na pozycje kwestionariusza

Tendencja do unikania konkretnej odpowiedzi

(Cronbach, 1946)

Niektóre osoby badane, częściej niż inne kategorie, wybierają kategorię neutralną ("nie wiem", "?"). Tendencja ta może okazać się stałym sposobem odpowiadania. Prawdopodobnie zjawisko to oznacza nieumiejętność podjęcia decyzji w sytuacji testowania.

Strategie (style) odpowiadania na pozycje kwestionariusza

Tendencja do odpowiedzi dewiacyjnych (Berg, 1967)

Tendencja do udzielania odpowiedzi wyjątkowych lub niezwykłych.

Kontrolowanie stylów odpowiadania

wyrównanie liczby pozycji diagnostycznych na "tak" i "nie", (tendencja do zgadzania się i zaprzeczania)

eliminowanie odpowiedzi pośrednich (centralny styl odpowiadania)

stosowanie skal kontrolnych: zliczanie odpowiedzi centralnych, niezdecydowanych; skali konsekwencji (nieuważności); porównanie proporcji odpowiedzi, np. potakujących czy negujących w skalach treściowych

Strategie (style) odpowiadania na pozycje kwestionariusza

Zmienna aprobaty społecznej (Edwards, 1957; Crowne i

Marlow, 1964)

Skłonność osób badanych do przypisywania sobie w samoopisach takich stwierdzeń, które są społecznie pożądane, a odrzucanie tych, które są społecznie niepożądane. Nie jest to świadome oszukiwanie, ale skłonność do pokazywania się od jak najlepszej strony.

Kontrolowanie zmiennej aprobaty społecznej

Na etapie konstrukcji kwestionariusza:

Pozycje neutralne

Pozycje subtelne pod względem trafności fasadowej

Specjalne formułowanie językowe pozycji

Wprowadzanie odpowiedniej instrukcji

Analiza korelacji pozycji ze skalami mierzącymi aprobatę społeczną

Na etapie stosowania kwestionariusza:

Wprowadzanie odpowiedniej instrukcji, tzw. instrukcja

"szczerości"

Skala kontrolna aprobaty społecznej (odrzucanie respondentów o wysokich wynikach lub korygowanie wyników skal treściowych przez doliczanie tzw. poprawek korekcyjnych

Tendencja do dysymulowania i symulowania a aprobata społeczna

Tendencja do dysymulowania

Jest to świadoma lub nieświadoma tendencja osoby badanej do przedstawiania się w nieprawdziwie korzystnym świetle

Dysymulacja najczęściej wiązana jest ze zmienną aprobaty społecznej

Tendencja do symulowania

Jest to świadome lub nieświadome udzielanie odpowiedzi, bezpodstawnie przedstawiających osobę badaną w niekorzystnym świetle, np. wskazujących na istnienie określonych zaburzeń zachowania czy niepożądanych cech osobowości

Kontrolowanie tendencji do symulacji umożliwiają specjalne skale kontrolne

Strategie konstrukcji testów

Strategia teoretyczna

W strategii teoretycznej konieczna jest analiza definicji badanego konstruktu oraz definicji cech, bowiem określają one zakresy oraz specyfikę zachowań będących ich opisem

Strategia empiryczna (instrumentalna)

W strategii zewnętrznej konieczna jest analiza definicji danego kryterium oraz wyodrębnienie i klasyfikacja podstawowych wskaźników związanych z kryterium

Konstruowanie testu według strategii empirycznej

(instrumentalnej)

Normy rangowe.

CENTYL - to punkt na skali, poniżej którego leży określony odsetek rozkładu.

Skala centylowa pozwala na ocenę wyniku danej osoby w stosunku do wyników innych osób należących do określonych populacji.

Jest to jednak nie skala normalna ale prostokątna - rozkład prostokątny - rozkład równoprawodopodobny, czyli rozkład, w którym wszystkie wartości zmiennej pojawiają się z tym samym prawdopodobieństwem.

Wzór na CENTYL (C)

Normy centylowe są normami typu RANGOWEGO (PORZĄDKOWEGO).

Oznacza to, że normy tego typu dobrze odzwierciedlają uporządkowanie osób badanych w grupie normalizacyjnej, nie odzwierciedlają natomiast względnych różnic między tymi osobami.

Normy typu równoważnikowego:

Równoważniki wieku to liczby wskazujące na kolejny rok i miesiąc życia badanych osób, odpowiadające średniej arytmetycznej lub medianie wykonania testu na danym etapie rozwoju

Równoważniki klasy to liczby wskazujące na rok i miesiąc nauczania w roku szkolnym, odpowiadające średniej arytmetycznej lub medianie wykonania testu na danym etapie rozwoju.

Interpretacja wyników zorientowana na kryterium (standard wykonania) to taki sposób oceny wyniku testowego, w którym nacisk kładzie się na konkretny zakres wiedzy czy umiejętności.

Dostarcza ona informacji o tym, co osoby badane potrafią zrobić, w odróżnieniu od interpretacji zorientowanej na normy, która mówi o tym, jak osoby badane są oceniane NA TLE innych osób do nich podobnych (należących do tej samej grupy normalizacyjnej).



Wyszukiwarka

Podobne podstrony:
przebieg, PSYCHOLOGIA, I ROK, semestr II, biologiczne mechanizmy zachowania II.mózgowe mechanizmy fu
rozdz 13 jezyk i mowa, Edward Nęcka - Psychologia poznawcza (opracowanie podręcznika)
Szymura, II ROK, SEMESTR II, psychologia różnic indywidualnych, opracowania
Nęcka r. 6, II ROK, SEMESTR II, psychologia różnic indywidualnych, opracowania
PSYCHOLOGIA STOSOWANA opracowanie na koło
opracowanie Psychologia
psychologia opracowanie pyta
Saarni, PSYCHOLOGIA, I ROK, semestr II, psychologia emocji i motywacji, opracowania
Aronson Rozdział 5, Uniwersytet Łódzki, Aronson Elliot - Psychologia Społeczna. Serce i Umysł. (Opra
GENEZA I PSYCHOLOGIZM CUDZOZIEMKI, Opracowania lektur, Cudzoziemka
Opracowanie zagadnień z Psychologii sądowej (cz 1)

więcej podobnych podstron