PSYCHOM, SWPS, psychometria, PSYCHOMETRIA I METODA TESTÓW (Elżbieta Hornowska)


Spis zagadnień egzaminacyjnych

rok akademicki 2006/2007

  1. Omów cechy charakterystyczne testów psychologicznych

- Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena

- Jest to sytuacja tworzona specjalnie dla celów diagnostycznych, w której wywołuje się zachowania typowe pod względem tej charakterystyki jaka ma być przedmiotem celowej obserwacji

- Jest to sytuacja, która od diagnosty nie wymaga osobistego zaangażowania i w której jasno jest określony zakres i rodzaj dopuszczalnych zachowań

  1. Jakie znasz przykłady testów psychologicznych?

. Jakie są kryteria dobrego testu?

    1. Obiektywność: nienaruszalność wyników testowania od osób, które te wyniki oceniają; test musi posiadać jasno określony klucz oceniania odpowiedzi, zmniejszający do minimum wpływ subiektywnych interpretacji (niezależnie od tego kto, gdzie i kiedy dokonuje oceny wyników tego samego testu, wykonywanego przez tę samą osobę, powinien otrzymać takie same rezultaty).

    2. Standaryzacja: jednolitość warunków badania; aby wyniki danego testu można było ze sobą porównać, dany test powinien zawsze być przeprowadzony w identycznych warunkach; powinna być identyczna instrukcja.

    3. Rzetelność: dokładność pomiaru; wielkość błędu jaki popełnia psycholog interpretując wyniki danego testu; mówi nam ona o tym, w jakim stopniu wynik danego testu odzwierciedla poziom mierzonej cechy u danej osoby, a nie wpływ czynników losowych.

    4. Trafność: obszar zastosowania testu; decyduje o tym, czy dany test możemy wykorzystywać w taki, a nie inny sposób; mówi czy można poprawnie wnioskować na podstawie wyniku testowego.

    5. Normalizacja: nadawanie znaczenia wynikom testowym; podstawą interpretacji wyników testowych jest zawsze jakiś układ odniesienia; podstawą formułowania wniosków o właściwościach psychologicznych osób badanych jest zawsze ocena tego, jak badana osoba wypadła na tle innych osób; normalizacja to procedura tworzenia zbiorów, w specjalny sposób przetworzonych, wyników testu dla osób o określonych właściwościach zdefiniowanych za pomocą kryteriów zewnętrznych.

    6. Właściwa adaptacja: dopasowanie testu do warunków polskich; adaptacja to proces przystosowywania wersji pierwotnej do specyfiki kultury lokalnej i nie sprowadza się ona jedynie do właściwego przetłumaczenia tekstu oryginalnego.

  1. Dlaczego standaryzacja testu jest zabiegiem szczególnie ważnym? Wskaż przynajmniej dwa aspekty w procedurze badania testem, które wymagają wystandaryzowania. Dlaczego?

. Standaryzacja testu jest zabiegiem związanym z ujednolicaniem warunków badania dla każdej osoby badanej. Jest to zabieg bardzo ważny dlatego że, jeśli zachowamy zasady standaryzacji to różnice w uzyskanych wynikach pomiędzy osobami badanymi możemy przypisać czynnikom indywidualnym a nie czynnikom związanym z zewnętrznymi warunkami badania. Standaryzacja przede wszystkim służy nam abyśmy mieli możliwość porównania wyników. Zabieg standaryzacji może dotyczyć:

  1. Jaka jest różnica pomiędzy testem obiektywnym a testem wystandaryzowanym?

TEST WYSTANDARYZOWANY - posiada dokładnie sprecyzowane zasady stosowania go oraz jest wyposażony w normy, otrzymane w wyniku przebadania reprezentatywnej próby pochodzącej z populacji, dla której test ma być stosowany. Normy te są podstawą do interpretacji wyników otrzymanych przez osoby badane.

TEST OBIEKTYWNY - posiada starannie opracowane, stale metody obliczania wyników, że sam wynik może zostać obliczony nawet przez osobę bez przygotowania psychologicznego

  1. Opisz swoimi własnymi słowami co rozumiesz przez "rzetelność testu".

Rzetelność oznacza zgodność wyników otrzymanych przez te same osoby, które zostały przebadane kilka razy tym samym testem. (W psychometrii termin rzetelność oznacza powtarzalność wyników.)

  1. Podaj i objaśnij podstawowe równanie klasycznej teorii testów H. Gulliksena.

    1. X = T + E

    2. X - wynik obserwowany

    3. T - wynik prawdziwy

    4. E - błąd pomiaru

    1. Założenia:

      1. ME = 0 (założenie o nieobciążalności narzędzia pomiarowego)

      2. rET = 0 ( założenie o niezależności)

      3. r E1E2 = 0

  1. Podaj definicję rzetelności testu.

Rzetelność testu-podstawowa właściwość testu psychologicznego, która informuje jego uzytkownika o dokładności(precyzji), z jaką test mierzy daną zmienną(przy czym nie bierze się pod uwagę, czy test mierzy rzeczywiście tą zmienną; ->trafność)

  1. Jakie są trzy podstawowe sposoby rozumienia rzetelności testu?

  1. stabilność w czasie- może byś względna lub bezwzględna, w zależności od metody pomiaru rzetelności. Stabilność bezwzględna związana jest z metodą pomiaru rzetelności typu test- retest, oraz w metodzie testów równoległych przy pomiarze tych samych osób w odstępstwie czasu (od 2 tyg. Do 2 miesięcy). Źródłem błędu jest brak stabilności testu w czasie.

  2. Wiarygodność testu- związana jest z badaniem tych samych osób tą samą metodą bez przerwy czasowej, źródłem błędu mogą być czynniki losowe związane z osobą badaną. Tzn.: jeśli badamy osoby bez odstępstwa czasu, to mogą nauczyć się testu, bądź stracić motywację do jego powtórnego dokonania (fluktuacja uwagi- nie zainteresowanie, znudzenie, lub wykorzystanie którejś ze strategi udzielenia odpowiedzi)

  3. Równoważność testu- związana jest z testami równoległymi czyli badaniem tych samych osób za pomocą testów mierzących tą samą właściwość w ten sam sposób z tą różnicą, że testy równoległe różnicują testy samych zadań. Tzn. Źródłem błędu może być treść pytań.

  1. Co to są testy równoległe?

. Testy równoległe są to testy, które mierzą tę samą właściwość w ten sam sposób; pytania zawarte w testach równoległych pochodzą z tego samego uniwersum, czyli wywodzą się z tej samej definicji, ale różnicuje je treść zadań. Aby testy można było uznać za równoległe spełnione muszą zostać trzy warunki:

  1. Jakie są wady technik obliczania rzetelności opartych na dwukrotnym testowaniu tej samej grupy osób?

Nie jest to pożądana technika badania rzetelności, bowiem możliwy jest wpływ różnych czynników ubocznych, takich jak zapamiętywanie, uczenie się, ewentualne różnice w warunkach badania itp., stawia pod znakiem zapytania adekwatność założenia o równoległości. Założenie to było podstawą wprowadzenia koncepcji rzetelności. Technika ta daje się zaakceptować w wypadku testów motorycznych czy różnicowania sensorycznego(testów, w których zakłada się, że powtarzalność nie ma istotnego wpływu na wyniki), jednak dla większości testów psychologicznych poszukać musimy innej techniki szacowania rzetelności. Trzeba pamiętać, że powtórzone testy bez przerwy czasowej ujawniają wpływ czynników ubocznych (np. wyćwiczenie), a testy z przerwą muszą mieć dobrze wycyrkulowany czas przerwy, bo to też wpływa na jakość wyników otrzymanych przez badanych(np. zmiana rozwojowa badanego).

  1. Co to jest błąd standardowy pomiaru i do czego służy?

Błąd standardowy jest to odchylenie standardowe różnic X - T (X- wynik obserwowany; T -wynik prawdziwy). Jest to błąd, który popełniamy wtedy, kiedy przyjmujemy, że wynikiem prawdziwym dane osoby jest średni wynik, jaki uzyskałaby ona w nieskończenie wielu pomiarach tym samym testem. Błąd ten wynosi: SEM=Sx√1-ru
Błąd standardowy służy do oceny precyzji naszych wniosków o wyniku prawdziwym osoby badanej.

  1. Jak należy interpretować przedział ufności dla wyniku otrzymanego?

  1. W jaki sposób wykorzystuje się informacje o błędzie standardowym różnicy? Jakie decyzje diagnostyczne wymagają uwzględnienia błędu standardowego różnicy?

a) Wykorzystuje się w ocenie rzetelności różnic między dwoma wynikami. Zgodnie z kryteriami decyzyjnymi: jeżeli różnica obliczona jest równa bądź większa od różnicy minimalnej, to jest ona istotna statystycznie(ma znaczenie diagnostyczne)

W skład różnicy minimalnej wchodzi wynik błędu standardowego różnicy. I w zależności od rodzaju sytuacji stosujemy 1 z 3 wzorów.

b) Decyzje związane z selekcją(szczególnie w wyniku analizy konfiguracyjnej profilu.

  1. Czy interpretując wyniki testowe można się odwoływać do innych źródeł niż podręcznik testowy? Wypowiedź uzasadnij.

Interpretując wynik testowy należy odwoływać się do podręcznika ponieważ:

a) w podręczniku znajduje się teoria na bazie której powstały wszystkie pozycje testowe np: mierząc testem Wais-R i testem Ravena osobę badaną, mierzymy w obu przypadkach inteligencje z tym, że w każdym z testów mierzymy inteligencje inaczej rozumianą.

b) w podr. Znajduje się grupa normalizacyjna w stosunku do której możemy przyrównać badane osoby. Np: inne normy mogą być dla kobiet, inne dla mężczyzn i różnych grup wiekowych, zależności co chcemy mierzyć.

c) w podr. Znajdują się sposoby badania rzetelności, czyli możemy się dowiedzieć jakie źródło błędu zostało przebadane.

d) w podr. Znajduje się klucz poprawnych odpowiedzi oraz sposób obliczania wyników.

e) w podr. Znajdują się przedziały ufności dla tego specyficznego narzędzia pomiaru.

  1. Wyjaśnij różnice w rozumieniu następujących pojęć: trafność wewnętrzna, trafność kryterialna, trafność teoretyczna, trafność fasadowa.

Trafność wewnętrzna in. logiczna, treściowa - to trafność dotycząca treści pytań.

Trafność treściowa pozwala nam określić na ile treść naszych pytań należy do uniwersum - czyli do definicji konstruktu, który chcemy mierzyć. Drugim ważnym aspektem związanym z trafnością treściową jest reprezentatywność, rozumiana jako proporcjonalność pozycji zawartych w teście w stosunku do uniwersum.

Trafność kryterialna - mówi nam o obszarze zastosowania naszego testu, pozwala wyjść poza konwencjonalne stosowanie testu, za pomocą trafności kryterialnej możemy określić jakie inne zachowania nie związane z zasadniczym pomiarem możemy diagnozować/ przewidywać na podstawie wyników uzyskanych naszym testem

Trafność teoretyczna - mówi nam jak dobrze pozycje testowe zawarte w naszym teście odnoszą się do teorii, z której się wywodzą

Trafność fasadowa - to trafność bezpośrednio związana z osoba badaną; trafność ta opisuje to co test wydaje się mierzyć osobom badanym, określa więc jak spostrzegają test osoby badane i czy ich zdaniem test jest adekwatny do określonego celu

  1. Jakie znasz sposoby wyeliminowania zjawiska kontaminacji kryterium?

- Badanie osoby badanej przez dwa różne sposoby

- Nie informowanie osoby badanej o wynikach uzyskanych przez osobę badana w innych testach

  1. Jakie znasz rodzaje trafności kryterialnej?

  1. Trafność diagnostyczna - charakteryzuje się tym, że kryterium dla ocenianego testu, jest pomiar zachowania lub cechy aktualnie występującej u osoby badanej.

  2. Trafność prognostyczna - charakteryzuje się tym, że kryterium dla ocenianego testu jest pomiar zachowania lub cechy występującej w przyszłości u osoby badanej.

Różnica pomiędzy trafnością diagnostyczną, a trafnością prognostyczną nie polega na różnicy w czasie zbierania danych kryterialnych, lecz na tym, że różne są przedmioty badania: przy diagnozie obchodzi nas stwierdzenie stanu istniejącego, przy prognozie - prawdopodobieństwo wystąpienia pewnych skutków stanu aktualnego.

  1. W jaki sposób można oszacować trafność teoretyczną testu?

Trafność teoretyczna jest oceną stopnia, w jakim dany test odzwierciedla cechę psychologiczna, która ma być przedmiotem pomiaru.

  1. Wyjaśnij pojęcie normy statystycznej?

Norma statystyczna-to co jest opisywane jako „zachowanie większości” czy jako „zachowanie średnie lub przeciętne”. Norma nie ozn. Standardu „dobrego” wykonania testu; norma opisuje poziom typowego wykonania testu przez osoby należące do określonej grupy.

  1. Dlaczego normy powinny być aktualne, adekwatne i reprezentatywne?

adekwatne- aby móc porównać osobę badana do grupy odniesienia( gr. Normalizacyjnej). Osoba badana musi należeć do grupy odniesienia ( musi być do niej podobna)

aktualne- np: nie możemy porównać młodzieży z 1965 roku do młodzieży współczesnej.

Reprezentatywne- jak dla mnie to jest taka sama odpowiedź jak w adekwatnym,, ale prawdopodobnie się mylę:)

  1. Co oznacza termin normy lokalne? Czy normy te różnią się od norm ogólnokrajowych?

Normy lokalne to normy dla wąsko zdefiniowanej populacji, ich użycie związane jest ze specyficznym, określonym wykorzystaniem danego testu, np. przyjmujemy osoby do pracy i nie interesuje nas porównanie do całej populacji Polaków, ale interesuje nas porównanie tychże osób do wąsko zdefiniowanej populacji osób starających się o pracę do danej organizacji na dane stanowisko

Normy ogólnokrajowe umożliwiają porównanie wyników otrzymanych przez konkretną osobę do wyników reprezentatywnych dla całego kraju (porównanie np. własnej płacy ze średnią krajową)

  1. Próba normalizacyjna dla testu wiadomości składała się z maturzystów liceów ogólnokształcących z 1964 roku. Określ przydatność norm dla: a) maturzystów z 1965 roku; b) absolwentów szkoły dla głuchoniemych z 1964 roku; c) maturzysty z 1964 roku, który dwukrotnie powtarzał klasę; d) ucznia, który ze względu na wybitne zdolności ukończył szkołę w wieku o dwa lata niższym.

  1. Jakie informacje należy podać o normach, aby można je było właściwie wykorzystywać i dlaczego?

a) informacje dotyczące reprezentatywności próby do której będziemy odnosić wynik badanego (sposób doboru próby czy: losowy - wiadomo, warstwowy - dzielimy populacje na warstwy i z każdej warstwy niezależne losowanie określonej liczby osób, kwotowy - polega na uzyskaniu jak najbardziej maksymalnym podobieństwie do populacji wyjściowej?)
dlaczego?
ponieważ jest rzeczą oczywistą, że struktura próby osób badanych powinna, tak dalece jak jest to możliwe, odzwierciedlać strukturę populacji, dla której test ten jest przeznaczony

b) informacje dotyczące wielkości próby
dlaczego?
ponieważ reprezentatywność próby zależy nie tylko od procedury wyboru osób, które wchodzą w jej skład, ale także od jej wielkości. Gdy próba jest zbyt mała, należy zachować szczególną ostrożność przy wykorzystywaniu danych normalizacyjnych do porównań w sytuacjach decyzyjnych.

c) informacje dotyczące roku w którym dane zostały zebrane
dlaczego?
ponieważ nawet jeśli dane zostały zebrane na dobrej próbie, lecz miało to miejsce dawno temu, to mogą one przyczynić się do błędnych interpretacji. (jeśli mija termin 15 lat - podchodzimy ostrożnie)

  1. Czy wynik testowy równy 80T równy jest 80 centylowi? Dlaczego?

  1. Dlaczego skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii?

Skala T jest skalą długą i stosujemy ją, gdy ważne jest różnicowanie w obrębie bardzo skrajnych wyników(patologia w sensie bardzo skrajny-nie w sensie patologia kliniczna).

  1. Dlaczego standardowe skale norm są tak bardzo popularne?

Są popularne ponieważ są najbardziej precyzyjne, łatwe do interpretacji, ponieważ odnoszą się do rozkładu normalnego, którego właściwości są dobrze znane, i dobrze czytelne ( precyzyjne ).

  1. Dlaczego normalizacja rozkładu jest krokiem niezbędnym przy przeliczaniu wyników surowych na którąś ze skal standardowych?

Normalizacja rozkładu jest zabiegiem istotnym, ponieważ zdecydowanie ułatwia nam interpretacje wyniku. W ten sposób każdy wynik standardowy możemy interpretowac w oparciu o właściwości dobrze znanego i przejrzystego rozkładu normalnego. Zabieg normalizacji rozkładu nie zaburza proporcji wyników surowych, przenosi tylko w odpowiednich proporcjach wyniki na rozkład normalny. Dzięki normalizacji rozkładu możemy dalej przeliczyć nasze wyniki surowe na wybraną przez siebie skalę.

  1. Dlaczego obliczamy moc dyskryminacyjną przed włączeniem zadań do ostatecznej wersji testu?

  1. Jakich specyficznych informacji dostarcza analiza zadań?

Analiza zadań obejmuje 3 etapy:
- analizę językowa
- analizę treściową
- analizę statystyczną

Specyficzne informacje:

a) Współczynnik trudności - stosujemy, gdy jest poprawna odpowiedź. Pozwala nam podjąć decyzję o tym, które pozycje testowe mogą wejść do ostatecznej wersji testu.
T = ni : N = pi * 100%
T - wskaźnik trudności ;
ni- liczba osób która udzieliła prawidłowej odpowiedzi
N- ogólna liczba osób która udzieliła odpowiedzi
Inaczej mówiąc jest to proporcja , które poprawnie odpowiedziały na daną pozycję testową (pi)

b) Współczynnik mocy dyskryminacji - to stopień, w jakim dana pozycja testowa różnicuje badaną populację w zakresie zachowania, który dany test ma mierzyć.

  1. Jakie znasz sposoby szacowania wielkości mocy dyskryminacyjnej zadań? Czym one się różnią między sobą?

Współczynnik mocy dyskryminacyjnej to stopień, w jakim dana pozycja testowa różnicuje badaną populację w zakresie zachowania, które dany test ma mierzyć. Zależy on od rodzaju populacji, z której porano próbę.