Spis zagadnień egzaminacyjnych
rok akademicki 2006/2007
Omów cechy charakterystyczne testów psychologicznych
- Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena
- Jest to sytuacja tworzona specjalnie dla celów diagnostycznych, w której wywołuje się zachowania typowe pod względem tej charakterystyki jaka ma być przedmiotem celowej obserwacji
- Jest to sytuacja, która od diagnosty nie wymaga osobistego zaangażowania i w której jasno jest określony zakres i rodzaj dopuszczalnych zachowań
Jakie znasz przykłady testów psychologicznych?
. Jakie są kryteria dobrego testu?
Obiektywność: nienaruszalność wyników testowania od osób, które te wyniki oceniają; test musi posiadać jasno określony klucz oceniania odpowiedzi, zmniejszający do minimum wpływ subiektywnych interpretacji (niezależnie od tego kto, gdzie i kiedy dokonuje oceny wyników tego samego testu, wykonywanego przez tę samą osobę, powinien otrzymać takie same rezultaty).
Standaryzacja: jednolitość warunków badania; aby wyniki danego testu można było ze sobą porównać, dany test powinien zawsze być przeprowadzony w identycznych warunkach; powinna być identyczna instrukcja.
Rzetelność: dokładność pomiaru; wielkość błędu jaki popełnia psycholog interpretując wyniki danego testu; mówi nam ona o tym, w jakim stopniu wynik danego testu odzwierciedla poziom mierzonej cechy u danej osoby, a nie wpływ czynników losowych.
Trafność: obszar zastosowania testu; decyduje o tym, czy dany test możemy wykorzystywać w taki, a nie inny sposób; mówi czy można poprawnie wnioskować na podstawie wyniku testowego.
Normalizacja: nadawanie znaczenia wynikom testowym; podstawą interpretacji wyników testowych jest zawsze jakiś układ odniesienia; podstawą formułowania wniosków o właściwościach psychologicznych osób badanych jest zawsze ocena tego, jak badana osoba wypadła na tle innych osób; normalizacja to procedura tworzenia zbiorów, w specjalny sposób przetworzonych, wyników testu dla osób o określonych właściwościach zdefiniowanych za pomocą kryteriów zewnętrznych.
Właściwa adaptacja: dopasowanie testu do warunków polskich; adaptacja to proces przystosowywania wersji pierwotnej do specyfiki kultury lokalnej i nie sprowadza się ona jedynie do właściwego przetłumaczenia tekstu oryginalnego.
Dlaczego standaryzacja testu jest zabiegiem szczególnie ważnym? Wskaż przynajmniej dwa aspekty w procedurze badania testem, które wymagają wystandaryzowania. Dlaczego?
. Standaryzacja testu jest zabiegiem związanym z ujednolicaniem warunków badania dla każdej osoby badanej. Jest to zabieg bardzo ważny dlatego że, jeśli zachowamy zasady standaryzacji to różnice w uzyskanych wynikach pomiędzy osobami badanymi możemy przypisać czynnikom indywidualnym a nie czynnikom związanym z zewnętrznymi warunkami badania. Standaryzacja przede wszystkim służy nam abyśmy mieli możliwość porównania wyników. Zabieg standaryzacji może dotyczyć:
instrukcji dla osoby badanej: w każdym przypadku; dla każdej osoby badanej instrukcja dot. testu musi być taka sama. Jeśli np. w instrukcji jest informacja dotycząca limitu czasowego na wykonanie testu i jedna osoba otrzyma taką informację, a druga osoba nie otrzyma, wyników nie możemy porównywać ze sobą; różnice pomiędzy osobami mogą w takim wypadku być związane z owym limitem czasu- inaczej rozwiązujemy test na czas, a inaczej bez limitu czasowego
pomocy testowych: tj. materiały dodatkowe czy arkuszy odpowiedzi. Przykładowo jedna z pomocy do zadania jest to test rysunkowy polegający na dostrzeżeniu w jak najszybszym czasie różnic pomiędzy obrazkami. W oryginalnej wersji rysunki są czytelne i przejrzyste. Diagnosta nie posiadając oryginałów, daje osobie badanej ksero rysunku, które jest zamazane i bardzo nieczytelne. Osoba badana nie dojrzała na rysunku kilku detali tylko dlatego, że były nieczytelne. Nie możemy więc porównywać jej wyników z wynikami osoby, która otrzymała arkusz oryginalny.
Jaka jest różnica pomiędzy testem obiektywnym a testem wystandaryzowanym?
TEST WYSTANDARYZOWANY - posiada dokładnie sprecyzowane zasady stosowania go oraz jest wyposażony w normy, otrzymane w wyniku przebadania reprezentatywnej próby pochodzącej z populacji, dla której test ma być stosowany. Normy te są podstawą do interpretacji wyników otrzymanych przez osoby badane.
TEST OBIEKTYWNY - posiada starannie opracowane, stale metody obliczania wyników, że sam wynik może zostać obliczony nawet przez osobę bez przygotowania psychologicznego
Opisz swoimi własnymi słowami co rozumiesz przez "rzetelność testu".
Rzetelność oznacza zgodność wyników otrzymanych przez te same osoby, które zostały przebadane kilka razy tym samym testem. (W psychometrii termin rzetelność oznacza powtarzalność wyników.)
Podaj i objaśnij podstawowe równanie klasycznej teorii testów H. Gulliksena.
X = T + E
X - wynik obserwowany
T - wynik prawdziwy
E - błąd pomiaru
Założenia:
ME = 0 (założenie o nieobciążalności narzędzia pomiarowego)
rET = 0 ( założenie o niezależności)
r E1E2 = 0
przyjmując to równanie jako podstawę naszego wnioskowania, widzimy wyraźnie, że wynik otrzymany w teście (X) nie ma w zasadzie żadnego praktycznego znaczenia, na jego podstawie trudno cokolwiek orzekać o prawdziwej wartości mierzonej cechy, gdyż wynik prawdziwy i błąd pomiaru są ze sobą nierozerwalnie związane
Podaj definicję rzetelności testu.
Rzetelność testu-podstawowa właściwość testu psychologicznego, która informuje jego uzytkownika o dokładności(precyzji), z jaką test mierzy daną zmienną(przy czym nie bierze się pod uwagę, czy test mierzy rzeczywiście tą zmienną; ->trafność)
Jakie są trzy podstawowe sposoby rozumienia rzetelności testu?
stabilność w czasie- może byś względna lub bezwzględna, w zależności od metody pomiaru rzetelności. Stabilność bezwzględna związana jest z metodą pomiaru rzetelności typu test- retest, oraz w metodzie testów równoległych przy pomiarze tych samych osób w odstępstwie czasu (od 2 tyg. Do 2 miesięcy). Źródłem błędu jest brak stabilności testu w czasie.
Wiarygodność testu- związana jest z badaniem tych samych osób tą samą metodą bez przerwy czasowej, źródłem błędu mogą być czynniki losowe związane z osobą badaną. Tzn.: jeśli badamy osoby bez odstępstwa czasu, to mogą nauczyć się testu, bądź stracić motywację do jego powtórnego dokonania (fluktuacja uwagi- nie zainteresowanie, znudzenie, lub wykorzystanie którejś ze strategi udzielenia odpowiedzi)
Równoważność testu- związana jest z testami równoległymi czyli badaniem tych samych osób za pomocą testów mierzących tą samą właściwość w ten sam sposób z tą różnicą, że testy równoległe różnicują testy samych zadań. Tzn. Źródłem błędu może być treść pytań.
Co to są testy równoległe?
. Testy równoległe są to testy, które mierzą tę samą właściwość w ten sam sposób; pytania zawarte w testach równoległych pochodzą z tego samego uniwersum, czyli wywodzą się z tej samej definicji, ale różnicuje je treść zadań. Aby testy można było uznać za równoległe spełnione muszą zostać trzy warunki:
średnie w obydwu testach powinny być takie same
odchylenia standardowe w obydwu testach powinny być takie same
korelacje pomiędzy jednym testem a pewną zmienną Z powinny być takie same jak korelacje pomiędzy drugim testem a tą samą zmienną Z
Jakie są wady technik obliczania rzetelności opartych na dwukrotnym testowaniu tej samej grupy osób?
Nie jest to pożądana technika badania rzetelności, bowiem możliwy jest wpływ różnych czynników ubocznych, takich jak zapamiętywanie, uczenie się, ewentualne różnice w warunkach badania itp., stawia pod znakiem zapytania adekwatność założenia o równoległości. Założenie to było podstawą wprowadzenia koncepcji rzetelności. Technika ta daje się zaakceptować w wypadku testów motorycznych czy różnicowania sensorycznego(testów, w których zakłada się, że powtarzalność nie ma istotnego wpływu na wyniki), jednak dla większości testów psychologicznych poszukać musimy innej techniki szacowania rzetelności. Trzeba pamiętać, że powtórzone testy bez przerwy czasowej ujawniają wpływ czynników ubocznych (np. wyćwiczenie), a testy z przerwą muszą mieć dobrze wycyrkulowany czas przerwy, bo to też wpływa na jakość wyników otrzymanych przez badanych(np. zmiana rozwojowa badanego).
Co to jest błąd standardowy pomiaru i do czego służy?
Błąd standardowy jest to odchylenie standardowe różnic X - T (X- wynik obserwowany; T -wynik prawdziwy). Jest to błąd, który popełniamy wtedy, kiedy przyjmujemy, że wynikiem prawdziwym dane osoby jest średni wynik, jaki uzyskałaby ona w nieskończenie wielu pomiarach tym samym testem. Błąd ten wynosi: SEM=Sx√1-ru
Błąd standardowy służy do oceny precyzji naszych wniosków o wyniku prawdziwym osoby badanej.
Jak należy interpretować przedział ufności dla wyniku otrzymanego?
Przedział ufności mówi nam o tym, w jakim przedziale i z jakim prawdopodobieństwem w tym przedziale mieści się wynik prawdziwy
Standardowy błąd pomiaru wykorzystywany jest do budowy przedziału ufności dla wyniku otrzymanego w teście
Ufność 1 - α wyrażana w procentach np. gdy α=0,05 to ufność 95% ( z 95% pewnością w danym przedziale mieści się prawdziwy wynik)
x - zα/2 SEM dolna granica przedziału ufności
x + zα/2 SEM górna granica przedziału ufności
z - dookreśla poziomu ufności wnioskowania
Przedział ufności musi być dwustronny
α - dobiera się w zależności od interesującego nas przedziału ufności (np. gdy 95% to α=0,05)
wartości zα/2 dla różnych przedziałów ufności
dla 85% zα/2 = 1,44
dla 90% zα/2 = 1,64
dla 95% zα/2 = 1,96
dla 99% zα/2 = 2,56
im szerszy przedział ufności tym mniej precyzyjne diagnozy
zadawalający poziom precyzji wnioskowania wynosi 85%
W jaki sposób wykorzystuje się informacje o błędzie standardowym różnicy? Jakie decyzje diagnostyczne wymagają uwzględnienia błędu standardowego różnicy?
a) Wykorzystuje się w ocenie rzetelności różnic między dwoma wynikami. Zgodnie z kryteriami decyzyjnymi: jeżeli różnica obliczona jest równa bądź większa od różnicy minimalnej, to jest ona istotna statystycznie(ma znaczenie diagnostyczne)
W skład różnicy minimalnej wchodzi wynik błędu standardowego różnicy. I w zależności od rodzaju sytuacji stosujemy 1 z 3 wzorów.
b) Decyzje związane z selekcją(szczególnie w wyniku analizy konfiguracyjnej profilu.
Czy interpretując wyniki testowe można się odwoływać do innych źródeł niż podręcznik testowy? Wypowiedź uzasadnij.
Interpretując wynik testowy należy odwoływać się do podręcznika ponieważ:
a) w podręczniku znajduje się teoria na bazie której powstały wszystkie pozycje testowe np: mierząc testem Wais-R i testem Ravena osobę badaną, mierzymy w obu przypadkach inteligencje z tym, że w każdym z testów mierzymy inteligencje inaczej rozumianą.
b) w podr. Znajduje się grupa normalizacyjna w stosunku do której możemy przyrównać badane osoby. Np: inne normy mogą być dla kobiet, inne dla mężczyzn i różnych grup wiekowych, zależności co chcemy mierzyć.
c) w podr. Znajdują się sposoby badania rzetelności, czyli możemy się dowiedzieć jakie źródło błędu zostało przebadane.
d) w podr. Znajduje się klucz poprawnych odpowiedzi oraz sposób obliczania wyników.
e) w podr. Znajdują się przedziały ufności dla tego specyficznego narzędzia pomiaru.
Wyjaśnij różnice w rozumieniu następujących pojęć: trafność wewnętrzna, trafność kryterialna, trafność teoretyczna, trafność fasadowa.
Trafność wewnętrzna in. logiczna, treściowa - to trafność dotycząca treści pytań.
Trafność treściowa pozwala nam określić na ile treść naszych pytań należy do uniwersum - czyli do definicji konstruktu, który chcemy mierzyć. Drugim ważnym aspektem związanym z trafnością treściową jest reprezentatywność, rozumiana jako proporcjonalność pozycji zawartych w teście w stosunku do uniwersum.
Trafność kryterialna - mówi nam o obszarze zastosowania naszego testu, pozwala wyjść poza konwencjonalne stosowanie testu, za pomocą trafności kryterialnej możemy określić jakie inne zachowania nie związane z zasadniczym pomiarem możemy diagnozować/ przewidywać na podstawie wyników uzyskanych naszym testem
Trafność teoretyczna - mówi nam jak dobrze pozycje testowe zawarte w naszym teście odnoszą się do teorii, z której się wywodzą
Trafność fasadowa - to trafność bezpośrednio związana z osoba badaną; trafność ta opisuje to co test wydaje się mierzyć osobom badanym, określa więc jak spostrzegają test osoby badane i czy ich zdaniem test jest adekwatny do określonego celu
Jakie znasz sposoby wyeliminowania zjawiska kontaminacji kryterium?
- Badanie osoby badanej przez dwa różne sposoby
- Nie informowanie osoby badanej o wynikach uzyskanych przez osobę badana w innych testach
Jakie znasz rodzaje trafności kryterialnej?
Trafność diagnostyczna - charakteryzuje się tym, że kryterium dla ocenianego testu, jest pomiar zachowania lub cechy aktualnie występującej u osoby badanej.
Trafność prognostyczna - charakteryzuje się tym, że kryterium dla ocenianego testu jest pomiar zachowania lub cechy występującej w przyszłości u osoby badanej.
Różnica pomiędzy trafnością diagnostyczną, a trafnością prognostyczną nie polega na różnicy w czasie zbierania danych kryterialnych, lecz na tym, że różne są przedmioty badania: przy diagnozie obchodzi nas stwierdzenie stanu istniejącego, przy prognozie - prawdopodobieństwo wystąpienia pewnych skutków stanu aktualnego.
W jaki sposób można oszacować trafność teoretyczną testu?
Trafność teoretyczna jest oceną stopnia, w jakim dany test odzwierciedla cechę psychologiczna, która ma być przedmiotem pomiaru.
Analiza różnic międzygrupowych: procedura testowania hipotez o różnym zachowaniu się dwóch grup; hipotezy te wyprowadzane są z teorii mierzonej cechy a badane grupy różnią się ze względu na ogólny wynik w teście (grupa o niskich wynikach vs. grupa o wysokich wynikach)
Analiza macierzy korelacji: ocena trafności teoretycznej na podstawie wysokości współczynników korelacji z podobnymi testami (wysokie) i współczynnikami korelacji z testami mierzącymi inne cechy (niskie); zwłaszcza macierzy „wielu cech - wielu metod” Campbella i Fiskiego
Analiza czynnikowa: wykrywanie czynników odpowiedzialnych za współzmienność wyników testów korelujących ze sobą
Analiza struktury wewnętrznej testu: jeśli można przyjąć w świetle teorii, że mierzona cecha jest cechą homogeniczną, to wysoki współczynnik zgodności wewnętrznej może być traktowany jako dowód trafności teoretycznej
Analiza zmian nieprzypadkowych wyników testu: porównywanie wyników dwukrotnego badania tym samym testem; w przerwie między badaniami wprowadza się manipulację eksperymentalną, wyprowadzoną z teorii mierzonej cechy; wynik porównania powinien być zgodny z założonymi efektami manipulacji
Analiza procesu rozwiązywania testu: gdy test zawiera zadania do rozwiązania lub polecenia do wykonania, to obserwacja kolejności wykonywanych czynności, elementów zadania sprawiających najwięcej trudności, elementów pomijanych, popełnianych błędów dostarcza informacji o mierzonym konstrukcje.
Wyjaśnij pojęcie normy statystycznej?
Norma statystyczna-to co jest opisywane jako „zachowanie większości” czy jako „zachowanie średnie lub przeciętne”. Norma nie ozn. Standardu „dobrego” wykonania testu; norma opisuje poziom typowego wykonania testu przez osoby należące do określonej grupy.
Dlaczego normy powinny być aktualne, adekwatne i reprezentatywne?
adekwatne- aby móc porównać osobę badana do grupy odniesienia( gr. Normalizacyjnej). Osoba badana musi należeć do grupy odniesienia ( musi być do niej podobna)
aktualne- np: nie możemy porównać młodzieży z 1965 roku do młodzieży współczesnej.
Reprezentatywne- jak dla mnie to jest taka sama odpowiedź jak w adekwatnym,, ale prawdopodobnie się mylę:)
Co oznacza termin normy lokalne? Czy normy te różnią się od norm ogólnokrajowych?
Normy lokalne to normy dla wąsko zdefiniowanej populacji, ich użycie związane jest ze specyficznym, określonym wykorzystaniem danego testu, np. przyjmujemy osoby do pracy i nie interesuje nas porównanie do całej populacji Polaków, ale interesuje nas porównanie tychże osób do wąsko zdefiniowanej populacji osób starających się o pracę do danej organizacji na dane stanowisko
Normy ogólnokrajowe umożliwiają porównanie wyników otrzymanych przez konkretną osobę do wyników reprezentatywnych dla całego kraju (porównanie np. własnej płacy ze średnią krajową)
Próba normalizacyjna dla testu wiadomości składała się z maturzystów liceów ogólnokształcących z 1964 roku. Określ przydatność norm dla: a) maturzystów z 1965 roku; b) absolwentów szkoły dla głuchoniemych z 1964 roku; c) maturzysty z 1964 roku, który dwukrotnie powtarzał klasę; d) ucznia, który ze względu na wybitne zdolności ukończył szkołę w wieku o dwa lata niższym.
Jakie informacje należy podać o normach, aby można je było właściwie wykorzystywać i dlaczego?
a) informacje dotyczące reprezentatywności próby do której będziemy odnosić wynik badanego (sposób doboru próby czy: losowy - wiadomo, warstwowy - dzielimy populacje na warstwy i z każdej warstwy niezależne losowanie określonej liczby osób, kwotowy - polega na uzyskaniu jak najbardziej maksymalnym podobieństwie do populacji wyjściowej?)
dlaczego?
ponieważ jest rzeczą oczywistą, że struktura próby osób badanych powinna, tak dalece jak jest to możliwe, odzwierciedlać strukturę populacji, dla której test ten jest przeznaczony
b) informacje dotyczące wielkości próby
dlaczego?
ponieważ reprezentatywność próby zależy nie tylko od procedury wyboru osób, które wchodzą w jej skład, ale także od jej wielkości. Gdy próba jest zbyt mała, należy zachować szczególną ostrożność przy wykorzystywaniu danych normalizacyjnych do porównań w sytuacjach decyzyjnych.
c) informacje dotyczące roku w którym dane zostały zebrane
dlaczego?
ponieważ nawet jeśli dane zostały zebrane na dobrej próbie, lecz miało to miejsce dawno temu, to mogą one przyczynić się do błędnych interpretacji. (jeśli mija termin 15 lat - podchodzimy ostrożnie)
Czy wynik testowy równy 80T równy jest 80 centylowi? Dlaczego?
Parametry skali T: M=50, S=10, liczy 101 jednostek (od 0 do 100); skala o największym zakresie znakomicie nadaje się do różnicowania zarówno bardzo niskich, jak i bardzo wysokich wyników; skala ta obejmuje swoim zasięgiem przedział od -5 do +5 odchyleń standardowych w rozkładzie normalnym
Skala centylowa pozwala na ocenę wyniku danej osoby w stosunku do wyników innych osób należących do określonej populacji; nie odzwierciedla ona jednak kształtu rozkładu wyników surowych; rozkład uzyskany w rezultacie przeliczenia wyników surowych na odsetki jest prostokątny
Centyl oznacza jaki procent osób otrzymuje wyniki gorsze od osoby badanej (80 centyl - 80% osób ma wynik gorsze)
Dlaczego skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii?
Skala T jest skalą długą i stosujemy ją, gdy ważne jest różnicowanie w obrębie bardzo skrajnych wyników(patologia w sensie bardzo skrajny-nie w sensie patologia kliniczna).
Dlaczego standardowe skale norm są tak bardzo popularne?
Są popularne ponieważ są najbardziej precyzyjne, łatwe do interpretacji, ponieważ odnoszą się do rozkładu normalnego, którego właściwości są dobrze znane, i dobrze czytelne ( precyzyjne ).
Dlaczego normalizacja rozkładu jest krokiem niezbędnym przy przeliczaniu wyników surowych na którąś ze skal standardowych?
Normalizacja rozkładu jest zabiegiem istotnym, ponieważ zdecydowanie ułatwia nam interpretacje wyniku. W ten sposób każdy wynik standardowy możemy interpretowac w oparciu o właściwości dobrze znanego i przejrzystego rozkładu normalnego. Zabieg normalizacji rozkładu nie zaburza proporcji wyników surowych, przenosi tylko w odpowiednich proporcjach wyniki na rozkład normalny. Dzięki normalizacji rozkładu możemy dalej przeliczyć nasze wyniki surowe na wybraną przez siebie skalę.
Dlaczego obliczamy moc dyskryminacyjną przed włączeniem zadań do ostatecznej wersji testu?
Jakich specyficznych informacji dostarcza analiza zadań?
Analiza zadań obejmuje 3 etapy:
- analizę językowa
- analizę treściową
- analizę statystyczną
Specyficzne informacje:
a) Współczynnik trudności - stosujemy, gdy jest poprawna odpowiedź. Pozwala nam podjąć decyzję o tym, które pozycje testowe mogą wejść do ostatecznej wersji testu.
T = ni : N = pi * 100%
T - wskaźnik trudności ;
ni- liczba osób która udzieliła prawidłowej odpowiedzi
N- ogólna liczba osób która udzieliła odpowiedzi
Inaczej mówiąc jest to proporcja , które poprawnie odpowiedziały na daną pozycję testową (pi)
b) Współczynnik mocy dyskryminacji - to stopień, w jakim dana pozycja testowa różnicuje badaną populację w zakresie zachowania, który dany test ma mierzyć.
Jakie znasz sposoby szacowania wielkości mocy dyskryminacyjnej zadań? Czym one się różnią między sobą?
Współczynnik mocy dyskryminacyjnej to stopień, w jakim dana pozycja testowa różnicuje badaną populację w zakresie zachowania, które dany test ma mierzyć. Zależy on od rodzaju populacji, z której porano próbę.
Pozycja testowa o dodatniej mocy różnicującej jest częściej rozwiązywana przez badanych o wysokich wynikach testowania, a więc różnicuje badanych w zgodzie z innymi pozycjami testu i zwiększa wariancję wyników testowania
Pozycja testowa o ujemnej mocy różnicującej jest częściej rozwiązywana przez badanych o niskich wynikach testowania, a więc różnicuje badanych przeciwnie niż inne pozycje testu i zmniejsza wariancję wyników testowania.
Wskaźnik dyskryminacji: najprostszy wskaźnik, który może być stosowany tylko w wypadku pozycji dwukategorialnych; wymaga on ustalenia punktu podziału osób badanych na dwie grupy - tzw. dolną grupę (o niskich wynikach w teście) i grupę górną (o wysokich wynikach w teście)
D = pu i pt
D - wskaźnik dyskryminacji, pu -oznacza proporcję odpowiedzi poprawnych w górnej grupie osób badanych, pt - oznacza proporcję odpowiedzi poprawnych w dolnej grupie badanych
Jego słabą stroną jest to, że nieznany jest kształt jego rozkładu z próby i dlatego, że nie możemy określić, jak duża wartość D jest istotnie statystyczna
Założenia:
Jeżeli D>= 0,40 pozycje testową można włączyć do testu
Jeżeli 0,30<=D<=0,39 pozycja testowa wymaga niewielkich zmian
Jeżeli 0,20<=D<=0,29 pozycja testowa ma znaczenie marginesowe i wymaga poważnych zmian
Jeżeli D<= 0,19 pozycja testowa powinna zostać wyeliminowana z testu lub całkowicie zmieniona
Korelacyjne współczynniki mocy dyskryminacyjnej: oparte na analizie korelacji między wynikiem danej pozycji testowej a ogólnym wynikiem w teście; operacyjnym wskaźnikiem pozycji danej osoby względem mierzonego konstruktu jest ogólny wynik w teście; im wyższą dodatnią wartość współczynnika korelacji otrzymamy, tym lepsze właściwości różnicujące, w pożądanym kierunku, będzie posiadała dana pozycja testowa
Współczynnik korelacji dwuseryjnej: może zostać obliczony w sytuacji, w której spełnione są dwa założenia:
rozkład wyników cechy mierzonej przez daną pozycję testową jest zmienną ciągłą o rozkładzie normalnym, a niedoskonałość pomiaru sprawia, że jest zmienną dyskretną
rozkład ogólnych wyników w teście jest rozkładem normalnym
Współczynnik korelacji punktowo - dwuseryjnej: obliczmy go wtedy, kiedy spełnione są następujące założenia:
rozkład wyników cechy mierzonej przez daną pozycję testową jest zmienną dyskretną
rozkład ogólnych wyników w teście jest rozkładem normalnym
Współczynnik korelacji punktowo - czteropolowej: obliczany wtedy, kiedy żadne z wymienionych wyżej założeń nie daje się utrzymać, a więc zarówno wynik pozycji testowej, jaki i ogólny wynik w teście traktowane są jako zmienne dychotomiczne
Analizowanie różnic między skrajnymi grupami: polega na ocenie istotności różnic między średnim wynikiem dla danej pozycji, jaki otrzymano w grupie górnej, i średnim wynikiem dla tej pozycji, jaki otrzymano w grupie dolnej.
1