najwyższego. Następnie odkładamy 27% wyników najniższych i tyle samo wyników najwyższych. Tylko tymi wynikami będziemy się zajmować dalej. Musimy pamiętać, że obliczamy współczynnik mocy dyskryminacyjnej dla każdej pozycji testu oddzielnie. Przy obliczaniu współczynnika dla danej pozycji testu wykonujemy następujące czynności:
1. jeśli nie dysponujemy dwukategorialną skalą odpowiedzi na pozycje testowe musimy sprowadzić naszą skalę do postaci dwukategorialnej (0 i 1). Nie wiemy jednak, gdzie znajduje się empiryczna granica pomiędzy tymi dwiema kategoriami. Nie zależy to od naszej intuicji, lecz od liczby odpowiedzi, jakie wybrali badani. Z tego powodu musimy skorzystać z gotowej formuły, którą podaje Brzeziński. Zasada, na którą się powołuje mówi, że linia graniczna pomiędzy dwiema kategoriami odpowiedzi (0 i 1) powinna być tam, gdzie całkowita suma wyników nad tą linią w dolnej grupie i pod linią w górnej grupie jest najmniejsza.
2. Gdy ustaliliśmy tą granicę, przygotowujemy wartości do podstawienia w tablicy statystycznej Flanagana, z której odczytamy wartość współczynnika mocy dyskryminacyjnej naszej pozycji testu. Teraz identyfikujemy sumy w dolnej i górnej grupie nad linią, czyli dla wagi 1. Wartości te układamy w proporcje odpowiedzi zgodnych z kluczem dla każdej grupy. Na przecięciu tych wartości znajdujemy wartość współczynnika korelacji dwuseryjnej.
Istnieją jeszcze dwa inne współczynniki mocy dyskryminacyjnej: współczynnik korelacji punktowo- czteropolowej ( odczytywany z tablic Jurgensena) oraz współczynnik korelacji punktowo- dwuseryjnej ( odczytywany z Flanagana). Decyzja o wyborze współczynnika zależy m. in. od wielkości badanej próbki oraz od stopnia trudności pozycji.
Przedstawiona powyżej procedura musi być przeprowadzona dla każdej pozycji testu. Jeśli jakaś pozycja uzyska zbyt niski współczynnik mocy dyskryminacyjnej, należy ją usunąć z testu i jeśli to konieczne wprowadzić nową. Postępujemy w ten sposób tak długo, aż test będzie zawierał wszystkie wskaźniki naszej zmiennej reprezentowane proporcjonalnie.
KROK IV- Analiza rzetelności wyniku ogólnego testu
Rzetelność to inaczej dokładność, z jaką wyniki testu mówią nam o badanym w zakresie mierzonej zmiennej.
Każdy wynik składa się z dwóch elementów: elementu prawdziwego i elementu błędu. Elementy te stanowią sumę. Badacz musi dążyć do minimalizacji tego składnika sumy, który jest błędem.
Podsumowując musimy poznać rzetelność naszego testu, abyśmy mieli zaufanie do jego dokładności, czyli do dokładności zbudowanych wskaźników. Należy przyjąć, że najbardziej powszechnym sposobem szacowania rzetelności testu jest obliczanie jego zgodności wewnętrznej, czyli średniej korelacji wszystkich pozycji z wynikiem ogólnym testu. Przyjmuje się, że im bardziej test jest wewnętrznie zgodny, tym bardziej jest dokładny. W takiej bowiem sytuacji zmniejsza się składnik błędu.
KROK V- Analiza trafności testu
Jeśli pytamy o trafność testu, to chcemy wiedzieć, czy mierzy to, co ma mierzyć. Aby to sprawdzić, wystarczy porównać wynik testu w grupie osób badanych z jakimś kryterium zewnętrznym, pozwalającym ocenić tę samą zmienną, którą mierzy test. Ważny jest jednak dobór tego kryterium, bo trzeba mieć pewność, że jest ono trafne. Jeśli tym kryterium będzie zachowanie osoby badanej, to powiemy, że oszacowaliśmy trafność diagnostyczną. Normalizacja testu to procedura podejmowania decyzji, które wyniki surowe testu będą wysokie, a które niskie. Mediana to wartość środkowa szeregu. W statystyce przyjmuje się, że poniżej mediany leżą wyniki niskie, a powyżej wysokie.