Stopień rzetelności testu ustala się w różny sposób. Najczęściej poprzez wspomniane już porównanie wyników testu podczas dwukrotnego jego zastosowania wobec tej samej grupy osób. Innym sposobem jest szukanie zbieżności wyników danego testu z wynikami innych metod badań, podobnie jak ma to miejsce w ocenianiu trafności testu. Wygodnym sposobem oceny stopnia rzetelności testu jest szukanie jego współczynnika w ramach jednorazowych badań testowych (będzie o tym mowa w związku z przedstawieniem ilościowej analizy zadań testowych). Niezależnie od zasygnalizowanych wyżej metod ustalenia stopnia rzetelności testu jest on tym wyższy, im wyższa zachodzi korelacja np. między powtórzonymi badaniami tego samego testu a wynikami różnych metod badań. Niski stopień korelacji nie potwierdza rzetelności testu.
Na ogół przyjmuje się. że test jest rzetelny tylko wówczas, gdy współczynnik korelacji dwóch kolejnych badań, za pomocą danego testu, nic jest mniejszy aniżeli *0,75. Niektórzy psychologowie twierdzą, że nic powinien być mniejszy niż • 0.90 (li.R. Hilgard, 1967. s. 585). Jest to bardzo wysoka korelacja świadcząca o niezwykle dużym stopniu rzetelności testu. W przypadku testów osiągnięć szkolnych, stosowanych obecnie u nas w szkołach, wydaje się to wprost nieprawdopodobne. Nie należy oczywiście „nigdy oczekiwać wyniku korelacji równej I. ponieważ działanie czynnika czasu musi siłą naturalnej konieczności modyfikować uzyskane wyniki pomiarów" (W.P. Zaczyński, 1995, s. 113). Zadowalający współczynnik korelacji wynosi f0,70 lub więcej.
Warto w tym miejscu nadmienić również, że stopień rzetelności testu pozostaje w ścisłym związku z jego obiektywnością. 1o znaczy, że im większą posiada rzetelność, tym otrzymane za jego pomocą wyniki są bardziej niezależne od osoby badającej. Niski stopień rzetelności świadczy z reguły nic tylko o wadliwej konstrukcji testu, lecz także o znacznym wpływie subiektywnych cech osób badających na końcową ocenę wyniku testowania.
Normalizacja testu polega na opracowaniu specjalnych norm. umożliwiających odpowiednią interpretację uzyskanych wyników testowych. Mają one z jednej strony ułatwić dokonanie klasyfikacji osób badanych według poprawnie rozwiązanych przez nich zadań testowych (normy empiryczne), z drugiej - porównanie osiągnięć szkolnych uczniów z wymaganiami programowymi (normy wymagań). W tym celu należy zastosować test odpowiednio opracowany pod względem jego trafności i rzetelności wobec większej liczby uczniów, której wielkość może kształtować się w granicach od kilkudziesięciu do kilkuset, a nawet i więcej osób. Zależy ona od rodzaju materiału badawczego. Im bardziej reprezentatywny jest ów materiał, tym wystarczy mniejsza liczba osób badanych i na
odwrót. Sl:\tł też testy osiągnięć szkolnych, przeznaczone dla uczniów jednego poziomu nauczania, mogą być znormalizowane na dużo mniejszej liczbie osób niż. testy, które mają być zastosowane wobec uczniów kilku klas. np. 1 -111 lub V-Vl
Liczba uwzględnionych osób podczas normalizacji testów powinna być tak wielka, aby przedstawione w postaci wykresu wyniki badań testowych były zbliżone do normalnej krzywej rozkładu, tzn. takiej krzywej, której najwyższy punkt leży w środku rozkładu, a po obu stronach tego punktu liczebności stopniowo opadają (poi J.P. Guilford, 1960. s. 138- 143). Tak na przykład gdyby w wyniku badań testem złożonym z 50 zadań, rozkład jego rezultatów był zbliżony do krzyw ej normalnej, wówczas najwyżej można by ocenić uczniów, którzy rozwiązali 40 50 zadań, najgorzej zaś uczniów, którzy rozwiązali 1-10 zadań, średnio oceniać należałoby uczniów, którzy rozwiązali 20 30 zadań itp.
Normalizacja testu nic jest bynajmniej łatwa. Oprócz zestawienia wyników badań i odpowiedniego ich zgrupowania—jak to wynika z podanego pwyżej przykładu wymaga zastosowania różnych obliczeń statystycznych. Opierając sic na tych obliczeniach opracowuje się normy dla danej populacji. Końcowym etapem normalizacji testu jest sprawdzenie ustalonych norm w dalszych próbnych badaniach. Teraz dopiero przystępujemy do badań właściwych (Z. Palcski, 1965. s 143)
Normalizacja testu jest konieczna zarówno wtedy, gdy konstruuje się now y test. jak również i w przypadku posługiwania się testem nieprzystosow anym do warunków, w jakich ma być zastosowany lub osób. których ma dotyczyć. Stąd norm uzyskanych w badaniu na jednej grupie osób nic można przenosić automatycznie na grupę osób z innej populacji. W grupie takiej mogą obowiązywać zupełnie inne normy. Przeto rzeczą niedopuszczalną jest bezkrytyczne stosow anie np. testów i norm amerykańskich w naszych szkołach lub też testów opracowanych u nas dla dzieci ze środowiska miejskiego w szkołach wiejskich.
Standaryzacja testu oznacza jego wysoki poziom rzetelności i trafności, łącznie z opracowywanymi normami, a ponadto .jednolitość postępowania przy badaniu. mającą na celu zmniejszenie do minimum zależności wyników od osoby badającej i od zewnętrznych warunków badania” (M. Choynowski, 1959. s. 156). Tak szerokie rozumienie standaryzacji nic przez wszystkich jest uznawane. Według niektórych teoretyków, miarą wystandaryzowanych testów jest przede wszystkim jednolita instrukcja, jaką stosuje badacz w toku posługiwania się nimi, oraz dokładnie określone zasady oceny i interpretacji otrzymanych wyników.
Obecnie przyjmuje się na ogól, iż test odpowiednio wystandaryzowany odznacza się dużym stopniem zobiektywizowania wyników testowych, tzn. jest wystarczająco rzetelny i trafny oraz odpowiednio znormalizowany i w trakcie
149