40 S ■ IT0B010CI* BADA* MiUKOWrCH I OMMOSTTCZNTCR
(6) Grupa metod opartych na badaniu stopnia zgodności sędziów kompetentnych oceniających odpowiedzi testowe. Badanie rzetelności w tym wypadku polega na odwołaniu się do grupy ekspertów, którzy oceniają przydatność poszczególnych pozycji do pomiaru danej zmiennej. Warunkiem włączenia danej pozycji do testu Jest uzyskanie wysokiej zgodności między sędziami. Mierzy się Ją za pomocą jakiegoś współczynnika - na przykład współczynnika zgodności sędziów kompetentnych W-Kendalla (por. Brzeziński, 1997).
Chcielibyśmy mocno podkreślić, że nie ma jednej, uniwersalnej metody badania rzetelności, która zawsze będzie odpowiednia. Pogłębione badanie rzetelności testu wymaga zastosowania kilku wzajemnie się uzupełniających metod (por. APA, 1985/ /1974, s. 60). Każda z nich bowiem dostarcza innych informacji o teście. Dopiero ich połączenie może dać nam pełny obraz rzetelności testu.
11.2.4
Obok rzetelności trafność jest podstawowym kryterium psychometrycznym dobroci testu. O ile rzetelność związana była z precyzją formalną pomiaru testowego, to trafność związana jest z aspektem treściowym tego pomiaru. Interesuje nas bowiem, Jak dokładnie test mierzy to, do pomiaru czego został skonstruowany. Tak też pojmuje się trafność w różnych opracowaniach psychometrycz-nych. (zob. ramka 11.6).
W jaki sposób bada się trafność testu? Psychometrzy są zgodni co do tego, że pełne zbadanie trafności testu wymaga odwołania się do czterech metod (np. APA, 1985; Brzeziński, 1997). mierzących;
(1) trafność diagnostyczną (concurrent vali-dity),
(2) trafność prognostyczną {predictive vali-dity),
(3) trafność treściową, inaczej - trafność wewnętrzną (content validity).
(4) trafność teoretyczną (canstruct validity).
Dwa pierwsze rodzaje trafności znane są pod ogólniejszą nazwą trafności kryterialnej (criterion oriented validity), gdyż ustalanie trafności w obu wypadkach polega na obliczeniu współczynnika korelacji między wynikiem testu i jakimś (naszym zdaniem - poza-testowym!) kryterium zewnętrznym względem analizowanego testu. Takim kryterium dla kwestionariusza KOD Becka, na przykład. może być diagnoza psychiatryczna, a nic inny kwestionariusz badający nasilenie depresji Niestety, utarła się niedobra praktyka. że owym kryterium zewnętrznym jest po prostu inny test, którego trafność sprawdzono przy użyciu jeszcze innego testu itd. Lepiej, gdy kryterium zewnętrznym dla sprawdzenia trafności kryterialnej testu osiągnięć szkolnych nie będzie inny test osiągnięć szkolnych o znanej trafności, ale gdy będą to, na przykład, oceny szkolne albo dane obserwacyjne. Oczywiście dopuszcza się sprawdzanie zbieżności wyników nowego testu z wynikami testów o uznanej reputacji psychometrycznej czy z wynikami testów mierzących zmienne pozostające w związku korelacyjnym (teoretycznie uzasadnionymi). Podstawowe dla orzekania o trafności kryterialnej powinno być jednak wykazanie zbieżności wyników nowego testu z rzeczywiście zewnętrznym, to znaczy poza testowym, kryterium (odniesionym do aktualnego albo przyszłego zachowania osoby badanej).
D. T. Campbell i D. W. Fiske (1959) swoją pracą poświęconą dwóm aspektom trafności kryterialnej, zbieżnemu i różnicowemu, zainicjowali nową praktykę ustalania trafności kryterialnej (omówienie - Brzeziński, 1997; nowsze ustalenia - Gaul. 1989). To była bardzo ważna praca dla rozwoju problematyki trafności. Każdy nowy test powinien być sprawdzany pod kątem jego zbieżności (aspekt zbieżny trafności) z różnymi testami