23. listopad 2006
PSYCHM.-W5
Przebieg
Rzetelność odnosi się do:
–
stabilności
–
równoważności
–
spójności
wyników testowych.
Wszystkie te pomysły wywodzą z tego samego pomysłu.
Metody empirycznej estymacji rzetelności:
–
wskaźnik rzetelności retestowej (stabilność)
–
formy równoległe (równoważność)
–
wskaźnik rzetelności międzypółkowej (spójność)
–
wskaźnik rzetelności wewnętrznej (spójność )
–
ocena sędziów kompetentnych
To nie są wskaźniki rzetelności, tylko te metody empirycznej estymacji rzetelności – ubogi sposób szacowania rzetelności.
Wskaźnik rzetelności retestowej
Tym samym testem badamy tych samych badanych więcej niż raz.
-dwa rodzaje:
wiarygodność testu (rzadko stosowany)
stabilność bezwzględna (stosowany)
Jest pewna grupa badanych którym dajemy ten test. Czekamy trochę i dajemy im jeszcze raz ten sam test i oczekujemy, że wyniki będą bardzo zbliżone. Wariancja różnic powinna być zerowa.
W praktyce oczywiście zdarza się pewna rozbieżność, a wtedy test jest bardziej obciążony błędem.
-spotykane odstępy: 1 tygodnia do 6 miesięcy
Niektórzy badani przy kolejnym wykonywaniu stara się powielać odpowiedzi, które wcześniej udzielili. W praktyce ten odstęp nie powinien być krótki. Dwa tygodnie to jest rozsądne minimum.
-wyjątkowo dziesiątki lat (kiedy badana jest nie tyle stabilność testu, co raczej mierzonej przez niego cechy, np. Inteligencji)
Systematyczne zmiany pewnej cechy na odstępie długiego czasu nie jest zagrożeniem dla wyników testu.
Jeśli wszystkim badanym zmienia się równocześnie to test jest idealnie rzetelny. Ale jeśli badani mają różne wyniki w różnych pomiarach to wtedy test ten nie jest 100% rzetelny.
Obliczanie wskaźnika rzetelności retestowej
–
współczynnik korelacji liniowej r-Pearsona
Strona 1 z 4
23. listopad 2006
Problemy:
–
pamięć poprzedniego badania (w praktyce czasem jest dotkliwy, a czasem mniej; w testach wykonaniowych, tam gdzie jest czynnik wprawy to ten problem jest bardzo dotkliwy)
–
uczenie się, wprawa
–
wyobrażenia badanych na temat celu powtórzenia badania Zalecenie APA: nie wolno ograniczać się do stosowania wskaźników retestowych.
Formy równoległe – wymogi
Chodzi o to samo. Trzeba przebadać ludzi jeszcze raz, ale nie tym samym testem, ale takim samym testem (czyli podobnym do pierwotnego).
Najczęściej w formy równoległe napisane są w formach równoległych.
Przed terapią i po terapii stosujemy taką metodę.
Warunki empiryczne musi spełniać dany test
-równość średnich
-równość odchyleń standardowych
-równość interkorelacji pozycji
-równość korelacji z kryterium zewnętrznym (inny test, który jest podobny) Oprócz tego musi być podobny materiał w tych testach, czyli trzeba wygenerować dwa razy więcej itemów.
Obliczanie rzetelnośći form równoległych
-Współczynnik korelacji liniowej r-Pearsona
-Formy równoległe jako wskźnik:
Stabilności bezwzględnej
Wiarygodności
Rzetelność szcowana metodą form równoległych daje zwykle oszacowania najniższe z możliwych
Kiedy oblicza się stabilność wewnętrzną. Co jest u psychologa stałe? Inteligencja ogólna! :) Podatność na hipnozę też jest stałą cechą.
3.Wskaźnik rzetelności międzypołówkowej
Też jest realizacją pomysłu -”zróbmy coś dwukrotnie”
Formy równoległe jest szczególnie ciekawie zrobione.
-Korelacja między połówkami testu, zazwyczaj pozycjami parzystymi i nieparzystymi Jeśli test jest idealny to korelacja między pierwszą połową a drugą połową pytań powinna być 100%, czyli r=1. Jeśli tak nie jest to pytania te są obciążone błędem.
–
bywa zaliczany do wskaźników rzetelności wewnętrznej Problem w tym, że szacujemy rzetelność poprzez skracanie narzędzia....
Im dłuższe narzędzie tym większa rzetelność. A my szacujemy rzetelność połowy narzędzia.
Obliczanie rzetelności międzypołówkowej korekta Spearmana-Browna rtt=2rhh/1+rhh
Strona 2 z 4
23. listopad 2006
gdzie:
rtt- rzetelność skorygowana
rhh- korelacja między połówkami
Wskaźnik rzetelności wewnętrznej (zgodności wewnętrznej) Test robi się tyle razy ile to jest tylko możliwe. Kombinacje między pytaniami testu.
5 pytań – 10 kombinacji – skorelować wszystko z wszystkim w ramach danego go testu.
Jest pewna ilość wskaźników, że im więcej ich zachodzi tym większe prawdopodobieństwo zajścia jakiegoś zjawiska.
–
j.t.miara tego, w jakim stopniu test jest czystą miarą mierzonej zmiennej i w jakim stopniu odpowiedzi na poszczególne pytania mierzą to samo co wynik w całym teście.
Od czego zależy to jak dobrze test wypadnie w skali rzetelności wewnętrzenej, tym większa im:
–
wyższe są korelacje między pozycjami testu
–
wyższa jest wariancja pozycji testu (najgorzej jest wtedy, gdy wszyscy badani odpowiadają w jeden sposób, bo wtedy test jest albo zbyt łatwy albo zbyt trudne i kicha)
–
mniejsze są różnice w trudności poszczególnych zadań (idealny test jest taki, że, jeśli to możliwe, wykazuje rozkład normalny, albo przynajmniej pół na pół)
–
większa jest liczba pozycji w teście
Wzory Kudera-Richardsona; format pozycji dychotomiczny (tak lub nie) Alfa Cronbach: dowolny format odpowiedzi – nadają się do badania pytań o dowolnym formacie Alfa Cronbach – najpopularniejszy obecnie wskaźnik rzetelności 5)Zgodność sędziów kompetentnych
Jest to inny pomysł. Narzędziem pomiarowym jest człowiek i jego ocena sytuacji.
3 rodzaje info: life data - obserwacja, experimental data i zgodność ocen Człowiek jest dobry w rozpoznawaniu cech innych osób, ale równie dobrze ukrywa swoje cechy.
–
stosowana w wypadku procedur, które wymagają subiektywnej oceny
–
W Kendalla - „korelacja” między więcej niż dwiema zmiennymi (sędziami) test szybkości a wskaźniki rzetelności
(jak najszybciej coś zrobić w jednostce czasu, a większość badanych nie zdąży zrobić wszystkiego) o części itemów nie ma informacji jakie one są.
Oznacza to, że pewne wskaźniki rzetelności są niemożliwe do zastosowania przy testach szybkości np. Międzypołówkowej, wewnętrznej.
–
dopuszczalne : wskaźniki retestowe i formy równoległe Interpretacja wskaźników rzetelności
Strona 3 z 4
P-W5
23. listopad 2006
–
przyjmują wartości z przedziału od 0-1
–
reprezentują estymowaną proporcję składnika prawdziwego i składnika błędu (np. L=0,8
->80% przez cechę, a 20% przez błąd)
–
UWAGA – korelację retestową oraz międzypołówkową należy ...
Pożądane wartości współczynników rzetelności
-Wymogi wobec rzetelności są wyższe w wypadku badań indywidualnych (pożądane 0,90) niż eksperymentów grupowych.
-Oeirntacyjna interpretacja:
0,90 i więcej – rzetelność znakomita (w psychologii raczej rzadko spotykana) o,8-0,9 – rzetelność dobra (często spotykana w psychologii) poniżej 0,50 – rzetelność nie do zaakceptowania
Przykłady rzetelności testów
–
FCZ-KT (Strelau)
–
od 0,77 żwawość do 0,85 wytrwałość
EPO- R
–
Neurotyzm: 0,84
–
Psychotyzm: o,67
–
Ekstra-introwersja:0,83
0,7 powinien być.
0,96 – Słownik - WAIS-R
Strona 4 z 4