|
|
|
|
Na skutek błędu pomiaru, wynik otrzymany w teście jest zawsze wyższy o wyniku prawdziwego.
Zróżnicowanie wyników prawdziwych jest zawsze wyższe od zróżnicowania wyników otrzymanych.
|
Wartość oczekiwana błędu pomiaru wynosi:
W klasycznej teorii testów t (średnia wyników otrzymanych) =
Jak błąd pomiaru wpływa na średnią i wariancję wyników otrzymanych:
|
Błędy pomiaru / przedział ufności
|
Przedział ufności wyniku prawdziwego, konstruowany w oparciu o standardowy błąd estymacji (SEE) budujemy wokół wyniku otrzymanego osoby badanej.
Aby wyznaczyć estymowany wynik prawdziwy, należy znać standardowy błąd pomiaru.
Przedział ufności wyniku prawdziwego, konstruowany jest wokół wyniku prawdziwego.
|
Standardowy błąd estymacji, SEE =
Porównując wielkości błędów - błąd standardowy estymacji w porównaniu z błędem standardowym pomiaru jest zawsze:
Przedział ufności wyniku prawdziwego to:
|
Ogólne: testy psychologiczne/ rzetelność / trafność
|
Pomiar inteligencji poprzez zważenie i zmierzenie mózgu nie jest ani trafny, ani rzetelny.
Rzetelność jest górną granicą trafności.
Z punktu widzenia poprawności i użyteczności diagnozy, ważniejsza jest rzetelność testu niż jego trafność.
|
Test jest obiektywny, gdy:
|
Szacowanie rzetelności - klasyczne
|
Wiarygodność pomiaru oceniana jest poprzez dwukrotne, raz za razem, badanie tym samym testem.
Wysoka α-Cronbacha oznacza wysokie interkorelacje pomiędzy pozycjami testu.
Konsensyjność testu można ocenić na podstawie współczynnika W-Kendalla.
|
Oceniając rzetelność narzędzia poprzez analizę i porównywanie pomiędzy sobą pojedynczych pozycji testowych, powinniśmy zastosować test:
Czym się różni test KR-20 od α-Cronbacha:
Test wysoce rzetelny to test, dla którego współczynnik rzetelności wynosi:
|
Szacowanie rzetelności - inne
|
W modelu Hoyta ilość poziomów czynnika A i B są odpowiednio ilość osób oraz ilość zastosowanych testów psychologicznych.
Obliczenia metodą Hoyta prowadzą do niedoszacowania rzetelności narzędzia.
W modelu Winera odpowiedzi osoby na poszczególne pytania kwestionariusza traktowane są jako pomiary zależne.
Stosując model Brzezińskiego, wystarczy przeprowadzić badanie testem na jednej próbie reprezentatywnej.
|
Model Winera różni się od modelu Hoyta:
Wskaźnik dobroci testu Brzezińskiego (DT) przyjmuje wartości z zakresu:
Teoria generalizowalności wyników, różni się od klasycznej teorii testów przede wszystkim:
|
|
Trafność wewnętrzna dotyczy reprezentatywności pozycji testowych.
Test o wysokiej trafności diagnostycznej, musi mieć również wysoką trafność prognostyczną.
Trafność kryterialna zależy od rzetelności wybranego kryterium.
|
Trafność diagnostyczna różni się od prognostycznej:
Poprawka na „rozcieńczenie” trafności (Correction for attenuation) służy do:
Trafność treściowa (wewnętrzna) to:
|
|
W analizie głównych składowych, główna składowa jest liniową kombinacją analizowanych zmiennych.
Główne składowe zawsze są ortogonalne.
W analizie głównych składowych można zastosować rotację Varimax.
|
Głównym celem stosowania analizy głównych składowych jest:
W przypadku czynników ortogonalnych, ładunek czynnikowy to:
Obroty (rotacje) w analizie czynnikowej mają na celu:
|
|
Reguły Campbella i Fiskiego wykazują dużą trafność zbieżną i rozbieżną, gdy dobierane cechy są maksymalnie podobne, a metody - maksymalnie różne.
Metoda Jacksona pozwala na wyodrębnieniu z macierzy wielu cech - wielu metod tylu czynników, ile jest zastosowanych metod, niezależnie od ilości mierzonych cech.
|
Wymień warunki Campbella i Fiskiego, które muszą być spełnione w analizie Wielu Cech Wielu Metod, by uznać test za trafny:
W macierzy Wielu Cech Wielu Metod, jakie współczynniki muszą być najwyższe, aby uznać test za trafny:
|
|
Pytania buforowe mają wysoką moc dyskryminacyjną.
Pytanie o trudności 0.9 dobrze różnicuje badanych.
Jeżeli trudność testu wynosi 0,5 oznacza to, że przeciętny wynik w tym teście jest równy środkowi skali wyników.
|
Narysuj ślad itemu o bardzo wysokiej trudności:
|
Konstruowanie i adaptacja
|
Przenosząc amerykański kwestionariusz zdolności werbalnych na grunt kultury polskiej, najlepszą techniką adaptacji będzie transkrypcja.
Badacz, który chce dokonać adaptacji brytyjskiego kwestionariusza do warunków polskich, musi najpierw dokonać jego translacji.
W strategii indukcyjnej (wewnętrznej) pierwszym etapem konstruowania kwestionariusza mogą być analizy leksykograficzne.
|
Trzy podstawowe strategie konstruowania testów to:
Testy psychologiczne, skonstruowane strategią wewnętrzną mają na celu:
|
|
Jeżeli test zawiera 25 pytań, punktowanych 0 lub 1, tworząc normy najlepiej przeliczyć wyniki surowe na skalę tenową.
Jeżeli rozkład surowych wyników w teście agresji jest bardzo skośny, tworząc normy najlepiej zastosować skalę opartą o rozkład procentowy.
Odnosząc wynik osoby badanej do norm, lepiej korzystać z norm ogólnych (dla całej populacji) niż dla norm lokalnych, dla określonego wieku i płci.
|
Jakim kształtem rozkładu, charakteryzuje się skala decylowa:
|
|
Klasyczna teoria testów dotyczy także testów projekcyjnych.
W testach osobowości stosuje się poprawkę na zgadywanie.
Test projekcyjny - jak każdy inny test - musi być znormalizowany.
|
Jakie znane Ci testy projekcyjne mają zadawalające współczynniki rzetelności i trafności:
Wpływ zmiennej aprobaty społecznej polega na:
|