23. listopad 2006
PRZEBIEG WYKŁADU NR 6 Z PSYCHOMETRII
Wiadomo, że testy nie mierzą dokładnie tego, co mierzyć powinny. Zawierają błąd. Dlatego warto jest oszacować ramy, w których mieści się dokładny wynik. Stosuje się do tego SEM.
SEM j.t. Odchylenie standardowe różnic między wynikiem prawdziwym a uzyskanym.
Błąd ma rozkład normalny
Przedział ufności (95%)
Im szerszy jest przedział tym pewność jest większa.
NP. Coś ma wynik 0-100. Komuś wyszło 60 pkt. - wynik uzyskany. A my chcemy wynik prawdziwy?
Prawdopodobieństwo, że ten wynik mieści się w przedziale od 0-100 wynosi 100%. Skrajnie szerokie oszacowanie redukuje każdą wątpliwość. Ale to nic nam nie daje.
95% pewności to jest już lepiej. Oszacowanie powinno być jak najwęższe, bo inaczej nie będzie użyteczne.
Test Z. 1,96 SD (odchyleń standardowych) to daje nam 95% pewności, że wynik prawdziwy jest w tym przedziale. 1,96SD x wynik uzyskany = błąd standardowy.
Znając odchylenie standardowe błędu to wykonujemy działanie X e < -1,96 (SEM): X +1,96 (SEM) Błąd standardowy pomiaru nadaje się do obliczenia przedziałów ufności NP.
SEM: 3
3 x 1,96 = prawie 6
50(wynik uzyskany) : 44-56, bo 50+-6.
SEM=SD x pierwiastek z 1- rtt
Im większy jest błąd standardowy tym mniejsza pewność oszacowania i oszacowanie wyników będzie mniej precyzyjne.
Współczynniki rzetelności, jak wszystkie miary oparte na korelacji, są wrażliwe na wielkość wariancji w próbie.
Korelacja jest tym większa im większa wariancja w próbie.
Jeśli zabieramy się do badania rzetelności testu to musimy się zastanowić czy próba, którą chcemy zbadać nie jest wyselekcjonowana pod względem danej cechy. Jak jest mała wariancja w próbie to nie powinniśmy badać rzetelności.
Chcąc zbadać związek inteligencji ogólnej z zarobkami wśród pracowników banku to niczego nie wykryje.
Strona 1 z 3
23. listopad 2006
Zmienna spłaszczona.
Analiza pozycji testowych
Chcemy, żeby nasz test był jak najbardziej rzetelny. Ale zwykle nie wychodzi ona od razu tak dobrze jakbyśmy chcieli. Trzeba go udoskonalić.
Ta metoda pokazuje, które pytania stanowią słabość w podniesieniu rzetelności testu.
–
moc dyskryminacyjna pytania
–
alfa przy wykluczenia pozycji
–
Skorygowany współczynnik korelacji item-skala
Moc dyskryminacyjna
=zdolność itemu do różnicowania populacji pod względem danej cechy (jak skutecznie dany wskaźnik różnicuje)
Np. jeśli jest to wskaźnik 0-1 to jak połowa pop. Reaguje 0, a druga 1 to jest on idealny.
–
mierzona jako skorygowana korelacja między pozycją a wynikiem (SKIS)- wynik ogólkny usuwany jest wynik w tej pozycji w której jest ...
Im niższa jest korelacja danego pytania z całą resztą to tym gorzej świadczy to o danym pytaniu.
Alfa przy wykluczeniu pozycji to jest alfa testu pomniejszonego o tę pozycję, której jakość badamy.
Jak bez tego pytania rzetelność reszty jest wyższa niż jak to pytanie jest w teście to to pytanie wyrzucamy.
Np. podatność na hipnozę.
Jeśli w pytaniu jest niższa korelacja niż pozostałe (SKIS) i alfa przy wykluczeniu jest wyższa to wykluczamy je i tym samym zwiększamy rzetelność testu.
------------------------- TRAFNOŚĆ TESTU ----------------
To pytanie o to: czy test mierzy to, co powinien mierzyć.
Zawsze możliwe jest to, że mierzymy to, co chcemy, żeby on mierzył.
Trafność testu – odnosi się do pytania o to, co jest mierzone przez test APA: Pojęcie trafności dotyczy poprawności wniosków wyprowadzanych na podstawie wyników testowych lub innych form badania
Brzeziński: trafność sprowadza się do dwóch pytań:
–
jakie wnioski można wyciągnąć na temat tego, co jest mierzone przez test,
–
jakie wnioski można sformułować o innych (pozatestowych) zachowaniach Np. test inteligencji ogólnej, która mierzy inteligencję ogólną rzeczywiście ... i co z tego? Jak to się ma do jego życia.
Strona 2 z 3
Psychom.-W6
23. listopad 2006
Poczucie kontroli (Rotter)
Umiejscowienie kontroli – względnie stałe przekonanie, że to co jednostkę spotyka w życiu jest spowodowane przez jednostkę czy siły zewnętrzne nad którymi się nie ma kontroli.
Jest względnie stała, ale podatna na sytuację.
Skala aprobaty społecznej (potrzebę aprobaty społecznej) – inni mają nas lubić i my sami chcemy się lubić
Trzy aspekty trafności:
–
trafność kryterialna: diagnostyczna i prognostyczna
–
treściowa
–
teoretyczna
Diagnostyczna
najprostsze ujęcie.
Pytanie o to, czy test jest w stanie określić, czy w danej chwili dana osoba odznacza się pewnymi właściwościami
Metoda badania: określanie zgodności testu z kryterium zewnętrznym
–
korelacja wyników testu z inną metodą mierzącą to samo, co wyniki w teście
–
narzędzie testowe oraz kryterialne stosowane w tym samym momencie Ale co w psychologii będzie tym kryterium zewn., bo mierzymy zmienne latentne. Niektóre cechy takie są.
Korelacja może być wysoka, ale to nie wyznacza trafności testu Prognostyczna
–
pytanie o to, czy wyniki w teście skutecznie prognozują zachowanie się jednostki w przyszłości (jest to tochę twardsze kryterium)
–
Metoda badawcza: określanie zgodności testu z rzeczywistym zachowaniem się jednostki w przyszłości:
–
korelacja wyników w teście z narzędziem określającym zachowanie się jednostki
–
narzędzie kryterialne stosowane po określonym czasie od zastosowania narzędzia testowanego
Strona 3 z 3