Spis zagadnień egzaminacyjnych
rok akademicki 2005/2006
Omów cechy charakterystyczne testów psychologicznych
Jest to sytuacja stworzona specjalnie do testów , sztuczna , a te zachowania są wskaźnikami interesującej nas cechy , że osoba badana jest świadoma faktu iż jest poddawana ocenie .
Jakie znasz przykłady testów psychologicznych?
Chodzi nie o konkretne testy ale o kategorie testów : testy obiektywne vs nieobiektywne , standaryzowane vs niestandaryzowane , zorientowane na normy vs zorientowane na kryterium , testy mocy ( osoba badana ma szansę zmierzyć się z każdą pozycją ) i testy szybkości ( mierzy poziom posiadanej cechy i tempo pracy )
Jakie są kryteria dobrego testu?
Święta 6 : obiektywność , standaryzacja , rzetelność , trafność , normalizacja i adaptacja ( jeżeli jest ważna ) .
Dlaczego standaryzacja testu jest zabiegiem szczególnie ważnym? Wskaż przynajmniej dwa aspekty w procedurze badania testem, które wymagają wystandaryzowania. Dlaczego?
Dlatego , że : odtwarza warunki badania testem jakie obowiązywały w trakcie opracowywania norm , co oznacza , że każda osoba badana ma mieć takie same warunki i na porównywaniu wyników testowych między sobą , dlatego wtedy możemy korzystać z norm . Instrukcja ( zakres pomocy udzielanej osobie badanej ) - należy wiernie ją przeczytać i nie przekraczać warunków , pomoce testowe zawsze powinny być takie same uwaga : arkusz odpowiedzi - nie robić kser , powinny być takie same ; standaryzacja
Jaka jest różnica pomiędzy testem obiektywnym a testem wystandaryzowanym?
Test obiektywny jego wyniki nie zależą od tego kto je interpretuje ( ślepa diagnoza że bez kontaktu z osoba badaną interpretuje się wyniki ) . Test wystandaryzowany jednolitość czyli niezależność wyników od sytuacji , w której badanie ma miejsce ( zasady badania ) chodzi o jednolitośc w obu testach .
Opisz swoimi własnymi słowami co rozumiesz przez "rzetelność testu".
To powtarzalność wyników testowych .
Podaj i objaśnij podstawowe równanie klasycznej teorii testów H. Gulliksena.
Jedyna techniczna sprawa mówiąc o rzetelności
Np. x = t + e , t-największe albo najmniejsze
e-najwieksze albo najmniejsze ( zmniejszyć błąd do którego prowadzi pomiar
testowy )
Podaj definicję rzetelności testu.
Jest to definicja operacyjna jest to wielkość współczynnika korelacji pomiędzy wynikami dwukrotnego badania tej samej grupy osób tym samym testem , a to się równa kwadratowi korelacji pomiędzy wynikiem obserwowanym a wynikiem prawdziwym .
Np. korelacje między dwoma wynikami tym samym testem = 0,80 ( to już jest kwadrat korelacji między wynikiem obserwowanym a prawdziwym ) to oznacza , że błąd wynosi 20% , 36% … 40% prawidłowa odpowiedź to 20% ( interpretujemy wprost ) .
A rzetelność opisuje ( mówi o podobieństwie ) im wyższy dodatni wynik tym większe podobieństwo : + 0,20 , + 0,56 , - 0,40 , - 0 ,96
Jakie są trzy podstawowe sposoby rozumienia rzetelności testu?
jako stabilność ( spójność w czasie wpływ czasu )
jako zgodność ( wpływ treści )
jako homogeniczność ( wpływ róznych wymiarów )
Co to są testy równoległe?
Mierzą to samo i dokładnie tak samo i w sensie formalnym są to metody , które w tej samej grupie osób dają takie same średnie wyniki , takie same odchylenia standardowe i tak samo korelują z innym testem ( a różnią się treścią pozycji testowych ) .
Jakie są wady technik obliczania rzetelności opartych na dwukrotnym testowaniu tej samej grupy osób?
Wady : a) zapamiętywanie ( prowadzi do przeszacowania współczynnika rzetelności )
b) czynniki o charakterze rozwojowym czyli uczenie się ( prowadzi do niedoszacowa-
nia współczynnika rzetelności ) .
Co to jest błąd standardowy pomiaru i do czego służy?
Mówi nam o tym jaka jest wielkość błędu , który powinniśmy wziąć pod uwagę przy interpretacji wyniku indywidualnego i służy do budowania przedziału ufności dla wyniku otrzymanego .
Jak należy interpretować przedział ufności dla wyniku otrzymanego?
Jest to przedział budowany wokół wyniku otrzymanego , jest to przedział w którym z założoną ufnością mieści się wynik prawdziwy osoby badanej ; każdy wynik wpadający do przedziału ufności jest tak samo prawdopodobny .
W jaki sposób wykorzystuje się informacje o błędzie standardowym różnicy? Jakie decyzje diagnostyczne wymagają uwzględnienia błędu standardowego różnicy?
pozwala nam określić jaka jest minimalna wartość różnicy pomiędzy dwoma wynikami , która jest istotna statystycznie ; jeżeli ta różnica jest istotna statystycznie między 2 wynikami to ma ona znaczenie diagnostyczne , w przeciwnym wypadku różnicy się nie interpretuje .
przede wszystkim sytuacje selekcji ( jak wybieramy najlepszego z kandydatów ) i sytuacji zmiany wyników ( terapii ) czy terapia pomogła , czy po niej wyniki spadły , czy terapia okazała się skuteczna np. obniżyła poziom lęku ?
Czy interpretując wyniki testowe można się odwoływać do innych źródeł niż podręcznik testowy? Wypowiedź uzasadnij.
należy , tak , jak najbardziej tak ( dot. to zwiększenia informacji na temat trafności metody )
Wyjaśnij różnice w rozumieniu następujących pojęć: trafność wewnętrzna, trafność kryterialna, trafność teoretyczna, trafność fasadowa.
Trafnośc wewnętrzna treściowa , logiczna , mówi nam o tym ile treść testu ( jaka próbka ) pokrywa uniwersum treści , które da się sformułować dla mierzonego konstruktu ; test powinien być reprezentatywny dla danego konstruktu tzn. proporcjonalny ( powinien proporcjonalnie wyczerpywać uniwersum treści )
Trafność kryterialna mówi o tym , o jakich zachowaniach poza testowych możemy wnioskować na podstawie wyników testu ; rozszerza możliwości interpretacyjne testu ; ma 2 aspekty :
trafność kryterialna diagnostyczna - na podstawie wyników testu orzekać o innych cechach aktualnie występujących u osoby badanej ; np. uszkodzenie CUN i test odwzorowywania figur geometrycznych
trafność kryterialna prognostyczna - możemy przewidywać cechy , które mogą się pojawić w przyszłości ; np. test do mierzenia temperamentu i mierzymy nim alkoholików
trafność teoretyczna - mówi o tym czy test mierzy to co z założenia miał mierzyć , na ile udało się zrealizować stawiane cele , czy np. test inteligencji mierzy to co miał mierzyć ? ; jest 6 różnych metod badania jej pkt 19
trafność fasadowa - mówi o tym co o teście myśli osoba badana , co test wydaje się mierzyć z punktu widzenia osoby badanej ; nie mierzy cechy testu ale to tylko co myśli osoba badana , może zwiększać lub zmniejszać motywację
Jakie znasz sposoby wyeliminowania zjawiska kontaminacji kryterium?
Kontaminacja kryterium jest to zanieczyszczenie kryterium ; błąd bierze się z tego , gdy ta sama osoba ocenia poziom wykonania w teście i poziom wykonania w zmiennej kryterialnej ( gdy robią to te same osoby ) ; podstawową metodą unikania jest rozdzielenie tych dwóch funkcji robienie dwóch zespołów ludzi
Jakie znasz rodzaje trafności kryterialnej?
Diagnostyczna
Prognostyczna
W jaki sposób można oszacować trafność teoretyczną testu?
Jest 6 grup metod : pierwsza metoda to badanie różnic grupowych ( głównie na to zwrócić uwagę , pozostałe metody nieważne ) - np. Apis mierzy inteligencję skrystalizowaną , im ktoś się więcej uczył tym lepiej powinien go rozwiązać osoby z wykształceniem średnim a wykształceniem wyższym ; hipoteza wynika z teorii o różnicy a weryfikujemy odwołując się do wyników .
Wyjaśnij pojęcie normy statystycznej?
Opisuje typowy poziom rozwiązania testu w grupie odniesienia to norma statystyczna .
Dlaczego normy powinny być aktualne, adekwatne i reprezentatywne?
Bo istotą reprezentacji normatywnej jest określenie stopnia podobieństwa osoby badanej do grupy odniesienia ; zawsze opisujemy osobę badaną na tle grupy odniesienia , dlatego to tło musi być a jest nim :
- aktualność - że nie są przestarzałe , max. 15 letnie
- adekwatność - tzn że mają być obliczane dla takiej grupy do której należy osoba badana , oceniane to jest pod kątem demograficznym : płeć , wykształcenie , miejsce zamieszkania itp.
- reprezentatywność - mówi o stopniu uogólniania naszych wniosków
Co oznacza termin normy lokalne? Czy normy te różnią się od norm ogólnokrajowych?
Normy lokalne są obliczane dla wąskich grup i stopień ich reprezentatywności jest mały a normy ogólnokrajowe są obliczane dla prób reprezentatywnych , dla populacji całego kraju .
Próba normalizacyjna dla testu wiadomości składała się z maturzystów liceów ogólnokształcących z 1964 roku. Określ przydatność norm dla: a) maturzystów z 1965 roku; b) absolwentów szkoły dla głuchoniemych z 1964 roku; c) maturzysty z 1964 roku, który dwukrotnie powtarzał klasę; d) ucznia, który ze względu na wybitne zdolności ukończył szkołę w wieku o dwa lata niższym.
dobre
b) niedobre ( wszystko zależy od tego co mierzymy bo może chodzi o to jak dzieci głuchonieme wypadają na tle osób nie głuchoniemych ? )
dobre
dobre
Jakie informacje należy podać o normach, aby można je było właściwie wykorzystywać i dlaczego?
- rok powstania
- skład grupy normalizacyjnej
- sposób pobrania próby ( czy była reprezentatywna czy nie ? )
- kiedy , kto i jak pobrał próbę ?
Czy wynik testowy równy 80T równy jest 80 centylowi? Dlaczego?
Nie jest równy bo : T- to skala standardowa
C - to skala wentylowa
Powierzchnia pod rozkładem , która odpowiada > 80 T ( mieści się ok. 3 odchyleń standardowych tj 3% osób tu się mieści ) a > 80 C ( centyl oznacza wyniki osób , które otrzymały poniżej , tu się mieści 20% osób )
Dlaczego skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii?
Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych .
Dlaczego standardowe skale norm są tak bardzo popularne?
Bo są one skalami interwałowymi , co oznacza , że pozwalają na określenie różnic między badanymi osobami ( mówi o wielkości różnic , każdy uzyskał inny czas , o ile był szybszy ) . A skala C porządkowa wskazuje jedynie porządek , informacje na którym miejscu znalazł się dany np. zawodnik . Centyle to miejsca 1,2,3 ale nie podaje poziomu nasilenia cechy ( dobre w siatkach centylowych dot. rozwoju dziecka ) .
Dlaczego normalizacja rozkładu jest krokiem niezbędnym przy przeliczaniu wyników surowych na którąś ze skal standardowych?
Dlatego , że do interpretacji wyników wykorzystujemy właściwości rozkładu normalnego , czyli wyniki w zakresie : -1 +1 - wyniki przeciętne
1 2 - wyniki wysokie
2 3 wyniki bardzo wysokie
-1 -2 - wyniki niskie
-2 -3 - wyniki bardzo niskie jest to niezbędne
-3 -4 - wyniki skrajnie niskie
Pytanie dot znajomości skal standardowych ( nie ma go tu ) : wyniki T , steny , staniny ( średnia 5 odchyleń standardowych 2 ) , IQ ( średnia 100 odchyleń standardowych 15 ) , tetrony ( średnia 10 odchyleń standardowych 4 )
Dlaczego obliczamy moc dyskryminacyjną przed włączeniem zadań do ostatecznej wersji testu?
Bo do ostatecznej wersji testu powinniśmy włączyć pozycje testowe różnicujące badane osoby pod względem mierzonej cechy .
Jakich specyficznych informacji dostarcza analiza zadań?
Dostarcza 3 rodzaji informacji czy pozycje testowe są :
poprawne rzeczowo ( czy są wskaźnikami mierzonych właściwości )
o poprawności językowej ( czy zostały skonstruowane poprawnie językowo )
o właściwościach statystycznych poszczególnych pozycji )
Jakie znasz sposoby szacowania wielkości mocy dyskryminacyjnej zadań? Czym one się różnią między sobą?
Testy właściwości poznawczych |
Testy właściwości afektywnych |
Wskaźnik trudności średnia trudność całego testu ; plus minus 50% ( optymalna decyzja gdy różnicujemy grupę , w testach selekcyjnych ; im niższy wskaźnik trudności tym trudniejszy test - 10% to bardzo trudny test a 90% to test bardzo łatwy ; specyficzna selekcja - dot sytuacji selekcyjnych , chcemy odsiać 10% to robimy taki test a test który max różnicuje to wtedy 50% ; mechanizmem który bierze tu udział jest zgadywanie |
Wskaźnik dyskryminacji testy dwukategorialne , test T-studenta , testy wielokategorialne ; korelacja wyniku danej pozycji z ogólnym wynikiem w teście - to są 3 metody ; np. przy testach 2 kategorialnych wskaźnik dyskryminacji się nie nadaje |
Co to są style odpowiadania i jak można sobie radzić z tym źródłem błędu w pomiarze testowym?
Są to stałe , trwałe dyspozycje do odpowiadania w sposób pozatreściowy to są style odpowiadania jak sobie radzić - że są pewne metody gdy możemy działać na poziomie konstrukcji kwestionariusza albo na poziomie interpretacji wyników ( skale kontrolne ) .
Na czym polega empiryczna procedura konstrukcji testu?
Polega na sprawdzeniu na jakie pozycje testowe inaczej odpowiadają osoby z tzw grupy kryterialnej ( posiadają cechy ) i grupy kontrolnej ( nie posiadają cech ) ; istotą tej procedury jest znalezienie kryterium pozwalającej odróżnić te 2 grupy między sobą .