PSYCHOMETRIA-Spis zagadnień egzaminacyjnych+ odpowiedzi, Psychometria

Spis zagadnień egzaminacyjnych

rok akademicki 2005/2006

Omów cechy charakterystyczne testów psychologicznych

Jest to sytuacja stworzona specjalnie do testów , sztuczna , a te zachowania są wskaźnikami interesującej nas cechy , że osoba badana jest świadoma faktu iż jest poddawana ocenie .

Jakie znasz przykłady testów psychologicznych?

Chodzi nie o konkretne testy ale o kategorie testów : testy obiektywne vs nieobiektywne , standaryzowane vs niestandaryzowane , zorientowane na normy vs zorientowane na kryterium , testy mocy ( osoba badana ma szansę zmierzyć się z każdą pozycją ) i testy szybkości ( mierzy poziom posiadanej cechy i tempo pracy )

Jakie są kryteria dobrego testu?

Święta 6 : obiektywność , standaryzacja , rzetelność , trafność , normalizacja i adaptacja ( jeżeli jest ważna ) .

Dlaczego standaryzacja testu jest zabiegiem szczególnie ważnym? Wskaż przynajmniej dwa aspekty w procedurze badania testem, które wymagają wystandaryzowania. Dlaczego?

Dlatego , że : odtwarza warunki badania testem jakie obowiązywały w trakcie opracowywania norm , co oznacza , że każda osoba badana ma mieć takie same warunki i na porównywaniu wyników testowych między sobą , dlatego wtedy możemy korzystać z norm . Instrukcja ( zakres pomocy udzielanej osobie badanej ) - należy wiernie ją przeczytać i nie przekraczać warunków , pomoce testowe zawsze powinny być takie same uwaga : arkusz odpowiedzi - nie robić kser , powinny być takie same ; standaryzacja

Jaka jest różnica pomiędzy testem obiektywnym a testem wystandaryzowanym?

Test obiektywny jego wyniki nie zależą od tego kto je interpretuje ( ślepa diagnoza że bez kontaktu z osoba badaną interpretuje się wyniki ) . Test wystandaryzowany jednolitość czyli niezależność wyników od sytuacji , w której badanie ma miejsce ( zasady badania ) chodzi o jednolitośc w obu testach .

Opisz swoimi własnymi słowami co rozumiesz przez "rzetelność testu".

To powtarzalność wyników testowych .

Podaj i objaśnij podstawowe równanie klasycznej teorii testów H. Gulliksena.

Jedyna techniczna sprawa mówiąc o rzetelności

Np. x = t + e , t-największe albo najmniejsze

e-najwieksze albo najmniejsze ( zmniejszyć błąd do którego prowadzi pomiar

testowy )

Podaj definicję rzetelności testu.

Jest to definicja operacyjna jest to wielkość współczynnika korelacji pomiędzy wynikami dwukrotnego badania tej samej grupy osób tym samym testem , a to się równa kwadratowi korelacji pomiędzy wynikiem obserwowanym a wynikiem prawdziwym .

Np. korelacje między dwoma wynikami tym samym testem = 0,80 ( to już jest kwadrat korelacji między wynikiem obserwowanym a prawdziwym ) to oznacza , że błąd wynosi 20% , 36% … 40% prawidłowa odpowiedź to 20% ( interpretujemy wprost ) .

A rzetelność opisuje ( mówi o podobieństwie ) im wyższy dodatni wynik tym większe podobieństwo : + 0,20 , + 0,56 , - 0,40 , - 0 ,96

Jakie są trzy podstawowe sposoby rozumienia rzetelności testu?

jako stabilność ( spójność w czasie wpływ czasu )
jako zgodność ( wpływ treści )
jako homogeniczność ( wpływ róznych wymiarów )

Co to są testy równoległe?

Mierzą to samo i dokładnie tak samo i w sensie formalnym są to metody , które w tej samej grupie osób dają takie same średnie wyniki , takie same odchylenia standardowe i tak samo korelują z innym testem ( a różnią się treścią pozycji testowych ) .

Jakie są wady technik obliczania rzetelności opartych na dwukrotnym testowaniu tej samej grupy osób?

Wady : a) zapamiętywanie ( prowadzi do przeszacowania współczynnika rzetelności )

b) czynniki o charakterze rozwojowym czyli uczenie się ( prowadzi do niedoszacowa-

nia współczynnika rzetelności ) .

Co to jest błąd standardowy pomiaru i do czego służy?

Mówi nam o tym jaka jest wielkość błędu , który powinniśmy wziąć pod uwagę przy interpretacji wyniku indywidualnego i służy do budowania przedziału ufności dla wyniku otrzymanego .

Jak należy interpretować przedział ufności dla wyniku otrzymanego?

Jest to przedział budowany wokół wyniku otrzymanego , jest to przedział w którym z założoną ufnością mieści się wynik prawdziwy osoby badanej ; każdy wynik wpadający do przedziału ufności jest tak samo prawdopodobny .

W jaki sposób wykorzystuje się informacje o błędzie standardowym różnicy? Jakie decyzje diagnostyczne wymagają uwzględnienia błędu standardowego różnicy?

pozwala nam określić jaka jest minimalna wartość różnicy pomiędzy dwoma wynikami , która jest istotna statystycznie ; jeżeli ta różnica jest istotna statystycznie między 2 wynikami to ma ona znaczenie diagnostyczne , w przeciwnym wypadku różnicy się nie interpretuje .
przede wszystkim sytuacje selekcji ( jak wybieramy najlepszego z kandydatów ) i sytuacji zmiany wyników ( terapii ) czy terapia pomogła , czy po niej wyniki spadły , czy terapia okazała się skuteczna np. obniżyła poziom lęku ?

Czy interpretując wyniki testowe można się odwoływać do innych źródeł niż podręcznik testowy? Wypowiedź uzasadnij.

należy , tak , jak najbardziej tak ( dot. to zwiększenia informacji na temat trafności metody )

Wyjaśnij różnice w rozumieniu następujących pojęć: trafność wewnętrzna, trafność kryterialna, trafność teoretyczna, trafność fasadowa.

Trafnośc wewnętrzna treściowa , logiczna , mówi nam o tym ile treść testu ( jaka próbka ) pokrywa uniwersum treści , które da się sformułować dla mierzonego konstruktu ; test powinien być reprezentatywny dla danego konstruktu tzn. proporcjonalny ( powinien proporcjonalnie wyczerpywać uniwersum treści )

Trafność kryterialna mówi o tym , o jakich zachowaniach poza testowych możemy wnioskować na podstawie wyników testu ; rozszerza możliwości interpretacyjne testu ; ma 2 aspekty :

trafność kryterialna diagnostyczna - na podstawie wyników testu orzekać o innych cechach aktualnie występujących u osoby badanej ; np. uszkodzenie CUN i test odwzorowywania figur geometrycznych
trafność kryterialna prognostyczna - możemy przewidywać cechy , które mogą się pojawić w przyszłości ; np. test do mierzenia temperamentu i mierzymy nim alkoholików
trafność teoretyczna - mówi o tym czy test mierzy to co z założenia miał mierzyć , na ile udało się zrealizować stawiane cele , czy np. test inteligencji mierzy to co miał mierzyć ? ; jest 6 różnych metod badania jej pkt 19
trafność fasadowa - mówi o tym co o teście myśli osoba badana , co test wydaje się mierzyć z punktu widzenia osoby badanej ; nie mierzy cechy testu ale to tylko co myśli osoba badana , może zwiększać lub zmniejszać motywację

Jakie znasz sposoby wyeliminowania zjawiska kontaminacji kryterium?

Kontaminacja kryterium jest to zanieczyszczenie kryterium ; błąd bierze się z tego , gdy ta sama osoba ocenia poziom wykonania w teście i poziom wykonania w zmiennej kryterialnej ( gdy robią to te same osoby ) ; podstawową metodą unikania jest rozdzielenie tych dwóch funkcji robienie dwóch zespołów ludzi

Jakie znasz rodzaje trafności kryterialnej?

Diagnostyczna

Prognostyczna

W jaki sposób można oszacować trafność teoretyczną testu?

Jest 6 grup metod : pierwsza metoda to badanie różnic grupowych ( głównie na to zwrócić uwagę , pozostałe metody nieważne ) - np. Apis mierzy inteligencję skrystalizowaną , im ktoś się więcej uczył tym lepiej powinien go rozwiązać osoby z wykształceniem średnim a wykształceniem wyższym ; hipoteza wynika z teorii o różnicy a weryfikujemy odwołując się do wyników .

Wyjaśnij pojęcie normy statystycznej?

Opisuje typowy poziom rozwiązania testu w grupie odniesienia to norma statystyczna .

Dlaczego normy powinny być aktualne, adekwatne i reprezentatywne?

Bo istotą reprezentacji normatywnej jest określenie stopnia podobieństwa osoby badanej do grupy odniesienia ; zawsze opisujemy osobę badaną na tle grupy odniesienia , dlatego to tło musi być a jest nim :

- aktualność - że nie są przestarzałe , max. 15 letnie

- adekwatność - tzn że mają być obliczane dla takiej grupy do której należy osoba badana , oceniane to jest pod kątem demograficznym : płeć , wykształcenie , miejsce zamieszkania itp.

- reprezentatywność - mówi o stopniu uogólniania naszych wniosków

Co oznacza termin normy lokalne? Czy normy te różnią się od norm ogólnokrajowych?

Normy lokalne są obliczane dla wąskich grup i stopień ich reprezentatywności jest mały a normy ogólnokrajowe są obliczane dla prób reprezentatywnych , dla populacji całego kraju .

Próba normalizacyjna dla testu wiadomości składała się z maturzystów liceów ogólnokształcących z 1964 roku. Określ przydatność norm dla: a) maturzystów z 1965 roku; b) absolwentów szkoły dla głuchoniemych z 1964 roku; c) maturzysty z 1964 roku, który dwukrotnie powtarzał klasę; d) ucznia, który ze względu na wybitne zdolności ukończył szkołę w wieku o dwa lata niższym.

dobre
b) niedobre ( wszystko zależy od tego co mierzymy bo może chodzi o to jak dzieci głuchonieme wypadają na tle osób nie głuchoniemych ? )
dobre
dobre

Jakie informacje należy podać o normach, aby można je było właściwie wykorzystywać i dlaczego?

- rok powstania

- skład grupy normalizacyjnej

- sposób pobrania próby ( czy była reprezentatywna czy nie ? )

- kiedy , kto i jak pobrał próbę ?

Czy wynik testowy równy 80T równy jest 80 centylowi? Dlaczego?

Nie jest równy bo : T- to skala standardowa

C - to skala wentylowa

Powierzchnia pod rozkładem , która odpowiada > 80 T ( mieści się ok. 3 odchyleń standardowych tj 3% osób tu się mieści ) a > 80 C ( centyl oznacza wyniki osób , które otrzymały poniżej , tu się mieści 20% osób )

Dlaczego skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii?

Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych .

Dlaczego standardowe skale norm są tak bardzo popularne?

Bo są one skalami interwałowymi , co oznacza , że pozwalają na określenie różnic między badanymi osobami ( mówi o wielkości różnic , każdy uzyskał inny czas , o ile był szybszy ) . A skala C porządkowa wskazuje jedynie porządek , informacje na którym miejscu znalazł się dany np. zawodnik . Centyle to miejsca 1,2,3 ale nie podaje poziomu nasilenia cechy ( dobre w siatkach centylowych dot. rozwoju dziecka ) .

Dlaczego normalizacja rozkładu jest krokiem niezbędnym przy przeliczaniu wyników surowych na którąś ze skal standardowych?

Dlatego , że do interpretacji wyników wykorzystujemy właściwości rozkładu normalnego , czyli wyniki w zakresie : -1 +1 - wyniki przeciętne

1 2 - wyniki wysokie

2 3 wyniki bardzo wysokie

-1 -2 - wyniki niskie

-2 -3 - wyniki bardzo niskie jest to niezbędne

-3 -4 - wyniki skrajnie niskie

Pytanie dot znajomości skal standardowych ( nie ma go tu ) : wyniki T , steny , staniny ( średnia 5 odchyleń standardowych 2 ) , IQ ( średnia 100 odchyleń standardowych 15 ) , tetrony ( średnia 10 odchyleń standardowych 4 )

Dlaczego obliczamy moc dyskryminacyjną przed włączeniem zadań do ostatecznej wersji testu?

Bo do ostatecznej wersji testu powinniśmy włączyć pozycje testowe różnicujące badane osoby pod względem mierzonej cechy .

Jakich specyficznych informacji dostarcza analiza zadań?

Dostarcza 3 rodzaji informacji czy pozycje testowe są :

poprawne rzeczowo ( czy są wskaźnikami mierzonych właściwości )
o poprawności językowej ( czy zostały skonstruowane poprawnie językowo )
o właściwościach statystycznych poszczególnych pozycji )

Jakie znasz sposoby szacowania wielkości mocy dyskryminacyjnej zadań? Czym one się różnią między sobą?

Testy właściwości poznawczych

Testy właściwości afektywnych

Wskaźnik trudności średnia trudność całego testu ; plus minus 50% ( optymalna decyzja gdy różnicujemy grupę , w testach selekcyjnych ; im niższy wskaźnik trudności tym trudniejszy test - 10% to bardzo trudny test a 90% to test bardzo łatwy ; specyficzna selekcja - dot sytuacji selekcyjnych , chcemy odsiać 10% to robimy taki test a test który max różnicuje to wtedy 50% ; mechanizmem który bierze tu udział jest zgadywanie

Wskaźnik dyskryminacji testy dwukategorialne , test T-studenta , testy wielokategorialne ; korelacja wyniku danej pozycji z ogólnym wynikiem w teście - to są 3 metody ; np. przy testach 2 kategorialnych wskaźnik dyskryminacji się nie nadaje

Co to są style odpowiadania i jak można sobie radzić z tym źródłem błędu w pomiarze testowym?

Są to stałe , trwałe dyspozycje do odpowiadania w sposób pozatreściowy to są style odpowiadania jak sobie radzić - że są pewne metody gdy możemy działać na poziomie konstrukcji kwestionariusza albo na poziomie interpretacji wyników ( skale kontrolne ) .

Na czym polega empiryczna procedura konstrukcji testu?

Polega na sprawdzeniu na jakie pozycje testowe inaczej odpowiadają osoby z tzw grupy kryterialnej ( posiadają cechy ) i grupy kontrolnej ( nie posiadają cech ) ; istotą tej procedury jest znalezienie kryterium pozwalającej odróżnić te 2 grupy między sobą .

Wyszukiwarka