04.11.2012
Wykład 4
Jak na podstawie wyniku otrzymanego (pojedynczego pomiaru) określić wynik prawdziwy?
Możliwe jest jedynie określenie przedziału w którym z określoną dokładnością znajduje się wynik prawdziwy
Standardowy błąd pomiaru
Standardowy błąd pomiaru jest odchyleniem standardowym rozkładu błędów pomiaru (X-T) wokół wyniku otrzymanego. Jest to błąd, który popełniamy przyjmując, że wynikiem prawdziwym osoby badanej jest średni wynik, jaki uzyskałaby ona w nieskończenie wielu pomiarach.
rozkład błędów pomiaru (X-T) jest bezpośrednio nie obserwowalny
Utożsamienie Sx rozkładu pomiarów populacji badanych i Sx rozkładu nieskończenie wielkiej liczby pomiarów jednej osoby
Ponieważ błąd ma charakter losowy, to wyniki otrzymane nie zawsze będą takie same.
Błąd pomiaru to różnica między wynikiem otrzymanym a wynikiem prawdziwym.
Zakładamy że rozkład zarówno błędu pomiaru jak i wyniku otrzymanego ma taki sam kształt.
Rozkład różnic X-T (błędów pomiaru E)
Rozkład różnic X-T (błędów pomiaru E)
Przedział ufności
W statystyce stosuje się przedziały ufności gdy np. chce się oszacować wartość jakiegoś parametru na podstawie danych z próby.
Pamiętajmy, że badamy tylko próbę!
Wynik prawdziwy mieści się w takim przedziale ufności.
Do wyniku otrzymanego należy dodać i odjąć odpowiednią (zależną od poziomu istotności) wielokrotność SEM:
półprzedział ufności
Wielkość zၡ/2 zależy od tego z jak dużą pewnością chcemy mówić o wyniku prawdziwym. Wartości zၡ/2 sprawdza się w tabelach rozkładu normalnego (bo SEM ma rozkład normalny)
dolna granica przedziału ufności
górna granica przedziału ufności
Wynik prawdziwy zawiera się w tym przedziale, przy założeniu, że granice przedziału należą do przedziału
Ocena rzetelności indywidualnego wyniku
inaczej
Ocena rzetelności indywidualnego wyniku
Przedział ufności dla wyniku otrzymanego pozwala na określenie granic, w których - z przyjętym prawdopodobieństwem - znajduje się wynik prawdziwy osoby badanej
STANDARDOWY BŁĄD POMIARU (SEM)
<X - zၡ/2 SEM ; X+ zၡ/2 SEM>
Przykładowe wartości z tabel rozkładu normalnego:
Procent rozkładu/ poziom ufności |
zၡ/2 |
90% |
1,64 |
95% |
1,96 |
99% |
2,58 |
Jeśli przedział ufności to 90%, to α to 10%;
Widać więc wyraźnie, że im większą chcemy mieć pewność co do tego jaki jest wynik prawdziwy tym większy staje się przedział, w którym ten wynik się znajduje:
Np. wyobraźmy sobie, że wynik otrzymany wynosi 100 i SEM=5
Z 90% pewnością możemy powiedzieć, że wynik prawdziwy (T) mieści się w przedziale
<100 - 1.64 * 5 ; 100 + 1.64 * 5> czyli około <92;108>
Z 99% pewnością wynik mieści się natomiast w większym przedziale:
<100 - 2.58 * 5 ; 100 + 2.58 * 5> czyli około <87;113>
Przy większym prawdopodobieństwie przedział ufności jest szerszy.
Jaki wybrać poziom ufności:
należy wybierać 90% przy diagnozie indywidualnej i 95% przy badaniach naukowych
najistotniejsze jest to, że
NIE JEST WAŻNY JEDEN WYNIK TYLKO PRZEDZIAŁ, bo pojedynczy wynik zawsze jest obciążony błędem, dlatego zawsze należy obliczyć przedział ufności.
Możliwa jest jednak nie tylko przedziałowa ale też punktowa estymacja wyniku prawdziwego
Teoretycznie wyniki otrzymane powinny korelować z wynikami prawdziwymi. Ale w rzeczywistości nie zawsze tak bywa. Można wyznaczyć prostą, która jest przybliżeniem takiej relacji.
Estymowany wynik prawdziwy
estymowany wynik prawdziwy prawie zawsze znajduje się pomiędzy wynikiem otrzymanym i średnią wyników otrzymanych; wyniki na środku są najbardziej prawdopodobne, a te skrajne są najmniej prawdopodobne; wynik otrzymany może być zatem zaniżony lub zawyżony w stosunku do wyniku prawdziwego; istnieje pewna zależność między wynikiem otrzymanym a wynikiem prawdziwym;
im większa rzetelność testu tym bliżej wyniku otrzymanego znajduje się estymowany wynik prawdziwy
im mniejsza rzetelność testu tym bliżej średniej wyników otrzymanych znajduje się estymowany wynik prawdziwy;
jeśli rzetelność testu wynosi 1, to estymowany wynik prawdziwy jest równy wynikowi otrzymanemu (bo pomiar jest bezbłędny); choć takie sytuacje się raczej nie zdarzają;
jeśli rzetelność testu wynosi 0, to estymowany wynik prawdziwy jest równy średniej wyników otrzymanych (bo pomiar jest całkowicie losowy);
im bardziej od średniej odległy jest wynik otrzymany, tym bardziej zwiększa się dystans pomiędzy wynikiem otrzymanym i estymowanym wynikiem prawdziwym;
jeśli wynik otrzymany jest równy średniej wyników otrzymanych to estymowany wynik prawdziwy jest równy wynikowi otrzymanemu.
Rozkład normalny
Podejście oparte na estymowanym wyniku prawdziwym łamie założenie Gulliksena o niezależności błędu pomiaru od wyniku prawdziwego
Nie wiadomo czy punktowo estymowany wynik prawdziwy różni się od wyniku prawdziwego i o ile się od niego różni
Standardowy błąd estymacji SEE
SEE jest standardowym odchyleniem rozkładu różnic T* i T
Rozkład wynikający z różnicy błędów estymacji; Żeby policzyć standardowy błąd estymacji, należy najpierw obliczyć standardowy błąd pomiaru;
SEM a SEE
Lord i Novick zaproponowali inne niż Gulliksen rozumienie standardowego błędu pomiaru - standardowy błąd estymacji (SEE) wyniku otrzymanego, który jest zależny od wyniku prawdziwego.
Standardowy błąd estymacji ma rozkład symetryczny wokół estymowanego wyniku prawdziwego i niesymetryczny wokół wyniku otrzymanego (ściśle - jest symetryczny dla wyników średnich i skośny dla wyników skrajnych).
W praktyce jednak, bardziej „zachowawcze” jest stosowanie SEM, a różnica jest subtelna, wynika to z następującej relacji:
Teoretyczny rozkład nieskończenie wielkiej liczby pomiarów jednej osoby
Przedział ufności oparty na SEE
Jak porównać dwa wyniki testowe?
Każdy wynik obarczony jest błędem. To co nas interesuje - to to, czy wyniki prawdziwe da się porównać między sobą; czy różnica między wynikami otrzymanymi będzie taka sama jak między wynikami prawdziwymi?
Standardowy błąd różnicy SEMD
SEMD jest standardowym odchyleniem rozkładu różnic E1 - E2 (dwa te same pomiary)
Prawdziwa różnica między dwoma wynikami / pomiarami.
Przedział ufności dla różnicy między dwoma wynikami otrzymanymi
inaczej
Przedział ufności dla różnicy między dwoma wynikami otrzymanymi
Przedział ufności dla różnicy między dwoma wynikami otrzymanymi pozwala na określenie granic, w których - z przyjętym prawdopodobieństwem - znajduje się prawdziwa różnica między dwoma wynikami
Standardowy błąd różnicy między dwoma wynikami
Oceniając istotność różnicy między dwoma wynikami posługujemy się wzorem:
Gdy obliczamy różnicę między wynikami dwóch różnych testów, przyjmuje on postać:
Gdy obliczamy różnicę między wynikami dwóch osób badanych tym samym testem:
Jeżeli
to:
jest istotna statystycznie (wyniki prawdziwe z założonym prawdopodobieństwem są różne). Wystarczy sprawdzić, czy w konkretnym przypadku dwóch pomiarów ta nierówność jest prawdziwa. Zaobserwowanych różnic nie można przypisać tylko występowaniu błędu pomiaru.
Psychometria
Dr Krzysztof Fronczyk
Semestr 5
- 8 -