5660


WYKŁAD X (09.05.07)

Istnieją trzy testy t:

1. Dla jednej próby,

2. Dla prób niezależnych,

3. Dla prób zależnych - stosuje się przy obrazowaniu mózgu (zależność między jednym wynikiem a drugim wynikiem).

Testy t można stosować, gdy wariancje w próbach nie różnią się istotnie od siebie (bardziej ortodoksyjna wersja) oraz gdy rozkład badanej cechy jest normalny i gdy dane zebrane zostały przy pomocy skali przedziałowej.

Nominalna liczba pomiarów - 10 w grupie lub 10 par.

W wersji ortodoksyjnej testy t można stosować, gdy spełnione są równocześnie następujące warunki:

  1. wariancje w próbach nie różnią się od siebie istotnie - patrz test f (rozrzut danych w obydwu rozrzutach jest podobny),

  2. rozkład badanej cechy musi być normalny, dwie próby różnią się średnimi, ale mają podobne rozkłady,

  3. pomiar danych musi być na skali przedziałowej albo stosunkowej,

  4. co najmniej 10 pomiarów.

Czy można liczyć wariancję, kiedy rozkład nie jest normalny? - tak.

Każdy test statystyczny służy do odpowiedzi czy dane które uzyskałem nie są przypadkiem. Jeżeli wariancja jest wyższa w mianowniku niż w liczniku, to wynik będzie mniejszy niż 1. Jeżeli będzie odwrotnie, wynik będzie większy. Test F (uwaga: zawsze wielka litera F) to test polegający na podzieleniu jednej wariancji przez drugą. Jeżeli wariancje są sobie równe, wartość F wynosi 1. W praktyce zawsze dzielimy większą wariancję przez mniejszą.

Wylosowaliśmy nieskończenie wiele próbek z populacji, z każdej z tych próbek liczę wariancję.

Jednostronność wariancji - test Levene'a, zawsze test jednostronny, w przypadku testu t interesuje nas nie odrzucenie hipotezy zerowej.

Zawsze należy sprawdzić wartość testu F (podzielenia większej wariancji przez mniejszą).

Jeżeli istotność testu F jest mniejsza niż 0,05 wtedy nie należy stosować testu t.

Reguła rzeki Missisipi: przy bardzo dużych próbach testy t zawsze wychodzą istotne - powiedzenie dotyczy mieszkańców USA - cokolwiek byśmy nie porównywali, zawsze mieszkańcy z jednej strony rzeki będą różnić się od mieszkańców z drugiej strony

Czasami zdarza się że ludzie stosują testy t dla 8 osób i uchodzi im to płazem. Jeżeli robimy jakiekolwiek badanie eksperymentalne czy różnicowe, to jeżeli badam, musze mieć 20 osób w jednej grupie lub 20 par wyników (taka jest tradycja w swps).

Kiedy nie możemy stosować testu t? Kiedy wyniki są na skali porządkowej, nie mają rozkładu normalnego i mają niejednorodne wariancje - chociaż coraz powszechnie dwa pierwsze założenie się omija .

Skąd wiemy co się dzieje w przypadku kiedy będziemy stosować test t, a nie będzie on zgodny z założeniami? W latach `60 zaczęto opracowywać dział „montecarlo”. Statystycy zaczęli zmyślać różne dane i zaczęli się tym bawić.

Stanisław Ulam - polski matematyk, członek szkoły lwowsko-warszawskiej. W okresie międzywojennym zgromadziła się grupa geniuszy z logiki, filozofii, itp. Wśród nich był też jeden psycholog. Dwie najważniejsze postaci: Stefan Banach i Alfred Tarski. Jednym z członków był Stanisław Ulam, pracował nad projektem „manhattan project”. Ulam układał sobie pasjansa i chciał zobaczyć jak często występuje dana sekwencja kart. Zamiast stosować obliczenia, lepiej sprawdzić rzucając 100 razy kostką.

Co można zrobić kiedy nie możemy stosować testów t?

1. Wykorzystać metody montecarlo (repróbkowanie). Polega na tym, że wszystkie wyniki mogę wrzucić do jednego zbioru i przypadkowo podzielić na dwie grupy. I tak w kółko. Jak będę tak robić 100 000 razy i będę sprawdzać czy jest różnica między średnimi, znaczy że moja różnica nie jest dziełem przypadku.

2. Testy nieparametryczne - testy statystyczne, których stosowanie nie wymaga uwzględnienia parametrów rozkładów zmiennych. Inaczej nazywane niezależnymi od rozkładu. Stosowanie ich nie wymaga żadnych założeń.

Najprostszy test nieparametryczny - ma się nijak do testów t. Test serii Walda Wolfowitza. Przykład: chodzą ludzie na wykład. Czy mają tendencję do tego żeby wchodzić razem? Gdyby wchodzili oddzielnie i chodziłoby tyle samo chłopców i tyle samo dziewczynek, powinni wchodzić na zmianę. Sprawdza czy w serii wyników które mam, seria wyników jest przypadkowa.

Często testy nieparametryczne nazywane są statystykami liczącymi (książka Czesława Domańskiego).

Test U Manna-Whitneya (test nieparametryczny) - stosujemy zamiast testu t dla danych niezależnych, gdy F mniejsze niż 0,05. Wymagane żeby dane były co najmniej na skali porządkowej (rangowej - dane na skali przedziałowej i stosunkowej i tak można porangować, w praktyce robi to spss). Mamy dwie grupy osób badanych 10osobowych. Możemy obliczyć średnią w pierwszej grupie i drugiej, następnie je porównać, wtedy jest test t. Gdy nie możemy tego zrobić, możemy te dwie grupy połączyć razem i po kolei rangować wyniki.

Jeżeli jest duża różnica tych rang, to wyniki nie były rozrzucone przypadkowo. Jeśli jest mała znaczy że były rozrzucone przypadkowo.

Wyniki tego testu można przybliżyć za pomocą wyników standaryzowanych „z” (średnia = 0, odchylenie = 1).

Test Wilcoxona - test znaków i rang różnic. Stosujemy gdy nie można zastosować testu t dla danych zależnych.

Czy większa jest szansa uzyskania w tym teście wyników dużych czy małych? Liczę sumę rang wyników które są ze znakiem rzadziej występującym. Czyli im niższa, tym lepiej.

Liczymy różnice między wynikami, rangujemy je, wyniki możemy zamienić na wartości standaryzowane z.

Test znaków - stosujemy, gdy nie możemy stosować testu t dla danych zależnych. Czyli tak samo jak w teście powyżej. Stosowanie go ma sens, gdy rozrzut wyników jest bardzo mały.

Jeżeli hipotezę zerową odrzucimy wykorzystując test nieparametryczny, to odrzucimy ją również w teście t (nie można na odwrót !!!).

4



Wyszukiwarka

Podobne podstrony:
5660
5660
5660
5660
5660
5660

więcej podobnych podstron