Metodologia - SPSS - Zastosowanie komputerów - Lipiec - Testy t, Metodologia - SPSS - Zastosowanie komputerów (osolek)


Testy t - analiza różnic między średnimi

Testy t służą do porównywania dwóch średnich.

Można je stosować pod warunkiem, że spełnione są dwa założenia:

1. rozkład badanej zmiennej w obu populacjach jest normalny

2. wariancje w porównywanych populacjach są jednorodne (podobne do siebie)

0x08 graphic
Wszystkie warianty testu t, dostępne w SPSS, znajdziemy w jednym miejscu:

Test t dla jednej próby służy do porównywania średniej uzyskanej w próbie z kryterium - np. wynikiem z wcześniejszych badań lub uzasadnionym teoretycznie.

5 lat przed przeprowadzeniem badania odbył się podobny wyścig i średni czas przepłynięcia wyznaczonego dystansu dla wszystkich pływaków wyniósł 160. Czy wyniki uzyskane w badaniu różnią się od tych sprzed 5 lat? (Innymi słowy - czy w ciągu 5 lat zmienił się średni czas pokonywania dystansu?)

Test t dla prób niezależnych służy do porównywania średnich uzyskanych w dwóch próbach, przy czym do każdej z nich należą inne osoby badane.

W każdej z konkurencji uczestniczyli inni pływacy. Czy wyniki konkurencji pływanie w morzu różnią się od wyników konkurencji pływanie w rzece?

Test t dla prób zależnych służy do porównywania średnich uzyskanych w jednej próbie ale dla dwóch zmiennych, reprezentujących kolejne pomiary jednej cechy.

Lekarz zbadał puls każdego z pływaków przed i po wyścigu - czy średni puls po wyścigu różni się od średniego pulsu przed wyścigiem?

Test t oparty jest na teoretycznym rozkładzie prawdopodobieństwa t-Studenta. Rozkład ten reprezentuje prawdopodobieństwo uzyskania różnych średnich przy pobieraniu z populacji wielu prób o wielkości takiej, jak próba badana. Jest to zatem rozkład z próby (rozkład wielu średnich z wielu prób), a nie rozkład wyników indywidualnych osób badanych.

Test t dla jednej próby.

5 lat przed przeprowadzeniem badania odbył się podobny wyścig i średni czas przepłynięcia wyznaczonego dystansu dla wszystkich pływaków wyniósł 160. Sporo jednak zmieniło się w ciągu tych 5 lat. Ludzie stali się sprawniejsi. Czy uwidoczniło się to w średnich czasach pokonywania dystansu wyścigu?

Wybieram test t dla jednej próby. Zmienną testowaną (zależną) jest czas pokonania dystansu, a wartością testowaną - kryterium z poprzedniego wyścigu, czyli 160.

Hipoteza zerowa:

nie ma różnic między wynikami w wyścigu obecnym i wynikami w wyścigu sprzed 5 lat; czyli:

średnia w próbie i kryterium są sobie równe; czyli inaczej mówiąc:

różnica między średnią a kryterium wynosi 0.

Hipoteza alternatywna:

średni czas uzyskany w badaniu i wynik sprzed 5 lat różnią się.

0x08 graphic

Dzięki opcjom mogę zaznaczyć wybrany przeze mnie przedział ufności wobec hipotezy zerowej. Kiedy zaznaczam 95 % - zakładam, że jeśli kryterium należy do 95% wyników najbardziej podobnych do otrzymanej średniej (czyli prawdopodobnie nie różnią się, pochodzą z jednej populacji) zaufam hipotezie zerowej i jej nie odrzucę. Jeśli jednak kryterium należy do pozostałych 5% wyników najmniej podobnych do otrzymanej średniej - odrzucę hipotezę zerową i przyjmę alternatywną.

Po wykonaniu testu otrzymuję RAPORT.

W górnej tabeli znajduję podstawowe statystyki dla rozkładu opartego na wartości uzyskanej przeze mnie w próbie: średnią, odchylenie standardowe i błąd standardowy średniej - czyli o ile "przeciętnie" średnia uzyskana w próbie różni się od średniej w populacji.

W dolnej tabeli znajduję wynik testu t (0,768), liczbę stopni swobody dla tego testu (dla jednej próby zawsze N-1) i istotność testu (0,449). Istotność oznacza, że istnieje 44,9 % szans na to, że średnia i kryterium pochodzą z tej samej populacji - prawdopodobieństwo to jest zbyt duże, by odrzucić hipotezę zerową.

Na końcu tabeli znajduje się przedział ufności obejmujący 95% wyników najbardziej podobnych do średniej. Jego środkiem jest różnica między średnią a kryterium (różnica średnich = 4,47). Możemy tu jeszcze raz zobaczyć, że 0, czyli brak różnicy, postulowany przez hipotezę zerową, znajduje się wewnątrz przedziału ufności - a zatem należy do wyników podobnych do uzyskanej średniej.

Wynik testu zapisujemy następująco: t(29) = 0,768, n.i. (czyli nie istotny)

Konkluzja z badania: Nie można odrzucić hipotezy zerowej, badanie jest niekonkluzywne.

0x08 graphic

UWAGA:

Gdyby istotność testu t była niższa od 0,05 (prawdopodobieństwo, że jest prawdziwa niższe niż 5%), to przy wyniku testu zapisalibyśmy:

p<0,05 lub p<0,01 lub p<0,001

W piśmiennictwie używane są tylko te trzy progi i zapis „ p mniejsze niż”.

Jeśli hipoteza zerowa jest tak mało prawdopodobna, to konkluzja z badania brzmi:

Odrzucamy hipotezę zerową i przyjmujemy alternatywną.

Test t dla prób niezależnych.

0x08 graphic
W każdej z konkurencji uczestniczyli inni pływacy. Czy wyniki konkurencji pływanie w morzu różnią się od wyników konkurencji pływanie w rzece?

Wybieram test t dla prób niezależnych. Zmienną testowaną (zależną) jest czas pokonania dystansu, zmienną grupującą - konkurencja, czyli gdzie odbywał się wyścig. Definiuję jeszcze grupy - zgodnie z wartościami jakie przypisałam konkurencji. Opcje służą do tego samego, co w teście t dla jednej próby.

Hipoteza zerowa:

nie ma różnic między wynikami w wyścigu w morzu i wynikami w wyścigu w rzece; czyli:

średnie są sobie równe; czyli inaczej mówiąc:

różnica między średnimi wynosi 0.

Hipoteza alternatywna:

średnie wyniki w konkurencjach różnią się.

Po wykonaniu testu otrzymuję RAPORT.

W górnej tabeli znajduję podstawowe statystyki dla rozkładu opartego na wartościach uzyskanych przeze mnie w próbach wydzielonych na podstawie zmiennej grupującej: średnią, odchylenie standardowe i błąd standardowy średniej (czyli o ile "przeciętnie" średnia uzyskana w próbie różni się od średniej w populacji).

0x08 graphic

W dolnej tabeli raportu znajduję na początku wynik testu Levena, porównującego wariancje w obu próbach. Ponieważ założeniem testu t jest równość wariancji, zależy mi na tym, aby prawdopodobieństwo (istotność) zdarzenia "założono równość wariancji” było wysokie. Dlatego cieszy mnie istotność 0,277 - zbyt wysoka, aby to twierdzenie odrzucić.

(Gdyby okazało się, że istotność tego twierdzenia jest bardzo niska, powinnam dalej korzystać z danych w wierszu drugim, przy twierdzeniu nie założono równości wariancji. Są one opracowane z poprawką, pozwalającą skorygować złamanie założenia testu t).

Odczytuję dalej wynik testu t (-0,282), liczbę stopni swobody dla tego testu (dla prób niezależnych zawsze N-2) i istotność testu (0,780). Istotność oznacza, że istnieje 78 % szans na to, że obie średnie pochodzą z tej samej populacji - prawdopodobieństwo to jest zbyt duże, by odrzucić hipotezę zerową.

Na końcu tabeli znajduje się przedział ufności obejmujący 95% wyników najbardziej podobnych do jednej ze średnich. Jego środkiem jest różnica między średnich (różnica średnich = 3,33). Możemy tu jeszcze raz zobaczyć, że 0, czyli brak różnicy, postulowany przez hipotezę zerową, znajduje się wewnątrz przedziału ufności - a zatem należy do wyników podobnych do uzyskanej średniej.

Wynik testu zapisujemy następująco: t(28) = -0,277, n.i. (czyli nie istotny)

Konkluzja z badania: Nie można odrzucić hipotezy zerowej, badanie jest niekonkluzywne.

Zastosowanie komputerów, semestr zimowy 2004/2005, mgr Ewa Lipiec



Wyszukiwarka