TESTY PARAMETRYCZNE DLA DWÓCH PRÓB NIEZALEŻNYCH
Test t-studenta (test t) - teoria
Obie próby powinny mieć rozkład normalny i być próbami losowymi o równych wariancjach. W praktyce jednak
okazało się, że test ten jest stosunkowo odporny na odstępstwa od powyższych wymagań (oprócz losowości próby).
Jeśli próby pochodzą z populacji odbiegających rozkładem od rozkładu normalnego, to zaleca się stosować poziom
istotności mniejszy niż 0,01.
Jeśli wariancje obu prób nie są równe, to prawdopodobieństwo popełnienia błędu I rodzaju ma tendencję wzrostową
ale przy większych próbach (n>100) i dla poziomu istotności 0,01 nie ma to większego znaczenia pod warunkiem, że
liczebności prób różnią się najwyżej o 10%.
Jeżeli jednak większa wariancja dotyczy próby o mniejszej liczebności, a mniejsza wariancja bardziej licznej próby -
prawdopodobieństwo popełnienia błędu I rodzaju wzrasta. W takiej sytuacji należy stosować zamiast klasycznego
testu t-Studenta jego odmianę dostosowaną do prób o nierównych wariancjach (statystyka t zamiast t) lub
nieparametryczny test Manna-Whitneya.
Liczebność prób nie powinna mniejsza niż 10. Przy tak małych próbach sprawdzenie założeń testu jest
problematyczne
Odmiana testu t-studenta dla nierównych wariancji w obu próbach (statystyka t') nazywany jest testem Cochrana-
Coxa lub testem t z oddzielną oceną wariancji.
TESTY NIEPARAMETRYCZNE DLA DWÓCH PRÓB NIEZALEŻNYCH
Test serii Walda-Wolfowitza
Seria ciągła sekwencja elementów jednej próby ograniczona elementami drugiej próby lub końcem (początkiem
rozkładu):
AAAAABBBBBB 2 serie
AABBAABB 4 serie
AAAAABBBBAABABBBBBBBBB 6 serii
AAAAAAAAAABBBBBBBBBBBBB układ nielosowy ABABABABABABABABABA układ losowy
H0: Rozkład serii jest losowy (przypadkowy) HA: Rozkład serii nie jest losowy
Test serii jest testem stosunkowo słabym (konserwatywnym). Zamiast niego zaleca się stosowanie testu Manna-
Whitneya.
Test Manna-Whitneya (U-test)
" Nieparametryczny odpowiednik testu t-Studenta dla dwóch prób niezależnych.
" Weryfikuje hipotezę, że obie próby pochodzą z tej samej populacji, tzn. nie różnią się rozkładem badanej
cechy.
" Należy go stosować w sytuacjach, gdy nie spełnione są warunki dla testu t.
" Może być używany do prób o małych liczebnościach, gdy nie jest możliwe oszacowanie zgodności rozkładu
danej cechy z rozkładem normalnym.
" Może być stosowany także do danych w skali porządkowej.
Gdy liczebności obu prób są mniejsze od 20 obliczana jest statystyka U. Dla bardziej licznych prób stosuje się
statystykę Z.
Obliczenia w teście Manna-Whitneya są wykonywane w oparciu o rangi pomiarów, a nie o ich wartości. W praktyce
test ten weryfikuje hipotezę o równości median w dwóch próbach.
TESTY PARAMETRYCZNE DLA DWÓCH PRÓB ZALEŻNYCH
Test t-Studenta dla dwóch prób zależnych
Wymaga spełnienia następujących warunków:
1. Każdy pomiar (obserwacja) z pierwszego zbioru danych może być powiązany z jednym i tylko jednym pomiarem z
drugiego zbioru danych
2. Rozkład różnic między powiązanymi obserwacjami jest zbliżony do rozkładu normalnego
TESTY NIEPARAMETRYCZNE DLA DWÓCH PRÓB ZALEŻNYCH
Test Wilcoxona
Nieparametryczny odpowiednik testu t-Studenta dla dwóch prób zależnych. Analizowane zmienne muszą być
zmierzone co najmniej w skali porządkowej.
Gdy liczba par jest większa niż 25 oblicza się statystykę Z, natomiast dla mniejszej liczby par statystykę T.
TESTOWANIE HIPOTEZ DOTYCZCYCH WIELU PRÓB
ANALIZA WARIANCJI ANOVA
Wariancja wskazuje na zmienność danej cechy w próbie. Gdyby wartości wszystkich elementów w próbie były takie
same, to wariancja wynosiła by zero.
ZADANIA Pomierzono w trzech kolejnych sezonach zimowych w Gdańsku zmierzono po 30 młodych łysek. Należy
sprawdzić czy średnia długość skrzydła u tego gatunku w kolejnych latach jest taka sama (czy ptaki te pochodzą z tej
samej populacji).
rok Średnia N Wariancja
1990 202,2 30 7,63
1991 202,4 30 4,52
1992 201,0 30 6,21
Ogół grup 201,9 90 6,36
Wariancja ogólna (na podstawie wszystkich 90 pomiarów) 6,36
Wariancja wewnątrzgrupowa (średnia arytmetyczna ważona z 3 wariancji) 6,12
Wariancja międzygrupowa (wariancja między średnimi) 0,5678 * 30 = 17,03
(Wartość wariancji obliczonej ze średnich należy pomnożyć przez liczebność grup)
Gdyby pomiary pochodziły z różnych populacji, to zmienność (wariancja) między grupami byłaby większa niż
wewnątrz grup.
Do oceny czy wariancja międzygrupowa istotnie różni się od wariancji wewnątrzgrupowej stosuje się statystykę F
(test F). Wartość statystyki F otrzymuje się dzieląc międzygrupową sumę kwadratów odchyleń przez
wewnątrzgrupową sumę kwadratów odchyleń. Jeśli wartość F jest mniejsza od 1, lub wariancja międzygrupowa jest
mniejsza od 1, to w takim przypadku hipotezę zerową przyjmuje się od razu.
OGRANICZENIA ANOVA
ANOVA dotyczy danych w skali interwałowej lub ilorazowej. Podobnie jak przy innych procedurach parametrycznych
istnieją pewne warunki, które muszą zostać spełnione, aby móc stosować ANOVA:
" Próby powinny być niezależne i losowe
" Wariancje w poszczególnych grupach muszą być sobie równe
" Każda z prób musi pochodzić z populacji o rozkładzie normalnym
" Średnie w grupach nie mogą być skorelowane z wariancjami (tzw. model addytywny)
1) ANOVA ZGODNOŚĆ Z ROZKAADEM NORMALNYM
Założenie o normalności rozkładu dotyczy każdej z badanych prób. W przypadku rozkładów skrajnie odbiegających
od rozkładu normalnego zaleca się transformację danych lub stosowanie nieparametrycznego odpowiednika ANOVA
testu Kruskala-Wallisa.
2) ANOVA JEDNORODNOŚĆ WARIANCJI
Do sprawdzenia założenia o jednorodności wariancji służą testy porównujące wariancje w próbach.
Test Levena w ostatnich latach krytykowany za nieodporność na odchylenia od normalności rozkładów w próbach.
Test Browna Forsythe a ostatnio bardziej polecany od testu Levena ze względu na większą odporność na
odchylenia od normalności rozkładów w próbach.
Test Bartletta może dawać mylne wyniki przy odstępstwach od normalności rozkładów w próbach.
Test Hartleya i test Cochrana wymagają by liczebności w próbach były jednakowe.
3) ANOVA BRAK KORELACJI MIDZY ŚREDNIMI I WARIANCJAMI
Do sprawdzenia tego założenia służy wykres punktowy pokazujący zależność wariancji (lub odchylenia
standardowego) od średniej w grupach.
Punkty na wykresie nie mogą układać się wzdłuż przekątnej.
Takie ułożenie wskazuje na korelację wariancji i średnich (im większa wartość średniej, tym większa wariancja) tzw.
multiplikatywność
średnia średnia
wariancja
wariancja
ANALIZA WARIANCJI - testy post-hoc
ANOVA nie daje odpowiedzi które próby różnią się między sobą. Do sprawdzenia istotności różnic między
poszczególnymi próbami służą testy post-hoc (a-posteriori).
Testy post-hoc (a-posteriori) wykonuje się wyłącznie po ANOVA, gdy ANOVA wykazała istotne różnice między
próbami.
Test Scheffego test najbardziej konserwatywny. Prawdopodobieństwo odrzucenia prawdziwej H0 jest stałe i
najmniejsze spośród testów post-hoc, niezależnie od liczby porównywanych prób.
Test Tukeya test mniej konserwatywny od poprzedniego. Prawdopodobieństwo odrzucenia prawdziwej H0 jest
stałe, niezależnie od liczby porównywanych prób.
Test Tukeya dla grup o nierównej liczebności nazywany jest testem Spjotvolla i Stolinea.
Test Newmana-Keulsa test mniej konserwatywny od poprzednich. Prawdopodobieństwo odrzucenia prawdziwej
H0 nie jest stałe i wzrasta wraz z liczbą porównywanych prób. Nie jest polecany gdy liczba porównywanych grup jest
duża.
Test Duncana test najmniej konserwatywny. Prawdopodobieństwo odrzucenia prawdziwej H0 nie jest stałe i
wzrasta wraz z liczbą porównywanych prób. Np. przy k=10 i ą=0,05, prawdopodobieństwo popełnienia błędu I
rodzaju wynosi 0,40 (40%). Nie jest polecany gdy liczba porównywanych grup jest duża.
Jeśli w badaniach koncentrujemy się na prostym porównaniu średnich w próbach, to najbardziej polecany jest test
Tukeya.
Wyszukiwarka
Podobne podstrony:
6) Test dla dwóch wariancjiTesty z farmakologii dla stomatologów i lekarzy odpowiedziInformatyka testy i zadania dla klas 4 6Testy parametryczne4) Test dla dwóch procentów (wskaźnika struktury)testy kliniczne dla dzieci[1]2) Test dla dwóch średnichwyklad 5 Testy parametryczne PL [tryb zgodności]więcej podobnych podstron