0 bNieparametryczne testy istotności, testy rozkładów:
NIEPARAMETRYCZNE TESTY ISTOTNOŚCI:
Ogólne informacje odnośnie testów nieparametrycznych:
Nie wymagają założeń
Analiza danych jakościowych i danych uporządkowanych
Analiza danych pochodzących z małych prób
Nie zależą od pewnych parametrów rozkładu populacji
Nieznane są rozkłady zmiennych losowych
Mają mniejszą moc od testów parametrycznych, ale przewyższają je w prostocie budowy i mało uciążliwych rachunkach
BADANIE RÓŻNIC MIĘDZY PRÓBAMI NIEZALEŻNYMI:
Test U Manna - Whitney'a:
Zastosowanie:
Dla zmiennych mierzalnych, których rozkład nie jest zgodny z rozkładem normalnym (rangi) - w takim przypadku możemy hipotezę zerową formułować jako brak istotnej różnicy średnich arytmetycznych; oczywiście test Manna i Whitney'a możemy też zastosować do danych spełniających założenia testu t-Studenta; jego moc wynosi wówczas około 95% mocy testu t-Studenta
Dla zmiennych mierzalnych typu porządkowego (miarą tendencji centralnej jest mediana) - w tym przypadku hipoteza zerowa zakłada, że badane grupy pochodzą z tych samych populacji, tzn. rozkłady danych w analizowanych grupach nie różnią się istotnie; dla danych porządkowych nie można bowiem obliczać wartości średniej
Jest najmocniejszą nieparametryczną alternatywą dla testu t dla prób niezależnych
Przygotowanie do przeprowadzenia testu:
Punktem wyjścia w teście Manna i Whitney'a jest nadanie wynikom obserwacji rang.
Rangowanie przeprowadzamy następująco:
1. Porządkowanie rosnąco wartości obu prób.
2. Zaczynając od wartości najmniejszej (lub największej), przyporządkowuje się poszczególnym obserwacjom kolejne liczby naturalne.
3. W przypadku wystąpienia wartości jednakowych przyporządkowywanie im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno im się przypisać).
Procedura:
Formułowanie hipotezy zerowej H0 oraz alternatywnej H1
H0: nie ma różnic pomiędzy medianami
H1: jest istotna różnica pomiędzy medianami
Poziom istotności α=0,05 lub α=0,01
Sprawdzenie założeń modelu:
rozważana zmienna jest mierzalna lub w skali porządkowej (rangowej)
Z dwóch prób tworzy się jedną próbę uporządkowaną i ranguje obserwacje.
Wyliczenie wartości sprawdzianu
U1 = n1*n2 + ½ * n1 (n1 + 1) - R1 R1 - suma rang określonych dla pierwszej próby
U2 = n1*n2 + ½ * n2 (n2 + 1) - R2
Bierzemy mniejszą z otrzymanych wartości (oznaczoną jako Ud) i porównuje się ją z wartością krytyczną odczytaną z tablic.
Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej:
p<α - odrzucamy H0 i przyjmujemy H1
p>α - nie ma podstaw do odrzucenia H0
Ud < Uk - odrzucamy H0 i przyjmujemy H1
Interpretacja wyników.
Test serii Walda Wolfowitza
Test Kołomogorowa-Smirnowa
BADANIE RÓŻNIC MIĘDZY PRÓBAMI ZALEŻNYMI:
Test znaków
Test Wilcoxona dla par obserwacji (rangowanych znaków) - test kolejności par Wilcoxona:
Zastosowanie:
Dla zmiennych mierzalnych, których rozkład nie jest zgodny z rozkładem normalnym.
Dla danych typu porządkowego i nie można obliczyć wartości średniej (miara tendencji centralnej - mediana)
Uwzględnia znak różnic pomiędzy rozkładami, ich wielkość oraz kolejność.
Ma moc zbliżoną do mocy testu t
Procedura:
Formułowanie hipotezy zerowej H0 oraz alternatywnej H1
H0: wyniki obu prób są jednakowe
badane próby pochodzą z tej samej populacji
nie ma istotnej różnicy między rozkładami danych w dwóch grupach
H1: wyniki obu prób są różne
badane próby pochodzą z różnych populacji
jest istotna różnica między rozkładami danych w dwóch grupach
Poziom istotności α=0,05 lub α=0,01
Sprawdzenie założeń modelu:
zmienna mierzalna lub typu porządkowego
Obliczenie wartości statystyki testu na podstawie danych z badanej próby:
obliczenie różnicy między wartości uzyskaną w pierwszym badaniu i wartością uzyskaną w drugim badaniu
uporządkowanie różnic w szereg rosnący i przypisanie im rang
osobne sumowanie rang różnic dodatnich i rang różnic ujemnych
mniejsza z otrzymanych sum to wartość testu Wilcoxona
Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej
Interpretacja wyników.
Test McNemary: - zagadnienie 8
i test Q Cochrana:
Zastosowanie:
jest uogólnieniem testu McNemary na więcej niż dwie próby.
zmienną zależna dychotomiczna - jak w McNemary (np. zdarzenie zaszło lub nie, odpowiedź jest poprawna lub zła)
dokonuje się całej serii pomiarów. Ocenia się, czy kolejne liczebności lub proporcje różnią się istotnie między sobą.
Wyniki pomiarów zapisujemy w tabeli, w której liczba rubryk poziomych odpowiada liczbie przebadanych osób, a liczba rubryk pionowych - liczbie dokonanych pomiarów zmiennej niezależnej.
BADANIE n PRÓB - NIEPARAMETRYCZNE ODPOWIEDNIKI ANALIZY WARIANCJI:
Test Friedmana
Test Q Cochrana
Test Kruskala - Wallisa:
Zastosowanie:
Nieparametryczny odpowiednik jednoczynnikowej analizy wariancji
służy do dokonania porównań wielu grup (maksymalnie można porównywać 10 grup)
sprawdzenie czy n niezależnych próbek pochodzi z tej samej populacji, czy z populacji z taką samą medianą.
poszczególne próbki nie muszą mieć takie same liczebności.
Dla danych mierzalnych, ale ich rozkłady nie jest zgodny z rozkładem normalnym lub wariancje są niejednorodne
Dla danych typu porządkowego i nie można obliczyć wartości średniej (miarą tendencji centralnej jest mediana)
Przygotowanie do przeprowadzenia testu:
Rangi nadane wynikom obserwacji są punktem wyjścia do wyliczenia wartości opisywanych testów.
Proces rangowania przebiega następująco:
Porządkujemy rosnąco wartości obu prób.
Zaczynając od wartości najmniejszej (lub największej), przyporządkowujemy poszczególnym obserwacjom kolejne liczby naturalne.
W przypadku wystąpienia wartości jednakowych przyporządkowujemy im tzw. rangi wiązane (średnia arytmetyczna z rang, jakie powinno się im przypisać).
Procedura:
Formułowanie hipotezy zerowej H0 oraz alternatywnej H1
H0: nie ma istotnej różnicy między medianami zmiennej w badanych populacjach
pomiary we wszystkich porównanych próbach pochodzą z tej samej populacji
H1: jest istotna różnica między medianami zmiennej w badanych populacjach
pomiary nie we wszystkich porównanych próbach pochodzą z tej samej populacji
Poziom istotności α=0,05
Sprawdzenie założeń modelu:
zmienna mierzalna lub typu porządkowego
Obliczenie wartości statystyki testu na podstawie danych z badanej próby:
wyznaczenie rang dla każdej wartości w badanych grupach
sumowanie rang w poszczególnych grupach
jeżeli wszystkie próby pochodzą z tej samej populacji, to średnia z rang będzie we wszystkich grupach równa
Test sumy rang Kruskala-Wallisa - rozkład χ2, df=k-1
n=n1+n2+nk Ti - suma rang w każdej próbie oddzielnie, k-ilość elementów w próbie
Decyzja o odrzuceniu lub przyjęciu hipotezy zerowej
p<α - odrzucamy H0 i przyjmujemy H1
p>α - nie ma podstaw do odrzucenia H0
Interpretacja wyników.
KORELACJE NIEPARAMETRYCZNE:
R Spearmana
Tau Kendalla
Test chi-kwadrat
TESTY ROZKŁADÓW: - testy zgodności rozkładów, zagadnienie 9
Test zgodności chi-kwadrat:
Test zgodności Kołmogorowa-Smirnowa (Lillieforsa):
Test W Shapiro-Wilka: