U'i lii Hiie procedury .statystyczne
I,niżej przedstawiamy przykłady użycia tostu t-Studenta dla różnych wymienionych hipotez zerowych. Zwróćmy uwagę, że w wynikach testu wyznaczany jest też prz,,. i Izial ufności dla wartości różnicy średnich. Domyślnie wyznaczany jest 95% przedział ufności, ale można wyznaczać inne przedziały zmieniając argument conf. level.
* losujemy dwie próby. Si} zależne, a druga jest większa średnio o 0.3
>
> x - morm(50) ,..
> y - x + 0.3 + rnorm(50,0.0.01)
> 0 test dla jednej próby
> » p-wartość jest wysoka, wifc nie ma podstaw by twierdzić, że Średnia
jest różna od 0
> t.test(y, mu=0)
One Sample t-test
t “ 0.6406, df - 49, p-value = 0.5247 -
alternative hypothesis: true mean is not equal to 0 95 percent confidence interval:
-0.2060437 0.3988940
sample estimates: mean of x 0.09642514
> t.test(x, y)$p.value tt p-wartoSć dla tego testu [1] 0.1614486
> # test sparowany dla dwóch prób
> u p-wartoSć jest niska, mamy podstawy twierdzić, że nastąpiła zmiana w
wartości średniej
> t.test(x, y, paired=T)
Paired t-test
data: x and y
t » -221.7657, df - 49, p-value < 2.2e-16
1
alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:
-0.3031758 -0.2977306 sample estimates: mean of the differences
-0.3004532
> # p-wartość dla testu sparowanego
> t.test(x, y, paired-T)$p.value [1] 1.126691e-75
> # p-wartoSć dla testu jednej próby Uilcozona
> vilcox.test(y, mu«0)$p.value [1] 0.6851558
> * p-wartość dla testu dwóch prób Wilcoiona
> wilcox.test(x, y)$p.value Cl] 0.1810666
Testowanie
Jeżeli porównujemy więcej niż dwie populacje i chcemy wykonać testy porównujące średnie dla każdej pary tych populacji to wygodnie jest skorzystać z funkcji pairwise.t.test(stats). Wykonuje ona test t-Studenta <ila każdej pary populacji 0fa2 automatycznie koryguje p-wartości biorąc pod uwagę liczbę wykonanych testów. - Zagadnienie: korekty p-wartości związanej z testowaniem zbionl hipotez, będzie jesz-| cze omówione w kolejnym podrozdziale. Zagadnienie testowania różnic pomiędzy wieloma średnimi zostało też poruszone przy okazji testów post-hoc (patrz podrozdział 3.4.2). Mniej popularnym testem, który również może być użyty {|0 testowania parametru położenia w jednej lub dwóch populacjach jest test znaków, zaimplementowany w funkcji sign.test(BSDA).
Popularne testy do weryfikowania jednorodności wariancji lub innych parametrów skuli są wymienione w tabeli 3.15. Testy ansari . test (stats). mood.test(stats) i var.test(stats) są przeznaczone do testowania parametru skali (wariancji) dla dwóch prób. Pozostałe testy można również wykonywać dla porównania większej liczby prób. Oczywiście należy sprawdzić założenia testu, który chcemy wykorzystać, np. test F zakłada rozkład normalny w porównywanych grupach, a jak pokażemy brak spełnienia założeń, może prowadzić do zupełnie błędnych wniosków.
Testowana hipoteza zerowa dla każdego z tych testów może być zapisana w ogólnej postaci:
ffv : <T*, = rrX2 = ... — <zXjb, przeciwko hipotezie alternatywnej:
^A : 3, j oXj 7Ś (rXji
gdzie <tXj to wartość odchylenia standardowego (parametru skali) w grupie j.
Tabela 3.15: Wybrane funkcje do weryfikacji równości wariancji (parametru skali)
var.test(stats) Test f dla dwóch prób do Weryfikacji hipotezy o jed
norodności wariancji. Zmieniając parametr ratio można również testować, hipotezę zerową, odpowiadająca przypuszczeniu, że iloraz wariancji ratio (domyślnie
ratio=l).
ansari. test (stats) Test Ansariego-Bradleya dla dwóch prób do weryfikacji
hipotezy o równości parametrów skali.
bartlett. test(stats) Test Bartletta dla wielu prób do weryfikacji hipotezy o jednorodności wariacji.
fligner.test(stats) Test. Flingcra-Killeenn dla wielu grup do weryfikacji hipotezy o jednorodności wariancji. ____
mood test (stat s) Rangowy test Mooda dla dwóch prób do weryfikacji hi
potezy o równości jwrametrów skali.
levene test (lawstat) Test Levene’a dla wielu prób do weryfikacji hipotezy o jednorodności wariancji. Funkcja levene.test() udostępnia również test Browna i Forsytha, różniący się od testu Levene’a tym, że parametr położenia wyznaczany jest przez mediany a nic przez średnie (patrz argument option). .........................