210
Wybrane procedury statystyczne
Testowanie
211
Na rysunku 3.38 przedstawiono moc testów dla kilku wybranych alternatyw jako funkcję rozmiaru próby.
Rozkłady norm(0,1) vs. norm(0,1.5)
Rozkłady Cauchy(0,1) vs. Cauchy(0,2)
N j / Na załączonych przykładach większość testów zachowuje się podobnie Największą moc otrzymuje się dla testu F. Przestrzegam jednak przód przesadnym optymizmem i wiarą w to, że test F jest dobry, bo na wszyst-kich wykresach ma wysoką moc. Ostatni wykres przedstawia wartość błędu pierwszego rodzaju w przypadku, gdy obie próby pochodzą z rozkładu wy- i kladniczego o równych wariancjach.
Jak widać, w sytuacji, gdy nie spełnione jest założenie o normalności, test F i test. Bartletta zupełnie nie kontrolują błędu pierwszego rodzaju!!! Testy te nie powinny być używane w takich sytuacjach, gdyż mogą prowadzić do błędnych wniosków!!! i?. Jednak jeżeli obserwacje w grupach pochodzą z rozkładu normalnego (patrz rysunek po prawej stronie na górze), to najlepiej radzi sobie test F, który jest w tej sytuacji testem optymalnym.
Rozkłady exp(1) vs. exp(2)
- ansan.tesł * mood.test
Rozkłady exp(1) vs. exp(1)
- var.test
— - ansari.test
• • • bartlett.test ■ — fligner.test
— - mood.test
Poniżej przedstawiamy przykład użycia wymienionych testów. Zwróćmy uwagę, że w wynikach testu F wyznaczany jest też 95% przedział ufności (inne przedziały ufności otrzymać zmieniając argument conf. level) dla wartości ilorazu wariancji.
■
> x = rnorm(20,2,l)
> y = morm(20,2,2)
> z = rnorm(20,2,3)
> tt porównaj dwie pierwsze grupy testem F
> var.test(x,y)
F test to compare two variances
data: x and y '
F « 0.2588, num df = 19, denom df = 19, p-valia = 0.004985
alternative hypothesis: true ratio of varlaices is not equal to 1 s
95 percent confidence interval:
0.1024484 0.6539232 sample estimates: ratio of variances 0.2588307
> tt porównaj te grupy innymi testami (wyznaawy tylko p-wartościj
> tt różne funkcje wymagają różnego sposobu pitwnia argumentów
> ansari.test(x,y)$p.value <
[1] 0.001085902
> bartlett.test(list(x,y,z))$p.value [1] 2.723469e-05
> mood.test(x,y)$p.value [1] 0.004855748
> grupy=gl(3,20)
> wart=c(x,y,z)
> fligner.test(wart‘grupy, data.frame(wart, gwpy})$p.vaiue [1] 0.008198007
> levene.test(wart,grupy)[1,3]
[1] 0.0Ó38661
Rysunek 3.38: Moce testów .skali dla różnych alternatyw, poziom istotności ..tt = 0.05
0o analizy zmiennej lub zbioru zmiennych o rozkładzie dwumianowym wykorzystuje się test proporcji nazywany też testem wskaźnika struktury. Weryfikuje on hipotezę zerową odpowiadającą przypuszczeniu, że prawdopodobieństwa sukcesu w poszczególnych grupach są sobie równe lub, że są równe zadanej wartości. Test proporcji jest zaimplementowany w funkcji prop.test(stats).
W przypadku testowania równości wskaźników' struktury w różnych grupach hipoteza zerowa jest postaci:
Ho ■ Pi = Pi = ■■■ = Pk<
gdzie pi to prawdopodobieństwo sukcesu w grupie i. Innymi słowy hipoteza zerowa to przypuszczenie, że prawdopodobieństwa sukcesów we wszystkicli grupach są ' równe. W przypadku testowania równości wskaźników struktury z zadanymi wartościami (ten test jest wykonywany jeżeli w funkcji prop.testO podamy argument p) hipoteza zerowa jest postaci:
P i = Po.l , Pi = Po,2,
Pk — Po.k,