Wybrane procedury statystyczne
lulaj przedstawimy jedynie jak używać tego testu do badania zgodności z zadany rozkładem.
Tost; Ko!omogorova-Smirnova jest dostępny w funkcji ks.testO. Pierwszym ar gumcntem tej funkcji jest wektor obserwacji, a drugim nazwa funkcji wyznaczającej dystrybuantę rozkładu, z którym chcemy badać zgodność. W przypadku badania zgodności z rozkładem jednostajnym będzie to "punif". Jeżeli badany zgodność / innym rozkładem, to za kolejne argumenty należy podać parametry rozkładu z wskazanej rodziny (test Kolornogorova-Smirnova nie weryfikuje zgodności z rodziną rozkładów, ale z jednym ustalonym rozkładem). Poniżej przedstawiamy dwa przykłady użycia.
> x - runif(lOO) tt losujemy wektor obserwacji
> tt czy x pochodzi z rozkładu jednostajnego?
> tt p-wartość jest duża, nie ma więc podstaw by twierdzić, że jest inaczej
> ks.test(x, "punif")
One-sample Kolmogorov-Srairnov test
data: x
D = 0.0865, p-value “ 0.4434 alteraative hypothesis: two-sided
> tt czy x pochodzi z rozkładu normalnego o Średniej 1 i wariancji 1?
> tt p-wartość jest mała, wygląda na to, że nie pochodzi
> ks.test(x, "pnorm", 1, 1)
One-sample Kolmogorov-Smirnov test
data: x
D m 0.5021, p-value < 2.2e-16
altemative hypothesis: two-sided :,v
Zgodność z rozkładami dyskretnymi o znanych parametrach (np. dwumianowym, Poissona itp) można weryfikować testem \2 (należy określić odpowiednio argument p z wektorem prawdopodobieństw dla kolejnych wartości) lub używając, testów zgodności dostępnych w funkcji goodfit(vcd).
3.5.1.3 Testy zgodności dla dwóch prób
Popularnym testem zgodności dla dwóch prób jest test Kołomogorova-Smirnova dostępny w funkcji ks. test(stats). Pierwszy wektor obserwacji oznaczmy symbolem. x a drugi symbolem y. Test Kolomogorova-Smirnowa weryfikuje hipotezę zerową postaci:
gdzie F to dystrybuanta nieznanego rozkładu, z którego pochodzą obserwacje x, a G to dystrybuanta nieznanego rozkładu, z którego pochodzą obserwacje y.
Hipoteza alternatywna może być postaci: 1
Testowanie
205
» F > G, alternatywa jednostronna (argument alternative="greater"),
• F <G, alternatywa jednostronna (argument alternative="less").
Aby użyć testu zgodności dla dwóch prób, należy za pierwsze dwa argumenty funkcji ks.testO podać wektory y i y. Poniżej przedstawimy przykład użycia tego testu.
> x = runif(lOO); y “ rnorm(lOO)
> 1 czy x i y pochodzą z tego samego rozkładu?
> tt p~wartoś6 jest mała, wygląda na to, że te rozkłady się różnią
> ks.test(x, y)
Two-sample Kolmogorov-Smirnov test data: x and y
D 1 0.43, p-value = 1.866e-08 alternative hypothesis: two-sided
Wiele opracowań do testów zgodności zalicza również test Wilcoxona. Test ten najefektywniej wykrywa różnice w parametrze położenia, dlatego zostanie przedstawiony w kolejnym podrozdziale razem z innymi testami do porównywania parametrów położenia lub wartości średnich.
Do oceny zgodności dwóch wektorów' obserwacji można również wykorzystać wykres kwautylowy zaimplementowany w funkcji qqplot(stats). Jeżeli podane zostaną argumenty x i y, to funkcja ta narysuje zbiór punktów, których współrzędne na osi poziomej odpowiadają kwantylom empirycznym pierwszego wektora a na osi pionowej kwantylom empirycznym drugiego wektora. Jeżeli obserwacje z obu wektorów pochodzą z tego samego rozkładu, to punkty powinny ułożyć się blisko prostej y = x. Przykład takiego użycia funkcji qqplot() zamieszczamy poniżej.
x - rexp(100); y - rnorm(500)
# te punkty nie ułożą się wzdłuż prostej - qqplot(x, y)
Najpopularniejsze testy statystyczne do weryfikowania hipotez o równości parametrów położenia (median lub średnich) przedstawione są w tabeli 3.14. Dla problemu wielu prób ogólna postać hipotezy zerowej jest następująca:
Wy : Pi = P2 = ■■ = Pfct przeciw hipotezie alternatywnej:
Ha : p, / Pj,
gdzie k to liczba populacji a p, to średnia lub mediana (testowany parametr położenia) w populacji itej. Postacie hipotezy zerowej dla jednej i dwóch prób przedstawione są szczegółowiej poniżej. Dla konkretnego testu przyjmowane są dodatkowe
F =ć G, alternatywa dwustronna, dystrybuanty się różnią (domyślna alternatywa dla testu ks .test O, odpowiada jej argument alternative="two. sided"),