przewodnikPoPakiecieR6

przewodnikPoPakiecieR6



Wybrane procedury statystyczne

lulaj przedstawimy jedynie jak używać tego testu do badania zgodności z zadany rozkładem.

Tost; Ko!omogorova-Smirnova jest dostępny w funkcji ks.testO. Pierwszym ar gumcntem tej funkcji jest wektor obserwacji, a drugim nazwa funkcji wyznaczającej dystrybuantę rozkładu, z którym chcemy badać zgodność. W przypadku badania zgodności z rozkładem jednostajnym będzie to "punif". Jeżeli badany zgodność / innym rozkładem, to za kolejne argumenty należy podać parametry rozkładu z wskazanej rodziny (test Kolornogorova-Smirnova nie weryfikuje zgodności z rodziną rozkładów, ale z jednym ustalonym rozkładem). Poniżej przedstawiamy dwa przykłady użycia.

>    x - runif(lOO)    tt losujemy wektor obserwacji

>    tt czy x pochodzi z rozkładu jednostajnego?

>    tt p-wartość jest duża, nie ma więc podstaw by twierdzić, że jest inaczej

>    ks.test(x, "punif")

One-sample Kolmogorov-Srairnov test

data: x

D = 0.0865, p-value “ 0.4434 alteraative hypothesis: two-sided

> tt czy x pochodzi z rozkładu normalnego o Średniej 1 i wariancji 1?

> tt p-wartość jest mała, wygląda na to, że nie pochodzi

>    ks.test(x, "pnorm", 1, 1)

One-sample Kolmogorov-Smirnov test

data: x

D m 0.5021, p-value < 2.2e-16

altemative hypothesis: two-sided    :,v

Zgodność z rozkładami dyskretnymi o znanych parametrach (np. dwumianowym, Poissona itp) można weryfikować testem \2 (należy określić odpowiednio argument p z wektorem prawdopodobieństw dla kolejnych wartości) lub używając, testów zgodności dostępnych w funkcji goodfit(vcd).

3.5.1.3 Testy zgodności dla dwóch prób

Popularnym testem zgodności dla dwóch prób jest test Kołomogorova-Smirnova dostępny w funkcji ks. test(stats). Pierwszy wektor obserwacji oznaczmy symbolem. x a drugi symbolem y. Test Kolomogorova-Smirnowa weryfikuje hipotezę zerową postaci:

Ho'. F = G,

gdzie F to dystrybuanta nieznanego rozkładu, z którego pochodzą obserwacje x, a G to dystrybuanta nieznanego rozkładu, z którego pochodzą obserwacje y.

Hipoteza alternatywna może być postaci: 1

Testowanie

205


» F > G, alternatywa jednostronna (argument alternative="greater"),

F <G, alternatywa jednostronna (argument alternative="less").

Aby użyć testu zgodności dla dwóch prób, należy za pierwsze dwa argumenty funkcji ks.testO podać wektory y i y. Poniżej przedstawimy przykład użycia tego testu.

>    x = runif(lOO); y “ rnorm(lOO)

>    1 czy x i y pochodzą z tego samego rozkładu?

>    tt p~wartoś6 jest mała, wygląda na to, że te rozkłady się różnią

>    ks.test(x, y)

Two-sample Kolmogorov-Smirnov test data: x and y

D 1 0.43, p-value = 1.866e-08 alternative hypothesis: two-sided

Wiele opracowań do testów zgodności zalicza również test Wilcoxona. Test ten najefektywniej wykrywa różnice w parametrze położenia, dlatego zostanie przedstawiony w kolejnym podrozdziale razem z innymi testami do porównywania parametrów położenia lub wartości średnich.

Do oceny zgodności dwóch wektorów' obserwacji można również wykorzystać wykres kwautylowy zaimplementowany w funkcji qqplot(stats). Jeżeli podane zostaną argumenty x i y, to funkcja ta narysuje zbiór punktów, których współrzędne na osi poziomej odpowiadają kwantylom empirycznym pierwszego wektora a na osi pionowej kwantylom empirycznym drugiego wektora. Jeżeli obserwacje z obu wektorów pochodzą z tego samego rozkładu, to punkty powinny ułożyć się blisko prostej y = x. Przykład takiego użycia funkcji qqplot() zamieszczamy poniżej.

x - rexp(100); y - rnorm(500)

# te punkty nie ułożą się wzdłuż prostej - qqplot(x, y)

3.5.2 Testowanie hipotezy o równości parametrów położenia

Najpopularniejsze testy statystyczne do weryfikowania hipotez o równości parametrów położenia (median lub średnich) przedstawione są w tabeli 3.14. Dla problemu wielu prób ogólna postać hipotezy zerowej jest następująca:

Wy : Pi = P2 = ■■ = Pfct przeciw hipotezie alternatywnej:

Ha :    p, / Pj,

gdzie k to liczba populacji a p, to średnia lub mediana (testowany parametr położenia) w populacji itej. Postacie hipotezy zerowej dla jednej i dwóch prób przedstawione są szczegółowiej poniżej. Dla konkretnego testu przyjmowane są dodatkowe

1

FG, alternatywa dwustronna, dystrybuanty się różnią (domyślna alternatywa dla testu ks .test O, odpowiada jej argument alternative="two. sided"),


Wyszukiwarka

Podobne podstrony:
przewodnikPoPakiecieR8 Wybrane procedury statystycznea.4.4 Regresja Zagadnienie regresji rozwijane
przewodnikPoPakiecieR 0 Wybrane procedury statystyczne wyr az modelu, formuły -1 albo Otrz
przewodnikPoPakiecieR 6 Wybrane procedury statystyczne Deviance Residuals: Min
przewodnikPoPakiecieR 7 Wybrane procedury statystyczno U budujemy model regresji logistycznej z jedn
przewodnikPoPakiecieR2 Wybrane procedury statystyczne gdzie /i() jest funkcją wiążącą (ang. link fu
przewodnikPoPakiecieR4 Wybrane procedury statystyczne Wynik każdego z wymienionych testów jest obie
przewodnikPoPakiecieR0 Wybrane procedury statystyczne ■■ Analiza przeżycia233 Do wizualnej oceny za
przewodnikPoPakiecieR 5 182 Wybrane procedury statystyczne3.4.5 Regresja logistyczna Zarówno analiza
przewodnikPoPakiecieR9 210 Wybrane procedury statystyczne Testowanie 211 Na rysunku 3.38 przedstawi
przewodnikPoPakiecieR4 140 Wybrane procedury statystyczne >    U ustawiamy ziarno
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: Bewarc
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
75190 przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: B

więcej podobnych podstron