95
i.2. Testy nieparametryczne
Testy zgodności służą do weryfikacji hipotez o postaci rozkładów badanej populacji. Hipoteza zerowa, którą będziemy weryfikować będzie miała postać H0 : F(x) — F0(x) lub H0 : F(x, 0) = F0(x, 0), odpowiednio przeciw hipotezie alternatywnej Hx : F(jc) ^ F0(;t) ^ ^ Fo(jc,0), gdzie ^ jest
parametrem rozkładu, którego wartość też może być weryfikowana.
Przykład. Hipotezą może być H0 : F(x) ~ N(m, a), gdzie m i a są pewnymi, nie interesującymi nas parametrami. Hipoteza może też mieć postać H0 : F(jc)~N(0,ct) albo też H0 : F(*) ~N(0,1).
Test służący do weryfikacji hipotezy o postaci rozkładu powinien mierzyć rozbieżności pomiędzy rozkładem hipotetycznym F0(jt) a rozkładem empirycz-Test zgodności nym. Pierwszym omawianym tutaj takim testem jest test chi-kwadrat Pearso-Pearsona na. Polega on na tym, że oś liczbową dzielimy punktami diy i = 1,2,..., r — 1
na rozłączne przedziały A(. Otrzymujemy w ten sposób r przedziałów,
Oznaczmy przez Ni liczbę obserwacji w przedziale A(, gdzie n = /V, +/V2 + —(-Nr. Niech pi = Pr(X € A-), gdzie X jest zmienną losową (cechą w populacji generalnej), a F0(x) jej dystrybuantą (hipotetyczną). Wtedy statystyka
Tylko MNW
mierzy rozbieżność między dystrybuantą empiryczną i dystrybuantą hipotetyczną (teoretyczną). Należy jednak zwrócić uwagę, że dla efektywnego obliczenia prawdopodobieństw pi należy znać wszystkie parametry występujące w dystrybunancie F(jc). Jeżeli nie są one jednak znane, to trzeba je estymować metodą największej wiarogodności.
Jeżeli nieznane parametry dystrybuanty F są oszacowane metodą największej wiarogodności, to dystrybuantą statystyki określonej wzorem (6.2.1) jest zbieżna dla n —> °° do dystrybuanty rozkładu chi-kwadrat Pe ar sona o r~~k— I stopniach swobody, gdzie k jest liczbą nieznanych parametrów dystrybuanty F{x).
Jeżeli n jest dostatecznie duże (n równe kilkadziesiąt, na przykład n ^ 60) oraz w każdej klasie A- jest co najmniej 8 wyników, tj. N-t^ 8, to na podstawie twierdzenia 6.2.1 można przyjąć, że statystyka określona wzorem (6.2.1) ma w przybliżeniu rozkład chi-kwadrat. Jeżeli w jakiejś klasie jest mniej niż