130 III. Nieparametryczne testy istotności
Na poziomie istotności a=0,05 zweryfikować za pomocą testu /. Kołmogo-rowa-Smimowa hipotezę, źe dla obu gatunków pszczół rozkłady średnic komórek w plastrach są takie same.
§ 3.3. TEST NIEZALEŻNOŚCI f
Podstawowe wyjaśnienia
Przy badaniu populacji generalnej jednocześnie ze względu na dwie cechy często interesuje nas sprawdzenie hipotezy, czy cechy te są. zc sobą związane. Gdy obie badane cechy są mierzalne, posługujemy się wtedy najczęściej pojęciem korelacji i regresji. Gdy jednak przynajmniej jedna z dwu badanych cech jest niemierzalna (tzn. ma jedynie kategorie jakościowe), to badając związek tych cech ze sobą posługujemy się pojęciem niezależności stochastycznej odpowiednich dwóch zmiennych losowych. Jak wiadomo z rachunku prawdopodobieństwa, dwa zdarzcaia A i B są niezależne, jeżeli zachodzi równość P(A n 8)= P(A) - P(B). Podobna jest definicja niezależności dwu zmiennych losowych X i Y. Zmienne te są niezależne, gdy dla dystrybuant zachodzi równość F(x. >‘)=Fi(*)F2(y)-
Często stosowany w praktyce test niezależności jest testem istotności pozwalającym na sprawdzenie, czy dwie badane cechy (niekoniecznie mierzalne) są niezależne. Test ten oparty jest na tej samej statystyce co test zgodności y2, z tym źe hipotetycznymi prawdopodobieństwami są oszacowane z próby prawdopodobieństwa otrzymania równocześnie określonej wartości (czy kategorii jakościowej) cechy X oraz Y, przy założeniu niezależności tych cech. Wymogiem tego testu jest duża liczebność próby, której wyniki zostały rozdzielone na odpowiednie grupy wartości (kategorie) ze względu na obie cechy od razu. Sporządza się zatem odpowiednią tablicę kombinowaną dla dwu cech, zwaną tablicą niezależności, która po wypełnieniu daje macierz liczebności empirycznych. Nakłada się na nią macierz liczebności teoretycznych, obliczonych przy założeniu niezależności cech znajdujących się w główce i w boczku. Porównanie elementów obu macierzy, czego dokoDuje się przez zastosowanie statystyki y', daje odpowiedź, czy można odrzucić hipotezę o niezależności cech na skutek wystąpienia 2byt dużych różnic liczebności empirycznych i teoretycznych. Należy wspo-
ntniec. że z otrzymanej w tym tencie niezależności wartości statystyki y} można skonstruować różne miary stopnia zależności badanych dwu cech, rde mają one jednak tak prostej interpretacji jak omówione w następnym rc2dzialc miary korelacji cech mierzalnych.
Model. Populacja generalna jest równocześnie badana ze względu na dwie cechy, niekoniecznie mierzalne. 2 populacji tej wylosowano niezależnie dużą próbę o liczebności n elementów. Wyniki próby klasyfikujemy w kombinowaną tablicę niezależności o r wierszach i s kolumnach. W boczku tablicy jest r grup wartości (kategorii) cechy X, a w główce tablicy jest i grup wartości (kategorii) cechy Y. Wnętrze tablicy wypełniają liczebności
(/=łt 2.....rtj=l, 2, „,r s), oznaczające, ile elementów w próbie
miało wartości obu cech należących do kombinacji (iyPodział na kategorie obu cech powinen być taki, by nxfz- 8. Sumując wiersze i kolumny otrzymanej z próby macierzy liczebności empirycznych [»y] otrzymujemy liczebności brzegowe, które wygodnie jest oznaczyć jako nt. oraz n.j. Zachodzą zatem równości
(3.8) n.j= £ niJt
(3 9) n= £ 2>o= Ź ni■= Ż n’J‘
r-i j=i i-i i
Na podstawie ułożonych w taką tablicę wyników próby należy sprawdzić hipotezę, że badane cechy są niezależne, tzn. hipotezę Hq', P{X:=x(t Y=yf} = P{X=x-t}P{Y=yj}y gdzie xs oraz yi ozoaczają odpowiednie wartości (lub kategorie) badanych cech.
Test istotności zwany testem niezależności y1 jest dla tej hipotezy następujący. 2 liczebności brzegowych w tablicy niezależności szacujemy prawdopodobieństwa brzegowe
Pi-
Następnie, zakładając prawdziwość hipotezy //0, tzn. niezależność cech, ' obliczamy dla każdej kratki tablicy prawdopodobieństwa hipotetyczne
r ś
Pij =JV P-j, Przy czym £ £ 1.
<-i i-i
»*