132 Ul. Nieparametryczne testy istotności
Mnożąc te prawdopodobieństwa przez ogólną liczebność próby otrzymujemy macierz liczebności teoretycznych [rip(}]. Z elementów macierzy liczebności empirycznych [nj oraz elementów macierzy liczebności teoretycznych [nptj] konstruujemy statystykę
(n^npjj)1
rtPcj
(3.10)
r=ij-i
Statystyka ta ma przy założeniu prawdziwości hipotezy ff0 o niezależności cech, asymptotyczny rozkład y1 z (r— l)(j— 1) stopniami swobody.
Obszar krytyczny (prawostronny) w tym teście określa nierówność X2>/1, gdzie x* jest wartością krytyczną odczytaną z tablicy rozkładu^2 dla ustalonego z góry poziomu istotności y i dla (r—1)($—1) stopni swobody w? taki sposób, aby zachodziła relacja P{yz^Xa)=a- Obliczoną wartość X2 porównujemy z wartością krytyczną y2 i jeżeli zajdzie nierównośćxz>xl> to hipotezę Ha o niezależności badanych cech Dależy odrzucić, co oznacza ich zależność. Gdy natomiast x2<xl* nie ma podstaw do odrzucenia hipotezy o niezależności badanych cech.
Uwaga. Zc względu na wymaganą liczebność co najmniej 8 elementów w każdej kratce, zachodzi czasem konieczność połączenia za pomocą spójnika „lub” dwu kategorii danej cechy w jedną. Zmniejszają się przy tym wymiary tablicy niezależności, a co za tym idzie, zmniejsza się liczba stopni swobody statystyki x2> Najmniejsze wymiary tablicy niezależności wynoszą 2 X 2 i statystyka /2 ma wtedy tylko 1 stopień swobody (jest to tzw. tablica czteropobwa).
Przykład. W celu stwierdzenia, czy podanie chorym na pewną chorobę nowego leku przynosi poprawę w ich stanie zdrowia, wylosowano dwie grupy pacjentów w jednakowym stopniu chorych na tę chorobę i jednej grupie o liczebności 120 podawano nowy lek, a druga grupa o liczebności 80 pacjentów otrzymała tradycyjne leki. Po pewnym czasie stwierdzono
Stan zdrowia po leczeniu | |||
Leczeni j |
bez poprawy |
wyraźna poprawa |
całkowite wyzdrowienie |
badanym lekiem |
20 |
40 |
60 |
tradycyjnie |
45 |
20 |
15 |
zestawione w tablicy liczebności chorych w poszczególnych kategoriach stanu zdrowia. Na poziomic istotności a=0700I zweryfikować hipotezę, że nowy lek istotnie poprawia stan zdrowia pacjentów.
Rozwiązanie. Wysuniętą hipotezę badawczą zamieniamy na hipotezę statystyczną H0: P{X=xif Y=yi}=P{X~xdP{Y=yi}t o niezależności obu badanych cech jakościowych Oj. rodzaju leczenia i stanu zdrowia po leczeniu). Jeżeli powyższą hipotezę statystyczną Ha o niezależności w wyniku zastosowania testu niezależności -/? trzeba będzie odrzucić, to oznaczać to będzie wobec danych zawartych w powyższej tablicy, źe stan zdrowia po leczeniu zależy istotnie od zastosowania badanego leku, co udowodniłoby jego przydatność.
Obliczenia w tekściey* niezależności rozpoczynamy od obliczeń liczebności brzegowych rt{. i n.j oraz oszacowania prawdopodobieństw brzegowych po i p.y Przyjmując następnie założenie o niezależności cech obliczamy prawdopodobieństwa teoretyczne Pjj=Po p.j. Wyniki obliczeń prawdopodobieństw pj;- zamieszczone są w prawym górnym rogu każdej kratki. Mnożąc te prawdopodobieństwa przez rc = 200 otrzymujemy dla każdej klatki liczebności teoretyczne np({, które umieszczono w dolnym lewym rogu. Zauważyć przy tym trzeba, że zc względu na konieczność bilansowania się elementów w wierszach i kolumnach obliczenia przeprowadzamy tylko dla tylu kratek, ile wynosi liczba stopni swobody, tzn. (r- l)(s—1) = -(2-1)(3 —).)—2, a pozostałe elementy zarówno macierzy [pi}] jak i \pptj] wyznaczamy z wartości brzegowych.
Leczeni |
Stan zdrowia po leczeniu | ||
bez poprawy j wyraźna I poprawa |
! całkowite | ^ wyzdrowienie |
Pi- | |
badanym j Ickiem |
'0,195 , 0,1«0 20 40 |
[0.225 60 220 |
0,60 |
39 i 36 |
45 1 | ||
. tradycyjnie 1 |
; 0.130 0,120 |
0,150 |
0,40 |
45 20 |
15 : eo | ||
26 \ 24 j , 30 i | |||
1 i n.j |
■ v> s •*> | ||
| P-i | 0,325 0.300 |
0^75 |
i.oo '= |