Porównywanie dwóch proporcji / frakcji Zakładamy, że analizowane dane są realizacjami dwóch zmiennych losowych o rozkładach dwumianowych z prawdopodobieństwami sukcesu p\ i />_> (czyli X ~ Bin(nj; pi) i V ~ }>in(;72; po)• Będziemy weryfikować hipotezę postaci
H0 : pi = P2 (54)
na poziomie istotności a przeciw hipotezie
Hi:pi^p2 (55)
Oznaczmy przez n\ i no Uczbę danych w pierwszej i drugiej grupie obserwacji (czyli liczności w odpowiednich rozkładach dwumianowych), a przez k\ i k2 liczby zajść zdarzeń, które „nas interesują” (tzn. są opisywane przez odpowiednie zmienne). Na początku obliczamy następującą statystykę:
z = (rąki - nik2) ■ . I-, w + -r-77-r ■ (56)
V «1«2 (fel + Kg) (»r + «2 - k\ — Ki)
Nie ma podstaw do odrzucenia hipotezy zerowej, jeżeli wartość bezwzględna obliczonej statystyki z jest mniejsza od kwantyla standardowego rozkładu normalnego zi_<*. Hipotezę zerową odrzucamy na korzyść hipotezy: P2 > pi, gdy obliczona statystyka jest mniejsza od —z^. Gdy statystyka ta jest większa od Z(3, odrzucamy Ho na korzyść hipotezy: p\ > P2.
Test x2 niezależności
Rozpatrujemy zmienne losowe X i Y, których wartości należą do rozłącznych kategorii: .,*<*) (dla zmiennej X) oraz (dla zmiennej
Y). Naszym celem jest weryfikacja hipotezy
Ho : X i Y są niezależne, (57)
wobec hipotezy alternatywnej
Hi : istnieje zależność pomiędzy X i Y. (58)
Niech riij oznacza liczbę obserwacji, dla których zmienna X należy do kategorii x<l> oraz zmienna Y należy do kategorii Symbolem ni. oznaczamy całkowitą
liczbę obserwacji, dla których zmienna X należy do kategorii a symbolem n.j - całkowitą liczbę obserwacji, dla których zmienna V’ należy do kategorii Zatem
r k
rą. = riij oraz n.j = ny . (59)
j=i ;=i
Niech n oznacza całkowitą liczbę obserwacji. Dla i = 1,2,...,fc i j = 1,2, ...,r wyznaczamy liczebności teoretyczne według następującego wzoru
(60)
Aby zweryfikować hipotezę zerową obliczamy wartość statystyki danej formułą