czyli sprawdzamy, czy nasza próba pochodzi z pewnego rozkładu F. Statystyką testową jest wtedy
D„ = sup \Ł(x) - F(*)| 1 |
[ (3.100) | |
Jak łatwo zauważyć, |
statystyka ta największe wal |
Otości może przyjmować w |
punktach skoku. Stąd |
Dn — max (£>+, D~) (, |
(3.101) |
gdzie |
X | |
; F(.v,,)){.^ | ||
1 (31102) |
Intuicja stojąca za obszarem krytycznym dla tej hipotezy jest bardzo prosta. Duże wartości statystyki testowej oznaczają duże różnice pomiędzy przyjętą przez nas dystrybuantą F a dystrybuantą empiryczną Fn. W praktyce istnieją jednak pewne problemy z doborem odpowiedniej reguły testowej. Zachodzi następujące twierdzenie.
Twierdzenie 3.41. Dla dowolnego rozkładu ciągłego F, rozkład statystyki testowej Dn przy ustalonym n, jest taki sam, przy założeniu prawdziwości Ha.
Oznacza to, że dla każdego ustalonego n powinniśmy zbudować odpowiednie tablice rozkładu statystyki Dn. Na szczęście dla dużych n mamy następujące twierdzenie, które pozwala zbudować tylko jedną tablicę dla pojedynczego rozkładu.
Twierdzenie 3.42. Jeśli n —♦ oo, to
+CO
P « d) U K(d) = (-l)V-2fc * . (3.103)
l
Test x2 niezależności
W praktycznych zagadnieniach często spotykamy się z pytaniem, czy jedna zmienna X jest zależna od drugiej zmiennej Y. Niestety, często nie jesteśmy w stanie nic powiedzieć na temat tego, z jakich rozkładów owe zmienne pochodzą. Ponadto zmienne X i Y mogą nie być zmiennymi ciągłymi, ale posiadać wartości składające się z kilku oddzielnych kategorii (np. cechy o skali porządkowej lub nominalnej). W tego typu przypadkach można spróbować zastosować test x2 niezależności.
Rozpatrujemy zmienne losowe X i Y, których wartości należą do rozłącznych kategorii: (dla zmiennej X) oraz y^\y^2\ ...,t/r* (dla zmiennej
y). Naszym celem jest weryfikacja hipotezy
Ha : X i Y są niezależne, (3.104)
wobec hipotezy alternatywnej
Hi : istnieje zależność pomiędzy X i Y. (3.105)
Niech nij oznacza liczbę obserwacji, dla których zmienna A' należy do kategorii xW oraz zmienna Y należy do kategorii y^K Symbolem n,-. oznaczamy całkowitą