42
Jak widać (por. rys. 5.1), x„ jest granicą przedziału, w którym można znaleźć zmienną losową z prawdopodobieństwem 1 — a. Prawdopodo-bieństwo „wypadnięcia” z przedziału jest równe a: Prob(X > xj * = 1 -Prob(XśxJ = 1 -(1 -a) = a
fi
a = 1 - F(xJ = If(x)dx = Prob(X >
xa
co również wynika z rys. 5.1:
Rys. 5.1. Ilustracja poziomu istotności a, współczynnika ufności 1 —a oraz obszaru przyjęai i obszaru odrzucenia hipotezy dla jednostronnego (w tym wypadku prawostronnego) testu hipotezy
Niewielkiej wartości prawdopodobieństwa « odpowiada obszar zmienności statystyki nazywany obszarem krytycznym albo obszarem odrzucania. Hipotezę zerową odrzucamy, gdy wartość statystyki trafi do obszaru krytycznego. : 5.1. Test x2 (chi-kwadrat)
Bardzo często stosowanym testem zgodności rozkładu empirycznego z wybranym rozkładem modelowym jest test y2, związany z poznanym wcześniej rozkładem y2. Test ten daje w wyniku jedną ilościową miarę zgodności częstości obserwowanych f°bur- i modelowych f["od w całym badanym przedziale zmienności. Może być przy tym stosowany do wszystkich rozkładów. Wprowadźmy statystykę X1 określoną następująco:
m (foher. fmod.\2 y2 _ V Jl i
(5.3)
Li fmoŁ
i" I Jl
gdzie m oznacza liczbę przedziałów (klas) histogramu o liczebności nie mniejszej od 5. Ponieważ liczebności przedziałów histogramu podlegają w przybliżeniu rozkładowi Poissona, średnia krotność w i-tym przedziale jest równa wariancji: /, —a]. Jeśli wybór rozkładu modelowego był trafny, wówczas/, = f!mŁ i wyrażenie (5.3) można zapisać w postaci sumy kwadratów zmiennych losowych o rozkładzie N(0, 1):
*2=I
^Jobttr._j-jnod.y\ 2
(5.4)
Statystyka x2 ma więc rozkład y2. Liczba stopni swobody jest przy tym równa liczbie przedziałów histogramu pomniejszonej o liczbę ograniczeń wprowadzonych przy obliczaniu y2. Pierwszym ograniczeniem jest wymóg równości sumy częstości obserwowanych i modelowych, czyli równość powierzchni histogramu oraz postulowanego rozkładu:
m
m
TJfi°bur-
= I/r'-
= n
(5.5)
gdzie n oznacza liczbę pomiarów. Kolejne ograniczenia wynikają z żądania, aby wartość średnia rozkładu modelowego była równa wartości średniej z próbki, a wariancja rozkładu modelowego - wariancji próbki: n = x; a2 - s2. Ograniczamy w ten sposób swobodę wyboru przez rozkład modelowy położenia na osi oraz szerokości (czyli zmniejszamy liczbę stopni swobody). Tak więc, gdy rozkładem modelowym jest rozkład normalny, wówczas liczba stopni swobody wyniesie m — 3, a w przypadku rozkładu Poissona m — 2 (ponieważ wariancja i wartość średnia nie są tym razem niezależne, lecz związane relacją <r2 = /i).
Posługiwanie się testem y2 wymaga uwzględniania dodatkowych reguł ilościowych, trudnych do ścisłego uzasadnienia. Wcześniej wspomniano, że liczebności przedziałów histogramu nie powinny być zbyt małe (jeśli są mniejsze od 5, należy połączyć sąsiadujące klasy). Liczba przedziałów nie powinna być przy tym mniejsza od 6 -f- 8, zaś ich optymalna liczba jest bliska pierwiastkowi kwadratowemu z liczby pomiarów.
Obszar przyjęcia dla testu y2 (por. rys. 5.2) określa warunek X2^xiL-Prawdopodobieństwo popełnienia błędu I rodzaju ustala się zwykle na poziomie a = 0,05. Prawdopodobieństwo popełnienia błędu II rodzaju jest przeważnie bardzo trudno ocenić.