37
4. WERYFIKACJA HIPOTEZ
4.1. Wiadomości wstępne
Niech dana będzie próbka
n
x
x ...,
,
1
z rozkładu absolutnie ciągłego P o gęstości
nieznanej
)
( y
f
. Wektor losowy
)
...,
,
(
1
n
x
x
x
będziemy nazywali wektorem obser-
wacji, a zbiór jego wszystkich możliwych wartości X – przestrzenią próbek. Naszym
celem jest sprawdzanie (weryfikacja) hipotezy głównej (zerowej)
0
H
, polegającej na
tym, że
)
(
)
(
0
y
f
y
f
, gdzie
)
(
0
y
f
jest daną z góry gęstością (tj.
0
)
(
0
y
f
,
1
)
(
0
dy
y
f
). Hipoteza zerowa może być określona także w inny sposób. Ponieważ
ZL
i
x
są niezależne, to gęstość wektora losowego x jest równa
)
(x
f
)
(
)...
(
)
(
2
1
n
x
f
x
f
x
f
. A więc hipoteza zerowa polega na tym, że w przestrzeni pró-
bek X wektor x spełnia rozkład o gęstości
)
(
)
...,
,
(
)
(
0
1
x
x
f
x
x
f
f
n
, gdzie
)
(
)...
(
)
(
)
(
0
2
0
1
0
0
n
x
f
x
f
x
f
f
x
. Symbolicznie hipotezę zerową będziemy, więc, zapi-
sywali w postaci
:
0
H
)
(
)
(
0
y
f
y
f
, albo w postaci
:
0
H
)
(
)
(
0
x
x
f
f
.
Rozpatrywana hipoteza zerowa jest prosta, ponieważ rozkład o gęstości
)
(
0
y
f
jest określony jednoznacznie. W tym przypadku, gdy hipoteza
0
H
wyraża ten fakt,
że rozkład o gęstości nieznanej
)
( y
f
należy do pewnej klasy zawierającej więcej niż
jeden rozkład, nazywamy ją hipotezą złożoną. Np. hipoteza polegająca na tym, że
próbka
n
x
x ...,
,
1
należy do rozkładu normalnego, jest złożona, ponieważ klasa roz-
kładów normalnych jest zbiorem wszystkich rozkładów o gęstości
)
(
2
,
y
f
a
2
2
2
)
(
2
1
a
y
e
, gdzie
R
a
,
0
.
Załóżmy, że chcemy zweryfikować hipotezę prostą
0
H
przeciw hipotezy alter-
natywnej
1
H
. Zakładamy również, że prawdziwa jest jedna i tylko jedna z hipotez
0
H
i
1
H
. Najpierw zbadamy przypadek prostych hipotez
:
0
H
)
(
)
(
0
x
x
f
f
(
)
(
)
(
0
y
f
y
f
) i
:
1
H
)
(
)
(
1
x
x
f
f
(
)
(
)
(
1
y
f
y
f
). Tu
)
(
1
y
f
jest pewną gęstością
różną od
)
(
0
y
f
,
)
(
)...
(
)
(
)
(
1
2
1
1
1
1
n
x
f
x
f
x
f
f
x
.
Budowa kryterium dla weryfikacji hipotezy zerowej polega na wyborze w prze-
strzeni próbek obszaru krytycznego K, takiego, że jeżeli wektor obserwacji x
K
, to
hipotezę
0
H
odrzucamy (czyli przyjmujemy hipotezę alternatywną
1
H
). Natomiast,
jeżeli
K
X
K
\
x
, to przyjmujemy hipotezę
0
H
(odrzucamy
1
H
).
38
Przyjmując albo odrzucając hipotezę zerową możemy popełnić błędy dwóch ro-
dzajów.
1. Błąd pierwszego rodzaju popełniamy w przypadku, gdy odrzucamy prawdzi-
wą hipotezę zerową
0
H
. Prawdopodobieństwo błędu pierwszego rodzaju wynosi
K
d
f
H
K
x
x
x
P
)
(
}
prawdziwa
jest
{
0
0
.
Błąd pierwszego rodzaju nazywa się również poziomem istotności kryterium.
2.
Błąd drugiego rodzaju popełniamy w przypadku, gdy przyjmujemy hipotezę
zerową
0
H
, chociaż nie jest ona prawdziwa. Prawdopodobieństwo błędu drugiego
rodzaju wynosi
K
d
f
H
K
x
x
x
P
)
(
}
prawdziwa
jest
{
1
1
.
Rozpatrywane całki tu rozumiemy jako n-krotne, tj.
n
dx
dx
d
...
1
x
.
Kryterium dla weryfikacji hipotezy byłoby idealne, gdyby prawdopodobieństwa
błędów obu rodzajów były równe 0. Niestety nie jest to możliwe wobec niepewności
spowodowanej przypadkowością wyników prowadzonych doświadczeń. Zmniejsza-
jąc prawdopodobieństwo błędu 1-go rodzaju przy ustalonej liczności próbki, my jed-
nocześnie zwiększamy prawdopodobieństwo błędu 2-go rodzaju, odwrotnie, zmniej-
szając prawdopodobieństwo błędu 2-go rodzaju, jednocześnie zwiększamy prawdo-
podobieństwo błędu 1-go rodzaju. Istotnie, zmniejszenie np. prawdopodobieństwa
błędu 1-go rodzaju jest równoważne zmniejszeniu obszaru K, co prowadzi do zmniej-
szenia pierwszej z wypisanych całek. W takich warunkach jednak zwiększa się ob-
szar
K
X
K
\
, co z kolei prowadzi do zwiększenia drugiej całki. Otrzymana
sprzeczność wymaga oczywiście rozstrzygnięcia kompromisowego, tj. takiego, przy
którym oba prawdopodobieństwa byłyby niezbyt duże. Podejście klasyczne polega na
wyborze obszaru krytycznego K w taki sposób, aby prawdopodobieństwo błędu 2-go
rodzaju było minimalne pod warunkiem, że prawdopodobieństwo błędu 1-go rodzaju
(poziom istotności) nie przekracza pewnego poziomu krytycznego
0
.
Definicja 1. Liczba
K
d
f
H
K
H
K
x
x
x
P
x
P
)
(
}
prawdziwa
jest
{
}
prawdziwa
jest
{
1
1
1
1
1
nazywa się mocą kryterium. Kryterium, którego moc jest maksymalna, nazywa się
kryterium o największej mocy.
Minimalizacja prawdopodobieństwa błędu 2-go rodzaju jest oczywiście równo-
ważna do maksymalizacji mocy kryterium.
Zagadnienie znalezienia kryterium o największej mocy da się rozwiązać bardzo
rzadko. Dlatego w ciągu dalszym zajmiemy się prostymi zagadnieniami, które nie
uwzględniają pojęcia błędu 2-go rodzaju.
39
4.2. Testy istotności. Kryterium χ
2
Pearsona
Jeżeli mamy tylko hipotezę zerową i nie ma żadnej alternatywy lub alternatywa
jest bardzo złożona, to można zapomnieć o prawdopodobieństwie błędu 2-go rodzaju
i budować kryterium, biorąc pod uwagę wyłącznie prawdopodobieństwo błędu 1-go
rodzaju. Ponieważ, jak wiemy, prawdopodobieństwo błędu 1-go rodzaju nazywa się
poziomem istotności, w rozpatrywanym przypadku hipoteza do sprawdzania nazywa
się hipotezą istotności, a odpowiednie kryteria dla jej weryfikacji – testami istotności.
Takie kryteria są oczywiście niezawodne w mniejszym stopniu niż kryteria o naj-
większej mocy. Wybierając poziom istotności
(najczęściej
05
,
0
lub
01
,
0
),
znajdujemy obszar krytyczny K korzystając z warunku
}
{
0
H
K
x
P
,
gdzie
0
H
jest hipotezą do sprawdzania. Jeżeli obecne dane statystyczne (wartości
próbki x) są takie, że
K
x
, to przy założeniu, że hipoteza
0
H
jest prawdziwa, uwa-
żamy, że otrzymane dane próbki stanowią zdarzenie o bardzo małym prawdopodo-
bieństwie
. Stąd wynika, że nie możemy uwierzyć w prawdziwość hipotezy
0
H
, tj.
hipotezę
0
H
należy odrzucić. Jeżeli natomiast okaże się, że
K
x
, to przy założeniu
prawdziwości
0
H
otrzymano, iż dane próbki x stanowią zdarzenie mające duże
prawdopodobieństwo
1
. Wówczas dochodzimy do wniosku, że otrzymane dane
statystyczne nie są sprzeczne z hipotezą
0
H
. Nie oznacza to, że wskazaną hipotezę
należy przyjąć. Aby mieć pewność, co do jej prawdziwości, należy sprawdzić ją na
dostatecznie wielkiej ilości próbek. Jeżeli wszystkie otrzymane wyniki nie stanowią
sprzeczności z
0
H
, to hipotezę tę można przyjąć. Na tym polega główna wada rozpa-
trywanego podejścia, związana z ignorowaniem prawdopodobieństwa błędu 2-go ro-
dzaju.
Kryteria porównania parametrów dwóch próbek. Niech
1
...,
,
1
n
x
x
oraz
2
...,
,
1
n
y
y
będą dwoma próbkami niezależnymi z rozkładów
2
1
1
,
a
N
i
2
2
2
,
a
N
od-
powiednio (próbki te są niezależne na mocy niezależności ZL
1
...,
,
1
n
x
x
,
2
...,
,
1
n
y
y
).
1) Niech
2
1
i
2
2
są znane. Należy zweryfikować hipotezę
2
1
0
:
a
a
H
.
Ponieważ ZL
x
i
y
są niezależne i mają rozkłady
1
2
1
1
,
n
a
N
i
2
2
2
2
,
n
a
N
od-
powiednio, to ZL
y
x
ma rozkład normalny z parametrami
1
2
)
(
a
a
x
y
E
,
2
2
2
1
2
1
)
(
n
n
x
y
x
y
D
D
D
, tj.
y
x
ma rozkład
2
2
2
1
2
1
1
2
,
n
n
a
a
N
. Wów-
czas ZL
2
2
2
1
2
1
1
2
)
(
n
n
a
a
x
y
ma rozkład
1
,
0
N
. Przy założeniu prawdziwości
0
H
40
otrzymujemy, więc, że ZL
2
2
2
1
2
1
0
0
n
n
x
y
H
ma rozkład
1
,
0
N
. Jest jasne, że
im bliżej siebie są wartości
1
a
i
2
a
, tym mniejsza jest wartość bezwzględna statystyki
. Jako obszar krytyczny należy, więc, wybrać zbiór
}
|
|
|
:
{
0
H
C
K
x
. Jeżeli
jest poziomem istotności kryterium, to stałą C wybieramy z warunku
))
(
1
(
2
}
|
{|
1
}
|
{|
}
|
{|
}
{
1
,
0
0
0
0
0
C
C
C
H
C
H
K
P
P
P
x
P
,
skąd korzystając z tablic znajdujemy C jako pierwiastek równania
2
1
)
(
1
,
0
C
.
Kryterium weryfikacji
0
H
ma, więc, postać następującą:
jeżeli
C
|
|
0
, to hipotezę
0
H
odrzucamy,
jeżeli
C
|
|
0
, to hipoteza
0
H
nie jest sprzeczna względem wyników doświad-
czeń (danych próbki).
2) Niech
1
a
i
2
a
są nieznane. Należy zweryfikować hipotezę
2
2
2
1
0
:
H
.
Dla estymatorów wariancji nieobciążonych
1
1
2
1
2
0
)
(
1
1
n
i
i
x
x
x
n
s
i
2
1
2
2
2
0
)
(
1
1
n
i
i
y
y
y
n
s
mamy
1
1
2
1
2
1
2
0
1
n
s
n
x
,
1
2
2
1
2
2
2
0
2
n
s
n
y
.
Przedstawione tu ZL są niezależne, ponieważ odnoszą się do niezależnych pró-
bek. Wówczas przy założeniu prawdziwości hipotezy
0
H
stosunek
1
1
2
2
1
1
2
1
2
0
2
0
2
1
n
n
s
s
n
n
y
x
ma rozkład Fishera o
1
1
n
,
1
2
n
stopniach swobody (patrz p. 3.2), a stosunek
1
1
1
2
1
2
2
1
2
0
2
0
1
2
n
n
s
s
n
n
x
y
ma rozkład Fishera o
1
2
n
,
1
1
n
stopniach swobody. Przyjęto jest w jakości staty-
styki kryterium korzystać ze stosunku, w którym licznik jest większy niż mianownik.
41
Niech
)
,
max(
2
0
2
0
2
01
y
x
s
s
s
,
)
,
min(
2
0
2
0
2
02
y
x
s
s
s
. Wprowadźmy ZL
2
02
2
01
s
s
. Przy za-
łożeniu prawdziwości hipotezy
0
H
ZL
0
0
H
ma rozkład
2
1
, k
k
F
, gdzie
1
k
1
1
n
,
2
k
1
2
n
, gdy
2
0
2
0
y
x
s
s
, oraz
1
k
1
2
n
,
2
k
1
1
n
, gdy
2
0
2
0
x
y
s
s
. Wy-
bierzmy liczby
1
F
i
2
F
(korzystając z tablicy rozkładu Fishera) tak, aby spełniony
był warunek
2
}
{
}
{
2
0
1
0
F
F
P
P
,
gdzie
jest poziomem istotności kryterium. Jest oczywiste, że ZL
0
1
ma rozkład
1
2
, k
k
F
, skąd wynika, że
2
1
1
}
{
1
0
1
0
F
F
P
P
.
Korzystając z tablicy rozkładu Fishera, znajdujemy
2
F
i
1
1 F
jako odpowiednie
kwantyle:
2
,
,
2
1
2
k
k
F
F
,
2
,
,
1
1
2
1
k
k
F
F
.
Wybierzmy obszar krytyczny:
}
albo
:
{
2
1
,
2
1
F
F
K
K
F
F
x
.
Mamy wówczas
}
albo
{
}
albo
{
}
{
2
0
1
0
0
2
1
0
F
F
H
F
F
H
K
P
P
x
P
2
2
}
{
}
{
2
0
1
0
F
F
P
P
.
Kryterium weryfikacji hipotezy
2
2
2
1
0
:
H
ma, więc, postać:
jeżeli
1
0
F
albo
2
0
F
, to hipotezę
0
H
odrzucamy;
jeżeli
2
0
1
F
F
, to hipoteza
0
H
nie jest sprzeczna względem danych próbki.
Kryterium χ
2
Pearsona w schemacie wielomianowym. Rozważmy n iden-
tycznych doświadczeń niezależnych, w każdym z których zachodzi jedno i tylko jed-
no z k zdarzeń rozłącznych
k
A
A ...,
,
1
. Prawdopodobieństwa zajścia zdarzeń w po-
szczególnych doświadczeniach są równe
1
1
1
}
{
)
(
p
A
A
p
P
, ...,
k
k
k
p
A
A
p
}
{
)
(
P
(
1
1
k
i
i
p
).
Oznaczmy przez
i
liczbę zajścia zdarzenia
i
A
w n doświadczeniach (
,
,
1 k
i
n
k
i
i
1
). Utwórzmy statystykę
k
i
i
i
i
np
np
1
2
2
)
(
.
K. Pearson udowodnił twierdzenie, z którego wynika, że
42
}
{
}
{
lim
2
1
2
t
t
k
n
P
P
,
gdzie
2
1
k
jest ZL, mająca rozkład
2
o
1
k
stopniach swobody.
Możemy, więc, uważać, że przy dużej liczności próbki n ZL
2
zachowuje się
w przybliżeniu tak samo, jak ZL
2
1
k
.
Załóżmy, że na podstawie wyników n niezależnych doświadczeń należy zwery-
fikować hipotezę
0
0
1
1
0
...,
,
:
k
k
p
p
p
p
H
,
gdzie
0
0
1
...,
,
k
p
p
są dane liczby nieujemne takie, że
1
...
0
0
1
k
p
p
. Ponieważ dla
dużych n na podstawie prawa wielkich liczb mamy
i
i
p
n
, tj.
0
i
i
np
, to przy
założeniu prawdziwości
0
H
wartości statystyki
2
nie mogą być zbyt duże. Obszar
krytyczny
p
K
należy, więc, wybrać w taki sposób, aby hipoteza
0
H
została odrzu-
cona gdy wartość statystyki
2
przekroczy pewną wielkość graniczną. Dlatego
wieźmy
}
:
{
2
kr.
2
x
p
K
. Wybierzmy poziom istotności
. Niech
0
2
2
0
H
k
i
i
i
i
np
np
1
0
2
0
)
(
. Wybierzmy
2
kr.
w taki sposób, aby
}
{
}
{
}
{
2
kr.
2
0
0
2
kr.
2
0
P
P
x
P
H
H
K
p
.
Jak wynika z rezultatu K. Pearsona, ostatnią równość możemy zastąpić równo-
ścią przybliżoną
}
{
2
kr.
2
1
k
P
. Wówczas korzystając z tablic rozkładu
2
mo-
żemy znaleźć wartość przybliżoną
)
,
1
(
2
2
kr.
k
.
Kryterium weryfikacji hipotezy
0
H
ma więc postać następującą:
jeżeli
)
,
1
(
2
2
0
k
, to hipotezę
0
H
odrzucamy;
jeżeli
)
,
1
(
2
2
0
k
, to hipoteza
0
H
nie jest sprzeczna wynikom doświad-
czeń.
Warto jeszcze raz podkreślić, że kryterium tę należy stosować tylko dla próbek
o dużej liczności.
4.3. Kryteria zgodności
Niech
n
x
x ...,
,
1
będzie próbką z rozkładu P o dystrybuancie nieznanej
)
(x
F
.
Należy zweryfikować hipotezę
)
(
)
(
:
0
0
x
F
x
F
H
, gdzie
)
(
0
x
F
jest daną z góry dys-
trybuantą (tj.
)
(
0
x
F
jest niemalejąca, lewostronnie ciągła oraz
0
)
(
0
F
,
1
)
(
0
F
). Hipoteza o takiej postaci nazywa się hipotezą zgodności, a kryteria jej
weryfikacji – kryteriami zgodności.
43
Najczęściej kryteria zgodności są budowane w sposób następujący. Jak wiemy,
dystrybuanta teoretyczna F i dystrybuanta empiryczna
*
n
F
są bliskie siebie przy du-
żych n. Wybierzmy pewną miarę odchylenia
)
...,
,
(
)
,
(
1
*
n
n
n
n
n
x
x
F
F
funkcji
*
n
F
od funkcji F. Wybór taki nie jest jednoznaczny, w zależności od sposobu wyboru
uzyskujemy różne kryteria zgodności. Załóżmy, że udało się znaleźć rozkład gra-
niczny ZL
n
gdy
n
. ZL o takim rozkładzie oznaczmy przez
. Obszar kry-
tyczny
F
K
wybieramy w sposób następujący:
}
:
{
kr.
x
F
K
. Znając poziom
istotności
znajdziemy następnie
kr.
z równania
}
{
}
{
}
{
kr.
0
0
kr.
0
P
P
x
P
H
H
K
F
,
gdzie
0
0
H
jest wartością miary granicznej przy warunku prawdziwości hipote-
zy
0
H
. Kryterium dla weryfikacji hipotezy
0
H
budujemy, więc, w sposób standar-
dowy:
jeżeli
kr.
0
, to hipotezę
0
H
odrzucamy;
jeżeli
kr.
0
, to uważamy, że hipoteza
0
H
odpowiada danym próbki.
Warto zauważyć, że kryteria zgodności stanowią przypadek szczególny testów
istotności, ponieważ nie uwzględniają prawdopodobieństwa błędu 2-go rodzaju.
Kryterium χ
2
Pearsona jako kryterium zgodności. Niech
n
x
x ...,
,
1
będzie
próbką z rozkładu P o dystrybuancie nieznanej
)
(x
F
. Należy zweryfikować hipotezę
)
(
)
(
:
0
0
x
F
x
F
H
, gdzie
)
(
0
x
F
jest daną z góry dystrybuantą. Dzielmy prostą rze-
czywistą R na k rozłącznych przedziałów
)
;
(
1
0
1
z
z
,
)
;
[
2
1
2
z
z
,
)
;
[
3
2
3
z
z
, ...,
)
;
[
1
k
k
k
z
z
. Oznaczmy przez
i
A
zdarzenie polegające na
tym, że wartość ZL teoretycznej
trafi do przedziału
i
, wówczas mamy
i
p
)
(
)
(
}
{
)
(
1
i
i
i
i
z
F
z
F
A
p
P
,
k
i
,
1
. Oznaczmy przez
i
liczbę wartości
próbki co trafili do przedziału
i
, tj. liczbę zajścia zdarzenia
i
A
w n doświadcze-
niach.
Załóżmy, że hipoteza
0
H
jest prawdziwa, tj.
0
F
F
. Tym bardziej więc praw-
dziwa jest hipoteza
0
0
1
1
0
...,
,
:
k
k
p
p
p
p
H
, gdzie
)
(
)
(
)
(
1
0
0
0
1
0
0
1
z
F
z
F
z
F
p
,
)
(
)
(
1
0
2
0
0
2
z
F
z
F
p
, ...,
0
k
p
)
(
1
)
(
)
(
1
0
1
0
0
k
k
k
z
F
z
F
z
F
.
Wówczas zagadnienie weryfikacji hipotezy
0
H
sprowadza się do weryfikacji
hipotezy sprawdzania odpowiednich prawdopodobieństw w schemacie wielomiano-
wym. Utwórzmy statystykę
k
i
i
i
i
np
np
1
2
2
)
(
, której rozkład graniczny przy
n
na mocy twierdzenia Pearsona zgadza się z rozkładem
2
o
1
k
stopniach
44
swobody. Obliczamy, więc,
)
(
)
(
1
0
0
0
i
i
i
z
F
z
F
p
,
k
i
,
1
, następnie obliczamy
wartość statystyki
2
przy założeniu prawdziwości hipotezy
0
H
:
k
i
i
i
i
H
np
np
1
0
2
0
2
2
0
)
(
0
.
Znając poziom istotności
, znajdujemy korzystając z tablic rozkładu
2
od-
powiedni kwantyl
)
,
1
(
2
k
. Kryterium weryfikacji hipotezy
0
H
wygląda, więc,
następującą:
jeżeli
)
,
1
(
2
2
0
k
, to hipotezę
0
H
odrzucamy;
jeżeli
)
,
1
(
2
2
0
k
, to uważamy, że hipoteza
0
H
odpowiada danym próbki.
Uwaga 1. W danym przypadku miarą odchylenia
*
n
F
od F służy
k
i
i
i
i
n
np
np
F
F
1
2
*
2
)
(
)
,
(
.
Uwaga 2. Na ile części i w jaki sposób należy dzielić prostą rzeczywistą? Istnie-
je wiele rekomendacji co do tego pytania. M. Kendall i J. Stewart proponują skom-
plikowaną procedurą, w której przedziały wybierają w taki sposób, aby prawdopodo-
bieństwa teoretyczne
0
i
p
były równe siebie
k
p
p
k
1
...
0
0
1
. Zwykle postępują w
sposób prostszy, dzieląc przedział [
)
(
)
1
(
;
n
x
x
) na dostatecznie wielką liczbę przedzia-
łów o tej samej długości, następnie zakładają, że
2
, ...,
1
k
są częściami we-
wnętrznymi takiego podziału, jako
1
wybierają sumę przedziału
)
;
(
)
1
(
x
i pierw-
szego przedziału otrzymanego przy podziale [
)
(
)
1
(
;
n
x
x
), jako
n
wybierają sumę
ostatniego otrzymanego przy podziale [
)
(
)
1
(
;
n
x
x
) przedziału i przedziału
)
;
[
n
x
.
Polecono, aby dla każdego
i
była spełniona nierówność
5
0
i
np
. Należy,
więc, opracować algorytm zmiany podziału na
i
w tym przypadku, gdy podana nie-
równość nie jest spełniona dla wszystkich przedziałów. Podział prostej rzeczywistej i
wspomniany algorytm należy opracować przed tym, jak będą znane dane próbki. Sto-
sowanie podziału i algorytmy do konkretnej próbki prowadzi do tego, że końce z
i
otrzymanych przedziałów będą funkcjami od
n
x
x ...,
,
1
, tj. zmiennymi losowymi, na-
tomiast twierdzenie Pearsona jest prawdziwe tylko w przypadku podziału prostej z
ustalonymi końcami przedziałów (nie zależnie od danych próbki). Załóżmy, że po-
przednie prosta rzeczywista została podzielona w podany wyżej sposób. Przykładem
algorytmu prawidłowego podziału spełniającego warunek
5
0
i
np
jest następujący:
jeżeli wskazany warunek jest spełniony w przedziale
1
, ten przedział nie ulega
zmianie, w przypadku przeciwnym łączymy ten przedział z
2
. Jeżeli w nowym
45
otrzymanym przedziale dany warunek wciąż nie będzie spełniony, łączymy razem
1
,
2
i
3
itd. dopóki nierówność nie będzie spełniona. Otrzymujemy w końcu
danej procedury nowy przedział
1
. Dalej bierzemy następny przedział (po nowym
1
) i postępujemy w podobny sposób, łącząc go w razie potrzeby z następnymi prze-
działami, itd. Przy takim postępowaniu liczba przedziałów otrzymanych przy począt-
kowym podziale prostej albo zmniejsza się, albo zostanie bez zmian.
Zauważmy, że z kryterium
2
należy korzystać w przypadku próbek o dużej
liczności. Autorzy rozważne polecają korzystać z tego kryterium, gdy
150
n
. Bar-
dziej odważne autorzy korzystają z niego, gdy
30
n
.
Uwaga 3. Podejrzewamy, że ZL teoretyczna
spełnia rozkład normalny, które-
go parametry są nieznane. Wtedy słuszna jest weryfikacja hipotezy
ZL
:
0
H
ma rozkład
2
0
, s
x
N
.
Czy możemy dla jej weryfikacji korzystać z kryterium
2
? Można dowieść, że
w tym przypadku całą procedura pozostaje w mocy z wyjątkiem tego, że wielkość
)
,
1
(
2
k
należy zastąpić przez
)
,
3
(
2
k
. W przypadku ogólnym, jeżeli prób-
kę tworzymy przy założeniu, że ZL teoretyczna ma rozkład o dystrybuancie
)
...,
,
(
1
0
m
x
F
, co zależy od m parametrów nieznanych, to najpierw należy wyzna-
czyć ich estymatory
m
ˆ
...,
,
ˆ
1
(np. za pomocą metody największej wiarygodności).
Następnie należy zweryfikować hipotezę
)
ˆ
...,
,
ˆ
(
)
(
:
1
0
0
m
x
F
x
F
H
. Wówczas re-
zultat Pearsona pozostaje w mocy z wyjątkiem tego, że rozkładem granicznym staty-
styki
k
i
i
i
i
np
np
1
2
2
)
(
będzie rozkład
2
o
1
m
k
stopniach swobody. Kryterium Pearsona w danym
przypadku można, więc, stosować, tylko że liczba stopni swobody przy obliczaniu
odpowiedniej kwantyli zmniejsza się o m. Oczywiście, w przypadku tym liczba czę-
ści rozbicia prostej rzeczywistej k musi być większa niż m.
Kryterium zgodności ω
2
. Stosowanie kryterium
2
polega na podziale prostej
rzeczywistej na części w pewnym stopniu w sposób dowolny, co prowadzi do utraty
części informacji a więc do tego, że wynik stosowania danego kryterium może zale-
żeć od sposobu podziału. Rozważmy teraz kryterium swobodny od wskazanej wady.
Przez H. Cramera, R. Mizesa i N. V. Smirnova wprowadzono następującą miarę
odchylenia dystrybuanty empirycznej od dystrybuanty teoretycznej:
46
)
(
|
)
(
)
(
|
)
,
(
*
*
x
dK
x
F
x
F
F
F
n
n
,
gdzie
)
(x
K
jest w pewnym sensie dowolną funkcją niemalejącą. N. V. Smirnov w
jakości
)
(x
K
zaproponował wziąć funkcję
)
(x
F
, co prowadzi do miary
)
(
|
)
(
)
(
|
*
2
x
dF
x
F
x
F
n
.
Jeżeli w ostatni wzór podstawić postać dystrybuanty empirycznej
,
gdy
,
1
.
..........
..........
..........
,
gdy
,
2
,
gdy
,
1
,
gdy
,
0
)
(
)
(
)
3
(
)
2
(
)
2
(
)
1
(
)
1
(
*
n
n
x
x
x
x
x
n
x
x
x
n
x
x
x
F
to po obliczeniach (oblicz samodzielnie) otrzymujemy
n
k
k
n
k
x
F
n
n
1
2
)
(
2
2
2
1
2
)
(
1
12
1
.
N. V. Smirnov udowodnił, że w przypadku ciągłej funkcji
)
(x
F
dla
2
n
W
n
istnieje granica
}
{
}
{
lim
x
W
x
W
n
n
P
P
,
której wartość nie zależy od F.
Istnieją tablicy rozkładu ZL granicznej W, z których możemy znając poziom
istotności
wyznaczyć punkt krytyczny
W
spełniający warunek
}
{
W
W
P
.
Niech poziom istotności
jest znany. Znajdziemy
W
. Następnie obliczamy
2
1
)
(
0
2
2
2
0
0
2
1
2
)
(
1
12
1
0
n
k
k
H
n
n
k
x
F
n
n
n
n
n
W
.
Kryterium weryfikacji hipotezy
0
H
wygląda następującą:
jeżeli
W
W
n0
, to hipotezę
)
(
)
(
0
x
F
x
F
odrzucamy,
jeżeli
W
W
n0
, to hipoteza
)
(
)
(
0
x
F
x
F
nie jest sprzeczna z danymi próbki.