mp2 rozd4 id 781670 Nieznany

background image

37

4. WERYFIKACJA HIPOTEZ


4.1. Wiadomości wstępne


Niech dana będzie próbka

n

x

x ...,

,

1

z rozkładu absolutnie ciągłego P o gęstości

nieznanej

)

( y

f

. Wektor losowy

)

...,

,

(

1

n

x

x

x

będziemy nazywali wektorem obser-

wacji, a zbiór jego wszystkich możliwych wartości X przestrzenią próbek. Naszym
celem jest sprawdzanie (weryfikacja) hipotezy głównej (zerowej)

0

H

, polegającej na

tym, że

)

(

)

(

0

y

f

y

f

, gdzie

)

(

0

y

f

jest daną z góry gęstością (tj.

0

)

(

0

y

f

,

 1

)

(

0

dy

y

f

). Hipoteza zerowa może być określona także w inny sposób. Ponieważ

ZL

i

x

są niezależne, to gęstość wektora losowego x jest równa

)

(x

f

)

(

)...

(

)

(

2

1

n

x

f

x

f

x

f

. A więc hipoteza zerowa polega na tym, że w przestrzeni pró-

bek X wektor x spełnia rozkład o gęstości

)

(

)

...,

,

(

)

(

0

1

x

x

f

x

x

f

f

n

, gdzie

)

(

)...

(

)

(

)

(

0

2

0

1

0

0

n

x

f

x

f

x

f

f

x

. Symbolicznie hipotezę zerową będziemy, więc, zapi-

sywali w postaci

:

0

H

)

(

)

(

0

y

f

y

f

, albo w postaci

:

0

H

)

(

)

(

0

x

x

f

f

.

Rozpatrywana hipoteza zerowa jest prosta, ponieważ rozkład o gęstości

)

(

0

y

f

jest określony jednoznacznie. W tym przypadku, gdy hipoteza

0

H

wyraża ten fakt,

że rozkład o gęstości nieznanej

)

( y

f

należy do pewnej klasy zawierającej więcej niż

jeden rozkład, nazywamy ją hipotezą złożoną. Np. hipoteza polegająca na tym, że
próbka

n

x

x ...,

,

1

należy do rozkładu normalnego, jest złożona, ponieważ klasa roz-

kładów normalnych jest zbiorem wszystkich rozkładów o gęstości

)

(

2

,

y

f

a

2

2

2

)

(

2

1

a

y

e

, gdzie

R

a

,

0

.

Załóżmy, że chcemy zweryfikować hipotezę prostą

0

H

przeciw hipotezy alter-

natywnej

1

H

. Zakładamy również, że prawdziwa jest jedna i tylko jedna z hipotez

0

H

i

1

H

. Najpierw zbadamy przypadek prostych hipotez

:

0

H

)

(

)

(

0

x

x

f

f

(

)

(

)

(

0

y

f

y

f

) i

:

1

H

)

(

)

(

1

x

x

f

f

(

)

(

)

(

1

y

f

y

f

). Tu

)

(

1

y

f

jest pewną gęstością

różną od

)

(

0

y

f

,

)

(

)...

(

)

(

)

(

1

2

1

1

1

1

n

x

f

x

f

x

f

f

x

.

Budowa kryterium dla weryfikacji hipotezy zerowej polega na wyborze w prze-

strzeni próbek obszaru krytycznego K, takiego, że jeżeli wektor obserwacji x

K

, to

hipotezę

0

H

odrzucamy (czyli przyjmujemy hipotezę alternatywną

1

H

). Natomiast,

jeżeli

K

X

K

\

x

, to przyjmujemy hipotezę

0

H

(odrzucamy

1

H

).

background image

38

Przyjmując albo odrzucając hipotezę zerową możemy popełnić błędy dwóch ro-

dzajów.

1. Błąd pierwszego rodzaju popełniamy w przypadku, gdy odrzucamy prawdzi-

wą hipotezę zerową

0

H

. Prawdopodobieństwo błędu pierwszego rodzaju wynosi

K

d

f

H

K

x

x

x

P

)

(

}

prawdziwa

jest

{

0

0

.

Błąd pierwszego rodzaju nazywa się również poziomem istotności kryterium.
2.

Błąd drugiego rodzaju popełniamy w przypadku, gdy przyjmujemy hipotezę

zerową

0

H

, chociaż nie jest ona prawdziwa. Prawdopodobieństwo błędu drugiego

rodzaju wynosi

K

d

f

H

K

x

x

x

P

)

(

}

prawdziwa

jest

{

1

1

.

Rozpatrywane całki tu rozumiemy jako n-krotne, tj.

n

dx

dx

d

...

1

x

.

Kryterium dla weryfikacji hipotezy byłoby idealne, gdyby prawdopodobieństwa

błędów obu rodzajów były równe 0. Niestety nie jest to możliwe wobec niepewności
spowodowanej przypadkowością wyników prowadzonych doświadczeń. Zmniejsza-
jąc prawdopodobieństwo błędu 1-go rodzaju przy ustalonej liczności próbki, my jed-
nocześnie zwiększamy prawdopodobieństwo błędu 2-go rodzaju, odwrotnie, zmniej-
szając prawdopodobieństwo błędu 2-go rodzaju, jednocześnie zwiększamy prawdo-
podobieństwo błędu 1-go rodzaju. Istotnie, zmniejszenie np. prawdopodobieństwa
błędu 1-go rodzaju jest równoważne zmniejszeniu obszaru K, co prowadzi do zmniej-
szenia pierwszej z wypisanych całek. W takich warunkach jednak zwiększa się ob-
szar

K

X

K

\

, co z kolei prowadzi do zwiększenia drugiej całki. Otrzymana

sprzeczność wymaga oczywiście rozstrzygnięcia kompromisowego, tj. takiego, przy
którym oba prawdopodobieństwa byłyby niezbyt duże. Podejście klasyczne polega na
wyborze obszaru krytycznego K w taki sposób, aby prawdopodobieństwo błędu 2-go
rodzaju było minimalne pod warunkiem, że prawdopodobieństwo błędu 1-go rodzaju
(poziom istotności) nie przekracza pewnego poziomu krytycznego

0

.

Definicja 1. Liczba

K

d

f

H

K

H

K

x

x

x

P

x

P

)

(

}

prawdziwa

jest

{

}

prawdziwa

jest

{

1

1

1

1

1

nazywa się mocą kryterium. Kryterium, którego moc jest maksymalna, nazywa się
kryterium o największej mocy.


Minimalizacja prawdopodobieństwa błędu 2-go rodzaju jest oczywiście równo-

ważna do maksymalizacji mocy kryterium.

Zagadnienie znalezienia kryterium o największej mocy da się rozwiązać bardzo

rzadko. Dlatego w ciągu dalszym zajmiemy się prostymi zagadnieniami, które nie
uwzględniają pojęcia błędu 2-go rodzaju.

background image

39

4.2. Testy istotności. Kryterium χ

2

Pearsona


Jeżeli mamy tylko hipotezę zerową i nie ma żadnej alternatywy lub alternatywa

jest bardzo złożona, to można zapomnieć o prawdopodobieństwie błędu 2-go rodzaju
i budować kryterium, biorąc pod uwagę wyłącznie prawdopodobieństwo błędu 1-go
rodzaju. Ponieważ, jak wiemy, prawdopodobieństwo błędu 1-go rodzaju nazywa się
poziomem istotności, w rozpatrywanym przypadku hipoteza do sprawdzania nazywa
się hipotezą istotności, a odpowiednie kryteria dla jej weryfikacji – testami istotności.
Takie kryteria są oczywiście niezawodne w mniejszym stopniu niż kryteria o naj-
większej mocy. Wybierając poziom istotności

(najczęściej

05

,

0

lub

01

,

0

),

znajdujemy obszar krytyczny K korzystając z warunku

}

{

0

H

K

x

P

,

gdzie

0

H

jest hipotezą do sprawdzania. Jeżeli obecne dane statystyczne (wartości

próbki x) są takie, że

K

x

, to przy założeniu, że hipoteza

0

H

jest prawdziwa, uwa-

żamy, że otrzymane dane próbki stanowią zdarzenie o bardzo małym prawdopodo-
bieństwie

. Stąd wynika, że nie możemy uwierzyć w prawdziwość hipotezy

0

H

, tj.

hipotezę

0

H

należy odrzucić. Jeżeli natomiast okaże się, że

K

x

, to przy założeniu

prawdziwości

0

H

otrzymano, iż dane próbki x stanowią zdarzenie mające duże

prawdopodobieństwo

1

. Wówczas dochodzimy do wniosku, że otrzymane dane

statystyczne nie są sprzeczne z hipotezą

0

H

. Nie oznacza to, że wskazaną hipotezę

należy przyjąć. Aby mieć pewność, co do jej prawdziwości, należy sprawdzić ją na
dostatecznie wielkiej ilości próbek. Jeżeli wszystkie otrzymane wyniki nie stanowią
sprzeczności z

0

H

, to hipotezę tę można przyjąć. Na tym polega główna wada rozpa-

trywanego podejścia, związana z ignorowaniem prawdopodobieństwa błędu 2-go ro-
dzaju.


Kryteria porównania parametrów dwóch próbek. Niech

1

...,

,

1

n

x

x

oraz

2

...,

,

1

n

y

y

będą dwoma próbkami niezależnymi z rozkładów

2

1

1

, 

a

N

i

2

2

2

, 

a

N

od-

powiednio (próbki te są niezależne na mocy niezależności ZL

1

...,

,

1

n

x

x

,

2

...,

,

1

n

y

y

).

1) Niech

2

1

i

2

2

są znane. Należy zweryfikować hipotezę

2

1

0

:

a

a

H

.

Ponieważ ZL

x

i

y

są niezależne i mają rozkłady

1

2

1

1

,

n

a

N

i

2

2

2

2

,

n

a

N

od-

powiednio, to ZL

y

x

ma rozkład normalny z parametrami

1

2

)

(

a

a

x

y

E

,

2

2

2

1

2

1

)

(

n

n

x

y

x

y

D

D

D

, tj.

y

x

ma rozkład

2

2

2

1

2

1

1

2

,

n

n

a

a

N

. Wów-

czas ZL

2

2

2

1

2

1

1

2

)

(

n

n

a

a

x

y

ma rozkład

1

,

0

N

. Przy założeniu prawdziwości

0

H

background image

40

otrzymujemy, więc, że ZL

2

2

2

1

2

1

0

0

n

n

x

y

H

ma rozkład

1

,

0

N

. Jest jasne, że

im bliżej siebie są wartości

1

a

i

2

a

, tym mniejsza jest wartość bezwzględna statystyki

. Jako obszar krytyczny należy, więc, wybrać zbiór

}

|

|

|

:

{

0

H

C

K

x

. Jeżeli

jest poziomem istotności kryterium, to stałą C wybieramy z warunku

))

(

1

(

2

}

|

{|

1

}

|

{|

}

|

{|

}

{

1

,

0

0

0

0

0

C

C

C

H

C

H

K

P

P

P

x

P

,

skąd korzystając z tablic znajdujemy C jako pierwiastek równania

2

1

)

(

1

,

0

C

.

Kryterium weryfikacji

0

H

ma, więc, postać następującą:

jeżeli

C

 |

|

0

, to hipotezę

0

H

odrzucamy,

jeżeli

C

 |

|

0

, to hipoteza

0

H

nie jest sprzeczna względem wyników doświad-

czeń (danych próbki).

2) Niech

1

a

i

2

a

są nieznane. Należy zweryfikować hipotezę

2

2

2

1

0

:

H

.

Dla estymatorów wariancji nieobciążonych

1

1

2

1

2

0

)

(

1

1

n

i

i

x

x

x

n

s

i

2

1

2

2

2

0

)

(

1

1

n

i

i

y

y

y

n

s

mamy

1

1

2

1

2

1

2

0

1

n

s

n

x

,

1

2

2

1

2

2

2

0

2

n

s

n

y

.

Przedstawione tu ZL są niezależne, ponieważ odnoszą się do niezależnych pró-

bek. Wówczas przy założeniu prawdziwości hipotezy

0

H

stosunek

1

1

2

2

1

1

2

1

2

0

2

0

2

1

n

n

s

s

n

n

y

x

ma rozkład Fishera o

1

1

n

,

1

2

n

stopniach swobody (patrz p. 3.2), a stosunek

1

1

1

2

1

2

2

1

2

0

2

0

1

2

n

n

s

s

n

n

x

y

ma rozkład Fishera o

1

2

n

,

1

1

n

stopniach swobody. Przyjęto jest w jakości staty-

styki kryterium korzystać ze stosunku, w którym licznik jest większy niż mianownik.

background image

41

Niech

)

,

max(

2

0

2

0

2

01

y

x

s

s

s

,

)

,

min(

2

0

2

0

2

02

y

x

s

s

s

. Wprowadźmy ZL

2

02

2

01

s

s

. Przy za-

łożeniu prawdziwości hipotezy

0

H

ZL

0

0

H

ma rozkład

2

1

, k

k

F

, gdzie

1

k

1

1

n

,

2

k

1

2

n

, gdy

2

0

2

0

y

x

s

s

, oraz

1

k

1

2

n

,

2

k

1

1

n

, gdy

2

0

2

0

x

y

s

s

. Wy-

bierzmy liczby

1

F

i

2

F

(korzystając z tablicy rozkładu Fishera) tak, aby spełniony

był warunek

2

}

{

}

{

2

0

1

0

F

F

P

P

,

gdzie

jest poziomem istotności kryterium. Jest oczywiste, że ZL

0

1 

ma rozkład

1

2

, k

k

F

, skąd wynika, że

2

1

1

}

{

1

0

1

0

F

F

P

P

.

Korzystając z tablicy rozkładu Fishera, znajdujemy

2

F

i

1

1 F

jako odpowiednie

kwantyle:

2

,

,

2

1

2

k

k

F

F

,

2

,

,

1

1

2

1

k

k

F

F

.

Wybierzmy obszar krytyczny:

}

albo

:

{

2

1

,

2

1

F

F

K

K

F

F

x

.

Mamy wówczas

}

albo

{

}

albo

{

}

{

2

0

1

0

0

2

1

0

F

F

H

F

F

H

K

P

P

x

P

2

2

}

{

}

{

2

0

1

0

F

F

P

P

.

Kryterium weryfikacji hipotezy

2

2

2

1

0

:

H

ma, więc, postać:

jeżeli

1

0

F

albo

2

0

F

, to hipotezę

0

H

odrzucamy;

jeżeli

2

0

1

F

F

, to hipoteza

0

H

nie jest sprzeczna względem danych próbki.


Kryterium χ

2

Pearsona w schemacie wielomianowym. Rozważmy n iden-

tycznych doświadczeń niezależnych, w każdym z których zachodzi jedno i tylko jed-
no z k zdarzeń rozłącznych

k

A

A ...,

,

1

. Prawdopodobieństwa zajścia zdarzeń w po-

szczególnych doświadczeniach są równe

1

1

1

}

{

)

(

p

A

A

p

P

, ...,

k

k

k

p

A

A

p

}

{

)

(

P

(

1

1

k

i

i

p

).

Oznaczmy przez

i

liczbę zajścia zdarzenia

i

A

w n doświadczeniach (

,

,

1 k

i

n

k

i

i

1

). Utwórzmy statystykę

k

i

i

i

i

np

np

1

2

2

)

(

.

K. Pearson udowodnił twierdzenie, z którego wynika, że

background image

42

}

{

}

{

lim

2

1

2

t

t

k

n

P

P

,

gdzie

2

1

k

jest ZL, mająca rozkład

2

o

1

k

stopniach swobody.

Możemy, więc, uważać, że przy dużej liczności próbki n ZL

2

zachowuje się

w przybliżeniu tak samo, jak ZL

2

1

k

.

Załóżmy, że na podstawie wyników n niezależnych doświadczeń należy zwery-

fikować hipotezę

0

0

1

1

0

...,

,

:

k

k

p

p

p

p

H

,

gdzie

0

0

1

...,

,

k

p

p

są dane liczby nieujemne takie, że

1

...

0

0

1

k

p

p

. Ponieważ dla

dużych n na podstawie prawa wielkich liczb mamy

i

i

p

n

, tj.

0

i

i

np

, to przy

założeniu prawdziwości

0

H

wartości statystyki

2

nie mogą być zbyt duże. Obszar

krytyczny

p

K

należy, więc, wybrać w taki sposób, aby hipoteza

0

H

została odrzu-

cona gdy wartość statystyki

2

przekroczy pewną wielkość graniczną. Dlatego

wieźmy

}

:

{

2
kr.

2

x

p

K

. Wybierzmy poziom istotności

. Niech

0

2

2
0

H

k

i

i

i

i

np

np

1

0

2

0

)

(

. Wybierzmy

2
kr.

w taki sposób, aby

}

{

}

{

}

{

2
kr.

2
0

0

2
kr.

2

0

P

P

x

P

H

H

K

p

.

Jak wynika z rezultatu K. Pearsona, ostatnią równość możemy zastąpić równo-

ścią przybliżoną

}

{

2
kr.

2

1

k

P

. Wówczas korzystając z tablic rozkładu

2

mo-

żemy znaleźć wartość przybliżoną

)

,

1

(

2

2
kr.

k

.

Kryterium weryfikacji hipotezy

0

H

ma więc postać następującą:

jeżeli

)

,

1

(

2

2
0

k

, to hipotezę

0

H

odrzucamy;

jeżeli

)

,

1

(

2

2
0

k

, to hipoteza

0

H

nie jest sprzeczna wynikom doświad-

czeń.

Warto jeszcze raz podkreślić, że kryterium tę należy stosować tylko dla próbek

o dużej liczności.


4.3. Kryteria zgodności


Niech

n

x

x ...,

,

1

będzie próbką z rozkładu P o dystrybuancie nieznanej

)

(x

F

.

Należy zweryfikować hipotezę

)

(

)

(

:

0

0

x

F

x

F

H

, gdzie

)

(

0

x

F

jest daną z góry dys-

trybuantą (tj.

)

(

0

x

F

jest niemalejąca, lewostronnie ciągła oraz

0

)

(

0



F

,

1

)

(

0



F

). Hipoteza o takiej postaci nazywa się hipotezą zgodności, a kryteria jej

weryfikacji – kryteriami zgodności.

background image

43

Najczęściej kryteria zgodności są budowane w sposób następujący. Jak wiemy,

dystrybuanta teoretyczna F i dystrybuanta empiryczna

*

n

F

są bliskie siebie przy du-

żych n. Wybierzmy pewną miarę odchylenia

)

...,

,

(

)

,

(

1

*

n

n

n

n

n

x

x

F

F

funkcji

*

n

F

od funkcji F. Wybór taki nie jest jednoznaczny, w zależności od sposobu wyboru

uzyskujemy różne kryteria zgodności. Załóżmy, że udało się znaleźć rozkład gra-
niczny ZL

n

gdy

n

. ZL o takim rozkładzie oznaczmy przez

. Obszar kry-

tyczny

F

K

wybieramy w sposób następujący:

}

:

{

kr.

x

F

K

. Znając poziom

istotności

znajdziemy następnie

kr.

z równania

}

{

}

{

}

{

kr.

0

0

kr.

0

P

P

x

P

H

H

K

F

,

gdzie

0

0

H

jest wartością miary granicznej przy warunku prawdziwości hipote-

zy

0

H

. Kryterium dla weryfikacji hipotezy

0

H

budujemy, więc, w sposób standar-

dowy:

jeżeli

kr.

0

, to hipotezę

0

H

odrzucamy;

jeżeli

kr.

0

, to uważamy, że hipoteza

0

H

odpowiada danym próbki.

Warto zauważyć, że kryteria zgodności stanowią przypadek szczególny testów

istotności, ponieważ nie uwzględniają prawdopodobieństwa błędu 2-go rodzaju.


Kryterium χ

2

Pearsona jako kryterium zgodności. Niech

n

x

x ...,

,

1

będzie

próbką z rozkładu P o dystrybuancie nieznanej

)

(x

F

. Należy zweryfikować hipotezę

)

(

)

(

:

0

0

x

F

x

F

H

, gdzie

)

(

0

x

F

jest daną z góry dystrybuantą. Dzielmy prostą rze-

czywistą R na k rozłącznych przedziałów

)

;

(

1

0

1

z

z



,

)

;

[

2

1

2

z

z

,

)

;

[

3

2

3

z

z

, ...,

)

;

[

1



k

k

k

z

z

. Oznaczmy przez

i

A

zdarzenie polegające na

tym, że wartość ZL teoretycznej

trafi do przedziału

i

, wówczas mamy

i

p

)

(

)

(

}

{

)

(

1

i

i

i

i

z

F

z

F

A

p

P

,

k

i

,

1

. Oznaczmy przez

i

liczbę wartości

próbki co trafili do przedziału

i

, tj. liczbę zajścia zdarzenia

i

A

w n doświadcze-

niach.

Załóżmy, że hipoteza

0

H

jest prawdziwa, tj.

0

F

F

. Tym bardziej więc praw-

dziwa jest hipoteza

0

0

1

1

0

...,

,

:

k

k

p

p

p

p

H

, gdzie

)

(

)

(

)

(

1

0

0

0

1

0

0

1

z

F

z

F

z

F

p

,

)

(

)

(

1

0

2

0

0

2

z

F

z

F

p

, ...,

0

k

p

)

(

1

)

(

)

(

1

0

1

0

0

k

k

k

z

F

z

F

z

F

.

Wówczas zagadnienie weryfikacji hipotezy

0

H

sprowadza się do weryfikacji

hipotezy sprawdzania odpowiednich prawdopodobieństw w schemacie wielomiano-

wym. Utwórzmy statystykę

k

i

i

i

i

np

np

1

2

2

)

(

, której rozkład graniczny przy

n

na mocy twierdzenia Pearsona zgadza się z rozkładem

2

o

1

k

stopniach

background image

44

swobody. Obliczamy, więc,

)

(

)

(

1

0

0

0

i

i

i

z

F

z

F

p

,

k

i

,

1

, następnie obliczamy

wartość statystyki

2

przy założeniu prawdziwości hipotezy

0

H

:

k

i

i

i

i

H

np

np

1

0

2

0

2

2
0

)

(

0

.

Znając poziom istotności

, znajdujemy korzystając z tablic rozkładu

2

od-

powiedni kwantyl

)

,

1

(

2

k

. Kryterium weryfikacji hipotezy

0

H

wygląda, więc,

następującą:

jeżeli

)

,

1

(

2

2
0

k

, to hipotezę

0

H

odrzucamy;

jeżeli

)

,

1

(

2

2
0

k

, to uważamy, że hipoteza

0

H

odpowiada danym próbki.

Uwaga 1. W danym przypadku miarą odchylenia

*

n

F

od F służy

k

i

i

i

i

n

np

np

F

F

1

2

*

2

)

(

)

,

(

.


Uwaga 2. Na ile części i w jaki sposób należy dzielić prostą rzeczywistą? Istnie-

je wiele rekomendacji co do tego pytania. M. Kendall i J. Stewart proponują skom-
plikowaną procedurą, w której przedziały wybierają w taki sposób, aby prawdopodo-

bieństwa teoretyczne

0

i

p

były równe siebie

k

p

p

k

1

...

0

0

1

. Zwykle postępują w

sposób prostszy, dzieląc przedział [

)

(

)

1

(

;

n

x

x

) na dostatecznie wielką liczbę przedzia-

łów o tej samej długości, następnie zakładają, że

2

, ...,

1

k

są częściami we-

wnętrznymi takiego podziału, jako

1

wybierają sumę przedziału

)

;

(

)

1

(

x



i pierw-

szego przedziału otrzymanego przy podziale [

)

(

)

1

(

;

n

x

x

), jako

n

wybierają sumę

ostatniego otrzymanego przy podziale [

)

(

)

1

(

;

n

x

x

) przedziału i przedziału

)

;

[

n

x

.

Polecono, aby dla każdego

i

była spełniona nierówność

5

0

i

np

. Należy,

więc, opracować algorytm zmiany podziału na

i

w tym przypadku, gdy podana nie-

równość nie jest spełniona dla wszystkich przedziałów. Podział prostej rzeczywistej i
wspomniany algorytm należy opracować przed tym, jak będą znane dane próbki. Sto-
sowanie podziału i algorytmy do konkretnej próbki prowadzi do tego, że końce z

i

otrzymanych przedziałów będą funkcjami od

n

x

x ...,

,

1

, tj. zmiennymi losowymi, na-

tomiast twierdzenie Pearsona jest prawdziwe tylko w przypadku podziału prostej z
ustalonymi końcami przedziałów (nie zależnie od danych próbki). Załóżmy, że po-
przednie prosta rzeczywista została podzielona w podany wyżej sposób. Przykładem

algorytmu prawidłowego podziału spełniającego warunek

5

0

i

np

jest następujący:

jeżeli wskazany warunek jest spełniony w przedziale

1

, ten przedział nie ulega

zmianie, w przypadku przeciwnym łączymy ten przedział z

2

. Jeżeli w nowym

background image

45

otrzymanym przedziale dany warunek wciąż nie będzie spełniony, łączymy razem

1

,

2

i

3

itd. dopóki nierówność nie będzie spełniona. Otrzymujemy w końcu

danej procedury nowy przedział

1

. Dalej bierzemy następny przedział (po nowym

1

) i postępujemy w podobny sposób, łącząc go w razie potrzeby z następnymi prze-

działami, itd. Przy takim postępowaniu liczba przedziałów otrzymanych przy począt-
kowym podziale prostej albo zmniejsza się, albo zostanie bez zmian.

Zauważmy, że z kryterium

2

należy korzystać w przypadku próbek o dużej

liczności. Autorzy rozważne polecają korzystać z tego kryterium, gdy

150

n

. Bar-

dziej odważne autorzy korzystają z niego, gdy

30

n

.


Uwaga 3. Podejrzewamy, że ZL teoretyczna

spełnia rozkład normalny, które-

go parametry są nieznane. Wtedy słuszna jest weryfikacja hipotezy

ZL

:

0

H

ma rozkład

2

0

, s

x

N

.

Czy możemy dla jej weryfikacji korzystać z kryterium

2

? Można dowieść, że

w tym przypadku całą procedura pozostaje w mocy z wyjątkiem tego, że wielkość

)

,

1

(

2

k

należy zastąpić przez

)

,

3

(

2

k

. W przypadku ogólnym, jeżeli prób-

kę tworzymy przy założeniu, że ZL teoretyczna ma rozkład o dystrybuancie

)

...,

,

(

1

0

m

x

F

, co zależy od m parametrów nieznanych, to najpierw należy wyzna-

czyć ich estymatory

m

ˆ

...,

,

ˆ

1

(np. za pomocą metody największej wiarygodności).

Następnie należy zweryfikować hipotezę

)

ˆ

...,

,

ˆ

(

)

(

:

1

0

0

m

x

F

x

F

H

. Wówczas re-

zultat Pearsona pozostaje w mocy z wyjątkiem tego, że rozkładem granicznym staty-
styki

k

i

i

i

i

np

np

1

2

2

)

(

będzie rozkład

2

o

1

m

k

stopniach swobody. Kryterium Pearsona w danym

przypadku można, więc, stosować, tylko że liczba stopni swobody przy obliczaniu
odpowiedniej kwantyli zmniejsza się o m. Oczywiście, w przypadku tym liczba czę-
ści rozbicia prostej rzeczywistej k musi być większa niż m.

Kryterium zgodności ω

2

. Stosowanie kryterium

2

polega na podziale prostej

rzeczywistej na części w pewnym stopniu w sposób dowolny, co prowadzi do utraty
części informacji a więc do tego, że wynik stosowania danego kryterium może zale-
żeć od sposobu podziału. Rozważmy teraz kryterium swobodny od wskazanej wady.

Przez H. Cramera, R. Mizesa i N. V. Smirnova wprowadzono następującą miarę

odchylenia dystrybuanty empirycznej od dystrybuanty teoretycznej:

background image

46



)

(

|

)

(

)

(

|

)

,

(

*

*

x

dK

x

F

x

F

F

F

n

n

,

gdzie

)

(x

K

jest w pewnym sensie dowolną funkcją niemalejącą. N. V. Smirnov w

jakości

)

(x

K

zaproponował wziąć funkcję

)

(x

F

, co prowadzi do miary



)

(

|

)

(

)

(

|

*

2

x

dF

x

F

x

F

n

.

Jeżeli w ostatni wzór podstawić postać dystrybuanty empirycznej

,

gdy

,

1

.

..........

..........

..........

,

gdy

,

2

,

gdy

,

1

,

gdy

,

0

)

(

)

(

)

3

(

)

2

(

)

2

(

)

1

(

)

1

(

*

n

n

x

x

x

x

x

n

x

x

x

n

x

x

x

F

to po obliczeniach (oblicz samodzielnie) otrzymujemy

n

k

k

n

k

x

F

n

n

1

2

)

(

2

2

2

1

2

)

(

1

12

1

.

N. V. Smirnov udowodnił, że w przypadku ciągłej funkcji

)

(x

F

dla

2

n

W

n

istnieje granica

}

{

}

{

lim

x

W

x

W

n

n

P

P

,

której wartość nie zależy od F.

Istnieją tablicy rozkładu ZL granicznej W, z których możemy znając poziom

istotności

wyznaczyć punkt krytyczny

W

spełniający warunek

}

{

W

W

P

.

Niech poziom istotności

jest znany. Znajdziemy

W

. Następnie obliczamy

2

1

)

(

0

2

2

2
0

0

2

1

2

)

(

1

12

1

0

n

k

k

H

n

n

k

x

F

n

n

n

n

n

W

.

Kryterium weryfikacji hipotezy

0

H

wygląda następującą:

jeżeli

W

W

n0

, to hipotezę

)

(

)

(

0

x

F

x

F

odrzucamy,

jeżeli

W

W

n0

, to hipoteza

)

(

)

(

0

x

F

x

F

nie jest sprzeczna z danymi próbki.


Wyszukiwarka

Podobne podstrony:
mp2 rozd3 id 781669 Nieznany
mp2 rozd1 id 781667 Nieznany
mp2 rozd2 id 781668 Nieznany
mp2 zad3 id 309079 Nieznany
Abolicja podatkowa id 50334 Nieznany (2)
4 LIDER MENEDZER id 37733 Nieznany (2)
katechezy MB id 233498 Nieznany
metro sciaga id 296943 Nieznany
perf id 354744 Nieznany
interbase id 92028 Nieznany
Mbaku id 289860 Nieznany
Probiotyki antybiotyki id 66316 Nieznany
miedziowanie cz 2 id 113259 Nieznany
LTC1729 id 273494 Nieznany
D11B7AOver0400 id 130434 Nieznany
analiza ryzyka bio id 61320 Nieznany
pedagogika ogolna id 353595 Nieznany

więcej podobnych podstron