Testowanie hipotez


Testowanie hipotez
Niech X = (X1, . . . , Xn) bÄ™dzie próbÄ… losowÄ… na przestrzeni X , zaÅ› P = {P¸, ¸ " Åš}
rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X .
Definicja 1. HipotezÄ… zerowÄ… Åš0 ‚" Åš nazywamy hipotezÄ™, której prawdziwość chcemy
zweryfikować na podstawie obserwacji. Hipoteza alternatywna jest postaci Ś1 = Ś\Ś0.
Hipoteza prosta zawiera jeden element, np. H0 : ¸ = 2, hipoteza zÅ‚ożona zawiera wiÄ™cej
niż jeden element, np. H0 : ¸ > 4.
Definicja 2. Obszar krytyczny testu jest to obszar odrzucenia hipotezy zerowej. Naj-
częściej ma on postać K = {X : T (X) > c}, gdzie c jest poziomem krytycznym testu,
wyznaczonym przez kwantyl rozkładu, z jakiego pochodzi statystyka testowa przy zało-
żeniu prawdziwości hipotezy zerowej (zależy on od przyjętego poziomu istotności testu).
Definicja 3. Test można identyfikować z jego obszarem krytycznym K lub funkcją kry-
tycznÄ… Õ : X - {0, 1} postaci
1, gdy X " K,
Õ(X) = 1K(X) =
0, gdy X " K,
/
Definicja 4. Prawdopodobieństwo błędu pierwszego rodzaju to prawdopodobieństwo od-
rzucenia hipotezy zerowej, gdy jest ona prawdziwa:
Ä…I(¸) = P¸(X " K), ¸ " Åš0.
Definicja 5. Prawdopodobieństwo błędu drugiego rodzaju to prawdopodobieństwo przy-
jęcia hipotezy zerowej, gdy jest ona fałszywa:
Ä…II(¸) = P¸(X " Kc) = 1 - P¸(X " K), ¸ " Åš1.
Definicja 6. FunkcjÄ… mocy testu nazywamy ² : Åš - [0, 1] postaci
²(¸) = P¸(X " K) = E¸Õ(X).
Z reguÅ‚y bada siÄ™ moc testu na alternatywie, czyli ¸ = ¸1.
Definicja 7. Test o funkcji krytycznej Õ (o obszarze krytycznym K) jest testem na
poziomie istotności ą " (0, 1), jeżeli
"¸"Åš E¸Õ(X) = P¸(X " K) = ²(¸) d" Ä….
0
Definicja 8. Rozmiarem testu o funkcji krytycznej Õ (obszarze krytycznym K) nazywamy
wielkość
² = sup E¸Õ(X) = sup ²(¸).
¸"Åš0 ¸"Åš0
Definicja 9. Test Õ" (K") na poziomie istotnoÅ›ci Ä… jest testem jednostajnie najmocniej-
szym (JNM) w klasie testów Ś (K) na poziomie ą, jeżeli
"Õ"Åš "¸"Åš ²"(¸) e" ²(¸).
1
1
Twierdzenie (podstawowy lemat Neymana-Pearsona) Niech P0 i P1 będą rozkła-
dami prawdopodobieństwa i niech f0 i f1 będą gęstościami tych rozkładów (względem
pewnej ustalonej miary µ). Niech Ä… " (0, 1) bÄ™dzie ustalonÄ… liczbÄ….
(a) (istnienie testu) Istnieją stałe c i ł > 0 takie, że
Å„Å‚
1, gdy f1(x) > cf0(x),
òÅ‚
Õ(x) = Å‚, gdy f1(x) = cf0(x),
ół
0, gdy f1(x) < tf0(x),
jest testem hipotezy H0 : P0 przeciwko H1 : P1 na poziomie istotności ą, tzn.
E0Õ(X) = Ä…. (1)
(b) (dostateczność) Jeżeli test Õ speÅ‚nia warunek (1) i dla pewnego c warunek
1, gdy f1(x) > cf0(x),
Õ(x) = (2)
0, gdy f1(x) < tf0(x),
to Õ jest testem najmocniejszym dla testowania H0 przeciwko H1 na poziomie istotnoÅ›ci Ä….
(c) (konieczność) Jeżeli Ć jest testem najmocniejszym na poziomie istotności ą dla
testowania H0 przeciwko H1, to dla pewnego c spełnia on warunek (2).
Podsumowując, test statystyczny składa się z:
1. Hipotezy zerowej H0 i hipotezy alternatywnej H1,
2. Statystyki testowej T (X),
3. Obszaru krytycznego K.
4. Poziomu istotności ą,
Decyzja: jeżeli T (X) " K, to odrzucamy hipotezę H0, jeżeli T (X) " K, to nie mamy
/
podstaw do odrzucenia hipotezy zerowej.
Definicja 10. P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy któ-
rym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej.
Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając
od lewej - od małego poziomu ą, kiedy to nie mamy podstaw do odrzucenia H0, po
przekroczeniu p-wartości zaczynamy odrzucać H0).
P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest
większa, tym bardziej hipoteza H0 jest prawdziwa. Mała p-wartość świadczy przeciwko
hipotezie zerowej.
Znajomość p-wartości pozwala przeprowadzić testowanie dla dowolnego poziomu istot-
ności:
-odrzucamy hipotezÄ™ zerowÄ… H0, gdy
p-wartość d" ą,
-nie mamy podstaw do odrzucenia hipotezy zerowej H0, gdy
p-wartość > ą.
2
Test Chi-kwadrat zgodności
nr klasy 1 2 3 4 5 ...
liczebności empiryczne n1 n2 n3 n4 n5 ...
" Hipotezy
H0 : X <" F, H1 : X F,
F jest dowolnym rozkładem prawdopodobieństwa.
" Statystyka testowa
k
(ni - nt)2
i
Ç2 = ,
nt
i
i=1
gdzie
k - liczba klas,
ni - liczebności empiryczne (zaobserwowane),
nt = n · pt - liczebnoÅ›ci teoretyczne,
i i
pt = PF (Xprzyjeła wartosc z klasy i) - prawdopodobieństwa teoretyczne.
i
Przy zaÅ‚ożeniu prawdziwoÅ›ci hipotezy zerowej statystyka Ç2 ma rozkÅ‚ad chi-kwadrat
z (k - r - 1) stopniami swobody (r jest liczbą nieznanych parametrów hipotetycz-
nego rozkładu F ).
" Obszar krytyczny
-1
K = (FÇ (1 - Ä…), +"),
2
k-1
-1
gdzie FÇ (1 - Ä…) jest kwantylem rzÄ™du 1 - Ä… rozkÅ‚adu chi-kwadrat z (k - r - 1)
2
k-1
stopniami swobody.
Test Chi-kwadrat niezależności
Tablica kontyngencji:
Cecha 1
Cecha 2 1 2 . . . k
1 n11 n12 . . . n1k
2 n21 n22 . . . n23
. . . . . . . . . . . . . . .
r nr1 nr2 . . . nrk
" Hipotezy
H0 : X, Y są niezależne, vs H1 : X, Y są zależne
3
" Statystyka testowa
k r
(nij - nt )2
ij
Ç2 = ,
nt
ij
j=1 i=1
gdzie
k - liczba kolumn w tablicy kontyngencji,
r - liczba wierszy w tablicy kontyngencji,
nij - liczebności empiryczne (zaobserwowane),
nt - liczebności teoretyczne, dane wzorem
ij
k r
nij · nij
j=1 i=1
nt = ,
ij
n
k r
gdzie n = nij .
j=1 i=1
Przy zaÅ‚ożeniu prawdziwoÅ›ci hipotezy zerowej statystyka Ç2 ma rozkÅ‚ad chi-kwadrat
z (k - 1)(r - 1) stopniami swobody.
" Obszar krytyczny
-1
K = (FÇ (1 - Ä…), +"),
2
(k-1)(r-1)
-1
gdzie FÇ (1 - Ä…) jest kwantylem rzÄ™du 1 - Ä… rozkÅ‚adu chi-kwadrat z (k - r - 1)
2
k-1
stopniami swobody.
Test Kołmogorowa
Test Kołmogorowa testuje zgodność z rozkładem F dla jednej próby (Test Kołmogorowa
- Smirnowa dla dwóch prób testuje zgodność rozkładów w obu próbach).
" Hipotezy
H0 : X <" F, H1 : X F,
gdzie F jest ciągłym rozkładem prawdopodobieństwa.
1. n d" 100
" Statystyka testowa
i - 1 i
Dn = sup |F (x) - Fn(x)| = max max F (Xi:n) - , - F (Xi:n) ,
1d"id"n
n n
x"R
4
" Obszar krytyczny
-1
K = (FD (1 - Ä…), 1],
n
-1
gdzie FD (1-ą) jest kwantylem rzędu 1-ą rozkładu statystyki Kołmogorowa (Dn).
n
2. n > 100
" Statystyka testowa
"
nDn,
" Obszar krytyczny
K = (1-Ä…, +"),
gdzie 1-ą jest kwantylem rzędu 1 - ą granicznego rozkładu statystyki Kołmogo-
"
rowa ( nDn).
Test Shapiro-Wilka
Jest to test normalności rozkładu.
" Hipotezy
H0 : X <" N, H1 : X N
" Statystyka testowa
2
n
aixi:n
i=1
W = ,
n
(xi - x)2
i=1
gdzie stałe ai są dane wzorem
-1
m V
(a1, . . . , an) = " ,
-1 -1
m V V m
gdzie m = (m1, . . . , mn) , są wartościami oczekiwanymi statystyk pozycyjnych z
pochodzących z próby iid z rozkładu standardowego normalnego a V jest ich ma-
cierzÄ… kowariancji (stablicowane).
" Obszar krytyczny
K = (Wn(1 - Ä…), +"),
gdzie Wn(1 - ą) jest kwantylem rzędu 1 - ą rozkładu statystyki Shapiro-Wilka W .
5
Test t-studenta
Jest to test parametryczny dla jednej lub dwóch prób, polegający na testowaniu równości
wartości oczekiwanych (test istotności). Zakładamy, że pomiary podlegają rozkładowi
normalnemu, oraz że wariancje w próbach nie różnią się od siebie istotnie.
1. Test t dla jednej próby
" Hipotezy
H0 : µ = µ0,
H1 : µ > µ0, (3)
µ < µ0, (4)
µ = µ0 (5)

" Statystyka testowa
Å»
" - µ0
X
T = n ,
sX
n
1
Å»
gdzie s2 = (Xi - X)2 to próbkowe odchylenie standardowe. Statystyka te-
X
n-1
i=1
stowa T ma rozkład t-studenta o (n - 1) stopniach swobody.
" Obszar krytyczny
Zależy od postaci hipotezy alternatywnej w następujący sposób:
K1 = (Ft-1 (1 - Ä…), +"),
n-1
K2 = (-", -Ft-1 (1 - Ä…)),
n-1
Ä… Ä…
K3 = (-", -Ft-1 (1 - )) *" (Ft-1 (1 - ), +"),
n-1 2 n-1 2
gdzie Ft-1 (a) to kwantyl rzędu a rozkładu t-studenta z (n - 1) stopniami swobody.
n-1
Jeżeli wariancja rozkładu jest znana, wówczas sX zastępujemy przez odchylenie
standardowe rozkładu, zaś Ft-1 (a) zastępujemy przez Ś-1(a).
n-1
2. Test t dla dwóch prób niezależnych
" Hipotezy
H0 : µ1 = µ2, H1 : µ1 = µ2

" Statystyka testowa
Å» Å»
X1 - X2
T = ,
SX Å»
Ż1-X2
gdzie
(n1 - 1)s2 + (n2 - 1)s2 1 1
1 2
SX = + ,
Ż1-X2
Å»
n1 + n2 - 2 n1 n2
s1, s2 to nieznane odchylenia standardowe z próbek, zaś n1, n2 to liczebności próbek.
Statystyka testowa T ma rozkład t-studenta o (n1 + n2 - 2) stopniach swobody.
6
" Obszar krytyczny
Ä… Ä…
K = (-", -Ft-1 (1 - )) *" (Ft-1 (1 - ), +")
n1+n2-2 n1+n2-2
2 2
3. Test dla dwóch prób zależnych
" Hipotezy
H0 : µ1 = µ2, H1 : µ1 = µ2

" Statystyka testowa
Å»
d
T = ,
Sd
Å»
gdzie
n
1
Å»
d = di,
n
i=1
di = x1i - x2i, i = 1, . . . , n,
n
1
Å»
Sd = (di - d)2,
Å»
n - 1
i=1
zaś x1i, x2i oznaczają wartości cechy X dla i-tego obiektu w pierwszym i drugim
badaniu. Statystyka testowa T ma rozkład t-studenta o (n - 1) stopniach swobody.
" Obszar krytyczny
Ä… Ä…
K = (-", -Ft-1 (1 - )) *" (Ft-1 (1 - ), +")
n-1 n-1
2 2
UWAGA: Gdy liczebność próby jest duża (n > 30, n1 + n2 > 30), to kwantyl rozkładu
t-studenta zastępujemy przez kwantyl rozkładu standardowego normalnego (Ft-1 Ś).
n
7


Wyszukiwarka

Podobne podstrony:
Teoria 7 Testowanie hipotez
9 Testowanie hipotez
testowanie hipotez
Ogólne zasady testowania hipotez statystycznych
Testowanie hipotez cz 2
Testowanie hipotez statystycznych
20 Testowanie hipotez
rafajłowicz,Inżynierskie zastosowania statystyki, testowanie hipotez statystycznych
1 wzory testowanie hipotezid121
Testowanie hipotez Testy t Studenta dla rozkładu normalnego
2009 pytania testowe
Testownik EE1
hipotezy

więcej podobnych podstron