Weryfikacja hipotez statystycznych
Na podstawie danych z próby losowej stawia się hipotezę dotyczącą całej
populacji, którą nazywamy hipotezą zerową (H0).
Hipotezy mogą dotyczyć parametrów rozkładu (hipotezy parametryczne) lub
rodzaju samego rozkładu, losowości próby, niezależności zmiennych (hipotezy
nieparametryczne).
Do weryfikacji hipotezy służy odpowiednio skonstruowana statystyka zwana
testem statystycznym.
Hipotezę zerową odrzucamy, jeżeli wynik testu należy do obszaru krytycznego
i wówczas przyjmujemy hipotezę alternatywną (HA). W przeciwnym
przypadku, nie ma podstaw do odrzucenia H0.
Parametryczne testy istotności:
1) Test istotności dla wartości średniej populacji generalnej
a) gdy odchylenie standardowe jest znane
b) gdy odchylenie standardowe nie jest znane
dla małej próby (n d" 30)
dla dużej próby (n < 30)
2) Test istotności dla dwóch średnich
a) gdy próby są niezależne
b) gdy próby są zależne (ta sama grupa dwukrotnie badana)
3) Test istotności dla wskaznika struktury (prawdopodobieństwa sukcesu)
4) Test istotności dla dwóch wskazników struktury
5) Test istotności dla wariancji populacji generalnej
6) Test istotności dla dwóch wariancji
Weryfikacja hipotezy o wartości oczekiwanej m w populacji generalnej
o rozkładzie normalnym N(m, s), jeżeli odchylenie standardowe s jest znane.
Hipotezę orzekającą, że wartość oczekiwana m jest równa liczbie m0 (hipoteza
zerowa) zapisujemy
H0 : m = m0
m0
Hipotezę alternatywną orzekającą, że m nie jest równe zapisujemy
H : m ą m0
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
(- Ą,-u)(u,+Ą) - u,u
n
s
gdzie
u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu N(0, 1),
a
a
spełniającą warunek F u =1- dla danego poziomu istotności .
( )
2
n jest licznością próby
Jeżeli H0: m = m0 i HA: m > m0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
- Ą,u
(u,+Ą)
n
s
gdzie u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu
N(0, 1), spełniającą warunek F u =1-a dla danego poziomu istotności a.
( )
Jeżeli H0: m = m0 i HA: m < m0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
- u,+Ą
(- Ą,-u)
n
s
gdzie u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu
N(0, 1), spełniającą warunek F u =1-a dla danego poziomu istotności a.
( )
Weryfikacja hipotezy o wartości oczekiwanej m w populacji generalnej
s
o rozkładzie normalnym N(m, s), jeżeli odchylenie standardowe nie jest
znane.
H0 : m = m0 i H : m ą m0
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
(- Ą,-ta )(ta ,+Ą)
n -1
- ta ,ta
Sn
ta
n -1
gdzie jest liczbą, którą odczytujemy z tablic rozkładu t Studenta dla
P t > ta = a
( )
a
stopni swobody i danego poziomu istotności taką, że .
Jeżeli H0: m = m0 i HA: m > m0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
n -1 (t2a ,+Ą)
- Ą,t2a
Sn
t2a
n -1
gdzie jest liczbą, którą odczytujemy z tablic rozkładu t Studenta dla
P(t > t2a)= 2a
a
stopni swobody i danego poziomu istotności taką, że .
Jeżeli H0: m ł m0 i HA: m < m0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
n -1 (- Ą,-t2a ) - t2a ,+Ą
Sn
t2a
n -1
gdzie jest liczbą, którą odczytujemy z tablic rozkładu t Studenta dla
P(t > t2a)= 2a
a
stopni swobody i danego poziomu istotności taką, że .
Weryfikacja hipotezy o prawdopodobieństwie p zmiennej losowej o
rozkładzie Bernoulliego (n ł 30).
H0: p = p0 i HA: p ą p0
Test Obszar krytyczny Obszar przyjęcia hipotezy
k - n p0
(- Ą,-u)(u,+Ą) - u,u
n p0 q0
gdzie
k jest liczbą sukcesów w próbie n elementowej,
u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu N(0, 1),
a
spełniającą warunek F u =1- dla danego poziomu istotności a.
( )
2
Jeżeli H0: p = p0 i HA: p > p0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
k - n p0
- Ą,u
(u,+Ą)
n p0 q0
gdzie u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu
N(0, 1), spełniającą warunek F u =1-a dla danego poziomu istotności a.
( )
Jeżeli H0: p = p0 i HA: p < p0, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
k - n p0
- u,+Ą
(- Ą,-u)
n p0 q0
gdzie u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu
N(0, 1), spełniającą warunek F u =1-a dla danego poziomu istotności a.
( )
s2
Weryfikacja hipotezy o wariancji w populacji generalnej o rozkładzie
normalnym N(m, s), w którym m i s nie są znane (n < 30). Weryfikowaną
2
H0:s2 = s2 H : s2 ą s0
hipotezą jest , natomiast hipotezą alternatywną: .
0 A
Test Obszar krytyczny Obszar przyjęcia hipotezy
2
n Sn
(0,c2)(c2 ,+Ą) c2,c2
2
1 2 1 2
s0
c2,c2 odczytane z tablic rozkładu c2 (chi kwadrat) dla n -1
1 2
gdzie liczby
1- a
stopni swobody i danego poziomu ufności , spełniają warunki
a a
P(c2 > c2)= 1- , P(c2 > c2 )>
1 2
2 2
2
2
H0 : s2 = s0
H : s2 > s0
Jeżeli i
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
2
n Sn
(c2 ,+Ą) 0,c2
2
2 2
s0
c2
c2
n -1
gdzie jest liczbą odczytaną z tablic rozkładu dla
stopni swobody i
2
P(c2 > c2)= a
a
danego poziomu istotności , spełniającą warunek .
2
2
2
H0 : s2 = s0 H : s2 < s0
Jeżeli i
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
2
n Sn
2
c2,+Ą
(0,c1)
2
1
s0
2
c1 c2
n -1
gdzie jest liczbą odczytaną z tablic rozkładu dla
stopni swobody i
2
P(c2 > c1 )= 1- a
a
danego poziomu istotności , spełniającą warunek .
Weryfikacja hipotezy o równości wartości oczekiwanych w dwóch populacjach
o rozkładach normalnych N m1,s1 i N m2,s2 , jeżeli odchylenia standardowe
( ) ( )
s1 i s2 są znane ( małe próbki czyli ni d" 30 lub n1+n2Ł 122)
Hipotezą zerową jest hipoteza orzekająca, że wartość oczekiwana pierwszej populacji
m1 jest równa wartości oczekiwanej drugiej populacji m2, czyli
H0 : m1 = m2
Test Obszar krytyczny Obszar przyjęcia hipotezy
X1 - X2
22
(- Ą,-ta )(ta ,+Ą)
- ta ,ta
ć
n1S1 + n2S2 1 1
+
n1 + n2 -2 n1 n2
Łł
gdzie ta jest liczbą, którą odczytujemy z tablic rozkładu t Studenta z (n1+n2 2)
stopniami swobody, dla danego poziomu istotności a.
Weryfikacja hipotezy o równości wartości oczekiwanych w dwóch
populacjach (próby niezależne, ni > 30 lub lub n1+n2> 122).
H0 : m1 = m2 H : m1 ą m2
i
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - X
n1 n2
2 2
- u,u
(- Ą,-u)(u,+Ą)
Sn Sn
1 2
+
n1 n2
gdzie
u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu N(0, 1),
a
spełniającą warunek F u =1- dla danego poziomu istotności a.
( )
2
n1, n2 są liczebnościami prób z poszczególnych populacji
Jeżeli H0: m1 = m2 i HA: m1 > m2, to:
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - X
n1 n2
2 2
(u,+Ą) -Ą,u
Sn Sn
1 2
+
n1 n2
gdzie
u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu N(0, 1),
spełniającą warunek F u =1-a dla danego poziomu istotności a.
( )
Weryfikacja hipotezy o równości wariancji dwóch populacjach o rozkładach
normalnych.
22
22
H0 : s1 = s2 HA : s1 > s2
i
Test Obszar krytyczny Obszar przyjęcia hipotezy
2
S
1
Fa ,+Ą -Ą, Fa
) ( )
2
S
2
gdzie
S1 odchylenie standardowe pierwszej próbki
S2 odchylenie standardowe drugiej próbki
(tak numerujemy próbki, żeby S1 > S2)
n1 liczebność pierwszej próbki
n2 liczebność drugiej próbki
Fa jest liczbą, którą odczytujemy z tablicy rozkładu F Snedecora, z (n1 1) oraz
(n2 1) stopniami swobody, dla danego poziomu istotności a.
Przykład 1
Liczba statków u wylosowanych armatorów kształtowała się następująco: 43, 28, 22,
53, 69, 70. Na poziomie ufności 0.9 sprawdzić hipotezę, że średnia liczba statków jest
równa 50, wobec hipotezy alternatywnej HA : m ą 50 przy założeniu że rozkład liczby
statków jest normalny, ze znanym odchyleniem standardowym s = 2.
Parametryczne testy istotności:
1)Test istotności dla wartości średniej populacji generalnej
a) gdy odchylenie standardowe jest znane
b) gdy odchylenie standardowe nie jest znane
dla małej próby (n d" 30)
dla dużej próby (n > 30)
2)Test istotności dla dwóch średnich
a) gdy próby są niezależne
b) gdy próby są zależne (ta sama grupa dwukrotnie badana)
3)Test istotności dla wskaznika struktury (prawdopodobieństwa sukcesu)
4)Test istotności dla dwóch wskazników struktury
5)Test istotności dla wariancji populacji generalnej
6)Test istotności dla dwóch wariancji
Weryfikacja hipotezy o wartości oczekiwanej m w populacji generalnej
o rozkładzie normalnym N(m, s), jeżeli odchylenie standardowe s jest znane.
Hipotezę orzekającą, że wartość oczekiwana m jest równa liczbie m0 (hipoteza
zerowa) zapisujemy
H0 : m = m0
m0
Hipotezę alternatywną orzekającą, że m nie jest równe zapisujemy
H : m ą m0
A
Test Obszar krytyczny Obszar przyjęcia hipotezy
X - m0
n
(- Ą,-u)(u,+Ą) - u,u
n
s
gdzie
u jest liczbą, którą odczytujemy z tablicy dystrybuanty F(x) rozkładu N(0, 1),
a
a
spełniającą warunek F u =1- dla danego poziomu istotności .
( )
2
n jest licznością próby
Przykład 1
Liczba statków u wylosowanych armatorów kształtowała się następująco: 43, 28, 22,
53, 69, 70. Na poziomie ufności 0.9 sprawdzić hipotezę, że średnia liczba statków jest
równa 50, wobec hipotezy alternatywnej HA : m ą 50 przy założeniu że rozkład liczby
statków jest normalny, ze znanym odchyleniem standardowym s = 2.
X - m0
Średnia z próby wynosi 47,5. Stąd statystyka testowa n ma wartość: -3,06.
s
a 0,1
F u = 1- = 1- = 0,95
Natomiast i z tablic rozkładu normalnego odczytujemy,
( )
22
że liczba u wynosi 2,33. Stąd obszar krytyczny jest następujący:
-Ą,-2,33 2,33,+Ą i wartość statystyki testowej należy do tego obszaru. Czyli
( ) ( )
na poziomie ufności 0,9, należy odrzucić hipotezę orzekającą, że średnia liczba
statków u badanych armatorów jest równa 50, na korzyść hipotezy, że średnia liczba
statków u badanych armatorów nie jest równa 50.
Przykład 2
Przeprowadzono pomiary stężenia siarczanów na dwóch odcinkach pewnej rzeki. Dla
odcinka 1 wykonano 18 próbek (119, 203, 140, 252, 199, 193, 141, 170, 167, 190, 142,
180, 191, 105, 158, 170, 162, 123 mg/l), a dla odcinka 2 wykonano 14 próbek (120,
180, 230, 115, 202, 136, 238, 301, 180, 254, 255, 297, 275, 278 mg/l). Na poziomie
istotności a = 0,05 należy sprawdzić, czy średnie stężenie siarczanów na obu
odcinkach jest takie samo.
Przykład 2
Przeprowadzono pomiary stężenia siarczanów na dwóch odcinkach pewnej rzeki. Dla odcinka 1 wykonano
18 próbek (119, 203, 140, 252, 199, 193, 141, 170, 167, 190, 142, 180, 191, 105, 158, 170, 162, 123 mg/l), a
dla odcinka 2 wykonano 14 próbek (120, 180, 230, 115, 202, 136, 238, 301, 180, 254, 255, 297, 275, 278
mg/l). Na poziomie istotności a = 0,05 należy sprawdzić, czy średnie stężenie siarczanów na obu odcinkach
jest takie samo.
H0 : m = m0
X1 - X2
t =
22
ć
n1S1 + n2S2 1 1
+
n1 + n2 -2 n1 n2
Łł
n1 = 18, n2 = 14, x1 =167, x1 = 218.6, s1 = 35.75,s2 = 64. Stąd t = -2.9
ta dla 30 stopni swobody i a = 0.05 wynosi 2.04, stąd obszar krytyczny to
(-, -2.04) (2.04, ) i wartość testu t należy do tego obszaru, czyli hipotezę zerową
należy odrzucić, czyli stężenie siarczanów na obu odcinkach jest istotnie różne.
Przykład 3
Dwóch oszczepników osiągnęło w ostatnim roku następujące wyniki ( w metrach).
Zawodnik A: 78, 68, 77, 69, 82, 68, 79, 80, 81. Zawodnik B: 72, 77, 86, 70, 64, 84, 67,
85. Aby porównać regularność ich wyników, należy zweryfikować hipotezę o równości
2 2
wariancji : na poziomie istotności a = 0,05, wobec hipotezy alternatywnej:
H0 :s1 =s2
2 2
HA :s1 >s2
Przykład 3
Dwóch oszczepników osiągnęło w ostatnim roku następujące wyniki ( w metrach). Zawodnik A:
78, 68, 77, 69, 82, 68, 79, 80, 81. Zawodnik B: 72, 77, 86, 70, 64, 84, 67, 85. Aby porównać
2 2
regularność ich wyników, należy zweryfikować hipotezę o równości wariancji :
H0 :s1 =s2 na
2 2
poziomie istotności a = 0,05, wobec hipotezy alternatywnej:
HA :s1 >s2
Dla zawodnika A odchylenie standardowe nieobciążone wynosi SA = 5.783, a dla
zawodnika B odchylenie standardowe nieobciążone wynosi SB = 8.634, W związku z
tym, że odchylenie standardowe zawodnika B jest większe niż zawodnika A, jako
próbę nr 1 bierzemy rezultaty zawodnika B. Więc S1 = 8.634 i S2 = 5.783, stąd wartość
statystyki testowej wynosi:
2
S1 74,55
= 2,23
2
S2 33,44
Wartością Fa odczytaną z tablic rozkładu F Snedecora dla poziomu istotności a = 0,05
oraz dla 7 i 8 stopni swobody jest liczba Fa = 3,5. Stąd obszarem krytycznym jest
przedział (3,5; Ą). Statystyka testowa nie należy do tego przedziału więc nie ma
podstaw do odrzucenia hipotezy o jednakowej regularności rzutów obu
oszczepników.
Wyszukiwarka
Podobne podstrony:
wyklad 5 Testy parametryczne PL [tryb zgodności]TESTY PARAMETRYCZNE DLA DWÓCH PRÓB NIEZALEŻNYCHSM T04 Testy parametryczne 12009 10 STATYSTYKA TESTY PARAMETRYCZNEid&6823 parametryczne testy istotnosciinformatyka w prawnicza testyHistoria państwa i prawa Polski Testy TabliceSprawdziany i Testy Nauczycieli1 parametry technniczne wymiary tablic zal nr1id?43Cw 6 Parametryczny stabilizator napieciawięcej podobnych podstron