Wyklad 14 MAT BIOL HIPOTEZY


Temat:
Testowanie hipotez statystycznych
Kody znaków:
\ółte wyró\nienie  nowe pojęcie
czerwony  uwaga
kursywa  komentarz
1
Anna Rajfura
Zagadnienia omawiane na zajęciach
1. Idea i pojęcia teorii testowania hipotez
statystycznych
2. Testowanie hipotezy dotyczącej:
a. średniej z rozkładu normalnego
b. porównaniu dwóch średnich
z rozkładów normalnych
c. porównaniu dwóch wariancji
z rozkładów normalnych
d. porównaniu dwóch frakcji z rozkładów
dwupunktowych
2
Anna Rajfura
Przykład z poprzedniego wykładu
Cecha X  masa owocu pewnej odmiany.
" Zało\enie:
X ~ N(, 2), gdzie , 2  nieznane
" Cel: wyznaczyć ocenę średniej
masy jednego owocu tej odmiany .
" Estymujemy średnią odmiany :
o losujemy próbę: x1, x2, ..., xn
o estymujemy parametr na podstawie tej
próby
3
Anna Rajfura
Przykład cd.
Oceną punktową parametru jest średnia
arytmetyczna dla próby; w przykładzie
x
oceną punktową średniej masy jednego
owocu tej odmiany jest wartość 194,46 g.
Ocena przedziałowa parametru to
przedział ufności; w przykładzie 95%
przedziałem ufności dla średniej masy
jednego owocu tej odmiany jest
190,75;198,17
.
4
Anna Rajfura
Problem cd.
Cecha X  masa owocu pewnej odmiany.
" Zało\enie: X ~ N(, 2), , 2  nieznane;
" Cel: zbadać średnią masę owocu
wyznaczyć ocenę średniej masy jednego
owocu tej odmiany .
Pytanie: Czy mo\na przyjąć,\e średnia masa
jednego owocu tej odmiany jest równa 200?
Decyzja: tak/nie.
Metoda: testowanie (weryfikacja) hipotez
5
Anna Rajfura
Idea testowania hipotez - przykład
Badamy krą\ek o wymiarach zbli\onych do
monety jednozłotowej ze stronami
oznaczonymi: A, B.
Mamy ustalić,
czy krą\ek jest symetryczny?
(podczas rzutów tym krą\kiem ka\da ze
stron będzie się pojawiać z jednakową
częstością).
Chcemy dostać odpowiedz: tak/nie
6
Anna Rajfura
Idea testowania hipotez - przykład
Formułujemy hipotezę
merytoryczną (stwierdzenie):
krą\ek jest symetryczny
inaczej:
stosunek wyników A do B wynosi
1:1
inaczej:
p-stwo otrzymania wyniku A
wynosi 0,5
7
Anna Rajfura
Idea testowania hipotez - przykład
Sprawdzenie hipotezy:
Testowanie (weryfikacja) hipotezy
" wykonujemy n rzutów krą\kiem
(n-elementowa próba), np. n = 10
" ustalamy regułę podejmowania
decyzji dotyczącej hipotezy na
podstawie wyników w próbie
8
Anna Rajfura
Idea testowania hipotez - przykład
Przykładowa reguła podejmowania
decyzji:
Jeśli wypadnie od 4 do 6 wyników
A w 10-elementowej próbie, to
krą\ek uznamy za symetryczny,
w przeciwnym przypadku - za
niesymetryczny.
9
Anna Rajfura
Idea testowania hipotez - przykład
Sprawdzenie hipotezy cd.:
" przykładowy wynik (próba):
A B B B B A B B B B
" wyznaczamy liczbę wyników A w
próbie, kA = 2,
" podejmujemy decyzję dotyczącą
hipotezy: na podstawie próby
odrzucamy hipotezę, \e krą\ek
jest symetryczny.
10
Anna Rajfura
Teoretyczne podstawy testowania hipotez
Doświadczenie losowe: rzut symetrycznym
krą\kiem ze stronami A, B (hipoteza
o symetryczności jest prawdziwa);
X  liczba wyników A w
10 - elementowej próbie;
X~B(n = 10, p = 0,5).
Wyznaczamy rozkład p-stwa
zmiennej losowej X ze wzoru
Bernoulliego
11
Anna Rajfura
Teoretyczne podstawy cd.
wartość X pstwo
Przykładowa reguła
0 0,001
podejmowania decyzji:
1 0,010
hipotezę odrzucimy jeśli X=0
2 0,044
lub X=10.
3 0,117
Zatem hipotezę odrzucimy z p-stwem:
4 0,205
P {X=0 lub X=10} = 0,002
5 0,246
Odrzucając hipotezę
6 0,205
popełniamy błąd. Ten błąd
7 0,117
popełniamy z pstwem 0,002.
8 0,044
9 0,010
Błędną decyzję podejmujemy
10 0,001
z pstwem 0,002.
12
Anna Rajfura
Teoretyczne podstawy cd.
Inne reguły podejmowania decyzji:
Odrzucenie hipotezy przy liczbie wyników A Pstwo popełnienia błędu
X = 10
lub 0,002
X = 0
X e" 9
lub 0,022
X d" 1
X d" 2 lub X e" 8 0,110
X d" 3 lub X e" 7 0,344
X d" 4 lub X e" 6 0,754
X "{0,1, ...,10 }
1
Jakie p-stwo popełnienia błędu
akceptujemy?
13
Anna Rajfura
Teoretyczne podstawy cd.
Jakie p-stwo popełnienia błędu
akceptujemy?
Graniczne p-stwo błędu  poziom istotności,
ozn. ą (np. ą = 0,05 albo ą = 0,01).
Jeśli przyjmiemy ą = 0,4, to obszar
krytyczny dla hipotezy (odrzucenia hipotezy)
to zbiór {0,1, 2, 3, 7, 8, 9, 10}, a obszar
dopuszczalny { 4, 5, 6}.
14
Anna Rajfura
Testowanie hipotez  przykład
" stawiamy hipotezę
p-stwo wyniku A jest równe 0,5
" wybieramy funkcję testową f
(statystykę testową, test
statystyczny)
liczba wystąpień wyniku A w
próbie losowej, ozn.: kA
15
Anna Rajfura
Testowanie hipotez  przykład cd.
" przyjmujemy poziom istotności ą
tym samym wyznaczamy obszar krytyczny
testu (wartość krytyczną funkcji testowej
fkryt)
ą = 0,4, zatem obszar krytyczny to zbiór
{0,1, 2, 3, 7, 8, 9, 10}
" losujemy próbę
A B B B B A B B B B
16
Anna Rajfura
Testowanie hipotez  przykład cd.
" wyliczamy wartość funkcji testowej
dla próby femp (wartość empiryczną
funkcji testowej)
kA = 2
" porównujemy femp z fkryt
(sprawdzamy, czy wartość femp
wpada do obszaru krytycznego)
kA = 2 nale\y do obszaru krytycznego
17
Anna Rajfura
Testowanie hipotez  przykład cd.
" wniosek statystyczny: hipotezę
H0 odrzucamy, gdy femp wpada do
obszaru krytycznego;
w przeciwnym przypadku hipotezy
H0 nie odrzucamy
odrzucamy hipotezę, \e krą\ek jest
symetryczny
18
Anna Rajfura
Terminologia i oznaczenia
" Hipoteza statystyczna
" Hipoteza zerowa, ozn.: H0
" Funkcja testowa, ozn.: f
" Wartość empiryczna funkcji testowej, femp
" Poziom istotności ą
" Wartość krytyczna funkcji testowej fkryt
19
Anna Rajfura
Terminologia i oznaczenia cd.
Hipoteza statystyczna to dowolne
przypuszczenie dotyczące rozkładu
p-stwa cechy X.
Testowaną hipotezę nazywamy
hipotezą zerową, ozn.: H0.
W przykładzie cecha X~B(n, p);
hipoteza zerowa H0: p = 0,5.
20
Anna Rajfura
Terminologia i oznaczenia cd.
Funkcja testowa: ozn. np.: t-Studenta,
F-Fishera, 2 chi-kwadrat.
W przykładzie funkcja testowa kA = liczba
wyników A.
Wartość empiryczna funkcji
testowej (wartość funkcji testowej
dla próby), np.: temp, Femp, 2 .
emp
W przykładzie kemp = 2.
21
Anna Rajfura
Terminologia i oznaczenia cd.
Poziom istotności ą
ą  akceptowalne p-stwo popełnienia
błędu (przy odrzucaniu hipotezy
prawdziwej), np. ą = 0,01 , ą = 0,05.
22
Anna Rajfura
Terminologia i oznaczenia cd.
Wartość krytyczna funkcji
testowej
np.: tkryt , Fkryt, 2
kryt
23
Anna Rajfura
Terminologia i oznaczenia cd. *
tkryt = tą,v taka, \e P{ |tv| > tą,v } = ą,
gdzie tv jest zmienną losową o rozkładzie
t-Studenta z v stopniami swobody;
Fkryt= Fą,u,v taka, \e P{ F u,v > F ą,u,v }= ą, gdzie
Fu,v jest zmienną losową o rozkładzie F-
Fishera z liczbami stopni swobody u, v.
2 = 2 taka, \e P{ 2 > 2 } = ą, gdzie
kryt ą, v v ą, v
2 jest zmienną losową o rozkładzie chi-
v
kwadrat z liczbą stopni swobody v.
24
Anna Rajfura
Błędy wnioskowania
Błędy wnioskowania o prawdziwości
hipotezy zerowej
STAN WNIOSEK
RZECZYWISTY
ODRZUCIĆ H0 NIE ODRZUCAĆ H0
H0 prawdziwa błąd I rodzaju, wniosek
pstwo = ą prawidłowy
H0 wniosek błąd II rodzaju,
nieprawdziwa prawidłowy pstwo = 
(fałszywa)
25
Anna Rajfura
Błędy wnioskowania - definicje
Błąd I rodzaju - błąd wnioskowania
polegający na odrzuceniu hipotezy zerowej,
która jest prawdziwa; pstwo wystąpienia
tego błędu powinno być małe, np. ą = 0,05
lub ą = 0,01; ą - poziom istotności testu.
Błąd II rodzaju - błąd wnioskowania
polegający na nieodrzuceniu hipotezy
zerowej, która jest fałszywa.
26
Anna Rajfura
Hipoteza H0: = 0
Zał.: cecha X ~ N(, 2), parametry nieznane
Próba losowa: x1, x2, ..., xn , n  licz. próby;
H0: = 0 test t-Studenta
Poziom istotności ą
x - 0
temp = " n
Funkcja testowa:
s
Wniosek stat.: je\eli | temp | > tą,v= n-1, to
H0 odrzucamy, wpp H0 nie mo\na odrzucić.
27
Anna Rajfura
Przykład H0: = 200
Cecha X  masa owocu pewnej odmiany, X ~
N(, 2), gdzie , 2  nieznane.
Hipoteza zerowa H0: = 200,
test t-Studenta, poziom istotności
ą = 0,05.
Próba: 191,2; 193,0; 195,1; 184,3; 197,6;
200,8; 194,2; 198,7; 189,5; 200,2
Parametry próby:
n=10; x =194,46 g , s = 5,19 g.
28
Anna Rajfura
Przykład H0: = 200 cd.
Wartość empiryczna funkcji
testowej:
x - 0
194,46 - 200
temp = " n = " 10 = -3,3755
s 5,19
Wartość krytyczna funkcji
testowej:
tą,v = n-1 = t0,05, 9 = 2,2622
29
Anna Rajfura
Wartości krytyczne rozkładu t-Studenta
X ~ t - X zmienna losowa o rozkładzie t-Studenta z liczbą stopni swobody v,
ą - poziom istotności,
t ą ,  - wartość krytyczna - liczba taka, \e P(|X| > t ą ,  ) = ą
 \
ą 0,400 0,300 0,200 0,100 0,050 0,025 0,025 0,010 0,005 0,001
1
1,3764 1,9626 3,0777 6,3137 12,7062 25,4519 25,4519 63,6559 127,3211 636,5776
2
1,0607 1,3862 1,8856 2,9200 4,3027 6,2054 6,2054 9,9250 14,0892 31,5998
3
0,9785 1,2498 1,6377 2,3534 3,1824 4,1765 4,1765 5,8408 7,4532 12,9244
4
0,9410 1,1896 1,5332 2,1318 2,7765 3,4954 3,4954 4,6041 5,5975 8,6101
5
0,9195 1,1558 1,4759 2,0150 2,5706 3,1634 3,1634 4,0321 4,7733 6,8685
6
0,9057 1,1342 1,4398 1,9432 2,4469 2,9687 2,9687 3,7074 4,3168 5,9587
7
0,8960 1,1192 1,4149 1,8946 2,3646 2,8412 2,8412 3,4995 4,0294 5,4081
8
0,8889 1,1081 1,3968 1,8595 2,3060 2,7515 2,7515 3,3554 3,8325 5,0414
2,2622
9
0,8834 1,0997 1,3830 1,8331 2,6850 2,6850 3,2498 3,6896 4,7809
10
0,8791 1,0931 1,3722 1,8125 2,2281 2,6338 2,6338 3,1693 3,5814 4,5868
11
0,8755 1,0877 1,3634 1,7959 2,2010 2,5931 2,5931 3,1058 3,4966 4,4369
30
Anna Rajfura
Przykład H0: = 200 cd.
Wniosek statystyczny:
| temp | =3,3375> 2,2622 = t0,05,9 ,
zatem hipotezę zerową H0
odrzucamy.
Wniosek merytoryczny: średnia
masa owocu tej odmiany nie
wynosi 200 g.
31
Anna Rajfura
Hipoteza H0: 1 = 2
Zało\enia: cechy X1~N(1, 2), X2~N(2, 2),
1, 2, 2- nieznane parametry.
Pobrano n1  elementową próbę losową z
pierwszej populacji oraz n2-elementową
próbę losową z drugiej populacji.
H0: 1 = 2 (porównanie średnich w dwóch
populacjach),
test t-Studenta, poziom istotności ą.
32
Anna Rajfura
Hipoteza H0: 1 = 2 cd.
x1 - x2
temp =
Funkcja testowa:
sr
gdzie:
ł ł
1 1
2
ł ł
sr = se ł +
błąd stand. ró\nicy średnich,
n1 n2 ł
ł łł
2 2
s1 "(n1 -1)+ s2 "(n2 -1)
2
se =
wsp. wariancja;
n1 + n2 - 2
33
Anna Rajfura
Hipoteza H0: 1 = 2 cd.
Wniosek statystyczny
Je\eli |temp|>tą, v = n1+n2-2, to hipotezę
H0 odrzucamy, wpp H0 nie mo\na
odrzucić.
34
Anna Rajfura
Hipoteza H0: 12 = 22 *
Zało\enia:
1.cecha X1~N(1, 2), cecha X2~N(2, 2), 1, 2, 2 - nieznane
parametry,
2.pobrano n1  elementową próbę losową z pierwszej populacji
oraz n2  elementową próbę losową z drugiej populacji.
H0: 12 = 22 (porównanie wariancji w dwóch
populacjach), test F-Fishera, poziom
istotności ą.
2
max (s2, s2 )
1
Femp =
2
min (s2, s2 )
Funkcja testowa:
1
35
Anna Rajfura
Wnioskowanie 1:
je\eli Femp > F ą/2, v licz, v mian, to hipotezę H0
odrzucamy, w przeciwnym przypadku H0 nie mo\na
odrzucić.
UWAGA:
v licz  liczba stopni swobody dla licznika, v mian -
liczba stopni swobody dla mianownika, vi = ni  1.
Wnioskowanie 2:
je\eli wartość p<ą, to hipotezę H0 odrzucamy,
w przeciwnym przypadku H0 nie mo\na odrzucić.
36
Anna Rajfura
Hipoteza H0: p1 = p2
Zał.: cechy X1 ~ B(n1, p1), X2 ~ B(n2, p2), parametry nieznane
Pobrano n1  elementową próbę losową z pierwszej populacji
oraz n2  elementową próbę losową z drugiej populacji,
ki  liczba elementów wyró\nionych w i-tej próbie
k1 + k2
ki
p =
pi =
n1 + n2
ni
H0: p1 = p2 (porównanie frakcji w dwóch
populacjach),
Test przybli\ony u (dla du\ych prób),
poziom istotności ą.
37
Anna Rajfura
Hipoteza H0: p1 = p2 cd.
p1 - p2
uemp =
ł
1 1
ł ł
p(1- p)ł n1 +
Funkcja testowa:
ł
n2 ł
ł łł
Wniosek statystyczny
uemp e" u
ą to hipotezę H0 odrzucamy,
Je\eli
,
1-
2
wpp H0 nie mo\na odrzucić.
38
Anna Rajfura
Pojęcia cd.
Hipoteza alternatywna, ozn. H1 
przyjmowana po odrzuceniu
hipotezy zerowej.
Moc testu - p-stwo nieodrzucenia
prawdziwej hipotezy
alternatywnej. Od testu
wymagamy, aby był najmocniejszy,
czyli z du\ym p-stwem odrzucał
fałszywą hipotezę zerową.
39
Anna Rajfura


Wyszukiwarka

Podobne podstrony:
Wyklad 4 MAT BIOL MODELE DYSKRETNE
stat biot wyklady z mat
0 1 Program MAT BIOL 12
wyklad I biol obrazki
mat wykład 2 po 2 szt na str
Wyklad BIOL ESTYMACJA 2012
MAT BUD WYKŁAD 5 spoiwa
Mat WIP Wykład21
Wyklad4 biol 12 13 student
Wyklad 5 FUNKCJE POCHODNA Biol 2012
Mat WIP Wykład16
EKON Zast Mat Wykład 1b
Analiza mat I semstr wykłady
isz mat wyklad11
Wykład 4 Wytrzymałość mat jednorodny układ naprężenia
Wyklad 8?LKA OZNACZONA Biol wer stud

więcej podobnych podstron