Ogólne zasady testowania hipotez statystycznych

Ogólne zasady
testowania hipotez statystycznych
" Zadaniem statystyki matematycznej jest uzyskanie informacji o całej
populacji na podstawie próby pochodzącej z tej populacji.
" Hipoteza statystyczna to stwierdzenie na temat rozkładu
prawdopodobieństwa pewnej cechy w populacji sformułowane bez
zbadania całości tej populacji.
Np.
jeśli twierdzimy, \e prawdopodobieństwo wykiełkowania ziarna
określonej rośliny jest równe co najmniej 80%, to jest to hipoteza
statystyczna, gdy stwierdzenie to jest sformułowane bez zbadania
wszystkich ziaren tej rośliny.
Podobnie, gdy twierdzimy, \e skuteczność szczepionki przeciwko
pewnej chorobie wynosi 50%, to jest to hipoteza statystyczna, gdy
stwierdzenie to jest sformułowane bez podania tej szczepionki
wszystkim potencjalnie nara\onym na tę chorobę.
" Problem:
Chcemy zweryfikować przypuszczenie, \e połowa bardzo licznej
populacji zamieszkującej na pewnym terenie ma określony gen
(nazwijmy go genem B).
Załó\my, \e z uwagi na ograniczone fundusze mo\emy przeprowadzić
badania genetyczne tylko w 10-cio osobowej grupie, którzy została
losowo wybrana z tej populacji.
Jak ocenić prawdziwość sformułowanego wy\ej przypuszczenia
o częstości występowania genu B?
Przyjmujemy zało\enia:
" Zakładamy, \e osoby do próby są wybierane tak, jak kule z urny,
w której 50% stanowią kule białe, zaś pozostałe kule są czarne.
" Odpowiada to przypuszczeniu, \e połowa populacji posiada gen B:
osoby z genem B traktowane są jak kule białe, pozostałe osoby, jak
kule czarne.
" Przypuszczenie, \e połowa populacji ma gen B odpowiada zało\eniu,
\e prawdopodobieństwo wylosowania osoby z genem B jest równe 0,5
(50%).
" Osoby są losowane w procedurze bez zwracania, ale poniewa\
populacja z zało\enia jest bardzo liczna, to wylosowanie zaledwie 10
osób nie zmienia w sposób istotny proporcji osób z genem B
w pozostałej populacji.
" Mo\na zatem w przybli\eniu przyjąć, \e przy losowaniu do próby
ka\dej z 10 osób mamy takie same prawdopodobieństwo wylosowania
osoby z genem B.
Dalsza część zało\eń:
" Osoby są losowane w procedurze bez zwracania, ale poniewa\
populacja z zało\enia jest bardzo liczna, to wylosowanie zaledwie 10
osób nie zmienia w sposób istotny proporcji osób z genem B
w pozostałej populacji.
" Mo\na zatem w przybli\eniu przyjąć, \e przy losowaniu do próby
ka\dej z 10 osób mamy takie same prawdopodobieństwo wylosowania
osoby z genem B.
" W przybli\eniu mo\na zatem uwa\ać, \e losowanie tej 10-cio
elementowej próby odpowiada doświadczeniu polegającemu na
losowaniu 10 kul ze zwracaniem z urny, w której jest 50% kul białych.
" Przypuszczenie, \e połowa populacji ma gen B odpowiada zało\eniu,
\e prawdopodobieństwo wylosowania osoby z genem B jest równe 0,5
(50%).
" Niech p oznacza prawdopodobieństwo wylosowania osoby z genem B.
" Formułujemy hipotezę zerową: p = 0,5.
" Dla hipotezy zerowej u\ywa się zapisu H0: treść hipotezy zerowej.
Mamy zatem H0: p = 0,5
" Nale\y pamiętać, \e postawiona hipoteza dotyczy populacji.
" Do pary z hipotezą zerową nale\y sformułować hipotezę alternatywną.
Hipoteza alternatywna to taka hipoteza, która zostanie przyjęta, gdy
znajdziemy podstawy do odrzucenia hipotezy zerowej.
" Dla hipotezy alternatywnej u\ywa się zapisu
H1: treść hipotezy alternatywnej.
W naszym przypadku formułujemy ją następująco H1: p +" 0,5, ale mo\liwe
są inne sformułowania (H1: p < 0,5 lub H1: p > 0,5).
Hipoteza alternatywna równie\ dotyczy populacji.
" Postępowanie będzie teraz zmierzało do weryfikacji hipotezy zerowej.
Weryfikacja ta dokona się w oparciu o próbę pobraną z populacji.
Rozkład z próby
Skoro przyjęliśmy zało\enie, \e losowanie 10 osób z populacji odpowiada
w przybli\eniu losowaniu ze zwracaniem 10 kul z urny, w której jest
50% kul białych, to mo\na obliczyć prawdopodobieństwo, \e wśród
tych 10 osób będzie 0, 1, 2, ..., 10 osób z genem B posługując się
rozkładem dwumianowym.
" Jako sukces przyjmujemy wylosowanie osoby z genem B.
" Zgodnie z hipotezą zerową prawdopodobieństwo sukcesu
jest równe 0,5.
" Mamy zatem n = 10 prób i wyznaczamy prawdopodobieństwo, \e
wystąpi k = 0, 1, 2, ..., 10 sukcesów .
" Niech X oznacza zmienną losową opisującą liczbę sukcesów w n
próbach. Wówczas X ~ Bin(n=10, p=0,5).
> round(dbinom(x=0:10,
size=10,
p=0,5
prob=0.5),
5)
0.00098
0.00977
0.04395
0.11719
0.20508
0.24609
0.20508
0.11719
0 1 2 3 4 5 6 7 8 9 10
0.04395
liczba sukcesów
0.00977
0.00098
0.3
0.2
0.1
prawdopodobieństwo
Jeśli X ~ Bin(n=10, p=0,5), to:
P(X=0)= 0.00098
Jeśli prawdziwa jest hipoteza zerowa, to:
P(X=1)= 0.00977
" prawdopodobieństwo uzyskania w próbie
P(X=2)= 0.04395
określonej liczby osób z genem B przyjmuje
P(X=3)= 0.11719
ró\ne wartości
P(X=4)= 0.20508
P(X=5)= 0.24609
" największe prawdopodobieństwo odpowiada
P(X=6)= 0.20508
uzyskaniu 5 osób, ale niewiele mniejsze
P(X=7)= 0.11719
prawdopodobieństwa odpowiadają 4 lub 6
P(X=8)= 0.04395
osobom z genem B.
P(X=9)= 0.00977
P(X=10)= 0.00098
Rozkładem z próby jest w tym przypadku rozkład dwumianowy Bin(n=10, p=0,5).
Parametry tego rozkładu są określone przez wielkość próby (n=10)
i treść hipotezy zerowej (p=0,5).
Widać, \e chocia\ w populacji
prawdopodobieństwo wystąpienia
Jeśli X ~ Bin(n=10, p=0,5), to:
genu B jest równe 0,5,
P(X=0)= 0.00098
to w próbie ka\da liczba osób
P(X=1)= 0.00977
z genem B ma niezerowe
P(X=2)= 0.04395
prawdopodobieństwo, z tym, \e
P(X=3)= 0.11719
niektóre prawdopodobieństwa są
P(X=4)= 0.20508
małe, np. P(X=0)lub P(X=1)
P(X=5)= 0.24609
P(X=6)= 0.20508
P(X=7)= 0.11719
P(X=8)= 0.04395
P(X=9)= 0.00977
P(X=10)= 0.00098
Wobec tego powstaje problem:
Jaka liczba osób z genem B w próbie będzie przesłanką do odrzucenia hipotezy zerowej?
Równowa\nie:
Jaka liczba osób z genem B w próbie będzie przesłanką do przyjęcia hipotezy zerowej?
Jaka liczba osób z genem B w próbie będzie skłaniała do odrzucenia
hipotezy zerowej?
Poniewa\ chcemy wnioskować o populacji na podstawie próby, to
mo\liwe jest popełnienie błędu i trzeba oszacować jego wielkość.
Załó\my, \e zastosujemy następującą regułę:
odrzucimy hipotezę zerową w ka\dym przypadku, gdy
w próbie proporcja osób z genem B nie jest równa 0,5
(czyli, gdy w próbie będzie inna liczba osób z genem B, ni\ 5).
Błąd przy powy\szej regule postępowania wystąpi wtedy, gdy w populacji
będzie 50% osób z genem B, ale w wylosowanej próbie znajdzie się
inna liczba osób, ni\ 5.
Prawdopodobieństwo popełnienia tego błędu mo\na obliczyć na
podstawie wartości rozkładu dwumianowego jako sumę wszystkich
prawdopodobieństw z wyjątkiem P(X = 5).
P(X=0)= 0.00098
P(X=1)= 0.00977
P(X=2)= 0.04395
P(X=3)= 0.11719
P(X=4)= 0.20508
P(X=5)= 0.24609
P(X=6)= 0.20508
P(X=7)= 0.11719
P(X=8)= 0.04395
P(X=9)= 0.00977
P(X=10)= 0.00098
Poniewa\ suma prawdopodobieństw jest równa 1, to poszukiwane
prawdopodobieństwo popełnienia błędu mo\na łatwiej obliczyć jako
1- P(X = 5) = 1- 0.24609 � 0,75
Zatem, jeśli stosujemy regułę:
odrzucamy hipotezę zerową w ka\dym przypadku, gdy
w próbie proporcja osób z genem B nie jest równa 0,5
(czyli, gdy w próbie będzie inna liczba osób z genem B, ni\ 5)
to popełnimy błąd zawsze wtedy, gdy w populacji będzie 50% osób
z genem B (czyli hipoteza zerowa będzie prawdziwa),
ale w wylosowanej próbie znajdzie się inna liczba osób, ni\ 5
(prawdopodobieństwo popełnienia tego błędu jest równe około 0,75).
Ogólnie, błąd tego rodzaju, co wy\ej jest popełniany wtedy, gdy następuje
odrzucenie prawdziwej hipotezy zerowej i nosi nazwę błędu I rodzaju.
" W analizowanym przypadku prawdopodobieństwo popełnienia
błędu I rodzaju jest równe 0,75.
" Interpretacja:
jeśli z populacji, w której proporcja osób z genem B jest równa 0,5
wielokrotnie wylosujemy próby 10-osobowe i zastosujemy regułę
o odrzucaniu hipotezy zerowej, gdy liczba osób z genem B będzie
inna, ni\ 5, to odrzucimy prawdziwą hipotezę zerową w 75%
przypadków, czyli w 75% przypadków podejmiemy błędną decyzję
odnośnie hipotezy zerowej.
" Trzeba zmodyfikować regułę postępowania tak, aby zmniejszyć
prawdopodobieństwo popełnienia błędu I rodzaju.
" Nie da się skonstruować takiej reguły postępowania, przy której
nie popełnimy błędu I rodzaju.
" Błąd ten wystąpi nawet wtedy, gdy będziemy odrzucać hipotezę zerową
tylko wtedy, gdy wszyscy w próbie będą mieć gen B lub nikt w próbie
nie będzie miał genu B (odpowiednie prawdopodobieństwo będzie
wtedy równe 0,00098 + 0,00098 = 0,00196,a więc będzie
niezerowe.
" Przy tej nowej regule prawdopodobieństwo popełnienia błędu I rodzaju jest
bardzo małe, więc pozornie ta reguła wydaje się lepsza.
" Jakie jest jednak wówczas prawdopodobieństwo, \e popełnimy błąd
polegający na przyjęciu hipotezy zerowej, która jest fałszywa? (tego
rodzaju błąd nosi nazwę błędu II rodzaju)
" Powy\sze prawdopodobieństwo zale\y od tego, jaka jest prawdziwa wartość p
w populacji.
" Załó\my, \e prawdziwa wartość p jest równa 0,7.
> dbinom(x=0:10,size=10,prob=0.7)
[1] 0.0000059049 0.0001377810 0.0014467005 0.0090016920 0.0367569090
[6] 0.1029193452 0.2001209490 0.2668279320 0.2334744405 0.1210608210
[11] 0.0282475249
" Prawdopodobieństwo przyjęcia hipotezy zerowej, \e p=0.5 (która jest
fałszywa) jest wówczas równe około 0,97 (suma wszystkich powy\szych
prawdopodobieństw z wyjątkiem pierwszego i ostatniego).
Hipoteza H0
Decyzja
prawdziwa fałszywa
decyzja błędna
przyjąć decyzja
(błąd II
H0 poprawna
rodzaju)
decyzja błędna
odrzucić decyzja
(błąd I
H0 poprawna
rodzaju)
" Prawdopodobieństwa błędów I i II rodzaju są ze sobą powiązane.
" Gdy określimy regułę odrzucania hipotezy zerowej w ten sposób, \eby
prawdopodobieństwo błędu I rodzaju było małe, to pociągnie to za sobą du\e
prawdopodobieństwo błędu II rodzaju.
" Nie ma mo\liwości skonstruowania takiej reguły wnioskowania, przy której
uniknęlibyśmy mo\liwości popełnienia błędów I i II rodzaju.
" Nale\y dą\yć do skonstruowania takiej reguły, w której prawdopodobieństwa
popełnienia obu rodzajów błędów będą jak najmniejsze.
" Mo\na z góry określić, jaką maksymalną wielkość
prawdopodobieństwa błędu I rodzaju jesteśmy skłonni zaakceptować.
Ta maksymalna wielkość jest nazywana poziomem istotności testu
i zazwyczaj oznaczana przez a.
" Na ogół przyjmuje się, \e a = 0,05 (5%) lub a = 0,01 (1%)
" Znając poziom istotności testu mo\na określić tzw. obszar krytyczny
testu.
" Obszar krytyczny testu to zbiór tych wartości obserwowanych
w próbie, które będą prowadzić do odrzucenia hipotezy zerowej.
Jeśli X ~ Bin(n=10, p=0,5),
Jeśli odrzucamy hipotezę zerową, gdy:
to:
" X=0 lub X=10, to błąd I rodzaju ma
prawdopodobieństwo równe 0,00196
P(X=0)= 0.00098
P(X=1)= 0.00977
" X=0 lub X=1 lub X=9 lub X=10, to błąd I rodzaju
P(X=2)= 0.04395
ma prawdopodobieństwo równe 0,0215
P(X=3)= 0.11719
" X=0 lub X=1 lub X=2 lub X=8 lub X=9 lub X=10,
P(X=4)= 0.20508
to błąd I rodzaju ma prawdopodobieństwo równe
P(X=5)= 0.24609
0,109375
P(X=6)= 0.20508
P(X=7)= 0.11719
P(X=8)= 0.04395
Widać więc, \e jeśli chcemy, aby poziom istotności
P(X=9)= 0.00977
testu był równy 0,05, to nale\y odrzucać hipotezę
P(X=10)= 0.00098
zerową, gdy X=0 lub X=1 lub X=9 lub X=10.
Obszar krytyczny testu składa się z wartości 0, 1, 9, 10,
a zatem jeśli zaobserwujemy w próbie którąś z tych
wartości, to hipotezę zerową nale\y odrzucić.
Liczba osób z genem B w próbie jest tzw. statystyką
testową.
" Mówiąc ogólnie, statystyka testowa T to pewna wielkość, którą
mo\na policzyć na podstawie danych z próby.
" Statystyka testowa jest zmienną losową, bo jej wartość zale\y od próby
(mo\e być ró\na w ró\nych próbach).
" Dla konkretnej próby statystyka testowa jest konkretną liczbą.
" Jeśli statystyka testowa nale\y do obszaru krytycznego testu,
to nale\y odrzucić hipotezę zerową.
" Jeśli statystyka testowa nie nale\y do obszaru krytycznego testu,
to nale\y stwierdzić, \e nie ma podstaw do odrzucenia hipotezy
zerowej.
Test statystyczny to reguła postępowania, która dla ka\dej mo\liwej próby
pobranej z populacji pozwala określić, co nale\y zrobić z hipotezą zerową
(odrzucić, czy uznać, \e nie ma podstaw do jej odrzucenia).
Statystycy zdefiniowali bardzo wiele ró\nych testów statystycznych.
Przy praktycznym stosowaniu gotowych testów statystycznych postępujemy
według następującego schematu:
1. Określamy hipotezę zerową i alternatywną.
2. Przyjmujemy poziom istotności testu a.
3. Obliczamy wartość statystyki testowej.
4. Sprawdzamy, czy wartość statystyki testowej nale\y do obszaru krytycznego
testu.
5. Podejmujemy decyzję odnośnie hipotezy zerowej:
" jeśli statystyka testowa nale\y do obszaru krytycznego testu, to hipotezę
zerową nale\y odrzucić
" jeśli statystyka testowa nie nale\y do obszaru krytycznego testu, to nale\y
stwierdzić, \e nie ma podstaw do odrzucenia hipotezy zerowej.
Chcemy zweryfikować przypuszczenie, \e połowa bardzo licznej populacji
zamieszkującej na pewnym terenie ma określony gen (nazwijmy go genem B).
W 10-osobowej próbie z tej populacji okazało się, \e 7 osób ma gen B.
Czy mo\na uwa\ać, \e połowa tej populacji ma gen gen B?
" Niech p oznacza proporcję osób w populacji, które mają gen B.
" H0: p = 0,5 vs. H1: p +" 0,5 (vs. [versus] oznacza kontra , wobec , przeciwko )
" Poziom istotności a = 0,05
" Statystyka testowa T to liczba osób w próbie, u których stwierdzono gen B, wobec
tego T = 7.
" Obszar krytyczny składa się z wartości 0, 1, 9, 10.
" Poniewa\ statystyka testowa nie nale\y do obszaru krytycznego, to nie ma
podstaw do odrzucenia hipotezy zerowej, która głosi, \e połowa populacji ma gen
B.
" Mo\na wyznaczyć prawdopodobieństwo błędu II rodzaju przy
obszarze krytycznym zło\onym z wartości 0,1,9,10.
" Błąd II rodzaju polega na przyjęciu fałszywej hipotezy zerowej.
" Skoro hipoteza zerowa jest fałszywa, to oznacza, \e p nie jest równe
0,5, nie wiemy jednak, jaką konkretną wartość pomiędzy 0 i 1
przyjmuje.
" Prawdopodobieństwo błędu II rodzaju musi być określone z osobna
dla ka\dej wartości innej, ni\ 0,5 (tych wartości jest nieskończenie
wiele).
" Mo\na go wyznaczyć dla przykładowych wartości p.
" Gdy p = 0,7, to wynosi ono 0.850548
" Gdy p = 0,93, to wynosi ono 0.1517299
" Gdy p = 0,52, to wynosi ono 0.9775281
" Ogólnie, im prawdziwa wartość p jest bli\sza wartości z hipotezy
zerowej (w tym przypadku 0,5), tym bardziej prawdopodobne jest
popełnienie błędu II rodzaju (czyli mała będzie zdolność testu do
odrzucenia fałszywej hipotezy zerowej).
p-value (p-wartość)
" W pakietach statystycznych testowanie hipotez statystycznych
przeprowadza się na ogół w oparciu o tzw. p-wartość (p-value).
" p-wartość jest to prawdopodobieństwo zaobserwowania danych takich,
jak w próbie lub danych jeszcze bardziej skłaniających do odrzucenia
hipotezy zerowej, przy zało\eniu, \e hipoteza zerowa jest prawdziwa.
" W analizowanym przykładzie, jeśli zaobserwujemy k = 7, to p-wartość
będzie równa około 0,3438
Jeśli X ~ Bin(n=10, p=0,5), to:
P(X=0)= 0.00098
P(X=1)= 0.00977
P(X=2)= 0.04395
Suma tych
P(X=3)= 0.11719
prawdopodobieństw
P(X=4)= 0.20508
jest równa około
P(X=5)= 0.24609
P(X=6)= 0.20508
0,3438
P(X=7)= 0.11719
P(X=8)= 0.04395
P(X=9)= 0.00977
P(X=10)= 0.00098
W tym przypadku p-wartość jest równa około 0,3438
> binom.test(x=7,n=10)
Exact binomial test
data: 7 and 10
number of successes = 7, number of trials = 10,
p-value = 0.3438
alternative hypothesis: true probability of success is not
equal to 0.5
95 percent confidence interval:
0.3475471 0.9332605
sample estimates:
probability of success
0.7
Przy testowaniu hipotez w oparciu o p-wartość postępujemy według
następującego schematu:
1. Określamy hipotezę zerową i alternatywną.
2. Przyjmujemy poziom istotności testu.
3. Wyznaczamy p-wartość (najczęściej przy u\yciu komputerowego
pakietu statystycznego).
4. Podejmujemy decyzję odnośnie hipotezy zerowej:
jeśli p-wartość Ł a, to hipotezę zerową nale\y odrzucić
jeśli p-wartość > a, to nale\y stwierdzić, \e nie ma podstaw
do odrzucenia hipotezy zerowej.
Chcemy zweryfikować przypuszczenie, \e połowa bardzo licznej populacji
zamieszkującej na pewnym terenie ma określony gen (nazwijmy go genem B).
W 10-osobowej próbie z tej populacji okazało się, \e 7 osób ma gen B.
Czy mo\na uwa\ać, \e połowa tej populacji ma gen gen B?
" Niech p oznacza proporcję osób w populacji, które mają gen B.
" H0: p = 0,5 vs. H1: p +" 0,5
" Poziom istotności a = 0,05
" p-wartość = 0,3438
" Poniewa\ 0,3438 > 0,05, to nie ma podstaw do odrzucenia hipotezy zerowej,
która głosi, \e połowa populacji ma gen B.

Wyszukiwarka

Podobne podstrony:
Testowanie hipotez statystycznych
rafajłowicz,Inżynierskie zastosowania statystyki, testowanie hipotez statystycznych
Ogolne zasady proj sieci wod kan
Zarządzanie Wiedzą2 Ogólne zasady oceny zgodności maszyn
Teoria 7 Testowanie hipotez
9 Testowanie hipotez
Ogólne zasady przemieszczania zwierząt towarzyszących po terytorium UE
Ogólne zasady
Ogolne zasady formatowania prac dyplomowych dla MiBM
instrukcja bhp dla szkoly ogolne zasady bezpieczenstwa
testowanie hipotez
Ogólne zasady oc ryzyka

więcej podobnych podstron