Wykład 10
Testowanie hipotez - c.d.
Czego potrzeba, aby podjąć decyzję?
" Tablicy rozkładu Studenta, aby ustalić wartość krytyczną (niezależne od danych).
"
Å»
X-m
" Wartości statystyki testowej t = n - 1, jej wartość zależny od danych.
S
" Czy można uniknąć wyszukiwania nowej wartości krytycznej?
" Tak. Wystarczy podać jej tzw. P-wartość dla naszej statystyki/danych.
" Znajomość P-wartości umożliwia podjęcie decyzji przy każdym poziomie istotności, bez wyszukiwania
wartości krytycznych.
Definicja P-wartości
P-wartość to prawdopodobieństwo, że przy prawdziwej hipotezie zerowej wartość statystyki przyjmie wartość
bardziej ekstremalną, niż zaobserwowana w badanej próbie.
" Dla dwustronnego testu Studenta P-wartość to całka z gęstości rozkładu Studenta na prawo od +|t| i
na lewo od -|t|.
" Dla testów jednostronnych P-wartość to całka po jednej stronie zaobserwowanej statystyki w kierunku
wyspecyfikowanym przez alternatywÄ™:
" Przy HA: m1 > m2, P-wartość to całka na prawo od obliczonej wartości t.
" Przy HA: m1 < m2, P-wartość to całka na lewo od t.
RozwiÄ…zanie - c.d.
Przy obliczonej wartości testu t = 6 i 9 stopniach swobody P-wartość jest równa (HA: m > 50) całce
z gęstości od 6 do ". Albo znajdujemy ją w tablicach, albo szacujemy (interpolujemy), albo liczymy za
pomocą programów statystycznych.
W naszym przypadku widzimy z tablic, że P-wartość dla 4,7809 wynosi 0,005. Zatem dla t = 6 musi być
jeszcze mniejsza. W rzeczywistości wynosi ona (obliczenia komputerowe) 0,0001
Inne rozkłady
Gdy prób jest wiele lub znamy Ã2, to korzystamy z rozkÅ‚adu normalnego.
Gdy chcemy weryfikować hipotezę dotyczącą wariancji lub odchylenia standardowego, to korzystamy z roz-
kÅ‚adu Ç2 (jak przy budowaniu przedziaÅ‚u ufnoÅ›ci).
Porównywanie średnich
Załóżmy, że chcemy porównać średnie m1 i m2 dwóch populacji i nie znamy rozkładów (np. średnia ocen ze
studiów w grupie kobiet i w grupie mężczyzn).
Musimy wtedy dysponować próbami o tak dużej liczebności, aby móc stosować Centralne Twiedzenie
Graniczne. (n > 30? a może n > 50?)
Przypuśćmy, że pobrano próby: o liczebności n spośród kobiet oraz o liczebności m spośród mężczyzn. Na
Å» Å»
podstawie CTG wnioskujemy, że XK oraz XM mają (w przybliżeniu) rozkłady normalne o średnich mk oraz
2 2
SK SM
mM i wariancjach i .
n m
Porównywanie średnich - c.d.
2 2
Å» Å»
Na podstawie próby obliczamy wartości XK, XM oraz SK i SM .
A ponieważ próba jest prosta (obserwacje niezależne), więc statystyka
1
Å» Å»
XK - XM
2 2
SK SM
+
n m
ma (w przybliżeniu) rozkład N(0, 1).
Obszar krytyczny zależy od postaci hipotezy alternatywnej.
Gdy obliczona wartość statystyki wpada do obszaru krytycznego, to hipotezę o równości średnich od-
rzucamy.
Jaki rozkład ma dana cecha?
Przypuśćmy, że opracowano nowy generator liczb losowych . Twórca twierdzi, że algorytm ten generuje
liczby losowe z przedziału (0, 1) zgodnie z rozkładem jednostajnym.
" Oznacza to, że P (X < a) = a dla 0 < a < 1 (dystrybuanta)
" lub, że P (x1 < X < x2) = x2 - x1, 0 < x1 < x2 < 1, czyli gęstość jest stała i równa 1 na odcinku
(0, 1).
" Wyrażenia algorytm generuje oraz losowo , użyte łącznie, zawierają sprzeczność!
" Czy ten generator jest dobry?
" Jak generować liczby z (0, 1) rzeczywiście losowo?
Odległość dwóch rozkładów
Aby porównać dwa rozkłady, musimy mieć jakąkolwiek miarę ich odległości.
Przypuśćmy, że dane sa dwa rozkłady prawdopodobieństwa o dystrybuantach F (x) oraz G(x).
" Jedną z miar odległości między rozkładami jest maksymalna różnica ich dystrybuant:
"
"(F, G) = sup |F (x) - G(x)|.
-"
Test zgodności Kołmogorowa (test )
Przypuśćmy, że chcemy zbadać, czy pewna zmienna losowa ma dany rozkład.
" H0: generator produkuje liczby losowe o rozkładzie jednostajnym na przedziale (0, 1)
" Niech Fn(x) będzie dystrybuantą empiryczną (czyli obliczoną na podstawie próby n-elementowej).
" Niech F będzie dystrybuantą, jaką zakłada hipoteza (u nas: F to dystrybuanta rozkładu jednostajnego
na przedziale (0, 1)).
" Połóżmy
Dn = sup |Fn(x) - F (x)|
x
Test Kołmogorowa c.d.
" A.N. Kołmogorow udowodnił, że jeśli hipoteza H0 jest prawdziwa i jest liczbą dodatnią, to przy
n "
"
"
"
2
lim P nDn < = Q() = (-1)je-2j 2.
n"
j=-"
" Rozkład ten został stablicowany, tablice np. na mojej stronie.
" Rozkład podany przez H0 musi być ciągły!
2
" Z testu można korzystać, gdy liczba obserwacji jest dość duża (n 50).
"
" Znaleziono jednak dokładne rozkłady nDn, są stablicowane. Jeśli z nich korzystamny, to liczba prób
nie musi być duża.
Przykład
Załóżmy, że wygenerowano 16 liczb losowych za pomocą wspomnianego algorytmu i otrzymano wyniki:
0,406 0,776 0,121 0,573 0,514 0,629 0,404 0,275
0,544 0,652 0,618 0,764 0,412 0,272 0,373 0,147
Czy te dane przeczą hipotezie H0: rozkład jest jednostajny na (0, 1) przy poziomie istotności 1 - ą = 0, 95?
Komentarz: Danych powinno być co najmniej 50, ale na potrzeby wykładu musimy ich wziąć tak mało,
"
aby zdążyć przeprowadzić obliczenia. Nie mamy tablicy rozkładu nDn(x).
RozwiÄ…zanie
Aby utworzyć dystrybuantę empiryczną, porządkujemy dane rosnąco:
0,121 0,147 0,272 0,275 0,373 0,404 0,406 0,412
0,514 0,544 0,573 0,618 0,629 0,652 0,764 0,776
" UporzÄ…dkowane dane nazywa siÄ™ statystykami pozycyjnymi albo porzÄ…dkowymi:
" xmin = x" x" ... x" = xmax
1 2 n
" Budujemy dystrybunatÄ™ empirycznÄ…:
"
Å„Å‚
ôÅ‚
0, gdy x x",
òÅ‚
1
m-1
Fn(x) = , gdy x" < x x" ,
m-1 m
n
ôÅ‚
ół
1, gdy x > x" .
n
RozwiÄ…zanie c.d.
Najwygodniej zapisać dane w tabeli
"
x" Fn(x) F (x) Dn(x) = |Fn(x) - F (x)| nDn(x)
i
0, 121 0 0, 121 0, 121 0, 484
0, 147 0, 0625 0, 147 0, 0845 0, 338
0, 272 0, 125 0, 272 0, 147 0, 588
0, 275 0, 1875 0, 275 0, 0875 0, 35
0, 373 0, 25 0, 373 0, 0123 0, 492
0, 404 0, 3125 0, 404 0, 0915 0, 366
0, 406 0, 375 0, 406 0, 031 0, 124
0, 412 0, 4375 0, 412 0, 0255 0, 102
0, 514 0, 5 0, 514 0, 014 0, 056
... ... ... ... ...
"
Niech = maxx nDn(x). Wartość krytyczną odczytuje się z tablic rozkładu -Kołmogorowa, tak, aby
zachodziło: P ( ą) = ą. Liczba ą jest wartością krytyczną dla danej wartości poziomu istotności ą.
" W naszym przypadku ą = 0, 05, więc z tablic
" odczytujemy dla ą = 0, 05 wartość krytyczną
" 0,05 = 1, 36
" Wniosek: Nie ma podstaw do odrzucenia hipotezy H0.
"
" Gdyby n było istotnie duże, np. n = 100, to mnożylibyśmy przez 100 = 10, a nie przez 4, wtedy
0, 588 · 2, 5 = 1, 47 i hipotezÄ™ H0 należaÅ‚oby odrzucić!
3
Niedogodności testu Kołmogorowa
Test Kołmogorowa ma kilka niedogodności:
" Rozkład musi być ciągły (nie może być skokowy).
" Prób powinno być dość dużo.
" Nie możemy grupować wyników (a jeśli jest ich 10 000?)
" A jeśli dane mamy już zgrupowane?
Test zgodnoÅ›ci Ç-kwadrat
Karl Pearson opracowaÅ‚ test, oparty na statystyce Ç2. Można stosować go wówczas, gdy
" Dane sÄ… pogrupowane w szereg rozdzielczy.
" Liczba elementów w próbie powinna być na tyle duża, aby
" liczba elementów w każdym przedziale była 5 (niektórzy postulują 10).
" Jeśli jest ich mniej, łączy się sąsiednie przedziały.
Test zgodnoÅ›ci Ç-kwadrat
Pobrano próbę liczebności n i wyniki podzielono na k rozłącznych przedziałów.
Niech ni będzie liczbą obserwacji, które wpadają do i-tego przedziału.
Niech pi będzie prawdopodobieństwem (przy założeniu prawdziwości H0) i-tego przedziału, tzn. pi =
P (zmienna o danym rozkładzie przybierze wartości z przedziału (xi, xi+1]).
Gdy n ", to statystyka
k
(ni - npi)2
Q2 =
npi
i=1
ma asymptotycznie rozkÅ‚ad Ç2 o k - r - 1 stopniach swobody, gdzie r jest liczbÄ… nieznanych parametrów,
których wartości oszacowano na podstawie próby.
Przykład
Wykonano 130 obserwacji pewnej cechy, o której sądzi się, że ma rozkład normalny. Tablica przedstawia
wyniki. Na poziomie ą = 0, 05 zweryfikować hipotezę o normalności tego rozkładu.
Wartość zmiennej X Liczba obserwacji
3, 6 2
(3, 6; 4, 2] 8
(4, 2; 4, 8] 35
(4, 8; 5, 4] 43
(5, 4; 6, 0] 22
(6, 0; 6, 6] 15
> 6, 6 5
RozwiÄ…zanie
RozkÅ‚ad normalny zależy od dwóch parametrów: m i Ã2, wiÄ™c musimy je oszacować na podstawie danej
próby:
" Jak obliczamy x?
Å»
" Ponieważ długość przedziału wynosi 0,6 więc przyjmiemy jako środek pierwszego przedziału liczbę
" 3,3, a jako środek ostatniego liczbę 6,9.
" Wtedy
4
1
" x = (2 · 3, 3 + 8 · 3, 9 + 35 · 4, 5 + 43 · 5, 1 + 22 · 5, 7+ 15 · 6, 3 + 5 · 7, 2) = 5, 157692.., podobnie
Å»
130
liczymy s = 0, 76
RozwiÄ…zanie c.d.
Liczba obserwacji w pierwszym przedziale jest mniejsza od 5, więc łączymy go z drugim przedziałem:
Wartość zmiennej X Liczba obserwacji
4, 2 10
(4, 2; 4, 8] 35
(4, 8; 5, 4] 43
(5, 4; 6, 0] 22
(6, 0; 6, 6] 15
> 6, 6 5
RozwiÄ…zanie c.d.
Hipotetycznym rozkładem zniennej X jest zatem rozkład N(5, 16; 0, 762). Stąd (przy założeniu prawdziwości
H0: X ma rozkład normalny), zmienna
X - 5, 16
0, 76
ma rozkład N(0, 1). Teraz obliczamy (z tablic rozkładu normalnego) liczby pi.
X - 5, 16 4, 2 - 5, 16
" p1 = P (-" < X < 4, 2) = P -" < < = Åš(-1, 25) = 0, 1056.
0, 76 0, 67
" Podobnie obliczamy
" p2 = P (4, 2 < X < 4, 8) = ... = 0, 2172
" p3 = 0, 3065, p4 = 0, 2393, p5 = 0, 1033, p6 = 0, 0281.
Weryfikcja hipotezy
X ni npi (ni - npi)2 (ni-npi)2
npi
4, 2 10 13, 7 13, 69 1, 00
(4, 2; 4, 8] 35 28, 2 46, 24 1, 64
(4, 8; 5, 4] 43 39, 8 10, 24 0, 25
(5, 4; 6, 0] 22 31, 1 82, 81 2, 66
(6, 0; 6, 6] 15 13, 4 2, 56 0, 19
> 6, 6 5 3, 8 1, 44 0, 28
Suma 130 130, 0 - - - 6, 12
Weryfikacja
Ponieważ po zgrupowaniu mieliśmy 6 przedziałów i 2 parametry szacowaliśmy z próby, więc liczba stopni
swobody wynosi tutaj
" k - r - 1 = 6 - 2 - 1 = 3.
" W tablicach Ç2 sprawdzamy, że do obszaru krytycznego (czyli odrzucenia) wpadajÄ… wartoÅ›ci wiÄ™ksze
3
niż 7,82.
" Nasza statystyka przyjęła wartość 6,12, więc
" nie ma podstaw do jej odrzucenia.
" Wartość statystyki testowej jest jednak bliska wartości krytycznej, więc należy zachować ostrożność i
obliczyć prawdopodobieństwo popełnienia błędu II rodzaju.
5
Test znaków
Przykład: w grupie studentów na lektoracie języka francuskiego zmierzono rozumienie tekstu mówionego
przed i po semestrze zajęć.
" Czy zajęcia te zwiększyły poziom rozumienia tekstu mówionego?
" Sformułowanie abstrakcyjne:
" Dane sÄ… dwie zmienne losowe X i Y .
" H0: rozkłady (dystrybuanty) obu zmiennych są jednakowe, tzn. FX a" FY
" HA: FX = FY
" Zweryfikować H0 na poziomie 1 - ą = 0, 95.
Test znaków c.d.
Załóżmy, że mamy n par niezależnych obserwacji dwóch zmiennych: (x1, y1), (x2, y2),..., (xn, yn).
" Przy założeniu prawdziwości H0 winno być
1
" P (X > Y ) = P (X < Y ) = (gdy P (X = Y ) = 0, np. rozkłady ciągłe).
2
" Porównajmy znaki różnic x1 - y1, x2 - y2, ..., xn - yn.
" Różnice równe zero odrzucamy (często 0 to wynik zaokrągleń).
" Przy hipotezie H0 znaki różnic ( + =sukces, - =porażka) mają rozkład Bernoulliego z parametrem
1
p = .
2
Przy założeniu H0 mamy więc:
P (w n-elmentowej próbie liczba plusów (minusów) przekroczy k) =
n
n 1
j 2n
j=k
" Te prawdopodobieństwa można obliczyć
" albo za pomoca komputera,
" albo korzystając z tw. de Moivre a-Laplace a. (W jak sposób?)
" Można więc obliczyć wartości krytyczne, np. dla jakiego k przy zadanej wielkości próby n spełniona
n
n 1
jest nierówność > ą.
j=k
j 2n
Przykład
Porównano rozumienie języka francuskiego wśród 10 studentów przed i po semestrze lektoratu. Oto wyniki:
Student Przed Po Różnica
1 32 34 2
2 31 31 0
3 29 35 6
4 10 16 6
5 30 33 3
6 33 36 3
7 22 24 2
8 25 28 3
9 32 26 -6
10 20 26 6
H0: liczba zrozumianych słów nie zmieniła się
6
HA: liczba zrozumianych słów wzrosła
Weryfikacja
Odrzucamy wynik 0 (zero). Zostaje 9 obserwacji.
Gdyby obie zmienne (liczba rozumianych słów przed i po semestrze lektoratu) miały ten sam rozkład, to
różnica X - Y miałaby rozkład Bernoulliego z p = 0, 5.
" W badanym przykładzie na 9 niezerowych obserwacji mamy 8 znaków + oraz 1 znak -. Odpowiada
to 8 sukcesom w 9 próbach Bernoulliego z p = 0, 5.
" Prawdopodobieństwo zdarzenia liczba sukcesów wyniesie co najmnej 8 jest równe
9 1 9 1 9 + 1
+ = H" 0, 02.
8 29 9 29 512
" Na poziomie 1 - ą < 0, 95 hipotezę należy
" odrzucić.
Główna idea weryfikacji statystycznej hipotez
Zdarzenia o małym prawdopodobieństwie obserwujemy bardzo rzadko.
" Co to znaczy małym ?
" R.A. Fischer (1890-1962) jeden z wielkich pionierów statystyki matematycznej i jej zastosowań w
różnych naukach eksperymentalnych. Zajmował się też genetyką i ogólniej, biologią.
" Fischer zaproponował 1 - ą = 0, 95.
" Można wymyślać inne poziomy istotności, ale kto chce się sprzeciwiać mistrzowi?
Główna idea weryfikacji statystycznej hipotez
" Znamy rozkład danej statystyki i potrafimy (na ogół z tablic) obliczyć odpowiednie prawdopodobień-
stwa.
" Dla zadanego poziomu istotności 1 - ą (równego najczęściej 0,9, 0,95 lub 0,99) obliczamy odpowiedni
obszar krytyczny (obszar odrzucenia).
" Jeśli wartość statystyki wpada do obszaru odrzucenia i H0 byłaby prawdziwa, oznacza to, iż zreali-
zowało się bardzo mało prawdopodobne zdarzenie.
" A takich raczej siÄ™ nie obserwuje!
" Wniosek: H0 nie jest prawdziwa, więc odrzucamy ją.
7
Wyszukiwarka
Podobne podstrony:
wyklad7 08 tekst
wyklad8 08 tekst
wyklad5 08 tekst
wyklad2 08 tekst
wyklad9 08 tekst
wyklad4 08 tekst
wyklad3 08 tekst
wyklad6 08 tekst
TI Wykład 08
Wyklad2 08
PLC wyklad 08
1GW Wyklad 08 cz1id991
GW Wyklad 08 cz2
wyklad1 08
PBS wyklad 08
więcej podobnych podstron