WYKŁAD 6
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych ma na celu sprawdzenie sformułowanych hipotez statystycznych, czyli podjęcie określonych decyzji statystycznych.
Hipoteza statystyczna to sąd (przypuszczenie) odnoszący się do nieznanego poziomu parametrów lub do nieznanej postaci rozkładu zmiennych losowych w zbiorowości generalnej. Hipotezy dzielimy na dwie grupy:
hipotezy parametryczne, tzn. sądy dotyczące parametrów rozkładu cechy w populacji generalnej,
hipotezy nieparametryczne, tzn. sądy dotyczące kształtu rozkładu populacji generalnej.
Hipoteza zerowa (H0) jest podstawową hipotezą statystyczną, która jest przedmiotem weryfikacji, tzn. proces weryfikacji może doprowadzić do jej odrzucenia bądź do stwierdzenia, że nie ma podstaw, by ją odrzucić. Hipoteza ta jest formułowana w taki sposób (czasem wbrew rozsądkowi), aby można ją było łatwo odrzucić.
Hipoteza alternatywna (H1) to hipoteza konkurencyjna w stosunku do hipotezy zerowej. Jest ona formułowana jako przypuszczenie, że rozkład nie posiada własności określonej w hipotezie zerowej (posiada ją w innym wariancie).
Trzeba przy tym rozróżnić następujące sytuacje:
jeżeli hipoteza zerowa jest parametryczna, to hipotezy alternatywne można sformułować dwustronnie (tzn. “jest różne”), prawostronnie (tzn. “jest większe od”) lub lewostronnie (tzn. “jest mniejsze od”), przy czym sposób formułowania hipotez zależy nie tylko od celu badania, ale również od rodzaju informacji statystycznych uzyskanych z próby losowej,
jeżeli hipoteza zerowa jest nieparametryczna, to hipotezy alternatywne są formułowane wyłącznie dwustronnie (tzn. jest różne) i znika problem odmiennego podejścia do weryfikacji hipotezy zerowej.
Hipotezy statystyczne weryfikuje się za pomocą testów statystycznych, przy czym w zależności od rodzaju hipotezy rozróżniane są testy parametryczne (służą do weryfikacji hipotez parametrycznych) i nieparametryczne (m.in. testy zgodności, losowości - służą do weryfikacji hipotez nieparametrycznych).
Przy weryfikacji hipotez statystycznych ważny jest tzw. poziom istotności oraz tzw. obszary odrzucenia hipotez zerowych (oznaczane przez W). Oba te pojęcia wiążą się z teorią błędów popełnianych przy podejmowaniu decyzji w procesach weryfikacji hipotez statystycznych.
Rozróżniamy dwa rodzaje błędów, które występują z określonym prawdopodobieństwem:
błąd I rodzaju, polegający na odrzuceniu hipotezy zerowej wtedy, gdy jest ona w rzeczywistości prawdziwa, jego prawdopodobieństwo będziemy oznaczać przez . (np. w statystycznej kontroli jakości jest ono określane jako ryzyko producenta),
błąd II rodzaju, polega na przyjęciu hipotezy zerowej wtedy gdy jest ona w rzeczywistości fałszywa, czyli jeśli jest prawdziwa hipoteza alternatywna, jego prawdopodobieństwo będziemy oznaczać przez . (np. w statystycznej kontroli jakości jest ono określane jako ryzyko odbiorcy).
Tabela 6.1
Błędy popełniane przy weryfikacji hipotez statystycznych.
Decyzja |
Hipoteza H0 prawdziwa |
Hipoteza H0 fałszywa |
Przyjąć weryfikowaną hipotezę H0 |
decyzja poprawna |
decyzja błędna - błąd II rodzaju |
Odrzucić weryfikowaną hipotezę H0 |
decyzja błędna - błąd I rodzaju |
decyzja poprawna |
Źródło: Opracowanie własne według Krysickiego [1986], s. 79
Test statystyczny to reguła postępowania, która na podstawie wyników z próby ma doprowadzić do odrzucenia lub nie postawionej hipotezy statystycznej.
Obustronny (dwustronny) obszar odrzucenia testu, który jest budowany gdy H1 jest stawiana dwustronnie, to zbiór wszystkich wartości zmiennej losowej u takich, że
, gdzie
- wartość krytyczna odczytana z tablic dla ustalonego z góry poziomu istotności taka, że
.
Jednostronny obszar odrzucenia testu (jest budowany gdy H1 jest stawiana jednostronnie) to zbiór wszystkich wartości zmiennej losowej u taka, że
(prawostronny obszar odrzucenia) lub
, gdzie
- wartość krytyczna dla z góry zadanego poziomu istotności taka, że
dla prawostronnego lub
dla lewostronnego obszaru odrzucenia .
Sprawdzian testu (statystyka testu) to zmienna losowa o określonym rozkładzie z próby. Wartość krytyczna testu to wartość zmiennej losowej o określonym rozkładzie, która przy danym stanowi koniec przedziału odrzucenia.
Mocą testu nazywamy prawdopodobieństwo podjęcia słusznej decyzji, polegającej na odrzuceniu weryfikowanej hipotezy wtedy, gdy jest ona fałszywa. Wyznacza się ją jako
M=1-
gdzie - prawdopodobieństwo popełnienia błędu II rodzaju.
W procesie weryfikacji hipotez statystycznych można wyróżnić kilka etapów:
sformułowanie hipotezy zerowej (H0) oraz hipotezy alternatywnej (H1) (jednej lub kilku),
wybór testu statystycznego służącego do weryfikacji hipotezy zerowej,
wyznaczenie wartości sprawdzianu testu,
ustalenie poziomu istotności ( ) oraz wyznaczenie obszaru odrzucenia hipotezy zerowej,
podjęcie decyzji z określonym prawdopodobieństwem błędu.
Testy parametryczne
Weryfikacja hipotez może dotyczyć:
jednej populacji generalnej - sprawdzenie, czy parametr ma określoną wartość,
dwóch zbiorowości - weryfikacja hipotezy o równości parametru w obu zbiorowościach.
Testy weryfikujące hipotezę o wartości oczekiwanej
H0: = 0
H1: 0, H1: > 0, H1: < 0.
Populacja N( ,σ ) ze znanym σ
Sprawdzian testu:
przy założeniu prawdziwości hipotezy H0 ma rozkład normalny N(0,1).
H1: 0
,
.
H1: > 0
prawostronny obszar odrzucenia,
,
.
.
H1: < 0
,
.
.
Populacja o rozkładzie normalnym z nieznanym σ
W tym przypadku korzystamy z testu t-Studenta z (n-1) st. swobody..
,
H1: 0
,
.
H1: > 0
,
H1: < 0
, .
Populacja o nieznanym rozkładzie, duża próba
Testy weryfikujące hipotezę o równości dwóch wartości oczekiwanych
H0: 1= 2
Dwie populacje N( 1,σ 1) i N( 2,σ 2), ze znanymi σ 1 i ,σ 2
0. H1: 1 2, to
;
.
H1: 1> 2,
;
.
H1: 1< 2,
.
Populacje o rozkładzie normalnym z nieznanym odchyleniem standardowym
liczebności prób n1 i n2 są małe
H1: 1 2
,
.
H1: 1> 2
,
H1: < 0
Test weryfikujący hipotezę o wariancji w populacji generalnej
populacja generalna N( ,σ ), i σ są nieznane.
o (n-1) stopniach swobody
,
.
,
Test weryfikujący hipotezę o równości dwóch wariancji w populacji generalnej
N( 1,σ 1) i N( 2,σ 2), przy czym parametry tych rozkładów są nieznane.
,
.
Statystyka o (n1-1) i (n2-1) stopniach swobody
Z tablic rozkładu Fishera-Snedecora taką wartość krytyczną
, aby
. Jeśli
,
Hipoteza o wskaźniku struktury w populacji generalnej
H0: p = p0
to
;
.
;
.
.
Testy nieparametryczne
Testy nieparametryczne mają mniejszą moc od testów parametrycznych.
Wyróżnia się ich podstawowe trzy grupy:
testy losowości,
testy zgodności,
testy niezależności i jednorodności.
Test medianowy dla losowości próby
H0: próba ma charakter losowy,
H1: próba nie ma charakteru losowego.
Test medianowy:
wyznaczenie mediany z próby,
przyporządkowanie każdemu elementowi próby xi, według kolejności pobierania elementów do badania, symbolu a - jeśli xi<Me, bądź symbolu b, jeśli xi>Me; wyniki xi=Me można pominąć,
wyznaczenie obszaru odrzucenia:
Z ciągu symboli a i b wyznaczamy ogólną liczbę serii k. Rozkład statystyki k przy założeniu prawdziwości hipotezy H0 jest znany i stablicowany. Na podstawie rozkładu liczby serii buduje się dwustronny obszar odrzucenia w ten sposób, że dla przyjętego poziomu istotności oraz n1 i n2 (liczebności odpowiednio symboli a i b) odczytuje się w tablicach rozkładu warunkowego liczby serii takie dwie wartości krytyczne k1 i k2 , aby zachodziły relacje:
Dla testu medianowego obszarem odrzucenia jest zbiór
.
Hipotezę H0 odrzucamy na rzecz hipotezy alternatywnej H1, jeżeli
, w przeciwnym przypadku tzn. gdy
nie ma podstaw do odrzucenia hipotezy zerowej H0.
Test zgodności rozkładu
Duża próba (n>120)
H0 : F(x)=F0(x), czyli że rozkład empiryczny F(x) pokrywa się z pewnym rozkładem teoretycznym F0(x),
H1 : F(x) F0(x), czyli że rozkład empiryczny F(x) jest różny od rozkładu teoretycznego F0(x),
Celem sprawdzenia hipotezy zerowej H0 należy:
podzielić wyniki próby na r rozłącznych klas o liczebnościach ni (i=1,2,3,..,r) w każdej klasie, przy czym
,
obliczyć prawdopodobieństwo pi tego, że zmienna losowa o dystrybuancie F0(x) przyjmie wartości należące do i -tej klasy (i =1,2,...r), gdzie:
,
obliczyć statystykę
,
ni - liczebność empiryczna i-tej klasy,
npi - liczebność teoretyczna i-tej klasy, tzn. liczebność i-tej klasy przy założeniu prawdziwości hipotezy H0.
Jeżeli H0 jest prawdziwa, to statystyka
ma przy
n→ rozkład
o (r-s-l) stopniach swobody, gdzie s jest liczbą szacowanych parametrów rozkładu z próby.
Można korzystać z tego rozkładu, jeśli liczba klas r nie jest mniejsza od 5 i
.
Obszar odrzucenia w tym teście ma postać
.
Testy zgodności dwóch rozkładów empirycznych
sprawdzenie, czy mamy do czynienia z próbami pochodzącymi z jednej populacji generalnej,
zbadanie, czy analizowana przez nas zbiorowość zmieniła się.
Test serii dla dwóch populacji
H0: dwie próby pochodzą z populacji o jednakowym rozkładzie, co można zapisać w postaci F1(x)=F2(x),
H1: dwie próby różnią się istotnie rozkładem, a więc F1(x) F2(x).
Weryfikacja hipotezy H0:
1. wyniki obu prób porządkujemy w jeden ciąg według rosnących wartości,
2. przyporządkowujemy elementom tego ciągu symbol a , jeśli pochodzą z pierwszej próby, a pozostałym b i uzyskujemy w ten sposób liczbę serii k,
3. dla ustalonego poziomu istotności oraz dla odpowiednich n1 i n2 (liczebności prób) odczytujemy z tablic rozkładu serii taką wartość krytyczną k , by zachodziła równość
,
4. obszar odrzucenia
.
Uwaga!
Jeżeli ta sama wartość cechy X występuje w obu próbach należy przyjąć takie uporządkowanie symboli a i b, przy którym liczba serii jest mniejsza.
Test niezależności
Wykorzystywany jest w badaniu relacji występujących między dwiema cechami lub zjawiskami.
H0: cechy są niezależne,
H1: cechy są zależne,
1) Dzielimy zbór możliwych wartości cechy X na r grup oraz cechy Y na s grup i umieszczamy te wartości odpowiednio w boczku i główce tablicy niezależności. Wnętrze tablicy wypełniamy liczebnościami nij, które oznaczają liczbę elementów w próbie należących do i -tej grupy według cechy X (i =1,2,...,r) i do j-tej grupy według cechy Y (j=1,2,...,s).
Przykład tablicy niezależności (zawierającej liczebności empiryczne)
|
yj |
|
|
|
|
|
xi |
|
y1 |
y2 |
... |
ys |
|
x1 |
|
n11 |
n12 |
... |
n1s |
n1. |
x2 |
|
n21 |
n22 |
... |
n2s |
n2. |
... |
|
... |
... |
... |
... |
... |
xr |
|
nr1 |
nr2 |
... |
nrs |
nr. |
|
|
n.1 |
n.2 |
... |
n.s |
n |
Zauważmy, że zachodzą relacje:
gdzie:
nij - liczebność empiryczna i-tego wariantu cechy X i j-tego wariantu cechy Y,
ni.- liczebność brzegowa i-tego warianty cechy X (i=1, 2, 3,.., r),
n.j- liczebność brzegowa j-tego wariantu cechy Y (j=1, 2, 3,..., s).
2) Szacujemy na podstawie liczebności brzegowych tablicy niezależności ni., n.j liczebności hipotetyczne (teoretyczne) dla każdej kombinacji (i,j) cech X i Y i wpisujemy je do odpowiedniej rubryki tablicy niezależności, czyli:
Przykład tablicy roboczej (zawierającej liczebności teoretyczne)
|
|
|
|
|
|
|
xi |
|
y1 |
y2 |
... |
ys |
|
x1 |
|
|
|
... |
|
n1. |
x2 |
|
|
|
... |
|
n2. |
... |
|
... |
... |
... |
... |
... |
xr |
|
|
|
... |
|
nr. |
|
|
n.1 |
n.2 |
... |
n.s |
n |
3) Wyznaczamy wartość sprawdzianu testu, czyli statystyki:
która ma przy założeniu prawdziwości hipotezy H0 asymptotyczny rozkład
o (r-1)(s-1) stopniach swobody.
Przykład tablicy roboczej
|
yj |
|
|
|
|
|
xi |
|
y1 |
y2 |
... |
ys |
|
x1 |
|
|
|
... |
|
|
... |
|
... |
... |
... |
... |
... |
xr |
|
|
|
... |
|
|
|
|
|
|
... |
|
|
4) Odczytujemy z tablic rozkładu
wartość
o (r-1)(s-1) stopniach swobody dla przyjętego poziomu istotności.
5) Obszar odrzucenia ma postać
.
32