Statystyka matematyczna, Wykład 6


WYKŁAD 6

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych ma na celu sprawdzenie sformułowanych hipotez statystycznych, czyli podjęcie określonych decyzji statystycznych.

Hipoteza statystyczna to sąd (przypuszczenie) odnoszący się do nieznanego poziomu parametrów lub do nieznanej postaci rozkładu zmiennych losowych w zbiorowości generalnej. Hipotezy dzielimy na dwie grupy:

hipotezy parametryczne, tzn. sądy dotyczące parametrów rozkładu cechy w populacji generalnej,

hipotezy nieparametryczne, tzn. sądy dotyczące kształtu rozkładu populacji generalnej.

Hipoteza zerowa (H0) jest podstawową hipotezą statystyczną, która jest przedmiotem weryfikacji, tzn. proces weryfikacji może doprowadzić do jej odrzucenia bądź do stwierdzenia, że nie ma podstaw, by ją odrzucić. Hipoteza ta jest formułowana w taki sposób (czasem wbrew rozsądkowi), aby można ją było łatwo odrzucić.

Hipoteza alternatywna (H1) to hipoteza konkurencyjna w stosunku do hipotezy zerowej. Jest ona formułowana jako przypuszczenie, że rozkład nie posiada własności określonej w hipotezie zerowej (posiada ją w innym wariancie).

Trzeba przy tym rozróżnić następujące sytuacje:

Hipotezy statystyczne weryfikuje się za pomocą testów statystycznych, przy czym w zależności od rodzaju hipotezy rozróżniane są testy parametryczne (służą do weryfikacji hipotez parametrycznych) i nieparametryczne (m.in. testy zgodności, losowości - służą do weryfikacji hipotez nieparametrycznych).

Przy weryfikacji hipotez statystycznych ważny jest tzw. poziom istotności oraz tzw. obszary odrzucenia hipotez zerowych (oznaczane przez W). Oba te pojęcia wiążą się z teorią błędów popełnianych przy podejmowaniu decyzji w procesach weryfikacji hipotez statystycznych.

Rozróżniamy dwa rodzaje błędów, które występują z określonym prawdopodobieństwem:

Tabela 6.1
Błędy popełniane przy weryfikacji hipotez statystycznych.

Decyzja

Hipoteza H0 prawdziwa

Hipoteza H0 fałszywa

Przyjąć weryfikowaną hipotezę H0

decyzja poprawna

decyzja błędna - błąd II rodzaju

Odrzucić weryfikowaną hipotezę H0

decyzja błędna - błąd I rodzaju

decyzja poprawna

Źródło: Opracowanie własne według Krysickiego [1986], s. 79

Test statystyczny to reguła postępowania, która na podstawie wyników z próby ma doprowadzić do odrzucenia lub nie postawionej hipotezy statystycznej.

Obustronny (dwustronny) obszar odrzucenia testu, który jest budowany gdy H1 jest stawiana dwustronnie, to zbiór wszystkich wartości zmiennej losowej u takich, że 0x01 graphic
, gdzie 0x01 graphic
- wartość krytyczna odczytana z tablic dla ustalonego z góry poziomu istotności  taka, że 0x01 graphic
.

Jednostronny obszar odrzucenia testu (jest budowany gdy H1 jest stawiana jednostronnie) to zbiór wszystkich wartości zmiennej losowej u taka, że 0x01 graphic
(prawostronny obszar odrzucenia) lub 0x01 graphic
, gdzie 0x01 graphic
- wartość krytyczna dla z góry zadanego poziomu istotności  taka, że 0x01 graphic
dla prawostronnego lub 0x01 graphic
dla lewostronnego obszaru odrzucenia .

Sprawdzian testu (statystyka testu) to zmienna losowa o określonym rozkładzie z próby. Wartość krytyczna testu to wartość zmiennej losowej o określonym rozkładzie, która przy danym  stanowi koniec przedziału odrzucenia.

Mocą testu nazywamy prawdopodobieństwo podjęcia słusznej decyzji, polegającej na odrzuceniu weryfikowanej hipotezy wtedy, gdy jest ona fałszywa. Wyznacza się ją jako

M=1-

gdzie   - prawdopodobieństwo popełnienia błędu II rodzaju.

W procesie weryfikacji hipotez statystycznych można wyróżnić kilka etapów:

  1. sformułowanie hipotezy zerowej (H0) oraz hipotezy alternatywnej (H1) (jednej lub kilku),

  2. wybór testu statystycznego służącego do weryfikacji hipotezy zerowej,

  3. wyznaczenie wartości sprawdzianu testu,

  4. ustalenie poziomu istotności ( ) oraz wyznaczenie obszaru odrzucenia hipotezy zerowej,

  5. podjęcie decyzji z określonym prawdopodobieństwem błędu.

Testy parametryczne

Weryfikacja hipotez może dotyczyć:

Testy weryfikujące hipotezę o wartości oczekiwanej

H0: = 0

H1:  0, H1:  > 0, H1: < 0.

Populacja N( ,σ ) ze znanym σ

Sprawdzian testu:

0x01 graphic

przy założeniu prawdziwości hipotezy H0 ma rozkład normalny N(0,1).

H1: 0

0x01 graphic

0x01 graphic
,

0x01 graphic

0x01 graphic
.

H1: > 0

prawostronny obszar odrzucenia, 0x01 graphic
, 0x01 graphic
.

0x01 graphic

0x01 graphic
.

H1: < 0

0x01 graphic

0x01 graphic
, 0x01 graphic
.

0x01 graphic
.

Populacja o rozkładzie normalnym z nieznanym σ

W tym przypadku korzystamy z testu t-Studenta z (n-1) st. swobody..

0x01 graphic
,

H1: 0

0x01 graphic
, 0x01 graphic
.

0x01 graphic

H1: > 0

0x01 graphic
, 0x01 graphic

0x01 graphic
 

0x01 graphic

H1:  < 0

0x01 graphic
0x01 graphic

0x01 graphic
, .

Populacja o nieznanym rozkładzie, duża próba

0x01 graphic

Testy weryfikujące hipotezę o równości dwóch wartości oczekiwanych

H0:  1= 2

Dwie populacje N( 1,σ 1) i N( 2,σ 2), ze znanymi σ 1 i ,σ 2

0x01 graphic

0. H1:  1  2, to

0x01 graphic
; 0x01 graphic
.

  1. H1: 1> 2, 0x01 graphic
    ; 0x01 graphic
    .

  2. H1: 1< 2, 0x01 graphic
    0x01 graphic

.

Populacje o rozkładzie normalnym z nieznanym odchyleniem standardowym

liczebności prób n1 i n2 są małe

0x01 graphic

H1: 1 2

0x01 graphic
, 0x01 graphic
.

H1: 1> 2

0x01 graphic
, 0x01 graphic

H1:  < 0

0x01 graphic
0x01 graphic

Test weryfikujący hipotezę o wariancji w populacji generalnej

populacja generalna N( ,σ ), i σ są nieznane.

0x01 graphic

0x01 graphic
0x01 graphic
o (n-1) stopniach swobody

0x01 graphic
, 0x01 graphic

.

0x01 graphic

0x01 graphic

Test weryfikujący hipotezę o równości dwóch wariancji w populacji generalnej

N( 1,σ 1) i N( 2,σ 2), przy czym parametry tych rozkładów są nieznane.

0x01 graphic
,

0x01 graphic
.

0x01 graphic

Statystyka o (n1-1) i (n2-1) stopniach swobody

Z tablic rozkładu Fishera-Snedecora taką wartość krytyczną 0x01 graphic
, aby 0x01 graphic
. Jeśli 0x01 graphic
,

Hipoteza o wskaźniku struktury w populacji generalnej

H0: p = p0

0x01 graphic

0x01 graphic
to

0x01 graphic
; 0x01 graphic
.

0x01 graphic
0x01 graphic
; 0x01 graphic
.

0x01 graphic
0x01 graphic
0x01 graphic
.

 

Testy nieparametryczne

Testy nieparametryczne mają mniejszą moc od testów parametrycznych.

Wyróżnia się ich podstawowe trzy grupy:

  1. testy losowości,

  2. testy zgodności,

  3. testy niezależności i jednorodności.

 

Test medianowy dla losowości próby

H0: próba ma charakter losowy,

H1: próba nie ma charakteru losowego.

Test medianowy:

  1. wyznaczenie mediany z próby,

  2. przyporządkowanie każdemu elementowi próby xi, według kolejności pobierania elementów do badania, symbolu a - jeśli xi<Me, bądź symbolu b, jeśli xi>Me; wyniki xi=Me można pominąć,

  3. wyznaczenie obszaru odrzucenia:

Z ciągu symboli a i b wyznaczamy ogólną liczbę serii k. Rozkład statystyki k przy założeniu prawdziwości hipotezy H0 jest znany i stablicowany. Na podstawie rozkładu liczby serii buduje się dwustronny obszar odrzucenia w ten sposób, że dla przyjętego poziomu istotności  oraz n1 i n2 (liczebności odpowiednio symboli a i b) odczytuje się w tablicach rozkładu warunkowego liczby serii takie dwie wartości krytyczne k1 i k2 , aby zachodziły relacje:

0x01 graphic

Dla testu medianowego obszarem odrzucenia jest zbiór 0x01 graphic
.

Hipotezę H0 odrzucamy na rzecz hipotezy alternatywnej H1, jeżeli 0x01 graphic
, w przeciwnym przypadku tzn. gdy 0x01 graphic
nie ma podstaw do odrzucenia hipotezy zerowej H0.

Test zgodności rozkładu 0x01 graphic

Duża próba (n>120)

H0 : F(x)=F0(x), czyli że rozkład empiryczny F(x) pokrywa się z pewnym rozkładem teoretycznym F0(x),

H1 : F(x) F0(x), czyli że rozkład empiryczny F(x) jest różny od rozkładu teoretycznego F0(x),

Celem sprawdzenia hipotezy zerowej H0 należy:

0x01 graphic
,

ni   - liczebność empiryczna i-tej klasy,

npi - liczebność teoretyczna i-tej klasy, tzn. liczebność i-tej klasy przy założeniu prawdziwości hipotezy H0.

Jeżeli H0 jest prawdziwa, to statystyka 0x01 graphic
ma przy
n rozkład 0x01 graphic
o (r-s-l) stopniach swobody, gdzie s jest liczbą szacowanych parametrów rozkładu z próby.

Można korzystać z tego rozkładu, jeśli liczba klas r nie jest mniejsza od 5 i 0x01 graphic
.

Obszar odrzucenia w tym teście ma postać 0x01 graphic
.

Testy zgodności dwóch rozkładów empirycznych

Test serii dla dwóch populacji

H0: dwie próby pochodzą z populacji o jednakowym rozkładzie, co można zapisać w postaci F1(x)=F2(x),

H1: dwie próby różnią się istotnie rozkładem, a więc F1(x) F2(x).

Weryfikacja hipotezy H0:

1. wyniki obu prób porządkujemy w jeden ciąg według rosnących wartości,

2. przyporządkowujemy elementom tego ciągu symbol a , jeśli pochodzą z pierwszej próby, a pozostałym b i uzyskujemy w ten sposób liczbę serii k,

3. dla ustalonego poziomu istotności  oraz dla odpowiednich n1n2 (liczebności prób) odczytujemy z tablic rozkładu serii taką wartość krytyczną k , by zachodziła równość 0x01 graphic
,

4. obszar odrzucenia 0x01 graphic
.

Uwaga!

Jeżeli ta sama wartość cechy X występuje w obu próbach należy przyjąć takie uporządkowanie symboli a i b, przy którym liczba serii jest mniejsza.

 

Test niezależności 0x01 graphic

Wykorzystywany jest w badaniu relacji występujących między dwiema cechami lub zjawiskami.

H0: cechy są niezależne,

H1: cechy są zależne,

1) Dzielimy zbór możliwych wartości cechy X na r grup oraz cechy Y na s grup i umieszczamy te wartości odpowiednio w boczku i główce tablicy niezależności. Wnętrze tablicy wypełniamy liczebnościami nij, które oznaczają liczbę elementów w próbie należących do i -tej grupy według cechy X (i =1,2,...,r) i do j-tej grupy według cechy Y (j=1,2,...,s).

Przykład tablicy niezależności (zawierającej liczebności empiryczne)

 

yj

 

 

 

 

 

xi

 

y1

y2

...

ys

x1

 

n11

n12

...

n1s

n1.

x2

 

n21

n22

...

n2s

n2.

...

 

...

...

...

...

...

xr

 

nr1

nr2

...

nrs

nr.

 

n.1

n.2

...

n.s

n

Zauważmy, że zachodzą relacje:

0x01 graphic

gdzie:

nij - liczebność empiryczna i-tego wariantu cechy X i j-tego wariantu cechy Y,

ni.- liczebność brzegowa i-tego warianty cechy X (i=1, 2, 3,.., r),

n.j- liczebność brzegowa j-tego wariantu cechy Y (j=1, 2, 3,..., s).

2) Szacujemy na podstawie liczebności brzegowych tablicy niezależności ni., n.j liczebności hipotetyczne (teoretyczne) dla każdej kombinacji (i,j) cech X i Y i wpisujemy je do odpowiedniej rubryki tablicy niezależności, czyli:

0x01 graphic

Przykład tablicy roboczej (zawierającej liczebności teoretyczne)

xi

 

y1

y2

...

ys

x1

 

0x01 graphic
0x01 graphic

0x01 graphic

...

0x01 graphic

n1.

x2

 

0x01 graphic

0x01 graphic

...

0x01 graphic

n2.

...

 

...

...

...

...

...

xr

 

0x01 graphic

0x01 graphic

...

0x01 graphic

nr.

 

n.1

n.2

...

n.s

n

3) Wyznaczamy wartość sprawdzianu testu, czyli statystyki:

0x01 graphic

która ma przy założeniu prawdziwości hipotezy H0 asymptotyczny rozkład 0x01 graphic
o (r-1)(s-1) stopniach swobody.

Przykład tablicy roboczej

 

yj

 

 

 

 

 

xi

 

y1

y2

...

ys

x1

 

0x01 graphic
0x01 graphic

0x01 graphic

...

0x01 graphic

0x01 graphic

...

 

...

...

...

...

...

xr

 

0x01 graphic

0x01 graphic

...

0x01 graphic

0x01 graphic

 

0x01 graphic

0x01 graphic

...

0x01 graphic

0x01 graphic

4) Odczytujemy z tablic rozkładu 0x01 graphic
wartość 0x01 graphic
o (r-1)(s-1) stopniach swobody dla przyjętego poziomu istotności.

5) Obszar odrzucenia ma postać 0x01 graphic
.

32



Wyszukiwarka

Podobne podstrony:
Statystyka matematyczna, Wykład 9
Statystyka matematyczna - wyklad 1, Studia materiały
Statystyka matematyczna, Wykład 4,5
Rachunek prawdopodobieństwa i statystyka matematyczna, wykład 3
Rachunek prawdopodobieństwa i statystyka matematyczna, wykład 2
Statystyka matematyczna, Wykład 12, Wykład 12 - poprawic uklad strony
x2, wykłady i notatki, statystyka matematyczna
Boratyńska A Wykłady ze statystyki matematycznej
SMiPE - Kolokwium wykład ściąga 1, STUDIA, SEMESTR IV, Statystyka matematyczna i planowanie eksperym
Wykład 3- Teoria prawdopodobieństwa i statystyki matematycznej, socjologia, statystyka
Rozklad statystyk z proby, wykłady i notatki, statystyka matematyczna
opracowanie pytań na wykład ze statystyki, STUDIA, SEMESTR IV, Statystyka matematyczna i planowanie
STATYSTYKA OPISOWA 5 WYKŁAD 25.04.2009, Statystyka opisowa i matematyczna, Statystyka opisowa i mate
Statystyka wykłady - prof. Trzpiot, Studia GWSH, Statystyka matematyczna - prof. Trzpiot
Wymagania odnośnie projektu na zaliczenie wykładu ze Statystyki matematycznej
QUIZ egzaminacyjny Statystyka matematyczna(2), sggw - finanse i rachunkowość, studia, II semestr, St
248649, wykłady i notatki, statystyka matematyczna

więcej podobnych podstron