background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

Wybrane zagadnienia z weryfikacji hipotez statystycznych 

1.  Wprowadzenie 

Badania  niewyczerpujące  (częściowe)  nie  dają  podstaw  do  formułowania  stanowczych 

(stuprocentowych)  stwierdzeń  dotyczących  obserwowanych  zmiennych  losowych.  Można 
natomiast, na podstawie 

tych badań, wysuwać pewne przypuszczenia w odniesieniu do nie-

znanej 

bliżej  klasy rozkładu  zmiennej  losowej,  jak  również  –  przy  znanym  rozkładzie  –  w 

odniesieniu  do  nieznanych  wartości  parametrów  rozkładu.  Przypuszczenia  te  nazywane  są 
hipotezami statystycznymi

. Hipotezy dotyczące parametrów nazywane są hipotezami parame-

trycznymi

natomiast hipotezy dotyczące klasy  rozkładu – a więc postaci funkcji opisującej 

rozkład  zmiennej  losowej,  ale  bez  odwoływania  się  do  liczbowych  wartości  parametrów  – 
nazywamy hipotezami nieparametrycznymi

W celu pełniejszego zrozumienia problemu rozważmy następujący przykład. 

PRZYKŁAD 1. 

(a) 

W fabryce pracuje urządzenie do produkcji pewnych detali. W celu sprawdzenia jaki procent wyro-
bów produkowanych pr

zez to urządzenie jest wadliwych, trzeba wylosować pewną liczbę detali i 

zbadać, ile z nich spełnia przyjęte normy jakości. Jeśli wylosowano n detali i spośród nich jest n

w

 

wadliwych, to stosunek n do n

w

 

jest oceną prawdopodobieństwa wyprodukowania wadliwego deta-

lu przez badane urządzenie. 

(b) 

Wyobraźmy sobie teraz, że ta sama fabryka kupuje nowe urządzenie do produkcji tych samych de-

tali i że producent zapewnia, że średnio tylko 1 na 100 (n

w

/n = 0.01) wyprodukowanych detali jest 

wadliwych

. Aby to sprawdzić losuje się np. n = 500 detali wyprodukowanych na tym urządzeniu 

bada ich jakość. Załóżmy, że n

w

 

= 20 nie spełnia norm jakości (n

w

/n = 0.05). Czy na podstawie ta-

kiego wyniku badań można by obalić zapewnienia producenta urządzenia? 

W punkcie (a) 

zadanie sprowadza się do oceny (estymacji)

I

(b)

 pewnego parametru, w punk-

ci

 

do podjęcia lub odrzucenia zapewnienia producenta, że prawdopodobieństwo wypro-

dukowania braku nie jest większe od 0.01, a więc do zweryfikowania hipotezy. 

Procedury  służące  do  sprawdzania  (weryfikowania)  owych  hipotez  noszą  nazwę  testów 

statystycznych

Postępowanie  weryfikacyjne  rozpoczyna  się  od  sformułowania  hipotezy ze-

rowej H

0

 oraz jednej lub kilku hipotez alternatywnych H

1

 

II

. Hipotez

ę zerową formułuje się w 

ten sposób, by orzekała brak różnic lub ogólniej – brak wpływu badanego czynnika doświad-

czalnego  na  obserwowany  parametr.  Jeśli  przez  Q  oznaczymy  nieznaną  wartość  badanego 
parametru

III

 

 zmiennej losowej X a przez Q

0

 

wartość tego samego parametru uzyskaną w do-

świadczeniu, to hipoteza zerowa wygląda w następujący sposób 

0

0

:

Q

Q

H

=

 

(1). 

Zapisana  w  taki  sposób  hipoteza  zerowa  jest  hipotezą  prostą.  Wysuwamy  mianowicie 

przypuszczenie, że parametr Q ma wartość Q

0

Hipoteza zerowa może być również hipotezą złożoną w postaci 

 

0

0

:

Q

Q

H

 

(2) 

albo 

                                                           

I

 Podstawowe zagadnienia z estymacji parametrów statystycznych zostały omówione w poprzednim konspek-

cie. 

II

 W niektórych podręcznikach można znaleźć oznaczenie hipotezy zerowej przez H, a hipotezy alternatywnej 

przez K

III

 Tym parametrem może być przykładowo: wartość średnia, wariancja, parametr λ w rozkładzie Poissona itp. 

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

 

0

0

:

Q

Q

H

 

 (3). 

Hipotezy alternatywne formułuje się następująco 

 

0

1

:

Q

Q

H

 

(4), 

 

0

1

:

Q

Q

H

>

 

(5), 

 

0

1

:

Q

Q

H

<

 

(6). 

Są to hipotezy złożone. Każda z nich może być alternatywną hipotezą wobec hipotezy ze-

rowej postaci (1)

. Alternatywą hipotezy zerowej (2) jest hipoteza (5), natomiast hipoteza (6) 

jest alternatywą hipotezy zerowej (3). 

Przy tak sformułowanych hipotezach zerowych i alternatywnych procedura weryfikacyjna 

przebiega według podanego poniżej schematu: 

−  Ze  populacji generalnej Z, w której określona  jest  zmienna  losowa  X,  pobiera  się 

n-

elementową próbę losową. 

−  Na podstawie zbioru realizacji X

n

 

oblicza  się  wartość  G(X

n

) statystyki

IV

− 

Na podstawie rozkładu prawdopodobieństwa statystyki G wyznacza się przedział (ob-
szar) krytyczny W

k

, taki 

że prawdopodobieństwo tego, iż wartość funkcji G(X

n

) trafi do 

obszaru krytycznego, przy założeniu, że Q = Q

0

, wynosi 

α. Co zapisuje się następująco 

  G

,  będącej 

sprawdzianem hipotezy zerowej. Statystykę G wybiera się odpowiednio do treści wery-
fikowanej hipotezy. 

 

(

)

α

=

=

0

|

)

(

P

Q

Q

W

X

G

k

n

 

(7). 

Prawdopodobieństwo α jest dowolnie małe, ale różne od zera i nazywane jest pozio-

mem  istotności  testu.  Zazwyczaj  przyjmuje  się  wartości  α  =  0.05  albo  α  =  0.01. 
W prz

ypadku hipotez zerowych złożonych typu (2) i (3) mamy 

 

(

)

α

=

0

|

)

(

P

Q

Q

W

X

G

k

n

 

(8), 

 

(

)

α

=

0

|

)

(

P

Q

Q

W

X

G

k

n

 

(9). 

− 

Jeśli uzyskana z doświadczenia wartość G(X

n

) spełnia warunek 

 

k

n

W

X

G

)

(

 

(10), 

to sprawdzaną hipotezę zerową odrzuca się na korzyść alternatywnej. Decyzja taka jest 

realizacją poglądu opartego na doświadczeniu, że zdarzenia mało prawdopodobne za-

chodzą  rzadko.  Jeśli  więc  wystąpiło  zdarzenie,  które  –  przy  założeniu  prawdziwości 
H

0

 – 

praktycznie nie powinno zajść, to kwestionujemy słuszność przyjętego założenia, 

odrzucając H

0

− 

Jeśli natomiast 

 

k

n

W

X

G

)

(

 

(11), 

to nie ma podstaw do odrzucenia weryfikowanej hipotezy zerowej. 

Weryfikując daną hipotezę statystyczną H

0

, na podstawie wyników próby losowej, pono-

simy zawsze pewne ryzyko podjęcia błędnej decyzji. Wynika to stąd, że na podstawie próbki 

                                                           

IV

 Dla przypomnienia – statystyka jest to dowolna funkcja, której dziedziną są wartości zmiennej losowej. W 

tym przypadku dziedziną funkcji G jest zbiór realizacji X

n

 uzyskany w próbie losowej. 

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

nigdy nie mamy całkowitej informacji o populacji, z której pobrana została próba. W związku 

z tym możemy więc podjąć decyzję poprawną, albo popełnić jeden z dwóch błędów: 

a) 

możemy odrzucić weryfikowaną hipotezę H

0

 

wtedy, gdy jest ona w rzeczywistości 

prawdziwa (popełniamy wtedy błąd pierwszego rodzaju), 

b)  lub 

możemy przyjąć weryfikowaną hipotezę H

0

 

jako prawdziwą, podczas gdy jest 

ona  w  rzeczywistości  fałszywa,  czyli  prawdziwa  jest  hipoteza  alternatywna  H

1

 

(popełniamy wtedy błąd drugiego rodzaju). 

Istotę tych błędów można też zilustrować za pomocą diagramu przedstawionego na rys. 1. 
 

 

Rys. 1

. Błędy popełniane przy weryfikacji hipotez statystycznych 

Prawdopodobieństwo  popełnienia  błędu  pierwszego  rodzaju  wynosi  α. Jest  ono  znane 

a priori 

(założone  z  góry)  na  etapie  tworzenia  przedziału  krytycznego  W

k

. Natomiast, aby 

określić prawdopodobieństwo popełnienia błędu drugiego rodzaju, trzeba wprowadzić dodat-

kowe założenia co do postaci hipotez alternatywnych. My nie będziemy zajmować się obli-

czeniem  tego  prawdopodobieństwa.  Należy  jedynie  wiedzieć,  że  im  mniejsze  prawdopodo-

bieństwo popełnienia błędu pierwszego rodzaju, tym większe jest prawdopodobieństwo po-

pełnienia błędu drugiego rodzaju. Gdybyśmy założyli prawdopodobieństwo popełnienia błędu 
pierw

szego  rodzaju  jako  równe  0  (tzn.  jeśli  niezależnie  od  wyników  eksperymentu  zawsze 

będziemy przyjmować hipotezę H

0

), to prawdopodobieństwo popełnienia błędu drugiego ro-

dzaju jest równe 1 (wtedy nigdy nie odrzucimy hipotezy H

0

, gdy jest fałszywa). Dla ustalone-

go poziomu istotności testu α prawdopodobieństwo popełnienia błędu drugiego rodzaju male-
je wraz ze wzrostem 

liczności próbki losowej. Oznacza to, że im większa próba losowa, tym 

częściej będziemy odrzucać hipotezę H

0

, gdy jest ona nieprawdziwa. 

2. 

Weryfikacja hipotezy dotyczącej wartości przeciętnej w rozkładzie normalnym 

Jeśli wariancja (σ

2

) obserwowanej zmiennej losowej X 

o rozkładzie normalnym nie jest 

znana, to do weryfikacji hipotez zerowych (1)  (3) 

wykorzystuje się test t-Studenta. W przy-

padku gdy wariancję σ

2

 

szacuje się za pomocą statystyki S

2

, sprawdzian hipotezy zerowej ma 

postać 

 

1

0

0

,

µ

=

ν

n

S

X

T

 

(12). 

Jeśli natomiast wariancję σ

2

 

szacuje się za pomocą statystyki S

*2

, to wówczas 

 

n

S

X

T

*

0

0

,

µ

=

ν

 

(13). 

Hipoteza zerowa H

0

 

Przyjąć 

Odrzucić 

Decyzja 

Decyzja 

Decyzja 

prawidłowa 

Błąd II rodzaju 

Błąd I rodzaju 

Decyzja 

prawidłowa 

H

0

 prawdziwa 

w rzeczywistości 

H

0

 fałszywa 

w rzeczywistości 

H

0

 prawdziwa 

w rzeczywistości 

H

0

 fałszywa 

w rzeczywistości 

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

Zmienna losowa T

ν,0

 ma roz

kład Studenta o ν = n – 1 stopniach swobody. 

Jeśli hipoteza zerowa ma postać (1) i jest weryfikowana wobec hipotezy alternatywnej (4) 

to test jest dwustronny. W takim przypadku obszar krytyczny, przedstawiony na rys. 2,  ma 
po

stać 

 

)

;

[

]

;

(

2

/

1

,

2

/

,

+∞

−∞

=

α

ν

α

ν

t

t

W

k

 

(14), 

przy czym wartości t

ν,α/2

 < 0 i t

ν,1-α/2

 > 0 

są odpowiednio: kwantylem dolnym i górnym rozkła-

du Studenta, 

a ich wartości wyznacza się w taki sposób, aby 

 

(

)

2

P

2

/

,

0

,

α

=

α

ν

ν

t

T

 

(15), 

 

(

)

2

P

2

/

1

,

0

,

α

=

α

ν

ν

t

T

 

(16). 

 

Rys. 2. Konstrukcja zbioru krytycznego (dwustronnego) testu do weryfikacji hipotezy H

0

μ = μ

0

 

przeciw hipotezie alternatywnej H

1

μ ≠ μ

0

 

dla poziomu istotności testu α 

Ponieważ |t

ν,α/2

| = t

ν,1-α/2

, zatem w przypadku testu dwustronnego mamy następujące reguły 

decyzyjne: 

− 

jeśli wartość T

ν,0

 wyliczona ze wzoru (12) albo (13) 

spełnia nierówność 

 

2

/

1

,

0

,

α

ν

ν

≥ t

T

 

(17), 

to odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej, 

− 

jeśli natomiast 

 

2

/

1

,

0

,

α

ν

ν

t

T

 

(18), 

to nie ma podstaw do odrzucenia weryfikowanej hipotezy zerowej. 

PRZYKŁAD 1. W pewnym zakładzie pracy, gdzie w sposób ciągły pracuje agregat służący do pakowania 

bentonitu w worki, p

obrano w sposób losowy 10 takich worków, a następnie zwarzono je. Uzyskano następujące 

wyniki  w kg:  1.06; 0.98; 1.01; 0.99; 1.00; 0.98; 1.03; 1.08; 0.96; 1.02. Na podstawie uzyskanych wyników 

sprawdzić, czy zadana na początku pracy wartość nominalna masy pojedynczego worka wynosi μ

0

  =  1.00 kg. 

Przy

jąć poziom istotności testu α = 0.01.  

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

Ponieważ agregat pracuje w sposób ciągły a próba losowa liczy tylko 10 worków to taką próbkę będziemy 

traktować jako małą. W związku z tym do testu będziemy używać statystyki (13). 

Stawiamy hipotezę zerową orzekającą, że agregat nadal pakuje bentonit w  worki o średniej masie równej 

1.00  kg.  Hipotezę  tą  zapisujemy  następująco:  H

0

μ  =  μ

0

.  Hipotezą  alternatywna  orzekać  będzie,  że  automat 

rozregulował  się,  czyli    H

1

μ ≠  μ

0

.  Wartość μ  szacujemy  obliczając  średnią  arytmetyczną  z wyników  próby 

losowej 

 

01

.

1

10

1

=

=

=

µ

=

i

i

X

X

Wartość statystyki S

*

 

wyliczamy w następujący sposób (patrz wzór 12 w poprzednim konspekcie) 

 

(

)

04

.

0

01

.

1

1

1

10

1

2

2

*

*

=

=

=

=

i

i

X

n

S

S

Tą samą wartość można uzyskać stosując funkcje Excela o nazwie ODCH.STANDARDOWE

Wyliczamy wartość statystyki (13) 

 

8582

.

0

10

04

.

0

00

.

1

01

.

1

*

0

0

,

=

=

µ

=

ν

n

S

X

T

Wartość  kwantylu  t

ν,1-α/2

 

liczymy  korzystając  z  funkcji  Excala  ROZKŁAD.T.ODW  o  następującej  składni: 

Prawdopodobieństwo = 

α = 0.01 (nie należy wpisywać 1 – α/2); stopnie_swobody = ν = n – 1 = 9, otrzymując 

t

ν,1-α/2

 = 3.2498. 

Ponieważ zgodnie z nierównością (18) |T

ν,0

 = 0.8582| <  t

ν,1-α/2

 = 3.2498 to nie ma podstaw do odrzucenia hi-

potezy  zerowej.  Inaczej  możemy  powiedzieć,  że  z  prawdopodobieństwem  1  –  α  agregat nadal pakuje worki 
o nominalnej masie 1.00 kg. 

Gdy hipoteza (5) 

jest  alternatywą  wobec  hipotezy  zerowej  (2), to test jest jednostronny 

(prawostronny). W takim przypadku obszar krytyczny (rys. 3

) wygląda następująco 

 

)

;

[

1

,

+∞

=

α

ν

t

W

k

 

(19), 

przy czym 

 

(

)

α

=

α

ν

ν

1

,

0

,

P

t

T

 

(20), 

gdzie t

ν,1-α/2

 > 0. 

Dla testu prawostronnego reguły decyzyjne są następujące: 

− 

jeśli wartość T

ν,0

 wyliczona ze wzoru (12) albo (13) 

spełnia nierówność 

 

α

ν

ν

1

,

0

,

t

T

 

(21), 

to odrzuca się hipotezę zerową na korzyść hipotezy alternatywnej, 

− 

jeśli natomiast 

 

α

ν

ν

<

1

,

0

,

t

T

 

(22), 

to nie ma podstaw do odrzucenia weryfikowanej hipotezy zerowej. 

Test lewostronny występuje w przypadku weryfikowaniu hipotezy zerowej (3) wobec hi-

potezy alternatywnej (6). Obszar krytyczny 

dla testu lewostronnego wygląda następująco (rys. 

4) 

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

 

]

;

(

,

α

ν

−∞

=

t

W

k

 

(23), 

przy czym 

 

(

)

α

=

α

ν

ν

,

0

,

P

t

T

 

(24), 

gdzie t

ν,α

 < 0. 

 

Rys. 3. Konstrukcja zbioru krytycznego (prawostronnego) testu do weryfikacji hipotezy H

0

μ ≤ μ

0

 

przeciw hipotezie alternatywnej H

1

μ > μ

0

 

dla poziomu istotności testu α 

 

 

Rys. 4. Konstrukcja zbioru krytycznego (lewostronnego) testu do weryfikacji hipotezy H

0

μ ≥ μ

0

 

przeciw hipotezie alternatywnej H

1

μ < μ

0

 

dla poziomu istotności testu α 

Regu

ły decyzyjne dla testu lewostronnego są analogiczne jak dla testu prawo i dwustron-

nego. Decyzje podejmuje si

ę następująco: 

−   

jeśli wartość T

ν,0

 wyliczona ze wzoru (12) albo (13) 

spełnia nierówność 

 

α

ν

ν

,

0

,

t

T

 

(25) 

background image

Konspekt nr 6 z laboratoriów „Statystyka i rachunek prawdopodobieństwa” 

to odrzuca się hipotezę zerową na korzyść hipotezy alternatywnej, 

− 

jeśli natomiast 

 

α

ν

ν

<

,

0

,

t

T

 

(26), 

to nie ma podstaw do odrzucenia weryfikowanej hipotezy zerowej. 

Aby  obliczy

ć  wartość  kwantyli  t

ν,α

  oraz  t

ν,1-α

  przy  pomocy  funkcji  Excela  o  nazwie 

ROZKŁAD.T.ODW jako argument Prawdopodobieństwo nale

ży wskazać wartość 2∙α. 

 
LITERATURA 
 
W. Krysicki, J. Bartos, W. Dysza, K. Królikowska, M. Wasilewska: Rachunek prawdopo-

dobieństwa i statystyka matematyczna w zadaniach. Wydawnictwo Naukowe PWN, Warsza-
wa 2005. 

 
A. Iwasiewicz,  A. Paszek: Statystyka z elementami statystycznych metod monitorowania 

procesów. Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków 2004. 

 
W. Kordecki: 

Rachunek  prawdopodobieństwa  i  statystyka  matematyczny. Oficyna Wy-

dawnicza GiS, Wrocław 2003. 

 
 


Document Outline