background image

2013-04-10 

Metody   probabilistyczne 

 

 

Weryfikacja hipotez statystycznych 

Hipotezy parametryczne 

Hipoteza statystyczna 

Hipoteza

  -  

każde przypuszczenie (sąd) o zbiorowości generalnej 

(populacji) wydane na podstawie próby statystycznej. 

Weryfikacja hipotezy

 

– wnioskowanie statystyczne o słuszności 

sformułowanej hipotezy. 
 

Rodzaje hipotez: 

parametryczne  
(o wartości przeciętnej, o wskaźniku struktury, o wariancji, itp.)  

nieparametryczne  
(o 

rozkładzie cechy, o niezależności cech X i Y, itp.). 

 

przy weryfikacji hipotez: 

Hipoteza zerowa (H

0

)  -  hipoteza sprawdzana. 

Hipoteza alternatywna (H

1

)  -  

hipoteza, którą jesteśmy skłonni 

przyjąć, gdy odrzucimy hipotezę zerową (H

0

). 

background image

2013-04-10 

Test statystyczny 

Test statystyczny

  -  

reguła postępowania, w wyniku której na 

podstawie wyników próby decydujemy o odrzuceniu lub przyjęciu 
hipotezy zerowej (H

0

). 

 

Rodzaje błędów w testowaniu hipotez  

Weryfikując daną hipotezę statystyczną na podstawie zaobserwowanych 

wyników próby ponosimy ryzyko podjęcia błędnej decyzji 

Sytuacja 

Decyzja przyjęcia H

0

 

Decyzja odrzucenia H

0

 

H

0

 

prawdziwa 

Decyzja prawidłowa 

1 - 

 

Decyzja błędna 

błąd I-rodzaju 

 

poziom istotności 

H

0

 

fałszywa 

Decyzja błędna 

błąd II-rodzaju 

 

Decyzja prawidłowa 

1 - 

 

moc testu 

Dobry test 

 -  

jest to prawdopodobieństwo popełnienia błędu I-rodzaju

 i 

nazywane jest poziomem istotności.  
Zwykle przyjmuje się: 

=0,05 (również używane: 0,1; 0,02; 0,01) 

 -  

jest to prawdopodobieństwo popełnienia błędu II-rodzaju

Zmniejszenie p-stwa 

 

powoduje zwiększenie p-stwa 

.  

Aby rozwiązać ten problem można najpierw zmniejszać p-stwa 

aby następnie – przez zwiększenie liczby próby n – obniżyć również 

 

do wymaganego poziomu i w ten sposób zwiększyć 

moc testu

.  

W ten sposób traci się jednak korzyści jakie niesie ze sobą metoda 
reprezentacyjna.  

Dobry test 

powinien mieć własność, że 

 

również jest bliskie 0. 

W zagadnieniach społeczno-ekonomicznych uznaje się, że 
popełnienie błędu I-rodzaju za bardziej niebezpieczne dla badań 
i dlatego określa się tylko wymagany poziom dla 

.  

Wybór liczby 

 jest w zasadzie dowolny. 

Dobry test to test, w którym  



 

background image

2013-04-10 

Rodzaje testów parametrycznych 

Testy istotności

  -  

pozwalają na odrzucenie hipotezy sprawdzanej 

z małym ryzykiem popełnienia błędu I-rodzaju lub stwierdzenia, że 
brak jest podstaw do jej odrzucenia.  
(testy, w których dla z góry ustalonego poziomu p-stwa błędu I-
rodzaju (

) poziom p-stwa 

błędu II-rodzaju (

) jest minimalny). 

 

Sprawdzian (hipotezy)  -  statystyka

, której wartość policzona na 

podstawie próby pozwala podjąć decyzję o odrzuceniu hipotezy 
zerowej (H

0

). Do budowy testu jest konieczna znajomość rozkładu 

wybranego sprawdzianu, przy założeniu prawdziwości sprawdzanej 
hipotezy H

0

, np. o parametrze populacji. 

 

Zbiór (obszar) krytyczny

  -  

zbiór wartości sprawdzianu, które 

przemawiają za odrzuceniem hipotezy zerowej (H

0

). 

Rodzaje zbiorów (obszarów) krytycznych 

 

 

Lewostronny  obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

Q

0

  

Prawostronny  obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

Q

Obustronny 

obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

 Q

0

  

background image

2013-04-10 

Parametryczne testy istotności 

Elementarnymi testami są następujące testy o wartości 

parametru:

 

 

Testowanie hipotezy o wartości przeciętnej (μ),  

Testowanie hipotezy o równości dwóch średnich, 

Testowanie hipotezy o wariancji (

σ

2

),  

Testowanie hipotezy o równości dwóch wariancji, 

Testowanie hipotezy o wskaźniku struktury (p), 

Testowanie hipotezy o równości dwóch wskaźników struktury. 

Etapy w postępowaniu testującym 

1.

Założenia o populacji generalnej, 
Określenie poziomu istotności α,

 

2.

Sformułowanie hipotezy zerowej H

0

 i alternatywnej H

1

3.

Wybór statystyki testowej (dla podjęcia decyzji związanej z H

0

), 

Obliczenie statystyki na podstawie próby, 

4.

Wyznaczenie obszaru krytycznego testu (tzn. obszaru odrzucenia), 

5.

Odczytanie wartości krytycznej statystyki. 

6.

Wnioskowanie (podjęcie decyzji).  

Brak podstaw do

odrzucenia Ho

Podjęcie decyzji

Wnioskujemy,

że Ho nie jest

prawdziwa

Wnioskujemy,

że Ho może być

prawdziwa

Odrzucić Ho

background image

2013-04-10 

Wartość p (p-value) 

α = P(Z<u

α

gdzie: u

α

 – wartość graniczna obszaru  

krytycznego 

 
Wnioskowanie: 

jeżeli p ≤ α => odrzucamy H

0

 na rzecz H

1

jeżeli p > α => brak podstaw do odrzucenia H

0

 

Wartość p - najmniejszy poziom istotności, przy którym zaobserwowana 

wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej 
H

0

 

 

 

p = P(Z<Z

n

gdzie: Z

n

 – statystyka z próby 

10 

Testowanie hipotezy o wartości przeciętnej (μ) 

1.

Założenie

Cecha ma w populacji rozkład normalny N(μ;

).

 

Założenie to można weryfikować nieparametrycznymi testami 

zgodności (np. test zgodności χ

2

). 

2.

Formułowanie hipotez:  

Hipoteza zerowa (H

0

)

 

jest hipotezą „o równości” i brzmi: 

H

0

μ μ

gdzie: 

μ

0

 

jest konkretną wartością (liczbą). 

Hipoteza alternatywna (H

1

)

 

może być sformułowana trojako 

(najczęściej w zależności od wyniku uzyskanego w próbie): 
H

1

μ 

 

μ

0

 (albo H

1

μ μ

0

 

albo też H

1

μ μ

0

)  

Wybór hipotezy alternatywnej (H

1

)

 

ma decydujące znaczenie dla 

sformułowania obszaru odrzucenia. 

3.

Konstruowanie sprawdzianu:  

Wybór sprawdzianu

 hipotezy zerowej (H

0

) zależy od liczebności 

próby n oraz od znajomości odchylenia standardowego 

 

w populacji. 

background image

2013-04-10 

11 

Rodzaje zbiorów (obszarów) krytycznych 

 

 

Lewostronny  obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

Q

0

  

Prawostronny  obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

Q

Obustronny 

obszar  odrzucenia  H

0

 

H

0

Q

0

 

H

1

 Q

0

  

12 

Testowanie hipotezy o wartości przeciętnej (μ) 

Model 1   

1.

Założenia: 
próba losowa pobrana z populacji o rozkładzie N(μ,σ)  

 jest znane  

2.

Formułowanie hipotezy: H

μ μ

0            

wobec

    

H

μ ≠ μ

0   

 

 

3.

Konstruowanie sprawdzianu:  
 
Estymator parametru 

μ: 

 

 

4.

Wartość krytyczna   u

α

U o rozkładzie N(0,1),  

 

dla której  

 

 

 

 

 

n

X

U

o

u

U

P

n

N

x

n

x

n

i

i

,

  

  

1

1

background image

2013-04-10 

13 

Testowanie hipotezy o wartości przeciętnej (μ) 

Model 2  

1.

Założenia: 

próba losowa pobrana z populacji o rozkładzie N(μ,σ), 
 

 

jest nieznane i liczność próby mała n

30  

 

2.

H

0

: µ = µ

0

          wobec   H

1

:  µ ≠ µ

 

3.

Przy estymacji wartości 

μ

 korzystamy ze statystyki t-Studenta z n-1 

stopniami swobody 
 
 

 

lub 

 
 

 

4.    

t

α

wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni 

swobody, dla której  

 

1

0

n

s

X

T

t

T

P

 

1

1

2

n

i

i

X

x

n

s

n

s

X

n

s

X

T

*

0

0

1

 

1

1

1

2

*

n

i

i

X

x

n

s

14 

Testowanie hipotezy o wartości przeciętnej (μ) 

Model 3 

1.

Założenia: 

próba losowa pobrana z populacji o rozkładzie dowolnym, 

 

jest nieznane i liczność próby duża n>30  

 

2.

Formułowanie hipotezy: H

μ μ

0            

wobec

    

H

μ ≠ μ

0   

 

 
 

       Estymator parametru 

μ: 

 
 

3.  

Standaryzując otrzymujemy statystykę U: 

 

 
 

 

4

.  

u

α

wartość krytyczna zmiennej losowej U o rozkładzie N(0,1), 

 

która P{|U|≥u

α

} = α 

n

N

x

n

x

n

i

i

,

  

  

1

1

n

s

X

U

o

background image

2013-04-10 

15 

Testowanie hipotezy o wartości przeciętnej (μ) 

4. 

Obszar jednostronny: 

lewostronny 

– hipoteza alternatywna H

1

 

ma postać H

1

:μ<μ

0

 

obszar krytyczny określa relacja:  P(U ≤ u

α

)=α  lub P(T ≤ t

α

)=α  

prawostronny 

– hipoteza alternatywna H

1

 

ma postać H

1

:μ>μ

0

 

obszar krytyczny określa relacja: P(U ≥ u

α

)=α  lub P(T ≥ t

α

)=α  

   Obszar dwustronny: 

dwustronny 

– hipoteza alternatywna H

1

 

ma postać H

1

:μ≠μ

0

 

obszar krytyczny określa relacja: P(|U| ≤ u

α

)=α  lub P(|T| ≤ t

α

)=α  

 

6. 

Wnioskowanie  

 

Jeżeli wartość sprawdzianu U lub T znajdzie się: 

w obszarze krytycznym, to H

0

 

należy odrzucić i przyjmujemy H

1

poza obszarem krytycznym, to nie ma podstaw do odrzucenia 
H

0

 

UWAGA !!!  Nigdy nie mówimy o przyjęciu hipotezy H

0

16 

Testowanie hipotezy o wartości przeciętnej (μ) 

5. 

Jak oczytać z tablic wartość krytyczną u

kryt

,  t

kryt

 

tj. granicę (granice) dla obszaru odrzucenia  

przyjmujemy poziom istotności, czyli prawdopodobieństwo 

 

popełnienia błędu I-rodzaju. 

rodzaj obszaru krytycznego określamy wstępnie na podstawie 
hipotezy alternatywnej H

1

  

 

Rozkład normalny N(0 ; 1) 

Dla obszaru lewostronnego 

odczytujemy taką wartość -u

kryt

 , dla 

której  

Dla obszaru prawostronnego 

przyjmujemy wartość odczytaną dla 

obszaru lewostronnego i bierzemy ją ze znakiem dodatnim: +u

kryt

Dla obszaru obustronnego 

odczytujemy taką wartość -u

kryt

 ,  

dla której .                            
Granicami będą wartości: ±u

kryt 

kryt

u

2

kryt

u

background image

2013-04-10 

17 

Testowanie hipotezy o wartości przeciętnej (μ) 

5. 

Jak oczytać z tablic wartość krytyczną u

kryt

,  t

kryt

 

tj. granicę (granice) dla obszaru odrzucenia  

 
Rozkład t-Studenta
  

Dla obszaru lewostronnego lub prawostronnego odczytujemy 
taką wartość -t

kryt

 

, dla której  

 

 

Dla obszaru obustronnego 

odczytujemy taką wartość t

kryt

 ,  

dla której                             
 
 
Granicami będą wartości: ±t

kryt 

2

1

kryt

n

t

T

P

kryt

n

t

T

P

1

18 

Testowanie hipotezy o wartości przeciętnej (μ) – przykład 1 

W 100 losowo wybranych gospodarstwach domowych średnia miesięczna 
opłata za energię elektryczną wyniosła 68 złotych, a odchylenie 
standardowe 14 złotych. Zweryfikuj panującą opinię, że przeciętne 
miesięczne wydatki na energię elektryczną w całej populacji (μ

0

) wynoszą 

75 złotych przyjmując poziom istotności 0,05. 

Dane:  n=100,             s=14

,  

α =0,05,   μ

0

=75,      σ≈s 

Hipotezy: H

0

:

 μ=75       H

1

:μ<75   

(obszar lewostronny) 

Sprawdzian model 3:  

 

Wartość krytyczna:  odczyt z rozkładu normalnego N(0;1)   

   

α =0,05 → 

 

u

kryt

 =-1,64 

U=-5  <  u

kryt

 =-1,64 

 

 

 

68

x

n

s

X

U

5

100

14

75

68

U

Wniosek:   
Należy odrzucić H

0

 

i przyjąć H

1

tzn. że nieznane przeciętne wydatki 
na energię w całej populacji (μ) są 
mniejsze od 75 zł. 

-1,64 

background image

2013-04-10 

10 

Dla 17 losowo wybranych pracowników firmy A otrzymano średni czas 
dojazdu 26 minut, a odchylenie standardowe 6 minut. Zweryfikuj panującą 
opinię, że przeciętny czas dojazdu w całej populacji (μ

0

) wynosi 25 minut 

przyjmując poziom istotności 0,05.  

Dane:  n=17,             s=6

,  

α =0,05,   μ

0

=25,      σ≈S 

Hipotezy: H

0

:

 μ = 25       H

1

:μ 

 

25   

(obszar obustronny) 

Sprawdzian model 2:  

 

Wartość krytyczna:  odczyt z rozkładu t-Studenta o  17-1=16  stopniach 
swobody. 

 

  

α =0,05 → 

 

t

kryt

 =

±2,1199 

-2,1199 < T=2/3 < +2,1199  
wartość sprawdzianu T nie leży w obszarze odrzucenia

 

 

 

19 

Testowanie hipotezy o wartości przeciętnej (μ) – przykład 2 

Wniosek:   
Nie ma podstaw do odrzucenia H

0

, tzn. 

że nieznany przeciętny czas dojazdu w 
całej populacji (μ) jest być może równy 
25 minut; test tego nie rozstrzyga. 

26

x

1

n

S

X

T

3

2

1

17

6

25

26

T

-2,12 

2,12 

20 

Test dla dwóch średnich  

 
Założenie:
  
 

Badamy dwie populacje generalne mające rozkłady normalne 
N(

μ

1

1

) i N(

μ

2

2

). W oparciu o wyniki dwu 

niezależnych prób

odpowiednio o liczebnościach n

1

 i n

2

, wylosowanych z tych 

populacji 

 
 
Formułowanie hipotez: 
 

należy sprawdzić hipotezę zerową „o równości”H

0

μ

1

=

μ

2

wobec  

hipotezy alternatywnej H

1

μ

1

μ

2

. (albo H

1

μ

1

 

μ

2

  

albo też H

1

μ

1

 

μ

2

background image

2013-04-10 

11 

21 

Test dla dwóch średnich  

Model 1 
Założenia:
 

Odchylenia standardowe 

1

 

2

 

tych populacji są znane. 

 
Sprawdzian (test istotności)
 

Z wyników prób wylosowanych z tych populacji obliczyć wartości 

średnich    i    , a następnie wartość statystyki według wzoru:  
 
 
 
 

Wnioskowanie: 

Statystyka ta przy założeniu prawdziwości hipotezy H

0

 

ma rozkład 

N(0,1).  

Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry 

poziomu istotności 

 

wyznaczyć taką wartość krytyczną u

, by spełniona 

była równość P{|U

 u

} = 

.  

2

2

2

1

2

1

2

1

n

n

x

x

u

1

x

2

x

22 

Test dla dwóch średnich 

Model 2 
Założenia: 

Odchylenia standardowe tych populacji są nieznane, ale jednakowe, 
tzn. zachodzi 

1

 = 

2

.  

Próby małe o liczebnościach n

1

 i n

2

 

są wylosowane niezależnie. 

Test istotności:  

z wyników obu prób obliczyć wartości średnie  
oraz wariancje s

i s

2

, a następnie wartość statystyki t według wzoru: 

 

 

 

Wnioskowanie: 

Statystyka 

ta ma przy założeniu prawdziwości hipotezy H

0

 

rozkład  

t Studenta o n

1

+n

2

-2 stopniach swobody.  

Z tablicy rozkładu t Studenta należy odczytać dla n

1

+n

2

-2 stopni 

swobody oraz dla założonego z góry poziomu istotności 

 

taką 

wartość krytyczną t

, by spełniona była równość P{|t

 t

}= 

 





2

1

2

1

2

2

2

2

1

1

2

1

1

1

2

n

n

n

n

s

n

s

n

x

x

t

1

x

2

x

background image

2013-04-10 

12 

23 

Test dla dwóch średnich 

Model 3 
Założenia:
 

rozkłady normalne lub inne, byle o skończonych wariancjach     i     , 

które są nieznane.  

Test istotności:  

na podstawie wyników dwu dużych prób (n

1

 oraz n

2

 

są rzędu co 

najmniej kilku dziesiątków) obliczyć wartość statystyki według 
wzoru:  
 
 
 

Wnioskowanie: 

Statystyka ta przy założeniu prawdziwości hipotezy H

0

 

ma rozkład 

N(0,1).  

Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry 

poziomu istotności 

 

wyznaczyć taką wartość krytyczną u

, by 

spełniona była równość P{|U

 u

} = 

.  

2

1

2
2

2

2

2

1

2

1

2

1

n

s

n

s

x

x

u

24 

Test dla dwóch średnich 

Model 4 
Założenia:
 

Wyniki obu prób można traktować jako wyniki pomiarów na tym samym 

elemencie populacji, np. wtedy gdy stanowią one pary przyporządkowanych 
sobie liczb (wynik przed i po operacji na pewnym elemencie)  

Analizujemy wówczas różnice z

i

=y

i

-x

i

.  

 

Test istotności: 

Próby małe o liczebności n – test dla średniej  
 

 

t

α

wartość  krytyczna  zmiennej  losowej  T o rozkładzie  t-Studenta dla n-1 stopni 

swobody,  dla której  P{|T

 t

} = 

.  

 

Budowanie hipotezy: 

Hipoteza zerowa:                                wobec   
lub H

0

:  x

1

 = x

2

  lub  H

0

:  x

1

 - x

= 0   wobec  H

1

: x

1

 

≠ x

2

  lub  H

1

:  x

1

 - x

2

 

≠ 0  

 

gdzie:         - 

średnia  w populacji  różnic

  

1

n

S

z

T

i

0

Z

H

0

:

0

Z

H

1

:

Z

background image

2013-04-10 

13 

25 

Test dla dwóch średnich 

Wnioskowanie: 

 

H

1

μ

 

μ

2

 

– obszar krytyczny 

dwustronny

 : |U

 u

, 

 

H

1

μ

μ

2

 

– obszar krytyczny 

lewostronny

 : U 

 u

. 

 

H

1

μ

μ

2

 

– obszar krytyczny 

prawostronny

 : U 

 u

26 

Test dla dwóch średnich - przykład 

Średnia odległość przejazdu 36 pasażerów w komunikacji tramwajowej wynosi 
3,4km, a 64 pasażerów w komunikacji autobusowej 3,8km, odchylenia 
standardowe odpowiednio s

T

=0,6, s

A

=0,4. Czy można przyjąć, że średnia 

odległość przejazdu pasażerów autobusami i tramwajami jest równa (α=0,02)? 

Dane: n

T

=36, n

A

=64, s

T

=0,6, s

A

=0,4, 

α=0,02 

Hipotezy: H

0

: μ

T

 = μ

A

         H

1

: μ

T

 

 

μ

A

 (obszar obustronny) 

Sprawdzian model 3:  

 

 

Wartość krytyczna:  odczyt z rozkładu N(0,1)   u

α

= 2,33 

 

 

 

2

2

2

1

2

1

2

1

n

S

n

S

x

x

u

Wniosek: 

Nie ma podstaw do odrzucenia hipotezy, że 

średnia odległość przejazdu pasażerów 

tramwajami jest równa średniej odległości 

przejazdu autobusami 

4

3

x

T

,

8

3

x

A

,

-2,33 

2,33 

206

,

1

 

11

,

0

4

,

0

0025

,

0

01

,

0

4

,

0

64

4

,

0

36

6

,

0

8

,

3

4

,

3

2

2

u

background image

2013-04-10 

14 

27 

Testowanie hipotezy o wskaźniku struktury (p

Założenie: Cecha ma w populacji rozkład dwupunktowy z parametrem 

p 

oznaczającym prawdopodobieństwo, że cecha przyjmie 

wyróżnioną wartość.   
Próba musi być duża  (n>100). 

 
Formułowanie hipotezy:  

Hipoteza zerowa (H

0

) 

jest hipotezą „o równości” i brzmi: H

0

p

gdzie p

0

 

jest konkretną wartością (liczbą). 

Hipoteza alternatywna (H

1

) 

może być sformułowana trojako 

(najczęściej w zależności od wyniku uzyskanego w próbie): 
H

1

 p

0

 (albo H

1

p

0

 

albo też H

1

p

0

)  

Wybór hipotezy alternatywnej (H

1

) ma decydujące znaczenie dla 

sformułowania obszaru odrzucenia. 
 

Estymator          ma graniczny rozkład normalny   

n

m

p

n

p

p

p

N

1

,

28 

Testowanie hipotezy o wskaźniku struktury (p

Sprawdzian: 

 

 

 

która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1), 
dla której P{|U|

u

}=

. 

 

Wnioskowanie:  

Jeżeli wartość sprawdzianu U znajdzie się: 

1.

w obszarze odrzucenia, to odrzucamy H

0

 i przyjmujemy H

1

2.

poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia 
H

0

n

p

p

p

n

m

U

0

0

0

1

background image

2013-04-10 

15 

29 

Testowanie hipotezy o wskaźniku struktury (p) - 

przykład 

Panuje opinia, że w 40 % osób w podróżach codziennych korzysta z 
samochodu. Zapytano 200 losowo wybranych osób. W 72 przypadkach 
otrzymano odpowiedź, że osoby te wybierają samochód. 

Zweryfikuj powszechnie panująca opinię na temat odsetka osób (p), które 
najczęściej poruszają się samochodem przyjmując poziom istotności 

=0,02. 

Dane: n=200,  m=72,         p

o

=0,4,      

α=0,02,     α/2=0,01 

Hipotezy:   

H

0

= 0,4 

H

1

 0,4 

(obszar obustronny) 

Sprawdzian: 

 

 

 

Wartość krytyczna:   
odczyt z rozkładu normalnego N(0;1)  
u

kryt

=2,33 

n

p

p

p

n

m

U

0

0

0

1

15

,

1

200

4

,

0

1

4

,

0

4

,

0

200

72

U

Wniosek:   

Nie ma podstaw  do odrzucenia  H

0

, tzn. że nieznany 

odsetek  osób w całej populacji  (p), które 
najczęściej korzystają  z samochodu  jest być może 
równy 40%; test tego  nie rozstrzyga

   

-2,33 

2,33