MP 7 hipot param 1

background image

2013-04-10

1

1

Metody probabilistyczne

Weryfikacja hipotez statystycznych

Hipotezy parametryczne

2

Hipoteza statystyczna

Hipoteza

-

każde przypuszczenie (sąd) o zbiorowości generalnej

(populacji) wydane na podstawie próby statystycznej.

Weryfikacja hipotezy

– wnioskowanie statystyczne o słuszności

sformułowanej hipotezy.

Rodzaje hipotez:

parametryczne
(o wartości przeciętnej, o wskaźniku struktury, o wariancji, itp.)

nieparametryczne
(o

rozkładzie cechy, o niezależności cech X i Y, itp.).

przy weryfikacji hipotez:

Hipoteza zerowa (H

0

) - hipoteza sprawdzana.

Hipoteza alternatywna (H

1

) -

hipoteza, którą jesteśmy skłonni

przyjąć, gdy odrzucimy hipotezę zerową (H

0

).

background image

2013-04-10

2

3

Test statystyczny

Test statystyczny

-

reguła postępowania, w wyniku której na

podstawie wyników próby decydujemy o odrzuceniu lub przyjęciu
hipotezy zerowej (H

0

).

Rodzaje błędów w testowaniu hipotez

Weryfikując daną hipotezę statystyczną na podstawie zaobserwowanych

wyników próby ponosimy ryzyko podjęcia błędnej decyzji

Sytuacja

Decyzja przyjęcia H

0

Decyzja odrzucenia H

0

H

0

prawdziwa

Decyzja prawidłowa

1 -

Decyzja błędna

błąd I-rodzaju

poziom istotności

H

0

fałszywa

Decyzja błędna

błąd II-rodzaju

Decyzja prawidłowa

1 -

moc testu

4

Dobry test

-

jest to prawdopodobieństwo popełnienia błędu I-rodzaju

i

nazywane jest poziomem istotności.
Zwykle przyjmuje się:

=0,05 (również używane: 0,1; 0,02; 0,01)

-

jest to prawdopodobieństwo popełnienia błędu II-rodzaju

.

Zmniejszenie p-stwa

powoduje zwiększenie p-stwa

.

Aby rozwiązać ten problem można najpierw zmniejszać p-stwa

,

aby następnie – przez zwiększenie liczby próby n – obniżyć również

do wymaganego poziomu i w ten sposób zwiększyć

moc testu

.

W ten sposób traci się jednak korzyści jakie niesie ze sobą metoda
reprezentacyjna.

Dobry test

powinien mieć własność, że

również jest bliskie 0.

W zagadnieniach społeczno-ekonomicznych uznaje się, że
popełnienie błędu I-rodzaju za bardziej niebezpieczne dla badań
i dlatego określa się tylko wymagany poziom dla

.

Wybór liczby

jest w zasadzie dowolny.

Dobry test to test, w którym



background image

2013-04-10

3

5

Rodzaje testów parametrycznych

Testy istotności

-

pozwalają na odrzucenie hipotezy sprawdzanej

z małym ryzykiem popełnienia błędu I-rodzaju lub stwierdzenia, że
brak jest podstaw do jej odrzucenia.
(testy, w których dla z góry ustalonego poziomu p-stwa błędu I-
rodzaju (

) poziom p-stwa

błędu II-rodzaju (

) jest minimalny).

Sprawdzian (hipotezy) - statystyka

, której wartość policzona na

podstawie próby pozwala podjąć decyzję o odrzuceniu hipotezy
zerowej (H

0

). Do budowy testu jest konieczna znajomość rozkładu

wybranego sprawdzianu, przy założeniu prawdziwości sprawdzanej
hipotezy H

0

, np. o parametrze populacji.

Zbiór (obszar) krytyczny

-

zbiór wartości sprawdzianu, które

przemawiają za odrzuceniem hipotezy zerowej (H

0

).

6

Rodzaje zbiorów (obszarów) krytycznych

Lewostronny obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q < Q

0

Prawostronny obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q > Q

0

Obustronny

obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q

Q

0

background image

2013-04-10

4

7

Parametryczne testy istotności

Elementarnymi testami są następujące testy o wartości

parametru:

Testowanie hipotezy o wartości przeciętnej (μ),

Testowanie hipotezy o równości dwóch średnich,

Testowanie hipotezy o wariancji (

σ

2

),

Testowanie hipotezy o równości dwóch wariancji,

Testowanie hipotezy o wskaźniku struktury (p),

Testowanie hipotezy o równości dwóch wskaźników struktury.

8

Etapy w postępowaniu testującym

1.

Założenia o populacji generalnej,
Określenie poziomu istotności α,

2.

Sformułowanie hipotezy zerowej H

0

i alternatywnej H

1

,

3.

Wybór statystyki testowej (dla podjęcia decyzji związanej z H

0

),

Obliczenie statystyki na podstawie próby,

4.

Wyznaczenie obszaru krytycznego testu (tzn. obszaru odrzucenia),

5.

Odczytanie wartości krytycznej statystyki.

6.

Wnioskowanie (podjęcie decyzji).

Brak podstaw do

odrzucenia Ho

Podjęcie decyzji

Wnioskujemy,

że Ho nie jest

prawdziwa

Wnioskujemy,

że Ho może być

prawdziwa

Odrzucić Ho

background image

2013-04-10

5

9

Wartość p (p-value)

α = P(Z<u

α

)

gdzie: u

α

– wartość graniczna obszaru

krytycznego


Wnioskowanie:

jeżeli p ≤ α => odrzucamy H

0

na rzecz H

1

,

jeżeli p > α => brak podstaw do odrzucenia H

0

,

Wartość p - najmniejszy poziom istotności, przy którym zaobserwowana

wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej
H

0

.

p = P(Z<Z

n

)

gdzie: Z

n

– statystyka z próby

p

10

Testowanie hipotezy o wartości przeciętnej (μ)

1.

Założenie:

Cecha ma w populacji rozkład normalny N(μ;

).

Założenie to można weryfikować nieparametrycznymi testami

zgodności (np. test zgodności χ

2

).

2.

Formułowanie hipotez:

Hipoteza zerowa (H

0

)

jest hipotezą „o równości” i brzmi:

H

0

:

μ = μ

0

gdzie:

μ

0

jest konkretną wartością (liczbą).

Hipoteza alternatywna (H

1

)

może być sformułowana trojako

(najczęściej w zależności od wyniku uzyskanego w próbie):
H

1

:

μ

μ

0

(albo H

1

:

μ < μ

0

albo też H

1

:

μ > μ

0

)

Wybór hipotezy alternatywnej (H

1

)

ma decydujące znaczenie dla

sformułowania obszaru odrzucenia.

3.

Konstruowanie sprawdzianu:

Wybór sprawdzianu

hipotezy zerowej (H

0

) zależy od liczebności

próby n oraz od znajomości odchylenia standardowego

w populacji.

background image

2013-04-10

6

11

Rodzaje zbiorów (obszarów) krytycznych

Lewostronny obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q < Q

0

Prawostronny obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q > Q

0

Obustronny

obszar odrzucenia H

0

H

0

: Q = Q

0

H

1

: Q

Q

0

12

Testowanie hipotezy o wartości przeciętnej (μ)

Model 1

1.

Założenia:
próba losowa pobrana z populacji o rozkładzie N(μ,σ)

jest znane

2.

Formułowanie hipotezy: H

0

:

μ = μ

0

wobec

H

1

:

μ μ

0

3.

Konstruowanie sprawdzianu:

Estymator parametru

μ:

4.

Wartość krytyczna u

α

-

U o rozkładzie N(0,1),

dla której

n

X

U

o

u

U

P

n

N

x

n

x

n

i

i

,

1

1

background image

2013-04-10

7

13

Testowanie hipotezy o wartości przeciętnej (μ)

Model 2

1.

Założenia:

próba losowa pobrana z populacji o rozkładzie N(μ,σ),

jest nieznane i liczność próby mała n

30

2.

H

0

: µ = µ

0

wobec H

1

: µ ≠ µ

0

3.

Przy estymacji wartości

μ

korzystamy ze statystyki t-Studenta z n-1

stopniami swobody

lub


4.

t

α

-

wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni

swobody, dla której

1

0

n

s

X

T

t

T

P

1

1

2

n

i

i

X

x

n

s

n

s

X

n

s

X

T

*

0

0

1

1

1

1

2

*

n

i

i

X

x

n

s

14

Testowanie hipotezy o wartości przeciętnej (μ)

Model 3

1.

Założenia:

próba losowa pobrana z populacji o rozkładzie dowolnym,

jest nieznane i liczność próby duża n>30

2.

Formułowanie hipotezy: H

0

:

μ = μ

0

wobec

H

1

:

μ μ

0


Estymator parametru

μ:


3.

Standaryzując otrzymujemy statystykę U:


4

.

u

α

-

wartość krytyczna zmiennej losowej U o rozkładzie N(0,1),

która P{|U|≥u

α

} = α

n

N

x

n

x

n

i

i

,

1

1

n

s

X

U

o

background image

2013-04-10

8

15

Testowanie hipotezy o wartości przeciętnej (μ)

4.

Obszar jednostronny:

lewostronny

hipoteza alternatywna H

1

ma postać H

1

:μ<μ

0

obszar krytyczny określa relacja: P(U ≤ u

α

)=α lub P(T ≤ t

α

)=α

prawostronny

hipoteza alternatywna H

1

ma postać H

1

:μ>μ

0

obszar krytyczny określa relacja: P(U ≥ u

α

)=α lub P(T ≥ t

α

)=α

Obszar dwustronny:

dwustronny

hipoteza alternatywna H

1

ma postać H

1

:μ≠μ

0

obszar krytyczny określa relacja: P(|U| ≤ u

α

)=α lub P(|T| ≤ t

α

)=α

6.

Wnioskowanie

Jeżeli wartość sprawdzianu U lub T znajdzie się:

w obszarze krytycznym, to H

0

należy odrzucić i przyjmujemy H

1

.

poza obszarem krytycznym, to nie ma podstaw do odrzucenia
H

0

.

UWAGA !!! Nigdy nie mówimy o przyjęciu hipotezy H

0

.

16

Testowanie hipotezy o wartości przeciętnej (μ)

5.

Jak oczytać z tablic wartość krytyczną u

kryt

, t

kryt

,

tj. granicę (granice) dla obszaru odrzucenia

przyjmujemy poziom istotności, czyli prawdopodobieństwo

popełnienia błędu I-rodzaju.

rodzaj obszaru krytycznego określamy wstępnie na podstawie
hipotezy alternatywnej H

1

Rozkład normalny N(0 ; 1)

Dla obszaru lewostronnego

odczytujemy taką wartość -u

kryt

, dla

której

Dla obszaru prawostronnego

przyjmujemy wartość odczytaną dla

obszaru lewostronnego i bierzemy ją ze znakiem dodatnim: +u

kryt

.

Dla obszaru obustronnego

odczytujemy taką wartość -u

kryt

,

dla której .
Granicami będą wartości: ±u

kryt

kryt

u

2

kryt

u

background image

2013-04-10

9

17

Testowanie hipotezy o wartości przeciętnej (μ)

5.

Jak oczytać z tablic wartość krytyczną u

kryt

, t

kryt

,

tj. granicę (granice) dla obszaru odrzucenia


Rozkład t-Studenta

Dla obszaru lewostronnego lub prawostronnego odczytujemy
taką wartość -t

kryt

, dla której

Dla obszaru obustronnego

odczytujemy taką wartość t

kryt

,

dla której


Granicami będą wartości: ±t

kryt

2

1

kryt

n

t

T

P

kryt

n

t

T

P

1

18

Testowanie hipotezy o wartości przeciętnej (μ) – przykład 1

W 100 losowo wybranych gospodarstwach domowych średnia miesięczna
opłata za energię elektryczną wyniosła 68 złotych, a odchylenie
standardowe 14 złotych. Zweryfikuj panującą opinię, że przeciętne
miesięczne wydatki na energię elektryczną w całej populacji (μ

0

) wynoszą

75 złotych przyjmując poziom istotności 0,05.

Dane: n=100, s=14

,

α =0,05, μ

0

=75, σ≈s

Hipotezy: H

0

:

μ=75 H

1

:μ<75

(obszar lewostronny)

Sprawdzian model 3:

Wartość krytyczna: odczyt z rozkładu normalnego N(0;1)

α =0,05 →

u

kryt

=-1,64

U=-5 < u

kryt

=-1,64

68

x

n

s

X

U

5

100

14

75

68

U

Wniosek:
Należy odrzucić H

0

i przyjąć H

1

,

tzn. że nieznane przeciętne wydatki
na energię w całej populacji (μ) są
mniejsze od 75 zł.

-1,64

background image

2013-04-10

10

Dla 17 losowo wybranych pracowników firmy A otrzymano średni czas
dojazdu 26 minut, a odchylenie standardowe 6 minut. Zweryfikuj panującą
opinię, że przeciętny czas dojazdu w całej populacji (μ

0

) wynosi 25 minut

przyjmując poziom istotności 0,05.

Dane: n=17, s=6

,

α =0,05, μ

0

=25, σ≈S

Hipotezy: H

0

:

μ = 25 H

1

25

(obszar obustronny)

Sprawdzian model 2:

Wartość krytyczna: odczyt z rozkładu t-Studenta o 17-1=16 stopniach
swobody.

α =0,05 →

t

kryt

=

±2,1199

-2,1199 < T=2/3 < +2,1199
wartość sprawdzianu T nie leży w obszarze odrzucenia

19

Testowanie hipotezy o wartości przeciętnej (μ) – przykład 2

Wniosek:
Nie ma podstaw do odrzucenia H

0

, tzn.

że nieznany przeciętny czas dojazdu w
całej populacji (μ) jest być może równy
25 minut; test tego nie rozstrzyga.

26

x

1

n

S

X

T

3

2

1

17

6

25

26

T

-2,12

2,12

20

Test dla dwóch średnich


Założenie:

Badamy dwie populacje generalne mające rozkłady normalne
N(

μ

1

,

1

) i N(

μ

2

,

2

). W oparciu o wyniki dwu

niezależnych prób,

odpowiednio o liczebnościach n

1

i n

2

, wylosowanych z tych

populacji



Formułowanie hipotez:

należy sprawdzić hipotezę zerową „o równości”: H

0

:

μ

1

=

μ

2

,

wobec

hipotezy alternatywnej H

1

:

μ

1

μ

2

. (albo H

1

:

μ

1

<

μ

2

albo też H

1

:

μ

1

>

μ

2

)

background image

2013-04-10

11

21

Test dla dwóch średnich

Model 1
Założenia:

Odchylenia standardowe

1

i

2

tych populacji są znane.


Sprawdzian (test istotności)

Z wyników prób wylosowanych z tych populacji obliczyć wartości

średnich i , a następnie wartość statystyki U według wzoru:



Wnioskowanie:

Statystyka ta przy założeniu prawdziwości hipotezy H

0

ma rozkład

N(0,1).

Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry

poziomu istotności

wyznaczyć taką wartość krytyczną u

, by spełniona

była równość P{|U|

u

} =

.

2

2

2

1

2

1

2

1

n

n

x

x

u

1

x

2

x

22

Test dla dwóch średnich

Model 2
Założenia:

Odchylenia standardowe tych populacji są nieznane, ale jednakowe,
tzn. zachodzi

1

=

2

.

Próby małe o liczebnościach n

1

i n

2

są wylosowane niezależnie.

Test istotności:

z wyników obu prób obliczyć wartości średnie
oraz wariancje s

1

i s

2

, a następnie wartość statystyki t według wzoru:

Wnioskowanie:

Statystyka

ta ma przy założeniu prawdziwości hipotezy H

0

rozkład

t Studenta o n

1

+n

2

-2 stopniach swobody.

Z tablicy rozkładu t Studenta należy odczytać dla n

1

+n

2

-2 stopni

swobody oraz dla założonego z góry poziomu istotności

taką

wartość krytyczną t

, by spełniona była równość P{|t|

t

}=





2

1

2

1

2

2

2

2

1

1

2

1

1

1

2

n

n

n

n

s

n

s

n

x

x

t

1

x

2

x

background image

2013-04-10

12

23

Test dla dwóch średnich

Model 3
Założenia:

rozkłady normalne lub inne, byle o skończonych wariancjach i ,

które są nieznane.

Test istotności:

na podstawie wyników dwu dużych prób (n

1

oraz n

2

są rzędu co

najmniej kilku dziesiątków) obliczyć wartość statystyki U według
wzoru:


Wnioskowanie:

Statystyka ta przy założeniu prawdziwości hipotezy H

0

ma rozkład

N(0,1).

Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry

poziomu istotności

wyznaczyć taką wartość krytyczną u

, by

spełniona była równość P{|U|

u

} =

.

2

1

2
2

2

2

2

1

2

1

2

1

n

s

n

s

x

x

u

24

Test dla dwóch średnich

Model 4
Założenia:

Wyniki obu prób można traktować jako wyniki pomiarów na tym samym

elemencie populacji, np. wtedy gdy stanowią one pary przyporządkowanych
sobie liczb (wynik przed i po operacji na pewnym elemencie)

Analizujemy wówczas różnice z

i

=y

i

-x

i

.

Test istotności:

Próby małe o liczebności n – test dla średniej

t

α

-

wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni

swobody, dla której P{|T|

t

} =

.

Budowanie hipotezy:

Hipoteza zerowa: wobec
lub H

0

: x

1

= x

2

lub H

0

: x

1

- x

2

= 0 wobec H

1

: x

1

≠ x

2

lub H

1

: x

1

- x

2

≠ 0

gdzie: -

średnia w populacji różnic

1

n

S

z

T

i

0

Z

H

0

:

0

Z

H

1

:

Z

background image

2013-04-10

13

25

Test dla dwóch średnich

Wnioskowanie:

H

1

:

μ

1

μ

2

– obszar krytyczny

dwustronny

: |U|

u

,

H

1

:

μ

1

<

μ

2

– obszar krytyczny

lewostronny

: U

u

.

H

1

:

μ

1

>

μ

2

– obszar krytyczny

prawostronny

: U

u

.

26

Test dla dwóch średnich - przykład

Średnia odległość przejazdu 36 pasażerów w komunikacji tramwajowej wynosi
3,4km, a 64 pasażerów w komunikacji autobusowej 3,8km, odchylenia
standardowe odpowiednio s

T

=0,6, s

A

=0,4. Czy można przyjąć, że średnia

odległość przejazdu pasażerów autobusami i tramwajami jest równa (α=0,02)?

Dane: n

T

=36, n

A

=64, s

T

=0,6, s

A

=0,4,

α=0,02

Hipotezy: H

0

: μ

T

= μ

A

H

1

: μ

T

μ

A

(obszar obustronny)

Sprawdzian model 3:

Wartość krytyczna: odczyt z rozkładu N(0,1) u

α

= 2,33

2

2

2

1

2

1

2

1

n

S

n

S

x

x

u

Wniosek:

Nie ma podstaw do odrzucenia hipotezy, że

średnia odległość przejazdu pasażerów

tramwajami jest równa średniej odległości

przejazdu autobusami

4

3

x

T

,

8

3

x

A

,

-2,33

2,33

206

,

1

11

,

0

4

,

0

0025

,

0

01

,

0

4

,

0

64

4

,

0

36

6

,

0

8

,

3

4

,

3

2

2

u

background image

2013-04-10

14

27

Testowanie hipotezy o wskaźniku struktury (p)

Założenie: Cecha ma w populacji rozkład dwupunktowy z parametrem

p

oznaczającym prawdopodobieństwo, że cecha przyjmie

wyróżnioną wartość.
Próba musi być duża (n>100).


Formułowanie hipotezy:

Hipoteza zerowa (H

0

)

jest hipotezą „o równości” i brzmi: H

0

: p = p

0

gdzie p

0

jest konkretną wartością (liczbą).

Hipoteza alternatywna (H

1

)

może być sformułowana trojako

(najczęściej w zależności od wyniku uzyskanego w próbie):
H

1

: p

p

0

(albo H

1

: p < p

0

albo też H

1

: p > p

0

)

Wybór hipotezy alternatywnej (H

1

) ma decydujące znaczenie dla

sformułowania obszaru odrzucenia.

Estymator ma graniczny rozkład normalny

n

m

p

n

p

p

p

N

1

,

28

Testowanie hipotezy o wskaźniku struktury (p)

Sprawdzian:

która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1),
dla której P{|U|

u

}=

.

Wnioskowanie:

Jeżeli wartość sprawdzianu U znajdzie się:

1.

w obszarze odrzucenia, to odrzucamy H

0

i przyjmujemy H

1

.

2.

poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia
H

0

.

n

p

p

p

n

m

U

0

0

0

1

background image

2013-04-10

15

29

Testowanie hipotezy o wskaźniku struktury (p) -

przykład

Panuje opinia, że w 40 % osób w podróżach codziennych korzysta z
samochodu. Zapytano 200 losowo wybranych osób. W 72 przypadkach
otrzymano odpowiedź, że osoby te wybierają samochód.

Zweryfikuj powszechnie panująca opinię na temat odsetka osób (p), które
najczęściej poruszają się samochodem przyjmując poziom istotności

=0,02.

Dane: n=200, m=72, p

o

=0,4,

α=0,02, α/2=0,01

Hipotezy:

H

0

: p = 0,4

H

1

: p

0,4

(obszar obustronny)

Sprawdzian:

Wartość krytyczna:
odczyt z rozkładu normalnego N(0;1)
u

kryt

=2,33

n

p

p

p

n

m

U

0

0

0

1

15

,

1

200

4

,

0

1

4

,

0

4

,

0

200

72

U

Wniosek:

Nie ma podstaw do odrzucenia H

0

, tzn. że nieznany

odsetek osób w całej populacji (p), które
najczęściej korzystają z samochodu jest być może
równy 40%; test tego nie rozstrzyga

-2,33

2,33


Wyszukiwarka

Podobne podstrony:
MP 8 hipot nieparam 2
MP 7 hipot parametryczne 2
MP 8 hipot nieparam 1
MP 8 hipot nieparam 2
MP W 06N
MP W 04N
R 4 2b mp
MP W 07N dodatek
R 4 1 mp
MP 6
MP 5
MP 1987 029 0228 id 318265 Nieznany

więcej podobnych podstron