Statystyka SUM w4

background image

Statystyka II-4

1

Testowanie hipotez statystycznych

(1)

• Drugim (obok teorii estymacji) ważnym działem

wnioskowania statystycznego jest testowanie hipotez

statystycznych, obejmu-jące zasady i metody

sprawdzania określonych przypuszczeń (założeń),

dotyczących parametrów lub postaci rozkładu cech

statystycznych populacji generalnej na podstawie

wyników z próby. Hipotezą statystyczną nazywamy każdy

sąd o zbiorowości generalnej, wydany bez

przeprowadzenia badania całkowitego. Prawdziwość

hipotezy statystycznej orzeka się na podstawie próby

losowej.

• Hipotezy mogą być parametryczne, gdy dotyczą wartości

odpowiednich parametrów statystycznych populacji

generalnej, takich jak wartość przeciętna, wariancja czy

wskaźnik struktury, lub nieparametryczne, gdy dotyczą

np. postaci rozkładu cechy statystycznej, współzależności

cech lub losowości próby.

background image

Statystyka II-4

2

Testowanie hipotez statystycznych

(2)

Hipotezą zerową H

0

nazywamy hipotezę sprawdzaną

(testowaną, weryfikowaną).

Hipotezą alternatywną H

1

nazywamy hipotezę, którą

jesteśmy skłonni przyjąć, gdy odrzucamy hipotezę H

0

.

Test statystyczny jest to reguła postępowania, która

przyporządkowuje wynikom próby losowej decyzję

przyjęcia lub odrzucenia hipotezy H

0

.

Bląd I rodzaju polega na odrzuceniu hipotezy H

0

, mimo że

jest ona prawdziwa.

Poziomem istotności  nazywamy prawdopodobieństwo

popełnienia błędu I rodzaju. Wartości  są bliskie zera i na

ogół są równe 0,01; 0,02; 0,05; 0,1.

Bląd II rodzaju polega na przyjęciu hipotezy H

0

, gdy jest

ona fałszywa. Prawdopodobieństwo popełnienia tego błędu

oznacza się przez . Dobry test statystyczny powinien mieć

tę własność, że  również powinno być bliskie zera.

background image

Statystyka II-4

3

Testowanie hipotez statystycznych

(3)

• W statystycznej kontroli jakości (SKJ)  określane jest

często jako ryzyko producenta,  zaś jako ryzyko odbiorcy.

Wartości  i  są wzajemnie powiązane i zmniejszanie jednej

z nich powoduje zwiększenie drugiej.

• Pewnym kompromisem są tzw. testy istotności, które dla

zadanego z góry poziomu istotności  zapewniają możliwie

najmniejszą wartość prawdopodobieństwa .

Sprawdzianem hipotezy nazywamy taką statystykę T (o

znanym rozkładzie), której wartość t

e

, policzona na

podstawie próby losowej, pozwala na podjecie decyzji, czy
odrzucić hipotezę H

0

. Dla hipotez parametrycznych

sprawdzianami są estymatory odpowiednich parametrów,
natomiast dla hipotez nieparametrycznych rolę
sprawdzianów pełnią mierniki rozbieżności między
rozkładem empirycznym a teoretycznym, sformułowanym w
hipotezie H

0

.

background image

Statystyka II-4

4

Testowanie hipotez statystycznych

(4)

Ilustracja graficzna wielkości  i 

background image

Statystyka II-4

5

Testowanie hipotez statystycznych

(5)

Zbiorem krytycznym Z nazywamy zbiór tych

wartości sprawdzianu hipotezy, które przemawiają
za odrzuceniem hipotezy H

0

.

• Zbiór Z może być w zależności od postaci hipotezy

alternatywnej zbiorem jednostronnym
(prawostronnym lub lewostronnym) albo zbiorem
dwustronnym.
Mówimy wtedy również, że test
statystyczny jest jednostronny (prawostronny,
lewostronny) lub dwustronny. Rozkład sprawdzianu
hipotezy określa, z jakich tablic należy odczytać
wartość krytyczną t

wyznaczającą zbiór Z, a zatem

zbiór Z zależy również od liczebności próby n, od
tego, czy znamy parametry (m lub

) w zbiorowości

generalnej oraz od poziomu istotności .

background image

Statystyka II-4

6

Testowanie hipotezy o wartości

przeciętnej (1)

Konstrukcję testu statystycznego omówimy na

przykła-dzie. Zakłada się, że długość życia opon ma

rozkład

N(m,

). Producent twierdzi, że wartość przeciętna tej

charakterystyki jest równa 50 tys. km. Na podstawie

100 losowo wybranych opon otrzymano = 45 tys.

km i

s = 8 tys. km. Czy na poziomie istotności =0,05

można uważać, że producent ma rację?

1

o

Sformułowanie hipotezy H

0

i H

1

W testach istotności hipoteza H

0

jest hipotezą „o

równoś-ci”. Hipoteza alternatywna H

1

może być

prostym zaprzeczeniem H

0

albo hipotezą „o

większości” lub „o mniejszości”. W tym przypadku:

H

0

: m = 50

H

1

: m

50

W testach istotności wartość  jest z góry zadana

x

background image

Statystyka II-4

7

Testowanie hipotezy o wartości

przeciętnej (2)

2

o

Zakładając, że długość życia opon ma rozkład

N(m,

) wybór sprawdzianu hipotezy zależy od

liczebności próby n oraz od tego, czy parametr

w zbiorowości generalnej jest znany: jeśli

jest znane i n30 lub

jest znane i n>30 lub

jest nieznane i n>30, ale wówczas

S

to sprawdzianem hipotezy H

0

jest statystyka:

o rozkładzie N(0,1).

• Gdy

jest nieznane i n 30, to sprawdzianem

hipotezy jest

o rozkładzie Studenta z (n-1) st.swobody

n

m

X

T

1

1

n

S

m

X

T

n

T

e

=(45-

50)/8·100=-6,25

background image

Statystyka II-4

8

Testowanie hipotezy o wartości

przeciętnej (3)

3

o

Wyznaczanie zbioru krytycznego

Wartość krytyczną t

odczytujemy w danym przykładzie

z tablic funkcji (t) w ten sposób, że przy zbiorze

dwustron-nym (t

)=(1- )/2, a przy jednostronnym

(t

)=1/2- . Jeżeli relacja wyznaczająca zbiór

krytyczny jest spełniona, czyli wartość t

wpada w zbiór

krytyczny, to hipotezę H

0

należy odrzucić. W

przeciwnym przypadku nie ma podstaw do odrzucenia
H

0

. W przypadku przyjęcia sprawdzianu hipotezy T

n-1

wartość krytyczną t

odczytujemy z tablic rozkładu

Studenta dla n-1 stopni swobody i: a)P(t

)=  przy

zbiorze jednostronnym;
b) P(t

)= 2 przy zbiorach dwustronnych. W

przykładzie H

1

: m

50, więc zbiór krytyczny jest

dwustronny.

background image

Statystyka II-4

9

Testowanie hipotezy o wartości

przeciętnej (4)

Zbiory krytyczne w
zależności od postaci
hipotezy
alternatywnej

background image

Statystyka II-4

10

Testowanie hipotez

parametrycznych

• W przypadku testowania hipotezy H

0

: m = m

0

wobec hipotezy

alternatyw-nej postaci H

1

: m

m

0

można podejmować decyzję o

odrzuceniu (lub nie) H

0

na podstawie przedziału ufności

wyznaczonego dla parametru m na poziomie ufności l-.
Jeśli wartość m

0

wpada do przedziału ufności, to nie ma podstaw do

odrzucenia H

0

; jeśli nie, to H

0

należy odrzucić, ponieważ zbiór leżący

poza przedziałem ufności jest zbiorem krytycznym.

• Korzystając z gotowych pakietów statystycznych, takich jak np.

„Statgra-phics", otrzymujemy wśród wyników, na wydrukach,

wartość określaną jako „P-value". Wartość ta jest równa

prawdopodobieństwu zajścia odpowiednich zdarzeń: a) P

V

= P(T>t

e

)

przy testach dwustronnych,

b) P

V

= P(T>t

e

) przy testach prawostronnych, c) P

v

=P(T< -t

e

) przy

testach lewostronnych, gdzie T — oznacza sprawdzian hipotezy, t

e

wartość sprawdzianu T policzoną na podstawie wyników z próby.

Jeśli wartość obliczonego prawdopodobieństwa P jest nie większa od

zadanego poziomu istotności  (P

v

 ), to hipotezę H

0

należy

odrzucić na korzyść odpowiedniej hipotezy alternatywnej. W

przeciwnym wypadku, gdy

P

v

> , nie ma podstaw do odrzucenia H

0

.

background image

Podsumowanie przykładu

• W rozpatrywanym przykładzie H

1

: m ≠ 50, więc

zbiór krytyczny jest dwustronny. Sprawdzianem
hipotezy jest

(t

) = (1 – 0,05)/2 = 0,95/2 = 0,475

stąd t

= 1,95

• W przykładzie wyznaczyliśmy wartość t

e

= -6,25.

Wynika stąd, że t

e

wpada w zbiór krytyczny, należy

zatem odrzucić hipotezę H

0

i w konsekwencji

przyjąć hipotezę alternatywną H

1

. Zatem producent

opon nie ma racji twierdząc, że przeciętna długość
życia opon wynosi 50 tys. km.

Statystyka II-4

11

background image

Podsumowanie

• W przypadku testowania hipotezy H

0

: m ≠

m

0

można podejmować decyzję o

odrzuceniu (lub nie) H

0

na podstawie

przedziału ufności wyznaczonego dla
parametru m na poziomie ufności 1 - . Jeśli

wartość m

0

wpada do przedziału ufności, to

nie ma podstaw do odrzucenia H

0

; jeśli nie,

to H

0

należy odrzucić, ponieważ zbiór

leżący poza przedziałem ufności jest
zbiorem krytycznym.

Statystyka II-4

12

background image

P-value

• Korzystając z gotowych pakietów statystycznych, np. pakietu

„Statistica”, na wydrukach wyników otrzymujemy wartość
określaną jako „P-value”. Wartość ta jest równa
prawdopodobieństwu zajścia odpowiednich zdarzeń:

a) P

v

= P(|T| > t

e

) przy testach dwustronnych,

b) P

v

= P(T > t

e

) przy testach prawostronnych,

c) P

v

= P(T < -t

e

) przy testach lewostronnych,

gdzie T – oznacza sprawdzian hipotezy, t

e

–wartość

sprawdzianu T policzoną na podstawie wyników z próby.
Jeśli wartość obliczonego prawdopodobieństwa P jest nie
większa od zadanego poziomu istotności  (P

v

), to

hipotezę H

0

należy odrzucić na korzyść odpowiedniej hipotezy

alternatywnej. W przeciwnym przypadku, gdy P

v

> , nie ma

podstaw do odrzucenia H

0

.

Statystyka II-4

13

background image

Testowanie hipotezy o

równości dwóch wartości

przeciętnych

• Dane są dwie zbiorowości generalne o

rozkładach normalnych N(m

1

, 

1

) i N(m

2

,

2

). Chcemy zweryfikować hipotezę H

0

: m

1

= m

2

wobec hipotezy H

1

: m

1

m

2

(lub H

1

:

m

1

< m

2

albo H

1

: m

1

> m

2

). Niech n

1

, n

2

oznaczają wielkości prób prostych,
wylosowanych z każdej zbiorowości , a
oraz oznaczają odpowiednio
średnie arytmetyczne i wariancje z prób.

Statystyka II-4

14

2

1

, X

X

2

)

2

(

2

)

1

(

S

i

S

background image

Testowanie hipotezy o

równości dwóch wartości

przeciętnych (2)

• W zależności od założeń

dotyczących zbiorowości
generalnych oraz od liczebności
prób, sprawdzian hipotezy H

0

ma

różną postać i jest związany z
rozkładem normalnym lub
rozkładem Studenta.

Statystyka II-4

15

background image

Testowanie hipotezy o

równości dwóch wartości

przeciętnych (3)

• Jeżeli

1

,

2

znane i n

1

≤ 30, n

2

≤ 30 lub

1

,

2

znane i n

1

> 30, n

2

> 30 lub

1

,

2

nieznane i n

1

> 30, n

2

> 30 i

przyjmujemy, że

, to

sprawdzian hipotezy ma postać:

Statystyka II-4

16

2

)

2

(

2

1

2

)

1

(

2

1

,

S

S

2

2

2

1

2

1

2

1

n

n

X

X

T

Rozkład statystyki przy
założeniu prawdziwości
H

0

, jest N(0, 1).

background image

Statystyka II-4

17

Hipotezy nieparametryczne (1)

• Nieparametryczne testy istotności dzielimy na trzy zasadnicze

grupy: testy zgodności, testy niezależności oraz testy

losowości próby. Testy nieparametryczne, w przeciwieństwie

do testów parametrycznych, mają tę zaletę, że nie wymagają

założeń w odniesieniu do postaci rozkładu cechy w zbiorowości

generalnej.

• Do najczęściej stosowanych testów nieparametrycznych należy

test zgodności chi-kwadrat (

2

). Test zgodności 

2

służy do

weryfikowania hipotezy, że obserwowana cecha X w

zbiorowości generalnej ma określony typ rozkładu, np.

dwumianowy, Poissona, normalny itd. Poniżej podajemy kilka

sposobów formułowania takiej hipotezy:
a. H

0

: cecha X ma rozkład określony dystrybuantą F(x) = F

0

(x).

b. H

0

: cecha X ma rozkład N(m,

).

c. H

0

: cecha X ma rozkład N (100, 5).

d. H

0

: cecha X ma rozkład Poissona.

e. H

0

: cecha X ma rozkład Poissona z parametrem m = 2.

background image

Statystyka II-4

18

Hipotezy nieparametryczne (2)

• W celu jednoznacznego określenia rozkładu teoretycznego

(hipote-tycznego) w danej ich klasie niejednokrotnie należy
najpierw na pod-stawie próby oszacować odpowiednie
parametry. Dla zweryfikowania hipotezy przedstawionej w b)
należy oszacować m i

w d) parametr m; w c) i e) parametry

są podane. W omawianych przykładach hipoteza
alternatywna jest prostym zaprzeczeniem hipotezy zerowej.
Test zgodności

2

można stosować, jeśli:

1° dane pochodzą z dużej n-elementowej próby wylosowanej
w sposób niezależny,
2° dane są przedstawione w postaci szeregu rozdzielczego o
r przedziałach klasowych, o liczebnościach przedziałów n

1

,

n

2

,..., n

r

spełniających warunek n

1

+ n

2

+...+ n

r

= n. Na ogół

przyjmuje się, że n

j

 5, j = l, 2,..., r,

3° rozkład hipotetyczny (sprecyzowany w H

0

) może być

zarówno rozkładem typu ciągłego, jak i skokowego.

background image

Statystyka II-4

19

Hipotezy nieparametryczne (2)

• Sprawdzianem hipotezy H

0

jest statystyka

• Statystyka ta ma, przy założeniu prawdziwości hipotezy H

0

,

rozkład 

2

o k = (r-s-1) stopniach swobody, przy czym s oznacza

liczbę parametrów, które należy wstępnie wyznaczyć na podstawie

próby; r — liczbę przedziałów klasowych.

• We wzorze (*) p

i

oznacza prawdopodobieństwo, że cecha X

przyjmuje wartość należącą do i-tego przedziału klasowego (gdy

rozkład cechy jest zgodny z H

0

), np

i

, zaś oznacza liczbę jednostek,

które powinny znaleźć się w i-tym przedziale, przy założeniu, że

cecha ma rozkład zgodny z hipotetycznym. Określa się je jako

liczebności teoretyczne. Wartość empiryczną statystyki (*)

oznaczamy przez 

e2

. Statystyka 

2

jest miarą rozbieżności między

rozkładem empirycznym a teoretycznym, a zatem zbyt duże

wartości 

2

powodują odrzucenie H

0

. Z tego względu relacja

wyznaczająca zbiór krytyczny ma postać

gdzie 

2

oznacza wartość krytyczną odczytaną z tablic.

(*)

1

2

r

i

i

i

i

np

np

n

2

2

P

background image

Statystyka II-4

20

Test zgodności -Kołmogorowa (1)

• Test służy do weryfikowania hipotezy, że cecha X

ma w zbiorowości generalnej określony rozkład
typu ciągłego; najczęsciej jest to rozkład
normalny. Warunki dotyczące danych z próby są
takie same, jak w teście 

2

. Hipotezy H

0

i H

1

formułuje się następująco:
H

0

: F(x) = F

0

(x)

H

1

: F(x)  F

0

(x)

Sprawdzian hipotezy ma postać:

F(x) oznacza dystrybuantę hipotetyczną
(teoretyczną), a F*(x) – dystrybuantę empiryczną

)

(

*

)

(

sup

x

F

x

F

D

D

n

x

n

n

background image

Statystyka II-4

21

Test zgodności -Kołmogorowa (1)

• Wartość dystrybuanty empirycznej dla danego x

oblicza się z zależności: F*(x)=n

isk

/n, w której n

isk

jest skumulowaną liczebnością, odpowiadającą
wartościom cechy nie większym od x.

• Statystyka  przy założeniu prawdziwości H

0

ma

asymptotyczny rozkład - Kołmogorowa. Z uwagi

na fakt, iż D

n

mierzy rozbieżność między

dystrybuantą teoretyczną i empiryczną, zbiór
krytyczny będą tworzyły tylko zbyt duże wartości
, tak więc będzie to zbiór prawostronny

określony równością:

odczytuje się z tablic, przy czym Q(

) =

P


Document Outline


Wyszukiwarka

Podobne podstrony:
Statystyka SUM w4
zestaw zadań statystyka SUM GiG (1)
Statystyka SUM w1
Statystyka SUM w2
zestaw zadań statystyka SUM GiG
ściąga statystyka, MEDYCYNA - ŚUM Katowice, I ROK, Biofizyka
Przykładowe pytania ze statystyki (1), ochrona środowiska UJ, I semestr SUM, statystyka
1-14, ochrona środowiska UJ, I semestr SUM, statystyka
statystyka w4, Studia, Statystyka
statystyka Liszka 2003, Prywatne, 1 SUM, Statystyka
statystyka 2014 I termin, ochrona środowiska UJ, I semestr SUM, statystyka
METODY STATYSTYCZNE 2014 materiały do W4
ściąga statystyka, MEDYCYNA - ŚUM Katowice, I ROK, Biofizyka
W4 Proces wytwórczy oprogramowania
W4 2010
w4 3

więcej podobnych podstron