Testowanie hipotez

statystycznych



Hipotezy statystyczne;



Testowanie hipotez statystycznych;



Testy parametryczne;



Testy nieparametryczne.

Hipotezy statystyczne, będące sformułowanymi
przypuszczeniami dotyczącymi rozkładu
populacji, mogą mieć różną postać, w zależności
od hipotez badawczych. Weryfikacja hipotezy
statystycznej odbywa się przez zastosowanie
specjalnego narzędzia zwanego testem
statystycznym.

W zależności od postaci postawionej hipotezy zerowej (czyli
bezpośrednio sprawdzanej) oraz postaci hipotezy
alternatywnej (tzn. konkurencyjnej w stosunku do hipotezy
zerowej) sposób budowy testu jest różny.
Testy istotności to taki rodzaj testów w którym na podstawie
wyników próby losowej podejmuje się jedynie decyzję
odrzucenia sprawdzanej hipotezy, lub stwierdza się, że brak
jest podstaw do jej odrzucenia, nie podejmuje się natomiast
decyzji o przyjęciu tej hipotezy.

Hipoteza statystyczna jest hipotezą dotyczącą parametrów
(jest to tzw. hipoteza parametryczna) lub postaci rozkładu
określonego zbioru (hipoteza nieparametryczna). W
statystyce przeważnie nie mamy absolutnej pewności co do
słuszności pewnej hipotezy, a osiągnięcie całkowitej
pewności często jest nieopłacalne lub nawet z różnych
względów niemożliwe. Proces sprawdzania hipotezy ma
zwykle następujący przebieg: stawiamy pewną hipotezę
odnośnie całej populacji, pobieramy próbę, badamy ją i na tej
podstawie akceptujemy lub odrzucamy postawioną hipotezę.

Weryfikacja hipotezy statystycznej odbywa się przez
zastosowanie specjalnego narzędzia, zwanego

testem

statystycznym

. Jest to reguła postępowania, która każdej

możliwej próbie losowej przyporządkowuje decyzję przyjęcia
lub odrzucenia sprawdzanej hipotezy. Należy jednak
podkreślić, że przyjęcie lub odrzucenie hipotezy w teście
statystycznym nie jest równoznaczne z logicznym
udowodnieniem jej prawdziwości lub fałszywości. Należy
bowiem pamiętać, że odrzucając sprawdzaną hipotezę w
teście statystycznym, kierujemy się jedynie tym, że dane
liczbowe wynikające z pomiarów dają nam małą szansę
prawdziwości tej hipotezy.

Testy parametryczne

Testy parametryczne pozwalają formułować szereg
wniosków dotyczących różnych parametrów
statystycznych. Badanie zjawisk w drodze obliczania
wybranych parametrów jest bardzo efektywnym
sposobem poznania, wynika to ze zwięzłej i precyzyjnej
formy opisu. Jednak testy parametryczne, mimo swej
różnorodności, nie dają odpowiedzi na wszystkie istotne
pytania, głównie dlatego, że testy te mogą być stosowane
w przypadku, gdy badana wielkość (populacja) ma
rozkład normalny lub bardzo zbliżony do niego. Ponadto
testy parametryczne, jak sama nazwa wskazuje, opisują
pewną właściwość badanego zjawiska (wyników
pomiarów), nie dając dostatecznych podstaw do
formułowania wniosków ogólnych.

1. Sformułowanie H

i H

: m=4,0 H

: m4,0; lub m>4,0; lub m

< 4,0)

2. Przyjęcie poziomu błędu I rodzaju  ( = 0,05)
3. Dobranie testu weryfikującego (statystyki, sprawdzianu hipotezy
Z

)

w zależności od rodzaju hipotezy

4. Ustalenie obszaru krytycznego testu (odczytanie wartości
krytycznej statystyki weryfikującej z tablic dla : z

tabl

, z



)

5. Obliczenie wartości statystyki na podstawie próbki (z

obl

, z

emp

)

6. Porównanie dwu statystyk i podjęcie decyzji o przyjęciu lub
odrzuceniu hipotezy H

7. Interpretacja podjętej decyzji

Kolejność czynności przy weryfikacji hipotez

DECYZJ A STATYSTYKA

HIPOTEZA

ZEROWA J EST

przyjąć H

odrzucić H

PRAWDZIWA

Nie ma błędu

1 

Błąd I rodzaju



FAŁSZYWA

Błąd II rodzaju



Nie ma błędu

1 

 = P(H

odrzucona/H

jest prawdziwa)  = P(H

nieodrzucona/H

jest fałszywa)

 = poziom błędu I rodzaju,  = poziom błędu II rodzaju, 1 = moc

testu

Prawidłowość podejmowanych

decyzji

Testy istotności dla średnich

I. Testy istotności dla średniej m populacji o
rozkładzie normalnym. Znana σ. Próbka n
elementowa.







Hipoteza H

: m = m

hipoteza

alternatywna H

- pewna wartość konkretna.

m

X ~ N(m,σ)

















Wyznaczamy obszar
krytyczny Q

Hipoteza
alternatywn
a postaci







































Testy istotności dla średnich

II. Testy istotności dla średniej m populacji o
rozkładzie normalnym. Nieznana σ. Próbka n
elementowa.

Hipoteza H

m=m

hipoteza

alternatywna H

- pewna wartość konkretna.

m

X ~ N(m,σ

)

















Wyznaczamy obszar
krytyczny Q

Hipoteza
alternatywn
a postaci









































Przykład 1. W celu sprawdzenia, czy nowy lek jest lepszy
od dotych-czasowego, zbadano jego skuteczność na 6
chorych mierząc współczynnik odbudowy czerwonych
ciałek krwi: 6,3; 7,8; 8,1; 8,3; 8,7 i 9,4.
Lek używany dotychczas daje 8,3. Sprawdź hipotezę przy
poziomie istotności 0,01.

Zakładamy rozkład normalny współczynnika i
wybieramy test t.

Parametry próbki:

n = 6;

x = 8,1; s = 1,04

Hipotezy:

m = 8,3;

: m > 8,3

Statystyka t:

0,01(5)

= 3,365

obl

=0.92144

Porównanie:

obl

< t

tabl

Wniosek:

Nie ma powodów aby sądzić, że nowy lek

jest lepszy od dotychczasowego.

Porównywanie średnich

W praktyce często porównujemy dwie
średnie m

i m

. Zwykle weryfikuje się

hipotezę:





Rozkład normalny gdy znane są odchylenia standardowe
σ

















 :









Obszar
krytyczny

Rozkład t-Studenta gdy znane nie są
odchylenia standardowe σ



























t









 :

Obszar
krytyczny

Niekiedy zachodzi konieczność porównania
średniego poziomu pewnej cechy przed oraz po
dodatkowym działaniu na elementach badanej
populacji. Załóżmy, że dysponujemy parami
wyników x

oraz y

dla tego samego elementu

w i-tej próbie. Nie można traktować takich par
jako dwu różnych prób prostych ponieważ
mogą być one skorelowane. Wprowadza się
wówczas nową zmienną Z mierzącą przyrost
wartości badanej cechy: z

= x

– y

. Weryfikuję

się hipotezę:





Z ~ N(m

,σ) jakie jest

tutaj



Testowanie cd.

HIPOTEZY O WARIANCJI POPULACJI

Testy istotności dla hipotez o wariancji w populacji o rozkładzie
normalnym N(m,σ) buduje się w oparciu o rozkłady statystyk









































)

(



















Gęstość rozkładu



dla 4, 8 i 12

stopnia swobody

Bardzo często korzysta się z szybkiej zbieżności
do rozkładu normalnego











2 

Dla k>30 zmienna
losowa

ma rozkład normalny
N(0,1)

Graniczne rozkłady samych statystyk S

i S, tzn. wariancji i

odchylenia standardowego z próby pochodzących z populacji
normalnych są też normalne

























Gdy

Testy dla wariancji

1. Zakładamy, że znana jest wartość średniej m w

populacji. Na podstawie n-elementowej próby
prostej weryfikujemy statystyczną hipotezę
parametryczną

Przy założeniu prawdziwości hipotezy H

wobe















 



















 















dla ustalonego poziomu
istotności α

w tablicy rozkładu dla n-stopnia
swobody

Obszar krytyczny:

2. Zakładamy, że nie jest znana wartość średniej m w
populacji generalnej o rozkładzie normalnym. Na
podstawie n-elementowej próby prostej weryfikujemy
statystyczną hipotezę parametryczną

wobe

















c

dla ustalonego poziomu istotności α w tablicy rozkładu 

dla

(n-1) -stopnia swobody znajdujemy liczbę c:

I wyznaczamy obszar krytyczny











Obliczamy

)

(











Sprawdzamy uzyskaną w próbie wartość



podejmujemy decyzję o przyjęciu lub odrzuceniu
hipotezy H

Wiemy, że średni czas
świecenia żarówki wynosi
m



= 1059 godzin. Po

wprowadzeniu zmian w
technologii postanowiono
sprawdzić, czy zmiany te
nie skróciły czasu
świecenia. Hipoteza
zerowa ma zatem postać
H



: m



= m



, H



: m



> m



czyli: średni czas
świecenia żarówki nie
uległ zmianie wobec
hipotezy, że jakość
żarówek jest lepsza. Do
badania pobrano losowo
próbę 10 żarówek, wyniki
tych badań przedstawia
tabela.

Przykład

1048

10480







109

108522











317

109

1059

1048









Odczytana z tablic dla poziomu ufności 0,95
wartość krytyczna t



= 1,833, zatem nie ma

podstaw, aby postawioną hipotezę zerową
odrzucić.

Przyjmujemy poziom istotności 1-
 = 0.95

H0 : m1 = m0, H1 : m1
> m0,

Testy istotności w analizie

korelacji

Współczynnik korelacji Pearsona
 <-1,1>.



 





























r = 0 – współzależność nie występuje, brak korelacji

0  r  0,3 – słaby stopień współzależności
0,3  r  0,5 – średni stopień współzależności, 0,2 – 0,4 wyraźna , ale niska

korelacja

0,5  r  0,7 – znaczny stopień współzależności . 0,4 – 0,7 umiarkowana

korelacja

0,7  r  0,9 – wysoki stopień współzależności, 0,7 – 0,9 znacząca korelacja
r  0,9 – bardzo wysoki stopień współzależności, >0,9 bardzo silna korelacja

r = 1 – współzależność całkowita (ścisłość) tzn. zależność funkcyjna między
rozważanymi cechami.

Korelacyjne wykresy

rozrzutu

korelacja liniowa dodatnia r
> 

korelacja liniowa ujemna r
< 

brak korelacji r =


korelacja krzywoliniowa r
= 

excell

KOWARIANCJA































dxdy

)

(

)

)(

(

)

)(

(

)

cov(

Współczynnik korelacji







)

cov(

)

(

)

(

)

cov(









Rozkład współczynnika

korelacji



 



















































)

(



Statysty
ka

ma rozkład

)

(























ma rozkład
N(0,1)







Testowanie hipotezy:

Bardzo często testuje się hipotezę o

niezależności stochastycznej zmiennych

losowych, tzn.



























ma rozkład t-Studenta o
n-2 stopniach swobody

Przykład
1.
Pewnej populacji mającej dwuwymiarowy rozkład normalny
wylosowano 12 elementową próbę prostą. Oblicz
prawdopodobieństwo zdarzenia:

a) gdy



= 0;

b) gdy



= 0.4.

********************************************************
a)













205915























„=1-ROZKŁAD.T(0.32,10,1)” = 0.622223

„=1-ROZKŁAD.T(0.99,10,1)” = 0.823278

********************************************************
b)























)

(



)

(































194404

)

(











































































„=ROZKŁAD.NORMALNY.S(-
0.39)”=0.348268
„=ROZKŁAD.NORMALNY.S(-
1.02)”=0.153864

Testy nieparametryczne

Testy nieparametryczne są
uniezależnione od rozkładu badanej
cechy, mogą być więc stosowane także w
przypadku dowolnych rozkładów,
niekoniecznie zbliżonych do normalnego.

Testy nieparametryczne
możemy podzielić na dwie
grupy:

• testy zgodności,
pozwalające na sprawdzenie
hipotezy, że populacja ma
określony typ rozkładu,

• testy dla hipotezy, że dwie
próby pochodzą z jednej
populacji (czyli, że dwie
populacje mają ten sam
rozkład).

Test zgodności chi-

kwadrat

Jest to jeden z najstarszych testów
statystycznych, pozwalający na sprawdzenie
hipotezy, że populacja ma określony typ
rozkładu (opisany pewną dystrybuantą w
postaci funkcji), przy czym może to być
zarówno rozkład ciągły lub skokowy.
Jedynym ograniczeniem jest to, że próba
musi być duża, zawierająca co najmniej
kilkadziesiąt próbek, bowiem wyniki jej
musimy podzielić na pewne klasy wartości.
Klasy te nie powinny być zbyt mało liczne,
do każdej z nich powinno wpadać
przynajmniej po 8 wyników.

Sposób postępowania jest
następujący:

Wyniki dzielimy na r

rozłącznych klas o liczebnościach
n

, przy czym liczebność próby

otrzymując w ten sposób rozkład
empiryczny.

Formułujemy hipotezę

zerową, że badana populacja ma
rozkład o dystrybuancie należącej
do pewnego zbioru rozkładów o
określonym typie postaci
funkcyjnej dystrybuanty;











Z hipotetycznego

rozkładu obliczamy dla
każdej z r klas wartości
badanej zmiennej losowej
X prawdopodobieństwa
p

, że zmienna losowa

przyjmie wartości
należące do klasy o
numerze i (i = 1,2,...,r);

Obliczamy

liczebności teoretyczne
np

, które powinny

wystąpić w klasie i, gdyby
populacja miała założony
rozkład;

Ze wszystkich

liczebności empirycznych
n

oraz hipotetycznych np

wyznaczmy wartość
statystyki:

która, przy założeniu
prawdziwości hipotezy
zerowej, ma rozkład chi-
kwadrat o r - 1 stopniach
swobody lub o r - k - 1
stopniach swobody, gdy z
próby oszacowano k
parametrów rozkładu;













6. Z tablicy rozkładu chi-kwadrat dla ustalonego
poziomu ufności odczytuje się taką wartość
krytyczną aby zachodziło P( ) = 1 - .
7. Porównujemy obie wartości i jeśli zachodzi
nierówność

to hipotezę należy odrzucić. W przeciwnym
przypadku, gdy

nie ma podstaw do odrzucenia hipotezy zerowej,
nie oznacza to jednak, że możemy ją przyjąć.













Test zgodności chi-

kwadrat

Przykład

W pewnym doświadczeniu fizycznym mierzy
się  czas  rozbłysku.  Przeprowadzono  n  =
  niezależnych  doświadczeń  nad  tym
efektem  i  zbiór  pogrupowanych  wyników
jest taki jak w tabeli.

Na  poziomie  ufności  99%  należy  zweryfikować
hipotezę,  że  czas  występowania  badanego  w  tych
doświadczeniach  efektu  świetlnego  ma  rozkład
normalny.

Z treści zadania nie wynikają parametry rozkładu
hipotetycznego. Nasza hipoteza zerowa zatem będzie
brzmiała: F(x)





gdzie



jest klasą wszystkich

dystrybuant normalnych.

(

-x

)

(

)



-1

-0

Dwa parametry rozkładu, średnią wartość m i
odchylenie standardowe



, szacujemy z próby

za pomocą estymatorów m = 0.67 i s = 0.30.
Dalsze wyniki zestawiamy w tabeli, gdzie F(u

)

jest wartością dystrybuanty rozkładu
normalnego N(0,1) w punkcie u

= (x

-m) / s,

który jest standaryzowaną wartością prawego
końca przedziału klasowego.



















Liczba stopni swobody k = 7 - 2 - 1 = 4, gdyż na
podstawie próby losowej zostały policzone dwa
parametry: wartość średnia i odchylenie
standardowe. Z tablic rozkładu



, dla poziomu

istotności 0,01, znajdujemy wartość krytyczną
= 13,277. Wartość krytyczna jest mniejsza od
obliczonej statystyki równej 73,52, zatem
hipotezę o normalności rozkładu należy
odrzucić.

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33
Slide 34
Slide 35
Slide 36
Slide 37
Slide 38