background image

 

Wykład 5: Testy parametryczne

Biometria i 

Biostatystyka

background image

Testy Istotności

Czemu służą?

Formułowanie hipotez

Statystyka testowa

P-wartości

Istotność/znamienność statystyczna

Testowanie wartości średniej w populacji

Dwustronne testy istotności i przedziały 

ufności

P-wartości vs. ustalone α

background image

Testy Istotności

2 najczęściej stosowane formy 
wnioskowania statystycznego

Przedział ufności

Ocena parametru populacji

Test istotności

Ocena słuszności konkretnych stwierdzeń 
o populacji dokonana na podstawie 
dowodów dostarczonych przez dane. 

background image

Testy istotności jako 
narzędzie wnioskowania 
statystycznego

Test istotności

Formalna procedura porównywania 

zebranych danych z hipotezą, której 

prawdziwość chcemy ocenić.

Hipoteza:  stwierdzenie o parametrach 

populacji lub modelu

Wyniki testu są wyrażone w postaci 

prawdopodobieństwa, które mierzy 

jak hipoteza się zgadza z danymi

background image

Formułowanie hipotez

Hipoteza zerowa

Stwierdzenie będące przedmiotem 
testu istotności

Test istotności jest tak skonstruowany, 
by ocenić siłę dowodów przeciw niej

Stwierdzenie w postaci “brak wpływu” 
lub “brak różnic”

Skrót: H

0

background image

Formułowanie hipotez, cd.

Hipoteza alternatywna

Stwierdzenie, które podejrzewamy o 

prawdziwość jako alternatywę dla H

0

Skrót: H

a

Hipotezy zawsze odnoszą się do populacji 

lub modelu, nie do poszczególnych wyników.

Hipotezy testów parametrycznych dotyczą 

parametrów populacji.

Istnieją jednostronne lub dwustronne 

hipotezy alternatywne.

background image

Statystyki testowe

Test opiera się na statystyce szacującej parametr, 

o którym mówi hipoteza. Zwykle jest to taka sama 

estymata, którą wykorzystuje się przy 

konstruowaniu przedziałów ufności dla badanego 

parametru. Kiedy H

0

 jest prawdziwa, oczekujemy, 

że estymacja daje wartości bliskie tym 

wynikającym z H

0

.

Wartości estymat dalekie od wartości parametru 

opisanej przez H

0

 dostarczają dowodu przeciw H

0

Hipoteza alternatywna determinuje, który kierunek 

uważamy za sprzyjający H

a

.

background image

Statystyki testowe, cd.

Statystyki testowe

Mierzą zgodność hipotezy zerowej i 
danych.

Używane są do obliczania 
prawdopodobieństwa, które 
potrzebujemy do testu istotności.

Zmienne losowe ze znanym 
rozkładem.

background image

P-wartości

Test istotności znajduje 
prawdopodobieństwo otrzymania 
wyniku tak skrajnego lub bardziej, 
niż w danej chwili obserwowany

.

Skrajny: daleki od tego, którego 
byśmy się spodziewali gdyby hipoteza 
zerowa była prawdziwa

background image

P-wartości, cd.

Prawdopodobieństwo, obliczane przy 

założeniu prawdziwości H

0

, że statystyka 

testowa da wynik tak skrajny lub bardziej niż 

w danej chwili obserwowany jest nazywane P-

wartością testu.

Im mniejsza P-wartość, tym mocniejszy 

dowód przeciw H

0

 dostarczony przez dane

Oblicza się ją używając funkcji rozkładu 

gęstości prawdopodobieństwa statystyki 

testowej (np. standardowego rozkładu 

normalnego dla statystyki testowej z).

background image
background image
background image

Istotność statystyczna 

Jeśli poziom P jest mniejsza lub równa 
niż α, mówimy że dane są znamienne 
statystycznie na poziomie istotności α.

Przykład:  

poziom istotności 0.01 znaczy 

że mamy dowód tak silny, że pojawiałby 
się tylko w 1% obserwacji, gdyby 
hipoteza zerowa była rzeczywiście 
prawdziwa.

Co mówi P-wartość równa 0.03?

background image

Krok 1. Korzystając z generatora liczb 
losowych N(0,1) wygeneruj dwa 
zbiory pomiarów po 16 pomiarów w 
każdym

Krok 2. Zapamiętaj P-wartości 
uzyskane z zastosowanego testu 
statystycznego (np. testu t)

Liczba powtórzeń kroków 1-2: 
N=25000

Symulacje numeryczne

background image
background image
background image
background image

N = 1262

background image

Test istotności - kroki

Można ocenić istotność dowodów 

przeciw hipotezie zerowej dostarczonych 

przez dane  wykonując czynności:

1.

Sformułuj hipotezę zerową H

i hipotezę 

alternatywną H

a

. Test jest przeznaczony do 

oceny siły dowodów przeciw H

0

. H

jest 

stwierdzeniem które zaakceptujemy jeśli 

dowody pozwolą nam odrzucić H

0

.

2.

Oblicz wartość statystyki testowej. Ta 

statystyka zwykle określa jak daleko dane są 

od H

0

.

background image

Test istotności - kroki

3.

Znajdź P-wartość dla obserwowanych danych. Jest 

to prawdopodobieństwo (przyjmując, że hipoteza 

zerowa jest prawdziwa), że statystyka będzie się 

opowiadać przeciw hipotezie co najmniej tak silnie 

jak z tymi danymi.

4.

Sformułuj wniosek. Wybierz poziom istotności α (jak 

bardzo dowód przeciw H

0

 uznajesz za decydujący).  

Jeśli P-wartość jest mniejsza lub równa α - wniosek, 

że hipoteza alternatywna jest prawdziwa; jeśli jest 

większa od α - wniosek, że dane nie dostarczają 

wystarczająco silnego dowodu do odrzucenia H

0

Twój wniosek jest podsumowaniem badań 

wykonanych za pomocą testu istotności.

background image

Testy dla wartości średniej w 
populacji – test z

Mamy prostą próbę losową o liczności n 

wylosowanej z normalnej populacji o 

nieznananej średniej μ ale ze znaną 

wariancją σ

2

. Chcemy sprawdzić 

hipotezę że μ ma określoną wartość, np. 

μ

0

.

Hipoteza zerowa:  H

0

: μ = μ

0

.

background image

Testy dla wartości średniej w 
populacji – test z

Hipoteza zerowa:  H

0

: μ = μ

0

.

Statystyka testowa:

jeśli hipoteza zerowa jest prawdziwa, to 

statystyka z ma standardowy rozkład 

normalny. 

n

x

z

/

0

background image

Testy dla wartości średniej w 
populacji – test z

Alternatywna hipoteza:  Jeśli jest  
jednostronna to np. H

a

: μ > μ

0

 

p-wartość: prawdopodobieństwo, że 
standardowa normalna zmienna 
losowa Z przybierze wartość co 
najmniej taką jak obserwowana z.

Możemy podobnie wnioskować dla 
innych hipotez alternatywnych.

background image
background image

Dystrybucja statystyki 

testowej

background image
background image
background image

Dwustronne testy 
istotności i przedziały 
ufności

Poziom α dwustronnego testu 
istotności odrzuca hipotezę H

0

: μ = 

μ

dokładnie wtedy, gdy wartość μ

0

 

znajduje się poza przedziałem 
ufności dla dla μ obliczonym dla 
poziomu 1-α  .

background image
background image

P-wartości vs. ustalone α

P-wartość to najmniejszy poziom α, na 

którym dane są istotne.  

Znając P-wartość możemy ocenić istotność 

na każdym poziomie.

To daje więcej informacji niż sprawdzanie 

odrzucony-lub-nie na ustalonym poziomie 

istotności.

Wartość z*, taka że P(Z>z

*

) jest równa 

zadanej liczbie a, 0<a<1, jest nazywana 

wartością krytyczną 

standardowego 

rozkładu normalnego.

background image
background image
background image

Wykorzystywanie i 
nadużywanie testów

Wybieranie poziomu istotności

Wybierz poziom α z góry jeśli musisz dokonać 
decyzji.

Nie ma sensu, jeśli chcesz jedynie opisać siłę 
swoich dowodów.

Jeśli stosujesz test istotności z ustalonym α 
by podjąć decyzję, wybierz α pytając jak silny 
dowód jest potrzebny do odrzucenia H

0

.  

To też zależy od tego jak wiarygodna jest/ma być 
hipoteza zerowa.  

background image

Wybór poziomu istotności

Jeśli H

0

 reprezentuje hipotezę, w 

którą każdy wierzył przez lata, będzie 
potrzebny mocny dowód (małe α) 
żeby ją obalić.

Siła dowodu potrzebnego do 
odrzucenia H

0

 zależy od 

konsekwencji podjęcia takiej decyzji.  

Kosztowne:  silny dowód

background image

Wybór poziomu istotności

Lepiej podawać p-wartość, która 
pozwala każdemu z nas decydować 
indywidualnie czy mamy 
wystarczająco silne dowody.

Nie ma ostrej granicy między 
„istotny” a „nieistotny” a jedynie 
rosnąca siła dowodu przy malejącej 
p-wartości.

background image

Czego istotność 
statystyczna nie oznacza?

Istotność statystyczna to nie to samo co 

praktyczna istotność.

Przykład: hipoteza bez zależności jest odrzucana

Nie oznacza mocnego związku, ale że jest silny dowód 

na istnienie jakiegoś związku

Kilka punktów odstających może się 

przyczynić do zaobserwowania wysokiej 

istotności wyniku testu, jeśli ślepo stosuje 

się testy istotności.

Punkty odstające mogą również zniwelować 

istotność.

background image

Nie ignoruj braku 
istotności

Jeśli badacz ma wyraźny powód 
podejrzewać, że zależność istnieje a potem 
nie może znaleźć istotnego dowodu nań, to 
może to być ciekawą wiadomością --- 
czasami ciekawszą niż to gdyby 
potwierdzono związek na poziomie 
istotności 5%.

Ukrywanie negatywnych wyników może 
skazać innych badaczy na poszukiwanie 
zależności, która nie istnieje.

background image

Wnioskowanie statystyczne nie 
jest słuszne dla wszystkich 
danych

Formalne wnioskowanie 
statystyczne  nie koryguje błędnie 
przeprowadzonego eksperymentu.  

Losowość próbkowania gwarantuje, 
że prawa probabilistyki mają 
zastosowanie w naszych testach 
istotności oraz wyznaczanych 
przedziałach ufności.

background image

Nie szukaj na siłę 
znamienności 
statystycznej!

Można także wnioskować bez 
uwzględniania istotności 
statystycznej.

Jeśli zdecydujesz jakiego wyniku 
szukasz, zaprojektuj eksperyment 
lub próbę, która Cię do niego 
doprowadzi i zastosuj test istotności 
żeby ocenić wagę dowodów.

background image

Nie szukaj na siłę 
znamienności 
statystycznej!

Ponieważ udane próby szukania 
zjawisk naukowych zwykle kończą 
się znalezieniem istotności 
statystycznej, uczynienie samej 
istotności obiektem poszukiwań 
jest zbyt nęcące.

background image

Nie szukaj na siłę 
znamienności 
statystycznej!

Jeśli już masz hipotezę, zaprojektuj 
badanie tak, żeby otrzymać wynik, 
który uważasz za istniejący. 

Jeśli wynik badania jest 
statystycznie istotny, masz już 
rzeczywisty dowód.

background image

Moc i wnioskowanie 

Badanie użyteczności przedziału 
ufności

Poziom ufności:  mówi nam jak 
niezawodna jest ta metoda przy 
wielokrotnych powtórzeniach 
eksperymentu.

Margines błędu: mówi nam, jak czuła 
jest ta metoda lub jak bardzo przedział 
ogranicza szacowanie parametru

background image

Moc i wnioskowanie

Badanie użyteczności testów istotności 

przy ustalonym α.

Poziom istotności:  mówi nam jak 

wiarygodna jest ta metoda w użyciu

Moc testu

:  mówi nam o zdolności testu do 

wykrywania tego, że hipoteza zerowa jest 

fałszywa

Mierzona jako prawdopodobieństwo że test 

odrzuci hipotezę zerową kiedy alternatywna jest 

prawdziwa. 

Im wyższe prawdopodobieństwo, tym 

bardziej czuły jest test.

background image

Moc testu

Prawdopodobieństwo, że test 
istotności przy ustalonym α odrzuci 
H

0

, kiedy  alternatywna wartość 

parametru jest prawdziwa, jest 
nazywane mocą testu do 
wykrywania tej alternatywy.

background image

Obliczanie mocy testu

Sformułuj H

0

, H

a

 (konkretną 

alternatywę, którą chcemy wykryć) i 
poziom istotności α.

Znajdź wartości      , które 
spowodują że odrzucimy H

0

.

Oblicz prawdopodobieństwo 
zaobserwowania tych wartości   , dla 
których alternatywa jest prawdziwa. 

x

x

background image
background image

Zwiększanie mocy testu

Zwiększ α.  5%-owy test istotności 

będzie miał większą szansę odrzucenia 

alternatywy niż 1%-owy, ponieważ jest 

wymagana mniejsza siła dowodu.

Weź taką alternatywę, która jest dalej 

od μ

0

. Wartości μ, które są w H

a

 ale 

leżą blisko do hipotetycznej wartości μ

są cięższe do wykrycia (mniejsza moc) 

niż wartości μ, które są daleko od μ

0

.

background image

Zwiększanie mocy testu, 
cd.

Zwiększ rozmiar próby. Więcej danych 
dostarczy więcej informacji o     więc jest 
większa szansa odróżnienia wartości μ.  

Zmniejsz σ.  To daje taki sam efekt jak 
zwiększanie rozmiaru próby: więcej 
informacji o μ.  Poprawienie procesu 
pomiarów i ograniczenie uwagi na 
subpopulacje to dwa najpopularniejsze 
sposoby na zmniejszenie σ. 

x

background image

Dwa typy błędów

Podczas przeprowadzania testów istotności 

musimy przyjąć jedną hipotezę a drugą 

odrzucić.

Mamy nadzieję że jest to trafna decyzja, ale nie 

musi tak być.

2 typy niewłaściwych decyzji:

Jeśli odrzucimy H

0

 (przyjmiemy H

a

) kiedy w 

rzeczywistości H

0

 jest prawdziwe, jest to błąd 

pierwszego rodzaju (odniesiony do p-wartości).

Jeśli przyjmiemy H

0

 (odrzucimy H

a

) kiedy w 

rzeczywistości H

a

 jest prawdziwe, jest to błąd 

drugiego rodzaju (odniesiony do mocy).

background image
background image

Prawdopodobieństwa 
błędów

Statystyczne wnioskowanie jest oparte na 

prawdopodobieństwie.

Jakakolwiek zasada podejmowania decyzji jest 

związana z prawdopodobieństwami popełnienia dwóch 

rodzajów błędów.

Poziom istotności α jakiegokolwiek testu z ustalonym 

poziomem jest prawdopodobieństwem popełnienia 

błędu pierwszego rodzaju.

α jest prawdopodobieństwem że test odrzuci zerową hipotezę 

H

0

 kiedy w rzeczywistości jest prawdziwa.

Moc testu przeprowadzonego na zadanym poziomie istotności 

α określona dla zadanej alternatywy wynosi 1 minus 

prawdopodobieństwo popełnienia błędu drugiego rodzaju dla 

tej alternatywy.

background image

Ogólnie przyjęte 
postępowanie przy 
testowaniu hipotez

Zdefiniuj H

0

 i H

a

 tak samo jak do testu 

istotności.

Popatrz na problem jak na decyzję - 

prawdopodobieństwa popełnienia błędów  

I-szego i II-ego rodzaju są powiązane.

Błędy pierwszego rodzaju są poważniejsze. 

Wybierz α (poziom istotności) i rozważ 

testy tylko takie, gdzie 

prawdopodobieństwo popełnienia błędu I-

szego rodzaju nie jest większe od α.

background image

Ogólnie przyjęte 
postępowanie przy 
testowaniu hipotez

Spośród testów wybierz ten, który ma 
jak najmniejsze prawdopodobieństwo 
popełnienia błędu II-ego rodzaju (czyli 
jak największą moc).  Jeśli to 
prawdopodobieństwo jest zbyt duże, 
będziesz musisz wziąć większą liczbę 
prób żeby zmniejszyć ryzyko błędu.

background image

Testy dla wartości średniej 
w populacji – jednostronny 
test t

Niech prosta próba losowa (PPL) o liczności n 
jest losowana z populacji o nieznanej wart. 
oczekiwanej μ. Żeby zweryfikować hipotezę 
że H

0

: μ = μ

 na podstawie PPL, oblicz 

statystykę t

Zmienna losowa T ma rozkład  t(n-1),  P-
wartość dla testu H

 przeciw H

a

: μ > μ

0

 

wynosi                 albo dla H

a

: μ < μ

0

  

n

/

s

x

t

0

t

T

)

t

T

(

P

background image

Test t - przykład 1

Niech PPL o liczności n jest losowana z 
populacji o nieznanej wartości 
oczekiwanej μ.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111, 
121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że H

0

: μ = 

μ

0

=120 na podstawie PPL liczności n, 

oblicz statystykę t dla jednej próby

6764

.

0

12

/

89

.

5

120

15

.

121

n

/

s

x

t

0

background image
background image

Test t - przykład 1

W kategoriach zmiennej losowej T 
z rozkładem t(n-1), P-wartość dla 
testu H

 przeciw H

a

: μ > μ

0

 wynosi 

t

T

background image

stopień swobody

Wartość krytyczna dla 
α=0.95

background image

Jeśli t

1

=0.6 to cdf(t

1

)=0.71967 więc p

1

=1-

0.71967=0.28033

Jeśli t

2

=0.7 to cdf(t

2

)=0.75077 więc p

2

=1-

0.75077=0.24923

więc p

2

 < p < p

1

Test t - przykład 1

background image

Z rozkładu t Studenta 
otrzymujemy

tcdf(0.6764,11) = 0.743621

p = 1 – 0.743621 = 

0.256379

Test t - przykład 1

background image

Test t - przykład 1

0.7436

p=0.2564

background image

Test t - przykład 1

Końcowy wniosek:

   

Nie możemy odrzucić H

0

 

mówiącej, że wartość średnia w 
populacji wynosi μ=120 i przyjąć 
H

a

 z p=0.2564

background image

Test t – przykład 2

Żeby zweryfikować hipotezę H

0

: μ = 135 

na podstawie PPL liczności n, obliczmy 

statystykę t dla jednej próby: 

W kategoriach zmiennej losowej T z 

rozkładem t(n-1), P-wartość dla testu na 

H

przeciw 

H

a

: μ < μ

0

 wynosi 

n

/

s

135

x

t

t

T

background image
background image

Test t - przykład 2

   [114, 123.3, 116.7, 129.0, 118, 124.6, 

123.1, 117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że 
H

0

: μ = μ

0

=135, obliczmy 

statystykę t

1456

.

8

12

/

89

.

5

135

15

.

121

n

/

s

x

t

0

background image

Z rozkładu t Studenta 
otrzymujemy

P(T ≤ t)

 = 

tcdf(-8.1456,11) =2.7e-6

p =

 0.0000027 < 0.000005

Test t - przykład 2

background image

Test t - przykład 2

p=2.7e-6

t = -8.1456

background image

Test t - przykład 2

Końcowy wniosek:

   

Odrzucamy H

0

 mówiącą, że wartość 

średnia w populacji wynosi μ=135 i 
przyjmujemy H

a

: μ < μ

0

 z p < 

0.000005

background image

Testy dla wartości średniej w 
populacji – dwustronny test t

Żeby zweryfikować hipotezę że H

0

: μ = 

115

 

na podstawie PPL liczności n, 

obliczmy statystykę t

W kategoriach zmiennej losowej T z 

rozkładem t(n-1), P-wartość dla testu H

przeciw 

H

a

: μ ≠ μ

0

 wynosi 

n

/

s

115

x

t

|

t

|

|

T

|

P

background image
background image

Test t - przykład 3

   [114, 123.3, 116.7, 129.0, 118, 124.6, 

123.1, 117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że 
H

0

: μ = μ

0

=115 obliczmy 

statystykę t

6170

.

3

12

/

89

.

5

115

15

.

121

n

/

s

x

t

0

background image

• Ponieważ wartość krytyczna 

t

0.05

=2.2010  a nasza obserwowana 

wartość jest wyższa, odrzucamy 
hipotezę zerową na poziomie α=0.05.

• Z rozkładu t otrzymujemy

P(|T| > |t|)

 = 2*(1-

tcdf(3.6170,11)) = 

0.0040

Więc dokładnie p =

 0.0040 

Test t - przykład 3

background image

Test t - przykład 3

p=0.0040

-t = -3.6170

t = 3.6170

background image

Test t - przykład 3

Końcowy wniosek:

   

odrzucamy H

0

 że wartość średnia w 

populacji wynosi μ=115 i 
przyjmujemy H

a

: μ ≠ μ

0

 z p = 

0.0040

background image

Pary obserwacji - test t 

W badaniu par obserwacji wyniki 
są łączone w pary i porównywane 
w jej obrębie. 

Przykład:  wyniki przed i po kursie 

background image

Pary obserwacji - analiza

Analiza par obserwacji jest 
konieczna kiedy mamy dwa 
pomiary lub obserwacje każdego 
obiektu i chcemy zbadać zmianę 
jednej względem drugiej.  
Zazwyczaj obserwacje w pewnym 
sensie są pomiarami „przed” i 
„po”.

background image

Pary obserwacji - analiza

W każdej parze odejmuje się 
pomiar „przed” od pomiaru „po”.

Analizuje się rozkład różnic 
stosując przedziały ufności i testy 
istotności dla jednej próby.

background image
background image

Pary obserwacji – 
przykład 4

Gain średnia z próby = 2.5

Gain odchylenie standardowe z próby = 
2.89

Aby zweryfikować hipotezę H

0

: μ = 

μ

0

=0 (brak różnic) przeciwko H

A

: μ 

≠ 0 na podstawie PPL o liczności n, 
obliczamy statystykę testową t

8686

.

3

20

/

89

.

2

0

5

.

2

/

0

n

s

x

t

background image

• Wartość krytyczna t

[0.05,19]

=2.0930.

•Obliczona statystyka t jest większa 

niż wartość krytyczna, odrzucamy 
zatem hipotezę zerową na poziomie 
α=0.05.

• Z rozkładu t znajdujemy

P(|T| > |t|)

 = 2*(1-

tcdf(3.8686,19)) = 

0.001

Zatem dokładna wartość p =

 0.001 

Pary obserwacji – 
przykład 4

background image

• Zakładając poziom istotności α, możemy 

przeprowadzić test dla wartości średniej w 
populacji wykorzystując przedział ufności 
określony dla poziomu C=1-α. 

• Obliczamy dolną i górną granicę przedziału 

ufności i sprawdzamy, czy µ

0

 należy do tego 

przedziału. 

• Jeśli tak, to nie mamy podstaw do odrzucenia 

hipotezy zerowej H

0

: μ = μ

0

• Jest to równoważne przeprowadzeniu 

dwustronnego testu t na poziomie istotności 
α. 

Wykorzystanie przedziałów ufności 
do wnioskowania o wartości 
średniej w populacji

background image

Przykład 3 – przedziały 
ufności

   [114, 123.3, 116.7, 129.0, 118, 124.6, 

123.1, 117.4, 111, 121.7, 124.5, 130.5] 

Średnia z próby = 121.15

Odchylenie standardowe z próby = 
5.89, α=0.05

89

.

124

12

89

.

5

2010

.

2

15

.

121

41

.

117

12

89

.

5

2010

.

2

15

.

121

11

,

05

.

0

2

11

,

05

.

0

1

n

s

t

Y

L

n

s

t

Y

L

background image

Przykład 3 – przedziały 
ufności

Przedział ufności

Hipoteza zerowa H

0

: μ =115, 

hipoteza alternatywna H

A

: µ≠115.

Ponieważ
odrzucamy hipotezę zerowa na 

poziomie α=0.05  

95

.

0

89

.

124

41

.

117

P

)

89

.

124

 ,

41

.

117

(

115

background image

Odporność procedur t

Wnioskowanie statystyczne jest 
nazywane odpornym, jeśli wymagane 
metodyka obliczeń jest nieczuła na 
naruszenie przyjętych założeń.

Procedury t są dość odporne na 
odstępstwa od normalności rozkładu 
populacji z wyjątkiem obserwowania 
silnej skośności rozkłądu lub 
występowania punktów odstających.

background image

Odporność procedur t

Większe próby to większa dokładność 
oszacowania P-wartości oraz wartości 
krytycznych dystrybucji t, gdy rozkład 
populacji nie jest normalny.

W przypadku małolicznych prób, zanim 
przejdzie się do testów t należy 
narysować wykres qq lub ramkowy w 
celu sprawdzenia skośności i punktów 
ostających.

background image

Praktyczne wskazówki do 
wnioskowania o średniej

Liczność próby: mniej niż 15:  Zastosuj 

procedury t jeśli dane mają w przybliżeniu 

rozkład normalny.  Jeśli ich rozkład jest daleki 

od normalnego, albo zaobserwowaliśmy punkty 

odstające, nie używaj t.

Liczność próby co najmniej 15:  Można 

zastosować procedury t, chyba że istnieją 

punkty odstające lub rozkład jest bardzo skośny

Duże próby:  Można stosować procedury t, 

nawet dla skośnych rozkładów, ale liczność 

musi być duża: ponad 40

background image

Porównywanie dwóch 
średnich

Problemy z dwiema próbami

Cel wnioskowania: porównanie 
odpowiedzi w dwóch grupach.

Przyjmuje się że każda grupa to próba 
z oddzielnej populacji.

Odpowiedzi w każdej z grup są 
niezależne.

background image

Pojęcia

Populacja

Zmienna

Średnia

Odchylenie standardowe

Liczność próby

Średnia próby

Odchylenie standardowe próby

background image

Test z dla dwóch prób

Naturalny estymator różnicy μ

- μ

2

 

jest różnicą dwóch średnich prób, 

Żeby wnioskować z tej statystyki 
musimy znać jej rozkład próbkowania.

Jeśli rozkłady obu populacji są normalne, 
rozkład
jest także normalny.

2

1

x

2

1

x



2

2

2

1

2

1

2

1

,

n

n

N

background image

Test z dla dwóch prób

Niech    jest średnią prostej próby losowej o 
liczności n

1

 z populacji o rozkładzie N(μ

1, 

σ

1

)  

a    to średnia PPL o liczności n

2

 z populacji 

o rozkładzie N(μ

2, 

σ

2

). Wtedy taka statystyka

ma standardowy rozkład funkcji gęstości 
prawdopodobieństwa N(0,1).

1

x

2

x

 

2

2

2

1

2

1

2

1

2

1

n

n

x

x

z

background image

Test t dla dwóch prób

Ten test zakłada że populacje, z 

których wzięto próbki mają 
równe wariancje

background image

Statystyka t dla dwóch 
prób

Jeśli odchylenia standardowe 
populacji nie są znane, 
przybliżamy je na podstawie 
odchylenia standardowego próby.

Stosuj właściwy wzór, zależny od 
liczności prób: n

1

 i n

2

.

background image

Statystyka t dla dwóch 
prób

Kiedy liczności prób są różne i 

przynajmniej jedno z n

1

 i n

2

 jest 

małe (<30) stosuj:

Taka statystyka ma rozkład t Studenta 

z k=n

1

+ n

2

 – 2 stopniami swobody.

 





 





2

1

2

1

2

1

2

2

2

2

1

1

2

1

2

1

n

n

n

n

2

n

n

s

)

1

n

(

s

)

1

n

(

x

x

t

background image

Statystyka t dla dwóch 
prób

Kiedy n

1

 i n

2

 są sobie równe 

(niezależnie od liczności) zastosuj:

Taka statystyka ma rozkład t Studenta 

z k=2(n – 1) stopniami swobody.

 

n

s

s

x

x

t

2

2

2

1

2

1

2

1

background image

Statystyka t dla dwóch 
prób

Kiedy n

1

 i n

2

 są różne, ale duże (≥30) 

stosuj:

Taka statystyka ma rozkład t Studenta 

z k=n

1

 + n

2

 - 2 stopniami swobody.

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

t

background image

Test istotności t dla dwóch 
prób

Niech prosta próba losowa o liczności n

1

 

jest losowana z populacji o rozkładzie 
normalnym z nieznaną wartością 
oczekiwaną μ

i jest niezależna od 

drugiej próby o liczności n

2

, losowanej z 

innej populacji o nieznanej wartości 
oczekiwanej μ

2.  

Zakładamy że odchylenia standardowe 
obu populacji są równe.

background image

Test istotności t dla dwóch 
prób

Żeby zweryfikować hipotezę H

0

: μ

= μ

2

 przeciw H

a

: μ

≠ μ

2

, obliczymy 

odpowiednią statystykę t i użyjemy 
P-wartości lub wartości 
krytycznych dla rozkładu t 
Studenta z odpowiednim stopniem 
swobody.

background image

Test istotności t dla 
dwóch prób – przykład 5

Niech PPL o liczności n

1

 jest losowana z 

populacji o nieznanej wartości oczekiwanej μ

1

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 
117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Kolejna PPL o liczności n

2

 jest losowana z 

populacji o nieznanej wartości oczekiwanej μ

2

[120, 125.5, 126, 125.5, 128.5, 125, 128, 116, 
122, 121, 117, 125]

średnia próby = 123.29

odchylenie standardowe próby = 4.08

background image

Test istotności t dla 
dwóch prób – przykład 5

 

0383

.

1

n

s

s

x

x

t

2

2

2

1

2

1

2

1

=0 z założenia

p = 0.3104

Wniosek: nie możemy odrzucić hipotezy, że wartości 
średnie obu populacji są równe na poziomie istotności 
α=0.05

Ponieważ n

1

=n

2

=12

background image

Przedział ufności dla dwóch 
prób

Niech PPL liczności n

1

 jest losowana z 

normalnej populacji o nieznanej wart. 

oczekiwanej μ

1  

i kolejna PPL o liczności n

2

 jest 

losowana z kolejnej normalnej populacji o 

nieznanej wart. oczekiwanej μ

2

. Dla dużych n

1

 

i n

2

 przedział ufności dla μ

- μ

2

 jest dany przez

gdzie statystyka t ma n

1

+n

2

-2 stopni swobody.

2

2

2

1

2

1

2

1

2

2

2

1

2

1

2

1

*

,

*

n

s

n

s

t

x

x

n

s

n

s

t

x

x

background image

Odporność procedur dla 
dwóch prób

Procedury t dla dwóch prób są bardziej 

odporne niż metody t dla jednej próby.

Jeśli liczności obu prób są równe a rozkłady 

porównywanych populacji mają podobne 

kształty, otrzymujemy dobrą dokładność.

Jeśli kształty rozkładów populacji są różne, 

potrzeba prób o większej liczności.

Planując badanie oparte na dwóch 

próbach, powinieneś zwykle wybierać 

równe liczności tych prób.

background image

Przybliżony test t Welch’a 
równości wartości średnich 
dwóch populacji o różnych 
wariancjach

background image

Przybliżony test t Welch’a

Ten test oblicza przybliżoną t-

wartość, taką

, dla której krytyczna 

wartość jest liczona jako średnia 

ważona pojedynczych wartości 

krytycznych t odpowiadających 

stopniom swobody dwóch prób.

background image

Przybliżony test t Welch’a

Dwupróbowa statystyka t

 jest 

równa:

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

't

background image

Przybliżony test t Welch’a

Wartość krytyczna t

α’

 dla błędu 

pierwszego rodzaju jest liczona 
jako:

2

2

2

1

2

1

2

2

2

]

[

1

2

1

]

[

n

s

n

s

n

s

t

n

s

t

't

2

1

background image

Testy dla wariancji w 

populacji

Mamy PPL o liczności n losowaną z 
rozkładu normalnego.  Chcemy 
testować hipotezę, że wariancja w 
populacji σ

2

 ma określoną wartość σ

02

.

Hipoteza zerowa:  H

0

: σ

2

 = σ

02

.

Hipoteza alternatywna: H

A

: σ

2

 ≠ σ

02

Jest to test dwustronny, testy 
jednostronne można wyprowadzić 
analogicznie

background image

Testy dla wariancji w 

populacji – test X

2

Z definicji rozkładu Χ

2

Ponieważ statystyka X

2

 ma rozkład         

postępujemy następująco::

Oblicz X

2

Znajdź wartości krytyczne dla testu 
dwustronnego dla zadanego poziomu 
istotności α

Porównaj wartość statystyki testowej z 
robszarem krytycznym.

2

2

2

'

2

)

1

(

s

n

X

X

n

i

2

]

1

[ 

n

background image

Testy dla wartości wariancji w 

populacji – przykład 6

Producent twierdzi, że wariancja średnicy 

tulejek wynosi 100.

Odchylenie standardowe z próby, oszacowane 

na podstawie 10 pomiarów, wynosi 11.2 

Statystyka testowa  

Wartości krytyczne dla testu dwustronnego na 

poziomie α=0.05 dla 9 stopni swobody 

wynoszą odpowiednio 2.700 oraz 19.023.

Wartość statystyki testowe jest mniejsza niż 

19.023 i większa niż 2.700, prowadzi to do 

akceptacji hipotezy zerowej na poziomie 

α=0.05.

290

.

11

100

)

2

.

11

(

9

)

1

(

2

2

2

2

'

2

s

n

X

X

n

i

background image

Rozkład F

Załóżmy, że losowanie dokonywane 
jest z populacji o rozkładzie normalnym 
o wartości średniej µ i wariancji σ

2

Losujemy najpierw n

1

 wartości i 

obliczamy ich wariancję z próby    , 
następnie losujemy n

2

 wartości i 

obliczamy ich wariancję z próby

Liczba stopni swobody dla obu 
wariancji ν

1

=n

1

-1 oraz ν

2

=n

2

-1.

2

1

s

2

2

s

background image

Rozkład F

Mając obie wielkości      oraz     , 
obliczamy

Opracowano model matematyczny 
oczekiwanego rozkładu tak 
zdefiniowanej zmiennej losowej i 
nazwano go rozkładem F, na cześć 
znanego statystyka of R.A.Fishera.

2

1

s

2

2

s

2

2

2

1

s

s

F

s

background image

Rozkład F

W przeciwieństwie do rozkładów t i Χ

2

, kształt 

rozkładu F określony jest przez dwa 
parametry ν

1

 i ν

2

.

background image

 Jednostronny test F 

jednorodności wariancji

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:   

Statystyka testowa:

opisana jest rozkładem F o [v

1

, v

2

stopniach swobody.

2

2

2

1

s

s

F

s

2

2

2

1

2

2

2

1

background image

 Jednostronny test F 

jednorodności wariancji – 

przykład 7

Próba 1: n

1

=7, 

Próba 2: n

2

=29, 

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:   

Statystyka testowa:

ma rozkład F o [6, 28] stopniach swobody.

2

2

2

1

32

.

1

029

.

16

181

.

21

2

2

2

1

s

s

F

s

2

2

2

1

180

.

21

2

1

s

029

.

16

2

2

s

background image

 Jednostronny test F 

jednorodności wariancji – 

przykład 7

32

.

1

F

Ponieważ 
wartość 
statystyki F nie 
należy do 
obszaru 
krytycznego, 
przyjmujemy 
hipotezę zerową 
na poziomie 
α=0.05

background image

 Dwustronny test F 

jednorodności wariancji – 

przykład 8

Próba 1: n

1

=10, 

Próba 2: n

2

=15, 

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:   

Statystyka testowa:

ma rozkład F o [9,14] stopniach swobody.

2

2

2

1

7134

.

0

021

.

18

856

.

12

2

2

2

1

s

s

F

s

2

2

2

1

856

.

12

2

1

s

021

.

18

2

2

s

background image

 Dwustronny test F 

jednorodności wariancji – 

przykład 8

7134

.

0

F

Since our F 
statistic does 
not belong to 
the rejection 
region, we 
accept null 
hypothesis at 
α=0.05

background image

Test Bartlett’a 
homogeniczności 
(jednorodności)  wariancji

Testowanie hipotezy zerowej 
mówiącej że dwie lub więcej 
populacje reprezentowane przez 
dwie lub więcej próby mają równe 
wariancje.

Hipoteza alternatywna mówi że co 
najmniej jedna wariancja jest inna

background image

Przykład 9

background image

 

Test Bartlett’a homogeniczności 

(jednorodności) wariancji – przykład 

9

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:   

Poziom istotności α=0.005

Próba 1: Treatment group n

1

=21, 

s

1

=11.01, 

Próba 2: Control group n

2

=23, s

2

=17.15

Naturalne logarytmy z wariancji: 
ln(11.01

2

)=4.80 oraz ln(17.15

2

)= 5.68

2

2

2

1

2

2

2

1

background image

 

Test Bartlett’a homogeniczności 

(jednorodności) wariancji – przykład 

9

Suma liczby stopni swobody: 20+22=42

Średnia ważona wariancji:

Logarytm naturalny średniej ważonej wariancji: 

5.36

Suma ważona logarytmów wariancji składowych

Statystyka testowa

Korekta skalująca C=1.0398

79

.

211

42

15

.

17

*

22

01

.

11

*

20

2

2

2

s

96

.

220

68

.

5

*

22

80

.

4

*

20

16

.

4

96

.

220

36

.

5

*

42

2

background image

 

Test Bartlett’a homogeniczności 

(jednorodności) wariancji – przykład 

9

Skorygowana wartość statystyki testowej 
4.16/1.0398=4.00

Wartość krytyczna dla 1 stopnia swobody i 
poziomu istotności α=0.005 wynosi 9.14.

Ponieważ wartość statystyki testowej (4.00) jest 
mniejsza od wartości krytycznej (9.14), nie mamy 
podstaw do odrzucenia hipotezy zerowej na 
poziomie α=0.005. 

Wniosek końcowy: wariancje są jednorodne.

background image
background image

Test Bartlett’a homogeniczności 
(jednorodności) wariancji – przykład 
10

Oblicz logarytm naturalny  
wariancji każdej z prób.

Zsumuj liczby stopni swobody

Oblicz średnią ważoną wariancji i 
jej logarytm naturalny

a

i

95

9

...

12

17

)

1

n

(

185167

.

2

112459

.

0

ln

   

,

112459

.

0

)

1

n

(

s

)

1

n

(

s

a

i

a

2

i

i

2

background image

Test Bartlett’a homogeniczności 
(jednorodności) wariancji – przykład 
10

Oblicz ważoną sumę logarytmów 
wariancji każdej z prób

Oblicz statystykę 

227545

.

229

s

ln

)

1

n

(

a

2

i

i

636721

.

21

s

ln

)

1

n

(

s

ln

)

1

n

(

X

a

2

i

i

2

a

i

2

background image

Test Bartlett’a homogeniczności 
(jednorodności) wariancji – przykład 
10

Jeśli hipoteza zerowa jest 
prawdziwa, to  skorygowana 
statystyka X

2

 ma w przybliżeniu 

rozkład χ

2

 o a-1 stopniach 

swobody. 

914

.

20

034566

.

1

63672

.

21

C

X

X

034566

.

1

)

1

n

(

1

1

n

1

)

1

a

(

3

1

1

C

2

2

kor

a

a

i

i

background image

Test Bartlett’a homogeniczności 
(jednorodności) wariancji – przykład 
10

475

.

18

2

]

7

[

01

.

0

Wartość krytyczna dla a-1=7 stopni 
swobody oraz alfa = 0.01 wynosi 

Wartość skorygowanej statystyki wynosi 
20.914. Wnioskujemy więc, że wariancje są 
niejednorodne.


Document Outline