background image

 

 

 

Wykład 5: Testy parametryczne

Biometria i 

Biostatystyka

background image

 

 

Testy Istotności

Czemu służą?

Formułowanie hipotez

Statystyka testowa

P-wartości

Istotność/znamienność statystyczna

Testowanie wartości średniej w populacji

Dwustronne testy istotności i przedziały 

ufności

P-wartości vs. ustalone α

background image

 

 

Testy Istotności

2 najczęściej stosowane formy 
wnioskowania statystycznego

Przedział ufności

Ocena parametru populacji

Test istotności

Ocena słuszności konkretnych stwierdzeń 
o populacji dokonana na podstawie 
dowodów dostarczonych przez dane. 

background image

 

 

Testy istotności jako 
narzędzie wnioskowania 
statystycznego

Test istotności

Formalna procedura porównywania 

zebranych danych z hipotezą, której 

prawdziwość chcemy ocenić.

Hipoteza:  stwierdzenie o parametrach 

populacji lub modelu

Wyniki testu są wyrażone w postaci 

prawdopodobieństwa, które mierzy 

jak hipoteza się zgadza z danymi

background image

 

 

Testowanie hipotez

Hipoteza zerowa

Stwierdzenie będące przedmiotem 
testu istotności

Test istotności jest tak skonstruowany, 
by ocenić siłę dowodów przeciw niej

Stwierdzenie w postaci “brak wpływu” 
lub “brak różnic”

Skrót: H

0

background image

 

 

Testowanie hipotez, cd.

Hipoteza alternatywna

Stwierdzenie, które podejrzewamy o 

prawdziwość jako alternatywę dla H

0

Skrót: H

a

Hipotezy zawsze odnoszą się do populacji lub 

modelu, nie do poszczególnych wyników.

Hipotezy testów parametrycznych dotyczą 

parametrów populacji.

Istnieją jednostronne lub dwustronne 

hipotezy alternatywne.

background image

 

 

Statystyki testowe

Test opiera się na statystyce szacującej parametr, 

o którym mówi hipoteza. Zwykle jest to taka sama 

estymata, którą wykorzystuje się przy 

konstruowaniu przedziałów ufności dla badanego 

parametru. Kiedy H

0

 jest prawdziwa, oczekujemy, 

że estymacja daje wartości bliskie tym 

wynikającym z H

0

.

Wartości estymat dalekie od wartości parametru 

opisanej przez H

0

 dostarczają dowodu przeciw H

0

Hipoteza alternatywna determinuje, który kierunek 

uważamy za sprzyjający H

a

.

background image

 

 

Statystyki testowe, cd.

Statystyki testowe

Mierzą zgodność hipotezy zerowej i 
danych.

Używane są do obliczania 
prawdopodobieństwa, które 
potrzebujemy do testu istotności.

Zmienne losowe ze znanym 
rozkładem.

background image

 

 

P-wartości

Test istotności znajduje 
prawdopodobieństwo otrzymania 
wyniku tak skrajnego lub bardziej, 
niż w danej chwili obserwowany

.

Skrajny: daleki od tego, którego 
byśmy się spodziewali gdyby hipoteza 
zerowa była prawdziwa

background image

 

 

P-wartości, cd.

Prawdopodobieństwo, obliczane przy 

założeniu prawdziwości H

0

, że statystyka 

testowa da wynik tak skrajny lub bardziej niż 

w danej chwili obserwowany jest nazywane P-

wartością testu.

Im mniejsza P-wartość, tym mocniejszy 

dowód przeciw H

0

 dostarczony przez dane

Oblicza się ją używając funkcji rozkładu 

gęstości prawdopodobieństwa statystyki 

testowej (np. standardowego rozkładu 

normalnego dla statystyki testowej z).

background image

 

 

background image

 

 

background image

 

 

Istotność Statystyczna 

Jeśli poziom P jest mniejsza lub równa 
niż α, mówimy że dane są znamienne 
statystycznie na poziomie istotności α.

Przykład:  

poziom istotności 0.01 znaczy 

że mamy dowód tak silny, że pojawiałby 
się tylko w 1% obserwacji, gdyby 
hipoteza zerowa była rzeczywiście 
prawdziwa.

Co mówi P-wartość równa 0.03?

background image

 

 

Krok 1. Korzystając z generatora liczb 
losowych N(0,1) wygeneruj dwa 
zbiory pomiarów po 16 pomiarów w 
każdym

Krok 2. Zapamiętaj P-wartości 
uzyskane z zastosowanego testu 
statystycznego (np. testu t)

Liczba powtórzeń kroków 1-2: 
N=25000

Przykład obliczeniowy

background image

 

 

background image

 

 

background image

 

 

background image

 

 

N = 1262

background image

 

 

Test istotności - kroki

Można ocenić istotność dowodów 

przeciw hipotezie zerowej dostarczonych 

przez dane  wykonując czynności:

1.

Sformułuj hipotezę zerową H

i hipotezę 

alternatywną H

a

. Test jest przeznaczony do 

oceny siły dowodów przeciw H

0

. H

jest 

stwierdzeniem które zaakceptujemy jeśli 

dowody pozwolą nam odrzucić H

0

.

2.

Oblicz wartość statystyki testowej. Ta 

statystyka zwykle określa jak daleko dane są 

od H

0

.

background image

 

 

Test istotności - kroki

3.

Znajdź P-wartość dla obserwowanych danych. Jest 

to prawdopodobieństwo (przyjmując, że hipoteza 

zerowa jest prawdziwa), że statystyka będzie się 

opowiadać przeciw hipotezie co najmniej tak silnie 

jak z tymi danymi.

4.

Sformułuj wniosek. Wybierz poziom istotności α (jak 

bardzo dowód przeciw H

0

 uznajesz za decydujący).  

Jeśli P-wartość jest mniejsza lub równa α - wniosek, 

że hipoteza alternatywna jest prawdziwa; jeśli jest 

większa od α - wniosek, że dane nie dostarczają 

wystarczająco silnego dowodu do odrzucenia H

0

Twój wniosek jest podsumowaniem badań 

wykonanych za pomocą testu istotności.

background image

 

 

Testy dla wartości średniej w 
populacji

Mamy prostą próbę losową o liczności n 

wylosowanej z normalnej populacji o 

nieznananej średniej μ ale ze znaną wariancją 

σ

2

. Chcemy sprawdzić hipotezę że μ ma 

określoną wartość, np. μ

0

.

Hipoteza zerowa:  H

0

: μ = μ

0

.

Statystyka testowa:

jeśli hipoteza zerowa jest prawdziwa, to statystyka z 

ma standardowy rozkład normalny. 

n

x

z

/

0

background image

 

 

Testy dla wartości średniej w 
populacji

Alternatywna hipoteza:  Jeśli jest  
jednostronna to np. H

a

: μ > μ

0

 

P-wartość: prawdopodobieństwo, że 
standardowa normalna zmienna 
losowa Z przybierze wartość co 
najmniej taką jak obserwowana z.

Możemy podobnie wnioskować dla 
innych hipotez alternatywnych.

background image

 

 

background image

 

 

background image

 

 

Dwustronne testy 
istotności i przedziały 
ufności

Poziom α dwustronnego testu 
istotności odrzuca hipotezę H

0

: μ = 

μ

dokładnie wtedy, gdy wartość μ

0

 

znajduje się poza przedziałem 
ufności dla dla μ obliczonym dla 
poziomu 1-α  .

background image

 

 

background image

 

 

P-wartości vs. ustalone α

P-wartość to najmniejszy poziom α, na 

którym dane są istotne.  

Znając P-wartość możemy ocenić istotność 

na każdym poziomie.

To daje więcej informacji niż sprawdzanie 

odrzucony-lub-nie na ustalonym poziomie 

istotności.

Wartość z*, taka że P{Z>z

*

} jest równa 

zadanej liczbie a, 0<a<1, jest nazywana 

wartością krytyczną standardowego 

rozkładu normalnego.

background image

 

 

background image

 

 

background image

 

 

Wykorzystywanie i 
nadużywanie testów

Wybieranie poziomu istotności

Wybierz poziom α z góry jeśli musisz 
dokonać decyzji.

Nie ma sensu, jeśli chcesz jedynie opisać siłę 
swoich dowodów.

Jeśli stosujesz test istotności z ustalonym α 
żeby podjąć decyzję, wybierz α pytając jak 
silny dowód jest potrzebny żeby odrzucić H

0

.  

To też zależy od tego jak wiarygodna jest hipoteza 
zerowa.  

background image

 

 

Wybór poziomu istotności

Jeśli H

0

 reprezentuje hipotezę, w 

którą każdy wierzył przez lata, będzie 
potrzebny mocny dowód (małe α) 
żeby je obalić.

Siła dowodu potrzebnego do 
odrzucenia H

0

 zależy od 

konsekwencji podjęcia takiej decyzji.  

Kosztowne:  silny dowód

background image

 

 

Wybór poziomu istotności

Lepiej podawać P-wartość, która 
pozwala każdemu z nas decydować 
indywidualnie czy mamy 
wystarczająco silne dowody.

Nie ma ostrej granicy między 
„istotny” a „nieistotny” a jedynie 
rosnąca siła dowodu przy malejącej 
P-wartości.

background image

 

 

Czego istotność 
statystyczna nie oznacza?

Istotność statystyczna to nie to samo co 

praktyczna istotność.

Przykład: hipoteza bez zależności jest odrzucana

Nie oznacza mocnego związku, ale że jest silny dowód 

na istnienie jakiegoś związku

Kilka punktów odstających może się 

przyczynić do zaobserwowania wysokiej 

istotności wyniku testu, jeśli ślepo stosuje 

się testy istotności.

Punkty odstające mogą również zniwelować 

istotność.

background image

 

 

Nie ignoruj braku 
istotności

Jeśli badacz ma wyraźny powód 
podejrzewać, że zależność istnieje a potem 
nie może znaleźć istotnego dowodu nań, to 
może to być ciekawą wiadomością --- 
czasami ciekawszą niż to gdyby 
potwierdzono związek na poziomie 
istotności 5%.

Ukrywanie negatywnych wyników może 
skazać innych badaczy na poszukiwanie 
zależności, która nie istnieje.

background image

 

 

Wnioskowanie statystyczne nie 
jest słuszne dla wszystkich 
danych

Formalne wnioskowanie 
statystyczne  nie koryguje błędnie 
przeprowadzonego eksperymentu.  

Losowość próbkowania gwarantuje, 
że prawa probabilistyki mają 
zastosowanie w naszych testach 
istotności oraz wyznaczanych 
przedziałach ufności.

background image

 

 

Nie szukaj na siłę 
znamienności 
statystycznej!

Można także wnioskować bez 
uwzględniania istotności 
statystycznej.

Jeśli zdecydujesz jakiego wyniku 
szukasz, zaprojektuj eksperyment 
lub próbę, która Cię do niego 
doprowadzi i zastosuj test istotności 
żeby ocenić wagę dowodów.

background image

 

 

Nie szukaj na siłę 
znamienności 
statystycznej!

Ponieważ udane próby szukania 
zjawisk naukowych zwykle kończą 
się znalezieniem istotności 
statystycznej, uczynienie samej 
istotności obiektem poszukiwań 
jest zbyt nęcące.

background image

 

 

Nie szukaj na siłę 
znamienności 
statystycznej!

Jeśli już masz hipotezę, zaprojektuj 
badanie tak, żeby otrzymać wynik, 
który uważasz za istniejący. 

Jeśli wynik badania jest 
statystycznie istotny, masz już 
rzeczywisty dowód.

background image

 

 

Moc i wnioskowanie 

Badanie użyteczności przedziału 
ufności

Poziom ufności:  mówi nam jak 
niezawodna jest ta metoda przy 
wielokrotnych powtórzeniach 
eksperymentu.

Margines błędu: mówi nam, jak czuła 
jest ta metoda lub jak bardzo przedział 
ogranicza szacowanie parametru

background image

 

 

Moc i wnioskowanie

Badanie użyteczności testów istotności 

przy ustalonym α.

Poziom istotności:  mówi nam jak 

wiarygodna jest ta metoda w użyciu

Moc testu

:  mówi nam o zdolności testu do 

wykrywania tego, że hipoteza zerowa jest 

fałszywa

Mierzona jako prawdopodobieństwo że test 

odrzuci hipotezę zerową kiedy alternatywna jest 

prawdziwa. 

Im wyższe prawdopodobieństwo, tym 

bardziej czuły jest test.

background image

 

 

Moc testu

Prawdopodobieństwo, że test 
istotności przy ustalonym α odrzuci 
H

0

, kiedy  alternatywna wartość 

parametru jest prawdziwa, jest 
nazywane mocą testu do 
wykrywania tej alternatywy.

background image

 

 

Obliczanie mocy testu

Sformułuj H

0

, H

a

 (konkretną 

alternatywę, którą chcemy wykryć) i 
poziom istotności α.

Znajdź wartości      , które 
spowodują że odrzucimy H

0

.

Oblicz prawdopodobieństwo 
zaobserwowania tych wartości   , dla 
których alternatywa jest prawdziwa. 

x

x

background image

 

 

background image

 

 

Zwiększanie mocy testu

Zwiększ α.  5%-owy test istotności 

będzie miał większą szansę odrzucenia 

alternatywy niż 1%-owy, ponieważ jest 

wymagana mniejsza siła dowodu.

Weź taką alternatywę, która jest dalej 

od μ

0

. Wartości μ, które są w H

a

 ale 

leżą blisko do hipotetycznej wartości μ

są cięższe do wykrycia (mniejsza moc) 

niż wartości μ, które są daleko od μ

0

.

background image

 

 

Zwiększanie mocy testu, 
cd.

Zwiększ rozmiar próby. Więcej danych 
dostarczy więcej informacji o     więc jest 
większa szansa odróżnienia wartości μ.  

Zmniejsz σ.  To daje taki sam efekt jak 
zwiększanie rozmiaru próby: więcej 
informacji o μ.  Poprawienie procesu 
pomiarów i ograniczenie uwagi na 
subpopulacje to dwa najpopularniejsze 
sposoby na zmniejszenie σ. 

x

background image

 

 

Dwa typy błędów

Podczas przeprowadzania testów istotności 

musimy przyjąć jedną hipotezę a drugą 

odrzucić.

Mamy nadzieję na trafność decyzji, ale nie 

zawsze jest to dobry wybór.

2 typy niewłaściwych decyzji:

Jeśli odrzucimy H

0

 (przyjmiemy H

a

) kiedy w 

rzeczywistości H

0

 jest prawdziwe, jest to błąd 

pierwszego rodzaju (odniesiony do p-wartości).

Jeśli przyjmiemy H

0

 (odrzucimy H

a

) kiedy w 

rzeczywistości H

a

 jest prawdziwe, jest to błąd 

drugiego rodzaju (odniesiony do mocy).

background image

 

 

background image

 

 

Ogólnie przyjęte 
postępowanie przy 
testowaniu hipotez

Zdefiniuj H

0

 i H

a

 tak samo jak do testu 

istotności.

Popatrz na problem jak na decyzję - 

prawdopodobieństwa popełnienia błędów  

I-szego i II-ego rodzaju są powiązane.

Błędy pierwszego rodzaju są poważniejsze. 

Wybierz α (poziom istotności) i rozważ 

testy tylko takie, gdzie 

prawdopodobieństwo popełnienia błędu I-

szego rodzaju nie jest większe od α.

background image

 

 

Ogólnie przyjęte 
postępowanie przy 
testowaniu hipotez

Spośród testów wybierz ten, który ma 
jak najmniejsze prawdopodobieństwo 
popełnienia błędu II-ego rodzaju (czyli 
jak największą moc).  Jeśli to 
prawdopodobieństwo jest zbyt duże, 
będziesz musisz wziąć większą liczbę 
prób żeby zmniejszyć ryzyko błędu.

background image

 

 

Jednostronny test t dla 
jednej próby

Niech prosta próba losowa (PPL) o liczności n 
jest losowana z populacji o nieznanej wart. 
oczekiwanej μ. Żeby zweryfikować hipotezę 
że H

0

: μ = μ

 na podstawie PPL, oblicz 

statystykę t

Zmienna losowa T ma rozkład  t(n-1),  P-
wartość dla testu H

 przeciw H

a

: μ > μ

0

 

wynosi                a przeciw H

a

: μ < μ

0

 wynosi  

n

/

s

x

t

0

t

T

)

t

T

(

P

background image

 

 

background image

 

 

Test t - przykład 1

Niech PPL o liczności n jest losowana z 
populacji o nieznanej wartości 
oczekiwanej μ.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111, 
121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że H

0

: μ = 

μ

0

=120 na podstawie PPL liczności n, 

oblicz statystykę t dla jednej próby

6764

.

0

12

/

89

.

5

120

15

.

121

n

/

s

x

t

0

background image

 

 

Test t - przykład 1

W kategoriach zmiennej losowej T 
z rozkładem t(n-1), P-wartość dla 
testu H

 przeciw H

a

: μ > μ

0

 wynosi 

t

T

background image

 

 

stopień swobody

Wartość krytyczna dla 
α=0.95

background image

 

 

Jeśli t

1

=0.6 to cdf(t

1

)=0.71967 więc p

1

=1-

0.71967=0.28033

Jeśli t

2

=0.7 to cdf(t

2

)=0.75077 więc p

2

=1-

0.75077=0.24923

więc p

2

 < p < p

1

Test t - przykład 1

background image

 

 

Z rozkładu t Studenta 
otrzymujemy

tcdf(0.6764,11) = 0.743621

p = 1 – 0.743621 = 

0.256379

Test t - przykład 1

background image

 

 

Test t - przykład 1

0.7436

p=0.2564

background image

 

 

Test t - przykład 1

Końcowy wniosek:

   

Nie możemy odrzucić H

0

 

mówiącej, że wartość średnia w 
populacji wynosi μ=120 i przyjąć 
H

a

 z p=0.2564

background image

 

 

Kolejny przykład jednostronnego 
testu t dla jednej próby

Żeby zweryfikować hipotezę H

0

: μ = 135 

na podstawie PPL liczności n, obliczmy 

statystykę t dla jednej próby: 

W kategoriach zmiennej losowej T z 

rozkładem t(n-1), P-wartość dla testu na 

H

przeciw 

H

a

: μ < μ

0

 wynosi 

n

/

s

135

x

t

t

T

background image

 

 

background image

 

 

Test t - przykład 2

   [114, 123.3, 116.7, 129.0, 118, 124.6, 

123.1, 117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że 
H

0

: μ = μ

0

=135, obliczmy 

statystykę t

1456

.

8

12

/

89

.

5

135

15

.

121

n

/

s

x

t

0

background image

 

 

Z rozkładu t Studenta 
otrzymujemy

P(T ≤ t)

 = 

tcdf(-8.1456,11) =2.7e-6

p =

 0.0000027 < 0.000005

Test t - przykład 2

background image

 

 

Test t - przykład 2

p=2.7e-6

t = -8.1456

background image

 

 

Test t - przykład 2

Końcowy wniosek:

   

Odrzucamy H

0

 mówiącą, że wartość 

średnia w populacji wynosi μ=135 i 
przyjmujemy H

a

: μ < μ

0

 z p < 

0.000005

background image

 

 

Dwustronny test t dla jednej 
próby

Żeby zweryfikować hipotezę że H

0

: μ = 

115

 

na podstawie PPL liczności n, 

obliczmy statystykę t

W kategoriach zmiennej losowej T z 

rozkładem t(n-1), P-wartość dla testu H

przeciw 

H

a

: μ ≠ μ

0

 wynosi 

n

/

s

115

x

t

|

t

|

|

T

|

P

background image

 

 

background image

 

 

Test t - przykład 3

   [114, 123.3, 116.7, 129.0, 118, 124.6, 

123.1, 117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że 
H

0

: μ = μ

0

=115 obliczmy 

statystykę t

6170

.

3

12

/

89

.

5

115

15

.

121

n

/

s

x

t

0

background image

 

 

• Ponieważ wartość krytyczna 

t

0.05

=2.2010  a nasza obserwowana 

wartość jest wyższa, odrzucamy 
hipotezę zerową na poziomie α=0.05.

• Z rozkładu t otrzymujemy

P(|T| > |t|)

 = 2*(1-

tcdf(3.6170,11)) = 

0.0040

Więc dokładnie p =

 0.0040 

Test t - przykład 3

background image

 

 

Test t - przykład 3

p=0.0040

-t = -3.6170

t = 3.6170

background image

 

 

Test t - przykład 3

Końcowy wniosek:

   

odrzucamy H

0

 że wartość średnia w 

populacji wynosi μ=115 i 
przyjmujemy H

a

: μ ≠ μ

0

 z p = 

0.0040

background image

 

 

Pary obserwacji - test t 

W badaniu par obserwacji wyniki 
są łączone w pary i porównywane 
w jej obrębie. 

Przykład:  wyniki przed i po kursie 

background image

 

 

background image

 

 

Kluczowe punkty odnośnie 
par obserwacji

Analiza par obserwacji jest 
konieczna kiedy mamy dwa 
pomiary lub obserwacje każdego 
obiektu i chcemy zbadać zmianę 
jednej względem drugiej.  
Zazwyczaj obserwacje w pewnym 
sensie są pomiarami „przed” i 
„po”.

background image

 

 

Kluczowe punkty odnośnie 
łączonych par

W każdej parze odejmuje się 
pomiar „przed” od pomiaru „po”.

Analizuje się rozkład różnic 
stosując przedziały ufności i testy 
istotności dla jednej próby.

background image

 

 

Odporność procedur t

Wnioskowanie statystyczne jest 
nazywane odpornym, jeśli wymagane 
metodyka obliczeń jest nieczuła na 
naruszenie przyjętych założeń.

Procedury t są dość odporne na 
odstępstwa od normalności rozkładu 
populacji z wyjątkiem obserwowania 
silnej skośności rozkłądu lub 
występowania punktów odstających.

background image

 

 

Odporność procedur t

Większe próby to większa dokładność 
oszacowania P-wartości oraz wartości 
krytycznych dystrybucji t, gdy rozkład 
populacji nie jest normalny.

W przypadku małolicznych prób, zanim 
przejdzie się do testów t należy 
narysować wykres qq lub ramkowy w 
celu sprawdzenia skośności i punktów 
ostających.

background image

 

 

Praktyczne wskazówki do 
wnioskowania z jednej 
średniej

Liczność próby: mniej niż 15:  Zastosuj 

procedury t jeśli dane mają w przybliżeniu 

rozkład normalny.  Jeśli ich rozkład jest daleki 

od normalnego, albo zaobserwowaliśmy punkty 

odstające, nie używaj t.

Liczność próby co najmniej 15:  Można 

zastosować procedury t, chyba że istnieją 

punkty odstające lub rozkład jest bardzo skośny

Duże próby:  Można stosować procedury t, 

nawet dla skośnych rozkładów, ale liczność 

musi być duża: ponad 40

background image

 

 

Porównywanie dwóch 
średnich

Problemy z dwiema próbami

Cel wnioskowania: porównanie 
odpowiedzi w dwóch grupach.

Przyjmuje się że każda grupa to próba 
z oddzielnej populacji.

Odpowiedzi w każdej z grup są 
niezależne.

background image

 

 

Pojęcia

Populacja

Zmienna

Średnia

Odchylenie standardowe

Liczność próby

Średnia próby

Odchylenie standardowe próby

background image

 

 

Statystyka z dla dwóch 
prób

Naturalny estymator różnicy μ

- μ

2

 jest 

różnicą dwóch średnich prób, 

Żeby wnioskować z tej statystyki 
musimy znać jej rozkład próbkowania.

Jeśli rozkłady obu populacji są normalne, 
rozkład
jest także normalny.

2

1

x

2

1

x



2

2

2

1

2

1

2

1

,

n

n

N

background image

 

 

Statystyka z dla dwóch 
prób

Niech    jest średnią prostej próby losowej o 
liczności n

1

 z populacji o rozkładzie N(μ

1, 

σ

1

)  

a    to średnia PPL o liczności n

2

 z populacji 

o rozkładzie N(μ

2, 

σ

2

). Wtedy taka statystyka

ma standardowy rozkład funkcji gęstości 
prawdopodobieństwa N(0,1).

1

x

2

x

 

2

2

2

1

2

1

2

1

2

1

n

n

x

x

z

background image

 

 

background image

 

 

background image

 

 

background image

 

 

Procedura t dla dwóch 
prób

Ten test zakłada że populacje, z 

których wzięto próbki mają 
równe wariancje

background image

 

 

Procedura t dla dwóch 
prób

Jeśli odchylenia standardowe 
populacji nie są znane, 
przybliżamy je na podstawie 
odchylenia standardowego próby.

Stosuj właściwy wzór, zależny od 
liczności prób: n

1

 i n

2

.

background image

 

 

Procedura t dla dwóch 
prób

Kiedy liczności prób są różne i 

przynajmniej jedno z n

1

 i n

2

 jest 

małe (<30) stosuj:

Taka statystyka ma rozkład t Studenta 

z k=n

1

+ n

2

 – 2 stopniami swobody.

 





 





2

1

2

1

2

1

2

2

2

2

1

1

2

1

2

1

n

n

n

n

2

n

n

s

)

1

n

(

s

)

1

n

(

x

x

t

background image

 

 

Procedura t dla dwóch 
prób

Kiedy n

1

 i n

2

 są sobie równe 

(niezależnie od liczności) zastosuj:

Taka statystyka ma rozkład t Studenta 

z k=2(n – 1) stopniami swobody.

 

n

s

s

x

x

t

2

2

2

1

2

1

2

1

background image

 

 

Procedura t dla dwóch 
prób

Kiedy n

1

 i n

2

 są różne, ale duże (≥30) 

stosuj:

Taka statystyka ma rozkład t Studenta 

z k=n

1

 + n

2

 - 2 stopniami swobody.

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

t

background image

 

 

Test istotności t dla dwóch 
prób

Niech prosta próba losowa o liczności n

1

 

jest losowana z populacji o rozkładzie 
normalnym z nieznaną wartością 
oczekiwaną μ

i jest niezależna od 

drugiej próby o liczności n

2

, losowanej z 

innej populacji o nieznanej wartości 
oczekiwanej μ

2.  

Zakładamy że odchylenia standardowe 
obu populacji są równe.

background image

 

 

Test istotności t dla dwóch 
prób

Żeby zweryfikować hipotezę H

0

: μ

= μ

2

 przeciw H

a

: μ

≠ μ

2

, obliczymy 

odpowiednią statystykę t i użyjemy 
P-wartości lub wartości 
krytycznych dla rozkładu t 
Studenta z odpowiednim stopniem 
swobody.

background image

 

 

Test istotności t dla 
dwóch prób - przykład

Niech PPL o liczności n

1

 jest losowana z 

populacji o nieznanej wartości oczekiwanej μ

1

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 
117.4, 111, 121.7, 124.5, 130.5] 

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Kolejna PPL o liczności n

2

 jest losowana z 

populacji o nieznanej wartości oczekiwanej μ

2

[120, 125.5, 126, 125.5, 128.5, 125, 128, 116, 
122, 121, 117, 125]

średnia próby = 123.29

odchylenie standardowe próby = 4.08

background image

 

 

Test istotności t dla 
dwóch prób - przykład

 

0383

.

1

n

s

s

x

x

t

2

2

2

1

2

1

2

1

=0 z założenia

p = 0.3104

Wniosek: nie możemy odrzucić hipotezy, że wartości 
średnie obu populacji są równe na poziomie istotności 
α=0.05

Ponieważ n

1

=n

2

=12

background image

 

 

Przedział ufności dla dwóch 
prób

Niech PPL liczności n

1

 jest losowana z 

normalnej populacji o nieznanej wart. 

oczekiwanej μ

1  

i kolejna PPL o liczności n

2

 jest 

losowana z kolejnej normalnej populacji o 

nieznanej wart. oczekiwanej μ

2

. Dla dużych n

1

 

i n

2

 przedział ufności dla μ

- μ

2

 jest dany przez

gdzie statystyka t ma n

1

+n

2

-2 stopni swobody.

2

2

2

1

2

1

2

1

2

2

2

1

2

1

2

1

*

,

*

n

s

n

s

t

x

x

n

s

n

s

t

x

x

background image

 

 

Odporność procedur dla 
dwóch prób

Procedury t dla dwóch prób są bardziej 

odporne niż metody t dla jednej próby.

Jeśli liczności obu prób są równe a rozkłady 

porównywanych populacji mają podobne 

kształty, otrzymujemy dobrą dokładność.

Jeśli kształty rozkładów populacji są różne, 

potrzeba prób o większej liczności.

Planując badanie oparte na dwóch 

próbach, powinieneś zwykle wybierać 

równe liczności tych prób.

background image

 

 

Test Bartlett’a 
homogeniczności 
(jednorodności)  wariancji

Testowanie hipotezy zerowej 
mówiącej że dwie populacje 
reprezentowane przez dwie próby 
mają równe wariancje.

Hipoteza alternatywna mówi że 
dwie wariancje są różne

background image

 

 

background image

 

 

Test jednorodności wariancji 
Bartletta

Oblicz logarytm naturalny  
wariancji każdej z prób.

Zsumuj liczby stopni swobody

Oblicz średnią ważoną wariancji i 
jej logarytm naturalny

a

i

95

9

...

12

17

)

1

n

(

185167

.

2

112459

.

0

ln

   

,

112459

.

0

)

1

n

(

s

)

1

n

(

s

a

i

a

2

i

i

2

background image

 

 

Test jednorodności wariancji 
Bartletta

Oblicz ważoną sumę logarytmów 
wariancji każdej z prób

Oblicz statystykę 

227545

.

229

s

ln

)

1

n

(

a

2

i

i

636721

.

21

s

ln

)

1

n

(

s

ln

)

1

n

(

X

a

2

i

i

2

a

i

2

background image

 

 

Test jednorodności wariancji 
Bartletta

Jeśli hipoteza zerowa jest 
prawdziwa, to  skorygowana 
statystyka X

2

 ma w przybliżeniu 

rozkład χ

2

 o a-1 stopniach 

swobody. 

914

.

20

034566

.

1

63672

.

21

C

X

X

034566

.

1

)

1

n

(

1

1

n

1

)

1

a

(

3

1

1

C

2

2

kor

a

a

i

i

background image

 

 

Test jednorodności wariancji 
Bartletta

475

.

18

2

]

7

[

01

.

0

Wartość krytyczna dla a-1=7 stopni 
swobody oraz alfa = 0.01 wynosi 

Wartość skorygowanej statystyki wynosi 
20.914. Wnioskujemy więc, że wariancje są 
niejednorodne.

background image

 

 

Przybliżony test t Welch’a 
równości wartości średnich 
dwóch populacji o różnych 
wariancjach

background image

 

 

Przybliżony test t Welch’a

Ten test oblicza przybliżoną t-

wartość, taką

, dla której krytyczna 

wartość jest liczona jako średnia 

ważona pojedynczych wartości 

krytycznych t odpowiadających 

stopniom swobody dwóch prób.

background image

 

 

Przybliżony test t Welch’a

Dwupróbowa statystyka t

 jest 

równa:

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

't

background image

 

 

Przybliżony test t Welch’a

Wartość krytyczna t

α’

 dla błędu 

pierwszego rodzaju jest liczona 
jako:

2

2

2

1

2

1

2

2

2

]

[

1

2

1

]

[

n

s

n

s

n

s

t

n

s

t

't

2

1

background image

 

 

Przybliżony test t Welch’a

Ta statystyka NIE MA rozkładu t ale 
możemy przybliżyć rozkład t’ dla 
dwóch prób stosując rozkład t(k) z 
przybliżeniem liczby stopni 
swobody k.

k równa się mniejszą z dwóch liczb: 
n

1

–1 oraz n

2

–1.

background image

 

 

Zadanie domowe


Document Outline