Wykład 5: Testy parametryczne
Biometria i
Biostatystyka
Testy Istotności
Czemu służą?
Formułowanie hipotez
Statystyka testowa
P-wartości
Istotność/znamienność statystyczna
Testowanie wartości średniej w populacji
Dwustronne testy istotności i przedziały
ufności
P-wartości vs. ustalone α
Testy Istotności
2 najczęściej stosowane formy
wnioskowania statystycznego
Przedział ufności
Ocena parametru populacji
Test istotności
Ocena słuszności konkretnych stwierdzeń
o populacji dokonana na podstawie
dowodów dostarczonych przez dane.
Testy istotności jako
narzędzie wnioskowania
statystycznego
Test istotności
Formalna procedura porównywania
zebranych danych z hipotezą, której
prawdziwość chcemy ocenić.
Hipoteza: stwierdzenie o parametrach
populacji lub modelu
Wyniki testu są wyrażone w postaci
prawdopodobieństwa, które mierzy
jak hipoteza się zgadza z danymi
Formułowanie hipotez
Hipoteza zerowa
Stwierdzenie będące przedmiotem
testu istotności
Test istotności jest tak skonstruowany,
by ocenić siłę dowodów przeciw niej
Stwierdzenie w postaci “brak wpływu”
lub “brak różnic”
Skrót: H
0
Formułowanie hipotez, cd.
Hipoteza alternatywna
Stwierdzenie, które podejrzewamy o
prawdziwość jako alternatywę dla H
0
Skrót: H
a
Hipotezy zawsze odnoszą się do populacji
lub modelu, nie do poszczególnych wyników.
Hipotezy testów parametrycznych dotyczą
parametrów populacji.
Istnieją jednostronne lub dwustronne
hipotezy alternatywne.
Statystyki testowe
Test opiera się na statystyce szacującej parametr,
o którym mówi hipoteza. Zwykle jest to taka sama
estymata, którą wykorzystuje się przy
konstruowaniu przedziałów ufności dla badanego
parametru. Kiedy H
0
jest prawdziwa, oczekujemy,
że estymacja daje wartości bliskie tym
wynikającym z H
0
.
Wartości estymat dalekie od wartości parametru
opisanej przez H
0
dostarczają dowodu przeciw H
0
.
Hipoteza alternatywna determinuje, który kierunek
uważamy za sprzyjający H
a
.
Statystyki testowe, cd.
Statystyki testowe
Mierzą zgodność hipotezy zerowej i
danych.
Używane są do obliczania
prawdopodobieństwa, które
potrzebujemy do testu istotności.
Zmienne losowe ze znanym
rozkładem.
P-wartości
Test istotności znajduje
prawdopodobieństwo otrzymania
wyniku tak skrajnego lub bardziej,
niż w danej chwili obserwowany
.
Skrajny: daleki od tego, którego
byśmy się spodziewali gdyby hipoteza
zerowa była prawdziwa
P-wartości, cd.
Prawdopodobieństwo, obliczane przy
założeniu prawdziwości H
0
, że statystyka
testowa da wynik tak skrajny lub bardziej niż
w danej chwili obserwowany jest nazywane P-
wartością testu.
Im mniejsza P-wartość, tym mocniejszy
dowód przeciw H
0
dostarczony przez dane
Oblicza się ją używając funkcji rozkładu
gęstości prawdopodobieństwa statystyki
testowej (np. standardowego rozkładu
normalnego dla statystyki testowej z).
Istotność statystyczna
Jeśli poziom P jest mniejsza lub równa
niż α, mówimy że dane są znamienne
statystycznie na poziomie istotności α.
Przykład:
poziom istotności 0.01 znaczy
że mamy dowód tak silny, że pojawiałby
się tylko w 1% obserwacji, gdyby
hipoteza zerowa była rzeczywiście
prawdziwa.
Co mówi P-wartość równa 0.03?
Krok 1. Korzystając z generatora liczb
losowych N(0,1) wygeneruj dwa
zbiory pomiarów po 16 pomiarów w
każdym
Krok 2. Zapamiętaj P-wartości
uzyskane z zastosowanego testu
statystycznego (np. testu t)
Liczba powtórzeń kroków 1-2:
N=25000
Symulacje numeryczne
N = 1262
Test istotności - kroki
Można ocenić istotność dowodów
przeciw hipotezie zerowej dostarczonych
przez dane wykonując czynności:
1.
Sformułuj hipotezę zerową H
0
i hipotezę
alternatywną H
a
. Test jest przeznaczony do
oceny siły dowodów przeciw H
0
. H
a
jest
stwierdzeniem które zaakceptujemy jeśli
dowody pozwolą nam odrzucić H
0
.
2.
Oblicz wartość statystyki testowej. Ta
statystyka zwykle określa jak daleko dane są
od H
0
.
Test istotności - kroki
3.
Znajdź P-wartość dla obserwowanych danych. Jest
to prawdopodobieństwo (przyjmując, że hipoteza
zerowa jest prawdziwa), że statystyka będzie się
opowiadać przeciw hipotezie co najmniej tak silnie
jak z tymi danymi.
4.
Sformułuj wniosek. Wybierz poziom istotności α (jak
bardzo dowód przeciw H
0
uznajesz za decydujący).
Jeśli P-wartość jest mniejsza lub równa α - wniosek,
że hipoteza alternatywna jest prawdziwa; jeśli jest
większa od α - wniosek, że dane nie dostarczają
wystarczająco silnego dowodu do odrzucenia H
0
.
Twój wniosek jest podsumowaniem badań
wykonanych za pomocą testu istotności.
Testy dla wartości średniej w
populacji – test z
Mamy prostą próbę losową o liczności n
wylosowanej z normalnej populacji o
nieznananej średniej μ ale ze znaną
wariancją σ
2
. Chcemy sprawdzić
hipotezę że μ ma określoną wartość, np.
μ
0
.
Hipoteza zerowa: H
0
: μ = μ
0
.
Testy dla wartości średniej w
populacji – test z
Hipoteza zerowa: H
0
: μ = μ
0
.
Statystyka testowa:
jeśli hipoteza zerowa jest prawdziwa, to
statystyka z ma standardowy rozkład
normalny.
n
x
z
/
0
Testy dla wartości średniej w
populacji – test z
Alternatywna hipoteza: Jeśli jest
jednostronna to np. H
a
: μ > μ
0
p-wartość: prawdopodobieństwo, że
standardowa normalna zmienna
losowa Z przybierze wartość co
najmniej taką jak obserwowana z.
Możemy podobnie wnioskować dla
innych hipotez alternatywnych.
Dystrybucja statystyki
testowej
Dwustronne testy
istotności i przedziały
ufności
Poziom α dwustronnego testu
istotności odrzuca hipotezę H
0
: μ =
μ
0
dokładnie wtedy, gdy wartość μ
0
znajduje się poza przedziałem
ufności dla dla μ obliczonym dla
poziomu 1-α .
P-wartości vs. ustalone α
P-wartość to najmniejszy poziom α, na
którym dane są istotne.
Znając P-wartość możemy ocenić istotność
na każdym poziomie.
To daje więcej informacji niż sprawdzanie
odrzucony-lub-nie na ustalonym poziomie
istotności.
Wartość z*, taka że P(Z>z
*
) jest równa
zadanej liczbie a, 0<a<1, jest nazywana
wartością krytyczną
standardowego
rozkładu normalnego.
Wykorzystywanie i
nadużywanie testów
Wybieranie poziomu istotności
Wybierz poziom α z góry jeśli musisz dokonać
decyzji.
Nie ma sensu, jeśli chcesz jedynie opisać siłę
swoich dowodów.
Jeśli stosujesz test istotności z ustalonym α
by podjąć decyzję, wybierz α pytając jak silny
dowód jest potrzebny do odrzucenia H
0
.
To też zależy od tego jak wiarygodna jest/ma być
hipoteza zerowa.
Wybór poziomu istotności
Jeśli H
0
reprezentuje hipotezę, w
którą każdy wierzył przez lata, będzie
potrzebny mocny dowód (małe α)
żeby ją obalić.
Siła dowodu potrzebnego do
odrzucenia H
0
zależy od
konsekwencji podjęcia takiej decyzji.
Kosztowne: silny dowód
Wybór poziomu istotności
Lepiej podawać p-wartość, która
pozwala każdemu z nas decydować
indywidualnie czy mamy
wystarczająco silne dowody.
Nie ma ostrej granicy między
„istotny” a „nieistotny” a jedynie
rosnąca siła dowodu przy malejącej
p-wartości.
Czego istotność
statystyczna nie oznacza?
Istotność statystyczna to nie to samo co
praktyczna istotność.
Przykład: hipoteza bez zależności jest odrzucana
Nie oznacza mocnego związku, ale że jest silny dowód
na istnienie jakiegoś związku
Kilka punktów odstających może się
przyczynić do zaobserwowania wysokiej
istotności wyniku testu, jeśli ślepo stosuje
się testy istotności.
Punkty odstające mogą również zniwelować
istotność.
Nie ignoruj braku
istotności
Jeśli badacz ma wyraźny powód
podejrzewać, że zależność istnieje a potem
nie może znaleźć istotnego dowodu nań, to
może to być ciekawą wiadomością ---
czasami ciekawszą niż to gdyby
potwierdzono związek na poziomie
istotności 5%.
Ukrywanie negatywnych wyników może
skazać innych badaczy na poszukiwanie
zależności, która nie istnieje.
Wnioskowanie statystyczne nie
jest słuszne dla wszystkich
danych
Formalne wnioskowanie
statystyczne nie koryguje błędnie
przeprowadzonego eksperymentu.
Losowość próbkowania gwarantuje,
że prawa probabilistyki mają
zastosowanie w naszych testach
istotności oraz wyznaczanych
przedziałach ufności.
Nie szukaj na siłę
znamienności
statystycznej!
Można także wnioskować bez
uwzględniania istotności
statystycznej.
Jeśli zdecydujesz jakiego wyniku
szukasz, zaprojektuj eksperyment
lub próbę, która Cię do niego
doprowadzi i zastosuj test istotności
żeby ocenić wagę dowodów.
Nie szukaj na siłę
znamienności
statystycznej!
Ponieważ udane próby szukania
zjawisk naukowych zwykle kończą
się znalezieniem istotności
statystycznej, uczynienie samej
istotności obiektem poszukiwań
jest zbyt nęcące.
Nie szukaj na siłę
znamienności
statystycznej!
Jeśli już masz hipotezę, zaprojektuj
badanie tak, żeby otrzymać wynik,
który uważasz za istniejący.
Jeśli wynik badania jest
statystycznie istotny, masz już
rzeczywisty dowód.
Moc i wnioskowanie
Badanie użyteczności przedziału
ufności
Poziom ufności: mówi nam jak
niezawodna jest ta metoda przy
wielokrotnych powtórzeniach
eksperymentu.
Margines błędu: mówi nam, jak czuła
jest ta metoda lub jak bardzo przedział
ogranicza szacowanie parametru
Moc i wnioskowanie
Badanie użyteczności testów istotności
przy ustalonym α.
Poziom istotności: mówi nam jak
wiarygodna jest ta metoda w użyciu
Moc testu
: mówi nam o zdolności testu do
wykrywania tego, że hipoteza zerowa jest
fałszywa
Mierzona jako prawdopodobieństwo że test
odrzuci hipotezę zerową kiedy alternatywna jest
prawdziwa.
Im wyższe prawdopodobieństwo, tym
bardziej czuły jest test.
Moc testu
Prawdopodobieństwo, że test
istotności przy ustalonym α odrzuci
H
0
, kiedy alternatywna wartość
parametru jest prawdziwa, jest
nazywane mocą testu do
wykrywania tej alternatywy.
Obliczanie mocy testu
Sformułuj H
0
, H
a
(konkretną
alternatywę, którą chcemy wykryć) i
poziom istotności α.
Znajdź wartości , które
spowodują że odrzucimy H
0
.
Oblicz prawdopodobieństwo
zaobserwowania tych wartości , dla
których alternatywa jest prawdziwa.
x
x
Zwiększanie mocy testu
Zwiększ α. 5%-owy test istotności
będzie miał większą szansę odrzucenia
alternatywy niż 1%-owy, ponieważ jest
wymagana mniejsza siła dowodu.
Weź taką alternatywę, która jest dalej
od μ
0
. Wartości μ, które są w H
a
ale
leżą blisko do hipotetycznej wartości μ
0
są cięższe do wykrycia (mniejsza moc)
niż wartości μ, które są daleko od μ
0
.
Zwiększanie mocy testu,
cd.
Zwiększ rozmiar próby. Więcej danych
dostarczy więcej informacji o więc jest
większa szansa odróżnienia wartości μ.
Zmniejsz σ. To daje taki sam efekt jak
zwiększanie rozmiaru próby: więcej
informacji o μ. Poprawienie procesu
pomiarów i ograniczenie uwagi na
subpopulacje to dwa najpopularniejsze
sposoby na zmniejszenie σ.
x
Dwa typy błędów
Podczas przeprowadzania testów istotności
musimy przyjąć jedną hipotezę a drugą
odrzucić.
Mamy nadzieję że jest to trafna decyzja, ale nie
musi tak być.
2 typy niewłaściwych decyzji:
Jeśli odrzucimy H
0
(przyjmiemy H
a
) kiedy w
rzeczywistości H
0
jest prawdziwe, jest to błąd
pierwszego rodzaju (odniesiony do p-wartości).
Jeśli przyjmiemy H
0
(odrzucimy H
a
) kiedy w
rzeczywistości H
a
jest prawdziwe, jest to błąd
drugiego rodzaju (odniesiony do mocy).
Prawdopodobieństwa
błędów
Statystyczne wnioskowanie jest oparte na
prawdopodobieństwie.
Jakakolwiek zasada podejmowania decyzji jest
związana z prawdopodobieństwami popełnienia dwóch
rodzajów błędów.
Poziom istotności α jakiegokolwiek testu z ustalonym
poziomem jest prawdopodobieństwem popełnienia
błędu pierwszego rodzaju.
α jest prawdopodobieństwem że test odrzuci zerową hipotezę
H
0
kiedy w rzeczywistości jest prawdziwa.
Moc testu przeprowadzonego na zadanym poziomie istotności
α określona dla zadanej alternatywy wynosi 1 minus
prawdopodobieństwo popełnienia błędu drugiego rodzaju dla
tej alternatywy.
Ogólnie przyjęte
postępowanie przy
testowaniu hipotez
Zdefiniuj H
0
i H
a
tak samo jak do testu
istotności.
Popatrz na problem jak na decyzję -
prawdopodobieństwa popełnienia błędów
I-szego i II-ego rodzaju są powiązane.
Błędy pierwszego rodzaju są poważniejsze.
Wybierz α (poziom istotności) i rozważ
testy tylko takie, gdzie
prawdopodobieństwo popełnienia błędu I-
szego rodzaju nie jest większe od α.
Ogólnie przyjęte
postępowanie przy
testowaniu hipotez
Spośród testów wybierz ten, który ma
jak najmniejsze prawdopodobieństwo
popełnienia błędu II-ego rodzaju (czyli
jak największą moc). Jeśli to
prawdopodobieństwo jest zbyt duże,
będziesz musisz wziąć większą liczbę
prób żeby zmniejszyć ryzyko błędu.
Testy dla wartości średniej
w populacji – jednostronny
test t
Niech prosta próba losowa (PPL) o liczności n
jest losowana z populacji o nieznanej wart.
oczekiwanej μ. Żeby zweryfikować hipotezę
że H
0
: μ = μ
0
na podstawie PPL, oblicz
statystykę t
Zmienna losowa T ma rozkład t(n-1), P-
wartość dla testu H
0
przeciw H
a
: μ > μ
0
wynosi albo dla H
a
: μ < μ
0
n
/
s
x
t
0
t
T
P
)
t
T
(
P
Test t - przykład 1
Niech PPL o liczności n jest losowana z
populacji o nieznanej wartości
oczekiwanej μ.
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111,
121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że H
0
: μ =
μ
0
=120 na podstawie PPL liczności n,
oblicz statystykę t dla jednej próby
6764
.
0
12
/
89
.
5
120
15
.
121
n
/
s
x
t
0
Test t - przykład 1
W kategoriach zmiennej losowej T
z rozkładem t(n-1), P-wartość dla
testu H
0
przeciw H
a
: μ > μ
0
wynosi
t
T
P
stopień swobody
Wartość krytyczna dla
α=0.95
Jeśli t
1
=0.6 to cdf(t
1
)=0.71967 więc p
1
=1-
0.71967=0.28033
Jeśli t
2
=0.7 to cdf(t
2
)=0.75077 więc p
2
=1-
0.75077=0.24923
więc p
2
< p < p
1
Test t - przykład 1
Z rozkładu t Studenta
otrzymujemy
tcdf(0.6764,11) = 0.743621
p = 1 – 0.743621 =
0.256379
Test t - przykład 1
Test t - przykład 1
0.7436
p=0.2564
Test t - przykład 1
Końcowy wniosek:
Nie możemy odrzucić H
0
mówiącej, że wartość średnia w
populacji wynosi μ=120 i przyjąć
H
a
z p=0.2564
Test t – przykład 2
Żeby zweryfikować hipotezę H
0
: μ = 135
na podstawie PPL liczności n, obliczmy
statystykę t dla jednej próby:
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu na
H
0
przeciw
H
a
: μ < μ
0
wynosi
n
/
s
135
x
t
t
T
P
Test t - przykład 2
[114, 123.3, 116.7, 129.0, 118, 124.6,
123.1, 117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że
H
0
: μ = μ
0
=135, obliczmy
statystykę t
1456
.
8
12
/
89
.
5
135
15
.
121
n
/
s
x
t
0
Z rozkładu t Studenta
otrzymujemy
P(T ≤ t)
=
tcdf(-8.1456,11) =2.7e-6
p =
0.0000027 < 0.000005
Test t - przykład 2
Test t - przykład 2
p=2.7e-6
t = -8.1456
Test t - przykład 2
Końcowy wniosek:
Odrzucamy H
0
mówiącą, że wartość
średnia w populacji wynosi μ=135 i
przyjmujemy H
a
: μ < μ
0
z p <
0.000005
Testy dla wartości średniej w
populacji – dwustronny test t
Żeby zweryfikować hipotezę że H
0
: μ =
115
na podstawie PPL liczności n,
obliczmy statystykę t
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu H
0
przeciw
H
a
: μ ≠ μ
0
wynosi
n
/
s
115
x
t
|
t
|
|
T
|
P
Test t - przykład 3
[114, 123.3, 116.7, 129.0, 118, 124.6,
123.1, 117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że
H
0
: μ = μ
0
=115 obliczmy
statystykę t
6170
.
3
12
/
89
.
5
115
15
.
121
n
/
s
x
t
0
• Ponieważ wartość krytyczna
t
0.05
=2.2010 a nasza obserwowana
wartość jest wyższa, odrzucamy
hipotezę zerową na poziomie α=0.05.
• Z rozkładu t otrzymujemy
P(|T| > |t|)
= 2*(1-
tcdf(3.6170,11)) =
0.0040
Więc dokładnie p =
0.0040
Test t - przykład 3
Test t - przykład 3
p=0.0040
-t = -3.6170
t = 3.6170
Test t - przykład 3
Końcowy wniosek:
odrzucamy H
0
że wartość średnia w
populacji wynosi μ=115 i
przyjmujemy H
a
: μ ≠ μ
0
z p =
0.0040
Pary obserwacji - test t
W badaniu par obserwacji wyniki
są łączone w pary i porównywane
w jej obrębie.
Przykład: wyniki przed i po kursie
Pary obserwacji - analiza
•
Analiza par obserwacji jest
konieczna kiedy mamy dwa
pomiary lub obserwacje każdego
obiektu i chcemy zbadać zmianę
jednej względem drugiej.
Zazwyczaj obserwacje w pewnym
sensie są pomiarami „przed” i
„po”.
Pary obserwacji - analiza
•
W każdej parze odejmuje się
pomiar „przed” od pomiaru „po”.
•
Analizuje się rozkład różnic
stosując przedziały ufności i testy
istotności dla jednej próby.
Pary obserwacji –
przykład 4
Gain średnia z próby = 2.5
Gain odchylenie standardowe z próby =
2.89
Aby zweryfikować hipotezę H
0
: μ =
μ
0
=0 (brak różnic) przeciwko H
A
: μ
≠ 0 na podstawie PPL o liczności n,
obliczamy statystykę testową t
8686
.
3
20
/
89
.
2
0
5
.
2
/
0
n
s
x
t
• Wartość krytyczna t
[0.05,19]
=2.0930.
•Obliczona statystyka t jest większa
niż wartość krytyczna, odrzucamy
zatem hipotezę zerową na poziomie
α=0.05.
• Z rozkładu t znajdujemy
P(|T| > |t|)
= 2*(1-
tcdf(3.8686,19)) =
0.001
Zatem dokładna wartość p =
0.001
Pary obserwacji –
przykład 4
• Zakładając poziom istotności α, możemy
przeprowadzić test dla wartości średniej w
populacji wykorzystując przedział ufności
określony dla poziomu C=1-α.
• Obliczamy dolną i górną granicę przedziału
ufności i sprawdzamy, czy µ
0
należy do tego
przedziału.
• Jeśli tak, to nie mamy podstaw do odrzucenia
hipotezy zerowej H
0
: μ = μ
0
• Jest to równoważne przeprowadzeniu
dwustronnego testu t na poziomie istotności
α.
Wykorzystanie przedziałów ufności
do wnioskowania o wartości
średniej w populacji
Przykład 3 – przedziały
ufności
[114, 123.3, 116.7, 129.0, 118, 124.6,
123.1, 117.4, 111, 121.7, 124.5, 130.5]
Średnia z próby = 121.15
Odchylenie standardowe z próby =
5.89, α=0.05
89
.
124
12
89
.
5
2010
.
2
15
.
121
41
.
117
12
89
.
5
2010
.
2
15
.
121
11
,
05
.
0
2
11
,
05
.
0
1
n
s
t
Y
L
n
s
t
Y
L
Przykład 3 – przedziały
ufności
Przedział ufności
Hipoteza zerowa H
0
: μ =115,
hipoteza alternatywna H
A
: µ≠115.
Ponieważ
odrzucamy hipotezę zerowa na
poziomie α=0.05
95
.
0
89
.
124
41
.
117
P
)
89
.
124
,
41
.
117
(
115
Odporność procedur t
Wnioskowanie statystyczne jest
nazywane odpornym, jeśli wymagane
metodyka obliczeń jest nieczuła na
naruszenie przyjętych założeń.
Procedury t są dość odporne na
odstępstwa od normalności rozkładu
populacji z wyjątkiem obserwowania
silnej skośności rozkłądu lub
występowania punktów odstających.
Odporność procedur t
Większe próby to większa dokładność
oszacowania P-wartości oraz wartości
krytycznych dystrybucji t, gdy rozkład
populacji nie jest normalny.
W przypadku małolicznych prób, zanim
przejdzie się do testów t należy
narysować wykres qq lub ramkowy w
celu sprawdzenia skośności i punktów
ostających.
Praktyczne wskazówki do
wnioskowania o średniej
Liczność próby: mniej niż 15: Zastosuj
procedury t jeśli dane mają w przybliżeniu
rozkład normalny. Jeśli ich rozkład jest daleki
od normalnego, albo zaobserwowaliśmy punkty
odstające, nie używaj t.
Liczność próby co najmniej 15: Można
zastosować procedury t, chyba że istnieją
punkty odstające lub rozkład jest bardzo skośny
Duże próby: Można stosować procedury t,
nawet dla skośnych rozkładów, ale liczność
musi być duża: ponad 40
Porównywanie dwóch
średnich
Problemy z dwiema próbami
Cel wnioskowania: porównanie
odpowiedzi w dwóch grupach.
Przyjmuje się że każda grupa to próba
z oddzielnej populacji.
Odpowiedzi w każdej z grup są
niezależne.
Pojęcia
Populacja
Zmienna
Średnia
Odchylenie standardowe
Liczność próby
Średnia próby
Odchylenie standardowe próby
Test z dla dwóch prób
Naturalny estymator różnicy μ
1
- μ
2
jest różnicą dwóch średnich prób,
Żeby wnioskować z tej statystyki
musimy znać jej rozkład próbkowania.
Jeśli rozkłady obu populacji są normalne,
rozkład
jest także normalny.
2
1
x
x
2
1
x
x
2
2
2
1
2
1
2
1
,
n
n
N
Test z dla dwóch prób
Niech jest średnią prostej próby losowej o
liczności n
1
z populacji o rozkładzie N(μ
1,
σ
1
)
a to średnia PPL o liczności n
2
z populacji
o rozkładzie N(μ
2,
σ
2
). Wtedy taka statystyka
ma standardowy rozkład funkcji gęstości
prawdopodobieństwa N(0,1).
1
x
2
x
2
2
2
1
2
1
2
1
2
1
n
n
x
x
z
Test t dla dwóch prób
Ten test zakłada że populacje, z
których wzięto próbki mają
równe wariancje
Statystyka t dla dwóch
prób
Jeśli odchylenia standardowe
populacji nie są znane,
przybliżamy je na podstawie
odchylenia standardowego próby.
Stosuj właściwy wzór, zależny od
liczności prób: n
1
i n
2
.
Statystyka t dla dwóch
prób
Kiedy liczności prób są różne i
przynajmniej jedno z n
1
i n
2
jest
małe (<30) stosuj:
Taka statystyka ma rozkład t Studenta
z k=n
1
+ n
2
– 2 stopniami swobody.
2
1
2
1
2
1
2
2
2
2
1
1
2
1
2
1
n
n
n
n
2
n
n
s
)
1
n
(
s
)
1
n
(
x
x
t
Statystyka t dla dwóch
prób
Kiedy n
1
i n
2
są sobie równe
(niezależnie od liczności) zastosuj:
Taka statystyka ma rozkład t Studenta
z k=2(n – 1) stopniami swobody.
n
s
s
x
x
t
2
2
2
1
2
1
2
1
Statystyka t dla dwóch
prób
Kiedy n
1
i n
2
są różne, ale duże (≥30)
stosuj:
Taka statystyka ma rozkład t Studenta
z k=n
1
+ n
2
- 2 stopniami swobody.
2
2
2
1
2
1
2
1
2
1
n
s
n
s
x
x
t
Test istotności t dla dwóch
prób
Niech prosta próba losowa o liczności n
1
jest losowana z populacji o rozkładzie
normalnym z nieznaną wartością
oczekiwaną μ
1
i jest niezależna od
drugiej próby o liczności n
2
, losowanej z
innej populacji o nieznanej wartości
oczekiwanej μ
2.
Zakładamy że odchylenia standardowe
obu populacji są równe.
Test istotności t dla dwóch
prób
Żeby zweryfikować hipotezę H
0
: μ
1
= μ
2
przeciw H
a
: μ
1
≠ μ
2
, obliczymy
odpowiednią statystykę t i użyjemy
P-wartości lub wartości
krytycznych dla rozkładu t
Studenta z odpowiednim stopniem
swobody.
Test istotności t dla
dwóch prób – przykład 5
Niech PPL o liczności n
1
jest losowana z
populacji o nieznanej wartości oczekiwanej μ
1
.
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Kolejna PPL o liczności n
2
jest losowana z
populacji o nieznanej wartości oczekiwanej μ
2
.
[120, 125.5, 126, 125.5, 128.5, 125, 128, 116,
122, 121, 117, 125]
średnia próby = 123.29
odchylenie standardowe próby = 4.08
Test istotności t dla
dwóch prób – przykład 5
0383
.
1
n
s
s
x
x
t
2
2
2
1
2
1
2
1
=0 z założenia
p = 0.3104
Wniosek: nie możemy odrzucić hipotezy, że wartości
średnie obu populacji są równe na poziomie istotności
α=0.05
Ponieważ n
1
=n
2
=12
Przedział ufności dla dwóch
prób
Niech PPL liczności n
1
jest losowana z
normalnej populacji o nieznanej wart.
oczekiwanej μ
1
i kolejna PPL o liczności n
2
jest
losowana z kolejnej normalnej populacji o
nieznanej wart. oczekiwanej μ
2
. Dla dużych n
1
i n
2
przedział ufności dla μ
1
- μ
2
jest dany przez
gdzie statystyka t ma n
1
+n
2
-2 stopni swobody.
2
2
2
1
2
1
2
1
2
2
2
1
2
1
2
1
*
,
*
n
s
n
s
t
x
x
n
s
n
s
t
x
x
Odporność procedur dla
dwóch prób
Procedury t dla dwóch prób są bardziej
odporne niż metody t dla jednej próby.
Jeśli liczności obu prób są równe a rozkłady
porównywanych populacji mają podobne
kształty, otrzymujemy dobrą dokładność.
Jeśli kształty rozkładów populacji są różne,
potrzeba prób o większej liczności.
Planując badanie oparte na dwóch
próbach, powinieneś zwykle wybierać
równe liczności tych prób.
Przybliżony test t Welch’a
równości wartości średnich
dwóch populacji o różnych
wariancjach
Przybliżony test t Welch’a
Ten test oblicza przybliżoną t-
wartość, taką
’
, dla której krytyczna
wartość jest liczona jako średnia
ważona pojedynczych wartości
krytycznych t odpowiadających
stopniom swobody dwóch prób.
Przybliżony test t Welch’a
Dwupróbowa statystyka t
’
jest
równa:
2
2
2
1
2
1
2
1
2
1
n
s
n
s
x
x
't
Przybliżony test t Welch’a
Wartość krytyczna t
α’
dla błędu
pierwszego rodzaju jest liczona
jako:
2
2
2
1
2
1
2
2
2
]
[
1
2
1
]
[
n
s
n
s
n
s
t
n
s
t
't
2
1
Testy dla wariancji w
populacji
Mamy PPL o liczności n losowaną z
rozkładu normalnego. Chcemy
testować hipotezę, że wariancja w
populacji σ
2
ma określoną wartość σ
02
.
Hipoteza zerowa: H
0
: σ
2
= σ
02
.
Hipoteza alternatywna: H
A
: σ
2
≠ σ
02
Jest to test dwustronny, testy
jednostronne można wyprowadzić
analogicznie
Testy dla wariancji w
populacji – test X
2
Z definicji rozkładu Χ
2
Ponieważ statystyka X
2
ma rozkład
postępujemy następująco::
Oblicz X
2
Znajdź wartości krytyczne dla testu
dwustronnego dla zadanego poziomu
istotności α
Porównaj wartość statystyki testowej z
robszarem krytycznym.
2
2
2
'
2
)
1
(
s
n
X
X
n
i
2
]
1
[
n
Testy dla wartości wariancji w
populacji – przykład 6
Producent twierdzi, że wariancja średnicy
tulejek wynosi 100.
Odchylenie standardowe z próby, oszacowane
na podstawie 10 pomiarów, wynosi 11.2
Statystyka testowa
Wartości krytyczne dla testu dwustronnego na
poziomie α=0.05 dla 9 stopni swobody
wynoszą odpowiednio 2.700 oraz 19.023.
Wartość statystyki testowe jest mniejsza niż
19.023 i większa niż 2.700, prowadzi to do
akceptacji hipotezy zerowej na poziomie
α=0.05.
290
.
11
100
)
2
.
11
(
9
)
1
(
2
2
2
2
'
2
s
n
X
X
n
i
Rozkład F
Załóżmy, że losowanie dokonywane
jest z populacji o rozkładzie normalnym
o wartości średniej µ i wariancji σ
2
.
Losujemy najpierw n
1
wartości i
obliczamy ich wariancję z próby ,
następnie losujemy n
2
wartości i
obliczamy ich wariancję z próby
Liczba stopni swobody dla obu
wariancji ν
1
=n
1
-1 oraz ν
2
=n
2
-1.
2
1
s
2
2
s
Rozkład F
Mając obie wielkości oraz ,
obliczamy
Opracowano model matematyczny
oczekiwanego rozkładu tak
zdefiniowanej zmiennej losowej i
nazwano go rozkładem F, na cześć
znanego statystyka of R.A.Fishera.
2
1
s
2
2
s
2
2
2
1
s
s
F
s
Rozkład F
W przeciwieństwie do rozkładów t i Χ
2
, kształt
rozkładu F określony jest przez dwa
parametry ν
1
i ν
2
.
Jednostronny test F
jednorodności wariancji
Hipoteza zerowa H
0
:
Hipoteza alternatywna H
A
:
Statystyka testowa:
opisana jest rozkładem F o [v
1
, v
2
]
stopniach swobody.
2
2
2
1
s
s
F
s
2
2
2
1
2
2
2
1
Jednostronny test F
jednorodności wariancji –
przykład 7
Próba 1: n
1
=7,
Próba 2: n
2
=29,
Hipoteza zerowa H
0
:
Hipoteza alternatywna H
A
:
Statystyka testowa:
ma rozkład F o [6, 28] stopniach swobody.
2
2
2
1
32
.
1
029
.
16
181
.
21
2
2
2
1
s
s
F
s
2
2
2
1
180
.
21
2
1
s
029
.
16
2
2
s
Jednostronny test F
jednorodności wariancji –
przykład 7
32
.
1
F
Ponieważ
wartość
statystyki F nie
należy do
obszaru
krytycznego,
przyjmujemy
hipotezę zerową
na poziomie
α=0.05
Dwustronny test F
jednorodności wariancji –
przykład 8
Próba 1: n
1
=10,
Próba 2: n
2
=15,
Hipoteza zerowa H
0
:
Hipoteza alternatywna H
A
:
Statystyka testowa:
ma rozkład F o [9,14] stopniach swobody.
2
2
2
1
7134
.
0
021
.
18
856
.
12
2
2
2
1
s
s
F
s
2
2
2
1
856
.
12
2
1
s
021
.
18
2
2
s
Dwustronny test F
jednorodności wariancji –
przykład 8
7134
.
0
F
Since our F
statistic does
not belong to
the rejection
region, we
accept null
hypothesis at
α=0.05
Test Bartlett’a
homogeniczności
(jednorodności) wariancji
Testowanie hipotezy zerowej
mówiącej że dwie lub więcej
populacje reprezentowane przez
dwie lub więcej próby mają równe
wariancje.
Hipoteza alternatywna mówi że co
najmniej jedna wariancja jest inna
Przykład 9
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
9
Hipoteza zerowa H
0
:
Hipoteza alternatywna H
A
:
Poziom istotności α=0.005
Próba 1: Treatment group n
1
=21,
s
1
=11.01,
Próba 2: Control group n
2
=23, s
2
=17.15
Naturalne logarytmy z wariancji:
ln(11.01
2
)=4.80 oraz ln(17.15
2
)= 5.68
2
2
2
1
2
2
2
1
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
9
Suma liczby stopni swobody: 20+22=42
Średnia ważona wariancji:
Logarytm naturalny średniej ważonej wariancji:
5.36
Suma ważona logarytmów wariancji składowych
Statystyka testowa
Korekta skalująca C=1.0398
79
.
211
42
15
.
17
*
22
01
.
11
*
20
2
2
2
s
96
.
220
68
.
5
*
22
80
.
4
*
20
16
.
4
96
.
220
36
.
5
*
42
2
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
9
Skorygowana wartość statystyki testowej
4.16/1.0398=4.00
Wartość krytyczna dla 1 stopnia swobody i
poziomu istotności α=0.005 wynosi 9.14.
Ponieważ wartość statystyki testowej (4.00) jest
mniejsza od wartości krytycznej (9.14), nie mamy
podstaw do odrzucenia hipotezy zerowej na
poziomie α=0.005.
Wniosek końcowy: wariancje są jednorodne.
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10
Oblicz logarytm naturalny
wariancji każdej z prób.
Zsumuj liczby stopni swobody
Oblicz średnią ważoną wariancji i
jej logarytm naturalny
a
i
95
9
...
12
17
)
1
n
(
185167
.
2
112459
.
0
ln
,
112459
.
0
)
1
n
(
s
)
1
n
(
s
a
i
a
2
i
i
2
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10
Oblicz ważoną sumę logarytmów
wariancji każdej z prób
Oblicz statystykę
227545
.
229
s
ln
)
1
n
(
a
2
i
i
636721
.
21
s
ln
)
1
n
(
s
ln
)
1
n
(
X
a
2
i
i
2
a
i
2
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10
Jeśli hipoteza zerowa jest
prawdziwa, to skorygowana
statystyka X
2
ma w przybliżeniu
rozkład χ
2
o a-1 stopniach
swobody.
914
.
20
034566
.
1
63672
.
21
C
X
X
034566
.
1
)
1
n
(
1
1
n
1
)
1
a
(
3
1
1
C
2
2
kor
a
a
i
i
Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10
475
.
18
2
]
7
[
01
.
0
Wartość krytyczna dla a-1=7 stopni
swobody oraz alfa = 0.01 wynosi
Wartość skorygowanej statystyki wynosi
20.914. Wnioskujemy więc, że wariancje są
niejednorodne.