Wykład 5: Testy parametryczne
Biometria i
Biostatystyka
Testy Istotności
Czemu służą?
Formułowanie hipotez
Statystyka testowa
P-wartości
Istotność/znamienność statystyczna
Testowanie wartości średniej w populacji
Dwustronne testy istotności i przedziały
ufności
P-wartości vs. ustalone α
Testy Istotności
2 najczęściej stosowane formy
wnioskowania statystycznego
Przedział ufności
Ocena parametru populacji
Test istotności
Ocena słuszności konkretnych stwierdzeń
o populacji dokonana na podstawie
dowodów dostarczonych przez dane.
Testy istotności jako
narzędzie wnioskowania
statystycznego
Test istotności
Formalna procedura porównywania
zebranych danych z hipotezą, której
prawdziwość chcemy ocenić.
Hipoteza: stwierdzenie o parametrach
populacji lub modelu
Wyniki testu są wyrażone w postaci
prawdopodobieństwa, które mierzy
jak hipoteza się zgadza z danymi
Testowanie hipotez
Hipoteza zerowa
Stwierdzenie będące przedmiotem
testu istotności
Test istotności jest tak skonstruowany,
by ocenić siłę dowodów przeciw niej
Stwierdzenie w postaci “brak wpływu”
lub “brak różnic”
Skrót: H
0
Testowanie hipotez, cd.
Hipoteza alternatywna
Stwierdzenie, które podejrzewamy o
prawdziwość jako alternatywę dla H
0
Skrót: H
a
Hipotezy zawsze odnoszą się do populacji lub
modelu, nie do poszczególnych wyników.
Hipotezy testów parametrycznych dotyczą
parametrów populacji.
Istnieją jednostronne lub dwustronne
hipotezy alternatywne.
Statystyki testowe
Test opiera się na statystyce szacującej parametr,
o którym mówi hipoteza. Zwykle jest to taka sama
estymata, którą wykorzystuje się przy
konstruowaniu przedziałów ufności dla badanego
parametru. Kiedy H
0
jest prawdziwa, oczekujemy,
że estymacja daje wartości bliskie tym
wynikającym z H
0
.
Wartości estymat dalekie od wartości parametru
opisanej przez H
0
dostarczają dowodu przeciw H
0
.
Hipoteza alternatywna determinuje, który kierunek
uważamy za sprzyjający H
a
.
Statystyki testowe, cd.
Statystyki testowe
Mierzą zgodność hipotezy zerowej i
danych.
Używane są do obliczania
prawdopodobieństwa, które
potrzebujemy do testu istotności.
Zmienne losowe ze znanym
rozkładem.
P-wartości
Test istotności znajduje
prawdopodobieństwo otrzymania
wyniku tak skrajnego lub bardziej,
niż w danej chwili obserwowany
.
Skrajny: daleki od tego, którego
byśmy się spodziewali gdyby hipoteza
zerowa była prawdziwa
P-wartości, cd.
Prawdopodobieństwo, obliczane przy
założeniu prawdziwości H
0
, że statystyka
testowa da wynik tak skrajny lub bardziej niż
w danej chwili obserwowany jest nazywane P-
wartością testu.
Im mniejsza P-wartość, tym mocniejszy
dowód przeciw H
0
dostarczony przez dane
Oblicza się ją używając funkcji rozkładu
gęstości prawdopodobieństwa statystyki
testowej (np. standardowego rozkładu
normalnego dla statystyki testowej z).
Istotność Statystyczna
Jeśli poziom P jest mniejsza lub równa
niż α, mówimy że dane są znamienne
statystycznie na poziomie istotności α.
Przykład:
poziom istotności 0.01 znaczy
że mamy dowód tak silny, że pojawiałby
się tylko w 1% obserwacji, gdyby
hipoteza zerowa była rzeczywiście
prawdziwa.
Co mówi P-wartość równa 0.03?
Krok 1. Korzystając z generatora liczb
losowych N(0,1) wygeneruj dwa
zbiory pomiarów po 16 pomiarów w
każdym
Krok 2. Zapamiętaj P-wartości
uzyskane z zastosowanego testu
statystycznego (np. testu t)
Liczba powtórzeń kroków 1-2:
N=25000
Przykład obliczeniowy
N = 1262
Test istotności - kroki
Można ocenić istotność dowodów
przeciw hipotezie zerowej dostarczonych
przez dane wykonując czynności:
1.
Sformułuj hipotezę zerową H
0
i hipotezę
alternatywną H
a
. Test jest przeznaczony do
oceny siły dowodów przeciw H
0
. H
a
jest
stwierdzeniem które zaakceptujemy jeśli
dowody pozwolą nam odrzucić H
0
.
2.
Oblicz wartość statystyki testowej. Ta
statystyka zwykle określa jak daleko dane są
od H
0
.
Test istotności - kroki
3.
Znajdź P-wartość dla obserwowanych danych. Jest
to prawdopodobieństwo (przyjmując, że hipoteza
zerowa jest prawdziwa), że statystyka będzie się
opowiadać przeciw hipotezie co najmniej tak silnie
jak z tymi danymi.
4.
Sformułuj wniosek. Wybierz poziom istotności α (jak
bardzo dowód przeciw H
0
uznajesz za decydujący).
Jeśli P-wartość jest mniejsza lub równa α - wniosek,
że hipoteza alternatywna jest prawdziwa; jeśli jest
większa od α - wniosek, że dane nie dostarczają
wystarczająco silnego dowodu do odrzucenia H
0
.
Twój wniosek jest podsumowaniem badań
wykonanych za pomocą testu istotności.
Testy dla wartości średniej w
populacji
Mamy prostą próbę losową o liczności n
wylosowanej z normalnej populacji o
nieznananej średniej μ ale ze znaną wariancją
σ
2
. Chcemy sprawdzić hipotezę że μ ma
określoną wartość, np. μ
0
.
Hipoteza zerowa: H
0
: μ = μ
0
.
Statystyka testowa:
jeśli hipoteza zerowa jest prawdziwa, to statystyka z
ma standardowy rozkład normalny.
n
x
z
/
0
Testy dla wartości średniej w
populacji
Alternatywna hipoteza: Jeśli jest
jednostronna to np. H
a
: μ > μ
0
P-wartość: prawdopodobieństwo, że
standardowa normalna zmienna
losowa Z przybierze wartość co
najmniej taką jak obserwowana z.
Możemy podobnie wnioskować dla
innych hipotez alternatywnych.
Dwustronne testy
istotności i przedziały
ufności
Poziom α dwustronnego testu
istotności odrzuca hipotezę H
0
: μ =
μ
0
dokładnie wtedy, gdy wartość μ
0
znajduje się poza przedziałem
ufności dla dla μ obliczonym dla
poziomu 1-α .
P-wartości vs. ustalone α
P-wartość to najmniejszy poziom α, na
którym dane są istotne.
Znając P-wartość możemy ocenić istotność
na każdym poziomie.
To daje więcej informacji niż sprawdzanie
odrzucony-lub-nie na ustalonym poziomie
istotności.
Wartość z*, taka że P{Z>z
*
} jest równa
zadanej liczbie a, 0<a<1, jest nazywana
wartością krytyczną standardowego
rozkładu normalnego.
Wykorzystywanie i
nadużywanie testów
Wybieranie poziomu istotności
Wybierz poziom α z góry jeśli musisz
dokonać decyzji.
Nie ma sensu, jeśli chcesz jedynie opisać siłę
swoich dowodów.
Jeśli stosujesz test istotności z ustalonym α
żeby podjąć decyzję, wybierz α pytając jak
silny dowód jest potrzebny żeby odrzucić H
0
.
To też zależy od tego jak wiarygodna jest hipoteza
zerowa.
Wybór poziomu istotności
Jeśli H
0
reprezentuje hipotezę, w
którą każdy wierzył przez lata, będzie
potrzebny mocny dowód (małe α)
żeby je obalić.
Siła dowodu potrzebnego do
odrzucenia H
0
zależy od
konsekwencji podjęcia takiej decyzji.
Kosztowne: silny dowód
Wybór poziomu istotności
Lepiej podawać P-wartość, która
pozwala każdemu z nas decydować
indywidualnie czy mamy
wystarczająco silne dowody.
Nie ma ostrej granicy między
„istotny” a „nieistotny” a jedynie
rosnąca siła dowodu przy malejącej
P-wartości.
Czego istotność
statystyczna nie oznacza?
Istotność statystyczna to nie to samo co
praktyczna istotność.
Przykład: hipoteza bez zależności jest odrzucana
Nie oznacza mocnego związku, ale że jest silny dowód
na istnienie jakiegoś związku
Kilka punktów odstających może się
przyczynić do zaobserwowania wysokiej
istotności wyniku testu, jeśli ślepo stosuje
się testy istotności.
Punkty odstające mogą również zniwelować
istotność.
Nie ignoruj braku
istotności
Jeśli badacz ma wyraźny powód
podejrzewać, że zależność istnieje a potem
nie może znaleźć istotnego dowodu nań, to
może to być ciekawą wiadomością ---
czasami ciekawszą niż to gdyby
potwierdzono związek na poziomie
istotności 5%.
Ukrywanie negatywnych wyników może
skazać innych badaczy na poszukiwanie
zależności, która nie istnieje.
Wnioskowanie statystyczne nie
jest słuszne dla wszystkich
danych
Formalne wnioskowanie
statystyczne nie koryguje błędnie
przeprowadzonego eksperymentu.
Losowość próbkowania gwarantuje,
że prawa probabilistyki mają
zastosowanie w naszych testach
istotności oraz wyznaczanych
przedziałach ufności.
Nie szukaj na siłę
znamienności
statystycznej!
Można także wnioskować bez
uwzględniania istotności
statystycznej.
Jeśli zdecydujesz jakiego wyniku
szukasz, zaprojektuj eksperyment
lub próbę, która Cię do niego
doprowadzi i zastosuj test istotności
żeby ocenić wagę dowodów.
Nie szukaj na siłę
znamienności
statystycznej!
Ponieważ udane próby szukania
zjawisk naukowych zwykle kończą
się znalezieniem istotności
statystycznej, uczynienie samej
istotności obiektem poszukiwań
jest zbyt nęcące.
Nie szukaj na siłę
znamienności
statystycznej!
Jeśli już masz hipotezę, zaprojektuj
badanie tak, żeby otrzymać wynik,
który uważasz za istniejący.
Jeśli wynik badania jest
statystycznie istotny, masz już
rzeczywisty dowód.
Moc i wnioskowanie
Badanie użyteczności przedziału
ufności
Poziom ufności: mówi nam jak
niezawodna jest ta metoda przy
wielokrotnych powtórzeniach
eksperymentu.
Margines błędu: mówi nam, jak czuła
jest ta metoda lub jak bardzo przedział
ogranicza szacowanie parametru
Moc i wnioskowanie
Badanie użyteczności testów istotności
przy ustalonym α.
Poziom istotności: mówi nam jak
wiarygodna jest ta metoda w użyciu
Moc testu
: mówi nam o zdolności testu do
wykrywania tego, że hipoteza zerowa jest
fałszywa
Mierzona jako prawdopodobieństwo że test
odrzuci hipotezę zerową kiedy alternatywna jest
prawdziwa.
Im wyższe prawdopodobieństwo, tym
bardziej czuły jest test.
Moc testu
Prawdopodobieństwo, że test
istotności przy ustalonym α odrzuci
H
0
, kiedy alternatywna wartość
parametru jest prawdziwa, jest
nazywane mocą testu do
wykrywania tej alternatywy.
Obliczanie mocy testu
Sformułuj H
0
, H
a
(konkretną
alternatywę, którą chcemy wykryć) i
poziom istotności α.
Znajdź wartości , które
spowodują że odrzucimy H
0
.
Oblicz prawdopodobieństwo
zaobserwowania tych wartości , dla
których alternatywa jest prawdziwa.
x
x
Zwiększanie mocy testu
Zwiększ α. 5%-owy test istotności
będzie miał większą szansę odrzucenia
alternatywy niż 1%-owy, ponieważ jest
wymagana mniejsza siła dowodu.
Weź taką alternatywę, która jest dalej
od μ
0
. Wartości μ, które są w H
a
ale
leżą blisko do hipotetycznej wartości μ
0
są cięższe do wykrycia (mniejsza moc)
niż wartości μ, które są daleko od μ
0
.
Zwiększanie mocy testu,
cd.
Zwiększ rozmiar próby. Więcej danych
dostarczy więcej informacji o więc jest
większa szansa odróżnienia wartości μ.
Zmniejsz σ. To daje taki sam efekt jak
zwiększanie rozmiaru próby: więcej
informacji o μ. Poprawienie procesu
pomiarów i ograniczenie uwagi na
subpopulacje to dwa najpopularniejsze
sposoby na zmniejszenie σ.
x
Dwa typy błędów
Podczas przeprowadzania testów istotności
musimy przyjąć jedną hipotezę a drugą
odrzucić.
Mamy nadzieję na trafność decyzji, ale nie
zawsze jest to dobry wybór.
2 typy niewłaściwych decyzji:
Jeśli odrzucimy H
0
(przyjmiemy H
a
) kiedy w
rzeczywistości H
0
jest prawdziwe, jest to błąd
pierwszego rodzaju (odniesiony do p-wartości).
Jeśli przyjmiemy H
0
(odrzucimy H
a
) kiedy w
rzeczywistości H
a
jest prawdziwe, jest to błąd
drugiego rodzaju (odniesiony do mocy).
Ogólnie przyjęte
postępowanie przy
testowaniu hipotez
Zdefiniuj H
0
i H
a
tak samo jak do testu
istotności.
Popatrz na problem jak na decyzję -
prawdopodobieństwa popełnienia błędów
I-szego i II-ego rodzaju są powiązane.
Błędy pierwszego rodzaju są poważniejsze.
Wybierz α (poziom istotności) i rozważ
testy tylko takie, gdzie
prawdopodobieństwo popełnienia błędu I-
szego rodzaju nie jest większe od α.
Ogólnie przyjęte
postępowanie przy
testowaniu hipotez
Spośród testów wybierz ten, który ma
jak najmniejsze prawdopodobieństwo
popełnienia błędu II-ego rodzaju (czyli
jak największą moc). Jeśli to
prawdopodobieństwo jest zbyt duże,
będziesz musisz wziąć większą liczbę
prób żeby zmniejszyć ryzyko błędu.
Jednostronny test t dla
jednej próby
Niech prosta próba losowa (PPL) o liczności n
jest losowana z populacji o nieznanej wart.
oczekiwanej μ. Żeby zweryfikować hipotezę
że H
0
: μ = μ
0
na podstawie PPL, oblicz
statystykę t
Zmienna losowa T ma rozkład t(n-1), P-
wartość dla testu H
0
przeciw H
a
: μ > μ
0
wynosi a przeciw H
a
: μ < μ
0
wynosi
n
/
s
x
t
0
t
T
P
)
t
T
(
P
Test t - przykład 1
Niech PPL o liczności n jest losowana z
populacji o nieznanej wartości
oczekiwanej μ.
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111,
121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że H
0
: μ =
μ
0
=120 na podstawie PPL liczności n,
oblicz statystykę t dla jednej próby
6764
.
0
12
/
89
.
5
120
15
.
121
n
/
s
x
t
0
Test t - przykład 1
W kategoriach zmiennej losowej T
z rozkładem t(n-1), P-wartość dla
testu H
0
przeciw H
a
: μ > μ
0
wynosi
t
T
P
stopień swobody
Wartość krytyczna dla
α=0.95
Jeśli t
1
=0.6 to cdf(t
1
)=0.71967 więc p
1
=1-
0.71967=0.28033
Jeśli t
2
=0.7 to cdf(t
2
)=0.75077 więc p
2
=1-
0.75077=0.24923
więc p
2
< p < p
1
Test t - przykład 1
Z rozkładu t Studenta
otrzymujemy
tcdf(0.6764,11) = 0.743621
p = 1 – 0.743621 =
0.256379
Test t - przykład 1
Test t - przykład 1
0.7436
p=0.2564
Test t - przykład 1
Końcowy wniosek:
Nie możemy odrzucić H
0
mówiącej, że wartość średnia w
populacji wynosi μ=120 i przyjąć
H
a
z p=0.2564
Kolejny przykład jednostronnego
testu t dla jednej próby
Żeby zweryfikować hipotezę H
0
: μ = 135
na podstawie PPL liczności n, obliczmy
statystykę t dla jednej próby:
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu na
H
0
przeciw
H
a
: μ < μ
0
wynosi
n
/
s
135
x
t
t
T
P
Test t - przykład 2
[114, 123.3, 116.7, 129.0, 118, 124.6,
123.1, 117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że
H
0
: μ = μ
0
=135, obliczmy
statystykę t
1456
.
8
12
/
89
.
5
135
15
.
121
n
/
s
x
t
0
Z rozkładu t Studenta
otrzymujemy
P(T ≤ t)
=
tcdf(-8.1456,11) =2.7e-6
p =
0.0000027 < 0.000005
Test t - przykład 2
Test t - przykład 2
p=2.7e-6
t = -8.1456
Test t - przykład 2
Końcowy wniosek:
Odrzucamy H
0
mówiącą, że wartość
średnia w populacji wynosi μ=135 i
przyjmujemy H
a
: μ < μ
0
z p <
0.000005
Dwustronny test t dla jednej
próby
Żeby zweryfikować hipotezę że H
0
: μ =
115
na podstawie PPL liczności n,
obliczmy statystykę t
W kategoriach zmiennej losowej T z
rozkładem t(n-1), P-wartość dla testu H
0
przeciw
H
a
: μ ≠ μ
0
wynosi
n
/
s
115
x
t
|
t
|
|
T
|
P
Test t - przykład 3
[114, 123.3, 116.7, 129.0, 118, 124.6,
123.1, 117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Żeby zweryfikować hipotezę że
H
0
: μ = μ
0
=115 obliczmy
statystykę t
6170
.
3
12
/
89
.
5
115
15
.
121
n
/
s
x
t
0
• Ponieważ wartość krytyczna
t
0.05
=2.2010 a nasza obserwowana
wartość jest wyższa, odrzucamy
hipotezę zerową na poziomie α=0.05.
• Z rozkładu t otrzymujemy
P(|T| > |t|)
= 2*(1-
tcdf(3.6170,11)) =
0.0040
Więc dokładnie p =
0.0040
Test t - przykład 3
Test t - przykład 3
p=0.0040
-t = -3.6170
t = 3.6170
Test t - przykład 3
Końcowy wniosek:
odrzucamy H
0
że wartość średnia w
populacji wynosi μ=115 i
przyjmujemy H
a
: μ ≠ μ
0
z p =
0.0040
Pary obserwacji - test t
W badaniu par obserwacji wyniki
są łączone w pary i porównywane
w jej obrębie.
Przykład: wyniki przed i po kursie
Kluczowe punkty odnośnie
par obserwacji
•
Analiza par obserwacji jest
konieczna kiedy mamy dwa
pomiary lub obserwacje każdego
obiektu i chcemy zbadać zmianę
jednej względem drugiej.
Zazwyczaj obserwacje w pewnym
sensie są pomiarami „przed” i
„po”.
Kluczowe punkty odnośnie
łączonych par
•
W każdej parze odejmuje się
pomiar „przed” od pomiaru „po”.
•
Analizuje się rozkład różnic
stosując przedziały ufności i testy
istotności dla jednej próby.
Odporność procedur t
Wnioskowanie statystyczne jest
nazywane odpornym, jeśli wymagane
metodyka obliczeń jest nieczuła na
naruszenie przyjętych założeń.
Procedury t są dość odporne na
odstępstwa od normalności rozkładu
populacji z wyjątkiem obserwowania
silnej skośności rozkłądu lub
występowania punktów odstających.
Odporność procedur t
Większe próby to większa dokładność
oszacowania P-wartości oraz wartości
krytycznych dystrybucji t, gdy rozkład
populacji nie jest normalny.
W przypadku małolicznych prób, zanim
przejdzie się do testów t należy
narysować wykres qq lub ramkowy w
celu sprawdzenia skośności i punktów
ostających.
Praktyczne wskazówki do
wnioskowania z jednej
średniej
Liczność próby: mniej niż 15: Zastosuj
procedury t jeśli dane mają w przybliżeniu
rozkład normalny. Jeśli ich rozkład jest daleki
od normalnego, albo zaobserwowaliśmy punkty
odstające, nie używaj t.
Liczność próby co najmniej 15: Można
zastosować procedury t, chyba że istnieją
punkty odstające lub rozkład jest bardzo skośny
Duże próby: Można stosować procedury t,
nawet dla skośnych rozkładów, ale liczność
musi być duża: ponad 40
Porównywanie dwóch
średnich
Problemy z dwiema próbami
Cel wnioskowania: porównanie
odpowiedzi w dwóch grupach.
Przyjmuje się że każda grupa to próba
z oddzielnej populacji.
Odpowiedzi w każdej z grup są
niezależne.
Pojęcia
Populacja
Zmienna
Średnia
Odchylenie standardowe
Liczność próby
Średnia próby
Odchylenie standardowe próby
Statystyka z dla dwóch
prób
Naturalny estymator różnicy μ
1
- μ
2
jest
różnicą dwóch średnich prób,
Żeby wnioskować z tej statystyki
musimy znać jej rozkład próbkowania.
Jeśli rozkłady obu populacji są normalne,
rozkład
jest także normalny.
2
1
x
x
2
1
x
x
2
2
2
1
2
1
2
1
,
n
n
N
Statystyka z dla dwóch
prób
Niech jest średnią prostej próby losowej o
liczności n
1
z populacji o rozkładzie N(μ
1,
σ
1
)
a to średnia PPL o liczności n
2
z populacji
o rozkładzie N(μ
2,
σ
2
). Wtedy taka statystyka
ma standardowy rozkład funkcji gęstości
prawdopodobieństwa N(0,1).
1
x
2
x
2
2
2
1
2
1
2
1
2
1
n
n
x
x
z
Procedura t dla dwóch
prób
Ten test zakłada że populacje, z
których wzięto próbki mają
równe wariancje
Procedura t dla dwóch
prób
Jeśli odchylenia standardowe
populacji nie są znane,
przybliżamy je na podstawie
odchylenia standardowego próby.
Stosuj właściwy wzór, zależny od
liczności prób: n
1
i n
2
.
Procedura t dla dwóch
prób
Kiedy liczności prób są różne i
przynajmniej jedno z n
1
i n
2
jest
małe (<30) stosuj:
Taka statystyka ma rozkład t Studenta
z k=n
1
+ n
2
– 2 stopniami swobody.
2
1
2
1
2
1
2
2
2
2
1
1
2
1
2
1
n
n
n
n
2
n
n
s
)
1
n
(
s
)
1
n
(
x
x
t
Procedura t dla dwóch
prób
Kiedy n
1
i n
2
są sobie równe
(niezależnie od liczności) zastosuj:
Taka statystyka ma rozkład t Studenta
z k=2(n – 1) stopniami swobody.
n
s
s
x
x
t
2
2
2
1
2
1
2
1
Procedura t dla dwóch
prób
Kiedy n
1
i n
2
są różne, ale duże (≥30)
stosuj:
Taka statystyka ma rozkład t Studenta
z k=n
1
+ n
2
- 2 stopniami swobody.
2
2
2
1
2
1
2
1
2
1
n
s
n
s
x
x
t
Test istotności t dla dwóch
prób
Niech prosta próba losowa o liczności n
1
jest losowana z populacji o rozkładzie
normalnym z nieznaną wartością
oczekiwaną μ
1
i jest niezależna od
drugiej próby o liczności n
2
, losowanej z
innej populacji o nieznanej wartości
oczekiwanej μ
2.
Zakładamy że odchylenia standardowe
obu populacji są równe.
Test istotności t dla dwóch
prób
Żeby zweryfikować hipotezę H
0
: μ
1
= μ
2
przeciw H
a
: μ
1
≠ μ
2
, obliczymy
odpowiednią statystykę t i użyjemy
P-wartości lub wartości
krytycznych dla rozkładu t
Studenta z odpowiednim stopniem
swobody.
Test istotności t dla
dwóch prób - przykład
Niech PPL o liczności n
1
jest losowana z
populacji o nieznanej wartości oczekiwanej μ
1
.
[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]
średnia próby = 121.15
odchylenie standardowe próby = 5.89
Kolejna PPL o liczności n
2
jest losowana z
populacji o nieznanej wartości oczekiwanej μ
2
.
[120, 125.5, 126, 125.5, 128.5, 125, 128, 116,
122, 121, 117, 125]
średnia próby = 123.29
odchylenie standardowe próby = 4.08
Test istotności t dla
dwóch prób - przykład
0383
.
1
n
s
s
x
x
t
2
2
2
1
2
1
2
1
=0 z założenia
p = 0.3104
Wniosek: nie możemy odrzucić hipotezy, że wartości
średnie obu populacji są równe na poziomie istotności
α=0.05
Ponieważ n
1
=n
2
=12
Przedział ufności dla dwóch
prób
Niech PPL liczności n
1
jest losowana z
normalnej populacji o nieznanej wart.
oczekiwanej μ
1
i kolejna PPL o liczności n
2
jest
losowana z kolejnej normalnej populacji o
nieznanej wart. oczekiwanej μ
2
. Dla dużych n
1
i n
2
przedział ufności dla μ
1
- μ
2
jest dany przez
gdzie statystyka t ma n
1
+n
2
-2 stopni swobody.
2
2
2
1
2
1
2
1
2
2
2
1
2
1
2
1
*
,
*
n
s
n
s
t
x
x
n
s
n
s
t
x
x
Odporność procedur dla
dwóch prób
Procedury t dla dwóch prób są bardziej
odporne niż metody t dla jednej próby.
Jeśli liczności obu prób są równe a rozkłady
porównywanych populacji mają podobne
kształty, otrzymujemy dobrą dokładność.
Jeśli kształty rozkładów populacji są różne,
potrzeba prób o większej liczności.
Planując badanie oparte na dwóch
próbach, powinieneś zwykle wybierać
równe liczności tych prób.
Test Bartlett’a
homogeniczności
(jednorodności) wariancji
Testowanie hipotezy zerowej
mówiącej że dwie populacje
reprezentowane przez dwie próby
mają równe wariancje.
Hipoteza alternatywna mówi że
dwie wariancje są różne
Test jednorodności wariancji
Bartletta
Oblicz logarytm naturalny
wariancji każdej z prób.
Zsumuj liczby stopni swobody
Oblicz średnią ważoną wariancji i
jej logarytm naturalny
a
i
95
9
...
12
17
)
1
n
(
185167
.
2
112459
.
0
ln
,
112459
.
0
)
1
n
(
s
)
1
n
(
s
a
i
a
2
i
i
2
Test jednorodności wariancji
Bartletta
Oblicz ważoną sumę logarytmów
wariancji każdej z prób
Oblicz statystykę
227545
.
229
s
ln
)
1
n
(
a
2
i
i
636721
.
21
s
ln
)
1
n
(
s
ln
)
1
n
(
X
a
2
i
i
2
a
i
2
Test jednorodności wariancji
Bartletta
Jeśli hipoteza zerowa jest
prawdziwa, to skorygowana
statystyka X
2
ma w przybliżeniu
rozkład χ
2
o a-1 stopniach
swobody.
914
.
20
034566
.
1
63672
.
21
C
X
X
034566
.
1
)
1
n
(
1
1
n
1
)
1
a
(
3
1
1
C
2
2
kor
a
a
i
i
Test jednorodności wariancji
Bartletta
475
.
18
2
]
7
[
01
.
0
Wartość krytyczna dla a-1=7 stopni
swobody oraz alfa = 0.01 wynosi
Wartość skorygowanej statystyki wynosi
20.914. Wnioskujemy więc, że wariancje są
niejednorodne.
Przybliżony test t Welch’a
równości wartości średnich
dwóch populacji o różnych
wariancjach
Przybliżony test t Welch’a
Ten test oblicza przybliżoną t-
wartość, taką
’
, dla której krytyczna
wartość jest liczona jako średnia
ważona pojedynczych wartości
krytycznych t odpowiadających
stopniom swobody dwóch prób.
Przybliżony test t Welch’a
Dwupróbowa statystyka t
’
jest
równa:
2
2
2
1
2
1
2
1
2
1
n
s
n
s
x
x
't
Przybliżony test t Welch’a
Wartość krytyczna t
α’
dla błędu
pierwszego rodzaju jest liczona
jako:
2
2
2
1
2
1
2
2
2
]
[
1
2
1
]
[
n
s
n
s
n
s
t
n
s
t
't
2
1
Przybliżony test t Welch’a
Ta statystyka NIE MA rozkładu t ale
możemy przybliżyć rozkład t’ dla
dwóch prób stosując rozkład t(k) z
przybliżeniem liczby stopni
swobody k.
k równa się mniejszą z dwóch liczb:
n
1
–1 oraz n
2
–1.
Zadanie domowe