wyklad 5 Testy parametryczne PL

background image

Wykład 5: Testy parametryczne

Biometria i

Biostatystyka

background image

Testy Istotności

Czemu służą?

Formułowanie hipotez

Statystyka testowa

P-wartości

Istotność/znamienność statystyczna

Testowanie wartości średniej w populacji

Dwustronne testy istotności i przedziały

ufności

P-wartości vs. ustalone α

background image

Testy Istotności

2 najczęściej stosowane formy
wnioskowania statystycznego

Przedział ufności

Ocena parametru populacji

Test istotności

Ocena słuszności konkretnych stwierdzeń
o populacji dokonana na podstawie
dowodów dostarczonych przez dane.

background image

Testy istotności jako
narzędzie wnioskowania
statystycznego

Test istotności

Formalna procedura porównywania

zebranych danych z hipotezą, której

prawdziwość chcemy ocenić.

Hipoteza: stwierdzenie o parametrach

populacji lub modelu

Wyniki testu są wyrażone w postaci

prawdopodobieństwa, które mierzy

jak hipoteza się zgadza z danymi

background image

Testowanie hipotez

Hipoteza zerowa

Stwierdzenie będące przedmiotem
testu istotności

Test istotności jest tak skonstruowany,
by ocenić siłę dowodów przeciw niej

Stwierdzenie w postaci “brak wpływu”
lub “brak różnic”

Skrót: H

0

background image

Testowanie hipotez, cd.

Hipoteza alternatywna

Stwierdzenie, które podejrzewamy o

prawdziwość jako alternatywę dla H

0

Skrót: H

a

Hipotezy zawsze odnoszą się do populacji lub

modelu, nie do poszczególnych wyników.

Hipotezy testów parametrycznych dotyczą

parametrów populacji.

Istnieją jednostronne lub dwustronne

hipotezy alternatywne.

background image

Statystyki testowe

Test opiera się na statystyce szacującej parametr,

o którym mówi hipoteza. Zwykle jest to taka sama

estymata, którą wykorzystuje się przy

konstruowaniu przedziałów ufności dla badanego

parametru. Kiedy H

0

jest prawdziwa, oczekujemy,

że estymacja daje wartości bliskie tym

wynikającym z H

0

.

Wartości estymat dalekie od wartości parametru

opisanej przez H

0

dostarczają dowodu przeciw H

0

.

Hipoteza alternatywna determinuje, który kierunek

uważamy za sprzyjający H

a

.

background image

Statystyki testowe, cd.

Statystyki testowe

Mierzą zgodność hipotezy zerowej i
danych.

Używane są do obliczania
prawdopodobieństwa, które
potrzebujemy do testu istotności.

Zmienne losowe ze znanym
rozkładem.

background image

P-wartości

Test istotności znajduje
prawdopodobieństwo otrzymania
wyniku tak skrajnego lub bardziej,
niż w danej chwili obserwowany

.

Skrajny: daleki od tego, którego
byśmy się spodziewali gdyby hipoteza
zerowa była prawdziwa

background image

P-wartości, cd.

Prawdopodobieństwo, obliczane przy

założeniu prawdziwości H

0

, że statystyka

testowa da wynik tak skrajny lub bardziej niż

w danej chwili obserwowany jest nazywane P-

wartością testu.

Im mniejsza P-wartość, tym mocniejszy

dowód przeciw H

0

dostarczony przez dane

Oblicza się ją używając funkcji rozkładu

gęstości prawdopodobieństwa statystyki

testowej (np. standardowego rozkładu

normalnego dla statystyki testowej z).

background image

background image

background image

Istotność Statystyczna

Jeśli poziom P jest mniejsza lub równa
niż α, mówimy że dane są znamienne
statystycznie na poziomie istotności α.

Przykład:

poziom istotności 0.01 znaczy

że mamy dowód tak silny, że pojawiałby
się tylko w 1% obserwacji, gdyby
hipoteza zerowa była rzeczywiście
prawdziwa.

Co mówi P-wartość równa 0.03?

background image

Krok 1. Korzystając z generatora liczb
losowych N(0,1) wygeneruj dwa
zbiory pomiarów po 16 pomiarów w
każdym

Krok 2. Zapamiętaj P-wartości
uzyskane z zastosowanego testu
statystycznego (np. testu t)

Liczba powtórzeń kroków 1-2:
N=25000

Przykład obliczeniowy

background image

background image

background image

background image

N = 1262

background image

Test istotności - kroki

Można ocenić istotność dowodów

przeciw hipotezie zerowej dostarczonych

przez dane wykonując czynności:

1.

Sformułuj hipotezę zerową H

0

i hipotezę

alternatywną H

a

. Test jest przeznaczony do

oceny siły dowodów przeciw H

0

. H

a

jest

stwierdzeniem które zaakceptujemy jeśli

dowody pozwolą nam odrzucić H

0

.

2.

Oblicz wartość statystyki testowej. Ta

statystyka zwykle określa jak daleko dane są

od H

0

.

background image

Test istotności - kroki

3.

Znajdź P-wartość dla obserwowanych danych. Jest

to prawdopodobieństwo (przyjmując, że hipoteza

zerowa jest prawdziwa), że statystyka będzie się

opowiadać przeciw hipotezie co najmniej tak silnie

jak z tymi danymi.

4.

Sformułuj wniosek. Wybierz poziom istotności α (jak

bardzo dowód przeciw H

0

uznajesz za decydujący).

Jeśli P-wartość jest mniejsza lub równa α - wniosek,

że hipoteza alternatywna jest prawdziwa; jeśli jest

większa od α - wniosek, że dane nie dostarczają

wystarczająco silnego dowodu do odrzucenia H

0

.

Twój wniosek jest podsumowaniem badań

wykonanych za pomocą testu istotności.

background image

Testy dla wartości średniej w
populacji

Mamy prostą próbę losową o liczności n

wylosowanej z normalnej populacji o

nieznananej średniej μ ale ze znaną wariancją

σ

2

. Chcemy sprawdzić hipotezę że μ ma

określoną wartość, np. μ

0

.

Hipoteza zerowa: H

0

: μ = μ

0

.

Statystyka testowa:

jeśli hipoteza zerowa jest prawdziwa, to statystyka z

ma standardowy rozkład normalny.

n

x

z

/

0

background image

Testy dla wartości średniej w
populacji

Alternatywna hipoteza: Jeśli jest
jednostronna to np. H

a

: μ > μ

0

P-wartość: prawdopodobieństwo, że
standardowa normalna zmienna
losowa Z przybierze wartość co
najmniej taką jak obserwowana z.

Możemy podobnie wnioskować dla
innych hipotez alternatywnych.

background image

background image

background image

Dwustronne testy
istotności i przedziały
ufności

Poziom α dwustronnego testu
istotności odrzuca hipotezę H

0

: μ =

μ

0

dokładnie wtedy, gdy wartość μ

0

znajduje się poza przedziałem
ufności dla dla μ obliczonym dla
poziomu 1-α .

background image

background image

P-wartości vs. ustalone α

P-wartość to najmniejszy poziom α, na

którym dane są istotne.

Znając P-wartość możemy ocenić istotność

na każdym poziomie.

To daje więcej informacji niż sprawdzanie

odrzucony-lub-nie na ustalonym poziomie

istotności.

Wartość z*, taka że P{Z>z

*

} jest równa

zadanej liczbie a, 0<a<1, jest nazywana

wartością krytyczną standardowego

rozkładu normalnego.

background image

background image

background image

Wykorzystywanie i
nadużywanie testów

Wybieranie poziomu istotności

Wybierz poziom α z góry jeśli musisz
dokonać decyzji.

Nie ma sensu, jeśli chcesz jedynie opisać siłę
swoich dowodów.

Jeśli stosujesz test istotności z ustalonym α
żeby podjąć decyzję, wybierz α pytając jak
silny dowód jest potrzebny żeby odrzucić H

0

.

To też zależy od tego jak wiarygodna jest hipoteza
zerowa.

background image

Wybór poziomu istotności

Jeśli H

0

reprezentuje hipotezę, w

którą każdy wierzył przez lata, będzie
potrzebny mocny dowód (małe α)
żeby je obalić.

Siła dowodu potrzebnego do
odrzucenia H

0

zależy od

konsekwencji podjęcia takiej decyzji.

Kosztowne: silny dowód

background image

Wybór poziomu istotności

Lepiej podawać P-wartość, która
pozwala każdemu z nas decydować
indywidualnie czy mamy
wystarczająco silne dowody.

Nie ma ostrej granicy między
„istotny” a „nieistotny” a jedynie
rosnąca siła dowodu przy malejącej
P-wartości.

background image

Czego istotność
statystyczna nie oznacza?

Istotność statystyczna to nie to samo co

praktyczna istotność.

Przykład: hipoteza bez zależności jest odrzucana

Nie oznacza mocnego związku, ale że jest silny dowód

na istnienie jakiegoś związku

Kilka punktów odstających może się

przyczynić do zaobserwowania wysokiej

istotności wyniku testu, jeśli ślepo stosuje

się testy istotności.

Punkty odstające mogą również zniwelować

istotność.

background image

Nie ignoruj braku
istotności

Jeśli badacz ma wyraźny powód
podejrzewać, że zależność istnieje a potem
nie może znaleźć istotnego dowodu nań, to
może to być ciekawą wiadomością ---
czasami ciekawszą niż to gdyby
potwierdzono związek na poziomie
istotności 5%.

Ukrywanie negatywnych wyników może
skazać innych badaczy na poszukiwanie
zależności, która nie istnieje.

background image

Wnioskowanie statystyczne nie
jest słuszne dla wszystkich
danych

Formalne wnioskowanie
statystyczne nie koryguje błędnie
przeprowadzonego eksperymentu.

Losowość próbkowania gwarantuje,
że prawa probabilistyki mają
zastosowanie w naszych testach
istotności oraz wyznaczanych
przedziałach ufności.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Można także wnioskować bez
uwzględniania istotności
statystycznej.

Jeśli zdecydujesz jakiego wyniku
szukasz, zaprojektuj eksperyment
lub próbę, która Cię do niego
doprowadzi i zastosuj test istotności
żeby ocenić wagę dowodów.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Ponieważ udane próby szukania
zjawisk naukowych zwykle kończą
się znalezieniem istotności
statystycznej, uczynienie samej
istotności obiektem poszukiwań
jest zbyt nęcące.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Jeśli już masz hipotezę, zaprojektuj
badanie tak, żeby otrzymać wynik,
który uważasz za istniejący.

Jeśli wynik badania jest
statystycznie istotny, masz już
rzeczywisty dowód.

background image

Moc i wnioskowanie

Badanie użyteczności przedziału
ufności

Poziom ufności: mówi nam jak
niezawodna jest ta metoda przy
wielokrotnych powtórzeniach
eksperymentu.

Margines błędu: mówi nam, jak czuła
jest ta metoda lub jak bardzo przedział
ogranicza szacowanie parametru

background image

Moc i wnioskowanie

Badanie użyteczności testów istotności

przy ustalonym α.

Poziom istotności: mówi nam jak

wiarygodna jest ta metoda w użyciu

Moc testu

: mówi nam o zdolności testu do

wykrywania tego, że hipoteza zerowa jest

fałszywa

Mierzona jako prawdopodobieństwo że test

odrzuci hipotezę zerową kiedy alternatywna jest

prawdziwa.

Im wyższe prawdopodobieństwo, tym

bardziej czuły jest test.

background image

Moc testu

Prawdopodobieństwo, że test
istotności przy ustalonym α odrzuci
H

0

, kiedy alternatywna wartość

parametru jest prawdziwa, jest
nazywane mocą testu do
wykrywania tej alternatywy.

background image

Obliczanie mocy testu

Sformułuj H

0

, H

a

(konkretną

alternatywę, którą chcemy wykryć) i
poziom istotności α.

Znajdź wartości , które
spowodują że odrzucimy H

0

.

Oblicz prawdopodobieństwo
zaobserwowania tych wartości , dla
których alternatywa jest prawdziwa.

x

x

background image

background image

Zwiększanie mocy testu

Zwiększ α. 5%-owy test istotności

będzie miał większą szansę odrzucenia

alternatywy niż 1%-owy, ponieważ jest

wymagana mniejsza siła dowodu.

Weź taką alternatywę, która jest dalej

od μ

0

. Wartości μ, które są w H

a

ale

leżą blisko do hipotetycznej wartości μ

0

są cięższe do wykrycia (mniejsza moc)

niż wartości μ, które są daleko od μ

0

.

background image

Zwiększanie mocy testu,
cd.

Zwiększ rozmiar próby. Więcej danych
dostarczy więcej informacji o więc jest
większa szansa odróżnienia wartości μ.

Zmniejsz σ. To daje taki sam efekt jak
zwiększanie rozmiaru próby: więcej
informacji o μ. Poprawienie procesu
pomiarów i ograniczenie uwagi na
subpopulacje to dwa najpopularniejsze
sposoby na zmniejszenie σ.

x

background image

Dwa typy błędów

Podczas przeprowadzania testów istotności

musimy przyjąć jedną hipotezę a drugą

odrzucić.

Mamy nadzieję na trafność decyzji, ale nie

zawsze jest to dobry wybór.

2 typy niewłaściwych decyzji:

Jeśli odrzucimy H

0

(przyjmiemy H

a

) kiedy w

rzeczywistości H

0

jest prawdziwe, jest to błąd

pierwszego rodzaju (odniesiony do p-wartości).

Jeśli przyjmiemy H

0

(odrzucimy H

a

) kiedy w

rzeczywistości H

a

jest prawdziwe, jest to błąd

drugiego rodzaju (odniesiony do mocy).

background image

background image

Ogólnie przyjęte
postępowanie przy
testowaniu hipotez

Zdefiniuj H

0

i H

a

tak samo jak do testu

istotności.

Popatrz na problem jak na decyzję -

prawdopodobieństwa popełnienia błędów

I-szego i II-ego rodzaju są powiązane.

Błędy pierwszego rodzaju są poważniejsze.

Wybierz α (poziom istotności) i rozważ

testy tylko takie, gdzie

prawdopodobieństwo popełnienia błędu I-

szego rodzaju nie jest większe od α.

background image

Ogólnie przyjęte
postępowanie przy
testowaniu hipotez

Spośród testów wybierz ten, który ma
jak najmniejsze prawdopodobieństwo
popełnienia błędu II-ego rodzaju (czyli
jak największą moc). Jeśli to
prawdopodobieństwo jest zbyt duże,
będziesz musisz wziąć większą liczbę
prób żeby zmniejszyć ryzyko błędu.

background image

Jednostronny test t dla
jednej próby

Niech prosta próba losowa (PPL) o liczności n
jest losowana z populacji o nieznanej wart.
oczekiwanej μ. Żeby zweryfikować hipotezę
że H

0

: μ = μ

0

na podstawie PPL, oblicz

statystykę t

Zmienna losowa T ma rozkład t(n-1), P-
wartość dla testu H

0

przeciw H

a

: μ > μ

0

wynosi a przeciw H

a

: μ < μ

0

wynosi

n

/

s

x

t

0

t

T

P

)

t

T

(

P

background image

background image

Test t - przykład 1

Niech PPL o liczności n jest losowana z
populacji o nieznanej wartości
oczekiwanej μ.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111,
121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że H

0

: μ =

μ

0

=120 na podstawie PPL liczności n,

oblicz statystykę t dla jednej próby

6764

.

0

12

/

89

.

5

120

15

.

121

n

/

s

x

t

0

background image

Test t - przykład 1

W kategoriach zmiennej losowej T
z rozkładem t(n-1), P-wartość dla
testu H

0

przeciw H

a

: μ > μ

0

wynosi

t

T

P

background image

stopień swobody

Wartość krytyczna dla
α=0.95

background image

Jeśli t

1

=0.6 to cdf(t

1

)=0.71967 więc p

1

=1-

0.71967=0.28033

Jeśli t

2

=0.7 to cdf(t

2

)=0.75077 więc p

2

=1-

0.75077=0.24923

więc p

2

< p < p

1

Test t - przykład 1

background image

Z rozkładu t Studenta
otrzymujemy

tcdf(0.6764,11) = 0.743621

p = 1 – 0.743621 =

0.256379

Test t - przykład 1

background image

Test t - przykład 1

0.7436

p=0.2564

background image

Test t - przykład 1

Końcowy wniosek:

Nie możemy odrzucić H

0

mówiącej, że wartość średnia w
populacji wynosi μ=120 i przyjąć
H

a

z p=0.2564

background image

Kolejny przykład jednostronnego
testu t dla jednej próby

Żeby zweryfikować hipotezę H

0

: μ = 135

na podstawie PPL liczności n, obliczmy

statystykę t dla jednej próby:

W kategoriach zmiennej losowej T z

rozkładem t(n-1), P-wartość dla testu na

H

0

przeciw

H

a

: μ < μ

0

wynosi

n

/

s

135

x

t

t

T

P

background image

background image

Test t - przykład 2

[114, 123.3, 116.7, 129.0, 118, 124.6,

123.1, 117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że
H

0

: μ = μ

0

=135, obliczmy

statystykę t

1456

.

8

12

/

89

.

5

135

15

.

121

n

/

s

x

t

0

background image

Z rozkładu t Studenta
otrzymujemy

P(T ≤ t)

=

tcdf(-8.1456,11) =2.7e-6

p =

0.0000027 < 0.000005

Test t - przykład 2

background image

Test t - przykład 2

p=2.7e-6

t = -8.1456

background image

Test t - przykład 2

Końcowy wniosek:

Odrzucamy H

0

mówiącą, że wartość

średnia w populacji wynosi μ=135 i
przyjmujemy H

a

: μ < μ

0

z p <

0.000005

background image

Dwustronny test t dla jednej
próby

Żeby zweryfikować hipotezę że H

0

: μ =

115

na podstawie PPL liczności n,

obliczmy statystykę t

W kategoriach zmiennej losowej T z

rozkładem t(n-1), P-wartość dla testu H

0

przeciw

H

a

: μ ≠ μ

0

wynosi

n

/

s

115

x

t

|

t

|

|

T

|

P

background image

background image

Test t - przykład 3

[114, 123.3, 116.7, 129.0, 118, 124.6,

123.1, 117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że
H

0

: μ = μ

0

=115 obliczmy

statystykę t

6170

.

3

12

/

89

.

5

115

15

.

121

n

/

s

x

t

0

background image

• Ponieważ wartość krytyczna

t

0.05

=2.2010 a nasza obserwowana

wartość jest wyższa, odrzucamy
hipotezę zerową na poziomie α=0.05.

• Z rozkładu t otrzymujemy

P(|T| > |t|)

= 2*(1-

tcdf(3.6170,11)) =

0.0040

Więc dokładnie p =

0.0040

Test t - przykład 3

background image

Test t - przykład 3

p=0.0040

-t = -3.6170

t = 3.6170

background image

Test t - przykład 3

Końcowy wniosek:

odrzucamy H

0

że wartość średnia w

populacji wynosi μ=115 i
przyjmujemy H

a

: μ ≠ μ

0

z p =

0.0040

background image

Pary obserwacji - test t

W badaniu par obserwacji wyniki
są łączone w pary i porównywane
w jej obrębie.

Przykład: wyniki przed i po kursie

background image

background image

Kluczowe punkty odnośnie
par obserwacji

Analiza par obserwacji jest
konieczna kiedy mamy dwa
pomiary lub obserwacje każdego
obiektu i chcemy zbadać zmianę
jednej względem drugiej.
Zazwyczaj obserwacje w pewnym
sensie są pomiarami „przed” i
„po”.

background image

Kluczowe punkty odnośnie
łączonych par

W każdej parze odejmuje się
pomiar „przed” od pomiaru „po”.

Analizuje się rozkład różnic
stosując przedziały ufności i testy
istotności dla jednej próby.

background image

Odporność procedur t

Wnioskowanie statystyczne jest
nazywane odpornym, jeśli wymagane
metodyka obliczeń jest nieczuła na
naruszenie przyjętych założeń.

Procedury t są dość odporne na
odstępstwa od normalności rozkładu
populacji z wyjątkiem obserwowania
silnej skośności rozkłądu lub
występowania punktów odstających.

background image

Odporność procedur t

Większe próby to większa dokładność
oszacowania P-wartości oraz wartości
krytycznych dystrybucji t, gdy rozkład
populacji nie jest normalny.

W przypadku małolicznych prób, zanim
przejdzie się do testów t należy
narysować wykres qq lub ramkowy w
celu sprawdzenia skośności i punktów
ostających.

background image

Praktyczne wskazówki do
wnioskowania z jednej
średniej

Liczność próby: mniej niż 15: Zastosuj

procedury t jeśli dane mają w przybliżeniu

rozkład normalny. Jeśli ich rozkład jest daleki

od normalnego, albo zaobserwowaliśmy punkty

odstające, nie używaj t.

Liczność próby co najmniej 15: Można

zastosować procedury t, chyba że istnieją

punkty odstające lub rozkład jest bardzo skośny

Duże próby: Można stosować procedury t,

nawet dla skośnych rozkładów, ale liczność

musi być duża: ponad 40

background image

Porównywanie dwóch
średnich

Problemy z dwiema próbami

Cel wnioskowania: porównanie
odpowiedzi w dwóch grupach.

Przyjmuje się że każda grupa to próba
z oddzielnej populacji.

Odpowiedzi w każdej z grup są
niezależne.

background image

Pojęcia

Populacja

Zmienna

Średnia

Odchylenie standardowe

Liczność próby

Średnia próby

Odchylenie standardowe próby

background image

Statystyka z dla dwóch
prób

Naturalny estymator różnicy μ

1

- μ

2

jest

różnicą dwóch średnich prób,

Żeby wnioskować z tej statystyki
musimy znać jej rozkład próbkowania.

Jeśli rozkłady obu populacji są normalne,
rozkład
jest także normalny.

2

1

x

x

2

1

x

x



2

2

2

1

2

1

2

1

,

n

n

N

background image

Statystyka z dla dwóch
prób

Niech jest średnią prostej próby losowej o
liczności n

1

z populacji o rozkładzie N(μ

1,

σ

1

)

a to średnia PPL o liczności n

2

z populacji

o rozkładzie N(μ

2,

σ

2

). Wtedy taka statystyka

ma standardowy rozkład funkcji gęstości
prawdopodobieństwa N(0,1).

1

x

2

x

 

2

2

2

1

2

1

2

1

2

1

n

n

x

x

z

background image

background image

background image

background image

Procedura t dla dwóch
prób

Ten test zakłada że populacje, z

których wzięto próbki mają
równe wariancje

background image

Procedura t dla dwóch
prób

Jeśli odchylenia standardowe
populacji nie są znane,
przybliżamy je na podstawie
odchylenia standardowego próby.

Stosuj właściwy wzór, zależny od
liczności prób: n

1

i n

2

.

background image

Procedura t dla dwóch
prób

Kiedy liczności prób są różne i

przynajmniej jedno z n

1

i n

2

jest

małe (<30) stosuj:

Taka statystyka ma rozkład t Studenta

z k=n

1

+ n

2

– 2 stopniami swobody.

 





 





2

1

2

1

2

1

2

2

2

2

1

1

2

1

2

1

n

n

n

n

2

n

n

s

)

1

n

(

s

)

1

n

(

x

x

t

background image

Procedura t dla dwóch
prób

Kiedy n

1

i n

2

są sobie równe

(niezależnie od liczności) zastosuj:

Taka statystyka ma rozkład t Studenta

z k=2(n – 1) stopniami swobody.

 

n

s

s

x

x

t

2

2

2

1

2

1

2

1

background image

Procedura t dla dwóch
prób

Kiedy n

1

i n

2

są różne, ale duże (≥30)

stosuj:

Taka statystyka ma rozkład t Studenta

z k=n

1

+ n

2

- 2 stopniami swobody.

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

t

background image

Test istotności t dla dwóch
prób

Niech prosta próba losowa o liczności n

1

jest losowana z populacji o rozkładzie
normalnym z nieznaną wartością
oczekiwaną μ

1

i jest niezależna od

drugiej próby o liczności n

2

, losowanej z

innej populacji o nieznanej wartości
oczekiwanej μ

2.

Zakładamy że odchylenia standardowe
obu populacji są równe.

background image

Test istotności t dla dwóch
prób

Żeby zweryfikować hipotezę H

0

: μ

1

= μ

2

przeciw H

a

: μ

1

≠ μ

2

, obliczymy

odpowiednią statystykę t i użyjemy
P-wartości lub wartości
krytycznych dla rozkładu t
Studenta z odpowiednim stopniem
swobody.

background image

Test istotności t dla
dwóch prób - przykład

Niech PPL o liczności n

1

jest losowana z

populacji o nieznanej wartości oczekiwanej μ

1

.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Kolejna PPL o liczności n

2

jest losowana z

populacji o nieznanej wartości oczekiwanej μ

2

.

[120, 125.5, 126, 125.5, 128.5, 125, 128, 116,
122, 121, 117, 125]

średnia próby = 123.29

odchylenie standardowe próby = 4.08

background image

Test istotności t dla
dwóch prób - przykład

 

0383

.

1

n

s

s

x

x

t

2

2

2

1

2

1

2

1

=0 z założenia

p = 0.3104

Wniosek: nie możemy odrzucić hipotezy, że wartości
średnie obu populacji są równe na poziomie istotności
α=0.05

Ponieważ n

1

=n

2

=12

background image

Przedział ufności dla dwóch
prób

Niech PPL liczności n

1

jest losowana z

normalnej populacji o nieznanej wart.

oczekiwanej μ

1

i kolejna PPL o liczności n

2

jest

losowana z kolejnej normalnej populacji o

nieznanej wart. oczekiwanej μ

2

. Dla dużych n

1

i n

2

przedział ufności dla μ

1

- μ

2

jest dany przez

gdzie statystyka t ma n

1

+n

2

-2 stopni swobody.

2

2

2

1

2

1

2

1

2

2

2

1

2

1

2

1

*

,

*

n

s

n

s

t

x

x

n

s

n

s

t

x

x

background image

Odporność procedur dla
dwóch prób

Procedury t dla dwóch prób są bardziej

odporne niż metody t dla jednej próby.

Jeśli liczności obu prób są równe a rozkłady

porównywanych populacji mają podobne

kształty, otrzymujemy dobrą dokładność.

Jeśli kształty rozkładów populacji są różne,

potrzeba prób o większej liczności.

Planując badanie oparte na dwóch

próbach, powinieneś zwykle wybierać

równe liczności tych prób.

background image

Test Bartlett’a
homogeniczności
(jednorodności) wariancji

Testowanie hipotezy zerowej
mówiącej że dwie populacje
reprezentowane przez dwie próby
mają równe wariancje.

Hipoteza alternatywna mówi że
dwie wariancje są różne

background image

background image

Test jednorodności wariancji
Bartletta

Oblicz logarytm naturalny
wariancji każdej z prób.

Zsumuj liczby stopni swobody

Oblicz średnią ważoną wariancji i
jej logarytm naturalny

a

i

95

9

...

12

17

)

1

n

(

185167

.

2

112459

.

0

ln

,

112459

.

0

)

1

n

(

s

)

1

n

(

s

a

i

a

2

i

i

2

background image

Test jednorodności wariancji
Bartletta

Oblicz ważoną sumę logarytmów
wariancji każdej z prób

Oblicz statystykę

227545

.

229

s

ln

)

1

n

(

a

2

i

i

636721

.

21

s

ln

)

1

n

(

s

ln

)

1

n

(

X

a

2

i

i

2

a

i

2

background image

Test jednorodności wariancji
Bartletta

Jeśli hipoteza zerowa jest
prawdziwa, to skorygowana
statystyka X

2

ma w przybliżeniu

rozkład χ

2

o a-1 stopniach

swobody.

914

.

20

034566

.

1

63672

.

21

C

X

X

034566

.

1

)

1

n

(

1

1

n

1

)

1

a

(

3

1

1

C

2

2

kor

a

a

i

i

background image

Test jednorodności wariancji
Bartletta

475

.

18

2

]

7

[

01

.

0

Wartość krytyczna dla a-1=7 stopni
swobody oraz alfa = 0.01 wynosi

Wartość skorygowanej statystyki wynosi
20.914. Wnioskujemy więc, że wariancje są
niejednorodne.

background image

Przybliżony test t Welch’a
równości wartości średnich
dwóch populacji o różnych
wariancjach

background image

Przybliżony test t Welch’a

Ten test oblicza przybliżoną t-

wartość, taką

, dla której krytyczna

wartość jest liczona jako średnia

ważona pojedynczych wartości

krytycznych t odpowiadających

stopniom swobody dwóch prób.

background image

Przybliżony test t Welch’a

Dwupróbowa statystyka t

jest

równa:

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

't

background image

Przybliżony test t Welch’a

Wartość krytyczna t

α’

dla błędu

pierwszego rodzaju jest liczona
jako:

2

2

2

1

2

1

2

2

2

]

[

1

2

1

]

[

n

s

n

s

n

s

t

n

s

t

't

2

1

background image

Przybliżony test t Welch’a

Ta statystyka NIE MA rozkładu t ale
możemy przybliżyć rozkład t’ dla
dwóch prób stosując rozkład t(k) z
przybliżeniem liczby stopni
swobody k.

k równa się mniejszą z dwóch liczb:
n

1

–1 oraz n

2

–1.

background image

Zadanie domowe


Document Outline


Wyszukiwarka

Podobne podstrony:
Wyklad 5 Testy parametryczne
wyklad 5 Testy parametryczne
Wyklad 6 Testy zgodnosci dopasowania PL
wyklad 6 Testy zgodnosci dopasowania PL
Wyklad 6 Testy zgodnosci dopasowania PL
wyklad 6 Testy zgodnosci dopasowania PL
wyklad 2 Prezentacja danych PL
pytania testowe i chemia budowlana -zestaw3, Szkoła, Pollub, SEMESTR II, chemia, wykład, testy
Wykład X fizjo antastic pl
Wykład 6 fizjo antastic pl
lipidy 2, Prywatne, Biochemia WYKŁADÓWKA I, Biochemia wykładówka 1, TESTY, testy
Wykład II antastic pl
wykład 8 fizjo antastic pl
Wykład 6 dobrostan antastic pl
Rozne wyklady-[ www.potrzebujegotowki.pl ], Ściągi i wypracowania
chemia wyklady wskrzynka(1), BUDOWNICTWO PŁ, Semestr I, chemia wykład

więcej podobnych podstron