Wyklad 5 Testy parametryczne

background image

Wykład 5: Testy parametryczne

Biometria i

Biostatystyka

background image

Testy Istotności

Czemu służą?

Formułowanie hipotez

Statystyka testowa

P-wartości

Istotność/znamienność statystyczna

Testowanie wartości średniej w populacji

Dwustronne testy istotności i przedziały

ufności

P-wartości vs. ustalone α

background image

Testy Istotności

2 najczęściej stosowane formy
wnioskowania statystycznego

Przedział ufności

Ocena parametru populacji

Test istotności

Ocena słuszności konkretnych stwierdzeń
o populacji dokonana na podstawie
dowodów dostarczonych przez dane.

background image

Testy istotności jako
narzędzie wnioskowania
statystycznego

Test istotności

Formalna procedura porównywania

zebranych danych z hipotezą, której

prawdziwość chcemy ocenić.

Hipoteza: stwierdzenie o parametrach

populacji lub modelu

Wyniki testu są wyrażone w postaci

prawdopodobieństwa, które mierzy

jak hipoteza się zgadza z danymi

background image

Formułowanie hipotez

Hipoteza zerowa

Stwierdzenie będące przedmiotem
testu istotności

Test istotności jest tak skonstruowany,
by ocenić siłę dowodów przeciw niej

Stwierdzenie w postaci “brak wpływu”
lub “brak różnic”

Skrót: H

0

background image

Formułowanie hipotez, cd.

Hipoteza alternatywna

Stwierdzenie, które podejrzewamy o

prawdziwość jako alternatywę dla H

0

Skrót: H

a

Hipotezy zawsze odnoszą się do populacji

lub modelu, nie do poszczególnych wyników.

Hipotezy testów parametrycznych dotyczą

parametrów populacji.

Istnieją jednostronne lub dwustronne

hipotezy alternatywne.

background image

Statystyki testowe

Test opiera się na statystyce szacującej parametr,

o którym mówi hipoteza. Zwykle jest to taka sama

estymata, którą wykorzystuje się przy

konstruowaniu przedziałów ufności dla badanego

parametru. Kiedy H

0

jest prawdziwa, oczekujemy,

że estymacja daje wartości bliskie tym

wynikającym z H

0

.

Wartości estymat dalekie od wartości parametru

opisanej przez H

0

dostarczają dowodu przeciw H

0

.

Hipoteza alternatywna determinuje, który kierunek

uważamy za sprzyjający H

a

.

background image

Statystyki testowe, cd.

Statystyki testowe

Mierzą zgodność hipotezy zerowej i
danych.

Używane są do obliczania
prawdopodobieństwa, które
potrzebujemy do testu istotności.

Zmienne losowe ze znanym
rozkładem.

background image

P-wartości

Test istotności znajduje
prawdopodobieństwo otrzymania
wyniku tak skrajnego lub bardziej,
niż w danej chwili obserwowany

.

Skrajny: daleki od tego, którego
byśmy się spodziewali gdyby hipoteza
zerowa była prawdziwa

background image

P-wartości, cd.

Prawdopodobieństwo, obliczane przy

założeniu prawdziwości H

0

, że statystyka

testowa da wynik tak skrajny lub bardziej niż

w danej chwili obserwowany jest nazywane P-

wartością testu.

Im mniejsza P-wartość, tym mocniejszy

dowód przeciw H

0

dostarczony przez dane

Oblicza się ją używając funkcji rozkładu

gęstości prawdopodobieństwa statystyki

testowej (np. standardowego rozkładu

normalnego dla statystyki testowej z).

background image
background image
background image

Istotność statystyczna

Jeśli poziom P jest mniejsza lub równa
niż α, mówimy że dane są znamienne
statystycznie na poziomie istotności α.

Przykład:

poziom istotności 0.01 znaczy

że mamy dowód tak silny, że pojawiałby
się tylko w 1% obserwacji, gdyby
hipoteza zerowa była rzeczywiście
prawdziwa.

Co mówi P-wartość równa 0.03?

background image

Krok 1. Korzystając z generatora liczb
losowych N(0,1) wygeneruj dwa
zbiory pomiarów po 16 pomiarów w
każdym

Krok 2. Zapamiętaj P-wartości
uzyskane z zastosowanego testu
statystycznego (np. testu t)

Liczba powtórzeń kroków 1-2:
N=25000

Symulacje numeryczne

background image
background image
background image
background image

N = 1262

background image

Test istotności - kroki

Można ocenić istotność dowodów

przeciw hipotezie zerowej dostarczonych

przez dane wykonując czynności:

1.

Sformułuj hipotezę zerową H

0

i hipotezę

alternatywną H

a

. Test jest przeznaczony do

oceny siły dowodów przeciw H

0

. H

a

jest

stwierdzeniem które zaakceptujemy jeśli

dowody pozwolą nam odrzucić H

0

.

2.

Oblicz wartość statystyki testowej. Ta

statystyka zwykle określa jak daleko dane są

od H

0

.

background image

Test istotności - kroki

3.

Znajdź P-wartość dla obserwowanych danych. Jest

to prawdopodobieństwo (przyjmując, że hipoteza

zerowa jest prawdziwa), że statystyka będzie się

opowiadać przeciw hipotezie co najmniej tak silnie

jak z tymi danymi.

4.

Sformułuj wniosek. Wybierz poziom istotności α (jak

bardzo dowód przeciw H

0

uznajesz za decydujący).

Jeśli P-wartość jest mniejsza lub równa α - wniosek,

że hipoteza alternatywna jest prawdziwa; jeśli jest

większa od α - wniosek, że dane nie dostarczają

wystarczająco silnego dowodu do odrzucenia H

0

.

Twój wniosek jest podsumowaniem badań

wykonanych za pomocą testu istotności.

background image

Testy dla wartości średniej w
populacji – test z

Mamy prostą próbę losową o liczności n

wylosowanej z normalnej populacji o

nieznananej średniej μ ale ze znaną

wariancją σ

2

. Chcemy sprawdzić

hipotezę że μ ma określoną wartość, np.

μ

0

.

Hipoteza zerowa: H

0

: μ = μ

0

.

background image

Testy dla wartości średniej w
populacji – test z

Hipoteza zerowa: H

0

: μ = μ

0

.

Statystyka testowa:

jeśli hipoteza zerowa jest prawdziwa, to

statystyka z ma standardowy rozkład

normalny.

n

x

z

/

0

background image

Testy dla wartości średniej w
populacji – test z

Alternatywna hipoteza: Jeśli jest
jednostronna to np. H

a

: μ > μ

0

p-wartość: prawdopodobieństwo, że
standardowa normalna zmienna
losowa Z przybierze wartość co
najmniej taką jak obserwowana z.

Możemy podobnie wnioskować dla
innych hipotez alternatywnych.

background image
background image

Dystrybucja statystyki

testowej

background image
background image
background image

Dwustronne testy
istotności i przedziały
ufności

Poziom α dwustronnego testu
istotności odrzuca hipotezę H

0

: μ =

μ

0

dokładnie wtedy, gdy wartość μ

0

znajduje się poza przedziałem
ufności dla dla μ obliczonym dla
poziomu 1-α .

background image
background image

P-wartości vs. ustalone α

P-wartość to najmniejszy poziom α, na

którym dane są istotne.

Znając P-wartość możemy ocenić istotność

na każdym poziomie.

To daje więcej informacji niż sprawdzanie

odrzucony-lub-nie na ustalonym poziomie

istotności.

Wartość z*, taka że P(Z>z

*

) jest równa

zadanej liczbie a, 0<a<1, jest nazywana

wartością krytyczną

standardowego

rozkładu normalnego.

background image
background image
background image

Wykorzystywanie i
nadużywanie testów

Wybieranie poziomu istotności

Wybierz poziom α z góry jeśli musisz dokonać
decyzji.

Nie ma sensu, jeśli chcesz jedynie opisać siłę
swoich dowodów.

Jeśli stosujesz test istotności z ustalonym α
by podjąć decyzję, wybierz α pytając jak silny
dowód jest potrzebny do odrzucenia H

0

.

To też zależy od tego jak wiarygodna jest/ma być
hipoteza zerowa.

background image

Wybór poziomu istotności

Jeśli H

0

reprezentuje hipotezę, w

którą każdy wierzył przez lata, będzie
potrzebny mocny dowód (małe α)
żeby ją obalić.

Siła dowodu potrzebnego do
odrzucenia H

0

zależy od

konsekwencji podjęcia takiej decyzji.

Kosztowne: silny dowód

background image

Wybór poziomu istotności

Lepiej podawać p-wartość, która
pozwala każdemu z nas decydować
indywidualnie czy mamy
wystarczająco silne dowody.

Nie ma ostrej granicy między
„istotny” a „nieistotny” a jedynie
rosnąca siła dowodu przy malejącej
p-wartości.

background image

Czego istotność
statystyczna nie oznacza?

Istotność statystyczna to nie to samo co

praktyczna istotność.

Przykład: hipoteza bez zależności jest odrzucana

Nie oznacza mocnego związku, ale że jest silny dowód

na istnienie jakiegoś związku

Kilka punktów odstających może się

przyczynić do zaobserwowania wysokiej

istotności wyniku testu, jeśli ślepo stosuje

się testy istotności.

Punkty odstające mogą również zniwelować

istotność.

background image

Nie ignoruj braku
istotności

Jeśli badacz ma wyraźny powód
podejrzewać, że zależność istnieje a potem
nie może znaleźć istotnego dowodu nań, to
może to być ciekawą wiadomością ---
czasami ciekawszą niż to gdyby
potwierdzono związek na poziomie
istotności 5%.

Ukrywanie negatywnych wyników może
skazać innych badaczy na poszukiwanie
zależności, która nie istnieje.

background image

Wnioskowanie statystyczne nie
jest słuszne dla wszystkich
danych

Formalne wnioskowanie
statystyczne nie koryguje błędnie
przeprowadzonego eksperymentu.

Losowość próbkowania gwarantuje,
że prawa probabilistyki mają
zastosowanie w naszych testach
istotności oraz wyznaczanych
przedziałach ufności.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Można także wnioskować bez
uwzględniania istotności
statystycznej.

Jeśli zdecydujesz jakiego wyniku
szukasz, zaprojektuj eksperyment
lub próbę, która Cię do niego
doprowadzi i zastosuj test istotności
żeby ocenić wagę dowodów.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Ponieważ udane próby szukania
zjawisk naukowych zwykle kończą
się znalezieniem istotności
statystycznej, uczynienie samej
istotności obiektem poszukiwań
jest zbyt nęcące.

background image

Nie szukaj na siłę
znamienności
statystycznej!

Jeśli już masz hipotezę, zaprojektuj
badanie tak, żeby otrzymać wynik,
który uważasz za istniejący.

Jeśli wynik badania jest
statystycznie istotny, masz już
rzeczywisty dowód.

background image

Moc i wnioskowanie

Badanie użyteczności przedziału
ufności

Poziom ufności: mówi nam jak
niezawodna jest ta metoda przy
wielokrotnych powtórzeniach
eksperymentu.

Margines błędu: mówi nam, jak czuła
jest ta metoda lub jak bardzo przedział
ogranicza szacowanie parametru

background image

Moc i wnioskowanie

Badanie użyteczności testów istotności

przy ustalonym α.

Poziom istotności: mówi nam jak

wiarygodna jest ta metoda w użyciu

Moc testu

: mówi nam o zdolności testu do

wykrywania tego, że hipoteza zerowa jest

fałszywa

Mierzona jako prawdopodobieństwo że test

odrzuci hipotezę zerową kiedy alternatywna jest

prawdziwa.

Im wyższe prawdopodobieństwo, tym

bardziej czuły jest test.

background image

Moc testu

Prawdopodobieństwo, że test
istotności przy ustalonym α odrzuci
H

0

, kiedy alternatywna wartość

parametru jest prawdziwa, jest
nazywane mocą testu do
wykrywania tej alternatywy.

background image

Obliczanie mocy testu

Sformułuj H

0

, H

a

(konkretną

alternatywę, którą chcemy wykryć) i
poziom istotności α.

Znajdź wartości , które
spowodują że odrzucimy H

0

.

Oblicz prawdopodobieństwo
zaobserwowania tych wartości , dla
których alternatywa jest prawdziwa.

x

x

background image
background image

Zwiększanie mocy testu

Zwiększ α. 5%-owy test istotności

będzie miał większą szansę odrzucenia

alternatywy niż 1%-owy, ponieważ jest

wymagana mniejsza siła dowodu.

Weź taką alternatywę, która jest dalej

od μ

0

. Wartości μ, które są w H

a

ale

leżą blisko do hipotetycznej wartości μ

0

są cięższe do wykrycia (mniejsza moc)

niż wartości μ, które są daleko od μ

0

.

background image

Zwiększanie mocy testu,
cd.

Zwiększ rozmiar próby. Więcej danych
dostarczy więcej informacji o więc jest
większa szansa odróżnienia wartości μ.

Zmniejsz σ. To daje taki sam efekt jak
zwiększanie rozmiaru próby: więcej
informacji o μ. Poprawienie procesu
pomiarów i ograniczenie uwagi na
subpopulacje to dwa najpopularniejsze
sposoby na zmniejszenie σ.

x

background image

Dwa typy błędów

Podczas przeprowadzania testów istotności

musimy przyjąć jedną hipotezę a drugą

odrzucić.

Mamy nadzieję że jest to trafna decyzja, ale nie

musi tak być.

2 typy niewłaściwych decyzji:

Jeśli odrzucimy H

0

(przyjmiemy H

a

) kiedy w

rzeczywistości H

0

jest prawdziwe, jest to błąd

pierwszego rodzaju (odniesiony do p-wartości).

Jeśli przyjmiemy H

0

(odrzucimy H

a

) kiedy w

rzeczywistości H

a

jest prawdziwe, jest to błąd

drugiego rodzaju (odniesiony do mocy).

background image
background image

Prawdopodobieństwa
błędów

Statystyczne wnioskowanie jest oparte na

prawdopodobieństwie.

Jakakolwiek zasada podejmowania decyzji jest

związana z prawdopodobieństwami popełnienia dwóch

rodzajów błędów.

Poziom istotności α jakiegokolwiek testu z ustalonym

poziomem jest prawdopodobieństwem popełnienia

błędu pierwszego rodzaju.

α jest prawdopodobieństwem że test odrzuci zerową hipotezę

H

0

kiedy w rzeczywistości jest prawdziwa.

Moc testu przeprowadzonego na zadanym poziomie istotności

α określona dla zadanej alternatywy wynosi 1 minus

prawdopodobieństwo popełnienia błędu drugiego rodzaju dla

tej alternatywy.

background image

Ogólnie przyjęte
postępowanie przy
testowaniu hipotez

Zdefiniuj H

0

i H

a

tak samo jak do testu

istotności.

Popatrz na problem jak na decyzję -

prawdopodobieństwa popełnienia błędów

I-szego i II-ego rodzaju są powiązane.

Błędy pierwszego rodzaju są poważniejsze.

Wybierz α (poziom istotności) i rozważ

testy tylko takie, gdzie

prawdopodobieństwo popełnienia błędu I-

szego rodzaju nie jest większe od α.

background image

Ogólnie przyjęte
postępowanie przy
testowaniu hipotez

Spośród testów wybierz ten, który ma
jak najmniejsze prawdopodobieństwo
popełnienia błędu II-ego rodzaju (czyli
jak największą moc). Jeśli to
prawdopodobieństwo jest zbyt duże,
będziesz musisz wziąć większą liczbę
prób żeby zmniejszyć ryzyko błędu.

background image

Testy dla wartości średniej
w populacji – jednostronny
test t

Niech prosta próba losowa (PPL) o liczności n
jest losowana z populacji o nieznanej wart.
oczekiwanej μ. Żeby zweryfikować hipotezę
że H

0

: μ = μ

0

na podstawie PPL, oblicz

statystykę t

Zmienna losowa T ma rozkład t(n-1), P-
wartość dla testu H

0

przeciw H

a

: μ > μ

0

wynosi albo dla H

a

: μ < μ

0

n

/

s

x

t

0

t

T

P

)

t

T

(

P

background image

Test t - przykład 1

Niech PPL o liczności n jest losowana z
populacji o nieznanej wartości
oczekiwanej μ.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1, 117.4, 111,
121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że H

0

: μ =

μ

0

=120 na podstawie PPL liczności n,

oblicz statystykę t dla jednej próby

6764

.

0

12

/

89

.

5

120

15

.

121

n

/

s

x

t

0

background image
background image

Test t - przykład 1

W kategoriach zmiennej losowej T
z rozkładem t(n-1), P-wartość dla
testu H

0

przeciw H

a

: μ > μ

0

wynosi

t

T

P

background image

stopień swobody

Wartość krytyczna dla
α=0.95

background image

Jeśli t

1

=0.6 to cdf(t

1

)=0.71967 więc p

1

=1-

0.71967=0.28033

Jeśli t

2

=0.7 to cdf(t

2

)=0.75077 więc p

2

=1-

0.75077=0.24923

więc p

2

< p < p

1

Test t - przykład 1

background image

Z rozkładu t Studenta
otrzymujemy

tcdf(0.6764,11) = 0.743621

p = 1 – 0.743621 =

0.256379

Test t - przykład 1

background image

Test t - przykład 1

0.7436

p=0.2564

background image

Test t - przykład 1

Końcowy wniosek:

Nie możemy odrzucić H

0

mówiącej, że wartość średnia w
populacji wynosi μ=120 i przyjąć
H

a

z p=0.2564

background image

Test t – przykład 2

Żeby zweryfikować hipotezę H

0

: μ = 135

na podstawie PPL liczności n, obliczmy

statystykę t dla jednej próby:

W kategoriach zmiennej losowej T z

rozkładem t(n-1), P-wartość dla testu na

H

0

przeciw

H

a

: μ < μ

0

wynosi

n

/

s

135

x

t

t

T

P

background image
background image

Test t - przykład 2

[114, 123.3, 116.7, 129.0, 118, 124.6,

123.1, 117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że
H

0

: μ = μ

0

=135, obliczmy

statystykę t

1456

.

8

12

/

89

.

5

135

15

.

121

n

/

s

x

t

0

background image

Z rozkładu t Studenta
otrzymujemy

P(T ≤ t)

=

tcdf(-8.1456,11) =2.7e-6

p =

0.0000027 < 0.000005

Test t - przykład 2

background image

Test t - przykład 2

p=2.7e-6

t = -8.1456

background image

Test t - przykład 2

Końcowy wniosek:

Odrzucamy H

0

mówiącą, że wartość

średnia w populacji wynosi μ=135 i
przyjmujemy H

a

: μ < μ

0

z p <

0.000005

background image

Testy dla wartości średniej w
populacji – dwustronny test t

Żeby zweryfikować hipotezę że H

0

: μ =

115

na podstawie PPL liczności n,

obliczmy statystykę t

W kategoriach zmiennej losowej T z

rozkładem t(n-1), P-wartość dla testu H

0

przeciw

H

a

: μ ≠ μ

0

wynosi

n

/

s

115

x

t

|

t

|

|

T

|

P

background image
background image

Test t - przykład 3

[114, 123.3, 116.7, 129.0, 118, 124.6,

123.1, 117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Żeby zweryfikować hipotezę że
H

0

: μ = μ

0

=115 obliczmy

statystykę t

6170

.

3

12

/

89

.

5

115

15

.

121

n

/

s

x

t

0

background image

• Ponieważ wartość krytyczna

t

0.05

=2.2010 a nasza obserwowana

wartość jest wyższa, odrzucamy
hipotezę zerową na poziomie α=0.05.

• Z rozkładu t otrzymujemy

P(|T| > |t|)

= 2*(1-

tcdf(3.6170,11)) =

0.0040

Więc dokładnie p =

0.0040

Test t - przykład 3

background image

Test t - przykład 3

p=0.0040

-t = -3.6170

t = 3.6170

background image

Test t - przykład 3

Końcowy wniosek:

odrzucamy H

0

że wartość średnia w

populacji wynosi μ=115 i
przyjmujemy H

a

: μ ≠ μ

0

z p =

0.0040

background image

Pary obserwacji - test t

W badaniu par obserwacji wyniki
są łączone w pary i porównywane
w jej obrębie.

Przykład: wyniki przed i po kursie

background image

Pary obserwacji - analiza

Analiza par obserwacji jest
konieczna kiedy mamy dwa
pomiary lub obserwacje każdego
obiektu i chcemy zbadać zmianę
jednej względem drugiej.
Zazwyczaj obserwacje w pewnym
sensie są pomiarami „przed” i
„po”.

background image

Pary obserwacji - analiza

W każdej parze odejmuje się
pomiar „przed” od pomiaru „po”.

Analizuje się rozkład różnic
stosując przedziały ufności i testy
istotności dla jednej próby.

background image
background image

Pary obserwacji –
przykład 4

Gain średnia z próby = 2.5

Gain odchylenie standardowe z próby =
2.89

Aby zweryfikować hipotezę H

0

: μ =

μ

0

=0 (brak różnic) przeciwko H

A

: μ

≠ 0 na podstawie PPL o liczności n,
obliczamy statystykę testową t

8686

.

3

20

/

89

.

2

0

5

.

2

/

0

n

s

x

t

background image

• Wartość krytyczna t

[0.05,19]

=2.0930.

•Obliczona statystyka t jest większa

niż wartość krytyczna, odrzucamy
zatem hipotezę zerową na poziomie
α=0.05.

• Z rozkładu t znajdujemy

P(|T| > |t|)

= 2*(1-

tcdf(3.8686,19)) =

0.001

Zatem dokładna wartość p =

0.001

Pary obserwacji –
przykład 4

background image

• Zakładając poziom istotności α, możemy

przeprowadzić test dla wartości średniej w
populacji wykorzystując przedział ufności
określony dla poziomu C=1-α.

• Obliczamy dolną i górną granicę przedziału

ufności i sprawdzamy, czy µ

0

należy do tego

przedziału.

• Jeśli tak, to nie mamy podstaw do odrzucenia

hipotezy zerowej H

0

: μ = μ

0

• Jest to równoważne przeprowadzeniu

dwustronnego testu t na poziomie istotności
α.

Wykorzystanie przedziałów ufności
do wnioskowania o wartości
średniej w populacji

background image

Przykład 3 – przedziały
ufności

[114, 123.3, 116.7, 129.0, 118, 124.6,

123.1, 117.4, 111, 121.7, 124.5, 130.5]

Średnia z próby = 121.15

Odchylenie standardowe z próby =
5.89, α=0.05

89

.

124

12

89

.

5

2010

.

2

15

.

121

41

.

117

12

89

.

5

2010

.

2

15

.

121

11

,

05

.

0

2

11

,

05

.

0

1

n

s

t

Y

L

n

s

t

Y

L

background image

Przykład 3 – przedziały
ufności

Przedział ufności

Hipoteza zerowa H

0

: μ =115,

hipoteza alternatywna H

A

: µ≠115.

Ponieważ
odrzucamy hipotezę zerowa na

poziomie α=0.05

95

.

0

89

.

124

41

.

117

P

)

89

.

124

,

41

.

117

(

115

background image

Odporność procedur t

Wnioskowanie statystyczne jest
nazywane odpornym, jeśli wymagane
metodyka obliczeń jest nieczuła na
naruszenie przyjętych założeń.

Procedury t są dość odporne na
odstępstwa od normalności rozkładu
populacji z wyjątkiem obserwowania
silnej skośności rozkłądu lub
występowania punktów odstających.

background image

Odporność procedur t

Większe próby to większa dokładność
oszacowania P-wartości oraz wartości
krytycznych dystrybucji t, gdy rozkład
populacji nie jest normalny.

W przypadku małolicznych prób, zanim
przejdzie się do testów t należy
narysować wykres qq lub ramkowy w
celu sprawdzenia skośności i punktów
ostających.

background image

Praktyczne wskazówki do
wnioskowania o średniej

Liczność próby: mniej niż 15: Zastosuj

procedury t jeśli dane mają w przybliżeniu

rozkład normalny. Jeśli ich rozkład jest daleki

od normalnego, albo zaobserwowaliśmy punkty

odstające, nie używaj t.

Liczność próby co najmniej 15: Można

zastosować procedury t, chyba że istnieją

punkty odstające lub rozkład jest bardzo skośny

Duże próby: Można stosować procedury t,

nawet dla skośnych rozkładów, ale liczność

musi być duża: ponad 40

background image

Porównywanie dwóch
średnich

Problemy z dwiema próbami

Cel wnioskowania: porównanie
odpowiedzi w dwóch grupach.

Przyjmuje się że każda grupa to próba
z oddzielnej populacji.

Odpowiedzi w każdej z grup są
niezależne.

background image

Pojęcia

Populacja

Zmienna

Średnia

Odchylenie standardowe

Liczność próby

Średnia próby

Odchylenie standardowe próby

background image

Test z dla dwóch prób

Naturalny estymator różnicy μ

1

- μ

2

jest różnicą dwóch średnich prób,

Żeby wnioskować z tej statystyki
musimy znać jej rozkład próbkowania.

Jeśli rozkłady obu populacji są normalne,
rozkład
jest także normalny.

2

1

x

x

2

1

x

x



2

2

2

1

2

1

2

1

,

n

n

N

background image

Test z dla dwóch prób

Niech jest średnią prostej próby losowej o
liczności n

1

z populacji o rozkładzie N(μ

1,

σ

1

)

a to średnia PPL o liczności n

2

z populacji

o rozkładzie N(μ

2,

σ

2

). Wtedy taka statystyka

ma standardowy rozkład funkcji gęstości
prawdopodobieństwa N(0,1).

1

x

2

x

 

2

2

2

1

2

1

2

1

2

1

n

n

x

x

z

background image

Test t dla dwóch prób

Ten test zakłada że populacje, z

których wzięto próbki mają
równe wariancje

background image

Statystyka t dla dwóch
prób

Jeśli odchylenia standardowe
populacji nie są znane,
przybliżamy je na podstawie
odchylenia standardowego próby.

Stosuj właściwy wzór, zależny od
liczności prób: n

1

i n

2

.

background image

Statystyka t dla dwóch
prób

Kiedy liczności prób są różne i

przynajmniej jedno z n

1

i n

2

jest

małe (<30) stosuj:

Taka statystyka ma rozkład t Studenta

z k=n

1

+ n

2

– 2 stopniami swobody.

 





 





2

1

2

1

2

1

2

2

2

2

1

1

2

1

2

1

n

n

n

n

2

n

n

s

)

1

n

(

s

)

1

n

(

x

x

t

background image

Statystyka t dla dwóch
prób

Kiedy n

1

i n

2

są sobie równe

(niezależnie od liczności) zastosuj:

Taka statystyka ma rozkład t Studenta

z k=2(n – 1) stopniami swobody.

 

n

s

s

x

x

t

2

2

2

1

2

1

2

1

background image

Statystyka t dla dwóch
prób

Kiedy n

1

i n

2

są różne, ale duże (≥30)

stosuj:

Taka statystyka ma rozkład t Studenta

z k=n

1

+ n

2

- 2 stopniami swobody.

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

t

background image

Test istotności t dla dwóch
prób

Niech prosta próba losowa o liczności n

1

jest losowana z populacji o rozkładzie
normalnym z nieznaną wartością
oczekiwaną μ

1

i jest niezależna od

drugiej próby o liczności n

2

, losowanej z

innej populacji o nieznanej wartości
oczekiwanej μ

2.

Zakładamy że odchylenia standardowe
obu populacji są równe.

background image

Test istotności t dla dwóch
prób

Żeby zweryfikować hipotezę H

0

: μ

1

= μ

2

przeciw H

a

: μ

1

≠ μ

2

, obliczymy

odpowiednią statystykę t i użyjemy
P-wartości lub wartości
krytycznych dla rozkładu t
Studenta z odpowiednim stopniem
swobody.

background image

Test istotności t dla
dwóch prób – przykład 5

Niech PPL o liczności n

1

jest losowana z

populacji o nieznanej wartości oczekiwanej μ

1

.

[114, 123.3, 116.7, 129.0, 118, 124.6, 123.1,
117.4, 111, 121.7, 124.5, 130.5]

średnia próby = 121.15

odchylenie standardowe próby = 5.89

Kolejna PPL o liczności n

2

jest losowana z

populacji o nieznanej wartości oczekiwanej μ

2

.

[120, 125.5, 126, 125.5, 128.5, 125, 128, 116,
122, 121, 117, 125]

średnia próby = 123.29

odchylenie standardowe próby = 4.08

background image

Test istotności t dla
dwóch prób – przykład 5

 

0383

.

1

n

s

s

x

x

t

2

2

2

1

2

1

2

1

=0 z założenia

p = 0.3104

Wniosek: nie możemy odrzucić hipotezy, że wartości
średnie obu populacji są równe na poziomie istotności
α=0.05

Ponieważ n

1

=n

2

=12

background image

Przedział ufności dla dwóch
prób

Niech PPL liczności n

1

jest losowana z

normalnej populacji o nieznanej wart.

oczekiwanej μ

1

i kolejna PPL o liczności n

2

jest

losowana z kolejnej normalnej populacji o

nieznanej wart. oczekiwanej μ

2

. Dla dużych n

1

i n

2

przedział ufności dla μ

1

- μ

2

jest dany przez

gdzie statystyka t ma n

1

+n

2

-2 stopni swobody.

2

2

2

1

2

1

2

1

2

2

2

1

2

1

2

1

*

,

*

n

s

n

s

t

x

x

n

s

n

s

t

x

x

background image

Odporność procedur dla
dwóch prób

Procedury t dla dwóch prób są bardziej

odporne niż metody t dla jednej próby.

Jeśli liczności obu prób są równe a rozkłady

porównywanych populacji mają podobne

kształty, otrzymujemy dobrą dokładność.

Jeśli kształty rozkładów populacji są różne,

potrzeba prób o większej liczności.

Planując badanie oparte na dwóch

próbach, powinieneś zwykle wybierać

równe liczności tych prób.

background image

Przybliżony test t Welch’a
równości wartości średnich
dwóch populacji o różnych
wariancjach

background image

Przybliżony test t Welch’a

Ten test oblicza przybliżoną t-

wartość, taką

, dla której krytyczna

wartość jest liczona jako średnia

ważona pojedynczych wartości

krytycznych t odpowiadających

stopniom swobody dwóch prób.

background image

Przybliżony test t Welch’a

Dwupróbowa statystyka t

jest

równa:

 

2

2

2

1

2

1

2

1

2

1

n

s

n

s

x

x

't

background image

Przybliżony test t Welch’a

Wartość krytyczna t

α’

dla błędu

pierwszego rodzaju jest liczona
jako:

2

2

2

1

2

1

2

2

2

]

[

1

2

1

]

[

n

s

n

s

n

s

t

n

s

t

't

2

1

background image

Testy dla wariancji w

populacji

Mamy PPL o liczności n losowaną z
rozkładu normalnego. Chcemy
testować hipotezę, że wariancja w
populacji σ

2

ma określoną wartość σ

02

.

Hipoteza zerowa: H

0

: σ

2

= σ

02

.

Hipoteza alternatywna: H

A

: σ

2

≠ σ

02

Jest to test dwustronny, testy
jednostronne można wyprowadzić
analogicznie

background image

Testy dla wariancji w

populacji – test X

2

Z definicji rozkładu Χ

2

Ponieważ statystyka X

2

ma rozkład

postępujemy następująco::

Oblicz X

2

Znajdź wartości krytyczne dla testu
dwustronnego dla zadanego poziomu
istotności α

Porównaj wartość statystyki testowej z
robszarem krytycznym.

2

2

2

'

2

)

1

(

s

n

X

X

n

i

2

]

1

[ 

n

background image

Testy dla wartości wariancji w

populacji – przykład 6

Producent twierdzi, że wariancja średnicy

tulejek wynosi 100.

Odchylenie standardowe z próby, oszacowane

na podstawie 10 pomiarów, wynosi 11.2

Statystyka testowa

Wartości krytyczne dla testu dwustronnego na

poziomie α=0.05 dla 9 stopni swobody

wynoszą odpowiednio 2.700 oraz 19.023.

Wartość statystyki testowe jest mniejsza niż

19.023 i większa niż 2.700, prowadzi to do

akceptacji hipotezy zerowej na poziomie

α=0.05.

290

.

11

100

)

2

.

11

(

9

)

1

(

2

2

2

2

'

2

s

n

X

X

n

i

background image

Rozkład F

Załóżmy, że losowanie dokonywane
jest z populacji o rozkładzie normalnym
o wartości średniej µ i wariancji σ

2

.

Losujemy najpierw n

1

wartości i

obliczamy ich wariancję z próby ,
następnie losujemy n

2

wartości i

obliczamy ich wariancję z próby

Liczba stopni swobody dla obu
wariancji ν

1

=n

1

-1 oraz ν

2

=n

2

-1.

2

1

s

2

2

s

background image

Rozkład F

Mając obie wielkości oraz ,
obliczamy

Opracowano model matematyczny
oczekiwanego rozkładu tak
zdefiniowanej zmiennej losowej i
nazwano go rozkładem F, na cześć
znanego statystyka of R.A.Fishera.

2

1

s

2

2

s

2

2

2

1

s

s

F

s

background image

Rozkład F

W przeciwieństwie do rozkładów t i Χ

2

, kształt

rozkładu F określony jest przez dwa
parametry ν

1

i ν

2

.

background image

Jednostronny test F

jednorodności wariancji

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:

Statystyka testowa:

opisana jest rozkładem F o [v

1

, v

2

]

stopniach swobody.

2

2

2

1

s

s

F

s

2

2

2

1

2

2

2

1

background image

Jednostronny test F

jednorodności wariancji –

przykład 7

Próba 1: n

1

=7,

Próba 2: n

2

=29,

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:

Statystyka testowa:

ma rozkład F o [6, 28] stopniach swobody.

2

2

2

1

32

.

1

029

.

16

181

.

21

2

2

2

1

s

s

F

s

2

2

2

1

180

.

21

2

1

s

029

.

16

2

2

s

background image

Jednostronny test F

jednorodności wariancji –

przykład 7

32

.

1

F

Ponieważ
wartość
statystyki F nie
należy do
obszaru
krytycznego,
przyjmujemy
hipotezę zerową
na poziomie
α=0.05

background image

Dwustronny test F

jednorodności wariancji –

przykład 8

Próba 1: n

1

=10,

Próba 2: n

2

=15,

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:

Statystyka testowa:

ma rozkład F o [9,14] stopniach swobody.

2

2

2

1

7134

.

0

021

.

18

856

.

12

2

2

2

1

s

s

F

s

2

2

2

1

856

.

12

2

1

s

021

.

18

2

2

s

background image

Dwustronny test F

jednorodności wariancji –

przykład 8

7134

.

0

F

Since our F
statistic does
not belong to
the rejection
region, we
accept null
hypothesis at
α=0.05

background image

Test Bartlett’a
homogeniczności
(jednorodności) wariancji

Testowanie hipotezy zerowej
mówiącej że dwie lub więcej
populacje reprezentowane przez
dwie lub więcej próby mają równe
wariancje.

Hipoteza alternatywna mówi że co
najmniej jedna wariancja jest inna

background image

Przykład 9

background image

Test Bartlett’a homogeniczności

(jednorodności) wariancji – przykład

9

Hipoteza zerowa H

0

:

Hipoteza alternatywna H

A

:

Poziom istotności α=0.005

Próba 1: Treatment group n

1

=21,

s

1

=11.01,

Próba 2: Control group n

2

=23, s

2

=17.15

Naturalne logarytmy z wariancji:
ln(11.01

2

)=4.80 oraz ln(17.15

2

)= 5.68

2

2

2

1

2

2

2

1

background image

Test Bartlett’a homogeniczności

(jednorodności) wariancji – przykład

9

Suma liczby stopni swobody: 20+22=42

Średnia ważona wariancji:

Logarytm naturalny średniej ważonej wariancji:

5.36

Suma ważona logarytmów wariancji składowych

Statystyka testowa

Korekta skalująca C=1.0398

79

.

211

42

15

.

17

*

22

01

.

11

*

20

2

2

2

s

96

.

220

68

.

5

*

22

80

.

4

*

20

16

.

4

96

.

220

36

.

5

*

42

2

background image

Test Bartlett’a homogeniczności

(jednorodności) wariancji – przykład

9

Skorygowana wartość statystyki testowej
4.16/1.0398=4.00

Wartość krytyczna dla 1 stopnia swobody i
poziomu istotności α=0.005 wynosi 9.14.

Ponieważ wartość statystyki testowej (4.00) jest
mniejsza od wartości krytycznej (9.14), nie mamy
podstaw do odrzucenia hipotezy zerowej na
poziomie α=0.005.

Wniosek końcowy: wariancje są jednorodne.

background image
background image

Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10

Oblicz logarytm naturalny
wariancji każdej z prób.

Zsumuj liczby stopni swobody

Oblicz średnią ważoną wariancji i
jej logarytm naturalny

a

i

95

9

...

12

17

)

1

n

(

185167

.

2

112459

.

0

ln

,

112459

.

0

)

1

n

(

s

)

1

n

(

s

a

i

a

2

i

i

2

background image

Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10

Oblicz ważoną sumę logarytmów
wariancji każdej z prób

Oblicz statystykę

227545

.

229

s

ln

)

1

n

(

a

2

i

i

636721

.

21

s

ln

)

1

n

(

s

ln

)

1

n

(

X

a

2

i

i

2

a

i

2

background image

Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10

Jeśli hipoteza zerowa jest
prawdziwa, to skorygowana
statystyka X

2

ma w przybliżeniu

rozkład χ

2

o a-1 stopniach

swobody.

914

.

20

034566

.

1

63672

.

21

C

X

X

034566

.

1

)

1

n

(

1

1

n

1

)

1

a

(

3

1

1

C

2

2

kor

a

a

i

i

background image

Test Bartlett’a homogeniczności
(jednorodności) wariancji – przykład
10

475

.

18

2

]

7

[

01

.

0

Wartość krytyczna dla a-1=7 stopni
swobody oraz alfa = 0.01 wynosi

Wartość skorygowanej statystyki wynosi
20.914. Wnioskujemy więc, że wariancje są
niejednorodne.


Document Outline


Wyszukiwarka

Podobne podstrony:
wyklad 5 Testy parametryczne PL
wyklad 5 Testy parametryczne
Wyklad 6 Testy zgodnosci dopasowania PL
wyklad 6 Testy zgodnosci dopasowania PL
pytania testowe i chemia budowlana -zestaw3, Szkoła, Pollub, SEMESTR II, chemia, wykład, testy
lipidy 2, Prywatne, Biochemia WYKŁADÓWKA I, Biochemia wykładówka 1, TESTY, testy
Wykład 8 Schematy i parametry dla skł 2 Indywidualna praca nr2
statystyka 3, WNIOSKOWANIE STATYSTYCZNE - TESTY PARAMETRYCZNE
Wykłady, testy z analitycznej, 1
statystyka ii laboratorium viii testy parametryczne ii
pytania testowe i chemia budowlana -zestaw1, Szkoła, Pollub, SEMESTR II, chemia, wykład, testy
Makroekonomia test zielony - dr Mitręga, makroekonomia wyklady i testy
III b wykład testy
WS testy parametryczne 3
Wykład 3 Pomiar parametrów technologicznych płuczek wiertniczych
Rajfura A, Statystyka Wyklad 02 PARAMETRY 2012 13
pytania testowe i chemia budowlana -zestaw2(2), Szkoła, Pollub, SEMESTR II, chemia, wykład, testy

więcej podobnych podstron