statyst wyprac, Testowanie

background image

Testowanie hipotez

background image

Hipotezy

 Hipoteza – dowolna wypowiedź o

rozkładzie zmiennej losowej

parametryczna (mówi o wartościach
parametrów rozkładu)

nieparametryczna

 Hipoteza parametryczna

prosta (jedna wartość)

złożona (zbiór wartości, np. przedział)

background image

Hipotezy - przykłady

 AUC nie ma rozkładu normalnego.
 Wartość oczekiwana t

max

wynosi 2h.

 Odchylenie standardowe C

max

nie

przekracza 3 mg/l.

 

2

max

t

E

2

max

t

lub:

9

max

C

V

albo:

3

max

C

background image

Cel testowania

 Zadaniem testu jest obalenie hipotezy

zerowej (H

0

) na rzecz hipotezy alterna-

tywnej (H

1

).

 Obalenie hipotezy polega na

wykazaniu, że gdyby była ona
prawdziwa, to uzyskanie takich
wyników pomiarów jak otrzymane
byłoby mało prawdopodobne.

background image

Weryfikacja

 Na podstawie wyniku badania (próby)

obliczamy tzw. statystykę testową T.
Wybór T zależy od H

0

i H

1

, planu

eksperymentu i przyjętych założeń o
rozkładzie wyników pomiarów.

 W oparciu o H

0

i H

1

, ew. inne, niejawne

założenia i (nieraz głęboką) wiedzę
statystyczną konstruujemy dla T
obszar krytyczny K.

background image

Weryfikacja

 Jeśli T znajdzie się w tym obszarze,

H

0

odrzucamy i twierdzimy, że

prawdziwa jest H

1

 W przeciwnym razie słuszność

hipotez H

0

lub H

1

pozostaje

nierozstrzygnięta.

background image

Błędy

 Błąd I rodzaju – odrzucenie słusznej

hipotezy. Prawdopodobieństwo tego
błędu oznaczamy  i nazywamy

poziomem istotności.

 Z reguły =0,05, czyli 5%.

0

H

K

T

P

background image

Błędy

 Błąd II rodzaju – niepowodzenie

obalenia H

0

, mimo że prawdziwa jest H

1

 Prawdopodobieństwo błędu II rodzaju

oznaczamy . Nie jest ono zwykle

równe 1- (i na ogół trudno je obliczyć).

 Prawdopodobieństwo udanej weryfikacji

nazywa się mocą testu, jest ona

równa 1-.

1

H

K

T

P

background image

Moc i liczebność próby

 Ocena mocy, choć trudna, jest

ważnym elementem planowania
badań.

 Moc testu wzrasta z liczebnością

próby.

 Staramy się tak dobrać liczbę

pomiarów, aby uzyskać
spodziewaną moc co najmniej 80%.

background image

Testy parametryczne dla

rozkładów ciągłych

 test równości wartości oczekiwanych

test t-Studenta i jego modyfikacje

analiza wariancji z porównaniami post
hoc

 test równości wariancji

test F-Fishera-Snedecora

 testy dla współczynnika korelacji

background image

Testy parametryczne dla

rozkładów dyskretnych

 Test frakcji (proporcji)

background image

Testy nieparametryczne

 Testy zgodności rozkładów

U - Manna-Whitneya-Wilcoxona

Kruskalla-Wallisa i Friedmana

- Pearsona

 Testy normalności

Lillieforsa, Shapiro-Wilka,
Kołmogorowa-Smirnowa

2

background image

Test t-Studenta

 Dwie grupy pomiarów:

na tych samych podmiotach, np. przed i po

posiłku (zmienne połączone)

na różnych podmiotach, np. ♀ i

(zmienne

niepołączone)

 Zakładamy, że pomiary podlegają

rozkładowi normalnemu.

 Dla zmiennych niepołączonych

dodatkowo zakładamy równość

wariancji w grupach.

background image

Test t-Studenta

 Hipoteza zerowa:
 Hipotezy alternatywne

test jednostronny

test dwustronny

2

1

0

:

H

2

1

1

:

H

2

1

1

:

H

background image

Przykład – test t-

Studenta, zmienne

połączone

 Czy dieta (np. sok grejpfrutowy)

wpływa na DB? Y – wielkość będąca
miarą DB.

 Przeformułowanie problemu:

 

 

B

A

Y

E

Y

E

H

:

0

 

 

B

A

Y

E

Y

E

H

:

1

B

A

Y

Y

D

 

 

0

:

0

:

1

0

D

E

H

vs

D

E

H

background image

test t-Studenta (cd)

 Wykonujemy eksperyment i

wyznaczamy dla każdego osobnika
D

i

.

 Wyznaczamy estymaty

(oszacowania) wartości oczekiwanej
i odchylenia standardowego
zmiennej losowej D

n

i

i

D

D

1

ˆ

1

ˆ

2

1

ˆ

n

D

D

n

i

i

background image

test t-Studenta (cd)

 Odchylenie standardowe średniej

jest razy mniejsze:

 Jeśli D ma rozkład normalny

to statystyka

 ma rozkład t-Studenta z n-1

stopniami swobody.

D

N

D

,

0

~

n

D

t

ˆ

ˆ

n

D

D

n

D

D

ˆ

ˆ

background image

test t-Studenta (cd)

t

t

P

4

3

2

1

0

1

2

3

4

0

0.1

0.2

0.3

0.4

Student

Gauss

t

background image

Test t-Studenta – moc

 W przedstawionym teście H

0

była

hipotezą prostą, a jej alternatywa –
hipotezą złożoną.

 Weźmy jeden ze składników

alternatywy:

 

0

:

1

1

D

E

h

background image

Test t-Studenta – moc

 Wtedy

a rozkład
zmiennej t jest
nieco inny (nazy-wa
się niecentralnym
rozkładem t ).

 Ze wzrostem

maleje  , a więc

zwiększa się moc
testu.

,

~

1

N

D

4

3

2

1

0

1

2

3

4

0

0.1

0.2

0.3

0.4

t-Studenta
Niecentralny t 0.2

Niecentralny t 1.0

Niecentralny t 2.0

D

1

background image

Test t-Studenta – moc

 Moc zwiększa się ze wzrostem

liczebności próby.

 Dokładne określenie mocy testu nie

jest możliwe, gdyż nie znamy
dokładnie potrzebnych parametrów.

background image

Test t-Studenta,

jedno- i dwustronny

 W teście jednostronnym porównujemy

wartość t z fraktylem .

 W teście dwustronnym porównujemy

|t| z

 Jeśli są przesłanki przemawiające za

tes-tem jednostronnym, warto go
stosować. Postawą tej decyzji nie może
być jednak bieżący eksperyment.

t

2

/

t

background image

Test t-Studenta,

zmienne niepowiązane

 Test dla zmiennych niepowiązanych

zawiera istotne założenie o równości
wariancji w obu grupach
(jednorodność wariancji).

 Jeśli założenie to nie jest spełnione,

należy stosować przybliżony wariant
opracowany przez Satterthwaite’a.
Spotyka się też nazwę test Welcha.

background image

Test równoważności

 Test t-Studenta pozwala udowodnić

istnienie różnic między grupami.

 W celu udowodnienia braku tych

różnic chciałoby się w teście
dwustronnym zamienić role
hipotezy zerowej i alternatywnej:

vs

2

1

0

:

H

2

1

1

:

H

background image

Test równoważności

 Niestety, moc takiego testu byłaby

równa dokładnie 0.

 Test równoważności ma udowodnić,

że różnica wartości oczekiwanych
nie przekracza z góry zadanego
zakresu.

1

2

1

2

2

1

0

lub

:

H

2

2

1

1

1

:

H

background image

Test równoważności

 Taki test, opracowany przez

Schuirmanna, używany bywa do
wykazywania równoważ-ności
postępowania terapeutycznego.

 Określenie granic i należy do

ekspertów z zakresu nauk
medycznych, a nie do statystyków.

1

2

background image

Test równości wariancji

 Test F-Fishera-Snedecora pozwala

porównać wariancje (a więc i odchylenia

standardowe) w dwu grupach pomiarów.

 Zakłada się w nim rozkład normalny w

obu grupach.

 Test może być jednostronny lub

dwustronny.

 Dla wielu wariancji używamy testu

Levene’a.

background image

Analiza wariancji

 Analiza wariancji (ANOVA) stanowi

rozszerzenie testu t-Studenta w

przypadku porównywania większej

liczby grup.

 Podział na grupy (czyli klasyfikacja)

dokonywany jest na podstawie

jednego lub kilku czynników. Mówimy

więc o jednoczynnikowej (one-way) lub

wieloczynnikowej analizie wariancji.

background image

Analiza wariancji

 Czynnik może przybierać pewną

liczbę wartości, zwanych poziomami.

 Np. czynnik płeć ma tylko dwa

poziomy (♀,♂), czynnik grupa krwi –

cztery poziomy (0,A,B,AB).

 Należy odróżniać liczbę czynników od

liczby poziomów danego czynnika.

 Jeszcze ważniejsze jest odróżnianie

wyniku od czynnika.

background image

Analiza wariancji

Założenia

 Podobnie jak w teście t-Studenta

zakłada się, że wyniki podlegają
rozkładowi normalnemu, a wariancje
we wszystkich grupach są takie
same.

 Procedury analizy wariancji są dość

odporne na naruszenie tych założeń.

background image

Jednoczynnikowa

analiza wariacji

 Hipoteza zerowa: wartość oczekiwana

w każdej grupie jest taka sama.

 Hipoteza alternatywna: nie wszystkie

wartości oczekiwane są jednakowe.

k

H

2

1

0

:

background image

Jednoczynnikowa

analiza wariancji

 Weryfikacja hipotezy polega na estymacji

wariancji na dwa niezależne od siebie
sposoby:

uśredniając wyniki uzyskane dla każdej grupy

badając zmienność średnich między grupami

 O ile H

0

jest słuszna, obie wariancje

powinny być jednakowe.

 Sprawdzamy to jednostronnym testem F.

background image

Jednoczynnikowa

analiza wariancji

 Wyniki przedstawia się w postaci

tabeli analizy wariancji:

Źródło

zmienności

Sumy

kwadratów

St.

swobody

Średni

kwadrat

F

Pomiędzy
grupami

k-1

Wewnątrz
grup (błąd)

n-k

Całkowita

n-1

1

2

k

Q

s

p

p

k

n

Q

s

w

w

2

2

2

w

p

s

s

F

k

i

i

p

x

x

Q

1

2



 

k

i

n

j

i

ij

w

i

x

x

Q

1

1

2

k

i

ij

x

x

Q

1

2

background image

Jednoczynnikowa

analiza wariancji

 Pozytywny wynik testu (odrzucenie

hipotezy zerowej) nie daje odpowiedzi
na pytanie, które wartości
oczekiwane różnią się między sobą.

 Odpowiedzi takiej udzielają testy po

analizie wariancji, zwane
porównaniami post-hoc.

background image

Testy po analizie

wariancji

 Porównania post-hoc są w istocie

równoczesnym wykonaniem wielu
testów.

 Jeśli pojedynczy test miałby poziom

istotności , to poziom istotności
wszystkich porównań mógłby być
znacznie wyższy.

background image

Testy po analizie

wariancji

 Wybór testu post-hoc zależy od

porównań, jakie zamierzamy

przeprowadzić.

 Jeśli porównujemy grupy z kontrolą,

możemy użyć testu Dunnetta.

 Gdy chcemy dokonać porównań typu

każdy z każdym przyda się nam test

Tukeya (lub Tukeya-Kramera dla

niejednakowo licznych grup).

background image

Testy post-hoc

 Wymienione testy zapewniają

poziom istotności dla całego
zbioru porównań.

background image

Test frakcji (proporcji)

 Test służy sprawdzeniu, czy

prawdopo-dobieństwa dwu zdarzeń
są jednakowe.

 Istnieje też wariant pozwalający

sprawdzić, czy prawdopodobieństwo
zdarzenia ma określoną z góry
wartość (np. czy P(♂)=0,5).

background image

Testy nieparametryczne

background image

Testy zgodności

rozkładów

 Test dla zmiennych połączonych –

test rang Wilcoxona. Zmienna losowa
nie musi być zmienną ciągłą, ale
może być zmienną porządkową.

 Dla zmiennych niepołączonych

analogicznym testem jest test rang
U – Manna-Whitney’a.

background image

Testy zgodności

 Rozszerzenia tych testów na

porównanie większej liczby grup to:

 Test Kruskala-Wallisa dla zmiennych

niepołączonych.

 Test Friedmana dla zmiennych

połączonych.

background image

Testy normalności

 Do badania, czy pomiary podlegają

rozkładowi normalnemu służą testy:

Lillieforsa

Shapiro-Wilka

D-Kołmogorowa-Smirnowa

background image

Test zgodności

z rozkładem

teoretycznym

 Test zgodności
 Test zgodności Kołmogorowa

2

background image

Test niezależności

 Jest to rozszerzenie testu proporcji na

więcej niż dwie grupy. Używany jest
często do oceny skuteczności
zabiegów terapeutycznych.

 Test ten przeznaczony jest dla

zmiennych losowych dyskretnych, nie
mających charakteru porządkowego.
Wrócimy do tego tematu.

2

background image

Test Q-Dixona

 Test Q-Dixona służy do eliminacji

pomiarów, co do których
spodziewamy się błędu grubego.
Może być źródłem nadużyć.

 Można go użyć do odrzucenia tylko

jednego pomiaru w danej próbie.


Document Outline


Wyszukiwarka

Podobne podstrony:
statyst wyprac, test t, test t-Studenta pozwala porównywać średnie w grupach niezależnych
Zagadnienia statystyczne konstruowania testów, Psychologia, biologia, Psychometria
statyst wyprac, 11, 11
06 Testowanie hipotez statystycznychid 6412 ppt
Rozwiązania z testowania hipotez nieparametrycznych 3, statystyka
statystyka, Przedzial ufnosci dla m. Testowanie hipotezy dla m., PRZEDZIAŁ UFNOŚCI DLA WARTOŚCI OCZE
Testowanie, WERYFIKACJA HIPOTEZ STATYSTYCZNYCH
Ogólne zasady testowania hipotez statystycznych
Statystyka #6 Testowanie hipotez
odp do testów, PEDAGOGIKA, METODY STATYSTYCZNE W PEDAGOGICE
testowanie hipotez, Statystyka i metodologia(1)
Zajęcia 7 Teoria testowania hipotez statystycznych
etapy testowania hipotez statystycznych, statystyka
5 Testowanie hipotez statystycznych
metody statystyczne i demograficzne w administracji, Notatki i wypracowania, Administracja, Statysty
SCIAGA Z PYTAN Z TESTOW[1] nie mam...., PK, Statystyka
metody testowania, wypracowania
TESTOWANIE HIPOTEZ STATYSTY, szkoła

więcej podobnych podstron