Wykład 6: Testy zgodności

dopasowania

Biometria i

Biostatystyka
Część 2: Statystyka

Testy zgodności



Te metody znajdują zastosowanie
przy analizie danych w skali
nominalnej, pozwalają sprawdzić czy
obserwowany rozkład

zliczeń

(nigdy

częstotliwości lub proporcji) zgadza
się z rozkładem hipotetycznym.



Najbardziej znaną techniką analizy
jest test zgodności chi-kwadrat (χ

Wprowadzenie



Załóżmy, że genetyk w ramach
eksperymentu skrzyżował
mieszaną populację F

i otrzymał

potomstwo F

z 90-oma

potomkami, z których n

=80 ma

fenotyp typu wild-type, a u n

=10

zaobserwowano mutacje.

Wprowadzenie



Genetyk, zgodnie z prawem
dziedziczenia, założył stosunek
fenotypów 3:1, ale rzeczywisty
stosunek wyniósł 80/10 = 8:1.



Spodziewane wartości p i q wynoszą

odpowiednio dla wild-type i mutantów.



and

Wprowadzenie



Używamy symbolu „daszek” żeby
zaznaczyć hipotetyczne lub
oczekiwane wartości proporcji.



Obserwowane proporcje tych
dwóch klas wynoszą odpowiednio



and

Wprowadzenie



Innym sposobem pokazania różnic
między wartościami oczekiwanymi
a obserwowanymi to wyrazić je w
zliczeniach (niektórzy nazywają je
częstościami).

Wprowadzenie



Obserwowana liczba zliczeń to

=80 i n

=10 dla dwóch fenotypów.



Oczekiwana liczba zliczeń to

gdzie N to liczność próby - liczba

potomków.

qˆ



















Wprowadzenie



Czy obserwowane odchylenie od

hipotezy 3:1 jest tak wielkie, że

praktycznie nieprawdopodobne?



Innymi słowy, czy zaobserwowane

dane wystarczająco różnią się od

wartości oczekiwanych, żeby

odrzucić hipotezę zerową?

Wykorzystanie funkcji
gęstości
prawdopodobieństwa



Rozkład, w którym p jest
prawdopodobieństwem naturalnego
fenotypu, a q zmutowanego, jest
rozkładem dwumianowym.



Możemy wyliczyć prawdopodobieństwo
otrzymania wyniku 80 naturalnych i 10
zmutowanych fenotypów, podobnie jak dla
wszystkich „gorszych” przypadków w
próbie 90 potomków dla



and

Wykorzystanie funkcji
gęstości
prawdopodobieństwa

jest równe dopełnieniu do jedności
wartości dystrybuanty.





















(

Wykorzystanie funkcji
gęstości
prawdopodobieństwa



Wyliczona wartość jest
prawdopodobieństwem 0.00084895
uzyskania wyniku co najmniej tak
odległego od hipotezy jak obserwowany.



Zauważ, że jest to test jednostronny;
alternatywna hipoteza mówi, że jest
więcej potomków z fenotypem typu wild-
type, niż liczba określona przez prawo
Mendla.

Wykorzystanie funkcji
gęstości
prawdopodobieństwa



Zaobserwowana próba jest dość
rzadkim wynikiem i możemy
wnioskować, że to jest istotne
odchylenie od oczekiwań.

Zastosowanie przedziałów
ufności



Jest to łatwiejsze podejście,
wymagające obliczenia
przedziałów ufności dla
dwumianowych proporcji i
przeprowadzenia wnioskowania
statystycznego w oparciu o
uzyskane wyniki.

Test zgodności



Opracujemy trzecie podejście do
oceny hipotezy zerowej - poprzez
testy zgodności dopasowania.



Tabela ilustruje jak postępować.

Test G

Fenot

ypy

Obserwow

ane

zliczenia

Obserwowa

proporcje

Oczekiw

ane

proporcj

Oczekiw

ane

zliczenia

Stosunek

zliczeń

obserwowa

nych do

oczekiwany

Wild-

type

0.89

0.75

67.5

1.185185

13.59192

Mutan

0.11

0.25

22.5

0.444444

-8.10930

Suma

1.0

90.0

Ln L =

5.48262











Test bazuje na logarytmie stosunków

wiarygodności

Test G



Test G może być skonstruowany
następująco:
Prawdopodobieństwo zaobserwowania
wyniku zgodnego z próbą, przy
założeniu, że parametry p i q rozkładu
są równe proporcjom w próbie, wynosi

1326838













Test G

Prawdopodobieństwo zaobserwowania
wyniku zgodnego z próbą, przy
założeniu proporcji Mendla, jest równe

0005518













Test G

Jeśli obserwowane proporcje są zgodne

z proporcjami z hipotezy zerowej,

obydwa obliczone wcześniej

prawdopodobieństwa będą równe, a ich

stosunek L równy 1.
Im większa różnica między proporcjami,

tym większe odchylenie L od 1.

Test G

Stosunek tych dwóch prawdopodobieństw
lub wiarygodności może być użyty w formie
statystyki do zmierzenia zgodności między
zliczeniami w próbie a oczekiwanymi.

Test G (logarytmiczny test ilorazu
wiarygodności)

to test oparty właśnie na

takim stosunku.

Test G

Zostało dowiedzione, że rozkład

G = 2 ln L

może być przybliżony przez rozkład χ

z jednym stopniem swobody.

Test G

W naszym wypadku

G = 2 ln L = 10.96524

Jeśli porównamy tę wartość z rozkładem

o jednym stopniu swobody (df),

otrzymujemy że wynik jest istotny
statystycznie

(p-wartość = 0.000928 < 0.001)

Rozkład chi-kwadrat, 1df

10.96524

Wzór obliczeniowy























Ponieważ









































Test G dla więcej niż dwóch
klas



Test zgodności można zastosować do

rozkładu z większą liczbą klas niż dwie.



Obliczamy stosunki obserwowanych

zliczeń do oczekiwanych, logarytmujemy

i mnożymy przez liczność obserwowaną.



Suma daje ln L, podczas gdy rozkład G =

2 ln L w przybliżeniu pokrywa się z

rozkładem chi-kwadrat z a-1 stopniami

swobody, gdzie a to liczba klas.

Przykład 1



Badanie miejsc powrotu łososi na tarło –
strumień macierzysty versus sąsiednie.

N = 200

ryb

Strumie

macierz

ysty

Strumie

ń 1

Strumie

ń 2

Strumie

ń 3

Strumie

ń 4

Obserwowan

zliczenia

135

Przykład 1

Hipoteza:

: Łososie wybierają strumień

macierzysty w 75% przypadków;

pozostałe w 25% przypadków

(6.25% na każdy z czterech).

: nie H

Przykład 1



Można sformułować hipotezę
zerową w inny sposób
H

: próba pochodzi z populacji

łososi z proporcjami 12:1:1:1:1
wyboru strumienia macierzystego i
alternatywnych.
H

: nie H

Przykład 1

Obserwowan

e zliczenia

Oczekiwan

e zliczenia

Stosune

Strumień
domowy

135

150

0.90

14.223
7

Strumień
1

12.5

1.20

2.7348

Strumień
2

12.5

1.36

5.2272

Strumień

12.5

0.80

-2.2314

Strumień

12.5

1.84

14.024
6

Suma

200

ln L =

5.5315



Przykład 1

0259

}

063

{

]

[









value

0.05

odrzucamy

poniewa

4877

063

]

[

]

[

















crit

Test chi-kwadrat zgodności
dopasowania



To tradycyjne podejście, stosowane
w znacznej liczbie publikacji
naukowych.



Jeszcze raz spójrzmy na
eksperyment genetyka z wynikiem
80 potomków wild-type i 10
mutantów.

Test chi-kwadrat zgodności
dopasowania



Najpierw obliczamy odchylenia

zliczeń obserwowanych od zliczeń

oczekiwanych i podnosimy je do

kwadratu.



Następnie obliczamy względne

kwadraty odchyleń - dzielimy je

przez liczbę zliczeń oczekiwanych.



Ostatecznie sumujemy otrzymane

wartości.

Test chi-kwadrat zgodności
dopasowania



Otrzymana statystyka jest nazywana

statystyką chi-kwadrat X

, ale ma

ona jedynie

rozkład przybliżony do

rozkładu X

z jednym stopniem

swobody



Niektórzy nazywają statystykę X

statystyką Pearsona.



Test chi-kwadrat jest zawsze

jednostronny!!

Test chi-kwadrat zgodności
dopasowania

Fenotyp

Obserwo

wane

zliczenia

Oczekiwa

stosunki

Oczekiwa

zliczenia

Odchylen

ia do

kwadratu

Względn

kwadraty

odchyleń

Wild-

type

0.75

67.5

156.25

2.3148

Mutant

0.25

22.5

156.25

6.9444

Suma

1.0

90.0

9.2592

Test chi-kwadrat zgodności
dopasowania

0023

}

2592

{

value

]

[









0.05

odrzucamy

poniewa

8415

2592

]

[

]

[















Test chi-kwadrat zgodności
dopasowania dla więcej niż
dwóch klas



Test dopasowania chi-kwadrat można

zastosować dla więcej niż dwóch klas.



Oblicz:



Statystyka X

ma w przybliżeniu

rozkład

chi-kwadrat z a-1 stopniami swobody,

gdzie a to liczba klas.











Przykład 1 - cd.

Obserwowan
e zliczenia

Oczekiwan
e zliczenia

Odchylenie Względne

odchylenia

Strumień
macierzyst
y

135

150

225

1.50

Strumień 1

12.5

6.25

0.50

Strumień 2

12.5

20.25

1.62

Strumień 3

12.5

6.25

0.50

Strumień 4

12.5

110.25

8.82

Suma

200

=12.94





n 

Przykład 1 - cd.

0116

}

{

value

]

[









0.05

odrzucamy

poniewa

4877

]

[

]

[















Testowanie cząstkowe



W naszym przykładzie o łososiach,
wygląda na to, że liczba ryb płynąca do
strumienia 4 spowodowała odrzucenie
H



Dlatego stosujemy analizę cząstkową.



Przetestujmy H

: Próbka pochodzi z

populacji z proporcjami 12:1:1:1 wyboru
strumienia macierzystego i
alternatywnych 1-3.

Przykład 1 - testowanie
cząstkowe

Obserwowa

ne zliczenia

Oczekiwan

e zliczenia

Odchylen

Względne

odchylenie

Strumień

macierzyst
y

135

177*12/15

=141.6

43.56

0.3076

Strumień 1

177*1/15=

11.8

10.24

0.8678

Strumień 2

11.8

27.04

2.2915

Strumień 3

11.8

3.24

0.2746

Suma

177

=3.7415





n 

Przykład 1 - testowanie
cząstkowe

2908

}

7415

{

value

]

[









0.05

odrzucamy

nie

poniewa

8174

7415

]

[

]

[















Korekty na nieciągłość



Wartości statystyk G lub X

liczone na

podstawie danych mają rozkład
dyskretny.



Jednak teoretyczny rozkład chi-kwadrat
jest ciągły.



Z wartościami nieskorygowanymi można
łatwiej fałszywie odrzucić H

(błąd I-

szego rodzaju jest większy niż
zamierzony).

Korekty na nieciągłość



W przypadku dwóch klas jest to

poważny problem. Jeśli N<200

musimy stosować korekty na

nieciągłość.



Test G – korekta Williams’a



Test X

– korekta Yates’a

adj

















adj

Testowanie dla innych
rozkładów



Możemy zastosować przedstawione
testy zgodności do weryfikacji hipotez o
rozkładach innych niż dwumianowy.



Jeśli szacujemy parametry rozkładu na
podstawie danych, musimy poprawnie
ustalić liczbę stopni swobody.

Testowanie dla innych
rozkładów

Rozkład

Parametry

szacowane

na podstawie

próby

Liczba df

Dwumianow

a-2

Normalny

μ,σ

a-3

Poissona

a-2

Test Kołmogorowa-
Smirnowa



Nieparametryczny test, stosowany do
analizy zmiennych o ciągłych
rozkładach częstości, mający większą
moc niż testy zgodności G i X

, jest

nazywany testem
Kołmogorowa-Smirnowa (KS).



Test KS jest szczególnie przydatny dla
małych prób, nie jest wskazane
grupowanie klas.

Test Kołmogorowa-
Smirnowa



Test jest oparty na różnicach między
dwiema dystrybuantami rozkładów
obserwowanych i oczekiwanych.



Powinien być stosowany dla danych
dyskretnych w skali porządkowej.



Jest lepszy niż zwykły test chi-kwadrat i
test G, ponieważ uwzględnia relację
porządku kategorii.

Test Kołmogorowa-
Smirnowa



Test dla dyskretnych danych analizuje
skumulowane zliczenia obserwowane i
oczekiwane oraz przyjmuje za statystykę

największą różnicę między nimi

Ta wartość jest porównywana z wartością
krytyczną, gdzie k=liczba kategorii,
N=liczność próby, α = poziom istotności alfa

max

Fˆ

max





max,

crit





Przykład 2 - dane
dyskretne



Chcemy sprawdzić czy insekty mają
preferencje związane z natężeniem
oświetlenia – czy ich liczność jest
równomiernie rozłożona wzdłuż gradientu
światła.



Nie można zmierzyć w skali liniowej różnic
gradientu światła, ale można określić, że
mniejsze liczby odpowiadają mniejszemu
natężeniu światła niż większe liczby.

Przykład 2



: Liczba insektów jest

równomiernie rozłożona wzdłuż
gradientu światła



: nie H



Ustalamy α = 0.05

Przykład 2

N=65

Ciemno -

Jasno - 5

Obserwowan

e zliczenia

Oczekiwane

zliczenia

Obserwowan

kumulatywne

zliczenia

Oczekiwane

kumulatywne

zliczenia

Przykład 2



Statystyka testowa

max

= 26



Wartość krytyczna

max,0.05,5,65

= 10

(patrz tabela)



Zasada decydowania

: odrzucenie

jeśli d

max

≥10; w przeciwnym

razie przyjęcie H



Ponieważ 26>10 (p<0.001),

odrzucamy H

Przykład 2



Wniosek:

Zaobserwowane dane nie mają
rozkładu równomiernego wzdłuż
uporządkowanych poziomów
natężenia światła (p<0.001).

Test KS zgodności
dopasowania - dane ciągłe



Wykorzystujemy własność, że pomimo
iż skumulowane oczekiwane zliczenia
opisane są funkcją ciągłą, największa
różnica między zliczeniami
obserwowanymi a oczekiwanymi
występuje w punktach nieciągłości -
jest liczona zarówno przed jak i po tym
jak dystrybuanta zliczeń
obserwowanych idzie krok w górę.

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33
Slide 34
Slide 35
Slide 36
Slide 37
Slide 38
Slide 39
Slide 40
Slide 41
Slide 42
Slide 43
Slide 44
Slide 45
Slide 46
Slide 47
Slide 48
Slide 49
Slide 50
Slide 51
Slide 52
Slide 53