Wykład 6: Testy zgodności dopasowania
TESTY ZGODNOSCI
Te metody znajdują zastosowanie przy analizie danych w skali nominalnej, pozwalają sprawdzić czy obserwowany rozkład zliczeń (nigdy częstotliwości lub proporcji) zgadza się z rozkładem hipotetycznym.
Najbardziej znaną techniką analizy jest test zgodności chi-kwadrat (χ2).
WPROWADZENIE
Załóżmy, że genetyk w ramach eksperymentu skrzyżował mieszaną populację F1 i otrzymał potomstwo F2 z 90-oma potomkami, z których n1=80 ma fenotyp typu
wild-type, a u n2=10 zaobserwowano mutacje.
Genetyk, zgodnie z prawem dziedziczenia, założył stosunek fenotypów 3:1, ale rzeczywisty stosunek wyniósł 80/10 = 8:1.
Spodziewane wartości p i q wynoszą
![]()
odpowiednio dla wild-type i mutantów.
Używamy symbolu „daszek” żeby zaznaczyć hipotetyczne lub oczekiwane wartości proporcji.
Obserwowane proporcje tych dwóch klas wynoszą odpowiednio
![]()
Innym sposobem pokazania różnic między wartościami oczekiwanymi a obserwowanymi to wyrazić je w zliczeniach (niektórzy nazywają je częstościami).
Obserwowana liczba zliczeń to n1=80 i n2=10 dla dwóch fenotypów.
Oczekiwana liczba zliczeń to

gdzie N to liczność próby - liczba potomków.
Czy obserwowane odchylenie od hipotezy 3:1 jest tak wielkie, że praktycznie nieprawdopodobne?
Innymi słowy, czy zaobserwowane dane wystarczająco różnią się od wartości oczekiwanych, żeby odrzucić hipotezę zerową?
WYKORZYSTANIE FUNKCJI GĘSTOŚCI PRAWDOPODOBIEŃSTWA
Rozkład, w którym p jest prawdopodobieństwem naturalnego fenotypu, a q zmutowanego, jest rozkładem dwumianowym.
Możemy wyliczyć prawdopodobieństwo otrzymania wyniku 80 naturalnych i 10 zmutowanych fenotypów, podobnie jak dla wszystkich „gorszych” przypadków w próbie 90 potomków dla
![]()

jest równe dopełnieniu do jedności wartości dystrybuanty.
Wyliczona wartość jest prawdopodobieństwem 0.00084895 uzyskania wyniku co najmniej tak odległego od hipotezy jak obserwowany.
Zauważ, że jest to test jednostronny; alternatywna hipoteza mówi, że jest więcej potomków z fenotypem typu wild-type, niż liczba określona przez prawo Mendla.
Zaobserwowana próba jest dość rzadkim wynikiem i możemy wnioskować, że to jest istotne odchylenie od oczekiwań.
ZASTOSOWANIE PRZEDZIAŁÓW UFNOŚCI
Jest to łatwiejsze podejście, wymagające obliczenia przedziałów ufności dla dwumianowych proporcji i przeprowadzenia wnioskowania statystycznego w oparciu o uzyskane wyniki.
TEST ZGODNOŚCI
Opracujemy trzecie podejście do oceny hipotezy zerowej - poprzez testy zgodności dopasowania.
Tabela ilustruje jak postępować.
Test G
Test bazuje na logarytmie stosunków wiarygodności
Fenotypy |
Obserwowane zliczenia |
Obserwowane proporcje |
Oczekiwane proporcje |
Oczekiwane zliczenia |
Stos.zliczeń obserwowanych do oczekiwanych |
|
Wild-type |
80 |
0.89 |
0.75 |
67.5 |
1.185185 |
13.59192 |
Mutant |
10 |
0.11 |
0.25 |
22.5 |
0.444444 |
-8.10930 |
Suma |
90 |
1.0 |
1.0 |
90.0 |
|
Ln L=5.48262
|
Test G może być skonstruowany następująco:
Prawdopodobieństwo zaobserwowania wyniku zgodnego z próbą, przy założeniu, że parametry p i q rozkładu są równe proporcjom w próbie, wynosi

Prawdopodobieństwo zaobserwowania wyniku zgodnego z próbą, przy założeniu proporcji Mendla, jest równe

Jeśli obserwowane proporcje są zgodne z proporcjami z hipotezy zerowej, obydwa obliczone wcześniej prawdopodobieństwa będą równe, a ich stosunek L równy 1.
Im większa różnica między proporcjami, tym większe odchylenie L od 1.
Stosunek tych dwóch prawdopodobieństw lub wiarygodności może być użyty w formie statystyki do zmierzenia zgodności między zliczeniami w próbie a oczekiwanymi.
Test G (logarytmiczny test ilorazu wiarygodności) to test oparty właśnie na takim stosunku.
Zostało dowiedzione, że rozkład
G = 2 ln L
może być przybliżony przez rozkład χ2 z jednym stopniem swobody.
W naszym wypadku
G = 2 ln L = 10.96524
Jeśli porównamy tę wartość z rozkładem χ2 o jednym stopniu swobody (df), otrzymujemy że wynik jest istotny statystycznie(p-wartość = 0.000928 < 0.001)
ROZKŁAD CHI-KWADRAT, 1df


10.96524
Wzór obliczeniowy



Ponieważ to

i
TEST G DLA WIĘCEJ NIŻ 2 KLAS
Test zgodności można zastosować do rozkładu z większą liczbą klas niż dwie.
Obliczamy stosunki obserwowanych zliczeń do oczekiwanych, logarytmujemy i mnożymy przez liczność obserwowaną.
Suma daje ln L, podczas gdy rozkład G = 2 ln L w przybliżeniu pokrywa się z rozkładem chi-kwadrat z a-1 stopniami swobody, gdzie a to liczba klas.
Przykład 1
Badanie miejsc powrotu łososi na tarło - strumień macierzysty versus sąsiednie.
N = 200 ryb |
Strumień macierzysty |
Strumień 1 |
Strumień 2 |
Strumień 3 |
Strumień 4 |
Obserwowane zliczenia |
135 |
15 |
17 |
10 |
23 |
Hipoteza:
H0: Łososie wybierają strumień macierzysty w 75% przypadków; pozostałe w 25% przypadków (6.25% na każdy z czterech).
Ha: nie Ho
Można sformułować hipotezę zerową w inny sposób
H0: próba pochodzi z populacji łososi z proporcjami 12:1:1:1:1 wyboru strumienia macierzystego i alternatywnych.
Ha: nie H0.
|
|
|
|
|
Strumień domowy |
135 |
150 |
0.90 |
-14.2237 |
Strumień 1 |
15 |
12.5 |
1.20 |
2.7348 |
Strumień 2 |
17 |
12.5 |
1.36 |
5.2272 |
Strumień 3 |
10 |
12.5 |
0.80 |
-2.2314 |
Strumień 4 |
23 |
12.5 |
1.84 |
14.0246 |
Suma |
200 |
200 |
|
ln L = 5.5315 |



TEST CHI-KWADRAT ZGODNOSCI DOPASOWANIA
To tradycyjne podejście, stosowane w znacznej liczbie publikacji naukowych.
Jeszcze raz spójrzmy na eksperyment genetyka z wynikiem 80 potomków wild-type i 10 mutantów.
Najpierw obliczamy odchylenia zliczeń obserwowanych od zliczeń oczekiwanych i podnosimy je do kwadratu.
Następnie obliczamy względne kwadraty odchyleń - dzielimy je przez liczbę zliczeń oczekiwanych.
Ostatecznie sumujemy otrzymane wartości.
Otrzymana statystyka jest nazywana statystyką chi-kwadrat X2, ale ma ona jedynie rozkład przybliżony do rozkładu X2 z jednym stopniem swobody.
Niektórzy nazywają statystykę X2 statystyką Pearsona.
Test chi-kwadrat jest zawsze jednostronny!!
Fenotypy |
Obserwowane zliczenia |
Oczekiwane stosunki |
Oczekiwane zliczenia |
Odchylenia do kwadratu |
Względne kwadraty odchyleń |
Wild-type |
80 |
0.75 |
67.5 |
156.25 |
2.3148 |
Mutant |
10 |
0.25 |
22.5 |
156.25 |
6.9444 |
Suma |
90 |
1.0 |
90.0 |
|
X2 = 9.2592 |



TEST CHI-KWADRAT ZGODNOSCI DOPASOWANIA DLA WIĘCEJ NIŻ DWÓCH KLAS
Test dopasowania chi-kwadrat można zastosować dla więcej niż dwóch klas.
Oblicz:

Statystyka X2 ma w przybliżeniu rozkład chi-kwadrat z a-1 stopniami swobody, gdzie a to liczba klas.
Przykład 1 - cd.
|
|
|
|
Względne odchylenia |
Strumień macierzysty |
135 |
150 |
225 |
1.50 |
Strumień 1 |
15 |
12.5 |
6.25 |
0.50 |
Strumień 2 |
17 |
12.5 |
20.25 |
1.62 |
Strumień 3 |
10 |
12.5 |
6.25 |
0.50 |
Strumień 4 |
23 |
12.5 |
110.25 |
8.82 |
Suma |
200 |
200 |
|
X2=12.94 |



TESTOWANIE CZĄSTKOWE
W naszym przykładzie o łososiach, wygląda na to, że liczba ryb płynąca do strumienia 4 spowodowała odrzucenie H0.
Dlatego stosujemy analizę cząstkową.
Przetestujmy H0: Próbka pochodzi z populacji z proporcjami 12:1:1:1 wyboru strumienia macierzystego i alternatywnych 1-3.
Przykład 1 - testowanie cząstkowe
|
Obserwowane zliczenia |
Oczekiwane zliczenia |
Odchylenie |
Względne odchylenie |
Strumień macierzysty |
135 |
177*12/15=141.6 |
43.56 |
0.3076 |
Strumień 1 |
15 |
177*1/15=11.8 |
10.24 |
0.8678 |
Strumień 2 |
17 |
11.8 |
27.04 |
2.2915 |
Strumień 3 |
10 |
11.8 |
3.24 |
0.2746 |
Suma |
177 |
|
|
X2=3.7415 |



KOREKTY NA NIECIĄGŁOŚĆ
Wartości statystyk G lub X2 liczone na podstawie danych mają rozkład dyskretny.
Jednak teoretyczny rozkład chi-kwadrat jest ciągły.
Z wartościami nieskorygowanymi można łatwiej fałszywie odrzucić H0 (błąd I-szego rodzaju jest większy niż zamierzony).
W przypadku dwóch klas jest to poważny problem. Jeśli N<200 musimy stosować korekty na nieciągłość.
Test G - korekta Williams'a
![]()
Test X2 - korekta Yates'a

TESTOWANIE DLA INNYCH ROZKŁADÓW
Możemy zastosować przedstawione testy zgodności do weryfikacji hipotez o rozkładach innych niż dwumianowy.
Jeśli szacujemy parametry rozkładu na podstawie danych, musimy poprawnie ustalić liczbę stopni swobody.
Rozkład |
Parametry szacowane na podstawie próby |
Liczba df |
Dwumianowy |
p |
a-2 |
Normalny |
μ,σ |
a-3 |
Poissona |
μ |
a-2 |
TEST KOŁMOGOROWA- SMIRNOWA ( KS )
Nieparametryczny test, stosowany do analizy zmiennych o ciągłych rozkładach częstości, mający większą moc niż testy zgodności G i X2, jest nazywany testem
Kołmogorowa-Smirnowa (KS).
Test KS jest szczególnie przydatny dla małych prób, nie jest wskazane grupowanie klas.
Test jest oparty na różnicach między dwiema dystrybuantami rozkładów obserwowanych i oczekiwanych.
Powinien być stosowany dla danych dyskretnych w skali porządkowej.
Jest lepszy niż zwykły test chi-kwadrat i test G, ponieważ uwzględnia relację porządku kategorii.
Test dla dyskretnych danych analizuje skumulowane zliczenia obserwowane i oczekiwane oraz przyjmuje za statystykę największą różnicę między nimi:
![]()
![]()
Ta wartość jest porównywana z wartością krytyczną, gdzie k=liczba kategorii, N=liczność próby, α = poziom istotności alfa
Przykład 2 - dane dyskretne
Chcemy sprawdzić czy insekty mają preferencje związane z natężeniem oświetlenia - czy ich liczność jest równomiernie rozłożona wzdłuż gradientu światła.
Nie można zmierzyć w skali liniowej różnic gradientu światła, ale można określić, że mniejsze liczby odpowiadają mniejszemu natężeniu światła niż większe liczby.
H0: Liczba insektów jest równomiernie rozłożona wzdłuż gradientu światła
Ha: nie H0
Ustalamy α = 0.05
N=65 |
Ciemno - 1 |
2 |
3 |
4 |
Jasno - 5 |
Obserwowane zliczenia |
0 |
7 |
6 |
38 |
14 |
Oczekiwane zliczenia |
13 |
13 |
13 |
13 |
13 |
Obserwowane kumulatywne zliczenia |
0 |
7 |
13 |
51 |
65 |
Oczekiwane kumulatywne zliczenia |
13 |
26 |
39 |
52 |
65 |
|di| |
13 |
19 |
26 |
1 |
0 |
Statystyka testowa dmax = 26
Wartość krytyczna dmax,0.05,5,65 = 10 (patrz tabela)
Zasada decydowania: odrzucenie H0 jeśli dmax≥10; w przeciwnym razie przyjęcie H0.
Ponieważ 26>10 (p<0.001), odrzucamy H0.
Wniosek:
Zaobserwowane dane nie mają rozkładu równomiernego wzdłuż uporządkowanych poziomów natężenia światła (p<0.001).
TEST KS ZGODNOŚCI DOPASOWANIA - dane ciągłe
Wykorzystujemy własność, że pomimo iż skumulowane oczekiwane zliczenia opisane są funkcją ciągłą, największa różnica między zliczeniami obserwowanymi a oczekiwanymi występuje w punktach nieciągłości - jest liczona zarówno przed jak i po tym jak dystrybuanta zliczeń obserwowanych idzie krok w górę.
![]()
![]()

![]()








![]()
![]()
![]()
![]()







![]()
![]()
![]()


![]()

![]()
![]()