100 Ł Parametryczne testy istotność:
omawiać. Zajmiemy się tu i w § 2.9 jedynie przypadkami mającymi zastosowanie w ogólnej statystyce, nie tylko doświadczalnej. Omówimy najpierw prosty' przypadek analizy wariancji w tzw. klasyfikacji pojedynczej. Sumę kwadratów wariancji ogólnej rozbija się tu jedynie na dwa składniki mierzące zmienność między grupami (populacjami) i wewnątrz grup. Porównując testem F wariancję między grupami z wariancją wewnętrzną grup rozstrzygamy, czy średnie grupowe różnią się istotnie od siebie czy nic. Jeżeli podział na grupy np. przebiegał ze względu na różne poziomy badanego czynnika, to można w ten sposób wykryć wpływ poziomu na efekt wartości badanej cechy.
Test analizy wariancji zwykle przeprowadza się według określonego schematu, ujętego w postaci tzw. tablicy analizy wariancji, mającej różną liczbę wierszy w zależności od konkretnego schematu, ale kolumny zawsze następujące:
Źródło Z/mejmości |
Suma kwadratów |
Stopnic swobody |
Wariancja |
Test F |
Do tabelki tej wpisuje się odpowiednie dane liczbowe obliczone z wyników próby* Dzieląc odpowiednią sumę kwadratów' przez stopnie swobody otrzymujemy pewne oceny wariancji, które porównujemy testem F z wariancją resztową na przyjętym poziomic istotności. Jeżeli to efekt
danego czynnika jest istotny.
Należy wspomnieć, że testy analizy wariancji mają bardzo liczne zastosowania między innymi -w analizie regresji.
Podamy teraz model analizy wariancji dla klasyfikacji pojedynczej. Testem podanym w tym modelu weryfikuje się hipotezę, że średnie wartości wielu populacji są takie same. Potrzebne w tym teście założenie jednorodności wariancji można sprawdzić testem Jłartletta omówionym w § 2.7.
Model. Danych jest k populacji o rozkładzie normalnym N(m,. a,) (i= 1,2, ...,k) lub o rozkładzie zbliżonym do normalnego. Zakłada się przy tym, że wariancje wszystkich k populacji są równe, tzn. <Ą=a\ = ...= =al**o2 (lecz nie muszą być znane). Z każdej z tych populacji wylosowano
niezależnie próby o liczebności ^ elementów. Wyniki prób oznaczone są przez xti (i— 1,2, /=!, 2, ...>«,) przy czym x,;=«,+£i;, gdzie
£;; jest wartością zmiennej losowej nazywanej jk/a/ńitfcwytt losowym, mającej rozkład ff{0, <x|. Na podstawie wyników xfj należy zweryfikować hipotezę Hc: mx = m2 = ...=mk wobec hipotezy alternatywnej Ht: nie wszystkie średnie badanych populacji są równe.
Test istotności (analizy wariancji) dla tej hipotezy jest następujący. Obliczamy z wyników poszczególnych prób średnie grupowe xt, i średnią ogólną x:
(2.15) -f*y dla i — 1,2, — , k»
j-i
(2.16) *=— £ gdzie n= £ nf.
w i«l I i= 1
2 kolei obliczamy odpowiednie sumy kwadratów i wypełniamy wartościami liczbowymi następującą tablicę analizy wariancji; występująca w niej statystyka F raa przy założeniu prawdziwości hipotezy H0 rozkład F Snedecora o k—l i n-k stopniach swobody:
j Źródło 1 zmkrcnoici |
Sama kwadratów |
Stopnie swobody |
Wariancja |
Test F |
między populacjami (jrupemi) |
t |
*-* |
Ji |
f=t\ |
wewnątrz grup (składnik lo&owy) |
» “* X X (xu-X,)* 1-1 /-I |
«-A |
ii |
Obliczoną w tablicy analizy wariancji wartość F porównujemy w końcu z wartością krytyczną Fx odczytaną z tablky rozkładu F Snedecora dla ustalonego z góry poziomu istotności a i dla. odpowiedniej liczby k — 1 oraz n-k stopni swobody. Spełniona ma być przy tym równość P {F^FJ = =*• Jeżeli w wyniku porównania otrzymamy nierówność F^FX> to hipotezę }JQ o równości średnich w badanych populacjach należy odrzucić. Natomiast gdy F<Fąt to nic ma podstaw do odrzucenia hipotezy H0.