47
Statystyka matematyczna
Testy zgodności z rozkładem normalnym
Testy te sprawdzają, czy próbka pochodzi z jakiegoś rozkładu normalnego. Przykładem są tutaj testy KołmogorowarSmirnowa, czy Shapiro-Wilka. Testy te są szczególnie istotne, ponieważ założenie o tym, że dane pochodzą z pewnego rozkładu normalnego, jest często wykorzystywane w innych testach statystycznych (patrz np. rozdział 3.6.4).
Testy średnich
Testy te wykorzystywane są w przypadku dwóch (lub większej) liczby grup obserwacji. Ich celem jest sprawdzenie hipotezy, czy średnie w poszczególnych grupach są identyczne. Dla dwóch grup przykładem są tu tzw. testy t. W teście tym zakładamy, że obserwujemy dwie próby X\, A'2,..., oraz Yi, Y2,..., przy czym Xu X2i..., Xni ~ N(fiX,°2) oraz YuY2i..., Yni ~ N(py, a2). Hipoteza zerowa ma postać
Ho ■ HX = t*Y • (3.118)
Jak widzimy, chcemy sprawdzić hipotezę o równości średnich, przy założeniu, że nieznana wariancja jest taka sama w obydwu próbach i wynosi a2.
Przez x oznaczymy średnią dla pierwszej próby („iksów”), przez y - średnią dla drugiej próby („igreków”), przez - empiryczną wariancję obliczoną dla pierwszej próby, a przez $y - empiryczną wariancję obliczoną dla drugiej próby. Wtedy statystyka testowa ma postać
* - y /nin2{ni -f n2 - 2)
\AflSx +«2«v- V |
ni -ł-ri2 |
Hipotezę (3.11S) odrzucamy, jeśli |
(3.119)
Należy pamiętać, że przed wykonaniem tego testu niezbędne jest sprawdzenie dwóch jego założeń - o tym, że odpowiednie próby „iksów” i „igreków” pochodzą z rozkładu normalnego, oraz o tym, że wariancje w obydwu próbach są takie same. Jeśli założenie o równości wariancji nie jest spełnione, zamiast wyżej przedstawionego testu, zastosować możemy bardziej skomplikowany test Satterthwite’a.
W przypadku trzech (lub większej) liczby grup odpowiedni test porównywania średnich w grupach nazywa się analizą wariancji. Hipoteza zerowa ma wtedy postać
Ho : A*i = A*2 = = • • • = Vk > (3.121)
gdzie m oznacza średnią dla i-tej grupy złożonej z obserwacji , X$.
W praktyce bardzo często spotykanym modelem jest założenie, że obserwacje mają postać
gdzie h jest stałą dla wszystkich obserwacji wartością oczekiwaną, rn jest składową wyniku pomiaru wynikającą z działania pewnego i-tego czynnika zewnętrznego (tzw. przyczyny głównej), zaś jest losowym błędem, jednorodnym pod