3.2.2. Testy zgodności
Dotychczas oceniano zgodność rozkładu obserwowanych danych z rozkładem teore-lym na podstawie wykresów. Jest 10 jednak ocena subiektywna, zalczna od oceniającego iej obiektywne są oceny ilościowe zgodności na podstawie testów statystycznych, pacowano wiele testów, które dzielą się na dwie grupy Do pierwszej należą testy, które być stosowane dla dowolnego hipotetycznego rozkładu. Najbardziej rozpowszechnione i w tej grupie dwa testy; test chi-kwadrat i test Kołmogorowa. Do drugiej grupy należą testy kj specjalistyczne, służące do badania zgodności z konkretnym rozkładem hipotc-ivm Najliczniejszą grupę stanowią tu testy normalności, czyli testy badające zgodność hi zmienną losową z rozkładem normalnym Wśród nich najczęściej stosowane są. Sbapi ro-Wilka i test Liiliefbrsa
3.2.2.1. Test chi-kwadrat <*:)
Jest to nąjbardzią rozpowszechniony test, opracowany przez Karla Pearsona Hi późny rozkład zmienną losową X może być dowolnym rozkładem i dotyczyć zarówno lennej losową ciągłą, jak i skokową. Hipoteza zerowa będzie miała postać
Ho: zmienna losowa X ma rozkład określony funkcją gęstości f(x), przy hipotezie matywnej, że rozkład zmiennej X jest inny, niż to określa hipoteza zerowa.
Test x2 przeprowadza się w następujący sposób. Dokonuje się n obserwacji zmiennej jwej X. Otrzymany zakres zmienności zaobserwowanych wartości dzieli się na k klas. łlicza się liczbę obserwacji n, należących do każdej klasy. Jeżeli hipoteza zerowa jest sdzłwa, można oczekiwać, że liczba obserwacji w każdą klasie powinna wynosić np, tby pi są prawdopodobieństwami zaobserwowania zmienną X w i-tą klasie i mogą być
iczone z wzoru:
Pi = J/(*)<*
(3 1)
pwnując liczebności zaobserwowane z teoretycznymi, otrzymuje się statystykę testową.
(32)
ystyka ta posiada asymptotycznie (tzn. dla n --> <*>) rozkład x‘ z liczbą stopni swobody ft-l Rzadko jednak zdarza się, że można postawić hipotezę zerową, w której podaje się tości parametrów rozkładu. Najczęściej w hipotezie zerową podawany jest typ rozkładu mej a wartości parametrów muszą być oszacowane na podstawie zebranych obserwacji y). W tym przypadku liczbę stopni swobody statystyki y~ zmniejsza się o liczbę tymowanych parametrów. Zatem liczba stopni swobody statystyki %2 jest równa k - r - 1. [gdzie r oznacza liczbę oszacowanych parametrów na podstawie zaobserwowanych danych