TEST ZGODNOŚCI CHI-KWADRAT

Test zgodności chi-kwadrat służy do weryfikowania hipotezy, że obserwowana cecha X charakteryzuje się w populacji określonym rodzajem rozkładu.

Hipotezę zerową formułujemy słownie w zależności od tego, jakim rozkładem charakteryzuje się badana cecha. Przykłady hipotezy zerowej zostały zaprezentowane poniżej:

  1. H0: cecha X ma rozkład określony dystrybuantą F(x) = F0(x),

  2. H0: cecha X ma rozkład N(m,σ),

  3. H0: cecha X ma rozkład Poissona.

Sprawdzianem hipotezy zerowej jest statystyka wyrażona w następujący sposób:

0x01 graphic

Statystyka testu ma rozkład χ2 o ν = k - r - 1 stopniach swobody, gdzie r to liczba szacowanych parametrów, od których zależy rozkład cechy w populacji, natomiast k to liczba przedziałów klasowych lub wariantów cechy X;

pi oznacza prawdopodobieństwo tego, że cecha X przyjmuje wartość należącą do i-tego przedziału klasowego, npi oznacza liczbę jednostek, które powinny znaleźć się w i-tym przedziale (przy założeniu, że cecha ma rozkład zgodny z hipotetycznym).

Jeżeli 0x01 graphic
, to nie ma podstaw do odrzucenia hipotezy zerowej, w przeciwnym przypadku istnieją podstawy do odrzucenia hipotezy zerowej.

Przykład

Na podstawie danych zawartych w poniższej tablicy należy odpowiedzieć na pytanie czy na poziomie istotności 0,05 można sądzić, że rozkład dziennej liczby dostaw dla pewnego przedsiębiorstwa Z w ciągu 90 dni jest rozkładem Poissona?

0x08 graphic
Tab. Dzienna liczba dostaw dla przedsiębiorstwa Z

Przez X oznaczamy dzienną liczbę dostaw do przedsiębiorstwa Z. Hipotezę zerową i alternatywną zapisujemy w następującej postaci:

H0: X ma rozkład Poissona,

H1: X nie ma rozkładu Poissona.

W rozkładzie Poissona wartości prawdopodobieństw są funkcją parametru m. Wartość parametru m jest nieznana, w związku z czym najpierw należy parametr ten oszacować na podstawie próby. Ponieważ w rozkładzie Poissona parametr m = E(X), można zatem do oszacowania tego parametru przyjąć estymator wartości przeciętnej. Otrzymujemy wartość średnią równą 1,656 (obliczenia znajdują się w arkuszu kalkulacyjnym MS Excel, do którego link znajduje się na końcu strony), stąd zaokrąglając przyjmujemy m = 1,7. Prawdopodobieństwa pi znajdujemy w tablicach rozkładu Poissona dla m = 1,7 tak, że pi = P(X = xi). Ostatnia wartość pi wynosi 0,092, jako różnica między jednością a sumą pi poprzednich.

Dzienna liczba dostaw (xi)

Liczba dni (fi)

xifi

0

19

0

1

29

29

2

17

34

3

14

42

4

11

44

Suma

90

149

wartość przeciętna

1.656

W celu wyznaczenia statystyki testu χ2 należy dokonać pewnych obliczeń, które zawiera poniższa tablica:

0x08 graphic
Tab. Obliczenia pomocnicze

0x01 graphic

Wartość statystyki testu χ0,052 odczytana z tablic dla ν = 5 - 1 - 1 = 3 stopniach swobody wynosi 7,815.

Ponieważ χ2 < χ2α, to nie ma podstaw do odrzucenia hipotezy zerowej, że rozkład liczby dostaw jest rozkładem Poissona.

0x01 graphic

0x01 graphic