Statystyka inżynierska – wykład
Test chi - kwadrat
Test chi – kwadrat ( Pearsona) należy do testów nieparametrycznych. Za pomocą tych testów weryfikuje się hipotezy dotyczące rozkładu statystycznego danej cechy, natomiast nie oceniają wartości parametrów tego rozkładu. Test chi-kwardrat jest testem zgodności, który odpowiada nam na pytanie „Czy populacja ma określony rozkład?”
Test chi-kwadrat możemy zastosować dla dużej n-elementowej próby. Przyjmuje się, że minimalna ilość szeregów rozdzielczych powinna wynosić ni=5. Dane w tej próbie powinny zostać wyznaczone w sposób niezależny oraz w postaci szeregu rozdzielczego o r przedziałach klasowych , o liczebnościach przedziałów n, spełniających warunek n1+ n2+ ...+nr=n, i=1,2,...,r. Hipotetyczny rozkład testu może być zarówno rozkładem typu ciągłego, jak i skokowego.
Wzór testu Pearsona:
gdzie:
pi - prawdopodobieństwo, że cecha X przyjmuje wartość należącą do i-tego przedziału klasowego,
npi - liczba jednostek, które powinny znaleźć się w i-tym przedziale przy założeniu, że cecha ma rozkład zgodny z hipotezą.
Gdy hipoteza zerowa jest prawdziwa to statystyka ta ma rozkład chi-kwadrat o r-k-1 stopniach swobody.
gdzie:
r – liczba przedziałów klasowych szeregu rozdzielczego,
k – liczba wyznaczonych parametrów rozkładu statystycznego ( dla rozkładu normalnego k=2, bo ocenia się wartość oczekiwaną i odchylenie standardowe).
Statystka ta stanowi rozbieżność pomiędzy rozkładem empirycznym a teoretycznym, co oznacza że zbyt duże wartości powodują odrzucenie hipotezy zerowej.
Rozkład chi kwadrat (χ²), to rozkład zmiennej loseowej, która jest sumą kwadratów niezależnych zmiennych losowych o rozkładzie normalnym.
Jeżeli ciąg niezależnych zmiennych losowych oraz:
gdzie k – liczba stopni swobody rozkładu zmiennej loseowej,
to:
Wykres
prawdopodobieństwa rozkładu chi kwadrat.
Wykres
dystrubuanty rozkładu chi kwadrat.
Postać zbioru krytycznego:
Gdzie: - wartość krytyczna z tablic rozkładu dla r - k - 1 stopni swobody. Reguły decyzyjne: - jeśli wartość - spełnia nierówność:
albo nierówność:
to odrzuca się hipoteze alternatywną: na korzyść hipotezy: .
Ilustracja
przedstawiająca postać zbioru krytycznego
Tablica wartości krytycznych dla zadanej liczby stopni swobody n i poziomu ufności.
Test chi kwadrat w praktyce można wykorzystać na różne sposoby:
sprawdzenie równoliczności grup
porównanie występowania obserwacji z ich teoretycznym występowaniem
1) Równoliczność grup.
Przykład:
Przeprowadzono badania, aby sprawdzić czy w ankiecie wzieła udział równa liczba kobiet i mężczyzn ( statystycznie równa). Przebadano 480 kobiet i 520 mężczyzn. Wynik okazał się nieistotny statystycznie (dla p<0,05). Oznacza to, że można przyjąć, że w ankiecie wzięła udział równa liczba kobiet i mężczyzn.
Test ten stosuje się również w przypadku sprawdzenia, czy któraś z udzielonych odpowiedzi była najczęściej iudzielana.
2) Występowania obserwacji a ich teoretyczne występowanie.
Przykład:
Załóżmy, że żyjemy w kraju, gdzie 70% populacji stanowią kobiety. W przeprowadzonym badaniu przebadano 60 mężczyzn i 40 kobiet. Następnie sprawdzono, czy rozkład płci w badaniu pokrywa się z rozkładem w populacji danego kraju. Teoretycznie, badając 100 osób, przebadanych powinno zostać 70 kobiet i 30 mężczyzn. Przy użyciu testu zgodności chi kwadrat stwierdzono, że różnica w proporcjach kobiet i mężczyzn jest na tyle duża, że można powiedzieć iż rozkład płci w badaniu nie odzwierciedla rozkładu w populacji.