liczebności jakich oczekiwalibyśmy gdyby nie istniały żadna zależność między zmiennymi. Przypuśćmy* że zamierzamy zapytać 20 mężczyzn 120 kobiet o upodobanie.^do.jednej z dwóch gatunków wody sodowej (gatunki A i B). Gdyby nie było żadnej zależności ^między upodobaniem odnośnie wody sodowej a płcią wówczas należałoby oczekiwać mniej* więcej jednakowych liczebności w preferencjach gatunku A i B dla obu^ci. Test Chi-kwadrat staje -się rosnąco istotny w miarę wzrostu odstępstwa od tego oczekiwanego schematu (to znaczy w, miarę jak liczebności odpowiedzi dla mężczyzn i kobiet zaczynają się różnić).
Wartość cłu-icwadtat i jej istotność Zależy ód hrafi^obśer^jf-fTićzby komórekw^tabeliP Zgodnie z zasadami dyskutowanymi w rozdziale Pojęcia..podstawowe stosunkowo małe odchylenia od oczekiwań okażą się istotne jeśli liczność próbki jest duża.
Jedynym założeniem leżącym u podstaw stosowania testu chi-kwadrat (poza losowością próbki) jest aby liczebności oczekiwane nie były bardzo małe. Powodem jest tu fakt, że chi-kwadrat testuje prawdopodobieństwa w poszczególnych komórkach i jeśli jakieś liczebności będąnp. poniżej 5 to oceny tych prawdopodobieństw okażą się wysoce nieprecyzyjne. Dalsze informacje na ten temat znaleźć można u: Everitta (1977). Haysa (1988), Kendalla i Stuarta (1979).
Dokładny test Fishera
Test ten jest dostępny jedynie w tabelach 2 x 2 i opiera się na następującym rozumowaniu: Przypuśćmy, że mamy--.dane; Liczebności'j?rzegowe-jvy -tabeli i zakładając*- że w populacj i, nie istnieje-zależność* między:/zrraenriymi. analizowanymi, w tabeli postawmy1 pytanie: jakie? jest. prawdopodobieństwo, że liczebnością ^poszczególnych4 komórkach siłożą .śię tak
nierównomiernie:; > (iub gorzejjr- jak '‘.obserwujemy- /w >tabeli?; ‘ Dla ';:ńmałyGh; >n prawdopodobieństwo to można policzyć dokładnie przez,, zliczenie wszystkich możliwych tabel, które można skonstruować na podstawie liczebności brzegowych. W ten sposób dokładny test Fishera oblicza dokładne prawdopodobieństwo przy hipotezie zerowej polegającej na uzyskaniu bieżącego rozkładu liczebności w komórkach tak samo lub bardziej nierównomiernej. Podawane są zarówno prawdopodobieństwa jedno jak i dwustronne.
Współczynnik Fi
Fi-kwadrat jest miarą korelacji między dwiema zmiennymi skategoryzowanymi w tabeli 2 x 2. Jego wartość może się zmieniać od 0 (brak relacji między zmiennymi; chi-kwadrat=0.0) do 1 (całkowita zależność między zmiennymi w tabeli).
- Współczynnik Kontyngencji
Współczynnik kontyngencji jest, opartą na wartościach chi-kwadrat,
miarą zależności między zmiennymi skategoryzowanymi zaproponowaną przez Pearsona, twórcę testu chi-kwadrat). Jej zaletą w porównaniu ze zwykłą wartością chi-kwadrat jest to, że jest łatwiej interpretowałna ponieważ zawsze zawarta jest pomiędzy 0 i 1 (0 oznacza niezależność zmiennych). Podstawową wadą tej statystyki jest natomiast to, że jej maksymalna wartość górna zależy od rozmiaru tabeli. C może osiągnąć wartość 1 jedynie dla nieskończonej liczby kategorii (zob. Siegel, 1956, str. 201).
Poważną wadą miar kontyngencji (opisanych wyżej) jest to, że nie są one łatwo interpretowalne w terminach prawdopodobieństwa lub proporcji zmienności jak to ma miejsce np. dla współczynnika korelacji Pearsona (zob. Korelacje). W ogóle należy dodać, że