A ndrzcj Halicki Katedra Statystyki U(t
Analiza zależności cech jakościowych
3. Kryteria niezależności
Zdefiniujemy pojęcie niezależności i określimy kiyteria niezależności.
Rozważmy w pierwszym rzędzie przypadek podwójnej dychotomii:
Dwie cechy A i B są niezależne, jeśli znajdujemy taka samą proporcję A wśród B, jak i wśród nie-5. Kryterium niezależności możemy więc zapisać w postaci proporcji
b
(O
a + c b+d
Jeżeli relacja ta jest spełniona, to spełnione będą również pozostałe tego typu zależności w kolumnach i wierszach, t;ikże w odniesieniu do liczebności brzegowych. Zapiszemy jedną taką proporcję włączając w nią liczebności brzegowe
a a + b
(2)
(3)
a + c n
Otrzymamy z niej równość
(a + b)(a + c) n
określającą kryterium niezależności w innej formie, w odniesieniu do pierwszej komórki tablicy.
Uogólniając je na wszystkie cztery klasy możemy powiedzieć, że jeżeli cechy A i B są niezależne, to liczebności a, b, c i d równają się iloczynom odnowiednich liczebności brzegowych podzielonych przez liczebność pu /. Jeżeli zaś uwzględnimy wszystkie czteiy takie równości, to stwierdzimy, że zachodzi związek
(4)
a d = b c
który pozwala na łatwe rozpoznanie, czy dwie cechy dychotomiczne są, czy też nie są zależne.
Jeżeli chodzi o klasyfikację wielodzielczą, to jako uogólnienie wzoru (3) można podać następujące twierdzenie:
Jeżeli cechy A i B są całkowicie niezależne w całej zbiorowości, to dla wszystkich klas AtBj zachodzi równość
Analogicznie sformułowanym warunkiem w odniesieniu do cech zł i B jest
(6)
Pij = Pi. ■ P.j
gdzie Pi* = /n oraz P*j=n*j!n są empirycznymi prawdopodobieństwami
realizacjami /-tego wariantu cechy A orazy-tego wariantu cechy B.
3