Zastosowanie komputerów
Michał Ścibor-Rylski
Tabele krzyżowe i test Chi
2
Zajęcia 10
Tabele krzyżowe
Tabele krzyżowe przedstawiają liczebności i/lub procenty dla dwóch (i czasem
większej liczby) zmiennych jednocześnie. Ze skrzyżowania wiersza i kolumny
możemy dowiedzieć się, ile zbadaliśmy osób należących jednocześnie do obu
kategorii. Najłatwiej to zobrazować przykładem: w badaniu bierze udział 20 osób:
10 kobiet (wartość 1) i 10 mężczyzn (2). Wszystkich uczestników pytamy o to,
którą porę roku wolą: lato (1), czy zimę (2). Po wpisaniu danych do SPSSa nasz
edytor danych wygląda tak:
Okazało się, że tylko dwie kobiety wolą lato i tylko dwóch
mężczyzn woli zimę. Na pierwszy rzut oka widać, że istnieje
jakaś zależność pomiędzy płcią i ulubioną porą roku. Czy
jest ona istotna? Dowiemy się po przeprowadzeniu testu
Chi
2
. Na razie wykonajmy tabelę krzyżową:
Analiza – opis statystyczny – tabele krzyżowe.
Przerzućmy „płeć” do wierszy i „porę” do kolumn.
Otrzymamy następującą tabelę krzyżową:
Test Chi
2
Test Chi
2
bada zależność pomiędzy dwoma zmiennymi. Zwykle są to zmienne
nominalne, ale oczywiście możemy wykonać ten test dla zmiennych ilościowych
(pamiętajmy wtedy, że nie powinny mieć zbyt wielu kategorii – w celu uniknięcia
ogromnych tabeli krzyżowych). W takim przypadku jednak lepiej pomyśleć o
jakimś bardziej zaawansowanym teście, np. teście t.
Test Chi
2
opiera się na różnicach pomiędzy liczebnościami otrzymanymi (f
o
) a
liczebnościami oczekiwanymi (f
e
).
Liczebności otrzymane oddają rzeczywisty rozkład wyników uzyskanych w
badaniu. Liczebności oczekiwane przedstawiają rozkład wyników w przypadku
niezależności zmiennych (w naszym przypadku niezależności ulubionej pory roku
od płci). Oblicza się je poprzez podzielenie iloczynu liczebności brzegowych dla
danej celki przez całkowitą liczbę osób (u nas zawsze liczebność brzegowa wynosi
10, więc dzielimy 100/20 i mamy w każdej celce 5). Obliczmy test Chi
2
oraz
liczebności oczekiwane: test jest w „tabelach krzyżowych” w „statystykach”, a
liczebności oczekiwane w „komórkach”.
2
=
∑
(f
o
– f
e
)
2
f
e
Test Chi
2
Po wykonaniu testu, otrzymujemy następujący raport:
Stąd odczytujemy wynik
testu
Chi2.
Stopnie
swobody
oblicza
się
mnożąc przez siebie:
liczbę wierszy-1 oraz
liczbę
kolumn-1.
Dla
tabeli 2x2 będzie to
zatem 1.
Uzyskany
wynik
zapisujemy:
2
(1)
= 7,2; p < 0,01
Wynik
jest
istotny,
istnieje zatem zależność
pomiędzy zmiennymi. Po
spojrzeniu
na
tabelę
krzyżową,
widać,
iż
kobiety wolą zimę, a
mężczyźni lato.
Pamiętajmy,
że
przy
teście Chi
2
nie wolno
mówić
o
kierunku
zależności (choć czasem
jest on oczywisty).
Przy wykonywaniu testu Chi
2
należy
pamiętać,
że
liczebności oczekiwane w
każdej celce nie powinny być
mniejsze niż 5.
Procenty w tabelach krzyżowych
W tabelach krzyżowych mamy możliwość otrzymania trzech rodzajów procentów: z
wiersza, z kolumny i z całości. Każdy z nich odnosi liczebność otrzymaną z celki do
innej podstawy oprocentowania: raz jest to liczebność brzegowa z wiersza, raz z
kolumny, raz całkowita liczba osób badanych. Procenty zaznaczmy w tabelach
krzyżowych w „komórkach”:
Odczytywanie wartości procentowych
może prowadzić do wielu błędów,
zwłaszcza
bez
odpowiedniego
treningu.
Dlatego
przećwiczmy
najczęstsze pytania na przykładzie ze
zbioru ALL99. Wykonujemy tabelę
krzyżową płci (sex) i stanu cywilnego
(marital). Płeć wrzućmy do wierszy, a
stan cywilny do kolumn. Zaznaczamy
wszystkie trzy rodzaje procentów.
Procenty w tabelach krzyżowych
Po wykonaniu tabeli krzyżowej, otrzymujemy następujący raport:
% z wiersza: mówi nam, jaki procent ze wszystkich osób tej płci stanowią osoby
z danego stanu cywilnego: np. wdowy stanowią 18,3% wszystkich kobiet.
% z kolumny: mówi nam, jaki procent ze wszystkich osób danego stanu cywilnego
stanowią osoby danej płci: np. kobiety stanowią 52,1% wszystkich osób w
związkach małżeńskich..
% z całości: mówi nam, jaki procent ze wszystkich osób badanych stanowią
osoby danej płci i stanu cywilnego: np. rozwiedzieni mężczyźni stanowią 1,1%
wszystkich osób badanych.