ANALIZA STATYSTYCZNA DANYCH
podstaw, bv twierdzić, że pokazanie klientowi zdjęcia szarlotki w istotny sposób wpływa na decyzję o złożeniu na nią zamówienia.
Przypatrzmy się bliżej statystykom podawanym w tabelach raportu pakietu SPSS:'
• Statystyka CHI-KWADRAT PEARSONA podaje wartość i istotność testu chi-kwadrat wyliczonego na podstawie wzorów przedstawionych w pierwszej części tekstu.
• Poprawka na ciągłość (czyli test chi-kwadrat z poprawką Yatesa) jest obliczana wyłącznie dla tabel o rozmiarach 2x2 (czyli dla dwóch zmiennych dwukategorialnych) i podaje wartość oraz istotność testu chi-kwadrat która dla tabel o takim właśnie rozmiarze powinna być lepszym przybliżeniem rzeczywistej miary związku między zmiennymi.
• ILORAZ WIARYGODNOŚCI — jest rzeczywistym testem chi-kwadrat wy-liczanym na podstawie metod regresji logistycznej. Kiedywroku 1900 Karl Pearson przedstawiał opracowany przez siebie test statystyczny chi-kwadrat Pearsona, nie istniały' jeszcze komputery służące do obliczeń statystycznych, a obliczanie ILORAZU WIARYGODNOŚCI byłoby uciążliwe Test chi-kwadrat Pearsona ma tę zaletę, że można go w dość prosty sposób obliczyć bez użvcia urządzeń elektronicznych, a zarazem stanowi dość dobre przybliżenie ILORAZU WIARYGODNOŚCI.
• DOKŁADNY TEST FISHERA jest obliczany dla tabel o rozmiarze 2x2, w których liczba przypadków jest mniejsza niż 30, lub w którejkolwiek z komórek liczebność oczekiwana jest mniejsza od pięciu. W takich sytuacjach DOKŁADNY TEST FISHERA jest lepszym odpowiednikiem testu chi-kwadrat.
• TEST ZWIĄZKU LINIOWEGO - jeśli obie analizowane zmienne mierzone są na skali ilościowej, statystyka ta dostarcza odpowiedzi na pytanie o istotność liniowego związku między analizowanymi zmiennymi.
W nawiasie po symbolu testu chi-kwadrat oprócz liczebności grupy umieszczamy zwyczajowo także liczbę stopni swobody dla przeprowadzonego testu. Stopnie swobody dla statystyki chi-kwadrat dla dwóch zmiennych otrzymujemy przez pomnożenie liczby wierszy (czyli liczby kategorii pierwszej zmiennej) minus jeden i liczby kolumn (czyli liczby kategorii drugiej zmiennej) minus jeden (w tabeli krzyżowej).
Wzór służący do obliczania ilości stopni swobody (df) dla tabel krzyżowych.
df = (liczbo kategorii pierwszej zmiennej- 1)x (liczba kategorii drugiej zmiennej-1) (7.5}
W przypadku szarlotki i zdjęć jest to: df = (2-l)x(2-l) = l.
Wynik testu chi-kwadrat dostarcza informacji o istnieniu bądź nieistnieniu istotnego związku między analizowanymi zmiennymi. Aby uzyskać informacje o sile związku między zmiennymi, należy obliczyć dodatkowe statystyki:
• Współczynnik kontyngencji, który może być wyliczony dla zmiennych WspóUzfnntk w tabelach krzyżowych, wskazuje na siłę związku między analizowanymi kontyngmeji zmiennymi, przyjmując wartości od 0 — brak związku do 1 - silny związek.
■ Miary phi i V Cramera dostępne jako statystyki wykonywane w tabelach phi i V Cramera krzyżowych informują o sile związku między analizowanymi zmiennymi nominalnymi. Rosnące wartości tych statystyk informują o silnym związku między zmiennymi. Miara phi obliczana jest dla tabel o rozmiarze 2x2 (czyli o stopniach sw'obody = 1), miara V Cramera powinna być stosowana dla wszystkich tabel o rozmiarze większym niż 2x2.
• Iloraz szans. Statystyki ilorazu szans obliczamy jedynie dla tabel 2x2, Iloraz szans przez zaznaczenie opcji RYZYKO WZGLĘDNE w oknie STATYSTYKI
menu TABELE KRZYŻOWE. Statystyka ilorazu szans jest miarą siły związku między zmiennymi i dotyczy prawdopodobieństwa pojawienia się określonej kategorii w jednej zmiennej, pod warunkiem że wystąpiła określona kategoria w drugiej zmiennej. Siłę ilorazu szans odczytujemy w kolumnie „95% przedział ufności” - jeśli przedział ten zawiera w sobie wartość 1, nie ma związku między analizowanymi zmiennymi.
Jak opisać otrzymane wyniki
Wyznanie a dobroczynność
Aby sprawdzić, czv istnieje zależność między wyznaniem osoby badanej, a jej skłonnością do udzielenia pomocy, przeprowadzono badanie, w którym rejestrowano reakcje katolików i protestantów na kierowaną do nich przez eksperymentatora prośbę o drobną przysługę. Częstość udzielania pomocy przez osobę badaną w zależności od jej wyznania przedstawia tabela na rys. 7.16. Dane znajdują się w pliku Rozdział?_d.sav.
Tabela krzyżowa wyznanie ‘ prośba Liczebność_
prośba |
Ogółem | ||
zgodził sie |
me zgodził sie | ||
wystane protestant |
14 |
4 |
18 |
katolik |
6 |
12 |
18 |
Ogółem |
20 |
16 |
36 |
Rys. 7.16. Częstość spełniania prośby w zależności od wyznania osoby badanej.
W celu sprawdzenia istotności związku między analizowanymi zmiennymi przeprowadzono test niezależności dwóch zmiennych - chi-kwadrat. Istotny wynik testu pożerała na odrzucenie hipotezy zerowej i przyjęcie hipotezy alternatywną} o istotnym związku między analizowanymi zmiennymi^2 (I, N = 36) = 7,2; p < 0,01. Siła związku między analizowanymi zmiennymi mierzona statystyka phi wskaziye na istnienie
181