Zmienna A
Zmienna B
Zastosowany
Uwagi
współczynnik
Interwałowa
Interwałowa
R Pearsona
Porządkowa
Interwałowa
R Spearmana
lub Porządkowa
Nominalna
Nominalna
Fi (dla tablic 4-
Przy zmiennych
lub Interwałowa
polowych)
interwałowych i
lub Porządkowa
V Cramera (dla
porządkowych o
pozostałych tablic)
liczbie kategorii
większej od 5
stosujemy
dychotomizację
zmiennych.
Korelacja to związek między zmiennymi - sytuacja, w której zmianom
wartości jednej zmiennej towarzyszy zmiana wartości drugiej – skorelowanej z
nią zmiennej.
Miarą siły i kierunku oraz kształtu związku jest współczynnik korelacji (dla
zmiennych porządkowych i ilościowych) lub współczynnik kontyngencji
(dla zmiennych nominalnych).
Do pomiaru siły związku między zmiennymi interwałowymi służyć może
współczynnik korelacji r Pearsona. Przyjmuje on wartości do -1 (dla bardzo
silnych związków ujemnych) do + 1 (dla bardzo silnych związków dodatnich
(Uwaga stosuje się go wyłącznie do interpretacji związków liniowych)
Uruchom program SPSS i wczytaj plik GSS93 pozdzbiór.sav
Sporządzimy macierz korelacji, w której zbadamy, czy istnieje związek między
następującymi czterema zmiennymi ilościowymi:
Wiek respondenta, Wiek zawarcia małżeństwa, Liczba dzieci, Liczba braci i
sióstr.
Wybieramy: Analiza-Korelacje –Parami. Do okienka ZMIENNE przy pomocy
strzałki między oknami przerzucamy wymienione wyżej cztery zmienne.
Następnie sprawdzamy, czy oznaczony jest właściwy współczynnik korelacji
(Pearson) i klikamy OK.
W raporcie SPSS otrzymujemy macierz:
1
Wiek
małżeństwa
Liczba braci i
respondenta
(pierwszego)
Liczba dzieci
sióstr
Wiek respondenta
Korelacja Pearsona
1
,083(**)
,404(**)
,143(**)
Istotność (dwustronna)
,004
,000
,000
N
1495
1199
1491
1490
Wiek zawarcia małżeństwa
Korelacja Pearsona
,083(**)
1
-,259(**)
-,006
(pierwszego)
Istotność (dwustronna)
,004
,000
,831
N
1199
1202
1199
1199
Liczba dzieci
Korelacja Pearsona
,404(**)
-,259(**)
1
,202(**)
Istotność (dwustronna)
,000
,000
,000
N
1491
1199
1495
1491
Liczba braci i sióstr
Korelacja Pearsona
,143(**)
-,006
,202(**)
1
Istotność (dwustronna)
,000
,831
,000
N
1490
1199
1491
1495
** Korelacja jest istotna na poziomie 0.01 (dwustronnie).
Na „skrzyżowaniu” każdej zmiennej z inną zmienną znajdują się trzy wartości:
- wartość współczynnika korelacji
- istotność
- N – liczba respondentów.
Istotność to prawdopodobieństwo popełnienia błędu; w naukach społecznych
standardowo przyjmuję granicę istotności równą 0,05 (5%).
Gdy istotność dla współczynnika korelacji jest większa od 0,05 – stwierdzamy, iż pomiędzy zmiennymi nie ma związku – nie interpretujemy nieistniejącego
związku ! Gdy wartość istotności jest mniejsza/równa od 0,05 – mówimy o istnieniu związku i opisujemy jego siłę i kierunek
W powyższym przykładzie nie ma związku między liczbą braci i sióstr a wiekiem zawarcia małżeństwa (istotność = 0.831).
Pozostałe związki są istotne. Najsilniejszy związek zachodzi między wiekiem respondenta a liczbą posiadanych dzieci .( r = 0,404) Jest to związek dodatni o umiarkowanej sile. Pozostałe związki jest raczej słabe (wartość
współczynników poniżej 0,3)
Kwadrat współczynnika korelacji nazywany jest WSPÓŁCZYNNIKIEM
DETERMINACJI – pokazuje on w jakim stopniu zmienność jednej zmiennej
wyjaśniana jest przez drugą zmienną.
W naszym przykładzie r2 dla związku między wiekiem a liczbą dzieci wynosi
r2= (0,404)2=0,163 lub 16,3 % Oznacza to, że liczba posiadanych dzieci jest w ok. 16% wyjaśniana wiekiem respondenta.
W podobny sposób wykonuje się i interpretuje współczynnik dla danych
porządkowych: rs Spearmana.
Sporządzimy teraz macierz dla następujących zmiennych:
Poziom wykształcenia respondenta, Poziom wykształcenia ojca i Poziom
wykształcenia matki.
2
Wybieramy: Analiza-Korelacje –Parami. Do okienka ZMIENNE przy pomocy strzałki między oknami przerzucamy wymienione wyżej trzy zmienne.
Następnie sprawdzamy, czy oznaczony jest właściwy współczynnik korelacji
(Spearman) i klikamy OK. W raporcie SPSS otrzymujemy macierz:
Poziom
Poziom
Poziom
wykształcenia
wykształcenia
wykształcenia
respondenta
ojca
matki
rho Spearmana
Poziom wykształcenia
Współczynnik
1,000
,390(**)
,395(**)
respondenta
korelacji
Istotność
.
,000
,000
(dwustronna)
N
1496
1205
1350
Poziom wykształcenia
Współczynnik
,390(**)
1,000
,601(**)
ojca
korelacji
Istotność
,000
.
,000
(dwustronna)
N
1205
1207
1127
Poziom wykształcenia
Współczynnik
,395(**)
,601(**)
1,000
matki
korelacji
Istotność
,000
,000
.
(dwustronna)
N
1350
1127
1352
** Korelacja jest istotna na poziomie 0.01 (dwustronnie).
Wszystkie związki w macierzy są istotne statystycznie (istotność jest
mniejsza od 0,001). Najsilniejszy związek dodatni występuje między
poziomem wykształcenia ojca i matki (0,601) Dwa pozostałe związki mają
umiarkowaną siłę (0,390 i 0,395). Współczynniki determinacji dla powyższych
związków wynoszą odpowiednio: 36%, 15%, 16%.
Współczynniki kontyngencji dla danych nominalnych obliczane są przy
pomocy tabel krzyżowych. Sprawdzimy teraz czy istnieje związek między płcią
a stosunkiem do legalizacji marihuany. Wybieramy: Analiza – Opis statystyczny
– Tabele krzyżowe. Do wierszy wprowadzamy zmienną grupującą (w tym
przypadku płeć respondenta) a do kolumn zmienną Czy marihuana powinna
być zalegalizowana. Następnie wybieramy przycisk Statystyki i zaznaczamy poznane wcześniej współczynniki kontyngencji (Phi i V Cramera), w kolejnym
kroku wybieramy opcje komórki i zaznaczamy opcję procenty w wierszu. Na końcu zaznaczamy umieszczoną pod listą zmiennych opcję Pokaż zgrupowane
wykresy słupkowe i klikamy OK.
Program prezentuje trzy tabele, pierwsza zawiera informację o liczbie
pomiarów, druga to właściwa tabela krzyżowa, a w trzeciej znajduje się
właściwy wynik – wartość współczynnika kontyngencji i istotność dla niego.
Należy zwrócić uwagę, iż program podaje zawsze wartości dwóch
współczynników Fi (φ) Yula i V Cramera. Ten pierwszy stosujemy wyłącznie
do tablic czteropolowych, a V Cramera do tablic z większą liczbą pól. Badacz musi zawsze wybrać i cytować tylko jeden - właściwy współczynnik
kontyngencji.
3
powinna być
zalegalizowana
Tak
Nie
Ogółem
Płeć respondenta
Mężczyzn
Liczebność
107
274
381
a
% z Płeć respondenta
28,1%
71,9%
100,0%
Kobieta
Liczebność
104
445
549
% z Płeć respondenta
18,9%
81,1%
100,0%
Ogółem
Liczebność
211
719
930
% z Płeć respondenta
22,7%
77,3%
100,0%
Miary symetryczne
Istotność
Wartość
przybliżona
Nominalna przez
Phi
,107
,001
Nominalna
V Kramera
,107
,001
N Ważnych obserwacji
930
W analizowanym przykładzie interpretujemy współczynnik Fi (φ) Yula (tabela
czteropolowa). Widzimy, iż mamy do czynienia z istotnym (p=0,001) bardzo
słabym związkiem (φ=0,107). W przypadku danych nominalnych należy
zawsze słownie opisać charakter związku, w tym przypadku związek polega na
tym, że mężczyźni częściej (28,1%) są zwolennikami legalizacji marihuany niż
kobiety (18,9%).
W sytuacji, gdy chcemy skorelować zmienną nominalną ze zmienną ilościową
lub porządkową, przyjmującą więcej niż 5 kategorii należy tę ostatnią zmienną
zdychotomizować.
Dychotomizację
przeprowadzamy
według
wartości
mediany. Sprawdzimy, czy istnieje związek między płcią respondenta a
liczbą lat nauki szkolnej. Zmienną „lat nauki szkolnej” należy
zdychotomizować według mediany, która dla tej zmiennej wynosi 12.(wartość
mediany sprawdzamy przy pomocy narzędzi używanych do opisu
statystycznego). Dychotomizację wykonujemy przy pomocy polecenia:
Przekształcenia – Rekoduj - Na inne zmienne. Zmienną żródłową jest lat nauki szkolnej (educ), zmienną wynikową nazwiemy educ2 . Po zaznaczeniu przycisku „zmień” uruchamiamy opcje „ Wartości źródłowe i wynikowe”
Wartości źródłowej „ Zakres wartości od najmniejszej do 12(mediana)”
przypisujemy wartość wynikową 1, a wartości źródłowej „Wszystkie pozostałe
wartości” przypisujemy wartość wynikową 2.
Następnie klikamy Dalej i OK., jeżeli polecenia wykonaliśmy prawidłowo, to na liście zmiennych powinna pojawić się nowa zmienna: educ2. Należy
zdefiniować wartości etykiet nowej zmiennej (1 – do 12 lat, 2 – powyżej 12
lat). Tak przygotowaną zmienną educ2 możemy użyć w tabeli krzyżowej by
sprawdzić czy istnieje związek między płcią a liczbą lat nauki szkolnej.
Współczynnik kontyngencji obliczamy jak w poprzednim przykładzie.
4