ZAJĘCIA NR 5
KORELACJA - gdy zmiany jednej i drugiej zmiennej
nie ma pomiaru nie ma współczynnika korelacji
WSPÓŁCZYNNIK KONTYNGENCJI:
porównywanie rozkładów frekwencji zmiennych
nie mówi się o kierunku związku tylko charakter
czy istnieje związek (jest albo go nie ma), a nie zależność
+ wyjaśnienie (opis) związku:
„Kobiety najczęściej wybierają ...
Kobiety najrzadziej wybierają ...
Mężczyźni najczęściej wybierają ...
Mężczyźni najrzadziej wybierają ...”
|
A |
B |
C |
D |
E |
Kobiety |
|
|
|
|
|
Mężczyźni |
|
|
|
|
|
ZADANIE 1.
Czy istnieje związek między płcią a paleniem tytoniu?
zmienna dychotomiczna (np. palący, niepalący) z natury jest zmienną ilościową
|
Kobiety |
Mężczyźni |
palący |
2 a |
4 b |
niepalący |
3 c |
1 d |
literka - oznaczenie komórki
|
o |
e |
o - e |
(o - e)2 |
(o - e)2 / e |
a |
2 |
3 |
-1 |
1 |
1/3 |
b |
3 |
3 |
1 |
1 |
1/3 |
c |
4 |
2 |
1 |
1 |
1/2 |
d |
1 |
2 |
-1 |
1 |
1/2 |
∑ |
1,67 |
WSPÓŁCZYNNIK KONTYNGENCJI (chi2):
miara związku (różnic) między zmiennymi
nie pozwala na bezpośrednie oszacowanie siły związku
NIE ocenia się na oko
zależy od liczby osób
podstawa do obliczania współczynników kontyngencji: φ Yule'a, V Cramera
o - WARTOŚCI OBSERWOWANE:
zbliżone - rozkład losowy
sprawdza się
czy są zbliżone oddalone - silniejszy związek między zmiennymi
e - WARTOŚCI OCZEKIWANE
|
Kobiety |
Mężczyźni |
|
palący |
2
|
4 b |
|
niepalący |
3 c |
1 d |
4 |
|
5 |
5 |
|
suma wierszy
suma kolumn suma sum
suma wierszy * suma kolumn (dla danej komórki)
e =
suma sum
ea = 6 * 5 / 10 = 3
ea = 6 * 5 / 10 = 3
ea = 4 * 5 / 10 = 2
ea = 4 * 5 / 10 = 2
WSPÓŁCZYNNIK KONTYNGENCJI φ (fi) YULE'A:
tylko dla tablic 4 - polowych
lepszy od χ2
wartości (0,1)
0 - brak związku
1 - SILNY związek między zmiennymi (nie dodatni)
N - liczba osób w tabeli
ZADANIE 2.
Czy istnieje związek między poziomem wykształcenia a preferencjami politycznymi?
|
A |
B |
C |
∑ |
podstawowe |
12 a |
10 b |
6 c |
28 |
średnie |
4 d |
6 e |
6 f |
16 |
wyższe |
4 g |
4 h |
8 i |
16 |
∑ |
20 |
20 |
20 |
60 |
takie same:
ea = eb = ec
ed = ee = ef
największa tabela 5 * 5 eg = eh = ei
liczebność < 5 - wątpliwa
|
o |
e |
o - e |
(o - e)2 |
(o - e)2 / e |
a |
12 |
9,33 |
2,67 |
7,13 |
0,76 |
b |
10 |
9,33 |
0,67 |
0,45 |
0,05 |
c |
6 |
9,33 |
-3,33 |
11,09 |
1,19 |
d |
4 |
5,33 |
-1,33 |
1,77 |
0,33 |
e |
6 |
5,33 |
0,67 |
0,45 |
0,08 |
f |
6 |
5,33 |
0,67 |
0,45 |
0,08 |
g |
4 |
5,33 |
-1,33 |
1,77 |
0,33 |
h |
4 |
5,33 |
-1,33 |
1,77 |
0,33 |
i |
8 |
5,33 |
|
7,13 |
1,34 |
różnica między wartościami ∑ |
4,50 |
χ2 = 4,5
ea = eb = ec = 20 * 28 / 60 = 9,33
ed = ee = ef = 20 * 16 / 60 = 5,33
eg = eh = ei = 20 * 16 / 60 = 5,33
WSPÓŁCZYNNIK KONTYNGENCJI V CRAMERA:
dla tablic większych niż 4 - polowe
wartości (0,1)
0 - brak związku
1 - SILNY związek między zmiennymi (nie dodatni)
czy istnieje związek
+ wyjaśnienie (opis) związku:
kto co wybierał
mniejsza z dwóch wartości:
W - 1 liczba wierszy - 1
K - 1 liczba kolumn - 1
W - 1 = 3 - 1 = 2 tablica kwadratowa nie ma mniejszej wartości,
K -1 = 3 - 1 = 2 obojętnie czy W - 1, czy K -1
V = √ 4,50 / 60 * 2 = √ 0,19 brak związku (bardzo słaby => tylko 4 %)
bo małe różnice między wartościami o i e
SPSS:
φ Yule'a nie liczy na podstawie χ2 może wyjść wartość ujemna
trzeba zmienić na „+”
podaje V Cramera + φ Yule'a (tablica 4 - polowa)
w zależności od wielkości tablicy niepotrzebne wyrzucić
więcej niż 5 kategorii
zdychotomizowanie zmiennej wielowartościowej
|
|
|||||
|
|
|||||
|
|
|
|
|
||
|
|
|
|
|
SPSS:
interpretacja TYLKO ISTOTNYCH STATYSTYCZNIE związków:
p < 0,05 omówienie kierunku i siły związku między zmiennymi:
porządkowymi
ilościowymi
omówienie charakteru związku (istnienie) między zmiennymi:
nominalnymi
zmienne:
(nie dychotomizować)
r Pearsona (-1,1)
rs Spearmana (-1,1)
|
|
|
|
tablica:
φ Yule'a
jeśli występuje
zmienna nominalna medianę przesuwa się tak, aby liczebności były
mniej więcej równe
więcej niż
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 kategorii
k > 5
V Cramera (0,1)
dychotomizacja
większe prawdopodobieństwo błędu
(mniejsza istotność)
współczynnik = 0,6 związek silny
KORELACJE:
r Pearsona
ANALIZA KORELACJE PARAMI ZMIENNE OK.
Korelacja r Pearsona: dodatnia ujemna
KP2 siła związku
rs Spearmana
Korelacje nieparametryczne - nie spełniają funkcji rozkładu normalnego
ANALIZA OPIS STATYSTYCZNY TABELE KRZYŻOWE
STATYSTYKI
NOMINALNE
Phi i V Cramera
DALEJ
KOMÓRKI
% W WIERSZU
DALEJ
POKAŻ ZGRUPOWANE WYKRESY SŁUPKOWE
Tabela 3.
MIARY SYMETRYCZNE:
Tablica:
4 - polowa Phi pominięcie „-”
większa V Kramera
opis związku: kto - ile?
Mediana = X połowa X i więcej Q - kwartyl Q = - ... - uwzględnienie połowa X i mniej „-”
ZMIENNE NOMINALNE:
ZMIENNA NOMINALNA
ZMIENNA ILOŚCIOWA
ZMIENNA PORZĄDKOWA
ILOŚCIOWE
ILOŚCIOWE
PORZĄDKOWE
PORZĄDKOWE
ILOŚCIOWE
NOMINALNE
NOMINALNE
PORZĄDKOWE
ILOŚCIOWE
ZMIENNE ILOŚCIOWE
ZMIENNE PORZĄDKOWE
ZMIENNE NOMINALNE