ZAJĘCIA NR 5
KORELACJA - gdy zmiany jednej i drugiej zmiennej
nie ma pomiaru nie ma współczynnika korelacji
WSPÓŁCZYNNIK KONTYNGENCJI:
porównywanie rozkładów frekwencji zmiennych
nie mówi się o kierunku związku tylko charakter
czy istnieje związek (jest albo go nie ma), a nie zależność
+ wyjaśnienie (opis) związku:
„Kobiety najczęściej wybierają ...
Kobiety najrzadziej wybierają ...
Mężczyźni najczęściej wybierają ...
Mężczyźni najrzadziej wybierają ...”
| 
 | A | B | C | D | E | 
| Kobiety | 
 | 
 | 
 | 
 | 
 | 
| Mężczyźni | 
 | 
 | 
 | 
 | 
 | 
ZADANIE 1.
Czy istnieje związek między płcią a paleniem tytoniu?
zmienna dychotomiczna (np. palący, niepalący) z natury jest zmienną ilościową
| 
 | Kobiety | Mężczyźni | 
| palący | 2 a | 4 b | 
| niepalący | 3 c | 1 d | 
        literka - oznaczenie komórki
| 
 | o | e | o - e | (o - e)2 | (o - e)2 / e | 
| a | 2 | 3 | -1 | 1 | 1/3 | 
| b | 3 | 3 | 1 | 1 | 1/3 | 
| c | 4 | 2 | 1 | 1 | 1/2 | 
| d | 1 | 2 | -1 | 1 | 1/2 | 
| ∑ | 1,67 | ||||

WSPÓŁCZYNNIK KONTYNGENCJI (chi2):
miara związku (różnic) między zmiennymi
nie pozwala na bezpośrednie oszacowanie siły związku
NIE ocenia się na oko
zależy od liczby osób
podstawa do obliczania współczynników kontyngencji: φ Yule'a, V Cramera
o - WARTOŚCI OBSERWOWANE:
zbliżone - rozkład losowy
sprawdza się
czy są zbliżone oddalone - silniejszy związek między zmiennymi
e - WARTOŚCI OCZEKIWANE


| 
 | Kobiety | Mężczyźni | 
 | 
| palący | 2 
 | 4 b | 
 
 | 
| niepalący | 3 c | 1 d | 4 | 
| 
 | 
 5 | 5 | 
 
 | 
suma wierszy
suma kolumn suma sum
suma wierszy * suma kolumn (dla danej komórki)
e = 	
suma sum
ea = 6 * 5 / 10 = 3
ea = 6 * 5 / 10 = 3
ea = 4 * 5 / 10 = 2
ea = 4 * 5 / 10 = 2
WSPÓŁCZYNNIK KONTYNGENCJI φ (fi) YULE'A:
tylko dla tablic 4 - polowych
lepszy od χ2
wartości (0,1)
0 - brak związku
1 - SILNY związek między zmiennymi (nie dodatni)

N - liczba osób w tabeli
ZADANIE 2.
Czy istnieje związek między poziomem wykształcenia a preferencjami politycznymi?
| 
 | A | B | C | ∑ | 
| podstawowe | 12 a | 10 b | 6 c | 28 | 
| średnie | 4 d | 6 e | 6 f | 16 | 
| wyższe | 4 g | 4 h | 8 i | 16 | 
| ∑ | 20 | 20 | 20 | 60 | 
takie same:
ea = eb = ec
ed = ee = ef
największa tabela 5 * 5 eg = eh = ei
liczebność < 5 - wątpliwa
| 
 | o | e | o - e | (o - e)2 | (o - e)2 / e | 
| a | 12 | 9,33 | 2,67 | 7,13 | 0,76 | 
| b | 10 | 9,33 | 0,67 | 0,45 | 0,05 | 
| c | 6 | 9,33 | -3,33 | 11,09 | 1,19 | 
| d | 4 | 5,33 | -1,33 | 1,77 | 0,33 | 
| e | 6 | 5,33 | 0,67 | 0,45 | 0,08 | 
| f | 6 | 5,33 | 0,67 | 0,45 | 0,08 | 
| g | 4 | 5,33 | -1,33 | 1,77 | 0,33 | 
| h | 4 | 5,33 | -1,33 | 1,77 | 0,33 | 
| i | 8 | 5,33 | 
 | 7,13 | 1,34 | 
| różnica między wartościami ∑ | 4,50 | ||||
χ2 = 4,5
ea = eb = ec = 20 * 28 / 60 = 9,33
ed = ee = ef = 20 * 16 / 60 = 5,33
eg = eh = ei = 20 * 16 / 60 = 5,33
WSPÓŁCZYNNIK KONTYNGENCJI V CRAMERA:
dla tablic większych niż 4 - polowe
wartości (0,1)
0 - brak związku
1 - SILNY związek między zmiennymi (nie dodatni)
czy istnieje związek
+ wyjaśnienie (opis) związku:
kto co wybierał

mniejsza z dwóch wartości:
W - 1 liczba wierszy - 1
K - 1 liczba kolumn - 1
W - 1 = 3 - 1 = 2 tablica kwadratowa nie ma mniejszej wartości,
K -1 = 3 - 1 = 2 obojętnie czy W - 1, czy K -1
V = √ 4,50 / 60 * 2 = √ 0,19 		 brak związku (bardzo słaby => tylko 4 %)
bo małe różnice między wartościami o i e
SPSS:
φ Yule'a nie liczy na podstawie χ2 może wyjść wartość ujemna
trzeba zmienić na „+”
podaje V Cramera + φ Yule'a (tablica 4 - polowa)
w zależności od wielkości tablicy niepotrzebne wyrzucić
więcej niż 5 kategorii
zdychotomizowanie zmiennej wielowartościowej
| 
 | 
 | |||||
| 
 | 
 | |||||
| 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | ||
SPSS:
interpretacja TYLKO ISTOTNYCH STATYSTYCZNIE związków:
p < 0,05 omówienie kierunku i siły związku między zmiennymi:
porządkowymi
ilościowymi
omówienie charakteru związku (istnienie) między zmiennymi:
nominalnymi
zmienne:
(nie dychotomizować)
r Pearsona (-1,1)
rs Spearmana (-1,1)
| 
 | 
 | 
| 
 | 
 | 
				                                            tablica:			
								φ Yule'a
jeśli występuje							
zmienna nominalna			         medianę przesuwa się tak, aby liczebności były
						                                        mniej więcej równe
więcej niż 
| 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
5 kategorii
k > 5
V Cramera (0,1)
		dychotomizacja
większe prawdopodobieństwo błędu
(mniejsza istotność)
współczynnik = 0,6 związek silny
KORELACJE:
r Pearsona
ANALIZA		    KORELACJE 		 PARAMI  		  ZMIENNE 		     OK. 
Korelacja r Pearsona: dodatnia ujemna
	KP2		      siła związku 
rs Spearmana
Korelacje nieparametryczne - nie spełniają funkcji rozkładu normalnego
ANALIZA 		      OPIS STATYSTYCZNY		 TABELE KRZYŻOWE
									      STATYSTYKI
									      NOMINALNE
									    Phi i V Cramera
										  DALEJ
							                                 KOMÓRKI
    % W WIERSZU
             DALEJ
POKAŻ ZGRUPOWANE WYKRESY SŁUPKOWE
Tabela 3.
MIARY SYMETRYCZNE:
Tablica:
4 - polowa			     Phi  		    pominięcie „-”
większa 			     V Kramera
opis związku: kto - ile?
Mediana = X połowa X i więcej Q - kwartyl Q = - ... - uwzględnienie połowa X i mniej „-”
ZMIENNE NOMINALNE:
ZMIENNA NOMINALNA
ZMIENNA ILOŚCIOWA
ZMIENNA PORZĄDKOWA
ILOŚCIOWE
ILOŚCIOWE
PORZĄDKOWE
PORZĄDKOWE
ILOŚCIOWE
NOMINALNE
NOMINALNE
PORZĄDKOWE
ILOŚCIOWE
ZMIENNE ILOŚCIOWE
ZMIENNE PORZĄDKOWE
ZMIENNE NOMINALNE