Diagram rozproszenia: zależność korelacyjna między poczuciem bliskości a idealizacją Pojęcie korelacji Pierwszy rysunek (ilustrujący korelację dodatnią) przedstawia graficznie wyniki dwóch zmiennych pewnego badania. Widać na nim pewien ogólny wzorzec - choć oczywiście z wieloma wyjątkami. Wzorzec ten można by opisać następująco: im wyższy poziom jednej zmiennej, tym większy drugiej. Taki wzorzec, gdy wysokie wartości jednej zmiennej towarzyszą wysokim wartościom drugiej, średnie - średnim, a niskie - niskim, jest przykładem korelacji. Korelacja jest to więc statystyka określająca siłę związku między zmiennymi. Korelacje " Pokazuje związek pomiędzy dwoma zmiennymi " Nie można wnioskować o zależności przyczynowej " Współczynnik korelacji z próby r pokazuje siłę związku pomiędzy zmiennymi. " Współczynnik korelacji przyjmuje wartości z przedziału -1 do +1 Wartość ujemna wskazuje na negatywny związek między zmiennymi (X maleje a Y wzrasta) Wartość dodatnia pokazuje na związek pozytywny pomiędzy zmiennymi (X rośnie i Y rośnie, X maleje i Y maleje) Wykres rozrzutu " Zazwyczaj używa się tego rodzaju wykresu do pokazania współzależności pomiędzy dwoma zmiennymi " Dwa wymiary pokazujące rozkład wyników dla dwóch zmiennych " Każdy wymiar pokazuje wartości liczbowe danej zmiennej " uwaga: najlepiej przedstawiać na tym typie wykresu dane na mierzone, co najmniej, na skali przedziałowej liczba nadzorowanych poziom stresu wg pracowników kwestionariusza 6 7 8 8 3 1 10 8 8 6 Wykres rozrzutu (na wykładzie będzie wiele innych przykładów wykresów rozrzutu) 10 8 6 4 2 0 2 4 6 8 10 12 Ilosc pracowników STRESS r Pearsona Współczynnik korelacji r Pearsona Średni moment iloczynowy wartości z służy zatem jako miara stopnia korelacji liniowej i jest nazywany współczynnikiem korelacji r- Pearsona, na cześć Karla Pearsona, który wraz z Francisem Galtonem odegrał główną rolę w rozwoju tej statystyki. Wzór na współczynnik korelacji: r = Ł ZX ZY / N r - współczynnik korelacji ZX - wartość z dla każdego przypadku dla zmiennej x ZY - wartość z dla każdego przypadku dla zmiennej y N - liczba przypadków Uwaga! Przy standaryzacji wyników, obliczamy SD, dzieląc przez N, nie przez (N-1) Liczba nadzorowanych Poziom stresu (Y) Moment pracowników (X) iloczynowy X X - (X - ZX Y Y - (Y - ZY ZX ZY M M)2 M M)2 6 -1 1 -.42 7 1 1 .38 -.16 8 1 1 .42 8 2 4 .77 .32 3 -4 16 -1.69 1 -5 25 -1.92 3.24 10 3 9 1.27 8 2 4 .77 .98 8 1 1 .42 6 0 0 0 0 Ł = 35 SS = 28 Ł = 30 SS = 34 Ł ZX ZY = 4.38 M = 7 SD2 = 5.60 M = 6 SD2 = 6.80 r = .88 28/5 34/5 SD = 2.37 SD = 2.61 Kolejne kroki obliczania współczynnika korelacji r Pearsona " 1. Przekształć wszystkie wyniki w wartości z. Wymaga to obliczenia średniej i odchylenia standardowego (SD) każdej zmiennej (dla SD, sumę kwadratów odchyleń dzielimy przez N, a nie przez N-1 jak to robi rutynowo SPSS), a następnie obliczenia wartości z dla każdego wyniku. " 2. Policz moment iloczynowy (cross product) dla każdego przypadku, czyli pomnóż przez siebie wartość z wyniku na jednej zmiennej i wartość z wyniku na drugiej zmiennej. " 3. Zsumuj momenty iloczynowe. " 4. Podziel tę sumę przez liczbę przypadków. Pamiętaj, aby użyć liczby przypadków, a nie liczby wyników. Problem zakresu zmiennych: zależność między wiekiem szkolnym a znajomością geografii Problem zakresu zmiennych: zależność między wynikami testu a sukcesem zawodowym u osób testowanych i u osób zatrudnionych Problem zależności krzywo-linioweych: Fakt, że współczynnik korelacji r Pearsona jest nieistotny, może wynikać z zależności nieliniowych Korelacje dla różnych skal pomiarowych: sens korelacji dla skal rangowych i nominalnych " r Pearsona skala interwałowa lub stosunkowa " rho Spearmana lub tau Kendalla skala rangowa " phi skala nominalna Korelacja jest to statystyka określająca siłę związku między zmiennymi: również wtedy gdy są to zmienne rangowe lub nominalne Niezależnie od skali, przy braku korelacji współczynniki korelacji są bliskie zeru, zaś korelacje dodatnie lub ujemne mieszczą się w przedziale (-1, 1). Wielołapkowce skala interwałowa Korelacje ILENOZEK PROP SZER WYS ILENOZEK Korelacja Pearsona 1,000 -,066 ,448* ,015 Istotność (dwustronna) , ,758 ,028 ,943 N 24 24 24 24 PROP Korelacja Pearsona -,066 1,000 ,073 -,612** Istotność (dwustronna) ,758 , ,734 ,001 N 24 24 24 24 SZER Korelacja Pearsona ,448* ,073 1,000 ,541** Istotność (dwustronna) ,028 ,734 , ,006 N 24 24 24 24 WYS Korelacja Pearsona ,015 -,612** ,541** 1,000 Istotność (dwustronna) ,943 ,001 ,006 , N 24 24 24 24 *. Korelacja jest istotna na poziomie 0.05 (dwustronnie). **. Korelacja jest istotna na poziomie 0.01 (dwustronnie). Wielołapkowce skala rangowa Korelacje ILENOZEK PROP SZER WYS rho Spearmana ILENOZEK Współczynnik korelacji 1,000 ,246 ,530** -,001 Istotność (dwustronna) , ,247 ,008 ,995 N 24 24 24 24 PROP Współczynnik korelacji ,246 1,000 ,455* -,767** Istotność (dwustronna) ,247 , ,025 ,000 N 24 24 24 24 SZER Współczynnik korelacji ,530** ,455* 1,000 ,190 Istotność (dwustronna) ,008 ,025 , ,374 N 24 24 24 24 WYS Współczynnik korelacji -,001 -,767** ,190 1,000 Istotność (dwustronna) ,995 ,000 ,374 , N 24 24 24 24 **. Korelacja jest istotna na poziomie 0.01 (dwustronnie). *. Korelacja jest istotna na poziomie 0.05 (dwustronnie). Wielołapkowce skala nominalna Tabela krzyżowa MILENOZE * MSZER Liczebność MSZER 1 2 Ogółem MILENOZE 1 10 3 13 2 3 8 11 Ogółem 13 11 24 Miary symetryczne Istotność Wartość przybliżona Nominalna przez Phi ,497 ,015 Nominalna V Kramera ,497 ,015 N Ważnych obserwacji 24 a. Nie zakładając hipotezy zerowej. b. Użyto asymptotyczny błąd standardowy, przy założeniu hipotezy zerowej.