Korelacja rang:
sposób szacowania współczynnika korelacji jest zależny od typu obserwowanych cech, ilości zgromadzonych danych oraz przyjętej dokładności badania. Korelacja rang jest stosowana w przypadku mało licznych populacji (N<50).
rs < 5% - brak
rs < 25% - słaba
rs < 50% - średnia
rs < 75% - duża
rs ≥ 75% - bardzo duża
robimy tabelę (5 kolumn): w 1 kolumnie wpisujemy X (w kolejności rosnącej), w drugiej Y, w trzeciej Rx numerujemy X (od 1 do N), w 4 numerujemy Y (od 1 do N), w 5 obliczamy wg wzoru: d² = (Rx - Ry)² i sumujemy tą kolumnę.
X Y Rx Ry d²
490 35 1 9
520 26 2 3,5
600 27 3,5 5
600 26 3,5 3,5
640 30 5 7,5
750 28 6 6
780 25 7 2
800 30 8 7,5
840 22 9 1
1020 41 10 10
Współczynnik Spearman'a:
rs = 1 - 6 * suma 5 kolumny (Rx - Ry)² / N * (N² - 1) - wynik w %
Odp: na podstawie współczynnika korelacji Spearman'a wnioskujemy, że pomiędzy …….., a ………. istnieje / nie istnieje korelacja.
Korelacja cech jakościowych:
W populacji obserwujemy równoczesną zmienność 2 cech jakościowych X i Y.
rysujemy tabelkę:
Obliczamy:
nˆ11 = w1 * k1 / N np. 44
nˆ12 = w1 * k2 / N np. 66
nˆ21 = w2 * k1 / N np. 156
nˆ22 = w2 * k2 / N np. 234
a później obliczamy:
(takie inne X) X² = 30² / 44 + 80² / 66 + 170² / 156 + 220² / 234 - 500
Następnie korzystamy z wzorów:
Cxy - współczynnik kontyngencji - wynik w %
Txy - współczynnik Czuprowa - wynik w %
w - liczba wierszy, k - liczba kolumn
odp: na podstawie współczynnika kontyngencji oraz współczynnika Czuprowa wnioskujemy, że pomiędzy …….., a ……… istnieje / nie istnieje ……… korelacja.
Jeżeli wyznaczone współczynniki klasyfikują badany związek do różnych klas, to w opisie kierujemy się współczynnikiem kontyngencji.
Korelacja cech ilościowych:
Rysujemy tabelę składającą się z 5 kolumn: 1 xi, 2 yi, 3 xi², 4 yi², 5 xi * yi
Póżniej obliczamy średnią: x = 1/N * Σxi
Póżniej odchylenie: δx = √ 1/N * Σxi² - (x)²
Średnia y = 1/N * Σyi
Odchylenie: δy = √ 1/N * Σyi
Obliczmy wskaźnik Pearson'a:
rxy = 1/N * Σ xi * yi - x * y / δx * δy
odp: pomiędzy ……….., a ………….. istnieje / nie istnieje ……% zależność korelacyjna o kierunku……
rxy = 1 korelacja dodatnia
0 < rxy < 1 korelacja dodatnia niedoskonała
rxy = 0 brak korelacji liniowej
-1 < rxy < 0 korelacja ujemna niedoskonała
rxy = -1 korelacja ujemna, związek funkcyjny
regresja liniowa:
jeżeli badając korelację 2 cech ilościowych otrzymamy, że współczynnik Pearson'a jest większy niż 50% to mamy prawo spróbować wyznaczyć wzór funkcji opisujący tę zależność.
potrzebne są dane z cech ilościowych: x i y (średnie), δx, δy, rxy, Σx².
Obliczamy: yˆ = ay + by * x
by = rxy * δy / δx
ay = y - by * x
odp: jeżeli wiek kobiety wzrośnie o 1 rok, to wiek mężczyzny wzrosnie o 1,05 roku.
etap 1.
Obliczamy odchylenie standardowe Su
Odp: rzeczywisty wiek mężczyzny może się różnić od wieku oszacowanego przez funkcje regresji o +/- 2,9 lat.
Etap 2.
Obliczamy Vu Vu musi spełniać warunek Vu < 15%
Odp: wiek mężczyzny zależy w 10 % od czynników losowych. Zatem funkcja jest dopuszczalna.
Etap 3.
Obliczamy R²[%]
Odp: wiek mężczyzny jest w 69 % opisywany przez funkcje regresji
Etap 4.
Obliczamy φ² musi spełniać warunek φ² < 20%
Odp: wiek mężczyzny nie jest opisywany w 31 % przez funkcję regresji. Zatem funkcja nie jest dopuszczalna i przechodzimy do etapu 5 w celu znależenia błędu.
Etap 5.
Obliczamy D(by), D(ay), póżniej podstawiamy pod wzór :
by / D(by) > 2
ay / D(ay) > 2 - wyraz wolny
indeksy indywidualne.
Stosujemy je gdy analizowane zjawisko stanowi jednolitą całość , czyli badanie było prowadzone w równych odstępach czasowych.
a) indeksy jednopodstawowe - podają o ile % zmieniło się badane zjawisko w stosunku do ustalonego okresu bazowego oraz jaki jest trend rozwojowy badanego zjawiska (rosnący, malejący, nieokreślony)
b) indeksy łańcuchowe - informują jaka była zmiana badanego zjawiska w stosunku do okresu poprzedniego oraz jakie jest tempo zachodzących zmian (rosnące, malejące, nieokreślone)
Korelacje rang - ściąga
1