MIARY KORELACJI CECH STATYSTYCZNYCH
MIARY KORELACJI |
RODZAJE CECH |
CHARAKTER ZWIĄZKU |
SPOSÓB PREZENTACJI DANYCH |
WARTOŚĆ WSPÓŁCZYNNIKA |
WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA |
ILOŚCIOWE |
LINIOWY |
SZEREGI TABLICE |
|
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA |
ILOŚCIOWE LUB JAKOŚCIOWE WYRAŻONE W SKALI PORZĄDKOWEJ |
LINIOWY |
SZEREGI |
|
WSPÓŁCZYNNIKI KONTYNGENCJI |
JAKOŚCIOWE LUB ILOŚCIOWA I JAKOŚCIOWA |
NIE MA ZNACZENIA |
TABLICE |
|
WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA - miara współzależności dwóch cech ilościowych. Wartość bezwzględna współczynnika informuje o sile związku, a znak o jego kierunku.
(1.1)
gdzie:
xi - zaobserwowane wartości cechy X
yi - zaobserwowane wartości cechy Y
i=1,2,...,n - kolejne pary obserwacji
- średnie arytmetyczne cech X i Y
- odchylenia standardowe cech X i Y
(1.2)
(1.3)
dla tablicy korelacyjnej
(1.4)
r = -1 oznacza, że między badanymi cechami istnieje związek funkcyjny liniowy ujemny;
- 1 < r < 0 oznacza, że między cechami istnieje związek korelacyjny ujemny;
r = 0 oznacza, że cechy są nieskorelowane (brak związku liniowego);
0 < r < 1 oznacza, że między cechami istnieje związek korelacyjny dodatni;
r = 1 oznacza, że między badanymi cechami istnieje związek funkcyjny liniowy dodatni;
r≤ 0,3 - korelacja jest niewyraźna, słaba;
Jeżeli 0,3 ≤ r ≤ 0.5 - korelacja jest średnia, umiarkowana.
Jeżeli r > 0,5 - korelacja jest wyraźna, silna.
r2 - współczynnik determinacji; informuje jaka część zmienności jednej zmiennej jest wyjaśniona kształtowaniem się drugiej zmiennej.
φ2 = 1 - r2 - współczynnik indeterminacji; informuje jaka część zmienności jednej zmiennej nie jest wyjaśniona kształtowaniem się drugiej zmiennej, a więc może być spowodowana innymi czynnikami.
ZADANIE 1
ANALIZA WSPÓŁZALEŻNOŚCI MIĘDZY FUNDUSZAMI WŁASNYMI A ZYSKIEM NATTO W 10 WYBRANYCH BANKACH.
bank |
|
|
|
|
|
|
|
a |
4,50 |
0,72 |
-115,73 |
13393,43 |
-28,02 |
785,18 |
3242,87 |
b |
7,30 |
0,26 |
-112,93 |
12753,18 |
-28,48 |
811,17 |
3216,36 |
c |
10,10 |
0,09 |
-110,13 |
12128,62 |
-28,65 |
820,88 |
3155,33 |
d |
26,60 |
6,32 |
-93,63 |
8766,58 |
-22,42 |
502,70 |
2099,28 |
e |
34,20 |
0,83 |
-86,03 |
7401,16 |
-27,91 |
779,02 |
2401,18 |
f |
37,20 |
0,45 |
-83,03 |
6893,98 |
-28,29 |
800,38 |
2349,00 |
g |
83,80 |
18,47 |
-36,43 |
1327,14 |
-10,27 |
105,49 |
374,17 |
h |
178,90 |
24,39 |
58,67 |
3442,17 |
-4,35 |
18,93 |
-255,27 |
i |
302,10 |
50,26 |
181,87 |
33076,70 |
21,52 |
463,07 |
3913,66 |
j |
517,60 |
185,62 |
397,37 |
157902,92 |
156,88 |
24611,02 |
62339,01 |
razem |
1202,3 |
287,41 |
0,0 |
257085,88 |
0,01 |
29697,84 |
82835,59 |
obliczamy średnie arytmetyczne oraz odchylenia standardowe obu cech:
obliczamy współczynnik korelacji wg wzoru (1.1)
obliczamy współczynnik korelacji wg wzoru (1.2)
obliczamy współczynnik korelacji wg wzoru (1.3)
bank |
|
|
|
|
|
a |
4,5 |
0,72 |
3,24 |
20,25 |
0,5184 |
b |
7,3 |
0,26 |
1,898 |
53,29 |
0,0676 |
c |
10,1 |
0,09 |
0,909 |
102,01 |
0,0081 |
d |
26,6 |
6,32 |
168,112 |
707,56 |
39,9424 |
e |
34,2 |
0,83 |
28,386 |
1169,64 |
0,6889 |
f |
37,2 |
0,45 |
16,74 |
1383,84 |
0,2025 |
g |
83,8 |
18,47 |
1547,786 |
7022,44 |
341,1409 |
h |
178,9 |
24,39 |
4363,371 |
32005,21 |
594,8721 |
i |
302,1 |
50,26 |
15183,55 |
91264,41 |
2526,068 |
j |
517,6 |
185,62 |
96076,91 |
267909,8 |
34454,78 |
razem |
1202,3 |
287,41 |
117390,9 |
401638,4 |
37958,29 |
r = 0,9480 oznacza, iż między funduszami własnymi a zyskiem netto wybranych banków istnieje silna dodatnia korelacja, co oznacza że wraz ze wzrostem zysku netto wzrastają fundusze własne banków.
r2 = 0,9021 oznacza, iż 90% zmienności funduszy własnych banków jest wywołana oddziaływaniem zysku netto.
φ2 = 1 - r2 = 1 - 0,9021 = 0,0979 oznacza, iż w 10% zmienność jest wywołana oddziaływaniem innych czynników.
WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA jest to miara korelacji oparta na rangach (tj. kolejnych liczbach od 1 do n, przyporządkowanych obserwacjom według ustalonego kryterium), oceniająca korelację rozumianą jako zgodność uporządkowań dwóch cech ilościowych lub cech jakościowych, wyrażonych w skali porządkowej.
rs < - 1, +1>
rs = - 1 - uporządkowania są całkowicie przeciwne
rs < 0 - korelacja ujemna świadczy o uporządkowaniach
niezgodnych
rs = 0 - niezależność uporządkowań
rs > 0 - korelacja dodatnia oznacza uporządkowania zgodne
rs = + 1 - uporządkowania są całkowicie zgodne.
RANGOWANIE JEST MOŻLIWE WTEDY GDY LICZBA OBSERWACJI NIE JEST DUŻA
A INFORMACJE SĄ ZAPISANE W SZEREGACH
ZADANIE 2.
W badaniach marketingowych rynku samochodowego dwie grupy niezależnych respondentów oceniały samochody znajdujące się na rynku. Jedną grupę stanowili mieszkańcy dużych miast (powyżej 100 tys.), drugą - mieszkańcy miast liczących do 5 tys. mieszkańców. Biorąc pod uwagę najważniejsze wady i zalety poszczególnych marek grupy przyporządkowały ogólne oceny od 1 (najniższa ocena) do 10 (ocena najwyższa) samochodom poddanym ocenie. Należy rozstrzygnąć czy opinie mieszkańców różnej wielkości miast są zgodne, czy też mieszkańcy dużych miast mają inne preferencje niż mieszkańcy małych miast.
l.p. |
marka samochodu |
ocena mieszkańców dużych miast |
ocena mieszkańców małych miast |
di |
di2 |
1 |
PEUGEOT |
8 |
1 |
7 |
49 |
2 |
RENAULT |
7 |
2 |
5 |
25 |
3 |
FORD |
2 |
8 |
-6 |
36 |
4 |
OPEL |
5 |
6 |
-1 |
1 |
5 |
DAEWOO |
1 |
7 |
-6 |
36 |
6 |
HUNDAY |
6 |
3 |
3 |
9 |
7 |
MAZDA |
3 |
9 |
-6 |
36 |
8 |
VW |
4 |
5 |
-1 |
1 |
9 |
AUDI |
9 |
4 |
5 |
25 |
razem |
x |
45 |
45 |
0 |
218 |
Współczynnik mniejszy od zera świadczy o niezgodności opinii mieszkańców różnej wielkości miast; siła korelacji jest duża.
ZADANIE 3
Informacje o wysokości przeciętnego miesięcznego wynagrodzenia brutto w województwach Polski oraz wskaźnik liczby widzów w kinach na 1000 mieszkańców prezentuje tablica. Ocenić współzależność badanych cech:
województwo |
przeciętne miesięczne wynagrodzenie brutto |
Liczba widzów w kinach na 1000 mieszkańców |
ri1 |
ri2 |
di |
di2 |
donośląskie |
2122 |
669 |
4 |
5 |
-1 |
1 |
kujawsko-pomorskie |
1917 |
460 |
12 |
9 |
3 |
9 |
lubelskie |
1904 |
445 |
14,5 |
11 |
3,5 |
12,25 |
lubuskie |
1910 |
341 |
13 |
16 |
-3 |
9 |
łódzkie |
1904 |
641 |
14,5 |
6 |
8,5 |
72,25 |
małopolskie |
2008 |
736 |
7 |
4 |
3 |
9 |
mazowieckie |
2891 |
1489 |
1 |
1 |
0 |
0 |
opolskie |
1991 |
359 |
8 |
15 |
-7 |
49 |
podkarpackie |
1861 |
424 |
16 |
12 |
4 |
16 |
podlaskie |
1918 |
450 |
11 |
10 |
1 |
1 |
pomorskie |
2140 |
1044 |
3 |
2 |
1 |
1 |
śląskie |
2239 |
615 |
2 |
7 |
-5 |
25 |
świętokrzyskie |
1950 |
375 |
9 |
14 |
-5 |
25 |
warmińsko-mazurskie |
1935 |
399 |
10 |
13 |
-3 |
9 |
wielkopolskie |
2043 |
759 |
6 |
3 |
3 |
9 |
zachodniopomorskie |
2077 |
553 |
5 |
8 |
-3 |
9 |
x |
32810 |
9759 |
136 |
136 |
0 |
256,5 |
Wartość współczynnika świadczy o dodatniej korelacji między wysokością wynagrodzeń i wskaźnikiem liczby widzów w kinach na 1000 mieszkańców. Siła związku jest umiarkowana.
KORELACJA CECH JAKOŚCIOWYCH - opiera się na wyznaczeniu współczynników kontyngencji, oceniających stopień skojarzenia cech.
Ocena skojarzenia cech opiera się na tzw. statystyce χ2 , która ukazuje odchylenia zaobserwowanych liczebności dla wyodrębnionych klas obu cech od liczebności jakich należałoby się spodziewać, gdyby cechy były niezależne.
gdzie:
nij |
- liczba elementów próby, |
|
- liczebności teoretyczne, |
k |
- liczba kolumn tablicy niezależności (kontyngencji), |
r |
- liczba wierszy tablicy niezależności. |
Liczebności teoretyczne oblicza się wg wzoru:
gdzie:
nij |
- liczba elementów próby, |
|
- liczebności teoretyczne, |
k |
- liczba kolumn tablicy niezależności, |
l |
- liczba wierszy tablicy niezależności. |
χ2
WSPÓŁCZYNNIKI KONTYNGENCJI
WSPÓŁCZYNNIK ZBIEŻNOŚCI T-CZUPROWA
WSPÓŁCZYNNIK V-CRAMERA
WSPÓŁCZYNNIK KONTYNGENCJI C PEARSONA
ZADANIE 4.
W maju 2004 roku jeden z ośrodków badania opinii społecznej zadał respondentom pytanie „czy prywatyzacja jest korzystna dla kraju?” Osoby pogrupowano na dwie kategorie: pracujących na własny rachunek oraz zatrudnionych na podstawie umowy o pracę.
Pracujący |
Ocena |
razem |
|
|
korzystna |
niekorzystna |
|
Na własny rachunek |
150 |
60 |
210 |
Na podstawie umowy o pracę |
40 |
70 |
110 |
razem |
190 |
130 |
320 |
Obliczamy liczebności teoretyczne wg wzoru
|
|
|
|
|
150 |
125 |
25 |
625 |
5,00 |
140 |
65 |
-25 |
625 |
9,62 |
60 |
85 |
-25 |
625 |
7,35 |
70 |
45 |
25 |
625 |
13,89 |
320 |
320 |
0 |
x |
35,86 |
Obliczamy statystykę χ2 wg wzoru
Obliczamy współczynnik zbieżności wg wzoru
Otrzymany współczynnik wskazuje na umiarkowaną współzależność pomiędzy oceną prywatyzacji a miejscem pracy.
12