Przykład 6.8.
W 2003 roku przeprowadzono badanie w grupie 100 studentów I roku prawa, mające na celu potwierdzenie zależności między miejscem zamieszkania a oceną uzyskaną z egzaminu wstępnego. Wyniki tych badań prezentuje tablica 6.11. Sprawdź, czy taka zależność istnieje i jaka jest jej siła?
Tablica 6.11. Miejsce zamieszkania i ocena uzyskana z egzaminu wstępnego
przez studentów I roku prawa
i Miejsce zamieszkania |
Ocena uzyskana z egzaminu wstępnego |
Ogółom | ||
3 |
4 |
5 | ||
Wieś |
25 |
6 |
2 |
33 |
Małe miasto |
5 |
38 |
1 |
44 |
Duże miasto |
3 |
6 |
14 |
23 |
Ogółem |
33 |
50 |
17 |
100 |
Źródło: dane umowne
Rozwiązanie
Aby odpowiedzieć na postawione pytanie, obliczamy stosunek korelacji eyx korzystając ze wzoru 6.14. Możemy tę miarę wyznaczyć, ponieważ zmienna zależna Y (w naszym przykładzie ocena uzyskana z egzaminu wstępnego) jest mierzalna. Obliczenia potrzebne do wyznaczenia stosunku korelacji przedstawia tablica 6.12, a sposób ich przeprowadzenia jest analogiczny jak w przykładzie 6.7.
Tablica 6.12. Obliczenia pomocnicze dla potrzeb wyznaczenia
stosunku korelacji z przykładu 6.8.
Miejsce zamieszkania |
yi |
"u |
J 5>y"« y-i |
yw-y |
(yM-y)2 | ||||
3 |
4 |
5 | |||||||
Wieś |
25 |
6 |
2 |
33 |
109 |
3,30 |
-0.54 |
0.29 |
9.57 |
Małe miasto |
5 |
38 |
1 |
44 |
172 |
3.91 |
0.07 |
0.01 |
0,44 |
Duże miasto |
3 |
6 |
14 |
23 |
103 |
4.48 |
0.64 |
0,41 |
9.43 |
lu_ |
33 |
50 |
17 |
100 |
384 |
X |
X |
X |
19,44 |
y-y |
-0.84 |
0,16 |
1.16 |
X | |||||
(yj -y)2 |
0.71 |
0,03 |
1.35 |
X | |||||
lyj-y)2-n.j |
23.43 |
1.50 |
22,95 |
47.88 |
Źródło: obliczenia własne na podstawie tablica 6.11.
W pierwszym etapie wyznaczamy średnią ogólną: y = = 3,84. Następnie obliczone
100
wartości podstawiamy do wzoru na stosunek korelacji eyv otrzymując: 0,64
. 119^ V 47,1
44
88
Powyższy wynik mówi o umiarkowanej zależności między miejscem zamieszkania a oceną uzyskaną z egzaminu. Rosnące średnie grupowe y(Ii) świadczą o istnieniu korelacji dodatniej między badanymi zmiennymi. Innymi słowy wraz ze wzrostem wielkości miejsca zamieszkania kandydatów można się spodziewać wyższej oceny z egzaminu wstępnego.
Współczynnik współzależności C-Pcarsona
Kolejną miarą wykorzystywaną do określenia związku między cechami jest współczynnik współzależności C-Pearsona zdefiniowany następująco:
gdzie: X2 to wartość statystyki X2 (chi- kwadrat) wyznaczonej na podstawie tablicy o wymiarach (w • k) według wzoru:
■> m * X =XX
*
^ • (6-22)
M 7-1
gdzie:
ntJ - liczebności waninkowe (empiryczne),
ńt} - liczebności teoretyczne, czyli takie, które wystąpiłyby gdyby cechy były niezależne.
Te ostatnie liczebności wyrażają się wzorem:
«, (O-23)
Współczynnik C-Pearsona oblicza się głównie dla cech jakościowych oraz tablic wielopolowych, czyli tablic w-iększych niż 2 x 2 Miara ta zawiera się w przedziale 0 < C < 1.
Poziom współczynnika C-Pearsona zależy od wielkości tablicy. W celu unormowania tej miary w taki sposób, aby współczynniki C pochodzące z różnej wielkości tablic mogły być ze sobą porównywane, proponuje się tzw. skorygowany współczynnik C-Pearsona:
(6.24)
gdzie:
C - min (w, k), 0<Cskor<\
185