BADANIE POZIOMU UCZĘSZCZANIA PŁCI DAMSKIEJ I MĘSKIEJ NA NIEOBOWIĄZKOWE WYKŁADY NA TERENIE UNIWERSYTETU TECHNOLOGICZNO- PRZYRODNICZEGO
Materiał badawczy oraz opracowanie:
Gumiński Karol
Strzyżewska Marta
Walczak Dawid
Analiza Korelacji.
W poniższych danych korelacyjnych przedstawiono zebrane dane statystyczne dotyczące poziomu uczęszczania obu płci na nie obowiązkowe wykłady, w próbie czterdziestu wykładów, na terenie uczelni Uniwersytetu Technologiczno Przyrodniczego.
|
x |
y |
|
Lp. |
M |
K |
Razem |
1 |
11 |
12 |
23 |
2 |
17 |
22 |
39 |
3 |
26 |
27 |
53 |
4 |
41 |
42 |
83 |
5 |
36 |
29 |
|
6 |
11 |
18 |
29 |
7 |
2 |
5 |
7 |
8 |
39 |
36 |
75 |
9 |
18 |
20 |
38 |
10 |
4 |
3 |
7 |
11 |
6 |
9 |
15 |
12 |
53 |
55 |
108 |
13 |
6 |
11 |
17 |
14 |
11 |
27 |
38 |
15 |
16 |
15 |
31 |
16 |
11 |
15 |
26 |
17 |
12 |
22 |
34 |
18 |
8 |
14 |
22 |
19 |
6 |
15 |
21 |
20 |
11 |
16 |
27 |
21 |
32 |
41 |
73 |
22 |
12 |
21 |
33 |
23 |
6 |
7 |
13 |
24 |
35 |
47 |
82 |
25 |
15 |
18 |
33 |
26 |
14 |
16 |
30 |
27 |
38 |
45 |
83 |
28 |
4 |
9 |
13 |
29 |
21 |
26 |
47 |
30 |
12 |
16 |
28 |
31 |
17 |
21 |
38 |
32 |
13 |
22 |
35 |
33 |
6 |
11 |
17 |
34 |
20 |
31 |
51 |
35 |
19 |
29 |
48 |
36 |
5 |
6 |
11 |
37 |
11 |
14 |
25 |
38 |
26 |
39 |
65 |
39 |
31 |
44 |
75 |
40 |
41 |
47 |
88 |
Tab. 02. Korelacja liniowa dodatnia
Tab. 01. zestawienie uczęszczania na wykłady kobiet jak i mężczyzn.
Budujemy tabele korelacyjną, przyjmujemy rozpiętość przedziałów
dla obu cech równą 10.
Y X |
0-10 |
10-20 |
20-30 |
30-40 |
40-50 |
50-60 |
∑ nj |
Yj |
S(Y) |
0-10 |
6 |
4 |
--- |
--- |
--- |
--- |
10 |
9 |
4,90 |
10-20 |
--- |
10 |
7 |
1 |
--- |
--- |
18 |
20 |
5 |
20-30 |
--- |
--- |
2 |
1 |
--- |
--- |
3 |
28,33 |
4,71 |
30-40 |
--- |
--- |
1 |
1 |
4 |
--- |
6 |
40 |
7,63 |
40-50 |
--- |
--- |
--- |
--- |
2 |
--- |
2 |
45 |
0 |
50-60 |
--- |
--- |
--- |
--- |
--- |
1 |
1 |
55 |
0 |
∑ ni |
6 |
14 |
10 |
3 |
6 |
1 |
40 |
|
|
Xi |
5 |
12,14 |
19 |
25 |
38,33 |
55 |
|
|
|
S(x) |
0 |
4,52 |
6,63 |
8,17 |
4,71 |
0 |
|
|
|
Tab. 03. tablica korelacyjna
Wyznaczamy średnie warunkowe dla obu cech
Średnie warunkowe Xi Średnie warunkowe Yj
................................. ...................................
X1=(5*6)/6=5 Y1=[(5*6)+(15*4)]/10=9
X2 =[(5*4)+(15*10)]/14=12,14 Y2 =[(15*10)+(25*7)+(35*1)]/18=20
X3 =[(15*7)+(25*2)+(35*1)]/10=19 Y3 =[(25*2)+(35*1)]/3=28,33
X4 =[(15*1)+(25*1)+(35*1)]/3=25 Y4 =[(25*1)+(35*1)+(45*4)]/6=40
X5 =[(35*4)*(45*2)]/6=38,33 Y5 =(45*2)/2=45
X6 =(55*1)/1=55 Y6 =(55*1)/1=55
Wyznaczamy odchylenia standartowe dla obu cech
Odchylenie standartowe Si(X) <ale najpierw obliczamy wariancję i wtedy pierwiastkujemy>
........................................
S1(X)=[(5*5)2*6]/6=0
S2(X)=[(5-12,14)2*4+(15-12,14)2*10]/14=20,41 pierwiastkujemy i wychodzi nam S2(X)=4,52
S3(X)=[(15-19)2*7+(25-19)2*2(35-19)2*1]/10=44 pierwiastkujemy i wychodzi nam S3(X)=6,63
S4(X)=[(15-25)2*1+(25-25)2*1+(35-25)2*1]/3=66,67 pierwiastkujemy i wychodzi nam S4(X)=8,17
S5(X)=[(35-38,33)2*4+(45-38,33)2*2]/6=22,22 pierwiastkujemy i wychodzi nam S5(X)=4,71
S6(X)=[(55-55)2*1]/1=0
Odchylenie standartowe Sj(Y) <ale najpierw obliczamy wariancję i wtedy pierwiastkujemy>
.....................................
S1(Y)=[(5-9)2*6+(15-9)2*4]/10=24 pierwiastkujemy i wychodzi nam S1(Y)=4,90
S2(Y)=[(15-20)2*10+(25-20)2*7+(35-20)2*1]/18=25 pierwiastkujemy i wychodzi nam S2(Y)=5
S3(Y)=[(25-28,33)2*2(35-28,33)2*1]/3=22,22 pierwiastkujemy i wychodzi nam S3(Y)=4,71
S4(Y)=[(25-40)2*1+(35-40)2*1+(45-40)2*4]/6=58,33 pierwiastkujemy i wychodzi nam S4(Y)=7,63
S5(Y)=[(45-45)2*2]/2=0
S6(Y)=[(55-55)2*1]/1=0
Przyporządkowanie w postaci tabelarycznej wartości jednej cechy (M)średnim warunkowym drugiej cechy (K).
Yj |
Xj |
5 |
5 |
15 |
12,14 |
25 |
19 |
35 |
25 |
45 |
38,33 |
55 |
55 |
.......... ...........
Xi |
Yi |
5 |
9 |
15 |
20 |
25 |
28,33 |
35 |
40 |
45 |
45 |
55 |
55 |
Tab. 04.przypożądkowanie w postaci tabelarycznej wartości jednej cechy <obecności kobiet na wykładach>
średnim warunkowym drugiej cechy< obecności mężczyzn na wykładach >
Tablica 05. Empiryczne linie regresji Y względem X na podstawie otrzymanych zbiorów
punktów z poprzedniego punktu. z położeń obu lin regresji możemy powiedzieć o istnieniu
korelacji dodatniej z związkach pomiędzy obecnością kobiet na wykładach i mężczyzn.
Określanie stopnia zależności < obecności kobiet na wykładach > na tle < obecności mężczyzn na wykładach >, za pomoczą współczynnika korelacji liniowej Pearsona.
Ale najpierw.
Wyznaczyć średnie arytmetyczne i odchylenia standartowe dla K i M, z rozkładów brzegowych.
Mężczyźni
Xi |
Xi |
Ni |
Xi*Ni |
0-10 |
5 |
10 |
50 |
10-20 |
15 |
18 |
270 |
20-30 |
25 |
3 |
75 |
30-40 |
35 |
6 |
210 |
40-50 |
45 |
2 |
90 |
50-60 |
55 |
1 |
55 |
∑ |
|
40 |
750 |
.................................
Średnia arytmetyczna=750/40=18,75
Kobiety
Yi |
Yi |
Ni |
Yi*Ni |
0-10 |
5 |
6 |
30 |
10-20 |
15 |
14 |
210 |
20-30 |
25 |
10 |
250 |
30-40 |
35 |
3 |
105 |
40-50 |
45 |
6 |
270 |
50-60 |
55 |
1 |
55 |
∑ |
|
40 |
920 |
..............................
Średnia arytmetyczna=920/40=23
Odchylenie standardowe dla M
..............................
S2xi=[(5-18,75)2*10+(15-18,75)2*18+(25-18,75)2*3+(35-18,75)2*6+(45-18,75)2*2+(55-18,75)2*1]/40 = [1890,62+253,13+117,19+1584,38+1378,13+1314,06]/40=6537,51/40
= 163,44pierwiastkujemy i wychodzi nam S(X)=12,78
Odchylenie standardowe dla K
................................
S2yj=[(5-23)2*6+(15-23)2*14+(25-23)2*10+(35-23)2*3+(45)2*6+(55)2*1]/40 = [1994+896+40+432+2904+1024]/40=181pierwiastkujemy i wychodzi nam S(Y)=13,45
X |
Y |
nij |
5 |
5 |
6 |
5 |
15 |
4 |
15 |
15 |
10 |
15 |
25 |
7 |
15 |
35 |
1 |
25 |
25 |
2 |
25 |
35 |
1 |
35 |
25 |
1 |
35 |
35 |
1 |
35 |
45 |
4 |
45 |
45 |
2 |
55 |
55 |
1 |
COV(x,y)=....................... rxy=.............................
COV(x,y)=[(5-18,75)*(5-23)*6+(5-18,75)*(15-23)*4+(15-18,75)*(15-23)*10+
+(15-18,75)*(25-23)*7+(15-18,75)*(35-23)*1+(25-18,75)*(25-23)*2+
+(25-18,75)*(35-23)*1+(35-18,75)*(25-23)*1+(35-18,75)*(35-23)*1+
+(35-18,75)*(45-23)*4+(45-18,75)*(45-23)*2+(55-18,75)*(55-23)*1]/40=
=[1485+440+300+(-52,5)+(-45)+25+75+32,5+195+1430+1155+1160]/40=
=6200/40=155
COV(x,y)=155 współczynnik kowariancji jest dodatni co informuje nasz
o dodatnich związkach korelacyjnych.
rxy=....................................
rxy=155/12,78*13,45=155/171,89=0,90
Wskaźnik korelacji Pearsona równa się (0,90), a to oznacza że siła współzależności występująca pomiędzy badanymi cechami jest silna, ponieważ im wskaźnik Pearsona jest bliższy 1 tym korelacja jest mocniejsza.
W celu prostego określenia siły zw. pomiędzy cechami stosuje się współczynnik d=r2
d*100 oznacza jaki procent zmienności zmiennej Y jest wyjaśniana przez zmienność zmiennej X.
d=r2 d=0,902=0,81 co znaczy ze w osiemdziesięciu procentach zmiana wartości Y współzależna ze zmianą X, a w dziewiętnastu procentach zmienność wzrost wartości Y nie powoduje wzrostu wartości X i tak samo przy spadku.
Wskaźnik <stosunek> korelacyjny, który pozwala zbadać ocenę siły zależności między
K a M.
exy=............................
S2(x)=163,44
S2(xi)=[(5-18,75)2*6+(12,14-18,75)2*14+(19-18,75)2*10+(25-18,75)2*3+(38,33-18,75)2*6+(55-18,75)2*1]/40=49,27
exy=49,27/163,44=0,30 pierwiastkujemy i wychodzi nam 0,549
exy=0,55
Sprawdźmy czy słuszne będzie założenie o prostoliniowości związku.
m(xy)= e2xy- r2xy=(0,55)2-(0,90)2=0,30-0,81= -0,51
m(xy)= -0,51
-0,51<0,2
Miernik Krzywoliniowości jest mniejszy od 0,2 zatem możemy twierdzić ze związek pomiędzy uczęszczaniem kobiet jak i mężczyzn jest prostoliniowy, wynik potwierdza tezę iż, wraz
z wzrostem obecności kobiet na wykładach wzrasta też liczebność mężczyzn, tak samo jest przy spadku obecności gdzie wraz z mniejsza ilością kobiet na wykładach jest wprost proporcjonalnie mniej mężczyzn na nieobowiązkowych zajęciach.
Obliczenie szeregu rozdzielczego przedziałowego dla X< mężczyźni>
1.utalanie liczby przedziałów:
N=40 K=40 pod pierw.=6.32 zaokrąglamy do jedności czyli K=6
2. ustalanie obszaru zmienności:
R= X max - X min
R=53-2=51
3. ustalanie zakresu zmienności:
Z=60-0=60
4. ustalenie rozpiętości przedziałów klasowych:
H=Z/K H=60/6=10
Powstaje nam szereg który musi mieć 6 przedziałów o rozpiętości 10.
Obliczenie szeregu rozdzielczego dla Y< Kobiety>
1.utalanie liczby przedziałów:
N=40 K=40 pod pierw.=6.32 zaokrąglamy do jedności czyli K=6
2. ustalanie obszaru zmienności:
R= Y max - Y min
R=55-3=52
3. ustalanie zakresu zmienności:
Z=60-0=60
4. ustalenie rozpiętości przedziałów klasowych:
H=Z/K H=60/6=10
Powstaje nam szereg który musi mieć 6 przedziałów o rozpiętości 10.
Przedziały dla Kobiet i Mężczyzn są takie same:
0-10
10-20
20-30
30-40
40-50
50-60
|
|
|
|
Udział % |
||
|
M |
K |
Razem |
M |
K |
Razem |
0-10 |
10 |
6 |
16 |
25,0% |
15,0% |
20,0% |
10--20 |
18 |
14 |
32 |
45,0% |
35,0% |
40,0% |
20--30 |
3 |
10 |
13 |
7,5% |
25,0% |
16,3% |
30-40 |
6 |
3 |
9 |
15,0% |
7,5% |
11,3% |
40-50 |
2 |
6 |
8 |
5,0% |
15,0% |
10,0% |
50-60 |
1 |
1 |
2 |
2,5% |
2,5% |
2,5% |
|
|
|
|
100,0% |
100,0% |
100,0% |