Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
Analiza zależności dwóch cech statystycznych jakościowych i ilo-
ściowych
Zagadnienia:
skala pomiarowa cech statystycznych wg. Stevensa
rodzaje związków między zmiennymi i metody ich badania
analiza współzależności dwóch cech jakościowych: nominalnych [miary oparte na statystyce
2
:
φ Yule’a, C Pearsona, V Cramera, T Czuprowa, Q Kendalla], porządkowych [korelacja rang Spe-
armanna, korelacja rang Kendalla]
analiza współzależności dwóch cech ilościowych: kowariancja, korelacja liniowa Pearsona
Dokładność obliczeń: 4 miejsca po przecinku.
Zad. 1.
W poniższej tablicy zestawiono dane dotyczące liczby rozwiązanych małżeństw z powodu śmier-
ci jednego ze współmałżonków lub rozwodu, w podziale na miasto i wieś.
Przyczyna rozwiązania małżeństwa
Śmierć
współmał-
żonka
Rozwód
Miejsce
zamieszkania
Miasto
43
38
Wieś
35
26
W oparciu o zaprezentowane dane określić stopień współzależności między przyczyną rozwiązania mał-
żeństwa a miejscem zamieszkania. W tym celu wykorzystać współczynniki:
a) φ Yule’a,
b) C Pearsona,
c) V Cramera,
d) T Czuprowa,
e) Q Kendalla,
f) Czy konieczne jest obliczanie wszystkich miar opartych na statystyce
2
? W jakich sytuacjach
może być taka konieczność?
g) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Zad. 2 Poproszono dwóch analityków finansowych, aby wyrazili swoje opinie o 10 przedsiębiorstwach,
uporządkowując je od najlepszego do najgorszego i nadając poszczególnym przedsiębiorstwom rangi od
1 (najlepsze) do 10 (najgorsze). Dane zebrano w poniższej tabeli:
Przedsiębiorstwo
Analityk finansowy 1
i
x
Analityk finansowy 2
i
y
1
5
6
2
6
7
3
1
2
4
3
4
5
2
1
6
7
8
7
4
3
8
8
5
9
10
9
10
9
10
a) Proszę narysować diagram korelacyjny (wykres rozrzutu)
b) Obliczyć i zinterpretować współczynnik korelacji rang Spearmana
Materiały do ćwiczeń z przedmiotu Statystyka, mgr Oskar Knapik
c) Obliczyć i zinterpretować współczynnik korelacji rang Kendalla
d) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Zad. 3.
W pewnym Urzędzie Stanu Cywilnego przeprowadzono badanie nowo zawartych małżeństw we-
dług wieku męża i żony (badanie przeprowadzono w jednym dniu). Wyniki badania losowo pobranych
par przedstawia poniższa tabela:
Wiek męża (w la-
tach)
19
21
23
21
20
23
26
25
26
34
Wiek żony (w la-
tach)
18
19
20
21
23
24
27
27
27
30
Określić siłę i kierunek zależności pomiędzy badanymi zmiennymi.
a) Narysować diagram korelacyjny dla wartości zmiennych przed rangowaniem i po rangowaniu. Ja-
kie wnioski płyną z analizy wykresów?
b) Obliczyć i zinterpretować współczynnik korelacji rang Spearmana
c) Obliczyć i zinterpretować współczynnik korelacji rang Kendalla
d) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Zad. 4.
Zbadano zależność między liczbą reklam pewnego wyrobu emitowanego dziennie w telewizji a
wysokością obrotów (w mln zł) otrzymując następujące dane:
Liczba reklam
3
5
4
5
7
Wielkość obrotów (w mln
zł)
10
13
14
16
15
a) Narysować diagram korelacyjny. Co można stwierdzić na jego podstawie?
b) Obliczyć i zinterpretować kowariancję.
c) Obliczyć i zinterpretować współczynnik korelacji liniowej Pearsona.
d) Dla ambitnych: Jak wykonać powyższą analizę w pakiecie R?
Numer
zadania
Odpowiedzi
1
f
=
V
=
T
=
0.0427
;
Q
= -
0.0866
;
C
=
0.0426 ; C
max
=
0.7071
2
b)
r
S
=
0.7028
3
b)
r
S
=
0.8818
c)
4
b)
cov( X,Y)
=
1.92; c) r(X,Y)
=
0.7028