STATYSTYKA
wykład 10
Ocena zależności
Wanda Olech
Badanie związku między
cechami
Cele:
" Stwierdzić, czy istnieje zależność między
cechami w próbie
" Stwierdzić, czy zależność jest istotna
" Ocenić siłę zależności
Ze względu na rodzaje cech w
próbach dwuwymiarowych oraz
na rodzaj zależności, dzielimy na:
" połączenie cechy jakościowej lub ilościowej
skokowej z dowolną
" połączenie cechy ilościowej ciągłej z cechą
ilościową ciągłą
WARIANT 1
" połączenie cechy jakościowej lub ilościowej
skokowej z dowolną
Ho: cechy są niezależne
H1: cechy są zależne
umaszczenie
ni.
nij czarne czekolada biszkopt
Warszawa
26 4 50 80
Kraków
34 6 30 70
Gdańsk
20 10 20 50
n. 80 20 100 200
j
N
ni.
n. j
ni. n. j
pi. =
p. j =
Ć
nij = pi. p. j N =
N
N
N
miasto
Teoretyczne liczebności
umaszczenie
czarne czekolada biszkopt
Warszawa
26 32 4 8 50 40 80
Kraków
34 28 6 7 30 35 70
Gdańsk
20 20 10 5 20 25 50
80 20 100 200
Ć
(nij - nij )2
(26 - 32)2 (20 - 25)2
2
cemp =
= + ... + = 13,77
Ć
nij
32 25
i, j
miasto
Weryfikacja hipotezy o niezależności cech
H0 : cechy są niezależne
H1 : cechy są zależne
2
c = 13,77
emp
Rozkład chi-kwadrat o czterech stopniach swobody,
gdyż v = (r-1)(k-1)
2
P(c ł 13,77) = 0,00807
Cecha
jakościowa
Współczynnik zbieżności T - Czuprowa
z inną
2
emp
T =
N (r -1)(k -1)
Informuje o sile zależności,
Jego wartość zawiera się w przedziale od <0 ; 1>
13,77
T = = 0,1855
200 (3 -1)(3 -1)
Zależność wysoko istotna, ale
słaba
LICZEBNOŚCI EMPIRYCZNE
duże małe
wieś
n
i
Y
miasto miasto
X
25 30 42 97
podstawowe
36 38 29 103
zawodowe
43 33 26 102
średnie
Chi-kwadrat emp 17,3366
51 32 23 106
wyzsze
nj 155 133 120 408
Liczba st.swobody 6
Istotność 0,00812271
LICZEBNOŚCI TEORYCZNE
duże małe
wieś
n
i
Y
miasto miasto
WSPÓACZYNNIK
X
ZBIEŻNOŚCI V 0,131708489
36,85 31,62 28,53 97
podstawowe
WSPÓACZYNNIK
39,13 33,58 30,29 103
zawodowe
DETERMINACJI
V2 1,7%
38,75 33,25 30,00 102
średnie
40,27 34,55 31,18 106
wyzsze
nj 155 133 120 408
WARIANT 2a:
- połączenie cechy ilościowej ciągłej z cechą
ilościową ciągłą, gdy obie mają w populacji
rozkład normalny
KOWARIANCJA
N
1
covxy =
(x - x) (yi - y) =
i
N -1
i=1
N N
ć
yi
x
i
N
1
i=1 i=1
=
x yi -
N -1 i=1 i N
Ł ł
KOWARIANCJA (covxy)
Informuje
- o istnieniu lub braku liniowej zależności między cechami,
- o kierunku zależności,
Jej wartość zawiera się w przedziale <-SxSy ; SxSy>
WSPÓACZYNNIK KORELACJI
LINIOWEJ PEARSONA
cov
xy
rxy =
Sx S
y
Informuje o sile i kierunku zależności,
Jego wartość zawiera się w przedziale od <-1 ;
1>
KORELACJA SILNA, DODATNIA
y
x
Przykład
Wydajność mleczna [kg] Zawartość tłuszczu [%]
5400 3,04
4800 3,09
6200 3,06
4700 3,15
4750 3,06
4800 3,17
5800 3,07
6250 3,13
5200 3,14
5500 3,09
Przykład
Wydajność mleczna [kg] Zawartość tłuszczu [%]
5400 3,04
4800 3,09
6200 3,06
4700 3,15
4750 3,06
4800 3,17
covxy = -8,056
5800 3,07
6250 3,13
5200 3,14
5500 3,09
2
Sx = 352111,1
2
Sy = 0,001978
-8,056
rxy = = -0,3053
352111,10,001978
Hipoteza porównująca wartość współczynnika
korelacji z stałą H0 : rXY = r0
ć
1 1+ r 1 1+ 0 0
uemp = ln - ln -
N - 3
2 1- r 2 1- 0 2(N -1)
Ł ł
Hipoteza porównująca wartość współczynnika
korelacji z zerem H0 : rXY = 0
r
temp = (N - 2)
1- r2
Przykład
- 0,3053
temp = (10 - 2) = -0,9068
1- (-0,3053)2
P(t Ł -0,9068) = 0,1955
dla H1 jednostronnej
P( t ł - 0,9068) = 0,391
dla H1 dwustronnej
Korelacja ujemna, słaba i nieistotna
WARIANT 2b:
- połączenie cechy ilościowej ciągłej z cechą
ilościową ciągłą, gdy przynajmniej jedna nie
ma w populacji rozkładu normalnego
WSPÓACZYNNIK KORELACJI
RANG SPEARMANA
N
2
6
d
i
i=1
rs =1-
2
N(N -1)
Przykład
I sędzia ranga II sędzia. ranga Różnica rang di
100 1 102 1,5 -0,5
101 2 102 1,5 0,5
107 6 108 6 0
111 9 110 8 1
109 7 110 8 -1
110 8 110 8 0
106 5 107 5 0
103 3 103 3,5 -0,5
112 10 111 10 0
104 4 103 3,5 0,5
Przykład
6 3 18
rs = 1- = 1- = 0,9818
10(100 -1) 990
0,9818
temp = 14,622
1- 0,98182
10 - 2
P(t ł14,622) = 0,0000
Korelacja bardzo silna i
wysoce istotna
ranga 1 ranga 2 di di2
1 12 -11 121
2 11 -9 81
3 10 -7 49
4 9 -5 25
5 8 -3 9
6 7 -1 1
7 6 1 1
8 5 3 9
9 4 5 25
10 3 7 49
11 2 9 81
12 1 11 121
0 572
6 572
rs = 1- = 1- 2 = -1
12(144 -1)
Triturus cristatus
Wyszukiwarka
Podobne podstrony:
Dz U 2009 14 80 Statystyczna Karta Wypadku wraz z opisem i kodami6 Statystyczna kontrola procesu 14informacja glownego urzedu statystycznego w sprawie zaktualizowanego szacunku pkb 14 2015informacja glownego urzedu statystycznego w sprawie zaktualizowanego szacunku pkb 14 2015st TPK w9 w10 14Statystyka IOAM Listy zada i tablice 14 15T 14Rzym 5 w 12,14 CZY WIERZYSZ EWOLUCJIustawa o umowach miedzynarodowych 14 00990425 14foto (14)DGP 14 rachunkowosc i audytwięcej podobnych podstron