IS3 wyklad10


Test istotności dla współczynnika korelacji:
1. Weryfikacja hipotezy 5;0: 5 = 0 (cechy X i Y są nieskorelowane)
Badane cechy (X,Y) mają dwuwymiarowy rozkład normalny o nieznanym współczynniku korelacji
r. Z populacji pobrano n-elementową próbkę i na jej podstawie obliczono wartośd r statystyki R.
A. licznośd n ł 3
5E
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 5a = 5[ - 2
1;5E2
ma rozkład t-Studenta o n-2 stopniach swobody
Weryfikujemy hipotezę 5;0: 5 = 0 na poziomie istotności a:
- jeżeli hipotezą alternatywną jest 5;1: 5 `" 0, to zbiorem krytycznym jest
1
5< = -", -5a1;1 *" 5a1;1 , " , gdzie 5a1;1 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta
5 5 5
2
2 2 2
o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5 > 0, to zbiorem krytycznym jest 5< = 5a1;5, " , gdzie
5a1;5 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5 < 0, to zbiorem krytycznym jest 5< = -", -5a1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5a(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
B. licznośd n ł 50
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 52 = 5[5E2
ma rozkład chi-kwadrat o 1 stopniu swobody
Weryfikujemy hipotezę 5;0: 5 = 0 na poziomie istotności a wobec hipotezy alternatywnej
5;1: 5 `" 0. Zbiorem krytycznym jest 5< 5X1;5, " , gdzie 5X1;5 jest kwantylem rzędu 1 - 5 rozkładu
chi-kwadrat o 1 stopniu swobody
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 52(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
C. licznośd n ł 100
5E
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 5H = 5[ ma
1;5E2
asymptotyczny rozkład normalny N(0,1)
Weryfikujemy hipotezę 5;0: 5 = 0 na poziomie istotności a:
- jeżeli hipotezą alternatywną jest 5;1: 5 `" 0, to zbiorem krytycznym jest
1
5< = -", -5b1;1 *" 5b1;1 , " , gdzie 5b1;1 jest kwantylem rzędu 1 - 5 rozkładu normalnego
5 5 5
2
2 2 2
N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 > 0, to zbiorem krytycznym jest 5< = 5b1;5, " , gdzie
5b1;5 jest kwantylem rzędu 1 - 5 rozkładu normalnego N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 < 0, to zbiorem krytycznym jest 5< = -", -5b1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5H(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
2. Weryfikacja hipotezy 5;0: 5 = 5 0
Badane cechy (X,Y) mają dwuwymiarowy rozkład normalny o nieznanym współczynniku korelacji
r. Z populacji pobrano n-elementową próbkę i na jej podstawie obliczono wartośd r statystyki R.
Zakładamy |r| ą 1.
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 5H = 5M - 5g0 5[ - 3,
1 1:5E 1 1:5 0
gdzie 5M = 5Y5[ , 5g0 = 5Y5[ ma asymptotyczny rozkład normalny N(0,1) dla n ł 10.
2 1;5E 2 1;5 0
Weryfikujemy hipotezę 5;0: 5 = 5 0 na poziomie istotności a:
- jeżeli hipotezą alternatywną jest 5;1: 5 `" 5 0, to zbiorem krytycznym jest
1
5< = -", -5b1;1 *" 5b1;1 , " , gdzie 5b1;1 jest kwantylem rzędu 1 - 5 rozkładu normalnego
5 5 5
2
2 2 2
N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 > 5 0, to zbiorem krytycznym jest 5< = 5b1;5, " , gdzie
5b1;5 jest kwantylem rzędu 1 - 5 rozkładu normalnego N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 < 5 0, to zbiorem krytycznym jest 5< = -", -5b1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5H(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
Np.
1. Z populacji, w której badane cechy mają dwuwymiarowy rozkład normalny pobrano próbkę
o liczności 25 (tabela). Na poziomie istotności a = 0.05 zweryfikuj hipotezę, że cechy są
nieskorelowane wobec hipotezy, ze są skorelowane.
5e5V5[5V.
5e5V2 5e5V25[5V.
5e5V\5f5W 5 6 7 8 9 5[5V.
5 - - 1 - - 1 5 25 25
10 - 1 3 2 - 6 60 100 600
15 1 3 3 3 1 11 165 225 2475
20 - 2 3 1 - 6 120 400 2400
25 - - 1 - - 1 25 625 625
5[ .5W 1 6 11 6 1 25 375 6125
5f5W5[.5W
5 36 77 48 9 175
5f5W2 25 36 49 64 81
5f5W25[.5W 25 216 539 384 81 1245
15 95 165 85 15
5e5V5[5V5W
5V
5f5W 5V 5e5V5[5V5W 75 570 1155 680 135 2615
1 1
5Y 5Z
5e = 5e5V5[5V. = 15, 5f = 5f5W5[ .5W = 7
5V<1 5W<1
5[ 5[
1 1
2 5Y 2 5Z
5`5K = 5e5V25[5V. - 5e2 = 20, 5`5K = 4.4721, 5`5L = 5f5W25[ .5W - 5f2 = 0.8, 5`5L = 0.8944
5V<1 5W<1
5[ 5[
1 1
5Z
5P5\5c 5e, 5f = 5f5W 5Y 5e5V5[5V5X - 5e5f = " 2615 - 15 " 7 = -0.4
5W<1 5V<1
5[ 25
5P5\5c(5e,5f) ;0.4
5_ = = = -0.1
5`5K5`5L 4.4721"0.8944
;0.1
5a 5e5V, 5f5V = 23 = -0.482
1;(;0.1)2
z tablicy kwantyli rozkładu t-Studenta o 23 stopniach swobody odczytujemy 5a0.975 = 2.069
ponieważ 5a(5e5V, 5f5V) -", -2.069 *" 2.069, " , to nie ma podstaw do odrzucenia hipotezy
5;0: cechy są nieskorelowane
2. Na podstawie próbki pobranej z populacji, w której badane cechy (X,Y) mają dwuwymiarowy
rozkład normalny o nieznanym r obliczono wartośd r = 0.45 statystyki R. Jak liczna powinna byd
próbka, aby na poziomie istotności a = 0.05 uznad, że współczynnik korelacji r > 0?
Na poziomie istotności a = 0.05 weryfikujemy hipotezę 5;0: 5 = 0 wobec hipotezy 5;1: 5 > 0
0.45
obliczamy wartośd statystyki 5a 5e5V, 5f5V = 5[ - 2 = 0.5039 5[ - 2
1;0.452
chcemy, aby 5a(5e5V, 5f5V) e" 5a0.95 dla jak najmniejszego n
metodą prób i błędów sprawdzamy dla n-2 = 10, 20, 30 itd. z tablicy kwantyli rozkładu t-Studenta
o n-2 stopniach swobody odczytujemy 5a0.95 dla kolejnych wartości n-2
otrzymujemy pierwsze zgodne n-2 = 20, sprawdzamy dla n-2 = 15 i nierównośd zachodzi, dla
n-2 = 13 zachodzi, a dla n-2 = 12 nie zachodzi
wnioskujemy, ze próba powinna mied co najmniej licznośd 15 elementów.
3. Z populacji, w której badane cechy (X,Y) mają dwuwymiarowy rozkład normalny pobrano
próbkę o liczności 80 elementów (tabela). Na poziomie istotności a = 0.05 zweryfikuj hipotezę,
że cechy są nieskorelowane wobec hipotezy, że są skorelowane.
Na poziomie istotności a = 0.05 weryfikujemy hipotezę 5;0: 5 = 0 wobec hipotezy 5;1: 5 `" 0
5e5V\5f5W 0.1 0.3 0.5 0.7 0.9 1.1 1.3 5[5V. 5e5V5[5V.
5e5V2 5e5V25[5V.
12.5 1 3 3 - - - - 7 87.5 156.25 1093.75
17.5 - 2 3 5 - - - 10 175 306.25 3062.5
22.5 - - 3 3 5 - - 11 247.5 506.25 5568.75
27.5 - - - 4 3 6 - 13 357.5 756.25 9831.25
32.5 - - - - 4 6 7 17 552.5 1056.25 17956.25
37.5 - - - - 4 4 4 12 450 1406.25 16875
42.5 - - - - 6 2 10 425 1806.25 18062.5
5[ .5W 1 5 9 12 16 24 13 80 2295 72450
5f5W5[.5W 0.1 1.5 4.5 8.4 14.4 26.4 16.9 72.2
0.01 0.09 0.25 0.49 0.81 1.21 1.69
5f5W2
0.01 0.45 2.25 5.88 12.96 29.04 21.97 72.56
5f5W25[.5W
5e5V5[5V5W 12.5 72.5 157.5 265 475 850 462.5
5V
5f5W 5V 5e5V5[5V5W 1.25 21.75 78.75 185.5 427.5 935 601.25 2251
1 1
5Y 5Z
5e = 5e5V5[5V. = 28.6875, 5f = 5f5W5[ .5W = 0.9025
5V<1 5W<1
5[ 5[
5Y 5Z
1 1
2 2
5`5K = 5e5V25[5V. - 5e2 = 82.6524, 5`5K = 9.0913, 5`5L = 5f5W25[ .5W - 5f2 = 0.0925, 5`5L = 0.3041
5[ 5[
5V<1 5W<1
1 5P5\5c(5e,5f)
5Z
5P5\5c 5e, 5f = 5f5W 5Y 5e5V5[5V5X - 5e5f = 2.247, 5_ = = 0.82
5W<1 5V<1
5[ 5`5K5`5L
52 5e5V, 5f5V = 80 " 0.822 = 53.792
z tablicy kwantyli rozkładu chi-kwadrat o 1 stopniu swobody odczytujemy 5X0.95 = 3.841
ponieważ 52 5e5V, 5f5V " ,3.841, "), to hipotezę 5;0 odrzucamy na rzecz hipotezy 5;1: zmienne X i Y
są skorelowane
4. W 120 zakładach przemysłowych zebrano dane o wydajności pracy X i wydajności produkcji Y
(tabela) w stosunku do poprzednich lat. Przy założeniu, że cechy (X,Y) mają dwuwymiarowy
rozkład normalny, na poziomie istotności a = 0.05 zweryfikuj hipotezę 5;0: 5 = 0 wobec 5;1: 5 > 0.
5e5V\5f5W 85 95 105 115 125 135 5[5V. 5e5V5[5V.
5e5V2 5e5V25[5V.
85 2 3 - - 2 - 7 595 7225 50575
95 2 3 5 3 1 2 16 1520 9025 144400
105 2 5 18 14 5 2 46 4380 11025 507150
115 - 2 7 12 - 3 30 3450 13225 396750
125 - 1 2 3 5 3 14 1750 15625 218750
135 - - - 2 - 2 4 540 18225 72900
145 - - - - - 3 3 435 21025 63075
5[ .5W 6 14 32 34 19 15 120 13120 1453600
5f5W5[.5W 510 1330 3360 3910 2375 2025 13510
7225 9025 11025 13225 15625 18225
5f5W2
43350 126350 352800 449650 296875 273375 1542400
5f5W25[.5W
1420 3420 3780 2105 1825
5e5V5[5V5W 570
5V
5f5W 5V 5e5V5[5V5W 48450 134900 359100 434700 263125 246375 1486650
1 1
5Y 5Z
5e = 5e5V5[5V. = 109.3333, 5f = 5f5W5[ .5W = 112.5833
5V<1 5W<1
5[ 5[
1
2 5Y
5`5K = 5e5V25[5V. - 5e2 = 159.563, 5`5K = 12.6318,
5V<1
5[
1
2 5Z
5`5L = 5f5W25[ .5W - 5f2 = 178.334, 5`5L = 13.3542,
5W<1
5[
1 5P5\5c(5e,5f)
5Z
5P5\5c 5e, 5f = 5f5W 5Y 5e5V5[5V5W - 5e5f = 79.647, 5_ = = 0.4722
5W<1 5V<1
5[ 5`5K5`5L
0.4722
5H 5e5V, 5f5V = 120 = 6.657
1 - 0.47222
z tablicy kwantyli rozkładu normalnego N(0,1) odczytujemy 5b0.95 = 1.64
ponieważ 5H 5e5V, 5f5V " ,1.64, "), to hipotezę 5;0 odrzucamy na rzecz hipotezy 5;1: 5 > 0
5. Dla danych z poprzedniego przykładu na poziomie istotności a = 0.01 zweryfikuj hipotezę
5;0: 5 = 0.65 wobec hipotezy alternatywnej 5;1: 5 < 0.65
1 1:0.4722 1 1:0.65
obliczamy wartośd statystyki Z 5e5V, 5f5V = 5Y5[ = 0.5129 oraz 5g0 = 5Y5[ = 0.7753
2 1;0.4722 2 1;0.65
czyli 5H 5e5V, 5f5V = 0.5129 - 0.7753 117 = -2.8383
z tablicy kwantyli rozkładu normalnego N(0,1) odczytujemy 5b0.99 = 2.33
ponieważ 5H 5e5V, 5f5V " (-", -2.33], to hipotezę 5;0 odrzucamy na rzecz hipotezy 5;1: 5 < 0.65
Test jednorodności dla dwóch współczynników korelacji:
Dane są dwie populacje, w których badane cechy (X,Y) mają dwuwymiarowe rozkłady normalne
o nieznanych współczynnikach korelacji 5 1, 5 2. Z pierwszej populacji pobrano 5[1 - elementową
próbkę i obliczono na jej podstawie wartośd 5_1 statystyki 5E1 oraz z drugiej populacji pobrano
5[2 - elementową próbkę i obliczono na jej podstawie wartośd 5_2 statystyki 5E2.
wykorzystamy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka
1 1:5E5V
5H = 5M1 - 5M2 5[1;3 5[2;3 , gdzie 5M5V = 5Y5[ , 5V = 1,2 ma rozkład asymptotycznie normalny
5[1:5[2;6 2 1;5E5V
N(0,1)
Weryfikujemy hipotezę 5;0: 5 1 = 5 2 na poziomie istotności a.
- jeżeli hipotezą alternatywną jest 5;1: 5 1 `" 5 2, to zbiorem krytycznym jest
1
5< = -", -5b1;1 *" 5b1;1 , " , gdzie 5b1;1 jest kwantylem rzędu 1 - 5 rozkładu normalnego
5 5 5
2
2 2 2
N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 1 > 5 2, to zbiorem krytycznym jest 5< = 5b1;5, " , gdzie
5b1;5 jest kwantylem rzędu 1 - 5 rozkładu normalnego N(0,1)
- jeżeli hipotezą alternatywną jest 5;1: 5 1 < 5 2, to zbiorem krytycznym jest 5< = -", -5b1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5H(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
Uwaga: Jeżeli mamy podstawy do przyjęcia hipotezy 5;0 to wspólną wartośd współczynnika
1:5 5[1;3 5g1: 5[2;3 5g2
korelacji r wyliczamy ze wzoru 1 5Y5[ = , gdzie 5g5W = 5M5W 5e5V, 5f5V , 5W = 1,2.
2 1;5 5[1:5[2;6
Np. Z dwu populacji, w których cechy (X,Y) mają dwuwymiarowe rozkłady normalne o
współczynnikach korelacji 5 1 i 5 2 pobrano próbki o licznościach 5[1 = 58 i 5[2 = 65, z których
wyznaczono wartości 5_1 = 0.49 i 5_2 = 0.17 statystyk 5E1 i 5E2. Na poziomie istotności a = 0.05
zweryfikuj hipotezę 5;0: 5 1 = 5 2 wobec hipotezy alternatywnej 5;1: 5 1 `" 5 2.
1 1:5_1
obliczamy wartości 5g1 = 5M1 5e5V, 5f5V = 5Y5[ = 0.5369 i 5g2 = 0.1717 oraz wartośd statystyki
2 1;5_1
58;3 65;3
5H 5e5V, 5f5V = 0.5369 - 0.1717 = 1.97
58:65;6
z tablicy kwantyli rozkładu normalnego N(0,1) odczytujemy 5b0.975 = 1.96
ponieważ 5H 5e5V, 5f5V " -", -1.96 *" ,1.96, "), to hipotezę 5;0 odrzucamy na korzyśd hipotezy 5;1
Test istotności dla współczynników prostej regresji
Dana jest populacją, w której badane cechy (X,Y) mają dwuwymiarowy rozkład normalny o
nieznanych parametrach. Prostą regresji cechy Y względem cechy X jest 5f = 5N5e + 5O.
Z populacji pobrano n  elementową próbkę (5e5V, 5f5V) i na jej podstawie wyznaczono estymatory
a i 5Ż współczynników 5N i 5O prostej regresji
1. Weryfikacją hipotezy 5;0: 5N = a0
54;a0
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 5a = ma rozkład
5F54
5[ 5[ 5[ 2
5[ 5K5V5L5V;( 5K5V)( 5L5V) 5F5L(1;5E2)
5V=1 5V=1 5V=1 2
t-Studenta o n-2 stopniach swobody, gdzie 54 = , 5F54 =
2
2
5[ 5[
5F5K(5[;2)
5[ 5K5V2;( 5K5V)
5V=1 5V=1
Weryfikujemy hipotezę 5;0: 5N = a0 na poziomie istotności a.
- jeżeli hipotezą alternatywną jest 5;1: 5N `" a0, to zbiorem krytycznym jest
1
5< = -", -5a1;1 *" 5a1;1 , " , gdzie 5a1;1 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta
5 5 5
2
2 2 2
o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5N > a0, to zbiorem krytycznym jest 5< = 5a1;5, " , gdzie
5a1;5 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5N < a0, to zbiorem krytycznym jest 5< = -", -5a1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5a(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
1. Weryfikacją hipotezy 5;0: 5O = 5Ż0
55;5Ż0
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 5a = ma rozkład
5F55
2
5F5L 1;5E2
1
2 2 2
t-Studenta o n-2 stopniach swobody, gdzie 55 = 5L - 545K, 5F55 = 5F5K + 5K2 = 5F54 5[ 5[ 5K5V2
2
5V<1
5F5K 5[;2
Weryfikujemy hipotezę 5;0: 5O = 5Ż0 na poziomie istotności a.
- jeżeli hipotezą alternatywną jest 5;1: 5O `" 5Ż0, to zbiorem krytycznym jest
1
5< = -", -5a1;1 *" 5a1;1 , " , gdzie 5a1;1 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta
5 5 5
2
2 2 2
o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5O > 5Ż0, to zbiorem krytycznym jest 5< = 5a1;5, " , gdzie
5a1;5 jest kwantylem rzędu 1 - 5 rozkładu t-Studenta o n-2 stopniach swobody
- jeżeli hipotezą alternatywną jest 5;1: 5O < 5Ż0, to zbiorem krytycznym jest 5< = -", -5a1;5
w przypadku, gdy wyznaczona na podstawie próbki wartośd statystyki 5a(5e5V, 5f5V) " 5<, to hipotezę
5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, w przeciwnym przypadku nie ma podstaw
do odrzucenia hipotezy 5;0
Np. Z populacji, w której cechy (X,Y) mają rozkład dwuwymiarowy normalny o nieznanych
parametrach pobrano 75-elementową próbkę otrzymując wyniki (tablica). Na poziomie istotności
a = 0.05 zweryfikuj hipotezę, że prostą regresji cechy Y względem X jest 5f = -0.45e + 1.35
5e5V\5f5W 1.15 1.20 1.25 1.30 1.35 1.40 1.45 5[5V. 5e5V5[5V.
5e5V2 5e5V25[5V.
0.1 - - - 1 2 3 3 9 0.9 0.01 0.09
0.2 - - 3 5 5 2 - 15 3 0.04 0.6
0.3 - 3 3 7 8 2 - 23 6.9 0.09 2.07
0.4 1 3 5 8 2 - - 19 7.6 0.16 3.04
0.5 1 2 2 4 - - - 9 4.5 0.25 2.25
5[ .5W 2 8 13 25 17 7 3 75 22.9 0.55 8.05
5f5W5[.5W 2.3 9.6 16.25 32.5 22.95 9.8 4.35 97.75
1.3225 1.44 1.5625 1.69 1.8225 1.96 2.1025
5f5W2
2.645 11.52 20.3125 42.25 30.9825 13.72 6.3075 127.7375
5f5W25[.5W
3.1 4.5 8.4 4.4 1.3 0.3
5e5V5[5V5W 0.9
5V
5f5W 5V 5e5V5[5V5W 1.035 3.72 5.625 10.92 5.94 1.82 0.435 29.495
aby zweryfikowad hipotezę H: prosta regresji cechy Y względem X ma równanie 5f = -0.45e + 1.35
weryfikujemy hipotezę 5;0: 5N = -0.4 wobec hipotezy alternatywnej 5;1: 5N `" -0.4
jeżeli hipoteza 5;0 nie zostanie odrzucona, to weryfikujemy hipotezę 5>0: 5O = 1.35 wobec hipotezy
5>1: 5O `" 1.35
odrzucenie którejkolwiek z hipotez 5;0, 5>0 powoduje odrzucenie hipotezy H
dokonujemy obliczeo
1 1
5Y 5Z
5e = 5e5V5[5V. = 0.3053, 5f = 5f5W5[ .5W = 1.3033
5V<1 5W<1
5[ 5[
5Y 5Z
1 1
2 2
5`5K = 5e5V25[5V. - 5e2 = 0.0141, 5`5K = 0. 1188, 5`5L = 5f5W25[ .5W - 5f2 = 0.0046, 5`5L = 0.0676
5[ 5[
5V<1 5W<1
1 5P5\5c 5e,5f
5Z
5P5\5c 5e, 5f = 5f5W 5Y 5e5V5[5V5W - 5e5f = -0.0046, 5_ = = -0.5728
5W<1 5V<1
5[ 5`5K5`5L
5P5\5c(5e, 5f)
a = = -0.3262, 5Ż = 5f - ax = 1.4029
2
5`5K
wyznaczona z próbki prosta regresji cechy Y względem X ma równanie 5f = -0.32625e + 1.4029
2
5`5L(1 - 5_2)
2
5`54 = = 0.003, 5`54 = 0.0548
2
5`5K(5[ - 2)
a - a0 -0.3262 - (-0.4)
5a 5e5V, 5f5V = = = 1.3467
5`54 0.0548
z tablicy kwantyli rozkładu t-Studenta o 73 stopniach swobody wyznaczamy 5a0.975 = 1.9931
ponieważ 5a 5e5V, 5f5V " -", -1.9931 *" ,1.9931, "), to nie ma podstaw do odrzucenia hipotezy
5;0 i przystępujemy do weryfikacji hipotezy 5>0
1 1
2 2 2 2 2
5`55 = 5`54 5`5K + 5e2 = 5`54 5[ 5Y 5e5V 5[5V. = 0.003 " " 8.05 = 0.000322, 5`55 = 0.0179
5V<1
75
5Ż - 5Ż0 1.4029 - 1.35
5a 5e5V, 5f5V = = = 2.9553
5`55 0.0179
ponieważ 5a 5e5V, 5f5V " -", 1.9931 *" ,1.9931, "), to hipotezę 5>0 odrzucamy, a co za tym idzie
odrzucamy też hipotezę H.
Regresja krzywoliniowa
Def. Empiryczną linią regresji cechy Y względem cechy X na podstawie próbki (5e5V, 5f5V5W), i=1,& ,n
j=1,& ,5[5V nazywamy zbiór punktów (5e5V, 5f(5e5V)), i=1,& ,n, gdzie 5f 5e5V = 58(5L|5K = 5e5V)
Empiryczną linią regresji cechy X względem cechy Y na podstawie próbki (5e5X5Y, 5f5X), k=1,& ,m
l=1,& ,5[5X nazywamy zbiór punktów (5e 5f5X , 5f5X), k=1,& ,m, 5e 5f5X = 58(5K|5L = 5f5X)
Uwaga: Regresje pierwszego rodzaju 5Z1 5f = 58 5K 5L = 5f , 5Z2 5e = 58 5L 5K = 5e są w przypadku
dwuwymiarowego rozkładu normalnego cech (X,Y) liniami prostymi, natomiast dla innych
rozkładów nie są to na ogół linie proste.
Jako oszacowanie na podstawie próbki linii regresji pierwszego rodzaju posługujemy się liniami
regresji drugiego rodzaju, wyznaczonymi metodą najmniejszych kwadratów.
Aby znalezd linie regresji drugiego rodzaju wśród linii rodziny 5f = 5S(5e, 5P1, 5P2, & , 5P5W) na podstawie
próbki (5e5V, 5f5V), i=1,& ,n ( n>j ) metodą najmniejszych kwadratów, należy tak dobrad parametry
5[
5P1, 5P2, & , 5P5W aby funkcja F(5P1, 5P2, & , 5P5W) = ,5f5V - 5S 5e5V, 5P1, 5P2, & , 5P5W -2 osiągała minimum.
5V<1
559
szukane wartości 5P1, 5P2, & , 5P5W muszą spełniad układ równao normalnych 55P = 0, 5Z = 1, & , 5W
5Z
(warunek konieczny na ekstremum funkcji wielu zmiennych)
Uwaga: Decyzję o wyborze rodziny linii 5f = 5S(5e, 5P1, 5P2, & , 5P5W) trzeba podjąd wcześniej np. na
podstawie diagramu korelacyjnego lub innych przesłanek.
Aby uprościd rozwiązywanie układu równao normalnych (dla dużej liczby parametrów zadanie
trudne samo w sobie) można w przypadku pewnych rodzin zastosowad podstawienia:
1. 5f = 54Ś 5e + 55
podstawienie 5c = 5f, 5b = Ś 5e , 56 = 54, 57 = 55 prowadzi do równania 5c = 565b + 57
2. 5f = 545e55, 54 > 0, 5e > 0
logarytmujemy równanie stronami otrzymując 5Y5[5f = 5Y5[54 + 555Y5[5e
podstawienie 5c = 5Y5[5f, 5b = 5Y5[5e, 56 = 55, 57 = 5Y5[54 prowadzi do równania 5c = 565b + 57
3. 5f = 54555e, 54 > 0, 55 > 0
logarytmujemy równanie stronami otrzymując 5Y5[5f = 5Y5[54 + 5e5Y5[55
podstawienie 5c = 5Y5[5f, 5b = 5e, 56 = 5Y5[55, 57 = 5Y5[54 prowadzi do równania 5c = 565b + 57
w każdym przypadku należy dla nowych zmiennych zbudowad tablicę korelacyjną, a następnie
wyznaczyd prostą regresji metodą najmniejszych kwadratów i wrócid do starych zmiennych
5[
Uwaga: Wyznaczona prosta regresji minimalizuje sumę ,5c5V - 565b5V + 57 -2 , a niekoniecznie
5V<1
5[
,5f5V - 5S 5e5V, 54, 55 -2, ale odchylenia od właściwego rozwiązania są często nieznaczne.
5V<1
Def. Jeżeli równanie regresji jest równaniem liniowym względem parametrów, to model regresji
nazywamy liniowym, a wykładnik najwyższej potęgi zmiennej (zmiennych) niezależnych nazywamy
stopniem modelu.
Np. Wyznacz linię regresji drugiego rodzaju w modelu liniowym drugiego stopnia na podstawie
próbki (5e5V, 5f5V), i=1,& ,n pobranej z populacji, w której cechy (X,Y) mają rozkład inny niż
dwuwymiarowy normalny.
5[ 2
minimalizujemy funkcję 59 54, 55, 56 = ,5f5V - 545e5V + 555e5V + 56 -2
5V<1
559
5[ 2 2
= -2 *,5f5V - 545e5V + 555e5V + 56 - " 5e5V + = 0
5V<1
554
559
5[ 2
układ równao normalnych: = -2 *,5f5V - 545e5V + 555e5V + 56 - " 5e5V+ = 0
5V<1
555
559
5[ 2
= -2 ,5f5V - 545e5V + 555e5V + 56 - = 0
5V<1
556
5[ 4 5[ 3 5[ 2 5[ 2
54 5e5V + 55 5e5V + 56 5e5V = 5f5V " 5e5V
5V<1 5V<1 5V<1 5V<1
5[ 3 5[ 2 5[ 5[
54 5e5V + 55 5e5V + 56 5e5V = 5f5V " 5e5V
5V<1 5V<1 5V<1 5V<1
5[ 2 5[ 5[
54 5e5V + 55 5e5V + 565[ = 5f5V
5V<1 5V<1 5V<1
1 1 1
5[ 5[ 2 5[
wyliczamy 56 = 5f5V - 54 5e5V - 55 5e5V
5V<1 5V<1 5V<1
5[ 5[ 5[
po wstawieniu do pozostałych równao i oznaczeniach
1 1
5[ 2 5[ 5[ 2 5[ 2 5[
5 = 5e5V - ( 5e5V)2, 5ż = 5e5V 5f5V - ( 5e5V )( 5f5V),
5V<1 5V<1 5V<1 5V<1 5V<1
5[ 5[
1 1
5[ 3 5[ 5[ 2 5[ 5[ 5[
5 = 5e5V - ( 5e5V)( 5e5V ), 5 = 5e5V5f5V - ( 5e5V)( 5f5V),
5V<1 5V<1 5V<1 5V<1 5V<1 5V<1
5[ 5[
554 + 555 = 5ż
1
5[ 4 5[ 2
5 = 5e5V - ( 5e5V )2 otrzymujemy 554 + 555 = 5
5V<1 5V<1
5[
55ż;55 55;5ż5 1 1 1
5[ 5[ 2 5[
stąd 54 = , 55 = , 56 = 5f5V - 54 5e5V - 55 5e5V, gdy 55 - 52 `" 0
5V<1 5V<1 5V<1
55;52 55;52 5[ 5[ 5[
Np.
1. Wyznacz linię regresji drugiego rodzaju na podstawie próbki (5e5V, 5f5V), i=1,& ,20 (tabelka)
pobranej z populacji, w której cechy (X,Y) mają rozkład inny niż dwuwymiarowy normalny.
2 3 4 2
i 5e5V 5f5V 5e5V5f5V
5e5V 5e5V 5e5V 5e5V 5f5V
1 5.5 3.3 30.25 166.375 915.0625 18.15 98.825
2 3.5 1.5 12.25 52.875 150.0625 5.25 18.375
3 6.5 3.7 42.25 274.625 1785.0625 37.05 240.825
4 4.5 2.5 20.25 91.125 410.0625 11.25 50.625
5 5.0 2.8 25 125 625 14 70
6 7.5 6.5 56.25 421.875 3164.0625 48.75 365.625
7 5.5 4.0 30.25 166.375 915.0625 22 121
8 4.5 2.0 20.25 91.125 410.0625 9 40.5
9 1.5 1.3 2.25 3.375 5.0625 1.95 2.925
10 4.0 1.7 16 64 265 6.8 27.2
11 6.5 4.8 42.25 274.625 1785.0625 31.2 202.8
12 8.0 8.2 64 512 4096 65.6 524.8
13 6.0 4.5 36 216 1296 27 162
14 2.0 1.0 4 8 16 2 4
15 2.5 0.8 6.25 15.625 39.0625 2 5
16 7.5 7.5 56.25 421.875 3164.0625 56.25 421.875
17 7.5 6.2 56.25 421.875 3164.0625 46.5 348.75
18 3.5 1.0 12.25 42.875 150.0625 3.5 12.25
19 2.5 1.4 6.25 15.625 39.0625 3.5 8.75
20 3.0 1.2 9 27 81 3.6 10.8
S 97.0 67.9 547.5 3402.25 22465.875 415.35 2737.925
z diagramu korelacyjnego dla próbki
przypuszczamy, że linia regresji drugiego
rodzaju będzie parabolą
minimalizujemy funkcję
5[
2
59 54, 55, 56 = ,5f5V - 545e5V + 555e5V + 56 -2
5V<1
obliczamy pomocniczo:
1
5[ 2
5 = 5e5V - 5[
5e5V 2 =
5V<1 5V<1
5[
1
547.5 - 972 = 77.05
20
1
5[ 2
5ż = 5e5V 5f5V - 5[ 2 5[
5e5V 5V<1 5f5V =
5V<1 5V<1
5[
1
= 2737.925 - " 547.5 " 67.9 = 879.1625
20
1 1
5[ 3 2
5 = 5e5V - 5[
5e5V 5[ 5e5V = 3402.25 - " 547.5 " 97 = 746.875
5V<1 5V<1 5V<1
5[ 20
1 1
5[
5 = 5e5V5f5V - 5[
5e5V 5[ 5f5V = 415.35 - " 97 " 67.9 = 86.035
5V<1 5V<1 5V<1
5[ 20
2
1 1
5[ 4
5 = 5e5V - 5[ 2
5e5V = 22465.875 - " 547.52 = 7478.063
5V<1 5V<1
5[ 20
55ż;55 77.05"879.1625;746.875"86.035
54 = = = 0.1896,
55;52 77.05"7478.063;746.8752
55;5ż5 86.035"7478.063;879.1625"746.875
55 = = = -0.7215,
55;52 77.05"7478.063;746.8752
1 1 1 1
5[ 5[ 2 5[
56 = 5f5V - 54 5e5V - 55 5e5V = 67.9 + 0.7215 " 97 - 0.1896 " 547.5 = 1.7034
5V<1 5V<1 5V<1
5[ 5[ 5[ 20
parabola regresji drugiego rodzaju ma równanie 5f = 0.18965e2 - 0.72155e + 1.7034
54
2. Wyznacz linię regresji drugiego rodzaju cechy Y względem X w postaci 5f = + 55 na podstawie
5e
5e5V/5f5W 0.1 0.3 0.5 0.7 0.9
50-elementowej próbki, dla której sporządzono tablicę
1.5 - - 5 8 8
korelacyjną
2.5 - 4 4 - -
1
3.5 - 5 - - -
dokonujemy podstawienia 5b = , 5c = 5f i szukamy prostej
5e
4.5 3 1 - - -
regresji 5c = 545b + 55 cechy V względem cechy U
5.5 4 - - - -
dla zmiennych (U,V) budujemy tablicę korelacyjną
6.5 4 - - - -
7.5 4 - - - -
5b5V\5c5W 0.1 0.3 0.5 0.7 0.9 5[5V. 5b5V5[5V.
5b5V2 5b5V25[5V.
0.67 - - 5 8 8 21 14.07 0.4489 9.4269
0.4 - 4 4 - - 8 3.2 0.16 1.28
0.29 - 5 - - - 5 1.45 0.0841 0.4205
0.22 3 1 - - - 4 0.88 0.0484 0.1936
0.18 4 - - - - 4 0.72 0.0324 0.1296
0.15 4 - - - - 4 0.6 0.0225 0.09
0.13 4 - - - - 4 0.52 0.0169 0.0676
5[ .5W 15 10 9 8 8 50 21.44 11.6082
5c5W5[.5W 1.5 3 4.5 5.6 7.2 21.8
0.01 0.09 0.25 0.49 0.81
5c5W2
0.15 0.9 2.25 3.92 6.48 13.7
5c5W25[.5W
5b5V5[5V5W 2.5 3.27 4.95 5.36 5.36
5V
5c5W 5V 5b5V5[5V5W 0.25 0.981 2.475 3.752 4.824 12.282
dokonujemy obliczeo
1 1
5Y 5Z
5b = 5b5V5[5V. = 0.4288, 5c = 5c5W5[ .5W = 0.436
5V<1 5W<1
5[ 5[
5Y 5Z
1 1
2 2
5`5H = 5b5V25[5V. - 5b2 = 0.0483, 5`5H = 0. 2198, 5`5I = 5c5W25[ .5W - 5c2 = 0.0839, 5`5I = 0.2897
5[ 5[
5V<1 5W<1
1
5Z
5P5\5c 5b, 5c = 5c5W 5Y 5b5V5[5V5W - 5b5c = 0.0587,
5W<1 5V<1
5[
5P5\5c(5b, 5c)
a = = 1.2153, 5Ż = 5c - a5b = -0.0851
2
5`5H
równanie prostej regresji cechy V względem U ma postad 5c = 1.21535b - 0.0851
wracając do starych zmiennych otrzymujemy równanie linii regresji drugiego rodzaju cechy Y
1.2153
względem X w postaci 5f = - 0.0851
5e
Def. Jeżeli 5f = 5S(5e) jest linią regresji drugiego rodzaju cechy Y względem X wyznaczoną na
podstawie próbki (5e5V, 5f5V), i=1,& ,n, to współczynnikiem zgodności nazywamy wielkośd
5[
,5f5V - 5S 5e5V -2
5V<1
52 =
5[
,5f5V - 5f-2
5V<1
a współczynnikiem korelacji krzywoliniowej (wskaznikiem korelacji) liczbę
! = 1 - 52
Współczynnik 52 (0 d" 52 d" 1) określa zgodnośd wyznaczonej linii regresji 5f = 5S(5e)
z wartościami w próbce: zgodnośd tym lepsza im 52 jest mniejszy.
5Z 5Y
,5f5W;5S 5e5V -25[5V5W
5W=1 5V=1
Uwaga: Dla danych z tablicy korelacyjnej obliczamy 52 =
5Z
(5f5W;5f)25[ .5W
5W=1
Jeżeli 5S 5e = 5N5e + 5O, to !2 = 5_2 (współczynnik korelacji krzywoliniowej jest uogólnieniem
współczynnika korelacji liniowej.
Def. Stosunkiem korelacyjnym cechy Y względem cechy X nazywamy statystykę
58,58 5L 5K - 58 5L -2
2
5;5L|5K = ,
5725L
a stosunkiem korelacyjnym cechy X względem cechy Y nazywamy statystykę
58,58 5K 5L - 58 5K -2
2
5;5K|5L = .
5725K
Stosunkiem korelacyjnym cechy Y względem cechy X wyznaczonym na podstawie próby
(5K5V, 5L5V), i=1,& ,n, dla której zbudowano tablicę korelacyjną (5K5V, 5L ), i=1,& ,l, j=1,& ,m nazywamy
5W
5Y 5Z
5Y
,5L5W;5L 5K5V -25[5V5W
,5L 5K5V ;5L-25[5V.
5V=1 5W=1
2 5V=1
statystykę 55L|5K = = 1 - , gdzie 5L 5K5V = 58(5L|5K5V)
5Z 5Z
(5L5W;5L)25[ .5W (5L5W;5L)25[ .5W
5W=1 5W=1
Analogicznie określamy stosunek korelacyjny cechy X względem Y
5Z 5Z 5Y
,5K 5L5W ;5K-25[ .5W ,5K5V;5K 5L5W -25[5V5W
5W=1 5W=1 5V=1
2
55K|5L = = 1 - , gdzie 5K 5L = 58(5K|5L )
5Y 5Y 5W
5W
(5K5V;5K)25[5V. (5K5V;5K)25[5V.
5V=1 5V=1
2 2 2 2
Stosunki 55L|5K i 55K|5L są wartościami statystyk 5;5L|5K i 5;5K|5L dla danych z próby.
2 2
Uwaga: Zachodzą nierówności 0 d" 55L|5K d" 1 oraz 5E2 d" 55L|5K (R jest współczynnikiem korelacji
wyznaczonym z próby). Przy tym
2
55L|5K = 0 E(Y|5K5V) = 5L, 5V = 1, & , 5Y tzn. linią regresji cechy Y względem X jest prosta 5f = 5L
mówimy wtedy, że cecha Y jest nieskorelowana z X
2
55L|5K = 1 E(Y|5K5V) = 5L , 5V = 1, & , 5Y, j = 1, & , m dla 5[5V5W `" 0 tzn. między cechami Y i X w próbie
5W
istnieje zależnośd funkcyjna 5L5V = 5S 5K5V , 5V = 1, & , 5[
Np.
5e5V\5f5W 1 2 3 4 5
2 2
1. Wyznacz stosunki korelacyjne 55L|5K i 55K|5L dla próby (5K5V, 5L5V),
1 3 - - - 3
i=1,& ,11, dla której zbudowano tablicę korelacyjną
2 - 2 - 2 -
1 1
5f(1) = 1 " 3 + 5 " 3 = 3, 5f(2) = 2 " 2 + 4 " 2 = 3,
3 - - 1 - -
6 4
1 1
5f(3) = 3 " 1 = 3, 5f = 1 " 3 + 2 " 2 + 3 " 1 + 4 " 2 + 5 " 3 = 3
1 11
2
czyli 55L|5K = 0 tzn. cecha Y jest nieskorelowana z cechą X
1 17
5e 1 = 1, 5e 2 = 2, 5e 3 = 3, 5e 4 = 2, 5e 5 = 1 oraz 5e = 1 " 6 + 2 " 4 + 3 " 1 =
11 11
(1;17)2"3:(2;17)2"2:(3;17)2"1:(2;17)2"2:(1;17)2"3
2 11 11 11 11 11
czyli 55K|5L = = 1 tzn. istnieje zależnośd funkcyjna
2
(1;17)2"6: 2;17 "4:(3;17)2"1
11 11 11
5e = 5S(5f) dla wartości cech X i Y w próbce (np. 5e = 3 - |3 - 5f|, 5f " *1,2,3,4,5+)
2. Wyznacz współczynnik zgodności cechy Y względem cechy X dla danych z próbki (5K5V, 5L5V),
i=1,& ,20, dla której zbudowano tablicę korelacyjną (tabela) jeżeli wiadomo, że linią regresji
drugiego rodzaju jest parabola 5f = 5S(5e) = 0.18965e2 - 0.72155e + 1.7034
20
1
5f = 5f5V = 3.395
5[
5V<1
5[
,5f5V - 5S 5e5V -2 2.2412
5V<1
52 = = = 0.0209
5[
,5f5V - 5f-2 107.289
5V<1
możemy więc powiedzied, że parabola regresji drugiego rodzaju cechy Y względem X całkiem
dobrze przybliża dane z próbki.
i 5e5V 5f5V 5f5V - 5f (5f5V - 5f)2 5S(5e5V) 5f5V - 5S(5e5V) (5f5V - 5S 5e5V )2
1 5.5 3.3 - 0.095 0.009 3.4706 - 0.1706 0.0291
2 3.5 1.5 - 1.895 3.591 1.5008 - 0.0008 0.0
3 6.5 3.7 2.305 5.313 5.0243 0.6757 0.0457
4 4.5 2.5 - 0.895 0.801 2.2961 0.2039 0.0416
5 5.0 2.8 - 0.595 0.354 2.8359 - 0.0359 0.0013
6 7.5 6.5 3.105 9.641 6.9572 - 0.4572 0.209
7 5.5 4.0 0.605 0.366 3.4706 0.5294 0.2803
8 4.5 2.0 - 1.395 1.946 2.2961 - 0.2961 0.0877
9 1.5 1.3 - 2.095 4.389 1.0478 0.2522 0.0636
10 4.0 1.7 - 1.695 2.873 1.851 - 0.151 0.0228
11 6.5 4.8 1.405 1.974 5.0243 - 0.2243 0.0503
12 8.0 8.2 4.805 23.088 8.0658 0.1342 0.018
13 6.0 4.5 1.105 1.221 4.2 0.3 0.09
14 2.0 1.0 - 2.395 5.736 1.0188 - 0.0188 0.0004
15 2.5 0.8 - 2.595 6.734 1.0847 - 0.2847 0.0811
16 7.5 7.5 4.105 16.851 6.9572 0.5428 0.2946
17 7.5 6.2 2.805 7.868 6.9572 - 0.7572 0.5734
18 3.5 1.0 - 2.395 5.736 1.5008 - 0.5008 0.2508
19 2.5 1.4 - 1.995 3.98 1.0847 0.3153 0.0994
20 3.0 1.2 - 2.195 4.818 1.2453 0.0453 0.0021
S 67.9 107.289 2.2412
Test istotności dla stosunku korelacyjnego
Badane cechy (X,Y) populacji generalnej mają dwuwymiarowy rozkład o nieznanych stosunkach
2 2
korelacyjnych 5;5L|5K i 5;5K|5L. Z populacji pobrano n-elementową próbkę (5K5V, 5L5V), i=1,& ,n, dla której
zbudowano tablicę korelacyjną (5K5V, 5L ), i=1,& ,l, j=1,& ,m
5W
2 2
1. Weryfikacją hipotezy 5;0: 5;5L|5K = 0 wobec hipotezy alternatywnej 5;1: 5;5L|5K `" 0 na poziomie
istotności a
2
55L|5K 5[;5Y
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 59 = " ma
2
1;55L|5K 5Y;1
rozkład Snedecora o (5Y - 1, 5[ - 5Y) stopniach swobody
zbiorem krytycznym jest przedział 5< = ,5S1;5, "), gdzie 5S1;5 jest kwantylem rzędu 1- a rozkładu
Snedecora o (5Y - 1, 5[ - 5Y) stopniach swobody
2
Na podstawie próbki wyznaczamy wartośd statystyki 55L|5K z próbki, a następnie wartośd 59(5e5V, 5f5V).
Jeżeli 59(5e5V, 5f5V) " 5<, to hipotezę 5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, a jeżeli
59(5e5V, 5f5V) " 5<, to nie ma podstaw do odrzucenia hipotezy 5;0.
2 2
2. Weryfikacją hipotezy 5;0: 5;5K|5L = 0 wobec hipotezy alternatywnej 5;1: 5;5K|5L `" 0 na poziomie
istotności a
2
55K|5L 5[;5Z
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 59 = " ma
2
1;55K|5L 5Z;1
rozkład Snedecora o (5Y - 1, 5[ - 5Y) stopniach swobody
zbiorem krytycznym jest przedział 5< = ,5S1;5, "), gdzie 5S1;5 jest kwantylem rzędu 1- a rozkładu
Snedecora o (5Y - 1, 5[ - 5Y) stopniach swobody
2
Na podstawie próbki wyznaczamy wartośd statystyki 55K|5L z próbki, a następnie wartośd 59(5e5V, 5f5V).
Jeżeli 59(5e5V, 5f5V) " 5<, to hipotezę 5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1, a jeżeli
59(5e5V, 5f5V) " 5<, to nie ma podstaw do odrzucenia hipotezy 5;0.
Np. Z populacji, w której badane cechy (X,Y) mają pewien dwuwymiarowy rozkład pobrano
50-elementową próbkę i sporządzono dla niej tablicę korelacyjną o 5Y = 7 klasach dla cechy X
2
i 5Z = 5 klasach dla cechy Y, a następnie wyliczono stosunki korelacyjne 55L|5K = 0.1535 oraz
2
55K|5L = 0.1313. Na poziomie istotności a = 0.05 zweryfikuj hipotezę o braku korelacji pomiędzy
cechami X i Y.
2
Na poziomie istotności a = 0.05 weryfikujemy hipotezę pomocniczą 5;0: 5;5L|5K = 0 wobec hipotezy
2
alternatywnej 5;1: 5;5L|5K `" 0 i w przypadku braku podstaw do odrzucenia hipotezy 5;0 weryfikujemy
2 2
hipotezę 5>0: 5;5K|5L = 0 wobec hipotezy alternatywnej 5>1: 5;5K|5L `" 0.
Jeżeli chociaż jedna z hipotez 5;0 i 5>0 zostanie odrzucona, to odrzucamy też hipotezę o braku
korelacji pomiędzy cechami X i Y.
2
55L|5K 5[;5Y 0.1535 43
wyznaczamy wartośd 59 5e5V, 5f5V = " = " = 1.2996
2
1;55L|5K 5Y;1 0.8465 6
z tablicy kwantyli rozkładu Snedecora o (6,43) stopniach swobody odczytujemy 5S0.95 = 2.33
ponieważ 59 5e5V, 5f5V " ,2.33, "), to nie ma podstaw do odrzucenia hipotezy 5;0
2
55K|5L 5[;5Z 0.1313 45
wyznaczamy wartośd 59 5e5V, 5f5V = " = " = 1.7004
2
1;55K|5L 5Z;1 0.8687 4
z tablicy kwantyli rozkładu Snedecora o (4,45) stopniach swobody odczytujemy 5S0.95 = 2.59
ponieważ 59 5e5V, 5f5V " ,2.59, "), to nie ma podstaw do odrzucenia hipotezy 5;0, a tym samym
nie ma też podstaw do odrzucenia hipotezy o braku korelacji pomiędzy cechami X i Y.
Test liniowości regresji
2
Równośd 5;5L|5K - 5 2 = 0 zachodzi wtedy i tylko wtedy, gdy linia regresji pierwszego rodzaju cechy
Y względem X jest linią prostą.
Dana jest populacja generalna, w której badane cechy (X,Y) mają pewien dwuwymiarowy rozkład
2
o nieznanych współczynniku korelacji r i stosunku korelacyjnym 5;5L|5K. Z populacji pobrano
n-elementową próbkę (5K5V, 5L5V), i=1,& ,n, dla której zbudowano tablicę korelacyjną (5K5V, 5L ), i=1,& ,l,
5W
j=1,& ,m
2 2
Weryfikujemy hipotezę 5;0: 5;5L|5K - 5 2 = 0 wobec hipotezy alternatywnej 5;1: 5;5L|5K - 5 2 `" 0 na
poziomie istotności a
2
55L|5K;5E2
5[;5Y
wykorzystujemy fakt, że przy założeniu prawdziwości hipotezy 5;0 statystyka 59 = " ma
2
1;55L|5K 5Y;2
rozkład Snedecora o (5Y - 2, 5[ - 5Y) stopniach swobody
zbiorem krytycznym jest przedział 5< = ,5S1;5, "), gdzie 5S1;5 jest kwantylem rzędu 1- a rozkładu
Snedecora o (5Y - 2, 5[ - 5Y) stopniach swobody
2
Na podstawie próbki wyznaczamy wartośd statystyk 55L|5K i 5E z próbki, a następnie wartośd
59(5e5V, 5f5V). Jeżeli 59(5e5V, 5f5V) " 5<, to hipotezę 5;0 odrzucamy na korzyśd hipotezy alternatywnej 5;1,
a jeżeli 59(5e5V, 5f5V) " 5<, to nie ma podstaw do odrzucenia hipotezy 5;0.
Analogicznie badamy prostoliniowośd regresji cechy X względem cechy Y
Np. . Z populacji, w której badane cechy (X,Y) mają pewien dwuwymiarowy rozkład pobrano
50-elementową próbkę i sporządzono dla niej tablicę korelacyjną o 5Y = 7 klasach dla cechy X
2
i 5Z = 5 klasach dla cechy Y, a następnie wyliczono stosunek korelacyjny 55L|5K = 0.67 oraz
wartośd 5_ = 0.75 statystyki 5E. Na poziomie istotności a = 0.05 zweryfikuj hipotezę o
prostoliniowości regresji cechy Y względem X.
2
na poziomie istotności a = 0.05 weryfikujemy hipotezę 5;0: 5;5L|5K - 5 2 = 0 wobec hipotezy
2
alternatywnej 5;1: 5;5L|5K - 5 2 `" 0
2
55L|5K;5_2
5[;5Y 0.67;0.752 43
wyznaczamy wartośd 59 5e5V, 5f5V = " = " = 2.8
2
1;55L|5K 5Y;2 1;0.67 5
z tablicy kwantyli rozkładu Snedecora o (5,43) stopniach swobody odczytujemy 5S0.95 = 2.48
ponieważ 59 5e5V, 5f5V " ,2.48, "), to hipotezy 5;0 o prostoliniowości regresji odrzucamy na korzyśd
hipotezy alternatywnej.


Wyszukiwarka

Podobne podstrony:
IS3 wyklad7
IS3 wyklad9
IS3 wyklad4
IS3 wyklad1
IS3 wyklad5
IS3 wyklad8
IS3 wyklad6
Sieci komputerowe wyklady dr Furtak
Wykład 05 Opadanie i fluidyzacja
WYKŁAD 1 Wprowadzenie do biotechnologii farmaceutycznej
mo3 wykladyJJ
ZARZĄDZANIE WARTOŚCIĄ PRZEDSIĘBIORSTWA Z DNIA 26 MARZEC 2011 WYKŁAD NR 3
Wyklad 2 PNOP 08 9 zaoczne

więcej podobnych podstron