dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 1
5.3. Regresja I-ego rodzaju
( )
Niech 5K, 5L będzie dwuwymiarową zmienną losową, dla której istnieje kowariancja.
Niech 58(5L|5K = 5e) oznacza wartość przeciętną zmiennej losowej 5L pod warunkiem, że
zmienna losowa 5K przyjmuje wartość równą 5e, a 58(5K|5L = 5f) oznacza wartość
przeciętną zmiennej losowej 5K pod warunkiem, że zmienna losowa Y przyjmuje
wartość równą 5f.
( )
W przypadku dwuwymiarowej zmiennej losowej 5K, 5L skokowej mamy:
1
( | )
58 5L 5K = 5e5V = " 5f5W5C(5L = 5f5W|5K = 5e5V) = " 5f5W5]5V5W
5]5V.
5W 5W
dla tych 5e5V, dla których 5]5V. `" 0, oraz
1
58(5K|5L = 5f5W) = " 5e5V5C(5K = 5e5V|5L = 5f5W) = " 5e5V5]5V5W
5].5W
5V 5V
dla tych 5f5W, dla których 5].5W `" 0.
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 2
( )
W przypadku dwuwymiarowej zmiennej losowej 5K, 5L typu ciągłego mamy:
+" +"
1
( | ) ( | )
58 5L 5K = 5e = +" 5f5S 5f 5e 5Q5f = +" 5f5S(5e, 5f)5Q5f
5S1(5e)
-" -"
( )
dla tych 5e, dla których 5S1 5e `" 0, oraz
+" +"
1
( | ) ( | )
58 5K 5L = 5f = +" 5e5S 5e 5f 5Q5e = +" 5e5S(5e, 5f)5Q5e
5S2(5f)
-" -"
( )
dla tych y, dla których 5S2 5f `" 0.
( | ) ( | )
Zauważmy, że 58 5L 5K = 5e jest funkcją zmiennej 5e, a 58 5K 5L = 5f funkcją zmiennej 5f.
( | )
o Niech 58 5L 5K = 5e = 5Z1(5e) oraz
( | )
o 58 5K 5L = 5f = 5Z2(5f).
( )
Zbiór punktów w !2 o współrzędnych 5e, 5f spełniających równanie 5f = 5Z1(5e)
nazywamy linią regresji I-ego rodzaju zmiennej losowej 5 względem zmiennej
losowej 5.
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 3
( )
Zbiór punktów w !2 o współrzędnych 5e, 5f spełniających równanie 5e = 5Z2(5f)
nazywamy linią regresji I-ego rodzaju zmiennej losowej 5 względem zmiennej
losowej 5.
( )
o W przypadku, gdy 5K, 5L jest dwuwymiarową zmienną losową skokową to
powyższe zbiory składają się ze skończonej lub przeliczalnej liczby punktów.
o Dla dwuwymiarowej zmiennej losowej typu ciągłego linie regresji I-ego rodzaju
mają co najwyżej przeliczalną liczbę punktów nieciągłości.
Linie regresji I-ego rodzaju mają następującą własność:
o Średnie odchylenie kwadratowe zmiennej losowej 5L od pewnej funkcji 5T(5K)
[ ( )]2
zmiennej losowej 5K, czyli 58 5L - 5T 5K , jest najmniejsze, gdy funkcja ta z
prawdopodobieństwem 1 jest równa 5Z1(5K), a więc zachodzi
[ ( )]2 [ ( )]2
58 5L - 5Z1 5K = min 58 5L - 5T 5K
5T
o Podobnie dla linii regresji I-ego rodzaju zmiennej losowej 5K względem 5L
otrzymujemy
[ ( )]2 [ ( )]2
58 5K - 5Z2 5L = min 58 5K - ! 5L
!
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 4
Przykład 5.3.
( )
Dwuwymiarowa zmienna losowa 5K, 5L ma rozkład o gęstości
( )
0,2 5e + 25f dla 0 d" x d" 1 i 0 d" y d" 2,
( )
5S 5e, 5f = {
( )
0 dla pozostałych 5e, 5f .
Wyznaczyć równanie linii regresji I-ego rodzaju zmiennej losowej 5L względem 5K.
Wyznaczmy najpierw gęstość rozkładu brzegowego zmiennej losowej 5K.
2
+"
( ) ( )
dla 0 d" 5e d" 1
( ) ( )
5S1 5e = +" 5S 5e, 5f 5Q5f = {0,2 +" 5e + 25f 5Q5f = 0,4 5e + 2
0
-"
0 dla pozostałych 5e
Dla 0 d" 5e d" 1 mamy
1 +" 0,2 2 35e+8
( ) ( | )
5Z1 5e = 58 5L 5K = 5e = 5f5S(5e, 5f)5Q5f = 5f(5e + 25f)5Q5f = .
+"-" +"0
5S1(5e) 0,4(5e+2) 35e+6
35e+8
Zatem linią regresji I-ego rodzaju zmiennej losowej 5L względem 5K jest 5f = dla
35e+6
0 d" 5e d" 1 (wykresem jest łuk hiperboli).
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 5
5.4. Regresja II-ego rodzaju
Prostą regresji II-ego rodzaju zmiennej losowej 5 względem zmiennej losowej 5
nazywamy prostą o równaniu 5f = 5N5e + 5O, gdzie współczynniki 5N i 5O są tak dobrane, aby
średnie odchylenie kwadratowe zmiennej losowej 5L od zmiennej losowej 5N5K + 5O było
najmniejsze, czyli
[
58 5L - ( )]2 ( )
5N5K + 5O = 5X 5N, 5O = 5Z5V5[
( )
o Dla dowolnej dwuwymiarowej zmiennej losowej 5K, 5L , dla której istnieją
skończone i dodatnie wariancje 525K i 525L w rozkładach brzegowych istnieje
dokładnie jedna taka prosta 5f = 5N5e + 5O, gdzie
55L 55L
5N = 5 i 5O = 585L - 5 585K.
55K 55K
o Zatem równanie prostej regresji II-ego rodzaju zmiennej losowej 5L względem 5K ma
postać:
5f - 585L 5e - 585K
= 5 .
55L 55K
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 6
Prostą regresji II-ego rodzaju zmiennej losowej 5 względem zmiennej losowej Y
nazywamy prostą o równaniu 5e = 5P5f + 5Q, gdzie współczynniki 5P i 5Q są tak dobrane, aby
średnie odchylenie kwadratowe zmiennej losowej 5K od zmiennej losowej 5P5L + 5Q było
najmniejsze, czyli
[
58 5K - ( )]2 ( )
5P5L + 5Q = 5Y 5P, 5Q = 5Z5V5[
( )
o Dla dowolnej dwuwymiarowej zmiennej losowej 5K, 5L , dla której istnieją
2 2
skończone i dodatnie wariancje 55K i 55L w rozkładach brzegowych istnieje dokładnie
jedna taka prosta 5e = 5P5f + 5Q, gdzie
55K 55K
5P = 5 i 5Q = 585K - 5 585L.
55L 55L
o Zatem równanie prostej regresji II-ego rodzaju zmiennej losowej 5K względem 5L ma
postać:
5e - 585K 5f - 585L
= 5 .
55K 55L
Obie proste regresji II-ego rodzaju pokrywają się, gdy 52 = 1.
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 7
Przykład 5.4.
( )
Dwuwymiarowa zmienna losowa 5K, 5L ma rozkład prawdopodobieństwa podany
w następującej tabelce:
X\Y -1 0 1
1 1 1
0
8 4 8
1 3
1 0
8 8
Wyznaczyć prostą regresji II-ego rodzaju zmiennej losowej 5L względem zmiennej losowej 5K.
Rozkłady brzegowe:
1 1
( ) ( )
5C 5K = 0 = , 5C 5K = 1 = ,
2 2
1 1 1
( ) ( ) ( )
5C 5L = -1 = , 5C 5L = 0 = , 5C 5L = 1 =
4 4 2
1 1 1 1 1 1
585K = 0 " + 1 " = , 585K2 = 02 " + 12 " = ,
2 2 2 2 2 2
1 1
525K = 585K2 - ( )2 1 - = , 55K = =
585K = "1 1
2 4 4 4 2
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 8
1 1 1 1 1 1 3
(-1 " + 02 " + 12 " = ,
)2 1
585L = -1 " + 0 " + 1 " = , 585L2 =
4 4 2 4 4 4 2 4
1 11
525L = 585L2 - ( )2 3 - = , 55L = "11 "11
585L = =
4 16 16 16 4
1 1 1 1 3 1
( ) (-1 " + 0 " 0 " + 0 " 1 " + 1 "
) (-1 " + 1 " 0 " 0 + 1 " 1 " =
)
58 5K5L = 0 "
8 4 8 8 8 4
1 1 1 1
( ) ( )
565\5c 5K, 5L = 58 5K5L - 585K585L = - " =
4 2 4 8
1
565\5c(5K, 5L) 11
"
8
( )
5 = 5 5K, 5L = = =
55K55L 11
1 11
"
"
2 4
Równanie prostej regresji II-ego rodzaju zmiennej losowej 5L względem zmiennej losowej 5K:
5f - 585L 5e - 585K
= 5
55L 55K
1 1
5f - 5e -
11 1 1
"
4 2
= " , 5f = 5e +
1
11 2 2
11
"
2
4
dr Tomasz Walczyński Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 6. cz. I (26.03.2014 r.) 9
5.5. Dwuwymiarowy rozkład normalny
Zmienna losowa (5K, 5L) ma dwuwymiarowy rozkład normalny (oznaczenie:
(5K, 5L)~5A(55e, 55f, 55e, 55f, 5)), jeśli ma gęstość postaci:
2
( - 55e
)2 ( )
1 1 5e 25 5e - 55e (5f - 55f) (5f - 55f)
( )
5S 5e, 5f = exp {- [ - + ]}
2 2
2(1 - 52) 55e 55e55f 55f
2555e55f 1 - 52
"
(-1,1 .
)
gdzie 5e " 5E, 5f " 5E, 55e " 5E, 55f " 5E, 55e > 0, 55f > 0, 5 "
( )
Jeżeli 5K, 5L ~5A(55e, 55f, 55e, 55f, 5), to
5K~5A(55e, 55e) i 5L~5A(55f, 55f)
( )
5 5K, 5L = 5
5K i 5L są niezależne wtedy i tylko wtedy, gdy 5 = 0
Zbiory punktów w przestrzeni 5E2 o współrzędnych (5e, 5f) spełniających równania
5f-55f 5f-55f
5e-55e
= 5 oraz 5e-55e = 5 są odpowiednio liniami regresji I-ego rodzaju zmiennej
55f 55e 55e 55f
losowej 5L względem 5K oraz zmiennej losowej 5K względem 5L.
Wyszukiwarka
Podobne podstrony:
Podstawy edytorstwa wykład cz IIsciaga okb wyklad 3 cz 6Wykłady cz 6gleby wykłady cz 1WYKŁAD 5 cz 1Przykładowe zadania Kolokwium wykładowe i zaliczenie ćwiczeń sem IIWykład cz 2 Choroby zawodoweWyklad cz 22010 06 Wyklad 11 Filtrowanie NieznanySztuczna inteligencja wykład cz 1więcej podobnych podstron