386 V Elementy rut hunkn pra\\■dopodobleństwa
Warunkowa wartość oczekiwana P.(Y|x) jest funkcją zmiennej x. E(Y|x)sip(x).; funkcję tę nazywa się regresją ZL Y względem ZL X. Wykres tej funkcji na płaszczyźnie Oxy, czyli zbiór punktów postaci (x.y). gdzie y = E(Y|x), nazywa się linią regresji pierwszego rodzaju 7.1. Y względem 7.1. X (krócej: limą regresji Y X ). W przypadku dyskretnym ta „linia" regresji jest zbiorem izolowanych punktów postaci
Analogicznie definiuje się regresję oraz linię regresji pierwszego rodzaju 7.L X względem 7.1. Y (linię regresji X|Y )
PRZY KŁAD 78. a) Dla danych z przykładu 7.7.a) linia regresji Y|Xjcst zbiorem dwóch punktów {(0,~),(l.-j)} Podobnie zbiór
|(-ę.U).( |.1)J jest limą regresji X|Y.
bł Dla danych z przykładu 7.7.b) linia regresji Y'X jest odcinkiem prostej y --^x dla \e(0.v/2). Natomiast luk wykresu funkcji
x=2(y ♦ yv'2 -*-2)/3(y dla ye(0.^2) jest limą regresji XY ■
Zajmiemy się teraz przydatnością linii regresji. Załóżmy, że interesują nas waności ZL Y, ale dostępne są nam tylko obserwacje wartości ZL X. Jeśli istnieje zależność między ZL X i Y\ to pozostaje nam jedynie dobrać funkcję ę> i stosować przybliżenie Y«<p(X)oraz przy dobieraniu funkcji ę> zadbać i» minimalizację błędu tego przybliżenia Przyjmujemy, że funkcja »p ma być tak dobrana, aby wyrażenie h[Y-ę>(X)| osiągało minimum powodzi się, że wyrażenie to osiągu minimum, gdy jako funkcję tp ubierzemy warunkową wartość oczekiwaną h(Y|\>, tj gdy <p(x) = E(Y|x). Oznacza to. że (/ pr-stwem 1) dla każdej funkcji (p spełniona jest nierówność:
Na przykład dla danych z przykładu 7.7.H) mamy (z pr-stwem I):
przy dowolnej funkcji
NIEZALEŻNOŚĆ ZMIENNYCH LOSOWYCH Przypomnijmy: mówimy, żc ZL X. Y są niezależne, gdy dla dowolnych xgR y e R spełniona jest równość
(7.18) P(X<x.Y <y) = P(X<x) P( Y<y),
tj. gdy zdarzenia {w: X(co)<x| i |w: Y(w)<yJ są niezależne. Gdy warunek ten nic jest spełniony, to ZL X, Y nazywa się zależnymi.
lWIhKDZhNIE 7.4 (trzy warunki konieczne i wystarczające niezależności ZL).
1) ZL X i Y są niezależne wtedy i tylko wtedy, gdy dla dowolnych zbiorów AcR i BcR zdarzenia {to; X(u))eA|, {to; Y(m)eBj są niezależne, czyli
P(XeA.Y «=B)= P(X <-A)P(Y eB).
2) Niech (X,Y) oznacza WI S o punktach skokowych (x,.yJ i i skokach pl( Wówczas 7.L X i Y są niezależne wtedy i tylko wtedy, gdy dla każdego punktu skokowego (x,,y()
(7.19) P(X-x,,Y=yj) = P(X = x,)• P(Y = yj) czyli p(J p, pr
3) Niech (X,Y) oznacza Wl.C o GP f i brzegowych GP fx i fv Wówczas ZL X, Y są niezależne wtedy i tylko wtedy, gdy GP f WLC (X,Y) jest postaci:
(7.20) f(x,y)=fx(x) fv(y).
rWltRDZEMt 7.5. Jeżeli ZL X i Y są niezależne, to niezależne są również 7.L U = g(X) i Z= h(Y). czyli: funkcje niezależnych zmien-nych losowych są niezależnymi zmiennymi losowymi.
PRZYKŁAD 7.9 ZI X i Y z przykładu 7.1 są zależne, bo np. P(X= O.Y =())- 0.2* 0.4 0.4 = P( X = 0)P( Y = 0). Zauważmy, że punkty skokowe |(0,0), (0,1), (1.0). (I,l)| me należą do wykresów funkcji postaci y--gtx) lub x = h(x), bo np. argumentowi 0 należałoby przyporządkować dwie różne wartości funkcji: g(0) = 0 i gt0)=l. Zatem: -uleżnośc (dokładnie: stochastyczna zależność) 7.1. X / Y nie oznacza ich zależności funkcyjnej, tj nie oznacza istnienia funkcji g i h takich, ze Y = g(X) lub X = h(Y). ■