ZMIENNA LOSOWA DWUWYMIAROWA CIĄGŁA
Zadanie: Niech zmienna losowa dwuwymiarowa (X,Y) ma rozkład jednostajny (równomoierny) na odszarze
wyznacz funkcję gęstości zmiennej losowej (X,Y);
Rozkład zmiennej losowej (X,Y) ma postać:
,
Trzeba wyznaczyć wartość stałej c, korzystając z tego, że:
W zadaniu
,
zatem z równania 4c=1 otrzymujemy c=1/4
i rozkład zmiennej losowej (X,Y) ma postać:
.
Dla tak zdefiniowanej funcji gęstości zmiennej losowej (X,Y) wykonaj następujące polecenia:
Wyznacz dystrybuantę zmiennej losowej (X,Y).
Dystrybuanta zmiennej losowej dwuwymiarowej ciągłej dla wartości zmiennej losowej (X,Y)=(x,y) wyraża się wzorem
,
Aby wyznaczyć dystrybuantę potrzebujemy podzielić obszar D na kilka podobszarów, a dokładniej, w przypadku tego zadania wystarczy 5 obszarów:
1) dla
lub
,
;
2) dla
, tzn.
,
.
3) dla
,
.
Szybciej można policzyć dystrybuantę korzystając z 2), podstawiając w miejsce y wartość 2 .
4) dla
,
Szybciej można policzyć dystrybuantę korzystając z 2), podstawiając w miejsce x wartość 1.
5) dla
,
Szybciej można policzyć korzystając z obliczeń w 2) lub w 3) lub 4).
Np. w 4) wystarczy za y wstawić wartość 2.
Zbierając obliczenia mamy dystrybuantę zmiennej losowej (X,Y):
.
Wyznacz gęstości brzegowe
Gęstości brzegowe wyznacza się ze wzorów:
.
Jeżeli obszar D zrzutujemy na oś OX, to otrzymamy przedział <-1,1>, zatem tylko na tym przedziale gęstość brzegowa zmiennej X będzie różna od 0 , poza tym przedziałem będzie zero, tzn.:
Dla
wartości y zmieniają się od 0 do 2, tzn.
,
więc
.
Zatem
jest to również rozkład jednostajny.
Analogicznie należy postąpić z rozkładem brzegowym względem Y:
Z rzutu obszaru D na oś OY otrzymujemy , że
. Zakres zmienności x dla tych y wynosi:
i wyliczamy funkcję gęstości na tym przedziale
.
Zatem
również rozkład jednostajny.
Wyznacz dystrybuanty brzegowe:
Dystrybuanty brzegowe wyrażone są wzorami:
(korzysta sie tutaj z funkcji gęstości zmiennej dwuwymiarowej)
lub
(należy zsumować wszystkie gęstości do momentu x (odpowiednio y) w rozkładach brzegowych zmiennej X (odpowiednio Y)) W obliczeniach stosowałam te wzory.
Wyznaczam dystrybuantę dla rozkładu brzegowego zmiennej X:
Wartości zmiennej losowej X dzielą się na 3 zbiory:
, zatem dla każdego zbioru trzeba oddzielnie wyznaczać dystrybuantę.
dla
,
dla
,
dla
,
, (co daje się szybko wyliczyć przy wykorzystaniu obliczeń z 2)- w miejsce x należy wstawić wartość 1.
Podsumowując:
Analogiczne rozumowanie przeprowadzam dla dystrybuanty brzegowej zmiennej Y:
Wartości zmiennej losowej Y dziele na zbiory:
i dla każdego zbioru oddzielnie wyznaczam dystrybuante brzegową:
dla
,
dla
,
dla
,
, (co daje się szybko wyliczyć przy wykorzystaniu obliczeń z 2)- w miejsce y należy wstawić wartość 2.
Podsumowując:
Czy zmienne losowe X i Y są niezależne?
Warunkiem koniecznym i wystarczającym niezależności zmiennych losowych X i Y jest jeden z warunków:
Ja sprawdzam to na podstawie drugiego warunku, czyli czy gęstość zmiennej dwuwymiarowej daje się wyrazić za pomocą iloczynu gęstości brzegowych.(Pierwszy warunek jest wyrażony dla dystrybuant odpowiednich rozkładów).
W tym przypadku odpowiedź jest pozytywna, bo jak stworzymy kombinacje wartości dla iloczynów gęstości brzegowych to otrzymamy 4 możliwości, wśród których tylko jedna ma gęstość różną od zera, tzn dla
i
,
.
W pozostałych przypadkach będzie zero.
Ponieważ zachodzi równość
, zatem zmienne losowe X, Y są niezależne.
Wyznacz wartości oczekiwane EX i EY
Wynik nie powinien być zaskoczeniem, bo rozkład brzegowy zmiennej losowej X jest jednostajny, zatem wartość oczekiwana będzie środkiem przedziału, na którym funkcja gęstości jest różna od zera.
To rozumowanie można zastosować do odgadnięcia wartości oczekiwanej dla zmiennej losowej Y. Zmienna ta też ma rozkład jednostajny, funkcja gęstości jest niezerowa na przedziale od zera do dwójki , zatem EY=1, co potwierdzają również rachunki:
.
Interpretacja wartości oczekiwanych:
EX=0 mówi, że zmienna losowa X przeciętnie będzie przyjmowała wartość 0,
Natomiast EY=1 mówi, że zmienna losowa Y przeciętnie będzie przyjmowała wartość 1.
Wyznacz macierz kowariancji
Jest to macierz postaci
gdzie
oznacza kowariancję zmiennych losowych X i Y .
Kowariancja informuje tylko o kierunku zależności między zmiennymi X oraz Y.
Jeżeli jej wartość jest dodatnia to mówimy o zależności dodatniej między zmiennymi X i Y (wraz ze wzrostem wartości zmiennej losowej X wartości zmiennej losowej Y też rosną),
natomiast jeśli jest to wartość ujemna to mamy zależność ujemną między zmiennymi X i Y (wraz ze wzrostem wartości X wartości Y będą malały).
W przypadku zera powiemy że zmienne nie są skorelowane.
Jest zależność między korelacją i nieazależnością zmiennych:
Jeśli zmienne losowe X i Y są niezależne, to są też nieskorelowane. Oznacza to, że dla zmiennych niezależnych cov(X,Y)=0.
Implikacja w drugą stronę nie zawsze jest prawdziwa, tzn. Nieskorelowanie zmiennych nie pociąga za sobą niezależności zmiennych losowych X i Y.
oznaczają wariancje zmiennych losowych X i Y.
Często wygodniej jest liczyć wariancję z następujących wzorów:
.
Aby policzyć kowariancję potrzebujemy wartość na E(XY), zatem:
.
W przypadku zmiennych niezależnych, a tak jest ze zmiennymi X i Y w tym zadaniu,
E(XY) można było policzyć prościej
.
Zatem cov(X,Y)=0, oznacza to, że zmienne X i Y nie są skorelowane.
Liczymy wariancje:
, wariancji nie interpretuje się.
Zatem
oznacza odchylenie standardowe zmiennej losowej X, które informuje nas o ile przeciętnie odchylają się wartości zmiennej losowej X od jej wartości oczekiwanej. Zatem w kontekście zadania : wartości zmiennej losowej X odchylają się od wartości oczekiwanej tej zmiennej równej zero przeciętnie o
.
Wariancję zmiennej losowej Y policzę z drugiego wzoru:
.
Potrzebuję obliczyć
,
zatem
i odchylenie standardowe zmiennej Y :
; oznacza ono, że wartości zmiennej losowej Y odchylają się od wartości oczekiwanej tej zmiennej równej 1 przeciętnie o
.
Zatem
Wyznacz współczynnik korelacji
Współczynnik korelacji wyraża się wzorem:
.
Może przyjmować wartości tylko z przedziału <-1,1>.
Współczynnik ten wyznacza kierunek i siłę korelacji między zmiennymi X i Y.
Wartości tego współczynnika bliskie 1 lub -1 oznaczają silną korelację między zmiennymi, natomiast wartości bliskie 0 oznaczają słabą korelację między zmiennymi.
W zadaniu
, jak już wcześniej wspomniano, brak jest korelacji między zmiennymi losowymi X i Y.
Wyzacz prostą regresji zmiennej losowej Y względem zmiennej losowej X
Wyraża się ona wzorem:
,
gdzie:
,
.
W zadaniu:
,
, zatem prosta regresji ma postać:
.
Zadania do samodzielnego rozwiązania:
Niech dwuwymiarowa zmienna losowa (X,Y) ma rozkład jednostajny na odszarze D:
1)
2)
3)
4) D jest kwadratem o wierzchołkach (1,0), (0,1), (-1,0), (0, -1)
5) D jest trójkątem o wierzchołkach (0,0), (4,4), (0,4)
6) D jest trójkątem ograniczonym prostymi:
,
,
.
Dla przykładów 1)-6) należy wykonać polecenia a)-i) z poprzedniego zadania.