Momenty zmiennych losowych
1. Wartość średnia
Definicja Jeżeli jest zmienną losową dyskretną przyjmującą wartości
z
prawdopodobieństwami
to wartością średnią
zmiennej losowej nazywamy liczbę
W przypadku gdy różnych wartości zmiennej losowej dyskretnej jest nieskończenie wiele, suma staje się sumą nieskończonej liczby składników
Jeżeli
jest zmienną losową ciągłą opisaną przez gęstość p(x), to wartością średnią takiej zmiennej nazywamy liczbę
2. Wartość średnia iloczynu zmiennej losowej przez stałą jest równa iloczynowi wartości średniej tej zmiennej przez tą stalą, tj.
Dowód. Wykażemy słuszność twierdzenia dla zmiennej losowej dyskretnej przyjmującej wartości xk z prawdopodobieństwami
Iloczyn zmiennej losowej
oraz stałej „a" jest nową zmienną losową dyskretną. Oznaczmy tę zmienną symbolem
Zmienna losowa
przyjmuje K wartości
l,
wyrażających się przez wartości zmiennej losowej
.
Ponieważ zmienna losowa
przyjmuje wartość
wtedy i tylko wtedy, gdy zmienna losowa
przyjmuje wartość
, zatem
Wobec powyższego
3. Wartość średnia sumy zmiennych losowych jest równa sumie wartości
średnich tych zmiennych
Dowód. Twierdzenie udowodnimy przy założeniu, że
są zmiennymi losowymi dyskretnymi przyjmującymi skończoną liczbę wartości. W przypadku gdy zmienne te są ciągłe, dowód jest analogiczny.
Niech
przyjmuje wartości
, natomiast zmienna wartości
Zmienna losowa
przyjmuje wartości
z prawdopodobieństwami
Biorąc pod uwagę wzory na prawdopodobieństwa brzegowe:
mamy
wynikają dwa ważne wnioski.
Wniosek Wartość średnia kombinacji liniowej dowolnej skończonej liczby zmiennych losowych jest równa takiej samej kombinacji liniowej wartości średnich tych zmiennych,
Wniosek Niech zmienne losowe
mają jednakowe wartości średnie równe C
Wartość średnia średniej arytmetycznej tych zmiennych wynosi również C
4. Wartość średnia iloczynu niezależnych zmiennych losowych jest równa
iloczynowi wartości średnich tych zmiennych
Dowód. Twierdzenie to udowodnimy zarówno dla zmiennych losowych dyskretnych, jak i dla zmiennych losowych ciągłych. Najpierw zajmiemy się zmiennymi losowymi dyskretnymi.
Zmienna losowa dyskretna
Przyjmuje wartości
z prawdopodobieństwami
, a zatem
Twierdzenie Jeżeli zdarzenia
tworzą układ zupełny, to
Dowód. Niech
będzie zmienną losową dyskretną przyjmującą wartości Wówczas prawdopodobieństwa można wyrazić przez prawdopodobieństwa łączne
5. Średnia warunkowa zmiennej
przy warunku, że zaszło zdarzenie
, wyraża się wzorem
Wobec powyższego
Istnieje twierdzenie analogiczne do twierdzenia dla zmiennych losowych ciągłych. Dowód dla takich zmiennych jest podobny do dowodu przeprowadzonego wyżej. Niech teraz
jest zmienną losową ciągłą o gęstości prawdopodobieństwa
wówczas
Pod całką, obok gęstości prawdopodobieństwa pv(y) występuje średnia warunkowa zmiennej
przy warunku, że zmienna losowa ciągła
przyjęła wartość y.
Ogólnie możemy napisać
Gdzie oznacza operację uśredniania przy ustalonej wartości zmiennej
zaś o
oznacza uśrednianie po zbiorze wszystkich wartości zmiennej
Momenty zmiennych losowych
7. Wartość średnią
— przy czym
— nazywamy n-tym momentem zmiennej losowej
względem liczby a Wynika z tej definicji w szczególności, że omawiana poprzednio wartość średnia zmiennej losowej może być traktowana jako pierwszy moment zmiennej losowej względem zera.
Momenty względem zera bywają często skrótowo nazywane po prostu momentami. Tak więc momentem n-tego rzędu zmiennej losowej nazywamy średnią
W przypadku zmiennej losowej dyskretnej przyjmującej wartości
z
prawdopodobieństwami
mamy
Ze wzoru wynika również, że dla zmiennej typu ciągłego
Średnim odchyleniem kwadratowym zmiennej losowej X względem liczby a nazywamy pierwiastek arytmetyczny z wartości średniej
. W przypadku gdy a =EX, mamy średnie odchylenie kwadratowe względem wartości średniej, nazywane odchyleniem standardowym zmiennej X.
8.Odchylenie standardowe zmiennej X będziemy oznaczali przez a(X).
Kwadrat odchylenia standardowego nosi 9.nazwę wariancji zmiennej losowej
Oznaczać ją będziemy przez
. Tak więc
Wariancję można interpretować jako statystyczną miarę rozproszenia wartości zmiennej losowej w odniesieniu do wartości średniej.
Wariancja jest jednocześnie przykładem momentu centralnego. Ogólna definicja momentów centralnych jest następująca.
10. Momentami centralnymi są momenty względem wartości średniej
zmiennej losowej
Momenty te oznaczać będziemy przez
Bezpośrednio z tej definicji wynika, że wariancja jest drugim momentem centralnym zmiennej losowej. Pierwszy moment centralny dla wszystkich zmiennych losowych jest taki sam i wynosi zero. Oznacza to też, że pierwszy moment centralny nie dostarcza nam jakichkolwiek informacji o zmiennej losowej, w odróżnieniu od wariancji. Wariancja jest obok średniej jednym z najważniejszych momentów używanych do opisu zmiennych losowych. Dlatego wariancji poświęcimy nieco więcej uwagi. Rozpocznijmy od twierdzenia. Dla dowolnej wartości liczbowej a zachodzi równość
Dowód
Ostatnia równość wynika stąd, że ,
Wariancje zmiennych
oraz
gdzie c jest dowolną stałą są jednakowe
Dowód. W dowodzie wykorzystamy właściwość wariancji, opisaną za pomocą równości
11. Wariancja iloczynu zmiennej losowej przez stalą jest równa iloczynowi kwadratu stałej przez wariancję tej zmiennej
Dowód
Jeżeli istnieją wariancje zmiennych losowych niezależnych
to wariancja sumy tych zmiennych też istnieje i jest równa sumie wariancji poszczególnych zmiennych
12 Wariancja różnicy zmiennych losowych niezależnych jest równa sumie wariancji poszczególnych zmiennych. Dowód. Istotnie
czego należało dowieść Często spotykaną operacją odnoszącą się do zmiennych losowych jest operacja normowania (nazywana też operacją standaryzowania). W wyniku unormowania zmiennej X otrzymujemy zmienną K określoną przez funkcję liniową
Jak łatwo można sprawdzić, zmienna Scharakteryzuje się takim samym rozkładem jak zmienna X, ale jej wartość średnia jest równa zeru, natomiast wariancja wynosi jeden.
13. Rozkłady symetryczne. Zmienna losowa ma rozkład symetryczny, jeżeli istnieje taka wartość a, że dla dowolnego x, dystrybuanta spełnia relację
Po zróżniczkowaniu względem x otrzymujemy warunek, jaki musi spełniać gęstość prawdopodobieństwa rozkładu symetrycznego
Wartość a w ostatnich dwu wzorach nosi nazwę środka symetrii.
14.Kwantylem rzędu p zmiennej losowej typu ciągłego o dystrybuancie ciągłej F(x), przy czym p jest ustaloną liczbą zawartą w przedziale nazywamy liczbę xp
spełniającą równanie
Kwantylem rzędu p, przy czym
zmiennej losowej o dystrybuancie
F(x) nazywamy liczbą xp spełniającą warunek
Warunek powyższy można zapisać również przy pomocy prawdopodobieństw
15. Mediana zmiennej losowej
Kwantyl rzędu 1/2 nosi nazwę mediany. Medianę zmiennej losowej X będziemy oznaczać przez MeX
Można wykazać, że dla rozkładów symetrycznych mediana jest równa wartości średniej, a ta -jak wiemy -jest równa środkowi symetrii
Kwantyle dla p = 1/4 i p = 3/4 są nazywane odpowiednio kwantylami dolnym i górnym.
JEDNOWYMIAROWE ZMIENNE LOSOWE
16. Dystrybuanta zmiennej losowej
Dystrybuanta jest funkcją określoną w dziedzinie liczb rzeczywistych w przedziale od
do
Z definicji dystrybuanty wynika, że dystrybuanta jest funkcją niemalejącą. Przyjmując dowolne
oraz
takie, że
mamy
Ponieważ
, zatem
Prawdopodobieństwo, że zmienna losowa przyjmie wartość mniejszą niż
jest równe zeru, gdyż jest to prawdopodobieństwo zdarzenia niemożliwego. Wynika stąd, że
Zdarzenie polegające na tym, że zmienna losowa
przyjmie wartość mniejszą niż
, jest zdarzeniem pewnym, a zatem jego prawdopodobieństwo wynosi l. Oznacza to, że
Funkcja dystrybuanty zdefiniowana wzorem jest funkcją lewostronnie ciągłą, tj.
gdzie
Z przekształceń wynika że
Niech
wówczas
Przechodząc do granicy gdy
otrzymujemy
Z powyższego wynika, że jeżeli dystrybuanta
jest nieciągła dla argumentu
to jej uskok w tym punkcie wynosi
Pochodną dystrybuanty będziemy nazywać
17. gęstością prawdopodobieństwa zmiennej losowej i oznaczamy ją przez
Dla wyróżnionych argumentów dystrybuanta może nie być różniczkowalna. Wiąże się z tym podział zmiennych losowych na zmienne losowe ciągłe i zmienne losowe dyskretne.
18.Zmienna losowa jest typu ciągłego, jeżeli jej dystrybuanta
jest funkcją ciągłą i przeliczalna jest liczba argumentów, dla których nie jest ona różniczkowalna.
Z wykazanej poprzednio monotoniczności funkcji dystrybuanty wynika, że gęstość prawdopodobieństwa
nie może przyjmować wartości ujemnych.
Jest to jedna z dwu najważniejszych właściwości gęstości prawdopodobieństwa zmiennych losowych ciągłych. Całkując obydwie strony równości
w przedziale od
do
otrzymujemy
gdzie
Zmieniając z na
uzyskujemy tzw. warunek normaliacyjny, jaki spełnić musi gęstość prawdopodobieństwa dowolnej zmiennej losowej ciągłej
Prawdopodobieństwo przyjęcia przez zmienną losową
wartości z przedziału
wyraża się jako całka z gęstości prawdopodobieństwa,
i tej zmiennej losowej w tym przedziale.
Ze związku
mamy
Z
wynika również bezpośrednio, że dla zmiennej losowej ciągłej
Prawdopodobieństwo przyjęcia przez zmienną losową ciągłą dowolnej wyróżnionej wartości jest równe zeru. Zdarzenie takie nie jest jednak zdarzeniem niemożliwym
19. Zmienna losowa jest typu dyskretnego, jeżeli jej dystrybuanta jest typu schodkowego.
Punktami nieciągłości dystrybuanty są wartości, jakie może przyjmować zmienna ziarnista, a liczba punktów nieciągłości jest przeliczalna.
Warunek normalizacyjny dla zmiennych losowych dyskretnych; wymaga on, aby suma wszystkich prawdopodobieństw, z jakimi zmienna dyskretna przyjmuje swoje wartości, była równa jedności. Zbiór prawdopodobieństw P(X = xn) dla wszystkich n tworzy rozkład prawdopodobieństwa zmiennej losowej dyskretnej i jest opisany
20.MOMENTY ZM.LOSOWYCH
.Centralnym momentem mieszanym rzędu r + s zmiennych Xj, i Xj nazywamy średnią
Z definicji tej między innymi wynika, że:
przy czym
jest wariancją, natomiast
jest r-tym momentem centralnym zmiennej losowej
Wśród centralnych momentów mieszanych szczególne znaczenia mają momenty rzędu drugiego.
22. Momenty centralne
nazywamy współczynnikami kowariancji zmiennych
Przekształcając nieco wzór możemy wyrazić
21.współczynnik kowariancji
przez wartości średnie zmiennych
i
oraz średnią ich iloczynu
Współczynnik kowariancji zmiennych losowych statystycznie niezależnych jest równy zeru.
Jeżeli zmienne
są niezależne, to zgodnie z twierdzeniem
Współczynniki kowariancji
tworzą macierz. Macierz tę oznaczamy przez
i nazywamy macierzą kowariancji.
Ponieważ
zatem na przekątnej macierzy kowariancji mamy wariancje kolejnych zmiennych losowych.
Ze wzoru współczynnika kowariancji wynika bezpośrednio, że
Tak więc, macierz kowariancyjna jest macierzą symetryczną.
Mając do dyspozycji W-wymiarową zmienną losową
, utwórzmy zmienną Y będącą kombinacją liniową zmiennych
'. Jeżeli współczynniki kombinacji oznaczymy przez
, to Y wyraża się wzorem:
Z właściwości operacji uśredniania wynika, że wartość średnia zmiennej Y jest następująca:
Wyznaczmy teraz wariancję W(Y)
Pomijając pośrednie przekształcenia, otrzymujemy ostatecznie
Forma kwadratowa, mająca właściwość wyrażoną nierównością, nosi nazwę formy określonej dodatnio.
Tak więc forma kwadratowa
o współczynnikach będących elementami macierzy kowariancji jest formą określoną dodatnio.
Współczynnik
zdefiniowany wzorem: