1 Wykład pierwszy
1.1 Piśmiennictwo
" Oderfeld J.: Statystyczne podstawy prac doświadczalnych, Wydawnictwo Politechniki
Warszawskiej, 1990
" Plucińska A., Pluciński E.: Probabilistyka, WNT, Warszawa 2000
" Gajek L., Kałuszka M.: Wnioskowanie statystyczne, modele i metody. WNT 1996.
" Bobrowski D.: Probabilistyka w zastosowaniach technicznych, WNT 1986
" Majsnerowska Małgorzata: Elementarny wykład z rachunku prawdopodobieństwa
z zadaniami. Skrypt UW, Wrocław 2002.
" Zieliński R.: Tablice statystyczne, PWN, W-wa 1972.
" Pakiety komputerowe: MATLAB Statistical toolbox, Statistica, Statgraphics
1.2 Pojęcia wstępne
Prawdopodobieństwo:
Niech &! będzie zbiorem możliwych wyników w doświadczeniu losowym czyli
przestrzenią zdarzeń, elementy &! to zdarzenia elementarne. Podzbiór A " &! to zdarzenie, a
jego elementy to zdarzenia elementarne Ś zdarzenie niemożliwe, A' = &!\A zdarzenie
przeciwne, A )" B - jednocześnie zaszło A i B, A *" B - zaszło co najmniej jedno z nich. Jeśli
A )" B = Ś - zdarzenia się wykluczają.
Definicje:
1. &! = {1,2,...,n} - skończona przestrzeń zdarzeń
n
Funkcja P :i P(i) i = 1,2,..., n taka, że " P(i)e" 0 oraz
"P( )= 1, nazywa się
i
i
i
prawdopodobieństwem dyskretnym skończonym.
Dla dowolnego zdarzenia A " &! :
P(A)=
"P( )
1
(1.1)
{i:i " A}
Jeżeli
A
1
P(i)= i = 1,2,..., n ! P(A)=
(1.2)
n
Jest to klasyczna definicja prawdopodobieństwa.
Sprawdzamy, że:
a) P(A)e" 0
b) Prawdopodobieństwo sumy skończonej liczby zdarzeń parami wykluczających
się jest równe sumie prawdopodobieństw
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 1
c) P()= 1
PRZYKAAD 1.1
Zadanie (Bobrowski str. 101)
Dwie radiostacje tego samego typu położone w pewnej odległości od siebie mogą być nastrojone na
jedną z 10 częstotliwości. Jakie jest prawdopodobieństwo, że obie radiostacje nastrojone i włączone niezależnie
będą miały tę samą częstotliwość?
Rozwiązanie
, eij zdarzenie elementarne, że pierwsza radiostacja ma częstotliwość i
= {eij ,(i, j) = 1,2,K,10}
a druga ma j.
,
A = {eij ,i = j}
A
10
P(A)= = = 0,1"100% = 10%
100
Przypomnienie wzorów z kombinatoryki:
n
# ś#
Liczba kombinacji (podzbiorów k elementowych zbioru n-elementowego) k z n:
ś# ź#
ś#k ź#
# #
Liczba permutacji (możliwych wszystkich uporządkowań zbioru zbioru n elementowego): n!
Liczba wariacji bez powtórzeń (uporządkowań k elementowych wybranych ze zbioru n-elementowego bez
n
# ś# n!
możliwości powtórzeń):
ś# ź#k!=
ś#k ź#
(n - k)!
# #
Liczba wariacji z powtórzeniami (uporządkowań k-elementowych wybranych ze zbiorów n-elementowych z
możliwością powtórzeń) : nk
2. Jeżeli:
"
&! = {1,2,K} oraz P(i)e" 0 i = 1,2,K,
(1.3)
"P( )= 1.
i
i=1
to P jest prawdopodobieństwem dyskretnym nieskończonym.
3. Definicja nowoczesna
Dana niepusta rodzina F podzbiorów &! spełniająca warunki:
a) Jeśli: A" F , to A'" F
"
b) Jeśli Ai " F i = 1,2,K, to Ai " F
U
i
nazywa się ciałem.
W przypadku skończonego zbioru &!, ciało to rodzina wszystkich podzbiorów. Jest
to rodzina
Definicja
Funkcja rzeczywista P określona na podzbiorach przestrzeni &!, tworzących ciało F
mająca własności:
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 2
a. P(A)e" 0
" "
b. " Ai )" Aj = Ś i `" j to P( Ai) =
U "P(A )
i
i`" j
i=1 i=1
c. P()= 1
nazywa się prawdopodobieństwem.
Trójka (&!,F,P) to przestrzeń probabilistyczna, a własności a, b, c, to aksjomaty
prawdopodobieństwa.
Aatwo wykazać, że definicje 1 i 2 są szczególnym przypadkiem definicji 3.
Własności
a) A " B ! P(A)d" P(B) - monotoniczność
b) P(A')= 1- P(A), P(A)d" 1
c) P(A *" B)= P(A)+ P(B)- P(A )" B)
n n
# ś#
d) Pś# Ai ź# d"
U "P(A ) - nierówność Boole a
i
# i=1 # i=1
Dowody pomijamy (zobacz piśmiennictwo)
Prawdopodobieństwo warunkowe
Rozważmy doświadczenie losowe i zwiążmy z nim przestrzeń ( ,F,P). Jeśli
interesuje nas wynik doświadczenia należącego do podzbioru B " , dla którego P(B)>0 to
możemy zredukować wyjściową przestrzeń probabilistyczną do przestrzeni (B, FB, P(" B) ),
gdzie FB={ A)" B , A" F } oraz
P(A )" B)
P(A | B)= dla A" F
(1.4)
P(B)
Jest to prawdopodobieństwo warunkowe zdarzenia A pod warunkiem, że zaszło B lub
krócej, prawdopodobieństwem A pod warunkiem B.
Zauważmy, że wzór (1.4) jest równoważny zależności:
P(A )" B)= P(A | B)" P(B) o ile P(B)> 0
(1.5)
Prawdopodobieństwo całkowite
Jeżeli ciąg zdarzeń {Bi,i = 1,..., n} tworzy zupełny układ zdarzeń w przestrzeni
(tzw. rozbicie przestrzeni) tzn. spełnione są trzy warunki:
n
= , P(Bi)>0 oraz '" Bi )" Bj = Ś
UBi
i`" j
i=1
to dla dowolnego A" F zachodzi:
n
P(A)=
(1.6)
"P(A | Bi )"P(Bi )
i=1
Jest to wzór na prawdopodobieństwo całkowite.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 3
PRZYKAAD 1.2
Zadanie (ilustrujące wzór na prawdopodobieństwo warunkowe)
Podpatrzyliśmy , że ktoś wpisuje trzyliterowe hasło do komputera korzystając tylko z klawiszy a oraz
b. Ponadto zauważyliśmy, że pierwszy znak hasła jest litera a. Jaka jest szansa, że trafimy wybierając jako drugą
literę znak b i jako trzecią literę znak b ?
Rozwiązanie:
Zadanie rozwiążemy na dwa sposoby.
1. Zauważmy, że:
= {(a,a,a),(a,a,b),(a,b,a),(a,b,b),(b,a,a),(b,a,b),(b,b,a),(b,b,b)}
(a)
Rozważmy nową przestrzeń zdarzeń elementarnych S = {(a, a, a),(a, a,b),(a,b, a),(a,b,b)} i jej podzbiór
zdarzenie DS = {(a,b,b)}. W takim razie:
DS
1
P(DS ) = =
(b)
S 4
2. Wykorzystamy teraz wzór (1.4):
1
P(D )" S)
1
8
P(DS S) = = =
(b)
4
P(S) 4
8
A zatem wynik jest ten sam.
PRZYKAAD 1.3
Zadanie ( prawdopodobieństwo całkowite)
Student na zajęcia dojeżdża rowerem raz na dwa dni (zdarzenie R), autobusem raz na trzy dni
(zdarzenie A) oraz tramwajem raz na sześć dni (zdarzenie T). Jeśli jedzie rowerem spóznia się raz na 60
przypadków, jeśli autobusem raz na 20 przypadków, jeśli tramwajem raz na 10 przypadków. Jakie jest
prawdopodobieństwo spóznienia się studenta (zdarzenie S)?
Rozwiązanie
Drzewo modelu dendryt.
1/2 1/3 1/6
R rower
A autobus
T tramwaj
T
R A
S spóznienie
1/60 1/20 1/10
Z zdążenie
S Z S Z S Z
1 1 1 1 1 1 1
P(S)= P(S | R)" P(R)+ P(S | A)" P(A)+ P(S |T )" P(T )= " + " + " =
60 2 20 3 10 6 24
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 4
Wzór Bayesa
Przy założeniach poprzedniego twierdzenia dla dowolnego zdarzenie A" F takiego,
że P(A)> 0 . Zachodzi:
P(A | Bi )" P(Bi )
P(Bi | A)= i = 1,..., n
n
(1.7)
"P(A | Bi )" P(Bi )
i=1
Nomenklatura:
P(Bi|A) - prawdopodobieństwo a'posteriori1
P(Bi) - prawdopodobieństwo a'priori2
Wzór (1.7) nosi nazwę wzoru na prawdopodobieństwo przyczyny
PRZYKAAD 1.4
Zadanie
W magazynie znajdują się monitory komputerowe wyprodukowane w trzech różnych oddziałach firmy,
w tym: 50% z oddziału w Polsce (R), 30% z oddziału w Chinach (C), 20% z oddziału w Japoni (J). Wiadomo, że
prawdopodobieństwo wyprodukowania monitora wadliwego (plamki na ekranie) jest równe 0,05 dla oddziału
(R) i (C) oraz 0,12 dla oddziału w (J). Odbiór odbywa się na podstawie kontroli wyrywkowej. Załóżmy, że
wylosowany wyrywkowo monitor okazał się wadliwy, jakie jest prawdopodobieństwo, że jest to monitor
wyprodukowany w Polsce.
Rozwiązanie
a) a priori,
A - monitor jest wadliwy:
P(R) = 0,5 P(C) = 0,3 P(J) = 0,2
P(A|R) = 0,05 = P(A|C) P(A|J) = 0,12
b) a posteriori:
P(A | R)" P(R) 0,05" 0.5 0,025
P(R | A)= = = = 0,391
P(A | R)" P(R)+ P(A | C)" P(C)+ P(A | J )" P(J ) 0,05" 0.5 + 0,05" 0.3+ 0,12"0.2 0,064
Niezależność zdarzeń
Niech A, B " F będą zdarzeniami takimi, że P(A|B) =P(A), czyli zajście B nie zmienia
prawdopodobieństwa zajścia A. Czyli A jest niezależne, od B tzn:
P(A )" B)= P(A)" P(B)
(1.8)
Uogólnienie:
Niech C będzie dowolną rodziną zdarzeń. Jeśli dla skończonej podrodziny {A1,A2,...,An}
zdarzeń z C spełniony jest warunek:
1
a'posteriori na podstawie faktów, z następstwa,
2
a'priori bez zapoznania się z faktami, uprzedzając fakty, przed doświadczeniem, z góry.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 5
n n
# ś#
Pś# Ai ź# =
(1.9)
I "P(A )
i
# i=1 # i=1
to C nazywamy rodziną zdarzeń niezależnych.
Uwaga:
Niezależność wg wzoru (1.9) jest własnością silniejszą, niż niezależność parami.
PRZYKAAD 1.5
Zadanie
Mamy dużą partię uszkodzonych dysków. Dyski są uszkodzone bo ź z nich piszczy, ź pracuje
niestabilnie, 1/4 się grzeje a ź ma wszystkie wymienione wady. Niech: A zdarzenie, że pierwszy losowo
wybrany dysk piszczy a B i C, że pracuje niestabilnie lub się grzeje. Czy zdarzenia A, B i C stanowią rodzinę
zdarzeń wzajemnie niezależnych?
Rozwiązanie
1
P(A)= P(B)= P(C)=
2
1
P(A )" B)= P(A )" C)= P(B )" C)=
4
P(A )" B)= P(A)" P(B); P(A )" C)= P(A)" P(C); P(B )" C)= P(B)" P(C);
1 1
= P(A )" B )" C)`" P(A)" P(B)" P(C)=
4 8
Czyli zdarzenia A, B i C nie stanowią rodziny zdarzeń wzajemnie niezależnych
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 6
2 Wykład drugi
2.1 Zmienna losowa jednowymiarowa.
Wezmy trojkę probabilistyczną ( ,F,P). Wprowadzimy definicję:
Funkcję X:&! R nazywamy zmienną losową jednowymiarową, jeśli dla
-1 -1
każdego a " R zbiór X ((- ",a)) jest zdarzeniem, czyli: X ((- ",a))" F . Realizacją
zmiennej losowej nazywa się wartość funkcji X w punkcie i oznacza małą literą x.
PRZYKAAD 2.6
Zadanie
Wezmy dyski komputerowe. Losujemy z partii jeden i sprawdzamy, czy jest sprawny. Jeśli jest
stawiamy 1 jeśli nie 0.
Rozwiązanie
, a zbiorem wartości jest zbiór {0,1}. Zmienna losowa przyjmuje wartość z pewnym
= {sp ,nsp}
prawdopodobieństwem.
W przypadku pomiarów fizycznych obarczonych błędem przypadkowym jako
zmienną losową przyjmuje się wprost funkcję, której realizacjami są wyniki pomiaru.
Rozkładem zmiennej losowej X nazywamy funkcję prawdopodobieństwa
przyporządkowującą zadanemu przedziałowi (- ", x) wartości P ({ : X ()< x}), gdzie P jest
funkcją prawdopodobieństwa.
PRZYKAAD 2.7
Zadanie
Dla danych z przykładu 2.6 zakładamy, że ,
P(sp)= 0,8 P(nsp)= 0,2
Rozwiązanie
Rozkład zmiennej losowej X definiuje się więc według wzoru:
0 gdy x d" 0
ż#
#0,2 gdy 0 < x d" 1
P(X < x) =
#
#1 gdy 1 < x
#
Uwagi
" Zmienne losowe przyjmujące tę samą wartość, ale z różnym prawdopodobieństwem (o
różnych rozkładach) uważamy za różne.
" W niektórych przypadkach wygodne jest posługiwanie się funkcją prawdopodobieństwa,
którą określa się na zbiorach punktowych w następujący sposób:
P(x)= P(X = x) (2.10)
Funkcję taką nazywa się funkcją prawdopodobieństwa zmiennej losowej X.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 7
2.2 Typy zmiennych losowych
W klasycznych wykładach rachunku prawdopodobieństwa i statystyki wyróżniamy zwykle:
1. Zmienne losowe typu skokowego (dyskretną) (oznaczymy SK)
2. Zmienną losową typu ciągłego (albo w skrócie ciągłą) (oznaczymy C)
3. Zmienne losowe mieszane
Zmienna typu skokowego (SK) przyjmuje ściśle określone, dyskretne wartości
liczbowe xi i = 1,2,3,... (może być skończone, albo nie), czyli P(X = xi ) = pi . Z własności
n "
prawdopodobieństwa pi = 1 dla zmiennej o skończonej liczbie wartości, oraz pi = 1
" "
i=1 i=1
gdy ma nieskończoną liczbę wartości.
Znając pary uporządkowane (xi, pi) mamy pełną informacje o rozkładzie zmiennej
losowej skokowej.
Funkcję prawdopodobieństwa skokowej zmiennej losowej można zapisać w postaci:
pi dla x = xi
ż#
P(x)= P(X = xi )=
(2.11)
#0 poza
#
Zmienna losowa typu ciągłego (C)
Mówimy, że zmienna losowa jest typu ciągłego jeżeli istnieje nieujemna funkcja f (x)
"
taka, że f (x)e" 0 , całka f (x) = 1 (lub f (x) = 1) i dla każdego przedziału x1, x2
+" +"
R -"
x2
P({ : x1 d" X () d" x2})= f (x)dx
(2.12)
+"
x1
Dystrybuanta
Dla zmiennej losowej X jest to funkcja (zwyczajowo oznaczana dużą literą F albo FX)
F:R 0,1 taka, że:
F(x)= P(X < x)
(2.13)
Własności dystrybuanty:
1. Dystrybuanta jest funkcją niemalejącą tzn: "x1, x2 " R x1 < x2 ! F(x1)d" F(x2)
2. "x1, x2 "R P(x1 d" X < x2)= F(x2)- F(x1)
3. lim F(x) = 1 lim F(x) = 0
x" x-"
4. Jest funkcją co najmniej lewostronnie ciągłą lim F(x) = F(x0)
-
xx0
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 8
PRZYKAAD 2.8
Zadanie
Narysować wykres dystrybuanty zmiennej losowej (SK) z przykładu 2.7
Rozwiązanie
0 gdy x d" 0
ż#
#0,2 gdy 0 < x d" 1
F(x) =
#
#1 gdy 1 < x
#
F(x)
1
0,8
0,2
x
0.2 1
Na ogół dystrybuanta nie jest w każdym punkcie ciągła prawostronnie, Różne zmienne
losowe mogą tę samą dystrybuantę. Jeśli X jest zmienną losową ciągłą to dodatkowo
zachodzą następujące własności dla dystrybuanty:
5. "x0 lim F(x) = F(x0) prawostronna ciągłość
+
xx0
6. "x0 "R P(X = x0)= 0
x2
7. "x1, x2 "R P(x1 d" X d" x2)= f (t)dt = F(x2) - F(x1)
+"
x1
8. W każdym punkcie ciągłości gęstości prawdopodobieństwa f(x) dystrybuanta F jest
dF(x)
różniczkowalna i: = f (x)
dx
Zwróćmy uwagę, że z uwagi 6 wynika, że fakt iż prawdopodobieństwo zdarzenia jest
równe zero nie oznacza, zdarzenie nie jest możliwe.
PRZYKAAD 2.9
Zadanie
ż#
cx3 0 d" x d" 1
Zmienna losowa (C) ma funkcję gęstości
f (x) =
#
#0 poza
Należy:
1. Obliczyć stałą c
2. Znalezć dystrybuantę
3. Narysować wykres gęstości i dystrybuanty
1 1
ś#
4. Znalezć
P#- d" x d"
ś# ź#
2 2
# #
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 9
Rozwiązanie
1
c
3
Ad 1. Ponieważ to:
f (x) = 1
+" +"cx dx = = 1 ! c = 4
4
R 0
0 dla x d" 0
ż#
x x
#
Ad 2. 3 4
F(x) = f (x) = dt = dla 0 < x < 1
+" +"4t #x
-" -" #1 dla x e" 1
#
Ad 3.
f(x) F(x)
4 1
x x
1 1
1
2
1 1
ś#
Ad 4.
1 1 1
P#- d" x d" = f (x)dx = F(12)- F(- )= =
ś# ź#
+"
2
24 16
2 2
# #
1
-
2
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 10
3 Wykład trzeci
3.1 Charakterystyki liczbowe zmiennych losowych
Rozkład zmiennej losowej może być jednoznacznie określony przez podanie
prawdopodobieństwa każdej możliwej wartości zmiennej losowej, bądz przez podanie
analitycznej postaci dystrybuanty lub gęstości prawdopodobieństwa. W praktyce zamiast
pełnej informacji o rozkładzie prawdopodobieństwa podaje się kilka charakterystycznych
parametrów, które opisują własności zmiennych losowych. Do najważniejszych
charakterystyk należą miary położenia i miary rozrzutu. Do miar położenia należą wartość
oczekiwana i kwantyle (w szczególności mediana i kwartale) natomiast do miar rozrzutu
wariancja i odchylenie standardowe. Ponadto omówimy pojęcia momentów zwykłych i
centralnych.
Wartość oczekiwana ( inaczej nadzieja matematyczna, wartość przeciętna, wartość średnia)
Wartość oczekiwana to jest liczba określona wzorem:
ż#
"x pi (SK)
i
# i
E(X )=
# (3.14)
xf (x)dx (C)
#
+"
#R
o ile szereg i całka są bezwzględnie zbieżne.
Uwaga
W piśmiennictwie wartość oczekiwaną zapisuje się EX, E[X] lub E(X). Przyjmiemy
zapis E(X).
W przypadku jeśli funkcja Y jest funkcją złożoną X tzn. Y = g(X) to wartość
oczekiwaną oblicz się ze wzoru:
ż#
"g(x )pi (SK)
i
# i
E(Y )= E[g(X )]=
# (3.15)
g(x)f (x)dx (C)
#
+"
#R
PRZYKAAD 3.10
Zadanie
Dana jest zmienna losowa (SK) określona następująco (funkcja prawdopodobieństwa):
1
ż#
dla x1 = 2; x2 = -1; x3= 4; x4 = -5; x5 = 3; x6 = -4
#
P(X = xi ) =
6
#
#0 pozostało
#
Należy obliczyć wartość oczekiwaną zmiennej losowej X.
Rozwiązanie
6
1 1
E(X )= pi = (2 -1+ 4 - 5 + 3- 4)= -
"xi
6 6
i=1
Wynik można interpretować następująco.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 11
Gramy w kości, jeśli wypadnie 1 to dostajemy 2 zł, jeśli wypadnie 2 to płacimy 1 zł, jeśli wypadnie 3 to
dostajemy 4zł, itd. W grę gramy bardzo długo. Pytanie jaka jest średnia wygrana przypadająca na grę?
n n
(2 -1+ 4 - 5 + 3 - 4) -
1
6 6
= = -
n n 6
PRZYKAAD 3.11
Zadanie
Podamy analogię mechaniczną do wartości oczekiwanej.
Pytanie: Jakie jest położenie środka masy układu?
m3
m1
m2
x
x1
x2
Rozwiązanie
Masa układu wynosi ,
M =
"mi
i
mi
Więc położenie środka ciężkości można wyznaczyć jako:
M " xc = xi ! xc = " xi
"mi "
M
i i
mi
Wyrażenie jest odpowiednikiem , bo
pi mi =1
"
M M
i
Własności wartości oczekiwanej
Ponieważ wartość oczekiwana jest określana jako suma lub całka, to ma następujące
własności:
1) gdy X = c (c " R) to
E(X )= E(c)= c
(3.16)
2) Dla dowolnych stałych ai " R i = 1,2,...n
n n
#
Eś# Xi ź# = E(Xi )
(3.17)
"a ś# "a
i i
# i=1 # i=1
Momenty zmiennej losowej
Momentem zwykłym rzędu k (k " N) zmiennej losowej X nazywamy liczbę
k
mk = E(X ) tzn.
k
ż#
pk (SK)
"xi
#
i
mk =
# (3.18)
xk f (x)dx (C)
#
+"
#R
Jeśli suma i całka istnieją
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 12
1
Dla k = 1 m1 = E(X )= E(X ) jest momentem rzędu pierwszego. Jest widoczne, że
moment rzędu pierwszego jest wartością . Czasem stosuje się oznaczenie m1 = ź .
Momentem centralnym rzędu k zmiennej losowej X nazywamy liczbę:
k k
źk = E{[X - E(X )] }= E[(X - ź) ]
(3.19)
Moment centralny rzędu 2, ź2 nazywamy wariancją i oznaczamy D2(X ), czasem
Var(X ). Pierwiastek kwadratowy z wariancji nazywany odchyleniem standardowym
i oznaczamy .
2
= D2(X ) lub = D2(X )
(3.20)
Można zauważyć, że:
k
2 2
ź2 = = D2(X )= E[(X - ź) ]= E(X - 2Xź + ź2)=
(3.21)
2 2
E(X )- 2źE(X )+ E(ź2)= m2 - m1
Własności wariancji
1) Gdy X = c (c " R) to D2(X )= D2(c)= 0
2) Jeżeli c jest dowolną stałą to D2(cX )= c2D2(X )
(3.22)
3) Jeśli c " R to D2(X + c)= D2(X ) (przesunięcie)
Wariancja i odchylenie standardowe są miarą rozproszenia zmiennej losowej.
PRZYKAAD 3.12
Zadanie
W teorii niezawodności i w teorii masowej obsługi stosuje się zmienne losowe o rozkładzie
wykładniczym. Są to zmienne losowe ciągłe o funkcji ciągłości określonej wzorem:
f(x)
x
0
0 x < 0
ż#
f (x) =
#e-x x e" 0 i > 0
#
Należy obliczyć wartość oczekiwaną i odchylenie standardowe zmiennej losowej o rozkładzie wykładniczym.
Rozwiązanie
Wartość oczekiwana (całkowanie przez części)
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 13
T
" "
x 1 1
-x
E(X )= xf (x)dx = dx = limĄ#- e-x - e-x ń# = =
+" +"xe ó#
T "
2 Ą# 2
Ł# Ś#0
0 0
bo:
e-x
u = x e-x x 1
xe-xdx = = - e-x - dx = - e-x - e-x
+" +"
2
v = x
Wariancja:
2 2
ź2 = = D2(X ) = m2 - m1
T
" " "
Ą# ń#
Ą# ń#
x2 x 2
2
E(X )= m2 = x2 f (x)dx = x2e-xdx = " ó#limó#- e-x Ą# + 2 e-xdxĄ# =
+" +" +"
ó#T " Ą#
Ł# Ś#0 Ś# 2
0 0 0
Ł#
2
2 1 1
# ś#
2 2
ź2 = = D2(X ) = m2 - m1 = - ś# ź#
=
2 # 2
#
Kwantyle
Liczbę xp (0 < p < 1) nazywamy kwantylem rzędu p zmiennej losowej X, gdy
spełnione są następujące warunki:
P(X d" xp)e" p oraz P(X e" xp)e" 1- p
(3.23)
Nierówności (3.23) nie wyznaczają kwantyli jednoznacznie. Jeżeli zmienna losowa jest ciągła,
to kwantyl rzędu p można wyznaczyć z równania: F(xp)= p .
Kwantyl rzędu nazywa się medianą, a kwantyle rzędu ź i nazywa się kwartynami
(czasem kwartylami rzędu 1 i 3).
Graficzna interpretacja kwantyli
f(x)
Pole równe p Pole równe 1-p
x
0
xp
Pole równe p tzn. F(xp)= p = P(X d" xp)
Pole równe 1- p tzn. P(X e" xp)
Rysunek 3.1 Graficzna interpretacja kwantyli
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 14
4 Wykład czwarty
4.1 Zmienna losowa dwuwymiarowa
Niech dana będzie trójka probabilistyczną ( ,F,P). Zmienna losowa dwuwymiarowa
(lub inaczej dwuwymiarowy wektor losowy) jest to uporządkowana para zmiennych
losowych (X,Y) określona na przestrzeni zdarzeń elementarnych (X ,Y ) : R2 . Zmienne
X, Y nazywa się składowymi wektora losowego. Rozkład prawdopodobieństwa zmiennej
dwuwymiarowej (X,Y) nazywa się łącznym rozkładem zmiennych losowych, a rozkłady
składowych wektora losowego nazywa się rozkładami brzegowymi.
Zwykle rozpatrujemy zmienne losowe skokowe (dyskretne) i ciągłe.
Zmienna losowa dwuwymiarowa skokowa
Jest to zmienna taka, że wszystkie składowe są dyskretnymi zmiennymi losowymi tzn
funkcja prawdopodobieństwa jest określona wzorem:
P(x, y)= P[( X ,Y ) = (x, y)].
(4.24)
Jeśli oznaczymy:
pij = P[(X ,Y )= (xi, yk )], i,k=1,2,&
(4.25)
to funkcja prawdopodobieństwa określa się wzorem:
pij x = xi i y = y
ż#
j
P(x, y)= przy czym pij = 1
#
"
(4.26)
ij
#0 poza
Zmienna losowa dwuwymiarowa typu ciągłego
Określa się ja na podstawie nieujemnej funkcji gęstości f(x,y) takiej, że:
f (x, y) e" 0 i f (x, y) = 1
+"+"
(4.27)
R2
Dystrybuanta dwuwymiarowej zmiennej losowej jest to funkcja F : R2 0,1 taka, że:
F(x, y) = P({ : X () < x,Y () < y}) = P(X < x,Y < y)
(4.28)
ż# pij (SK)
" "
#{i:xi < x }{j: y < y }
j
#
F(x, y) =
y
# x
(4.29)
#
+" +"f (u,v)dudv (C)
#
#-" -"
Dla zmiennej losowej ciągłej zachodzą własności:
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 15
d b
1. P(a d" X d" b,c d" Y d" d)= f (x, y)dxdy
+" +"
c a
"2F(x, y)
2. Fxy = = f (x, y) tam, gdzie f(x,y) ciągła
"x"y
Rozkład brzegowy
Rozkłady brzegowe zmiennych losowych powstają gdy interesuje nas rozkład jednej ze
składowych wektora losowego.
Definicje dla zmiennej losowej skokowej:
P(X = xi )= pi" = pij , P(Y = yi )= p" j = pij
" "
(4.30)
j i
Dla dwuwymiarowej zmiennej losowej (X,Y) typu ciągłego definiuje się rozkłady brzegowe
zmiennej za pomocą brzegowych gęstości prawdopodobieństwa:
fX (x) = f (x, y)dy
+"
(4.31)
R
analogicznie fY (y):
fY (y) = f (x, y)dx
+"
(4.32)
R
PRZYKAAD 4.13
Zadanie
Znalezć rozkłady brzegowe zmiennej losowej dwuwymiarowej (SK) określonej poniższą tabelką.
Rozwiązanie
Rozkłady brzegowe określono w ostatniej kolumnie i ostatnim wierszu tabeli.
xi
p" j
1 2 3
yj
1 0 1/6 1/6 1/3
2 1/6 0 1/6 1/3
3 1/6 1/6 0 1/3
pi" 1/3 1/3 1/3 1
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 16
PRZYKAAD 4.14
Zadanie
Zmienna losowa dwuwymiarowa ciągła określona jest funkcją:
ż#
e- x- y dla x, y > 0
f (x, y)=
#
#0 poza
Znalezć rozkłady brzegowe zmiennych X i Y.
Rozwiązanie
" "
f (x) = e-x- ydy = e-x e- ydy = e-x
X
+" +"
0 0
oraz przez symetrię:
"
- x - y
fY (y) = dx = e- y
+"e
0
PRZYKAAD 4.15
Zadanie
Dwuwymiarowa zmienna losowa ciągła ma funkcję gęstości:
y
ż#1- x - y
6
dla x, y " D
#
f (x, y)=
6
#
D
#0 poza
#
Należy wyznaczyć funkcje brzegowych gęstości porawdopodobeństwa: x
1
Rozwiązanie
Opis obszaru:
D :{(x, y): 0 d" x d" 1 i 0 d" y d" 6(1- x)}
albo
y
D :{(x, y): 0 d" y d" 6 i 0 d" x d" 1- }
6
Obliczenie rozkładów brzegowych:
6(1-x)
6(1-x) 6(1-x) 6(1-x)
y y Ą# ń#
y2
#1 ś#dy = - x)dy - # ś#dy = - x)y]6(1-x) 2
[(1 - = 3(1 - x)
f (x) = - x - ź# ś# ź#
ś#
X 0
+" +"(1 +" ó#12 Ą#
6 6
# # # #
Ł# Ś#0
0 0 0
y y
1- 1-
2
6 6
y
#1 ś#dx = Ą## y ś#x x2 ń# 1 #1 y ś#
fY (y) = - x - ź# - ź# - = - ź#
ś# ś#
+" ó#ś#1 6 2 Ą#
6
# #
Ł## # Ś#0 2 # 6 #
0
Wykresy rozkładów brzegowych:
fX(x) fY(y)
3
x y
1 6
Rozkłady warunkowe zmiennych losowych
Są to rozkłady jednych ze składowych wektora losowego pod warunkiem, że druga przyjęła
określoną wartość.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 17
Dla zmiennej losowej skokowej
pij
P(X = xi |Y = yi )= gdy p" j > 0
p" j
(4.33)
pij
P(Y = yi | X = xi )= gdy pi" > 0
pi"
Dla zmiennej losowej ciągłej
f (x, y0)
f (x |Y = y0) =
X
fY (y0)fY (y0)> 0
(4.34)
f (x0, y)
f (y | X = x0) =
X
fX (x0)fX (x0)> 0
PRZYKAAD 4.16
Zadanie
Wyznaczyć prawdopodobieństwa warunkowe P(X=xi|Y=yi) dla zmiennych losowych z przykładu 4.13.
Rozwiązanie
xi
1 2 3
yi
1 0 1/2 1/2
2 1/2 0 1/2
3 1/2 1/2 0
p11
Bo np.
P(X = x1 | Y = y1)= = 0
p" 1
p21 1
P(Y = y2 | X = x1)= =
p" 1 2
Niezależność zmiennych losowych
Zmienne losowe są niezależne (NZ) wtedy, gdy:
"i" P(X = xi |Y = yi )= P(X = xi )" P(Y = yi )= pi" " p" j (SK)
j
(4.35)
"x"y f (x, y) = fX (x)" fY (y) (C)
PRZYKAAD 4.17
Zadanie
Zbadać niezależność zmiennych losowych z przykładu 4.13.
Rozwiązanie
Zmienne losowe nie są niezależne, bo np. dla i=j=2 mamy:
p22 = 0
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 18
1 1
p" 2 = ; p2" =
3 3
1 1 1
p2" " p" 2 = " = `" 0 = p22
3 3 9
PRZYKAAD 4.18
Zadanie
Do danych z przykładu 4.15 sprawdzić, czy zmienne losowe są niezależne.
Rozwiązanie
1
Sprawdzmy dla i
y =1
x =
2
1 1 1 1
#
f ,1ś# =1- - =
ś# ź#
2 2 6 3
# #
1 3 25
# ś#
f = ; fY (1)=
ś# ź#
X
2 4 72
# #
1 3 25 1
# ś#
f " fY (1) = " `"
ś# ź#
X
2 4 72 3
# #
Czyli:
1 1
# ś# #
" "y=1 f " fY (1)`" f ,1ś#
ś# ź# ś# ź#
1 X
x=
2 2
# # # #
2
Charakterystyki liczbowe zmiennej losowej dwuwymiarowej
Moment zwykły rzędu (k,l) oznaczany mkl , gdzie k,l " N dwuwymiarowej zmiennej (X,Y)
jest to liczba określona wzorem:
k l
ż#
(y )
""(x ) pij (SK)
i j
#
i j
k l
mkl = E(X Y ) = jeśli szereg i całka są zbieżne
#
(4.36)
xk yl f (x, y)dxdy (C)
#
+"
2
#R
Aatwo zauważyć, że momenty zwykłe rzędu (1,0) oraz (0,1) są to średnie rozkładów
brzegowych
m10 = źX
m01 = źY
gdzie źX - średnia rozkładu brzegowego zmiennej X i źY to średnia rozkładu brzegowego
zmiennej Y.
Moment centralny
Moment centralny rzędu (k,l) gdzie k,l " N jest to liczba określona następująco:
k l
źkl = E[(X - m10) "(Y - m01) ]
(4.37)
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 19
Uwaga
2 2
Momenty centralne rzędu (2,0) i (0,2) są to wariancje , Y rozkładów brzegowych
X
zmiennych losowych X i Y.
Kowariancja i współczynnik koleracji
Moment centralny rzędu (1,1) nazywa się kowariancją zmiennych losowych X i Y i oznacza
Cov(X,Y) tzn:
Cov(X ,Y ) = ź11 = E[(X - m10)(Y - m01)]
(4.38)
Kowariancję można przedstawić jako funkcję momentów zwykłych:
Cov(X ,Y ) = E[(X - m10)(Y - m01)]= E(XY - Xm01 - m10Y + m10m01) =
(4.39)
= m11 - m10m01 = E(XY ) - E(X )E(Y )
W wyprowadzeniu powyższych zależności wykorzystano własności wartości oczekiwanej.
Zauważmy, że:
Cov(X , X ) = D2X
(4.40)
Czasem w rachunku prawdopodobieństwa wprowadza się pojęcie zmiennych
standaryzowanych zdefiniowanych wzorem:
X ~
~ - źX Y - źY
X = , Y =
(4.41)
Y
X
Prawdziwe jest następujące twierdzenie:
Jeśli zmienne losowe są niezależne to E(XY)=E(X)E(Y) oraz Cov(X ,Y ) = 0.
Ale twierdzenie odwrotne nie jest prawdziwe. Ilustruje to poniższy przykład.
PRZYKAAD 4.19
Dana jest dwuwymiarowa zmienna losowa typu skokowego, której rozkład łączny opisany jest tabelką:
xi
p" j
6 8 10
yj
1 0.2 0 0.2 0.4
2 0 0.2 0 0.2
3 0.2 0 0.2 0.4
pi" 0.4 0.2 0.4 1
Obliczymy kowariancję. Kolejno:
3 3 3
m11 = y pij = 16 m10 = E(X ) = pi" = 6 " 0.4 + 8" 0.2 +10 " 0.4 = 8
""xi j "xi
i=1 j=1 i=1
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 20
3
m01 = E(Y ) = y p" j = 1" 0.4 + 2 " 0.2 + 3" 0.4 = 2
" j
j=1
Zatem: . Ale zmienne nie są niezależne bo np.:
Cov(X ,Y ) = m11 - m10m01 = 16 - 2 "8 = 0
oraz . Jest widoczne, że
p21 = 0 p2" = 0.2 i p" 1 = 0.4 p21 `" p2" p" 1
Współczynnikiem korelacji zmiennych losowych X i Y oznaczanym albo XY nazywamy
liczbę:
ź11 Cov( X ,Y )
= =
(4.42)
ź20ź02 X Y
Czasem w rachunku prawdopodobieństwa wprowadza się pojęcie zmiennych
standaryzowanych zdefiniowanych wzorem:
X ~
~ - źX Y - źY
X = , Y =
(4.43)
Y
X
Współczynnik korelacji można zdefiniować przy tych oznaczeniach następująco:
Cov(X ,Y )
~,Y
~)
= = Cov(X
(4.44)
XY
0 < < 1
= 0 y = 1 y
y
x
x x
-1< < 0 = -1
y y
x x
Rysunek 4.2 Przykładowe realizacje wektorów losowych dwuwymiarowych (X,Y) przy
rożnych wartościach współczynnika korelacji pomiędzy składowymi.
Współczynnik korelacji ma następujące własności:
" d" 1(o ile istnieje)
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 21
" = 1 wtedy i tylko wtedy gdy P(Y = aX + b) = 1
Z drugiej zależności wynika, że współczynnik korelacji może służyć jako miara liniowej
zależności zmiennych losowych X i Y.
Znaczenie wartości bezwzględnej i znaku współczynnika korelacji ilustruje rys. 4.2.
Mówimy, że zmienne losowe są nieskorelowane jeśli = 0 oraz, że są skorelowane
w przeciwnym przypadku (oczywiście to, że zmienne są nieskorelowane nie oznacza jeszcze,
że są niezależne).
Jeśli zmienne losowa Y jest funkcją liniową zmiennej X to prostą o równaniu:
y = ax + b
(4.45)
nazywamy prostą regresji.
Jeśli nie jest spełniony warunek = 1 to znaczy, że nie zachodzi równość P(Y = aX + b) = 1
to często szukamy takiej funkcji liniowej aby prawdopodobieństwo P(Y = aX + b) było
możliwie duże. Zazwyczaj przyjmuje się jako kryterium tzw. oczekiwany kwadratowy błąd
aproksymacji:
e = E[(Y - aX - b)2]
(4.46)
Wartości a i b, dla których e jest minimalne wyznaczają prostą nazywaną prostą regresji II
rodzaju.
Można pokazać, że współczynnik korelacji jest miarą dokładności, z jaka jedną zmienna
losową Y można aproksymować przez liniową funkcję innej zmiennej losowej, której
współczynniki dobrano tak aby błąd e był minimalny. Jeśli = 0 to błąd ten jest największy,
jeśli natomiast = 1 to jest najmniejszy.
Prawa zastrzeżone J.Frączek, Materiał na prawach rękopisu. Kopiowanie bez zgody autora zabronione. W razie wykrycia błędów proszę
o informację. fraczek@meil.pw.edu.pl . Wersja 07 Strona 22
Wyszukiwarka
Podobne podstrony:
MiTE wykład 1 7 wersjaMiTE Zadania seria 2 wersjaMiTE Zadania seria 2 wersjaplan nauczania technik informatyk wersja 1BHP styczeń 2011 odpowiedzi wersja xAM zaliczenie 4 styczeń 2012 i odpowiedzi wersja AInstrukcja Programowania Zelio Logic 2 wersja polskastrategia podatkowa wersja skrocona 9WYTYCZNE TCCC 2014 WERSJA POLSKAPsychologia spoĹ‚eczna WYKĹAD 13Podstawy Programowania Wersja Rozszerzonawięcej podobnych podstron