Katedra Statystyki
Akademia Ekonomiczna w Katowicach
Wykład 8
Zmienne losowe
Definicja: Zmienna losowa X to funkcja spełniająca warunki:
1) Określona
jest
na
zbiorze
zdarzeń
elementarnych i przyjmuje wartości rzeczywiste X : Ω → R
2) Funkcja X jest funkcją mierzalną względem ciała F
{w: w ∈ Ω , X (w) < k} ∈ F
Zmienna losowa skokowa - skończona, bądź
przeliczalna, liczba wartości ze zbioru liczb rzeczywistych R, które mają przyporządkowane dodatnie prawdopodobieństwa.
1
P X = x
p
0
k } =
k >
k
∑ p 1
k =
k
Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej spełnia warunki:
Λ f ( x) ≥ 0
∈
x R
∞
∫ f ( x) dx =1
−∞
Funkcja dystrybuanty
F(x) = P{X < x}
F ( x) = ∑ P{ X = x }
k
x
, dla zm. skok.
k < x
2
F(x) = ∫ f (t)dt
−∞
, dla zmiennych ciągłych
Momenty zmiennej losowej
Nadzieja matematyczna (wartość oczekiwana, średnia, przeciętna) zmiennej losowej X:
∑ x p
i
i − skokowe
E( X ) = ∞
∫ x f ( x) dx
−∞
Wariancja zmiennej losowej
D 2 ( X ) = E[ X − E( X )]2
∑( x
( ) 2
i − E X
) pi
i
D 2 ( X ) = ∞
∫( x − E( X ))2 f ( x) dx
−∞
Moment zwykły rzędu r
3
i
i
i
m =
r
∞
∫ xrf(x)dx
−∞
moment centralny rzędu r
∑(
r
x − m
i
1 ) p i
i
c =
r
∞
∫(
r
x − m
( )
1 ) f x dx
−∞
Szczególne przypadki: c1 = 0
c2 = D2(x)
Momenty centralne zestandaryzowane
λ
Cr
=
r
( C
2 )r
λ1 = 0
4
C
λ = ( r
r
C
2 ) r
2
D ( X ) = D( X ) = C 2
Odchylenie
standardowe
zmiennej
losowej.
Wskazuje o ile, średnio rzecz biorąc, wartości zmiennej losowej odchylają się od jej wartości oczekiwanej.
Dominanta
M = x :p = ma {
x p
d
d
k }
- skokowe
k
5
- ciągłe
Kwantyl
0 < p < 1
xp - kwantyl rzędu p zmiennej
losowej skokowej:
P{ X ≤ xp}≥ p
P{ X ≥ x 1
p }≥
− p
dla ciągłych zm. los.:
P{ X < x =
p }
p
lub
{
P X > x
=1−
p }
p
Kwantyl rzędu 0,5 - mediana
6
rozkład
prawdopodobieństwa
wyników
egzaminu:
0 5
,
x = 3
{
P X = }
x = 0 4
,
x = 4
0 1
,
x = 5
0 dla x ∈(−∞,3 >
,05dla x ∈( ,34 >
F(x) =
,
0 9 dla
x ∈(4,5 >
1 dla x ∈(5,+∞)
E(X) = 3⋅0,5 + 4⋅0,4 + 0,1⋅5 = 1,5 + 1,6 + 0,5 = 3,6
Średnio rzecz biorąc ocena z egzaminów wynosi 3,6 (wartość oczekiwana z egzaminu wynosi 3,6).
D2(X)=(3-3,6)2⋅0,5+(4-3,6)2⋅0,4+(5-3,6)2⋅0,1=0,44
D(x)≈0,7.
7
Własności funkcji dystrybuanty
1. Funkcja niemalejąca
2. Przynajmniej lewostronnie ciągła
lim
(
F x) = 0 ∧
lim
(
F x) = 1
3. Granica x→−∞
x→+∞
Rozklad hipergeometryczny:
Mamy urnę z kulami: B - białymi i C - czarnymi, C+B=N. Losujemy z niej n kul
B C
{
k n − k
P H = }
k =
N
n
B
N − n
B
B
E(H) = n
, D2 (H) =
1 −
N
(N − )
1 n N
N
8
Jeśli będziemy losować ze zwrotem kule do urny B
p =
oraz
N , to funkcja prawdopodobieństwa rozkładu dwumianowego ma postać:
{
n
P X
k} pk (1− p n−k
=
=
)
, k = ,
0 ,
1 2,...
n
k
gdzie wartości k zmiennej losowej Xn, to liczba wylosowanych kul białych.
E(Xn) = np, D2(Xn) = np (1 - p)
Jeśli n→∞ i p→0, tak że np=λ, to k
λ
lim {
P X
k
P Y
k
e−
=
=
=
=
λ
n
} {
}
n→∞
k!
p→0
Jest to funkcja prawdop. rozkładu Poissona.
E(Y) = λ,
D2(Y) = λ
9
Rozkład jednostajny ma funkcję gęstości:
1
dla
x ∈< a, b >
f (x
b
a
) = −
0
dla
x ∉< a, b >
f(x)
1
b −
a
a
b x
∆
∆
678 678
a x1 x1+∆ x2 x2+∆ b
Zakreskowane pole będzie const. dla dowolnych punktów x1, x2, takich, że xi≤b-∆.
10
P{x1 < X < x1 + ∆} = P{x2 < X < x2 + ∆}, x1 ≠ x2.
Niech czas oczekiwania na obsługę w Supersamie ma rozkład wykładniczy:
α e− x
α
dla
x
≥ 0
g(x) =
0
dla
x < 0
11
1
P{x < X < x + ∆ = ∫ ( )
=
1
1
}
f x dx
x
1
x
∆
1+
x1
= ∫ f(x)dx − ∫ f(x)dx = (
F x
∆
1 +
)− (Fx1)
−∞
−∞
Rozkład normalny
1
( x − µ)2
f ( x) =
exp−
,
σ 2π
2 2
σ
σ1
σ2 > σ1
µ
X ~ N (µ,σ ), µ = E( X ), D( X ) = σ
12
µ
µ
1
µ2
1 < µ2
Graniczne twierdzenie Lindeberga - Levye’go Założenia:
1. Zmienne losowe X1, X2, ..., Xn są niezależne 2. Każda z nich ma taki sam rozkład, przy czym Λ E( X
D X
i )
2
= µ ∧
( ) 2
= δ
i=
i
,
1 ..., n
Niech
X −
n
µ
1
Z
n, X
X
n =
= ∑ i
δ
n
i=1
13
lim P( Z < z =
= ϕ
n
) lim Fn( z) ( z)
n→∞
n→∞
,
gdzie Z ma rozkład normalny, standardowy, czyli Z ~ N(0,1)
lub
lim P( X < u =
=
n
) lim Fn( u) F( u) n→∞
n→∞
,
2
σ
N µ,
gdzie U ma rozkład normalny:
n .
u<-matrix(0,10000,1)
for (i in 1:10000) u[i]<-mean(runif(n,a,b)) hist(u)
14