Metody probabilistyczne i statystyka - egzamin
1. Definicja prawdopodobieństwa.
Jeżeli mamy Ω,S i spełnione są następujące warunki :
a) A∈S
P A≥0 (Jeżeli zdarzenie A zawiera się w rodzinie S to prawdopodobieństwo A jest
większe równe 0)
b)Ω P(Ω)=1 (Jeżeli istnieje zbiór zdarzeń elementarnych to prawdopodobieństwo Ω jest równe
c)
(Jeżeli mamy i zdarzeń ,iloczyn i-ego z j-tym jest zbiorem pustym, i nie jest równe j, to suma
prawdopodobieństw jest prawdopodobieństwem sumy)
To funkcja ta jest przestrzenią prawdopodobieństw.
2. Własności dystrybuanty.
Dystrybuantą nazywany funkcję która spełnia 3 warunki :
- jest niemalejąca.
- lim
x⇒−∞
i lim
x⇒ ∞
są sobie równe dla funkcji f
- jest lewostronnie ciągła (granica funkcji w punkcie = punktowi) lim
x⇒ x
0
−
s
f x= f x
0
3. Sprawdzić, czy funkcja może F x =
1
arctg x
1
2
być dystrybuantą rozkładu
prawdopodobieństwa.
f x =
1
arctgx
2
1. F ' x=
1
∗
1
1 x
2
dla kazdego
x
∈ℝ
F ' x0
2.
lim
n −∞
1
arctg x
2
=
1
−
2
2
=
0
lim
n ∞
1
arctg x
2
=
1
2
2
=
1
3. z analizy funkcja arctg jest ciągła
f x =
∫
∞
x
¿
F t
∞
≥
0
∫
−∞
∞
f t dt=1
a<b
F b−F a=
∫
∞
b
f t dt –
∫
−∞
a
f t dt=
∫
a
b
f t dt≥0
4. Udowodnić, że jeśli P jest rozkładem prawdopodobieństwa na R
1
to funkcja określona
By Perez
Strona 1 z 12
Metody probabilistyczne i statystyka - egzamin
wzorem F x = P −∞ ; x ma własności:
1. F jest niemalejąca
2.
lim
x −∞
F x=0
lim
x ∞
F x=1
3. F jest lewostronnie ciągła
1.
x
1
x
2
A :−∞ ; x
1
B :−∞ ; x
2
C :x
1
; x
2
Zauważmy, że A∪C=B jeżeli A∩C =∅
P A∪C=P B ⇒ P AP B=P C
F x
1
−
F x
2
=
P −nieskończność ; x
2
−
P −nieskończność ; x
1
idąc dalej
P B P A= P C = P x
1
; x
2
0
funkcja
niemalejąca
2.
x
n
– ciag rosnący n elementowy , lim
x⇒ ∞
x
n
=∞
−∞
; x
1
, −∞ ; x
2
;−∞ ; x
3
....
x ∪
i=1
∞
−∞
; x
1
=−∞
;∞
lim
x⇒ ∞
F x = lim
x⇒−∞
F x
n
=
lim
n⇒ ∞
P −∞ ; x
n
=
P −∞ ;∞=1
x
n
malejący , lim
x⇒ ∞
x
n
lim
n⇒−∞
F x=lim
n⇒ ∞
f x
n
=
lim
n ⇒∞
P −∞ ; x
n
=
P ∅=0
3.
x
n
rosnacy lim
n⇒ ∞
x
n
=
x
0
lim x x
−
0
F
x =lim
n ⇒ ∞
F x
n
=
lim
n ⇒∞
P −∞ ; x
n
=
P −∞ ; x
0
=
F x
0
F x =
∫
−∞
x
f t dt
| f t≥0
|
∫
−∞
∞
f t dt=1
5. Definicja prawdopodobieństwa warunkowego.
Jeśli P B0 ,to P A ∖ B P A∖ B=
P A∩ B
P B
Dowód:
1 P A/ B≥0
2. P ∖ B=
P ∖ B
P B
=
P B
P B
=
1
3. A
1,
A
2,
A
3,
.... A
i
il A
j
=∅
i≠ j
By Perez
Strona 2 z 12
Metody probabilistyczne i statystyka - egzamin
A
i
∩
B∪ A
j
∩
B= A
i
∩
A
j
∩
B∩B=∅
mówimy , ze zdarzenie A nie zależy od B jeżeli P A/ B=P A wtedyi tylko wtedy gdy
P A∩ B=P A P B
6. Udowodnić, że P ∅=0 .
∅∪∅∪∅∪
…∪∅=0
P ∅∪∅∪∅∪…∪∅=P ∅
∅∩∅=∅
zauważ, że zdarzenie niemożliwe samo się wyklucza.
P ∅P ∅P ∅...P ∅=P ∅ Jest to prawdziwe, gdy P ∅=0
7. Udowodnić, że P A=1−P A
P A=1−P A A∪ A= P A∪A=P A∩ A=∅ P A P A=1 P A=1−P A
8. Udowodnić, że dla dowolnych dwóch zdarzeń P A∪B=P AP B−P A∩B .
9. Udowodnić, że: jeśli A⊂ B to P A≤P B .
A⊂ B⇒ P A≤P B B= A∪ B ∖ A=A∪ B∩A
P B=P A∪ B∩ A=P AP B∩ A≥P A
10.Sformułować i udowodnić twierdzenie o prawdopodobieństwie zupełnym.
Tw:
A
1
i=1,2,3 ,...
A
1
∪
A
2
∪
…=
A
i
∩
A
j
=∅
i≠ j
P A
i
0 – spelnia ten warunek
P B=
∑
i
P A
i
P B / A
i
Dowód:
B=B∩
B∩ A
1
∪
A
2
∪
A
3
∪
...= B∩A
1
∪
B∩ A
2
∪
B∩A
3
∪
...= B∩A
i
∪
B∩A
j
=
B∩B∩A
i
∩
A
j
=
B∩∅=∅
P B
P B∩A
1
∪
B∩ A
2
∪
...= P B∩ A
1
B∩A
2
B∩B
3
...= P A
1
P B/ A1 P A
2
P B/ A
2
P A
3
P B/ A
3
…=
∑
i
P A
i
P B/ A
i
By Perez
Strona 3 z 12
Metody probabilistyczne i statystyka - egzamin
11.Sformułować i udowodnić twierdzenie Bayesa.
Jeżeli zdarzenia A_i (i=1,2,3,...) tworzą układ zupełny zdarzeń, czyli:
A
1
∪
A
2
∪
A
3
∪
…= A
i
∩
A
j
=∅
i≠ j
P A
i
0 Mamy zdarzenie B gdzie P B0,
¿
dla każdego zdarzenia A
j
zachodzi równość.
P A
j
/
B =
P A
j
P B/ A
j
∑
i
P
A
i
P B / A
i
– wzór Baysa
Dow:
P A
j
/
B=
P A
j
∫
B
P
B=
P A
j
P B/ A
j
∑
i
P B/ A
i
P A
j
∫
B=P A
j
P B/ A
j
P B0
P A
i
/
B=
P A
i
P B / A
i
∑
i
P B/ A
i
12.Definicja zmiennej losowej.
Zmienna losowa x, y, z- jest to funkcja rzeczywista
X X : R
określona na przestrzeni zdarzeń
elementarnych mająca następującą własność: dla każdej liczby rzeczywistej
x ∈R
zbiór zdarzeń elementarnych
w, dla których
X wx
jest zdarzeniem, czyli jest elementem rodziny S
w :{ X w x}∈S
13.Udowodnić, że P a≤ X b=P X b−P X a .
14.Rozkład Bernoulliego
metoda wykonywania doświadczeń. Bierzemy pewne doświadczenie i wykonujemy to pewną
ilość razy. Jako wyniki obieramy sukces i porażkę. Prawdopodobieństwo sukcesu i porażki musi
być takie samo.
n- liczba doświadczeń zgodnie z ww schematem
zdefiniujemy X – zmienna losowa
k =0,1,2,...,n – liczba sukcesów
zmienna losowa ma rozkład Bernouliego (dwumianowy), jeżeli
P X =k = n
k
p
k
1− p
n−k
x
1
x
2
x
3
.. x
n
– suma jest tutaj określana jako liczba sukcesów.
By Perez
Strona 4 z 12
Metody probabilistyczne i statystyka - egzamin
15.Rozkład Poissona
16.Rozkład normalny
Zmienna losowa o wartości oczekiwanej
E X
m
i wariancji
D
2
X
2
ma rozkład
normalny jeżeli jej funkcja gęstości wyraża się wzorem
f X
1
2
e
x m
2
2
2
17.Napisać funkcję gęstości zmiennej losowej o rozkładzie normalnym z wartością
oczekiwaną 5 i odchyleniem standardowym 7.
f X =
1
2
e
−
x−m
2
2
2
f X =
1
7∗
2
e
−
x−5
2
2∗7
2
19. Parametry zmiennych losowych (średnia, wariancja, odchylenie standardowe, mediana
i wartość modalna).
Zmienna typy ciągłego:
WARTOŚĆ OCZEKIWANA:
M=
∫
−∞
∞
x f x dx
WARIANCJA
2
=
∫
−∞
∞
x−m
2
f x dx
ODCHYLENIE STANDARDOWE
=
∫
−∞
∞
x−m
2
f x dx
MEDIANA
Funkcja gęstości przyjmuje wartość
1
2
By Perez
Strona 5 z 12
Metody probabilistyczne i statystyka - egzamin
MODALNA
MAX DLA FUNKCJI GĘSTOŚCI.
Zmienna typu skokowego:
Wartość oczekiwana m
m=
∑
i
x
i
⋅
p
i
- mnożymy wartość x z jego prawdopodobieństwem i dodajemy z kolejnym
mnożeniem x-a z jego prawdopodobieństwem.
Wariancja
2
oraz odchylenie standardowe
2
=
∑
i
x
i
−
m
2
⋅
p
i
=
∑
i
x
i
−
m
2
⋅
p
i
Modalna – takie x_i dla którego p jest największe.
Mediana takie x_i spełniające następujący warunek.
P x
i
≤
1
2
≤
P ≤ x
i
17.Udowodnić, że jeśli zmienna losowa X ma wartość oczekiwaną m i odchylenie standardowe
σ
, to zmienna losowa Y =
X −m
ma wartość oczekiwaną zero i odchylenie standardowe 1.
σ
m
X
Y
−
=
, (gdzie X- zm. los.)
2
2
)
(
,
)
(
σ
=
=
x
D
m
x
E
E Y
E
X m
1
E X
m
1
E X
m
1
m m
0
D
2
Y
D
2
X
m
1
2
D
2
X m
1
2
D
2
X
1
2
2
1
18.Udowodnić, że jeśli zmienna losowa X ma wartość oczekiwaną 5 i odchylenie standardowe
4, to zmienna losowa
Y =
X −5
4
ma wartość oczekiwaną zero i odchylenie standardowe 1.
tego nie wiem
19.Twierdzenie Poissona (dowód)
Jeśli:
P= X =k =
n
k
p
k
1− p
n− k
k =0
oraz : p= pn n
0
nn
0
np= 0
to:
lim
n
∞
P X
n
=
k =
k
k !
e
−
Dowód:
lim
n
∞
P X
n
=
k =lim
n
∞
n
k
p
k
1− p
n− k
idąc dalej
1
k !
lim
n
∞
n−k 1n−k 2⋅...⋅ n−1 n
n
k
⋅
1−
n
n− k
By Perez
Strona 6 z 12
Metody probabilistyczne i statystyka - egzamin
równe jest
1
k !
lim
n ∞
n−k 1
n
⋅
n−k 2
n
⋅
...⋅
n−1
n
⋅
n
n
⋅
k
1−
x
n
n
1−
x
n
k
następnie
k
k !
lim
n ∞
1−
k −1
n
1−
k −2
n
⋅
...⋅1−
1
n
=
k
k !
20.Zmienne losowe typu skokowego. Rozkład zmiennej losowej typu skokowego.
Zmienną losową typu skokowego nazywamy taki zbiór przeliczalny X ∈R
1
dla którego
Px X =1
21.Zmienne losowe typu ciągłego. Rozkład zmiennej losowej typu ciągłego.
Zmienne losowe typu ciągłego ,(zbiorem wartości jest zbiór liczb rzeczywistych). Są one
charakteryzowane
przez
funkcję
gęstości
.
Rozkładami zmiennych losowych typu ciągłego są: jednostajny, normalny,wykładniczy.
22.Twierdzenie Linderberga-Levy’ego
jeżeli X
n
jest ciągiem zmiennych niezależnie losowych o takich samych rozkładach mających
wartość oczekiwaną m i wariancję D
2
X
n
=
2
, to ciąg losowy U
n
U
n
=
1
n
∑
k =1
n
X
k
−
mn
23.Określenie populacji i próby
POPULACJA – zbiór jednorodnych elementów różniących się między sobą tylko wartością
podanej cechy
PRÓBA – pewnien podzbiór POPULACJI
powinna być: reprezentatywna oraz losowa
24.Zasady budowy szeregów rozdzielczych
Jak tworzyć szereg rozdzielczy
- szereg rozdz. ma nam ułatwić obliczenia
-najlepiej by te liczby (przedziały) były całkowicie zaokrąglanymi liczbami.
Musimy mieć 2 informacje:
R= X
max
−
X
min
- nazywamy 'resztą'
Przez k- liczba przedziału klasowych
h- długość przedziału
k⋅h≈ R
Liczba przedziałów nie powinna przekraczać 15 i nie powinna być mniejsza niż 6.
25.Definicja i własności estymatorów punktowych
Estymator jest oszacowaniem parametru zmiennych losowych
Szukamy takich estymatorów, które będą optymalne dla danej zmiennej losowej.
Estymator nie powinien być obciążony – (rozrzut jest zbyt duży) jeśli mamy parametr Q a jego
estymator to
Q jest on nieobciążony gdy E(
Q )=Q
Estymator powinien być zgodny lim
n → ∞
P ∣Q−
Q∣=1
n- ilość prób
By Perez
Strona 7 z 12
Metody probabilistyczne i statystyka - egzamin
– dowolna liczba rzeczywista większa od zera
Jeśli liczebność próby dąży do nieskończoności, to prawdopodobieństwo różnicy Q z estymatora
mniejsza od jest równa jeden
Estymator powinien być najefektywniejszy
26.Wyprowadzić wzór na estymator wartości oczekiwanej
x=
1
n
∑
i=1
n
x
1
27.Udowodnić, że średnia arytmetyczna jest nieobciążonym estymatorem wartości
oczekiwanej.
28.Średnia arytmetyczna jest estymatorem:
1. zgodnym,
na
podstawie
twierdzenia
Chinczyna
lim
n
P
1
n
i 1
n
Xi m
1
2. nie
obciążonym
E X
E
1
n
i 1
n
E Xi
E X
m
najefektywniejszym (zakładamy, że rozkład cechy w populacji ma rozkład
normalny)
V X
V
1
n
i 1
n
Xi
1
n
2
i 1
n
V Xi
2
n
29.Udowodnić, że
D
2
x=
2
n
30.Wyprowadzić wzór na przedział ufności dla wartości oczekiwanej na podstawie próby z
populacji o rozkładzie normalnym ze znanym odchyleniem standardowym.
E X
m
E X m
E X
E m
m m 0
D
2
X m
D
2
X
D
2
1
n
i 1
n
Xi
1
n
2
i 1
n
D
2
Xi
1
n
2
i 1
n
2
1
n
2
n
2
2
n
odchylenie standardowe
D
2
X
m
n
P
n
X
m
n
n
1
By Perez
Strona 8 z 12
Metody probabilistyczne i statystyka - egzamin
P
U
X
m
n
U
1
stąd wynika:
U
X
m
n
U
U
n
X m U
n
X U
n
m
X U
n
co daje:
X
U
n
m X
U
n
31.Omówić zasady testowania hipotez statystycznych.
•
stawiamy hipotezę zerową, że średnia m ma wartość
m
0, tzn:
H m m
0
0
:
=
wobec hipotezy alternatywnej:
1
0
H m m
1
0
:
≠
2
o
H m m
1
0
:
>
3
o
H m m
1
0
:
<
•
za sprawdzian hipotezy przyjmujemy średnią arytmetyczną
X
•
jeżeli
H
0 jest prawdziwa to statystyka o postaci:
n
m
X
U
σ
0
−
=
ma rozkład
( )
1
;
0
N
,
•
ustalamy wartość
u
α
(tzw. wartość krytyczna), której nie powinien przekraczać
moduł statystyki U, określając ją w taki sposób w rozkładzie
( )
1
;
0
N
, aby dla ustalonego
poziomu
α
zachodziła relacja:
(
)
α
α
=
≥
u
U
P
•
wartości zmiennej u spełniające nierówność
U
u
≥
α
są obszarem krytycznym
testu, tzn.:
λ
α
α
= − ∞ −
> ∪ <
+ ∞
(
;
;
)
u
u
2
2
32.
Obszar krytyczny
λ
(dwustronny)
•
ustalamy wartość
u
α
, której nie powinna przekraczać statystyka U, określając ją w
taki sposób w rozkładzie
( )
1
;
0
N
, aby dla ustalonego poziomu
α
zachodziła relacja:
(
)
α
α
=
≥
u
U
P
•
wartości zmiennej U spełniające nierówność
U
u
≥
α
stanowią obszar krytyczny
testu, tzn.:
λ
α
= 〈
+ ∞
u ;
)
Obszar krytyczny
λ
(prawostronny)
•
ustalamy wartość
u
α
, od której powinna być większa statystyka U, określając ją w
By Perez
Strona 9 z 12
Metody probabilistyczne i statystyka - egzamin
taki sposób w rozkładzie
( )
1
;
0
N
, aby dla ustalonego poziomu
α
zachodziła relacja:
(
)
α
α
=
−
≤
u
U
P
•
wartości zmiennej U spełniające nierówność
U
u
≤ −
α
stanowią obszar krytyczny
testu, tzn.:
(
〉
−
∞
−
=
α
λ
u
;
Obszar krytyczny
λ
(lewostronny)
Jeżeli z próby uzyskamy taką wartość statystyki u, że
-
u
∈
λ
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej,
-
u
∉
λ
to stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej.
33.Podać przykład konstrukcji testu statystycznego dla wartości średniej.
Przypuśćmy, że mamy dokonać oceny jakości partii zapałek, liczącej 10000 pudełek.
Producent twierdzi, iż w każdym pudełku są 54 zapałki.
Zakładamy, że sprawdzono 100 pudełek i średnia ilość w nich wyniosła 51,21 , a odchylenie
standardowe w próbce równa się 2,45. Niech współczynnik istotności na poziomie którego
weryfikujemy hipotezę H
0
(m=54) wynosi 0,002. Wstawiając do wzoru otrzymujemy :
t
0,499
i w tablicach rozkładu normalnego odczytujemy t~3
Hipotezę odrzucamy, gdy
X
m
t
n
, a więc
54 51,21 2,79
3 2,45
100
0,735
,
czyli hipotezę odrzucamy.
34.Omówić test zgodności
2
.
1. Formułujemy hipotezy:
H
0
:
F(X)
=
F
0
(X)
H
1
: F(X) <> F
0
(X) , gdzie F(X) oznacza dystrybuantę pewnego rozkładu hipotetycznego.
Możemy podać następujący algorytm postępowania:
1. Z rozkładu hipotetycznego, sformułowanego w hipotezie zerowej H
0
, wystarczy
dla każdego przedziału klasowego prawdopodobieństwo teoretycznego
przyjmowania wartości z tego przedziału przez badaną cechę
p
i
=P(x
i
<= ξ <= x
i+1
)= F
0
(x
i+1
) – F
0
(x
i
)
2. Wyznaczamy dla każdego przedziału liczebności teoretyczne n*p
i
, które powinny
wystąpić w n-elementowej próbie, gdyby rozkład populacji był zgodny z
rozkładem określonym w hipotezie zerowej H
0
.
3. Wyznaczymy różnice pomiędzy liczebnościami empirycznymi i teoretycznymi n
i
-
np
i
oraz wartość statystyki testowej
X
2
i 1
k
n i npi
2
npi
Jeżeli rozkład empiryczny nie będzie zgodny z rozkładem hipotetycznym
należy spodziewać się, że różnice n
i
-np
i
pomiędzy liczebnościami
empirycznymi i teoretycznymi będą znaczne. Postać statystyki testowej
sugeruje, że wówczas będzie ona przyjmować duże wartości. Duże
wartości statystyki
2
będą oznaczały, że hipotezę zerową należy
odrzucić.
Niech
2
oznacza wartość statystyki testowej wyznaczoną na podstawie
wyników próby. Hipotezę zerową odrzucamy, gdy prawdziwa jest
By Perez
Strona 10 z 12
Metody probabilistyczne i statystyka - egzamin
nierówność
2
2
, gdzie
2
jest wartością odczytaną z tablic
rozkładu CHI dla ustalonego poziomu istotności
i (k-r-1) stopni
swobody ( r – liczba szacowanych z prób parametrów rozkładu
hipotetycznego, niezbędnych do wyznaczenia prawdopodobieństw
teoretycznych p
i
).
35.Omówić test zgodności λ-Kołmogorowa
1. Dla każdego prawego końca przedziału klasowego obliczamy wartości
dystrybuanty empirycznej i hipotetycznej.
2. Obliczamy wartość statystyki D
n
= sup
x
|F
n
(X) – F
0
(X)| , która następnie
przekształcamy do postaci
D
n
n
(statystyka testowa o rozkładzie
Kołmogorowa). Można się spodziewać, że duże wartości statystyki będą
świadczyły o dużych różnicach pomiędzy wartościami dystrybuanty empirycznej i
hipotetycznej.
Weryfikacja hipotezy sprowadza się do :
1. sformułowania hipotez
2. obliczenia dystrybuanty
3. obliczenia wartości statystyki
4. porównaniu z danymi z tablic:
0
(wtedy odrzucamy)
5. jeżeli rozkład empiryczny
F
n
X
F
0
X
to
D
n
~ 0
36.Omówić sposób konstrukcji prostej regresji.
By Perez
Strona 11 z 12
Metody probabilistyczne i statystyka - egzamin
37.Omówić metodę najmniejszych kwadratów i podać przykłady jej zastosowania.
By Perez
Strona 12 z 12