METODY PROBABILISTYCZNE
METODY PROBABILISTYCZNE
zbiór materiałów do kolokwium nr 1
Aktualizacja: 18.11.2008
Przykładowe zestawy
1)
Podaj definicje próbki losowej prostej?
2)
Jakie znasz miary wartość centralnych zmiennej losowej?
3)
Podaj definicje mediany.
4)
Podaj definicje kwantyla.
5)
Omów test Kołomorowa-Smirnowa.
6)
Co to jest przedział ufności.
7)
Jaki parametr definiuje asymetrie rozkładu i jakie istnieją rozkłady asymetrii?
8)
Jakie znasz rozkłady testowe? Wymień nazwy i podaj zależności miedzy kwantylem, a wartością krytyczna dla rozkładu
2
.
9)
Podaj wzór na dystrybuantę rozkładu Weibulla i zdefiniuj jego parametry.
10) Podaj wzór na odchylenie standardowe skorygowane i nieskorygowane.
1)
Jakie znasz wzory na prawdopodobieństwo empiryczne (z próby)?
2)
Zdefiniuj pojęcie współczynnika zmienności.
3)
Czemu się równa wartość oczekiwana i wariancja rozkładu Poissona?
4)
Zdefiniuj parametry rozkładu normalnego.
5)
Podaj wzór na dystrybuantę rozkładu potęgowego.
6)
Czemu się równa wartość oczekiwana rozkładu t-Studenta?
7)
Ile siatek funkcyjnych ma rozkład Weibulla i jak się nazywają?
8)
Omów test Kołomorowa-Smirnowa.
9)
Podaj zależność pomiędzy współczynnikiem dopasowania i współczynnikiem korelacji.
10) Omów pojecie mieszanina rozkładów.
1)
Zdefiniuj pojecie i podaj przykład kumulacyjnego.
2)
Podaj zależność na k-ty moment centralny zmiennej losowej ciągłej. Jak się nazywa drugi moment centralny?
3)
Podaj wzór na standaryzacje zmiennej losowej i podaj właściwości zmiennej standaryzowanej.
4)
Co to jest wektor losowy?
5)
Ze zbioru wyrobów o dużej liczebności i wadliwości w=10% losowano po jednej sztuce i badano. Jakie jest prawdopodobieństwo,
że dla trafienia na sztukę niedobra trzeba zbadać 3 sztuki?
6)
W jakim zakresie parametrów kształtu rozkład Weibulla jest pseudo symetryczny i podobny do rozkładu normalnego?
7)
Napisz słowami co oznacza X ^l k,m.
8)
Podaj definicje przedziału ufności.
9)
Omów test zgodności
2
.
10) Jakie znasz metody kontroli obliczeń statystycznych?
1)
Co to jest populacja generalna?
2)
Jakie znasz wzory na oszacowanie prawdopodobieństwa z próby?
3)
Podaj definicje i właściwości dystrybuanty.
4)
Co to jest moda?
5)
Co to jest współczynnik zmienności.
6)
Podaj definicje i właściwości kowariancji.
7)
Zdefiniuj parametry rozkładu Weibulla.
8)
Opisz graficzna metodę szacowania parametrów rozkładu.
9)
Omów test zgodności
2
.
10) Do czego służy i jak jest realizowany test serii?
1)
Na czym polega metoda analizy statystycznej zwana metoda dystrybuanty empirycznej
2)
Zdefiniuj pojecie wariancji:
3)
Podaj dziedzinę współczynnika korelacji:
4)
Narysuj wykres funkcji gęstości rozkładu równomiernego
5)
Obszar ufności.
6)
Test zgodności.
7)
Czym się różni test
2
od testu Kołmogomorowa-Smirnowa?
8)
Jaki test można zastosować do oceny niezależności uzyskanych wyników badan statystycznych?
9)
Podaj dowolna wartość testowa do testu błędów grubych.
10) Podaj warunek konieczny i wystarczający niezależności dwóch zdarzeń losowych?
Podaj definicję próbki losowej prostej.
Próbką losowa normalna nazywamy podzbiór stanowiący część populacji generalnej poddanej badaniu statystycznemu, na
podstawie którego wnioskuje się o populacji generalnej, przy czym wszystkie elementy populacji generalnej maja taka samą
szansę trafienia do próbki.
Jakie znasz miary wartości centralnych zmiennej losowej?
Średnie: arytmetyczna, geometryczna, harmoniczna, kwadratowa, a także mediana i moda.
Podaj definicje mediany.
Medianą nazywamy wartość cechy w szeregu uporządkowanym poniżej i powyżej której znajduje się jednakowa liczba
obserwacji. Aby obliczyć medianę sortujemy dany zbiór w kolejności rosnącej i numerujemy od 1 do n. Jeżeli n jest
nieparzyste medianą jest wartość obserwacji w środku
n
2
, jeśli zaś n jest parzyste medianą jest średnia arytmetyczną
między dwoma środkowymi obiektami obserwacji
n
2
n
2
1
.
Podaj definicje kwantyla.
Kwantylem rzędu p, gdzie
0 p1
w rozkładzie empirycznym
P
x
zmiennej losowej X nazywamy każdą liczbę x
p
dla
której spełnione są zależności: P
x
−∞
, x
p
]
p oraz P
x
x
p
,∞1− p .
W szczególności, kwantylem rzędu p jest taka wartość zmiennej x
p
, że wartości mniejsze lub równe x
p
są przyjmowane
z prawdo podobieństwem co najmniej p, zaś wartości większe lub równe x
p
są przyjmowane z prawdopodobieństwem co
najmniej 1− p .
Jaki parametr definiuje asymetrie rozkładu i jakie istnieją rodzaje asymetrii?
Asymetrię rozkładu definiuję parametr zwany współczynnikiem asymetrii lub współczynnikiem skośności, którego wzór
brzmi:
=
3
2
3 / 2
=
3
x
3
Gdzie,
3
jest trzecim momentem centralnym, a
3
jest odchyleniem średnim zmiennej losowej
X
.
Jeśli 0 to rozkład ma asymetrię ujemną, jeśli =0 to rozkład jest symetryczny, jeśli zaś 0 to rozkład ma
asymetrię dodatnią.
Oszacowanie współczynnika można również otrzymać w oparciu o wynik badania próbki losowej korzystając ze wzoru:
=
n⋅
∑
i
[
x
i
−
X ]
3
n−1⋅n−2⋅S
3
Podaj wzór na dystrybuantę rozkładu Weibulla i zdefiniuj parametry tego rozkładu.
Dystrybuanta rozkładu Weibulla jest postaci:
F x=
{
0
dla x≤X
0
1−exp
[
−
x− X
0
X
m
−
X
0
k
]
dla xX
0
}
Gdzie, X
0
jest parametrem przesunięcia wyrażanym w jednostkach zmiennej losowej,
X
m
, F X
m
=
1−e
1
=
0,6322
jest parametrem skali wyrażonym w jednostkach zmiennej losowej,
k jest bezwymiarowym parametrem kształtu.
Jakie znasz rozkłady testowe - wymień nazwy i podaj zależność miedzy kwantylem, a wartością krytyczna dla rozkładu
2
(ksi kwadrat)?
Rozkłady testowe:
2
, t-studenta, Fischera-Snedecora,.
Zależność między kwantylem a wartością krytyczną dla rozkładu
2
:
Kwantyl
2
rzędu
1−
jest równy wartości krytycznej rzędu .
Podaj wzór na odchylenie standardowe skorygowane i nie skorygowane.
Odchylenie standardowe skorygowane
S =
∑
i=1
n
z
i
−
z
n−1
Gdzie z
i
– wartość pomiaru.
Odchylenie standardowe nie skorygowane
S =
∑
i=1
n
z
i
−
z
n
Co to jest przedział ufności i obszar ufności?
Przedziałem ufności −
1,
2
, gdzie jest nieznanym parametrem rozkładu, o współczynniku ufności
1− , nazywamy taki przedział −
1,
2
, który spełnia warunek:
P
1
2
=
1− , gdzie
1
i
2
są funkcjami wyznaczonymi na podstawie próby losowej.
Obszarem ufności nazywamy obszar zawarty między krzywymi ufności dla regresji na poziomie
1−
.
Omów test Kołmogorowa - Smirnowa
Test Kołomogorowa – Smirnowa jest najprostszym testem wiarygodności znakomicie nadającym się do szybkich obliczeń
inżynierskich w połączeniu z graficzną metodą opracowania wyników. Test ten stosuje się, gdy:
- zmienna losowa jest ciągła,
- liczba zaobserwowanych realizacji zmiennej losowej jest mniejsza od 10,
- wartości parametrów rozkładu są dane, a nie szacowane z wyników obliczeń.
W przypadku oszacowań graficznych gdzie dystrybuanta aproksymowana jest równaniem prostej, można badając odchylenia
punktów eksperymentalnych od prostej, obejść warunek dotyczący znajomości parametrów rozkładu.
Aby stosować test Kołmogorowa-Smirnowa oblicza się wartość statystyki:
dn=max
1≤i≤n
∣
F x
i
−
F x
i
∣
gdzie F x
i
wartość dystrybuanty empirycznej dla wartości zmiennej losowej
x
i
,
F x
i
wartość dystrybuanty
teoretycznej hipotetycznego rozkładu, odczytana z równania prostej dla wartości zmiennej losowej
x
i
.
Hipotezę zgodności rozkładu empirycznego z hipotetycznym rozkładem teoretycznym należy odrzucić, gdy spełniona jest
nierówność: dnDn , gdzie
Dn
jest jest wartością krytyczną dla rozkładu Kolmogorowa-Smirnowa odczytaną z
tablic dla danego poziomu ufności
.
Jakie znasz wzory na prawdopodobieństwo empiryczne (z próby)?
P A=∣A∣/∣∣ ,
P A∣B=
P A∪B
P B
,
P A=P A∣B
1
⋅
P B
1
P A∣B
2
⋅
P B
2
⋯
P A∣B
n
⋅
P B
n
n
k
⋅
p
k
⋅
q
n−k
pq=1
Zdefiniuj pojecie współczynnika zmienności.
Współczynnikiem zmienności nazywamy klasyczną miarę zróżnicowania rozkładu cechy. W odróżnieniu od odchylenia
standardowego, które określa bezwzględne zróżnicowanie cechy, współczynnik zmienności jest miarą względną, czyli zależną
od średniej arytmetycznej.
Współczynnik ten definiowany jest wzorem:
V =
s
x
śr
, gdzie s - odchylenie standardowe, x
śr
- średnia arytmetyczna.
Czemu się równa wartość oczekiwana i wariancja rozkładu Poissona?
Wartość oczekiwana i wariancja rozkładu Poissona są sobie równie i równe jest jednemu parametrowi :
E Z =V Z = .
Zdefiniuj parametry rozkładu normalnego.
Parametrami rozkładu normalnego(Gaussa) są:
μ jest środkiem rozrzutu, który dla rozkładu normalnego pokrywa się z średnią, medianą i modą,
σ –odchylenie standardowe – jest miara rozrzutu zmiennej losowej.
Podaj wzór na dystrybuantę rozkładu potęgowego
F t=
{
0
t≤0
t
c
dla 0tc
1
t≥c
}
gdzie c0 to parametr skali, a 0 to parametr kształtu rozkładu.
Czemu się równa wartość oczekiwana rozkładu t-Studenta?
Wartość oczekiwana rozkładu t-Studenta równa jest zeru.
E T
k
=
0
Zdefiniuj pojecie i podaj przykład szeregu kumulacyjnego.
Szereg, w którym każdej wartości szeregu uporządkowanego przyporządkowuje się sumy częstości odpowiadające wszystkim
wartościom zmiennej losowej nie większym od danej wartości.
Podaj zależność na k-ty moment centralny zmiennej losowej ciągłej. Jak się nazywa drugi moment centralny?
Momentem centralnym zmiennej losowej X rzędu k nazywamy wartość
c
k
⋅
X =E X − EX
k
, o ile istnieją EX i
E X −EX
k
.
Moment centralny drugiego rzędu nazywamy wariancją i oznaczamy V ar X albo
D
2
⋅
X
.
Pierwiastek z wariancji nazywamy średnim odchyleniem standardowym, oznaczamy
x
=
V ar X
Podaj wzór na standaryzacje zmiennej losowej i podaj właściwości zmiennej standaryzowanej.
Y =
X −E X
x
nazywa się standaryzowaną zmienną losową. Właściwości standaryzowanej zmiennej losowej są
następujące: wartość oczekiwana jest równa
E Y =0
; wariancja jest równa
V Y =1
;
momenty zwykłe i centralne zmiennej Y są sobie równe; k-ty moment zmiennej Y jest równy ilorazowi k-tego momentu
centralnego zmiennej X przez odchylenie średnie
σ
x
w potędze k-tej:
m
k
Y =
k
Y =
k
X
x
k
znając dystrybuantę zmiennej Y można wyznaczyć dystrybuantę zmiennej X z zależności P X x=P
Y
x−E X
x
Co to jest wektor losowy?
Układ dwóch zmiennych losowych X i Y nazywa się wektorem losowym
X ,Y
.
Wektor losowy ma następujące rodzaje momentów:
Momentem rzędu k l wektora losowego
X ,Y
oznaczonym jako m
kl
nazywamy wartość oczekiwaną funkcji
X
k
⋅
Y
l
, czyli
m
kl
=
E X
k
⋅
Y
l
.
Momentem centralnym wektora losowego (X, Y) rzędu k +l, oznaczonym
µ
kl
nazywamy wartość oczekiwaną funkcji
[
X −E X ]
k
⋅[
Y −E Y ]
l
, czyli
kl
=
E {[ X −E X ]
k
⋅[
Y −E Y ]
l
}=
E [ X −m
10
k
⋅
Y −m
01
l
]
Momenty centralne rzędu pierwszego
10
oraz
01
są równe 0. Momenty centralne rzędu drugiego są trzy:
-wariancje zmiennych losowych X i Y:
oraz mieszany drugi moment centralny
11
=
E [ X −m
10
⋅
Y −m
01
]=
cov X , Y
20
=
E X −m
10
2
=
V X
02
=
E Y −m
01
2
=
V Y
W jakim zakresie parametrów kształtu rozkład Weibulla jest pseudo symetryczny i podobny do rozkładu normalnego.
Przedział 3.2k 3.7 . W tym przedziale jest podobny do normalnego.
Napisz słowami co oznacza
2
(ksi kwadrat), k,
.
2
- test zgodności, k - współczynnik kształtu,
- poziom istotności.
Podaj definicje przedziału ufności.
Przedziałem ufności dla parametru
υ
nazywa się przedział liczbowy (a, b) - gdzie a i b są zmiennymi losowymi - który
pokrywa prawdziwą wartość parametru
υ
z określonym prawdopodobieństwem
β
zwanym poziomem ufności.
Przedział ufności może być jednostronny lub dwustronny.
Omów test zgodności
2
(omega kwadrat).
Test ten opiera się na bezpośrednio zaobserwowanych, niegrupowanych wartościach analizowanej zmiennej losowej, a więc
nadaje się znakomicie do wyników opracowywanych metodą dystrybuanty empirycznej.
Może być stosowany dla: metody graficznej i dystrybuanty empirycznej; zmiennej losowej ciągłej; próbki losowej pełnej;
liczby realizacji zmiennej losowej n≥10
Podstawą testu jest statystyka
n
n
2
=
1
12⋅n
∑
i=1
n
[
F x
i
−
F x
i
]
2
Jeżeli jest spełniona nierówność
n
n
2
n
2
to hipotezę o zgodności rozkładu empirycznego z hipotetycznym rozkładem
teoretycznym należy odrzucić.
Test
ω
2
jest oparty na podobnej statystyce jak test Kołmogorowa-Smirnowa. Jest to jednak test o większej mocy.
Jakie znasz metody kontroli obliczeń statystycznych?
Testy zgodności: Kołmogorowa-Smirnowa,
2
, w
2
,
2
, serii.
Ile siatek funkcyjnych ma rozkład Weibulla i jak się one nazywają?
Rozkład ten ma dwie siatki: uniwersalną oraz siatkę o ustalonym współczynniku – parametrze kształtu k.
Podaj zależności pomiędzy współczynnikiem dopasowania i współczynnikiem korelacji.
Współczynnik dopełnienia jest kwadratem współczynnika korelacji.
Ze zbioru wyrobów o dużej ilości i wadliwości = 10% losowano po jednej sztuce i badano. Jakie jest
prawdopodobieństwo, ze dla trafienia na sztukę niedobra trzeba zbadać 3 sztuki?
Odpowiedź daje rozkład geometryczny P X =3, w=0.1=0.11−0.1
3−1
=
0.081
Napisz słowami co oznacza
k ,
2
.
k ,
2
to kwantyl statystyki
2
rzędu o ok stopniach swobody
Zdefiniuj mieszaninę rozkładów
Rozkład o dystrybuancie
F x= p
1
⋅
F
1
x p
2
⋅
F
2
x
, nazywa się mieszaniną rozkładów o dystrybuantach
F
1
x
,
F
2
x zaś
p
1
, p
2
to udziały rozkładów składowych w mieszaninie.
Co to jest siatka funkcyjna?
Siatka specyficzna dla każdego rozkładu statystycznego, w którym dystrybuanta jest linią prostą.
Jaki związek mają ze sobą dystrybuanta i funkcja gęstości?
Gęstość prawdopodobieństwa jest pochodną dystrybuanty, a dystrybuanta jest całką z gęstości prawdopodobieństwa.
Do czego służy test serii?
Liczba uzyskanych serii pomiarowych może być miarą losowości badanego zjawiska lub inaczej może być miarą niezależności
poszczególnych doświadczeń. Zbyt mała liczba serii świadczy o zakłóceniu losowości badanego zjawiska lub świadczy o tym,
że poszczególne obserwacje wpływają na siebie, czyli nie są niezależne.
Jaki jest związek między rozkładem normalnym a logarytmo-normalnym?
Jeśli w centralnym twierdzeniu granicznym zamiast o sumie niezależnych czynników losowych będziemy mówić o o ich
iloczynie to zamiast rozkładu normalnego otrzymamy rozkład logarytmo-normalny. Wykresy gęstości prawdopodobieństwa i
dystrybuanty rozkładu logarytmo-normalnego są w skali logarytmicznej identyczne jak dla rozkładu normalnego. Jeśli X ma
rozkład logarytmo-normalny, to ln X ma rozkład normalny.
Test
w
2
Stosowany gdy do opracowania wyników stosuje się dystrybuantę empiryczną. W przypadku badania zmiennej losowej ciągłej
przy liczbie realizacji n≥10 i próbie pełnej.
Podstawą testu jest statystyka: w
n
2
=−
n−2
∑
i=1
n
{
2⋅
∑
i
n
i
−
1ln F x
i
[
2
n−
∑
i
n
i
1
]
ln [1−F x
i
]
}
.
jeśli spełniona jest nierówność
w
o
2
≥
w
2
to na poziomie istotności
należy hipotezę o zgodności rozkładu teoretycznego
z empirycznym odrzucić. Test
w
n
2
ma moc porównywaną z mocą testu
2
.
Test
2
Test ten jest addytywny i należy go stosować w wypadku opracowywania wyników metodą histogramu. Wymaga spełnienia
warunków co do podziału na klasy i liczności realizacji w klasach. W związku z tym otrzymane wyniki mogą być
subiektywne. Mimo zwiększenia ryzyka odrzucenia hipotezy prawdziwej stosuje się go w metodzie dystrybuanty empirycznej.
Podstawą testu jest wówczas statystyka:
2
=
∑
i=1
n
∑
i
n
i
−
nF x
i
2
nF x
i
[
1−F x
i
]
.
Hipotezę o zgodności rozkładu empirycznego z hipotetycznym rozkładem teoretycznym należy odrzucić jeśli jest spełniona
nierówność
2
≥
N −r −1.
2
gdzie
N−r −1.
2
to wartość krytyczna rozkładu
2
o N −r −1 stopniach swobody rzędu
, r to liczba szacowanych parametrów rozkładu, N to liczba różnych wartości zmiennej losowej.
Definicja próbki losowej.
Jest to próbka pobrana w taki sposób, że wszystkie elementy populacji generalnej mają jednakową szansę na trafienie do niej.
Parametry określające miarę wartości centralnej.
Mediana, moda, wartość oczekiwana (średnia).
Rozkład multiplikatywny.
Jeśli mówimy o iloczynie zmiennych losowych, a nie o sumie, to rozkład jest multiplikatywny, a nie addytywny.
Patrz np. rozkład logarytmo-normalany.
Rozkład Fishera-Snedecora
Jeśli
x
1
i x
2
są niezależnymi zmiennymi losowymi o rozkładzie
2
odpowiednio z k
1
i k
2
stopniami swobody
to zmienna losowa (statystyka) równa jest:
F =
x
1
k
1
x
2
k
2
Funkcja prawdopodobieństwa
p x
1
=
P X =x
i
określa prawdopodobieństwo zdarzenia
X = x
i
dla każdej możliwej wartości
x
i
∈
i=1,2 ,3 ,... , n
danej zmiennej losowej
X
. Znając funkcję prawdopodobieństwa można wyznaczyć dystrybuantę:
F x=P X x=
∑
xi p
p x
Funkcja gęstości prawdopodobieństwa
Dla zmiennej losowej X ciągłej zakłada się, że jej dystrybuanta
F x
jest różniczkowalna w całym obszarze możliwych
wartości tej zmiennej losowej. Istnieje wówczas nieujemna funkcja f x=
dF x
dx
0 nazywana funkcją gęstości
prawdopodobieństwa. Wartość f x⋅dx określa prawdopodobieństwo zdarzenia iż zmienna losowa znajdzie się w
przedziale x≤X xdx i nazywa się ją elementem prawdopodobieństwa.
Podać wzór na zmienną standaryzowaną i jej właściwości
Standaryzowana zmienna losowa: Y =
X −E X
x
Właściwości:
•
Wartość oczekiwana E Y =0 , wariancja V Y =1
•
momenty zwykłe i centralne zmiennej Y są sobie równe
•
k-ty moment zmiennej Y jest równy ilorazowi k-tego momentu centralnego zmiennej X przez odchylenie
średnie
x
w potędze k-tej: m
k
Y =
k
Y =
k
X
x
k
•
znając dystrybuantę zmiennej
Y
można wyznaczyć dystrybuantę zmiennej X z zależności
P X x=P
Y
x−E X
x
Podaj zależność pomiędzy współczynnikiem dopasowania i współczynnikiem korelacji
Kwadrat współczynnika korelacji
r
jest współczynnikiem dopasowania
r
2
.