Andrzej Najgebauer
PROJEKTOWANIE
EKSPERYMENTÓW
SYMULACYJNYCH
OKREŚLENIE CZYNNIKÓW
OKREŚLENIE CZYNNIKÓW
WYZNACZAJĄCYCH
WYZNACZAJĄCYCH
EKSPERYMENT
EKSPERYMENT
Andrzej Najgebauer
PODSTAWOWE ZAGADNIENIA
warunki początkowe i końcowe
warunki początkowe i końcowe
momenty gromadzenia danych
momenty gromadzenia danych
czas trwania eksperymentu a liczba
czas trwania eksperymentu a liczba
powtórzeń
powtórzeń
plany losowania i plany eksperymentów
plany losowania i plany eksperymentów
metody redukcji wariancji estymatorów
metody redukcji wariancji estymatorów
przygotowanie „narzędzi” do
przygotowanie „narzędzi” do
statystycznej analizy symulacji
statystycznej analizy symulacji
Andrzej Najgebauer
ŹRÓDŁA BŁĘDÓW
SYMULACYJNYCH I SPOSOBY
ICH KONTROLOWANIA
†
błędy modelowania
błędy modelowania
•
nieadekwatny model matematyczny
nieadekwatny model matematyczny
•
w wyniku weryfikacji modelu i walidacji
w wyniku weryfikacji modelu i walidacji
powinny być zidentyfikowane i usunięte
powinny być zidentyfikowane i usunięte
†
błędy programowania
błędy programowania
•
błędy implementacji modelu w języku
błędy implementacji modelu w języku
symulacyjnym
symulacyjnym
•
testowanie modelu symulacyjnego w
testowanie modelu symulacyjnego w
oparciu o prosty system, ze znaną postacią
oparciu o prosty system, ze znaną postacią
analityczną rozwiązania
analityczną rozwiązania
Andrzej Najgebauer
ŹRÓDŁA BŁĘDÓW (c.d.)
†
błędy losowania - „set effect” i „sequence effect”
błędy losowania - „set effect” i „sequence effect”
•
złe generatory liczb pseudolosowych
złe generatory liczb pseudolosowych
•
poddanie generatorów testom losowości i zgodności
poddanie generatorów testom losowości i zgodności
rozkładów (minimum po 3 testy różne na losowość i żgodność)
rozkładów (minimum po 3 testy różne na losowość i żgodność)
•
stosowanie różnych technik redukcji wariancji
stosowanie różnych technik redukcji wariancji
†
błędy estymacji parametrycznej
błędy estymacji parametrycznej
•
błąd obciążenia początkowego (stan nieustalony) - „initial
błąd obciążenia początkowego (stan nieustalony) - „initial
bias”
bias”
•
gromadzenie danych wyjściowych po ustaleniu się stanu
gromadzenie danych wyjściowych po ustaleniu się stanu
systemu (warm up)
systemu (warm up)
•
statystyczna zależność wyników symulacji wskutek
statystyczna zależność wyników symulacji wskutek
autokorelacji i korelacji skrośnej i ograniczoność stosowania
autokorelacji i korelacji skrośnej i ograniczoność stosowania
CTG
CTG
•
stosowanie wielu powtórzeń eksperymentu, ustalanie paczek
stosowanie wielu powtórzeń eksperymentu, ustalanie paczek
wyników „batch means”, metoda regeneracji
wyników „batch means”, metoda regeneracji
Andrzej Najgebauer
WARUNKI POCZĄTKOWE I
KOŃCOWE
ustalenie zestawu charakterystyk
ustalenie zestawu charakterystyk
wejściowych
wejściowych
ustalenie zestawu charakterystyk
ustalenie zestawu charakterystyk
wyjściowych
wyjściowych
dobór estymatorów badanych
dobór estymatorów badanych
charakterystyk - określenie ich populacji
charakterystyk - określenie ich populacji
generalnych i rozkładu tych populacji
generalnych i rozkładu tych populacji
ustalenie kryteriów jakości badań
ustalenie kryteriów jakości badań
symulacyjnych
symulacyjnych
Andrzej Najgebauer
POPULACJA GENERALNA
Zbiór pewnych realnych
Zbiór pewnych realnych
elementów różniących
elementów różniących
się wartościami
się wartościami
badanych zmiennych -
badanych zmiennych -
cech np. zbiór ludzi w
cech np. zbiór ludzi w
badanym społeczeństwie
badanym społeczeństwie
lub nieskończony zbiór
lub nieskończony zbiór
możliwych powtórzeń
możliwych powtórzeń
pewnego eksperymentu,
pewnego eksperymentu,
wynikiem którego jest
wynikiem którego jest
zbiór wartości pewnych
zbiór wartości pewnych
zmiennych - cech
zmiennych - cech
statystycznych
statystycznych
Rozkładem populacji
Rozkładem populacji
generalnej
generalnej
nazywamy
nazywamy
rozkład wartości
rozkład wartości
badanej cechy w tej
badanej cechy w tej
populacji
populacji
(
,
,
,...,
)
X X X
X
R
n
n
1
2
3
przestrzeń prób
Populacja
generalna
Cecha X
Andrzej Najgebauer
MODEL MATEMATYCZNY ROZKŁADU
PG
Rozkład prawdopodobieństwa pewnej zmiennej
Rozkład prawdopodobieństwa pewnej zmiennej
losowej skokowej lub ciągłej
losowej skokowej lub ciągłej
Prawdopodobieństwo interpretuje się jako częstość
Prawdopodobieństwo interpretuje się jako częstość
względną występowania w populacji generalnej
względną występowania w populacji generalnej
elementów o określonych wartościach badanej cechy
elementów o określonych wartościach badanej cechy
Próba losowa - losowe wybrane elementy z populacji
Próba losowa - losowe wybrane elementy z populacji
generalnej o rozkładzie identycznym jak populacja
generalnej o rozkładzie identycznym jak populacja
generalna
generalna
Rozkład zmiennej losowej
Rozkład zmiennej losowej
X
X
jest dany przez
jest dany przez
dystrybuantę F(x,
dystrybuantę F(x,
zależną od
zależną od
nieznanej
nieznanej
wartości
wartości
parametru
parametru
Parametr rozkładu populacji generalnej
Parametr rozkładu populacji generalnej
jest
jest
przedmiotem estymacji na podstawie próby losowej
przedmiotem estymacji na podstawie próby losowej
(
,
,
,...,
)
X X X
X
n
1
2
3
Andrzej Najgebauer
ESTYMATORY
ESTYMATOREM
ESTYMATOREM
szacowanego
szacowanego
parametru
parametru
rozkładu
rozkładu
F(x,
F(x,
)
)
populacji
populacji
nazywamy
nazywamy
statystykę
statystykę
Z
Z
n
n
= g(X),
= g(X),
której rozkład
której rozkład
prawdopodobieństwa zależy od
prawdopodobieństwa zależy od
szacowanego parametru
szacowanego parametru
i
i
często
często
oznaczamy go
oznaczamy go
n
ˆ
Andrzej Najgebauer
Cechy estymatorów
NIEOBCIĄŻONOŚĆ :
NIEOBCIĄŻONOŚĆ :
Gdy
Gdy
i jest to obciążenie
i jest to obciążenie
estymatora w n - elementowej próbie.
estymatora w n - elementowej próbie.
Niech
Niech
czyli jest to estymator nieobciążony
czyli jest to estymator nieobciążony
estymator wariancji
estymator wariancji
2
2
populacji
populacji
ES
ES
2
2
=(n-1/n)
=(n-1/n)
2
2
- czyli
- czyli
S
S
2
2
jest estymatorem
jest estymatorem
obciążonym
obciążonym
S
S
2
2
1
1
=(n/n-1) S
=(n/n-1) S
2
2
jest estymatorem
jest estymatorem
nieobciążonym
nieobciążonym
E
n
E
b
E
n
n
n
,
(
)
n
n
i
i
n
n
i
i
n
i
i
n
X
n
X
EX m
EX
E
n
X
n
EX
m
1
1
1
1
1
1
oraz
S
n
X
X
i
n
i
n
2
1
2
1
(
)
Andrzej Najgebauer
Cechy estymatorów
Asymptotyczna nieobciążoność:
Asymptotyczna nieobciążoność:
Nazywamy asymptotycznie
Nazywamy asymptotycznie
nieobciążonym
nieobciążonym
Efektywność, asymptotyczna
Efektywność, asymptotyczna
efektywność
efektywność
0
lim
którego
dla
Estymator,
n
n
b
niejszy
najefektyw
znie
asymptotyc
jest
ˆ
1
)
ˆ
e(
lim
,
1
)
ˆ
e(
0
,
)
ˆ
(
)
ˆ
(
)
ˆ
e(
niejszy
najefektyw
ˆ
)
ˆ
(
)
ˆ
(
2
*
2
*
2
*
2
ˆ
n
n
n
n
n
n
n
n
n
n
D
D
D
D
n
Andrzej Najgebauer
Cechy estymatorów
Zgodność
Zgodność
Estymator parametru jest zgodny
Estymator parametru jest zgodny
jeśli
jeśli
0
dla
,
1
}
|
ˆ
{|
lim
czyli
ˆ
.
.
.
n
n
n
n
P
p
i
l
Andrzej Najgebauer
Metody estymacji punktowej
Metoda momentów
Metoda największej
wiarogodności
Metoda najmniejszych kwadratów
Andrzej Najgebauer
Metoda momentów
Momenty zwyczajne są funkcjami
Momenty zwyczajne są funkcjami
nieznanych parametrów:
nieznanych parametrów:
i
k
i
i
k
k
i
k
i
i
k
i
i
i
k
i
i
k
i
M
M
M
g
M
M
M
k
i
m
m
m
g
M
M
M
g
then
g
k
i
m
m
m
g
if
k
i
f
m
parametrów
zgodnymi
mi
estymatora
są
,...,
2
,
1
),
,...,
,
(
ˆ
empiryczne
momenty
oznaczaj
ą
,...,
,
,...,
2
,
1
),
,...,
,
(
)
,...,
,
(
continue,
,...,
2
,
1
),
,...,
,
(
,...,
2
,
1
),
,...,
,
(
2
1
2
1
2
1
2
1
2
1
2
1
Andrzej Najgebauer
Metoda największej
wiarogodności
Gęstość prawdopodobieństwa zmiennej losowej
X, której rozkład zależy od parametrów
Jeżeli jest próbą losową
prostą, to
Jest funkcją wiarogodności
Estymator najwiarygodniejszy:
)
,...,
,
(
1
k
x
f
)
,...,
,
(
2
1
n
X
X
X
n
i
k
i
n
i
k
i
k
n
x
p
x
f
x
x
x
L
1
2
1
1
2
1
2
1
2
1
)
,...,
,
,
(
)
,...,
,
,
(
)
,...,
,
,
,...,
,
(
k
i
L
L
L
i
R
n
k
,...,
2
,
1
,
0
)
(
),
(
max
)
ˆ
(
Andrzej Najgebauer
Metoda najmniejszych
kwadratów
Taki dobór estymatorów, aby
zminimalizować wyrażenie
czyli
)
(
min
)
ˆ
(
)]
(
[
)
(
1
2
S
S
h
x
S
k
R
n
n
i
i
Andrzej Najgebauer
Estymacja przedziałowa
Niech będzie dana próba losowa
Niech będzie dana próba losowa
Rozkład jej zależy od rzeczywistego
Rozkład jej zależy od rzeczywistego
parametru
parametru
Przedział ufności dla parametru
Przedział ufności dla parametru
na
na
poziomie ufności 1-
poziomie ufności 1-
(0<
(0<
<1): (A,B) spełnia
<1): (A,B) spełnia
warunki:
warunki:
Należy oszacować końce przedziału ufności A
Należy oszacować końce przedziału ufności A
i B, które są zmiennymi losowymi.
i B, które są zmiennymi losowymi.
nazywamy
nazywamy
długością przedziału ufności
długością przedziału ufności
)
,...,
,
(
2
1
n
X
X
X
1
))
,...,
(
)
,...,
(
(
od
zależa
nie
)
,...,
(
),
,...,
(
1
1
1
1
n
n
n
n
X
X
B
B
X
X
A
P
X
X
B
B
X
X
A
A
)
,...,
(
)
,...,
(
1
1
n
n
n
X
X
A
X
X
B
l
Andrzej Najgebauer
Hipotezy i testy statystyczne
Hipoteza statystyczna
to przypuszczenie,
to przypuszczenie,
dotyczące rozkładu prawdopodobieństwa
dotyczące rozkładu prawdopodobieństwa
populacji:
populacji:
gdzie
gdzie
F(x)
F(x)
jest dystrybuantą rozkładu
jest dystrybuantą rozkładu
populacji, a
populacji, a
jest pewnym zbiorem
jest pewnym zbiorem
dystrybuant, zwany zbiorem hipotez
dystrybuant, zwany zbiorem hipotez
dopuszczalnych
dopuszczalnych
Dwa typy: hipoteza parametryczna i
Dwa typy: hipoteza parametryczna i
nieparametryczna
nieparametryczna
Test statystyczny
– narzędzie do weryfikacji
– narzędzie do weryfikacji
hipotez na podstawie prób losowych – reguła
hipotez na podstawie prób losowych – reguła
decyzyjna i jednocześnie zmienna losowa
decyzyjna i jednocześnie zmienna losowa
binarna (0- przyjąć hipotezę, 1- odrzucić)
binarna (0- przyjąć hipotezę, 1- odrzucić)
)
(
:
x
F
H
Andrzej Najgebauer
Parametryczne testy
istotności
Hipoteza prosta
Hipoteza prosta
Hipoteza złożona alternatywna
Hipoteza złożona alternatywna
Test statystyczny
Test statystyczny
T
T
oparty na obszarze
oparty na obszarze
krytycznym
krytycznym
nazywa się testem istotności dla
nazywa się testem istotności dla
sprawdzanej hipotezy zerowej (prostej)
sprawdzanej hipotezy zerowej (prostej)
Dla wartości statystyki na próbie losowej
Dla wartości statystyki na próbie losowej
Z
Z
n
n
(
(
X=
X=
(
(
X
X
1
1
,
,
X
X
2
2
,...,
,...,
X
X
n
n
))
))
hipotezę
hipotezę
H
H
0
0
odrzuca się z
odrzuca się z
prawdopodobieństwem błędu I rodzaju
prawdopodobieństwem błędu I rodzaju
(zwanym poziomem istotności)
(zwanym poziomem istotności)
Dla wartości statystyki na próbie losowej Z
Dla wartości statystyki na próbie losowej Z
n
n
(
(
X=
X=
(
(
X
X
1
1
,
,
X
X
2
2
,...,
,...,
X
X
n
n
))
))
stwierdza się jedynie brak
stwierdza się jedynie brak
podstaw do odrzucenia hipotezy
podstaw do odrzucenia hipotezy
H
H
0
0
0
1
0
0
:
:
H
H
Andrzej Najgebauer
Test istotności dla średniej -
przykład
Normalny rozkład populacji
Normalny rozkład populacji
N
N
(
(
,
,
) ze
) ze
znaną wariancją
znaną wariancją
2
2
Hipoteza
Hipoteza
H
H
0
0
:
:
m
m
=
=
m
m
0
0
Hipoteza
Hipoteza
H
H
1
1
:
:
m
m
m
m
0
0
Statystyka przy
Statystyka przy
prawdziwej
prawdziwej
H
H
0
0
ma rozkład normalny
ma rozkład normalny
N
N
(0,1) z obszarem krytycznym Q=
(0,1) z obszarem krytycznym Q=
{
{
U
U
: |
: |
U
U
|>
|>
u
u
}
}
u
u
-kwantyl rozkładu
-kwantyl rozkładu
normalnego
normalnego
N
N
(0,1)
(0,1)
n
m
X
U
0
Andrzej Najgebauer
Nieparametryczne testy
istotności
Testy zgodności – weryfikacja typu
Testy zgodności – weryfikacja typu
rozkładu – badanie zgodności uzyskanego
rozkładu – badanie zgodności uzyskanego
z próby rozkładu empirycznego z
z próby rozkładu empirycznego z
rozkładem hipotetycznym (teoretycznym)
rozkładem hipotetycznym (teoretycznym)
Testy niezależności zmiennych losowych
Testy niezależności zmiennych losowych
(testy losowości) – testy serii, testy
(testy losowości) – testy serii, testy
kombinatoryczne (pokerowy,
kombinatoryczne (pokerowy,
kolekcjonera)
kolekcjonera)
Andrzej Najgebauer
Testy zgodności
Test chi-kwadrat
Test chi-kwadrat
F
F
(x) – nieznany rozkład populacji generalnej
(x) – nieznany rozkład populacji generalnej
F
F
0
0
(x) – rozkład teoretyczny populacji
(x) – rozkład teoretyczny populacji
Grupowanie szeregu rozdzielczego o
Grupowanie szeregu rozdzielczego o
r
r
rozłącznych klasach i
rozłącznych klasach i
licznościach
licznościach
n
n
i
i
w i-tej klasie
w i-tej klasie
Dla empirycznego szeregu rozdzielczego wyznacza się
Dla empirycznego szeregu rozdzielczego wyznacza się
prawdopodobieństwa
prawdopodobieństwa
p
p
i
i
otrzymania w rozkładzie
otrzymania w rozkładzie
F
F
0
0
(x)
(x)
wyniku próby należącego do i-tej klasy
wyniku próby należącego do i-tej klasy
Dla każdej klasy i wyznacza się liczebności teoretyczne
Dla każdej klasy i wyznacza się liczebności teoretyczne
np
np
i
i
Wyznacza się wartość statystyki
Wyznacza się wartość statystyki
2
2
:
:
Wyznacza się obszar krytyczny
Wyznacza się obszar krytyczny
Porównanie
Porównanie
Test zgodności
Test zgodności
-Kołmogorowa, Kołmogorowa-Smirnowa
-Kołmogorowa, Kołmogorowa-Smirnowa
r
i
i
i
i
np
np
n
1
2
2
)
(
0
2
2
2
2
2
2
odrzucamy
to
,
Gdy
}
{
},
:
{
H
Q
P
Q