1
Projektowanie
Eksperymentów
Symulacyjnych
dr inż. Dariusz Pierzchała
dr inż. Dariusz Pierzchała
2
Podstawowe zagadnienia
model symulacyjny
model symulacyjny
rodzaje modeli symulacyjnych
rodzaje modeli symulacyjnych
etapy budowy modelu
etapy budowy modelu
warunki początkowe i końcowe
warunki początkowe i końcowe
momenty gromadzenia danych
momenty gromadzenia danych
identyfikacja typu rozkładu badanej
identyfikacja typu rozkładu badanej
charakterystyki
charakterystyki
czas trwania eksperymentu a liczba powtórzeń
czas trwania eksperymentu a liczba powtórzeń
plany losowania i plany eksperymentów
plany losowania i plany eksperymentów
metody redukcji wariancji estymatorów
metody redukcji wariancji estymatorów
przygotowanie „narzędzi” do statystycznej
przygotowanie „narzędzi” do statystycznej
analizy symulacji
analizy symulacji
3
Symulacja komputerowa
Symulacja komputerowa - metoda badania
Symulacja komputerowa - metoda badania
lub naśladowania systemu rzeczywistego lub
lub naśladowania systemu rzeczywistego lub
teoretycznego poprzez zbudowanie jego
teoretycznego poprzez zbudowanie jego
modelu i jego implementacji komputerowej
modelu i jego implementacji komputerowej
a następnie eksperymentowanie na modelu i
a następnie eksperymentowanie na modelu i
analiza uzyskanych wyników.
analiza uzyskanych wyników.
[Najgebauer „Informatyczne systemy
[Najgebauer „Informatyczne systemy
wspomagania decyzji ...”]
wspomagania decyzji ...”]
Symulacja uosabia zasadę „poznawania
Symulacja uosabia zasadę „poznawania
poprzez wykonywanie”
poprzez wykonywanie”
4
Proces symulacji
W procesie symulacji można wyróżnić trzy
W procesie symulacji można wyróżnić trzy
zasadnicze fazy:
zasadnicze fazy:
Budowa modelu symulacyjnego – obejmuje:
Budowa modelu symulacyjnego – obejmuje:
konstruowanie modelu matematycznego, odpowiadającego
konstruowanie modelu matematycznego, odpowiadającego
głównemu celu modelowania;
głównemu celu modelowania;
jego implementację komputerową, zależną od typu modelu i
jego implementację komputerową, zależną od typu modelu i
stosowanego języka symulacyjnego;
stosowanego języka symulacyjnego;
opracowanie planu eksperymentu.
opracowanie planu eksperymentu.
Eksperymentowanie – faza realizowania planu badań
Eksperymentowanie – faza realizowania planu badań
symulacyjnych – w zależności od zakresu badań może być
symulacyjnych – w zależności od zakresu badań może być
bardzo czasochłonna
bardzo czasochłonna
Analiza wyników eksperymentów - polega na
Analiza wyników eksperymentów - polega na
przeprowadzeniu estymacji wyznaczanych charakterystyk,
przeprowadzeniu estymacji wyznaczanych charakterystyk,
przeprowadzeniu weryfikacji postawionych w fazie
przeprowadzeniu weryfikacji postawionych w fazie
początkowej hipotez, wyznaczeniu modelu regresji itp.
początkowej hipotez, wyznaczeniu modelu regresji itp.
5
Model symulacyjny
Model symulacyjny definiujemy jako:
Model symulacyjny definiujemy jako:
model formalny,
model formalny,
jego reprezentacja komputerowa dla potrzeb symulacji,
jego reprezentacja komputerowa dla potrzeb symulacji,
projekt eksperymentu,
projekt eksperymentu,
metoda analizy wyników eksperymentów symulacyjnych.
metoda analizy wyników eksperymentów symulacyjnych.
Składniki modelu:
Składniki modelu:
stany - opisują system w przedziale czasu; To kombinacja
stany - opisują system w przedziale czasu; To kombinacja
wartości zmiennych powstała, gdy każdemu atrybutowi obiektu
wartości zmiennych powstała, gdy każdemu atrybutowi obiektu
przyporządkujemy pewną zmienną, której zakres wartości
przyporządkujemy pewną zmienną, której zakres wartości
odpowiada wartościom, przyjmowanym przez ten atrybut;
odpowiada wartościom, przyjmowanym przez ten atrybut;
zdarzenia - zmiana stanu w ustalonej chwili ;
zdarzenia - zmiana stanu w ustalonej chwili ;
czas.
czas.
Przenoszenie systemu ze stanu do stanu zgodnie z
Przenoszenie systemu ze stanu do stanu zgodnie z
określonymi zasadami jest zatem symulacją;
określonymi zasadami jest zatem symulacją;
6
Klasyfikacja modeli symulacyjnych -I
konceptualne (opisowe),
konceptualne (opisowe),
deklaratywne (wyróżnia się stany i zdarzenia),
deklaratywne (wyróżnia się stany i zdarzenia),
funkcjonalne (wyróżnia się funkcje i zmienne –
funkcjonalne (wyróżnia się funkcje i zmienne –
np. w modelu obiektu),
np. w modelu obiektu),
wyrażające zależności (ograniczone –
wyrażające zależności (ograniczone –
odzwierciedlają prawa rządzące działaniem
odzwierciedlają prawa rządzące działaniem
badanych systemów),
badanych systemów),
przestrzenne (wyrażające dekompozycję
przestrzenne (wyrażające dekompozycję
przestrzeni – przestrzeń jest obiektem lub
przestrzeni – przestrzeń jest obiektem lub
elementy przestrzeni są obiektami),
elementy przestrzeni są obiektami),
multimodele (grafowe lub sieciowe modele
multimodele (grafowe lub sieciowe modele
złożone z innych typów);
złożone z innych typów);
7
Klasyfikacja modeli symulacyjnych -II
statyczne – pomijają czas lub opisują chwilowy stan
statyczne – pomijają czas lub opisują chwilowy stan
systemu w pewnym momencie (np. układ równań
systemu w pewnym momencie (np. układ równań
różniczkowych Chapmana-Kołmogorowa opisujących SMO
różniczkowych Chapmana-Kołmogorowa opisujących SMO
w stanie ustalonym);
w stanie ustalonym);
dynamiczne – wyraźnie podkreślają zjawisko czasu (np.
dynamiczne – wyraźnie podkreślają zjawisko czasu (np.
układ równań różniczkowych Chapmana-Kołmogorowa
układ równań różniczkowych Chapmana-Kołmogorowa
opisujących SMO w stanie przejściowym);
opisujących SMO w stanie przejściowym);
deterministyczne – brak losowych zależności w modelu
deterministyczne – brak losowych zależności w modelu
(np. prosty dwurównaniowy model Keynesowski zależności
(np. prosty dwurównaniowy model Keynesowski zależności
między dochodem narodowym i konsumpcją (bez
między dochodem narodowym i konsumpcją (bez
składnika losowego));
składnika losowego));
stochastyczne – niektóre z zależności w modelu mają
stochastyczne – niektóre z zależności w modelu mają
charakter losowy (np. w systemie obsługi klientów w
charakter losowy (np. w systemie obsługi klientów w
banku - losowy odstęp czasu między przybyciami klientów
banku - losowy odstęp czasu między przybyciami klientów
do kolejki do kasy itp.).
do kolejki do kasy itp.).
8
Klasyfikacja modeli symulacyjnych -III
Podział modeli symulacyjnych ze względu
Podział modeli symulacyjnych ze względu
na stopień znajomości stanu elementów
na stopień znajomości stanu elementów
systemu, którego są modelem:
systemu, którego są modelem:
Stopień znajomości stanu elementów systemu
Typ modelu
symulacyjnego
Wejścia systemu
Formalny opis stanu
systemu lub procesów
zachodzących
w systemie
Wyjścia systemu
Pierwszy
znane
nie znany
znane
Drugi
znane
znany
nie znane
Trzeci
nie znane
znany
znane
9
Klasyfikacja modeli symulacyjnych -III
Modele
Modele
typu pierwszego:
typu pierwszego:
służą do naśladowania (identyfikacji) procesu lub
służą do naśladowania (identyfikacji) procesu lub
układu;
układu;
znany jest stan wejść i wyjść systemu (np.
znany jest stan wejść i wyjść systemu (np.
empirycznie), natomiast nie jest znany formalny
empirycznie), natomiast nie jest znany formalny
opis procesów zachodzących w systemie lub stanu
opis procesów zachodzących w systemie lub stanu
systemu;
systemu;
model ten wykorzystuje się do sprawdzania
model ten wykorzystuje się do sprawdzania
prawdziwości hipotez co do stanu systemu lub
prawdziwości hipotez co do stanu systemu lub
procesów w nim zachodzących (np. identyfikacja
procesów w nim zachodzących (np. identyfikacja
rodzaju funkcji trendu w modelach tendencji
rodzaju funkcji trendu w modelach tendencji
rozwojowej).
rozwojowej).
10
Klasyfikacja modeli symulacyjnych -III
Modele
Modele
typu drugiego:
typu drugiego:
służą do badania systemu wprost;
służą do badania systemu wprost;
znany jest stan wejść systemu i formalny opis
znany jest stan wejść systemu i formalny opis
stanu systemu lub procesów zachodzących w
stanu systemu lub procesów zachodzących w
systemie, natomiast nie jest znany stan wyjść
systemie, natomiast nie jest znany stan wyjść
systemu;
systemu;
model ten wykorzystuje się do naśladowania
model ten wykorzystuje się do naśladowania
efektów np. decyzji. Sprawdzenie efektów decyzji
efektów np. decyzji. Sprawdzenie efektów decyzji
drogą symulacyjną, przed ich zastosowaniem w
drogą symulacyjną, przed ich zastosowaniem w
praktyce, może być bardziej owocne niż ich
praktyce, może być bardziej owocne niż ich
sprawdzenie metodą „prób i błędów”;
sprawdzenie metodą „prób i błędów”;
11
Klasyfikacja modeli symulacyjnych -III
Modele
Modele
typu trzeciego:
typu trzeciego:
służą do naśladowania optymalnego
służą do naśladowania optymalnego
sterowania;
sterowania;
znany jest stan wyjść systemu i formalny opis
znany jest stan wyjść systemu i formalny opis
stanu systemu lub procesów zachodzących w
stanu systemu lub procesów zachodzących w
systemie, natomiast nie jest znany stan wejść
systemie, natomiast nie jest znany stan wejść
systemu;
systemu;
ten model wykorzystuje się m.in. do
ten model wykorzystuje się m.in. do
kierowania programowanego;
kierowania programowanego;
12
Klasyfikacja symulacji
Symulacja interaktywna to taki sposób prowadzenia eksperymentu,
Symulacja interaktywna to taki sposób prowadzenia eksperymentu,
w którym użytkownik (badacz) może wpływać na jego przebieg w
w którym użytkownik (badacz) może wpływać na jego przebieg w
trakcie trwania eksperymentu poprzez zmianę parametrów modelu
trakcie trwania eksperymentu poprzez zmianę parametrów modelu
symulacyjnego.
symulacyjnego.
Rozproszona symulacja interaktywna (ang. Distributed Interactive
Rozproszona symulacja interaktywna (ang. Distributed Interactive
Simulation,DIS) realizacja eksperymentu symulacyjnego w
Simulation,DIS) realizacja eksperymentu symulacyjnego w
rozproszonym środowisku komputerowym.
rozproszonym środowisku komputerowym.
czasem
zdarzeniami
ciągła
Symulacja
dyskretna
Symulacja
t
0
t
0
t
k
t
1
t
k+1
= t
k
+ t, t=const
e
0
e
1
e
2
e
k
...
e
n
...
13
Etapy budowy modelu symulacyjnego
(1) określenie systemu;
(1) określenie systemu;
(2) sformułowanie modelu;
(2) sformułowanie modelu;
(3) ustalenie danych dla modelu;
(3) ustalenie danych dla modelu;
(4) zaprogramowanie modelu;
(4) zaprogramowanie modelu;
(5) planowanie
eksperymentów
(5) planowanie
eksperymentów
symulacyjnych;
symulacyjnych;
(6) ocenę uzyskanych wyników;
(6) ocenę uzyskanych wyników;
(7) ocenę adekwatności modelu;
(7) ocenę adekwatności modelu;
(8)
(8)
dokumentowanie.
dokumentowanie.
14
Warunki początkowe i końcowe
Traktujemy model symulacyjny jak „czarną
Traktujemy model symulacyjny jak „czarną
skrzynkę” a następnie:
skrzynkę” a następnie:
określamy zestawy danych wejściowych;
określamy zestawy danych wejściowych;
ustalamy zestawy charakterystyk
ustalamy zestawy charakterystyk
wyjściowych;
wyjściowych;
dobieramy estymatory badanych
dobieramy estymatory badanych
charakterystyk - określamy ich populację
charakterystyk - określamy ich populację
generalną i rozkłady tych populacji;
generalną i rozkłady tych populacji;
ustalamy kryteria jakości badań
ustalamy kryteria jakości badań
symulacyjnych.
symulacyjnych.
15
Określenie zestawów danych
wejściowych
Eksperyment realizowany jest dla wielu parametrów
Eksperyment realizowany jest dla wielu parametrów
wejściowych i dla ustalonego zakresu zmienności tych
wejściowych i dla ustalonego zakresu zmienności tych
parametrów.
parametrów.
x
x
j
j
jmin
jmin
,
,
jmax
jmax
,
,
Doświadczenie rozpoczynamy od typowej konfiguracji
Doświadczenie rozpoczynamy od typowej konfiguracji
zmiennych wejściowych a następnie zmieniając jedną z
zmiennych wejściowych a następnie zmieniając jedną z
nich obserwujemy, jaki był efekt tej zmiany na odpowiedź
nich obserwujemy, jaki był efekt tej zmiany na odpowiedź
systemu.
systemu.
Dopuszczalne a nawet wymagane są zestawy danych
Dopuszczalne a nawet wymagane są zestawy danych
„nierealnych” lub niespotykanych w rzeczywistości –
„nierealnych” lub niespotykanych w rzeczywistości –
dlaczego?
dlaczego?
eksperymen
t
na obiekcie
badanym
x
1
x
2
x
m
we
wy
k
K
1,
j
m
1,
16
Określenie zestawów danych
wejściowych
E
E
ksperymenty symulacyjne prowadz
ksperymenty symulacyjne prowadz
one są
one są
m.in.
m.in.
po
po
to, by określić jakie mogą być konsekwencje
to, by określić jakie mogą być konsekwencje
przyjętych w danym eksperymencie założeń o
przyjętych w danym eksperymencie założeń o
zmianach
zmianach
wartości parametrów wejściowych.
wartości parametrów wejściowych.
Dają możliwość
Dają możliwość
analiz
analiz
y
y
przyszłych możliwych stanów
przyszłych możliwych stanów
systemu, np.
systemu, np.
gospodarki
gospodarki
narodowej.
narodowej.
Rezultaty analizy sprowadzają się
Rezultaty analizy sprowadzają się
często
często
do stwierdzeń
do stwierdzeń
typu
typu
:
:
„J
„J
eżeli ukształtują się
eżeli ukształtują się
dane
dane
warunki
warunki
,
,
przebieg
przebieg
zjawiska
zjawiska
będzie
będzie
następujący i prowadzona
następujący i prowadzona
będzie dana
będzie dana
polityka
polityka
decyzyjna,
decyzyjna,
to wtedy osiągnięte zostaną
to wtedy osiągnięte zostaną
następujące wyniki”
następujące wyniki”
.
.
Dla odróżnienia „p
Dla odróżnienia „p
rognoza
rognoza
”
”
mówi nam o tym, jak
mówi nam o tym, jak
najprawdopodobniej ukształtuje się
najprawdopodobniej ukształtuje się
określone
określone
zjawisko
zjawisko
w przyszłości.
w przyszłości.
17
Określenie zestawów danych
wejściowych
Dla wielu parametrów wejściowych i dla
Dla wielu parametrów wejściowych i dla
ustalonego zakresu zmienności tych
ustalonego zakresu zmienności tych
parametrów konstruuje się
parametrów konstruuje się
plan
plan
eksperymentu
eksperymentu
.
.
Planem eksperymentu nazywa się tablicę:
Planem eksperymentu nazywa się tablicę:
x
x
ij
ij
- oznacza wartość czynnika
- oznacza wartość czynnika
x
x
j
j
w
w
i
i
-tym
-tym
powtórzeniu eksperymentu
powtórzeniu eksperymentu
max
min
,
,
2
,
1
,
,
1
,
1
,
,
,...,
,...,
,
j
j
j
jnj
j
j
j
j
ij
m
j
n
i
ij
X
x
x
Q
18
Określenie zestawów danych
wejściowych
Pełne doświadczenia czynnikowe
Pełne doświadczenia czynnikowe
Doświadczenie polega na sprawdzeniu wszystkich
Doświadczenie polega na sprawdzeniu wszystkich
możliwych
kombinacji
wszystkich
zmiennych
możliwych
kombinacji
wszystkich
zmiennych
wejściowych (czynników) i na wszystkich poziomach
wejściowych (czynników) i na wszystkich poziomach
wartości. Wymaga to przeprowadzenie
wartości. Wymaga to przeprowadzenie
„
„
n*m”
n*m”
prób
prób
.
.
Zaletą pełnego doświadczenia czynnikowego jest to, że
Zaletą pełnego doświadczenia czynnikowego jest to, że
badając wszystkie możliwe przypadki, możemy znaleźć
badając wszystkie możliwe przypadki, możemy znaleźć
wpływ na odpowiedź systemu każdego czynnika z
wpływ na odpowiedź systemu każdego czynnika z
osobna oraz oddziaływań między nimi.
osobna oraz oddziaływań między nimi.
Główną wadą jest natomiast wysoki koszt takiego
Główną wadą jest natomiast wysoki koszt takiego
badania biorąc pod uwagę fakt, że każdy pojedyncze
badania biorąc pod uwagę fakt, że każdy pojedyncze
doświadczenie może być wielokrotnie powtórzone.
doświadczenie może być wielokrotnie powtórzone.
Koszt ten może być mierzony czasem realizacji
Koszt ten może być mierzony czasem realizacji
przedsięwzięcia oraz kosztem ekonomicznym.
przedsięwzięcia oraz kosztem ekonomicznym.
19
Określenie zestawów danych
wejściowych
Są trzy sposoby redukcji liczby pojedynczych
Są trzy sposoby redukcji liczby pojedynczych
eksperymentów:
eksperymentów:
zmniejszenie liczby poziomów każdego czynnika
zmniejszenie liczby poziomów każdego czynnika
zmniejszenie liczby czynników
zmniejszenie liczby czynników
użycie ułamkowego doświadczenia czynnikowego.
użycie ułamkowego doświadczenia czynnikowego.
W niektórych przypadkach możemy chcieć
W niektórych przypadkach możemy chcieć
sprawdzić jedynie
sprawdzić jedynie
dwa poziomy
dwa poziomy
dla każdego
dla każdego
czynnika a następnie określić względną ich wagę
czynnika a następnie określić względną ich wagę
oraz wpływ na odpowiedź systemu.
oraz wpływ na odpowiedź systemu.
Pełne doświadczenie czynnikowe, w którym
Pełne doświadczenie czynnikowe, w którym
wykorzystywanych jest k zmiennych wejściowych o
wykorzystywanych jest k zmiennych wejściowych o
dwóch
dwóch
poziomach
poziomach
wartości wymaga
wartości wymaga
przeprowadzenia 2
przeprowadzenia 2
k
k
eksperymentów.
eksperymentów.
20
Określenie zestawów danych
wejściowych
Ułamkowe doświadczenia czynnikowe
Ułamkowe doświadczenia czynnikowe
Stosowane, gdy liczba eksperymentów
Stosowane, gdy liczba eksperymentów
jest zbyt duża.
jest zbyt duża.
Ograniczenie liczby wymaganych
Ograniczenie liczby wymaganych
eksperymentów poprzez
eksperymentów poprzez
jednoczesne
jednoczesne
:
:
zmniejszenie liczby czynników podlegających
zmniejszenie liczby czynników podlegających
ocenie,
ocenie,
zmniejszenie liczby poziomów badanych
zmniejszenie liczby poziomów badanych
czynników.
czynników.
21
Określenie zestawów danych
wejściowych
I
I
nne układy eksperymentów
nne układy eksperymentów
układy czynnikowe z częściową
układy czynnikowe z częściową
replikacją,
replikacją,
układy obrotowe,
układy obrotowe,
kwadraty łacińskie,
kwadraty łacińskie,
kwadraty grecko-łacińskie,
kwadraty grecko-łacińskie,
układy powierzchni reakcji
układy powierzchni reakcji
22
Szacowanie liczności próby
Liczność próby
Liczność próby
ma znaczący wpływ na
ma znaczący wpływ na
dokładność uzyskanych estymatorów
dokładność uzyskanych estymatorów
.
.
W
W
obec
obec
tego
tego
prostą, lecz skuteczną metodą
prostą, lecz skuteczną metodą
nadzorowania symulacji jest obliczanie na
nadzorowania symulacji jest obliczanie na
bieżąco wartości wariancji z próby dla
bieżąco wartości wariancji z próby dla
szacowanych charakterystyk i parametrów.
szacowanych charakterystyk i parametrów.
Na
Na
etapie przygotowania eksperymentu
etapie przygotowania eksperymentu
można ocenić,
można ocenić,
jaka musi być liczność
jaka musi być liczność
próby, aby uzyskać
próby, aby uzyskać
oszacowanie
oszacowanie
na
na
ustalonym poziomie ufności
ustalonym poziomie ufności
.
.
23
Szacowanie liczności próby
Najczęściej rozkład populacji generalnej
Najczęściej rozkład populacji generalnej
jest normalny N(
jest normalny N(
,
,
)
)
,
,
ale oba parametry
ale oba parametry
tego rozkładu
tego rozkładu
zazwyczaj
zazwyczaj
nie są znane i
nie są znane i
muszą być szacowane na podstawie
muszą być szacowane na podstawie
próby.
próby.
Aby poznać wartoś
Aby poznać wartoś
ć
ć
parametru
parametru
,
,
dokonuje się losowania wstępnej próby,
dokonuje się losowania wstępnej próby,
zwanej pilotażową, o liczności
zwanej pilotażową, o liczności
n
n
0
0
i oblicza
i oblicza
się z niej wartość statystyki
się z niej wartość statystyki
:
:
z
U
i
U
i
n
n
X
X
1
1
0
2
1
0
(
)
24
Szacowanie liczności próby
N
N
astępnie
astępnie
ze wzoru:
ze wzoru:
z
z
najdujemy minimalną liczność próby
najdujemy minimalną liczność próby
,
,
gdzie
gdzie
g
g
jest połową długości
jest połową długości
przedziału
przedziału
ufności
ufności
:
:
2
g
k
z
n
P X k
X X k
n
n
1
25
Szacowanie liczności próby
Jeżeli nie możemy lub nie chcemy
Jeżeli nie możemy lub nie chcemy
przyjmować założenia o normalności
przyjmować założenia o normalności
rozkładu populacji generalnej, to możemy
rozkładu populacji generalnej, to możemy
skorzystać z nierówności Czebyszewa:
skorzystać z nierówności Czebyszewa:
Wymagana jest znajomość wartości
Wymagana jest znajomość wartości
odchylenia standardowego s zmiennej
odchylenia standardowego s zmiennej
losowej X - jeżeli nie jest ono znane,
losowej X - jeżeli nie jest ono znane,
można zastosować oszacowanie:
można zastosować oszacowanie:
z
U
i
U
i
n
n
X
X
1
1
0
2
1
0
(
)
1
}
|
{|X
P
26
Szacowanie liczności próby
Z nierówności Czebyszewa wynika, że
Z nierówności Czebyszewa wynika, że
dla próby losowej x
dla próby losowej x
1
1
, x
, x
2
2
,...,x
,...,x
n
n
, dla której:
, dla której:
otrzymujemy:
otrzymujemy:
Z założenia poziom ufności wynosi 1-a,
Z założenia poziom ufności wynosi 1-a,
więc:
więc:
n
n
1
1
ˆ
i
i
x
x
2
2
1
}
|
{|
n
x
P
1
1
2
2
n
2
2
n
27
Ustalenie zestawu charakterystyk
wyjściowych
Wielokrotne przeprowadzenie eksperymentu
Wielokrotne przeprowadzenie eksperymentu
umożliwia powtórzenie badania systemu dla
umożliwia powtórzenie badania systemu dla
różnych chwil
różnych chwil
t
t
r
r
,
,
r
r
- kolejny
- kolejny
eksperyment
eksperyment
.
.
W „określonych” momentach gromadzone są
W „określonych” momentach gromadzone są
potrzebne dane.
potrzebne dane.
Na podstawie uzyskanych
Na podstawie uzyskanych
r
r
wartości
wartości
badanych charakterystyk systemu otrzymuje
badanych charakterystyk systemu otrzymuje
się próbę losową
się próbę losową
pewnej
pewnej
populacji
populacji
generalnej wszystkich
generalnej wszystkich
możliwych
możliwych
wyników
wyników
eksperymentów dla obserwowan
eksperymentów dla obserwowan
ych
ych
charakterystyk.
charakterystyk.
28
Ustalenie zestawu charakterystyk
wyjściowych
Zasadniczym celem symulacji jest wyznaczenie
Zasadniczym celem symulacji jest wyznaczenie
charakterystyk procesów stacjonarnych (ustalonych),
charakterystyk procesów stacjonarnych (ustalonych),
tzn. charakterystyk granicznego rozkładu
tzn. charakterystyk granicznego rozkładu
prawdopodobieństwa F(x) zmiennej losowej X
prawdopodobieństwa F(x) zmiennej losowej X
(pewnej charakterystyki badanego systemu), tj.
(pewnej charakterystyki badanego systemu), tj.
rozkładu, dla którego:
rozkładu, dla którego:
Przykładowe charakterystyki:
Przykładowe charakterystyki:
Terminowość realizacji
Terminowość realizacji
poszczególnych
poszczególnych
etapów
etapów
decyzyjnych;
decyzyjnych;
Oczekiwana liczba klientów w oddziale banku w ciągu dnia;
Oczekiwana liczba klientów w oddziale banku w ciągu dnia;
Wskaźnik rynku papierów wartościowych
Wskaźnik rynku papierów wartościowych
;
;
)
(
}
{
lim
x
F
x
X
P
n
n
29
Ustalenie zestawu charakterystyk
wyjściowych
Estymacja takich charakterystyk rozkładu F(x), jak
Estymacja takich charakterystyk rozkładu F(x), jak
średnia lub wariancja, na podstawie próby X
średnia lub wariancja, na podstawie próby X
1
1
,
,
X
X
2
2
, ..., X
, ..., X
n
n
i za pomocą znanych metod statystyki
i za pomocą znanych metod statystyki
matematycznej napotyka następujące trudności:
matematycznej napotyka następujące trudności:
nie jest znany a priori moment (oznaczmy go przez
nie jest znany a priori moment (oznaczmy go przez
m
m
),
),
od którego wszystkie kolejne zmienne losowe X
od którego wszystkie kolejne zmienne losowe X
m+1
m+1
,
,
X
X
m+2
m+2
, ..., X
, ..., X
n
n
mają rozkład F(x); okres od
mają rozkład F(x); okres od
1
1
do
do
m
m
nosi
nosi
nazwę
nazwę
fazy przejściowej
fazy przejściowej
;
;
warunkiem prawidłowej estymacji jest założenie, że
warunkiem prawidłowej estymacji jest założenie, że
rozkład F(x) jest rozkładem normalnym.
rozkład F(x) jest rozkładem normalnym.
zmienne losowe X
zmienne losowe X
i
i
są najczęściej skorelowane (zwykle
są najczęściej skorelowane (zwykle
dodatnio), a zatem nie są niezależne, co wyklucza
dodatnio), a zatem nie są niezależne, co wyklucza
możliwość zastosowania wprost reguł estymacji
możliwość zastosowania wprost reguł estymacji
zakładających niezależność elementów próby;
zakładających niezależność elementów próby;
30
Ustalenie zestawu charakterystyk
wyjściowych
skorelowane zmienne losowe X
skorelowane zmienne losowe X
i
i
Rozwiązanie 1: metoda niezależnych przebiegów
Rozwiązanie 1: metoda niezależnych przebiegów
(metoda replikacji):
(metoda replikacji):
wykonanie r niezależnych przebiegów symulacyjnych;
wykonanie r niezależnych przebiegów symulacyjnych;
wyznaczenie estymatorów punktowych żądanych parametrów
wyznaczenie estymatorów punktowych żądanych parametrów
w poszczególnych przebiegach;
w poszczególnych przebiegach;
przyjęcie za wynik średniej z ustalonych w ten sposób
przyjęcie za wynik średniej z ustalonych w ten sposób
estymatorów;
estymatorów;
odpowiednie przedziały ufności można również zbudować na
odpowiednie przedziały ufności można również zbudować na
podstawie wyznaczonego ciągu r estymatorów – z powodu
podstawie wyznaczonego ciągu r estymatorów – z powodu
niezależności przebiegów niezależne są także poszczególne
niezależności przebiegów niezależne są także poszczególne
estymatory.
estymatory.
(Wykonując kolejne przebiegi symulacyjne należy pamiętać o
(Wykonując kolejne przebiegi symulacyjne należy pamiętać o
odcięciu fazy przejściowej)
odcięciu fazy przejściowej)
31
Ustalenie zestawu charakterystyk
wyjściowych
skorelowane zmienne losowe X
skorelowane zmienne losowe X
i
i
Rozwiązanie 2: metoda pojedynczego
Rozwiązanie 2: metoda pojedynczego
przebiegu:
przebiegu:
Podstawę estymacji charakterystyk procesu przy
Podstawę estymacji charakterystyk procesu przy
tym podejściu stanowią wyniki pojedynczego
tym podejściu stanowią wyniki pojedynczego
przebiegu symulacyjnego, odpowiednio długiego i
przebiegu symulacyjnego, odpowiednio długiego i
podzielonego na rozłączne odcinki;
podzielonego na rozłączne odcinki;
Pojęcie odcinka jest utożsamiane z pojedynczym
Pojęcie odcinka jest utożsamiane z pojedynczym
przebiegiem w metodzie niezależnych przebiegów
przebiegiem w metodzie niezależnych przebiegów
(do szacowania poszczególnych parametrów stosuje
(do szacowania poszczególnych parametrów stosuje
się wprost procedury estymacji wykorzystywane w
się wprost procedury estymacji wykorzystywane w
metodzie niezależnych przebiegów);
metodzie niezależnych przebiegów);
32
Estymatory charakterystyk
Uzyskane podczas symulacji
Uzyskane podczas symulacji
zbiory danych,
zbiory danych,
zawierające realizacje zmiennych losowych
zawierające realizacje zmiennych losowych
oraz wartości charakterystyk są
oraz wartości charakterystyk są
liczne
liczne
, wobec
, wobec
czego do dalszej analizy należy je przekształcić
czego do dalszej analizy należy je przekształcić
przy pomocy określonej funkcji próby losowej,
przy pomocy określonej funkcji próby losowej,
będącej również zmienną losową
będącej również zmienną losową
, tzn.
, tzn.
statystyk
statystyk
i
i
.
.
W celu oszacowania ustalonych w wyniku
W celu oszacowania ustalonych w wyniku
grania charakterystyk, należy uzyskać na
grania charakterystyk, należy uzyskać na
podstawie próby wartości
podstawie próby wartości
specjalnych statystyk
specjalnych statystyk
zwanych
zwanych
estymator
estymator
ami
ami
tych charakterystyk.
tych charakterystyk.
33
Identyfikacja typu rozkładu badanej
ch-yki
Załóżmy, że otrzymaliśmy realizację próby losowej dla
Załóżmy, że otrzymaliśmy realizację próby losowej dla
wartości wybranej charakterystyki X
wartości wybranej charakterystyki X
.
.
Jest to skończony
Jest to skończony
ciąg liczb:
ciąg liczb:
x
x
1
1
, x
, x
2
2
, ..., x
, ..., x
i
i
, ..., x
, ..., x
n
n
Przekształćmy
ten
ciąg
do
postaci
ciągu
Przekształćmy
ten
ciąg
do
postaci
ciągu
uporządkowanego rosnąco, tzn.
uporządkowanego rosnąco, tzn.
x
x
*
*
1
1
, x
, x
*
*
2
2
, ..., x
, ..., x
*
*
i
i
, ..., x
, ..., x
*
*
n
n
,
,
dla którego
dla którego
x
x
*
*
i+1
i+1
x
x
*
*
i
i
,
,
Następnie podzielmy obserwacje x
Następnie podzielmy obserwacje x
*
*
1
1
, x
, x
*
*
2
2
, ..., x
, ..., x
*
*
i
i
, ..., x
, ..., x
*
*
n
n
na R rozłącznych klas, R
na R rozłącznych klas, R
n
n
, tworząc szereg
, tworząc szereg
rozdzielczy, z którego możemy otrzymać dystrybuantę
rozdzielczy, z którego możemy otrzymać dystrybuantę
empiryczną F
empiryczną F
n
n
(x)
(x)
34
Identyfikacja typu rozkładu badanej
ch-yki
Dystrybuanta
Dystrybuanta
empiryczna:
empiryczna:
gdzie :
gdzie :
x
x
s
s
r
r
- środek r-tej klasy ;
- środek r-tej klasy ;
m
m
r
r
- liczność r-tej klasy,
- liczność r-tej klasy,
przy czym zachodzi .
przy czym zachodzi .
x
<
dla
1
dla
dla
0
)
(
1
1
1
1
s
R
s
r
s
r
i
i
s
x
x
x
x
n
m
x
x
x
F
n
35
Identyfikacja typu rozkładu badanej
ch-yki
Oznaczmy przez F
Oznaczmy przez F
0
0
dystrybuantę teoretyczną rozkładu
dystrybuantę teoretyczną rozkładu
populacji generalnej. Będziemy sprawdzać hipotezę
populacji generalnej. Będziemy sprawdzać hipotezę
H
H
: F
: F
0
0
= F
= F
n
n
.
.
Można pokazać, że następująca statystyka:
Można pokazać, że następująca statystyka:
przy dużym
przy dużym
n
n
i założeniu prawdziwości hipotezy
i założeniu prawdziwości hipotezy
H
H
dąży do
dąży do
rozkładu
rozkładu
2
2
-Pearsona o R-1 stopniach swobody. Ograniczeniem
-Pearsona o R-1 stopniach swobody. Ograniczeniem
dla tej metody jest konieczność posiadania dużej próby (
dla tej metody jest konieczność posiadania dużej próby (
n
n
30)
30)
oraz
oraz
m
m
r
r
5
5
,
,
.
.
Obszar krytyczny dla testu Pearsona jest
Obszar krytyczny dla testu Pearsona jest
postaci
postaci
, gdzie
, gdzie
jest kwantylem rozkładu
jest kwantylem rozkładu
2
2
dla R-1
dla R-1
stopni swobody przy poziomie istotności
stopni swobody przy poziomie istotności
.
.
m
F x
F x
F x
F x
r
r
s
r
s
r
s
r
s
r
R
n
n
(
)
( )
(
)
( )
1
2
1
1
R
(
, )
1
2
1
2
r
R
1,
36
Analiza regresji
W analizie wyników symulacji
W analizie wyników symulacji
wykorzystuje się analizę regresji;
wykorzystuje się analizę regresji;
Jest to narzędzie do ustalenia postaci
Jest to narzędzie do ustalenia postaci
funkcyjnej zależności między pewnymi
funkcyjnej zależności między pewnymi
charakterystykami
charakterystykami
(np. na wejściu systemu mierzymy
(np. na wejściu systemu mierzymy
wartości pewnej charakterystyki X, a na
wartości pewnej charakterystyki X, a na
wyjściu tego systemu – wartości
wyjściu tego systemu – wartości
charakterystyki Y);
charakterystyki Y);
37
Analiza regresji
Model:
Model:
y
y
t
t
=f
=f
t
t
(x
(x
1t
1t
, x
, x
2t
2t
,..., x
,..., x
kt
kt
,..., x
,..., x
Kt
Kt
,
,
t
t
), t=1,2,...,n,
), t=1,2,...,n,
k=1,2,...,K
k=1,2,...,K
y - zmienna objaśniana, regresant
y - zmienna objaśniana, regresant
x - zmienna objaśniająca, regresor,
x - zmienna objaśniająca, regresor,
- składnik losowy,
- składnik losowy,
t - numer kolejnej obserwacji,
t - numer kolejnej obserwacji,
k - numer kolejnej zmiennej objaśniającej
k - numer kolejnej zmiennej objaśniającej
38
Analiza regresji
Rodzaje zależności:
Rodzaje zależności:
Zależność liniowa – f(x) jest funkcją liniową:
Zależność liniowa – f(x) jest funkcją liniową:
f(x) =
f(x) =
+
+
x,
x,
Zależność stochastyczna:
Zależność stochastyczna:
f(x) =
f(x) =
+
+
x +
x +
,
,
gdzie
gdzie
jest „składnikiem losowym” o znanym rozkładzie
jest „składnikiem losowym” o znanym rozkładzie
prawdopodobieństwa.
prawdopodobieństwa.
Dla wielu zmiennych objaśniających:
Dla wielu zmiennych objaśniających:
y =
y =
+
+
1
1
x
x
1
1
+
+
2
2
x
x
2
2
+ ... +
+ ... +
K
K
x
x
K
K
+
+
, gdzie
, gdzie
czynnik deterministyczny:
czynnik deterministyczny:
+
+
1
1
x
x
1
1
+
+
2
2
x
x
2
2
+ ... +
+ ... +
K
K
x
x
K
K
,
,
czynnik stochastyczny:
czynnik stochastyczny:
,
,
parametry strukturalne:
parametry strukturalne:
,
,
1
1
,
,
2
2
, ... ,
, ... ,
K
K
.
.
39
Analiza regresji
Zapis wektorowy zależności modelu:
Zapis wektorowy zależności modelu:
Uwzględnienie wyrazu wolnego pociąga za sobą
Uwzględnienie wyrazu wolnego pociąga za sobą
konieczność wprowadzenia wektora kolumnowego
konieczność wprowadzenia wektora kolumnowego
x
x
1
1
t
t
=
=
1
1
1
,
,...,
1
,
1
1
t
t
K
k
kt
k
t
x
n
t
x
y
]
,...,
,
[
2
1
)
(
)
(
)
(
Kt
t
t
t
k
t
k
t
k
t
x
x
x
x
gdzie
x
y
K
k
:
2
1
)
(
40
Analiza regresji
Macierzowy zapis modelu
Macierzowy zapis modelu
Kn
n
K
K
n
k
k
k
t
t
t
x
...
x
1
:
...
:
:
x
...
x
1
x
...
x
1
x
:
x
x
]
|
...
|
|
[
2
2
22
1
1
2
)
(
)2
(
)1
(
)
K(
)
2(
)
1(
x
x
x
X
)
(
)
(
)
(
t
k
t
ξ
Xα
y
41
Analiza regresji
Estymacja parametrów modelu
Estymacja parametrów modelu
Rozważamy model, gdy spełnione są
Rozważamy model, gdy spełnione są
założenia schematu Gaussa-Markowa oraz
założenia schematu Gaussa-Markowa oraz
K=1 (regresja prosta):
K=1 (regresja prosta):
Wartość oczekiwana zmiennej objaśnianej
Wartość oczekiwana zmiennej objaśnianej
równa jest zatem:
równa jest zatem:
Powyższe równanie wyznacza linię regresji
Powyższe równanie wyznacza linię regresji
populacji generalnej
populacji generalnej
Wariancja zaś równa jest:
Wariancja zaś równa jest:
t
t
x
Y
E
1
0
)
(
2
2
2
1
0
1
0
2
2
)
(
)
(
))
(
(
)
(
t
t
t
t
t
t
t
E
x
-
x
E
Y
E
Y
E
Y
D
42
Analiza regresji
Rozkład normalny:
Rozkład normalny:
Zmienne losowe Y
Zmienne losowe Y
t
t
mają również
mają również
rozkład normalny:
rozkład normalny:
Parametry
Parametry
0
0
,
,
1
1
są nieznane i
są nieznane i
podlegają oszacowaniu na podstawie
podlegają oszacowaniu na podstawie
próby statystycznej
próby statystycznej
Zatem linia regresji próby:
Zatem linia regresji próby:
)
,
(
:
2
t
t
N
)
,
(
:
2
1
0
t
t
x
N
Y
t
t
x
y
1
0
ˆ
ˆ
ˆ
43
Analiza regresji
Estymatory
Estymatory
są funkcjami zmiennych losowych
są funkcjami zmiennych losowych
Y
Y
t
t
;
;
Różnice
Różnice
nazywamy resztami;
nazywamy resztami;
Mamy cztery funkcje:
Mamy cztery funkcje:
linia regresji populacji generalnej LRPG
linia regresji populacji generalnej LRPG
linia regresji próby LRP
linia regresji próby LRP
wartości empiryczne (populacja generalna) WEPG
wartości empiryczne (populacja generalna) WEPG
wartości empiryczne (próba) WEP
wartości empiryczne (próba) WEP
(WEPG = WEP)
(WEPG = WEP)
1
0
ˆ
,
ˆ
t
t
t
y
Y
e
ˆ
t
t
x
y
1
0
ˆ
ˆ
ˆ
t
t
x
EY
1
0
t
t
t
x
Y
1
0
t
t
t
e
x
Y
1
0
ˆ
ˆ
44
Analiza regresji
Zgodnie z założeniami schematu Gaussa-
Zgodnie z założeniami schematu Gaussa-
Markowa cała informacja o nieznanych
Markowa cała informacja o nieznanych
parametrach modelu regresji jest zawarta w
parametrach modelu regresji jest zawarta w
próbie statystycznej;
próbie statystycznej;
Poszukujemy estymatora , który minimalizuje
Poszukujemy estymatora , który minimalizuje
sumę kwadratów reszt:
sumę kwadratów reszt:
•
Inaczej: szukamy linii, która jest najlepsza z
punktu widzenia sumy kwadratów reszt e
t
(min)
•
Reszty e
t
można traktować jako realizacje
składnika losowego.
min
)
(
1
2
n
t
t
e
45
Analiza regresji
min
)
(
7
1
2
t
t
e
x
y
1
0
ˆ
ˆ
ˆ
x
1
x
2
x
3
x
4
x
5
x
6
x
7
x
4
e
46
Analiza regresji
Otrzymujemy:
Otrzymujemy:
2
1
1
1
)
(
/
)
)(
(
ˆ
x
x
y
y
x
x
n
t
t
t
n
t
t
n
x
y
n
t
t
n
t
t
/
ˆ
ˆ
1
1
1
0
47
Analiza regresji
Ocena modelu - współczynnik determinacji R
Ocena modelu - współczynnik determinacji R
2
2
Jest liczbą z przedziału <0, 1> albo po przekształceniu z przedziału
Jest liczbą z przedziału <0, 1> albo po przekształceniu z przedziału
<0%, 100%>
<0%, 100%>
Informuje, jak część zmienności zmiennej objaśnianej jest wyjaśniana
Informuje, jak część zmienności zmiennej objaśnianej jest wyjaśniana
przez zmienne objaśniające;
przez zmienne objaśniające;
Gdy wartość R
Gdy wartość R
2
2
bliska jest 1 mówimy o bardzo dobrym dopasowaniu
bliska jest 1 mówimy o bardzo dobrym dopasowaniu
modelu do danych empirycznych, a gdy jest bliska zeru, uznajemy, że
modelu do danych empirycznych, a gdy jest bliska zeru, uznajemy, że
zbudowany model nie wyjaśnia rzeczywistej zmienności zmiennej zależnej.
zbudowany model nie wyjaśnia rzeczywistej zmienności zmiennej zależnej.
(Przyjmuje się często, że wartość R
(Przyjmuje się często, że wartość R
2
2
powinna być większa od 0,6 (60%);)
powinna być większa od 0,6 (60%);)
Wyznacza się również dodatkowo skorygowany współczynnik
Wyznacza się również dodatkowo skorygowany współczynnik
determinacji R
determinacji R
2
2
*:
*:
Dla dowolnego modelu R
Dla dowolnego modelu R
2
2
*
*
R
R
2
2
. Jeżeli różnica pomiędzy liczbą obserwacji
. Jeżeli różnica pomiędzy liczbą obserwacji
a liczbą zmiennych jest duża, to obie miary zgodności mają zbliżone
a liczbą zmiennych jest duża, to obie miary zgodności mają zbliżone
wartości.
wartości.
W p.p. , zwłaszcza przy małej próbie, bardziej wiarygodny jest
W p.p. , zwłaszcza przy małej próbie, bardziej wiarygodny jest
skorygowany R
skorygowany R
2
2
*;
*;
R
R
R
k
n
k
2
2
*
2
1
)
1
(
48
Analiza regresji
Test dla współczynników modelu regresji linowej (
i
):
Sprawdzeniu podlega hipoteza H
0
: =0
wobec
alternatywnej w jednej z postaci H
1
: >0, <0, 0.
Do weryfikacji hipotezy zerowej stosujemy statystykę
testową o postaci: , gdzie b jest oszacowaniem
parametru , S(b) jest błędem
standardowym.
Statystyka t przy założeniu prawdziwości H
0
ma
rozkład t – Studenta o n-2 stopniach swobody.
H
0
odrzucamy, gdy wartość bezwzględna statystyki
testowej jest większa od wartości odczytanej z tablic
danego rozkładu, np. gdy |t| t
, n-2
.
Jeżeli nie odrzucimy H
0
, to wniosek, że parametr jest
statystycznie nieistotny.
)
(b
S
b
t
49
Analiza regresji
Zależności zmiennych objaśnianych i
Zależności zmiennych objaśnianych i
objaśniających mogą być liniowe lub nieliniowe;
objaśniających mogą być liniowe lub nieliniowe;
Liniowa postać funkcji reprezentuje stały kierunek
Liniowa postać funkcji reprezentuje stały kierunek
rozwoju danego zjawiska, wyznaczony przez
rozwoju danego zjawiska, wyznaczony przez
współczynnik kierunkowy prostej;
współczynnik kierunkowy prostej;
W przypadku modelu nieliniowego sprowadzamy go
W przypadku modelu nieliniowego sprowadzamy go
do postaci liniowej.
do postaci liniowej.
Następnie stosuje się metody znane dla modeli
Następnie stosuje się metody znane dla modeli
liniowych.
liniowych.
Należy pamiętać, że przejście z modelu
Należy pamiętać, że przejście z modelu
nieliniowego do modelu liniowego w konsekwencji
nieliniowego do modelu liniowego w konsekwencji
musi być zastosowane również w odwrotnym
musi być zastosowane również w odwrotnym
przekształceniu.
przekształceniu.
50
Analiza regresji
W celu oszacowania postaci funkcji stosuje
W celu oszacowania postaci funkcji stosuje
się m.in. badanie charakteru funkcji na
się m.in. badanie charakteru funkcji na
podstawie rozrzutu punktów empirycznych;
podstawie rozrzutu punktów empirycznych;
Metodę tę stosuje się zwłaszcza dla modeli
Metodę tę stosuje się zwłaszcza dla modeli
z jedna zmienną objaśniająca.
z jedna zmienną objaśniająca.
W innych przypadkach stosować należy
W innych przypadkach stosować należy
procedury komputerowego rozpoznawania
procedury komputerowego rozpoznawania
kształtów z wykresów rozrzutu punktów
kształtów z wykresów rozrzutu punktów
empirycznych.
empirycznych.
Rozważmy kilka przykładów typowych
Rozważmy kilka przykładów typowych
postaci związków dwóch zmiennych.
postaci związków dwóch zmiennych.
51
Analiza regresji
Przykłady modeli nieliniowych sprowadzalnych do
liniowych
• Model wielomianowy
y=a
0
+a
1
x+ a
2
x
2
+...+ a
k
x
k
+
możemy zastąpić zmienne x
i
zmiennymi z
i
lub
logarytmować
stronami równanie otrzymując:
y’=log y=loga
0
+loga
1
+log(x)+ loga
2
+ 2log(x) +...+ loga
k
+k log(x)+log
y’=[loga
0
+loga
1
+2loga
2
+...+ k log(a
k
)]
log(x)+ log =A
log(x)+ log
x
y
y=a+bx+cx
2
+dx
3
x
y
y=a+bx+cx
2
52
Analiza regresji
Przykłady modeli nieliniowych sprowadzalnych
do liniowych
• Model wykładniczy
y=ba
cx+
logarytmując obie strony otrzymujemy:
y’=log(y)=log(b)+(cx+)log(a) =
= log(b)+[clog(a)] x+log(a) = b’+a’x+ c’
x
y
y=bx
a
,a<1
y=b+alog(x)
x
y
y=bx
a
,a>1
y=ba
x
53
Analiza regresji
Przykłady modeli nieliniowych sprowadzalnych do
liniowych
• Model potęgowy
y=a(x
1
)
b
(x
2
)
c
e
logarytmując obie strony logarytmem naturalnym
otrzymujemy:
y’=ln(y)=ln(a)+bln(x
1
)+cln(x
2
)+
54
Analiza regresji
Przykłady modeli nieliniowych sprowadzalnych
do liniowych
• Model logarytmiczny
y=b+alog(x) +
podstawiając x’=log(x) otrzymujemy:
y=b+a x’ +
55
Metody poprawiania jakości procesu
symulacji
Wyróżnikiem jakości uzyskanych wyników jest:
Wyróżnikiem jakości uzyskanych wyników jest:
wariancja estymatora;
wariancja estymatora;
przedział ufności estymowanych charakterystyk
przedział ufności estymowanych charakterystyk
badanego procesu;
badanego procesu;
Zawężenie przedziału ufności jest możliwe
Zawężenie przedziału ufności jest możliwe
przez:
przez:
zwiększenie liczby obserwacji - wymaga zazwyczaj
zwiększenie liczby obserwacji - wymaga zazwyczaj
znacznego wydłużenia eksperymentu
znacznego wydłużenia eksperymentu
symulacyjnego (nie jest pożądane);
symulacyjnego (nie jest pożądane);
zmniejszenie wariancji - wymaga jedynie
zmniejszenie wariancji - wymaga jedynie
właściwego wyboru estymatora lub odpowiedniego
właściwego wyboru estymatora lub odpowiedniego
zorganizowania procesu generowania liczb
zorganizowania procesu generowania liczb
pseudolosowych (nie wymaga wydłużenia czasu
pseudolosowych (nie wymaga wydłużenia czasu
trwania eksperymentu);
trwania eksperymentu);
56
Metody poprawiania jakości procesu
symulacji
Metody redukcji wariancji:
Metody redukcji wariancji:
metoda zmiennych kontrolnych,
metoda zmiennych kontrolnych,
metoda losowania przeciwstawnego (tzw.
metoda losowania przeciwstawnego (tzw.
zmiennych antytetycznych),
zmiennych antytetycznych),
metoda losowania warstwowego
metoda losowania warstwowego
57
Metody poprawiania jakości procesu
symulacji
metoda zmiennych kontrolnych
metoda zmiennych kontrolnych
bazuje na znajomości np. wartości
bazuje na znajomości np. wartości
oczekiwanej wybranej zmiennej losowej
oczekiwanej wybranej zmiennej losowej
obserwowanej, silnie dodatnio skorelowanej
obserwowanej, silnie dodatnio skorelowanej
z badaną zmienną, wskutek czego uzyskuje
z badaną zmienną, wskutek czego uzyskuje
się redukcję wariancji;
się redukcję wariancji;
58
Metody poprawiania jakości procesu
symulacji
metoda losowania przeciwstawnego
metoda losowania przeciwstawnego
(zmiennych antytetycznych)
(zmiennych antytetycznych)
metoda polega na tym, że jeśli w jednym
metoda polega na tym, że jeśli w jednym
eksperymencie symulacyjnym wylosowaliśmy
eksperymencie symulacyjnym wylosowaliśmy
ciąg liczb pseudolosowych o rozkładzie
ciąg liczb pseudolosowych o rozkładzie
równomiernym z przedziału [0,1]:
równomiernym z przedziału [0,1]:
x
x
1
1
, x
, x
2
2
, ..., x
, ..., x
n
n
, to w kolejnym eksperymencie
, to w kolejnym eksperymencie
symulacyjnym korzystamy z liczb:
symulacyjnym korzystamy z liczb:
(1-
(1-
x
x
1
1
)
)
,
,
(1-
(1-
x
x
2
2
)
)
, ...,
, ...,
(1-
(1-
x
x
n
n
)
)
;
;
59
Metody poprawiania jakości procesu
symulacji
metoda losowania przeciwstawnego
metoda losowania przeciwstawnego
wylosowane ciągi liczb pseudolosowych o
wylosowane ciągi liczb pseudolosowych o
rozkładzie równomiernym z przedziału [0,1]:
rozkładzie równomiernym z przedziału [0,1]:
x
x
1
1
, x
, x
2
2
, ..., x
, ..., x
n
n
,
,
(1)
(1)
(1-
(1-
x
x
1
1
)
)
,
,
(1-
(1-
x
x
2
2
)
)
, ...,
, ...,
(1-
(1-
x
x
n
n
)
)
;
;
(2)
(2)
wariancja zmiennej losowej ,
wariancja zmiennej losowej ,
, gdzie i-ty element ciągu (1) jest realizacją
, gdzie i-ty element ciągu (1) jest realizacją
zmiennej losowej
zmiennej losowej
X
X
i
i
a i-ty element ciągu (2)
a i-ty element ciągu (2)
jest realizacją zmiennej losowej
jest realizacją zmiennej losowej
X
X
i
i
’
’
:
:
ulega zmniejszeniu, wskutek ujemnej
ulega zmniejszeniu, wskutek ujemnej
wartości
wartości
'
''
i
i
i
X
X
X
n
i
,
1
}
,
{
2
}
{
}
{
}
{
'
'
''
i
i
i
i
i
X
X
Cov
X
V
X
V
X
V
}
,
{
'
i
i
X
X
Cov
60
Metody poprawiania jakości procesu
symulacji
metoda losowania warstwowego
metoda losowania warstwowego
metoda z kolei polega na tym, że dla i-tego elementu
metoda z kolei polega na tym, że dla i-tego elementu
ciągu (1) (jako realizacji zmiennej losowej
ciągu (1) (jako realizacji zmiennej losowej
X
X
i
i
) liczb
) liczb
pseudolosowych o rozkładzie równomiernym z
pseudolosowych o rozkładzie równomiernym z
przedziału [0,1] wygenerowanych w eksperymencie
przedziału [0,1] wygenerowanych w eksperymencie
symulacyjnym ustala się liczbę
symulacyjnym ustala się liczbę
x
x
i
i
’
’
skorelowaną z nim
skorelowaną z nim
(jako realizację zmiennej losowej
(jako realizację zmiennej losowej
X
X
i
i
’
’
):
):
x
x
i
i
’
’
używa się w kolejnym eksperymencie
używa się w kolejnym eksperymencie
liczby te, jak poprzednio, są skorelowane i również dają
liczby te, jak poprzednio, są skorelowane i również dają
ujemną kowariancję;
ujemną kowariancję;
1
2
1
dla
,
2
1
2
1
0
dla
,
2
1
'
i
i
i
i
i
x
x
x
x
x
61
Błędy eksperymentów symulacyjnych
Warunki poprawnego eksperymentu symulacyjnego:
Warunki poprawnego eksperymentu symulacyjnego:
właściwe rozpoznanie systemu,
właściwe rozpoznanie systemu,
poprawna konstrukcja modelu,
poprawna konstrukcja modelu,
trafny dobór stopnia szczegółowości modelu,
trafny dobór stopnia szczegółowości modelu,
niezawodne oprogramowanie,
niezawodne oprogramowanie,
starannie zaplanowane eksperymenty;
starannie zaplanowane eksperymenty;
Najczęściej spotykane błędy podczas tworzenia
Najczęściej spotykane błędy podczas tworzenia
modeli symulacyjnych i podczas ich eksploatacji:
modeli symulacyjnych i podczas ich eksploatacji:
źle określony cel symulacji;
źle określony cel symulacji;
nieodpowiedni poziom szczegółowości modelu;
nieodpowiedni poziom szczegółowości modelu;
zły język symulacyjny;
zły język symulacyjny;
nieodpowiedni udział użytkownika w opracowaniu modelu;
nieodpowiedni udział użytkownika w opracowaniu modelu;
62
Źródła błędów symulacyjnych i sposoby
ich kontrolowania
†
błędy modelowania
błędy modelowania
•
nieadekwatny model matematyczny
nieadekwatny model matematyczny
•
w wyniku weryfikacji modelu i walidacji
w wyniku weryfikacji modelu i walidacji
powinny być zidentyfikowane i usunięte
powinny być zidentyfikowane i usunięte
†
błędy programowania
błędy programowania
•
błędy implementacji modelu w języku
błędy implementacji modelu w języku
symulacyjnym
symulacyjnym
•
testowanie modelu symulacyjnego w oparciu
testowanie modelu symulacyjnego w oparciu
o prosty system, ze znaną postacią
o prosty system, ze znaną postacią
analityczną rozwiązania
analityczną rozwiązania
63
Źródła błędów symulacyjnych i sposoby
ich kontrolowania
†
błędy losowania - „set effect” i „sequence effect”
błędy losowania - „set effect” i „sequence effect”
•
złe generatory liczb pseudolosowych
złe generatory liczb pseudolosowych
•
poddanie generatorów testom losowości i zgodności
poddanie generatorów testom losowości i zgodności
rozkładów (minimum po 3 testy różne na losowość i żgodność)
rozkładów (minimum po 3 testy różne na losowość i żgodność)
•
stosowanie różnych technik redukcji wariancji
stosowanie różnych technik redukcji wariancji
†
błędy estymacji parametrycznej
błędy estymacji parametrycznej
•
błąd obciążenia początkowego (stan nieustalony) - „initial
błąd obciążenia początkowego (stan nieustalony) - „initial
bias”
bias”
•
gromadzenie danych wyjściowych po ustaleniu się stanu
gromadzenie danych wyjściowych po ustaleniu się stanu
systemu (warm up)
systemu (warm up)
•
statystyczna zależność wyników symulacji wskutek
statystyczna zależność wyników symulacji wskutek
autokorelacji i korelacji skrośnej i ograniczoność stosowania
autokorelacji i korelacji skrośnej i ograniczoność stosowania
CTG
CTG
•
stosowanie wielu powtórzeń eksperymentu, ustalanie paczek
stosowanie wielu powtórzeń eksperymentu, ustalanie paczek
wyników „batch means”, metoda regeneracji
wyników „batch means”, metoda regeneracji
64
Materiał dodatkowy
65
(
,
,
,...,
)
X X X
X
R
n
n
1
2
3
przestrzeń prób
Populacja generalna - przypomnienie
Zbiór pewnych realnych
Zbiór pewnych realnych
elementów różniących się
elementów różniących się
wartościami badanych
wartościami badanych
zmiennych - cech np. zbiór
zmiennych - cech np. zbiór
ludzi w badanym
ludzi w badanym
społeczeństwie lub
społeczeństwie lub
nieskończony zbiór
nieskończony zbiór
możliwych powtórzeń
możliwych powtórzeń
pewnego eksperymentu,
pewnego eksperymentu,
wynikiem którego jest zbiór
wynikiem którego jest zbiór
wartości pewnych zmiennych
wartości pewnych zmiennych
- cech statystycznych
- cech statystycznych
Rozkładem populacji
Rozkładem populacji
generalnej nazywamy
generalnej nazywamy
rozkład wartości badanej
rozkład wartości badanej
cechy w tej populacji
cechy w tej populacji
Populacj
a
generaln
a
Cecha X
66
Model matematyczny rozkładu PG
Rozkład prawdopodobieństwa pewnej zmiennej
Rozkład prawdopodobieństwa pewnej zmiennej
losowej skokowej lub ciągłej
losowej skokowej lub ciągłej
Prawdopodobieństwo interpretuje się jako częstość
Prawdopodobieństwo interpretuje się jako częstość
względną występowania w populacji generalnej
względną występowania w populacji generalnej
elementów o określonych wartościach badanej cechy
elementów o określonych wartościach badanej cechy
Próba losowa - losowe wybrane elementy z populacji
Próba losowa - losowe wybrane elementy z populacji
generalnej o rozkładzie identycznym jak populacja
generalnej o rozkładzie identycznym jak populacja
generalna
generalna
Rozkład zmiennej losowej X jest dany przez
Rozkład zmiennej losowej X jest dany przez
dystrybuantę F(x,Q), zależną od nieznanej wartości
dystrybuantę F(x,Q), zależną od nieznanej wartości
parametru Q
parametru Q
Parametr rozkładu populacji generalnej Q jest
Parametr rozkładu populacji generalnej Q jest
przedmiotem estymacji na podstawie próby losowej
przedmiotem estymacji na podstawie próby losowej
67
Estymatory, cechy estymatorów
ESTYMATOREM
ESTYMATOREM
szacowanego parametru
szacowanego parametru
rozkładu
rozkładu
F(x,
F(x,
)
)
populacji
populacji
nazywamy
nazywamy
statystykę
statystykę
Z
Z
n
n
= g(X),
= g(X),
której rozkład prawdopodobieństwa zależy
której rozkład prawdopodobieństwa zależy
od szacowanego parametru
od szacowanego parametru
i
i
często oznaczamy
często oznaczamy
go
go
.
.
Wartość estymatora
Wartość estymatora
g(x
g(x
1
1
, x
, x
2
2
, ... , x
, ... , x
n
n
),
),
odpowiadająca
odpowiadająca
konkretnej realizacji próby
konkretnej realizacji próby
(x
(x
1
1
, x
, x
2
2
, ... , x
, ... , x
n
n
),
),
jest
jest
liczbą, nazywaną oceną parametru
liczbą, nazywaną oceną parametru
.
.
Przy wyborze estymatora należy brać pod uwagę
Przy wyborze estymatora należy brać pod uwagę
jego
podstawowe
własności:
nieobciążoność,
jego
podstawowe
własności:
nieobciążoność,
efektywność, zgodność i dostateczność.
efektywność, zgodność i dostateczność.
n
68
Metody estymacji punktowej
Metoda momentów
Metoda największej wiarogodności
Metoda najmniejszych kwadratów
69
Metoda momentów
Momenty zwyczajne są funkcjami
Momenty zwyczajne są funkcjami
nieznanych parametrów:
nieznanych parametrów:
i
k
i
i
k
k
i
k
i
i
k
i
i
i
k
i
i
k
i
M
M
M
g
M
M
M
k
i
m
m
m
g
M
M
M
g
then
g
k
i
m
m
m
g
if
k
i
f
m
parametrów
zgodnymi
mi
estymatora
są
,...,
2
,
1
),
,...,
,
(
ˆ
empiryczne
momenty
oznaczaj
ą
,...,
,
,...,
2
,
1
),
,...,
,
(
)
,...,
,
(
continue,
,...,
2
,
1
),
,...,
,
(
,...,
2
,
1
),
,...,
,
(
2
1
2
1
2
1
2
1
2
1
2
1
70
Metoda największej wiarogodności
Gęstość prawdopodobieństwa zmiennej losowej
X, której rozkład zależy od parametrów
Jeżeli jest próbą losową
prostą, to
Jest funkcją wiarogodności
Estymator najwiarygodniejszy:
)
,...,
,
(
1
k
x
f
)
,...,
,
(
2
1
n
X
X
X
n
i
k
i
n
i
k
i
k
n
x
p
x
f
x
x
x
L
1
2
1
1
2
1
2
1
2
1
)
,...,
,
,
(
)
,...,
,
,
(
)
,...,
,
,
,...,
,
(
k
i
L
L
L
i
R
n
k
,...,
2
,
1
,
0
)
(
),
(
max
)
ˆ
(
71
Metoda najmniejszych
kwadratów
Taki dobór estymatorów, aby
zminimalizować wyrażenie
czyli
)
(
min
)
ˆ
(
)]
(
[
)
(
1
2
S
S
h
x
S
k
R
n
n
i
i
72
Estymatory, cechy estymatorów
Estymator jest nieobciążony, gdy
Estymator jest nieobciążony, gdy
.
.
Gdy
Gdy
i jest to obciążenie
i jest to obciążenie
estymatora w n - elementowej próbie.
estymatora w n - elementowej próbie.
Przykłady:
Przykłady:
Niech
Niech
czyli jest to estymator nieobciążony
czyli jest to estymator nieobciążony
.
.
estymator wariancji
estymator wariancji
2
2
populacji
populacji
.
.
ES
ES
2
2
=(n-1/n)
=(n-1/n)
2
2
- czyli
- czyli
S
S
2
2
jest estymatorem obciążonym
jest estymatorem obciążonym
.
.
S
S
2
2
1
1
=(n/n-1) S
=(n/n-1) S
2
2
jest estymatorem nieobciążonym
jest estymatorem nieobciążonym
.
.
E
n
E
b
E
n
n
n
,
(
)
n
n
i
i
n
n
i
i
n
i
i
n
X
n
X
EX m
EX
E
n
X
n
EX
m
1
1
1
1
1
1
oraz
S
n
X
X
i
n
i
n
2
1
2
1
(
)
73
Estymatory, cechy estymatorów
Asymptotyczna nieobciążoność:
Asymptotyczna nieobciążoność:
nazywamy
nazywamy
asymptotycznie nieobciążonym
asymptotycznie nieobciążonym
Efektywność, asymptotyczna
Efektywność, asymptotyczna
efektywność
efektywność
0
lim
którego
dla
Estymator,
n
n
b
niejszy
najefektyw
znie
asymptotyc
jest
ˆ
1
)
ˆ
e(
lim
,
1
)
ˆ
e(
0
,
)
ˆ
(
)
ˆ
(
)
ˆ
e(
niejszy
najefektyw
ˆ
)
ˆ
(
)
ˆ
(
2
*
2
*
2
*
2
ˆ
n
n
n
n
n
n
n
n
n
n
D
D
D
D
n
74
Estymatory, cechy estymatorów
Zgodność
Zgodność
Estymator parametru jest zgodny, jeśli:
Estymator parametru jest zgodny, jeśli:
0
dla
,
1
}
|
ˆ
{|
lim
czyli
ˆ
.
.
.
n
n
n
n
P
p
i
l
75
Estymacja parametrów rozkładu
badanych ch-yk
Mając typ rozkładu badanej charakterystyki możemy
Mając typ rozkładu badanej charakterystyki możemy
wyznaczyć estymatory parametrów tego rozkładu.
wyznaczyć estymatory parametrów tego rozkładu.
Jeżeli przyjmiemy, że rozkład populacji generalnej
Jeżeli przyjmiemy, że rozkład populacji generalnej
dla charakterystyki X jest normalny N(
dla charakterystyki X jest normalny N(
,
,
) (przy
) (przy
dostatecznie dużej liczbie przebiegów symulacyjnych
dostatecznie dużej liczbie przebiegów symulacyjnych
jest to wniosek z twierdzenia
jest to wniosek z twierdzenia
Lindeberga-Levy’ego), to estymatorami punktowymi
Lindeberga-Levy’ego), to estymatorami punktowymi
wartości oczekiwanych dla badanych charakterystyk
wartości oczekiwanych dla badanych charakterystyk
są wartości oczekiwane z próby
są wartości oczekiwane z próby
, np.
, np.
Niech X
Niech X
c
c
1
1
, X
, X
c
c
2 ,. . . ,
2 ,. . . ,
X
X
c
c
n
n
oznaczają
oznaczają
starty
starty
gracza w kolejnych
gracza w kolejnych
przebiegach symulacyjnych. Ponieważ przebiegów tych
przebiegach symulacyjnych. Ponieważ przebiegów tych
jest
jest
n
n
stąd estymator punktowy wartości oczekiwanej
stąd estymator punktowy wartości oczekiwanej
strat
strat
wyznaczamy
wyznaczamy
:
:
n
n
1
1
i
C
i
C
X
X
76
Estymacja parametrów rozkładu
badanych ch-yk
Niech X
Niech X
c
c
1
1
, X
, X
c
c
2 ,. . . ,
2 ,. . . ,
X
X
c
c
n
n
oznaczają
oznaczają
starty
starty
gracza
gracza
w kolejnych przebiegach symulacyjnych.
w kolejnych przebiegach symulacyjnych.
Ponieważ przebiegów tych jest
Ponieważ przebiegów tych jest
n
n
stąd
stąd
estymator punktowy wartości oczekiwanej
estymator punktowy wartości oczekiwanej
strat wyznaczamy
strat wyznaczamy
:
:
Wyznaczon
Wyznaczon
y
y
estymator
estymator
jest
jest
estymator
estymator
e
e
m
m
punktowym. Często jednak lepiej jest mieć
punktowym. Często jednak lepiej jest mieć
pewien przedział, w którym mieści się
pewien przedział, w którym mieści się
szacowana wartość parametru.
szacowana wartość parametru.
n
n
1
1
i
C
i
C
X
X
77
Estymacja parametrów rozkładu
badanych ch-yk
S
S
posób
wyznaczenia
estymatora
posób
wyznaczenia
estymatora
przedziałowego
wartości
oczekiwanej
przedziałowego
wartości
oczekiwanej
badanej zmiennej losowej X
badanej zmiennej losowej X
C
C
:
:
Wariancja estymatora jest dana wzorem:
Wariancja estymatora jest dana wzorem:
gdzie
gdzie
2
2
jest wariancją zmiennej losowej X, tj.
jest wariancją zmiennej losowej X, tj.
2
2
= D
= D
2
2
(X).
(X).
Nieobciążony estymator wariancji jest
Nieobciążony estymator wariancji jest
określony następująco:
określony następująco:
S X
2
2
n
2
1
2
2
1
2
1
1
1
1
1
n
n
n
n
n
n
(
)
X
X
X
X
i
i
i
i
78
Estymacja parametrów rozkładu
badanych ch-yk
Ponieważ
wariancja
jest
nieznana
Ponieważ
wariancja
jest
nieznana
(wyznaczamy ją z próby zarejestrowanej
(wyznaczamy ją z próby zarejestrowanej
podczas symulacji), więc zmienna losowa
podczas symulacji), więc zmienna losowa
k
k
postaci:
postaci:
ma rozkład t Studenta o
ma rozkład t Studenta o
n
n
-1 stopniach
-1 stopniach
swobody. Zmiennej
swobody. Zmiennej
k
k
użyjemy do budowy
użyjemy do budowy
przedziału ufności dla średniej
przedziału ufności dla średniej
.
.
k
n
X X
/
79
Estymacja parametrów rozkładu
badanych ch-yk
Przy ustalonym współczynniku ufności 1-
Przy ustalonym współczynniku ufności 1-
, z
, z
tablic rozkładu t-Studenta dla
tablic rozkładu t-Studenta dla
n-1
n-1
stopni
stopni
swobody można odczytać wartość k
swobody można odczytać wartość k
i
i
następnie
dokonując
przekształceń
następnie
dokonując
przekształceń
otrzymamy następujący wzór na przedział
otrzymamy następujący wzór na przedział
ufności wartości oczekiwanej :
ufności wartości oczekiwanej :
P X k
X X k
n
n
1
80
Hipotezy i testy statystyczne
Hipoteza statystyczna
to przypuszczenie,
to przypuszczenie,
dotyczące rozkładu prawdopodobieństwa
dotyczące rozkładu prawdopodobieństwa
populacji:
populacji:
gdzie
gdzie
F(x)
F(x)
jest dystrybuantą rozkładu
jest dystrybuantą rozkładu
populacji, a
populacji, a
jest pewnym zbiorem
jest pewnym zbiorem
dystrybuant, zwany zbiorem hipotez
dystrybuant, zwany zbiorem hipotez
dopuszczalnych
dopuszczalnych
Dwa typy: hipoteza parametryczna i
Dwa typy: hipoteza parametryczna i
nieparametryczna
nieparametryczna
Test statystyczny
– narzędzie do weryfikacji
– narzędzie do weryfikacji
hipotez na podstawie prób losowych – reguła
hipotez na podstawie prób losowych – reguła
decyzyjna i jednocześnie zmienna losowa
decyzyjna i jednocześnie zmienna losowa
binarna (0- przyjąć hipotezę, 1- odrzucić)
binarna (0- przyjąć hipotezę, 1- odrzucić)
)
(
:
x
F
H
81
Parametryczne testy istotności
Hipoteza prosta
Hipoteza prosta
Hipoteza złożona (alternatywna)
Hipoteza złożona (alternatywna)
Test statystyczny
Test statystyczny
T
T
oparty na obszarze
oparty na obszarze
krytycznym
krytycznym
nazywa się testem istotności dla
nazywa się testem istotności dla
sprawdzanej hipotezy zerowej (prostej)
sprawdzanej hipotezy zerowej (prostej)
Dla próby losowej
Dla próby losowej
X=
X=
(
(
X
X
1
1
,
,
X
X
2
2
,...,
,...,
X
X
n
n
)
)
hipotezę
hipotezę
H
H
0
0
odrzuca się z prawdopodobieństwem błędu I
odrzuca się z prawdopodobieństwem błędu I
rodzaju
rodzaju
(zwanym poziomem istotności)
(zwanym poziomem istotności)
Dla próby losowej
Dla próby losowej
X=
X=
(
(
X
X
1
1
,
,
X
X
2
2
,...,
,...,
X
X
n
n
)
)
stwierdza
stwierdza
się jedynie brak podstaw do odrzucenia
się jedynie brak podstaw do odrzucenia
hipotezy
hipotezy
H
H
0
0
0
1
0
0
:
:
H
H
82
Test istotności dla średniej -
przykład
Normalny rozkład populacji
Normalny rozkład populacji
N
N
(
(
,
,
) ze
) ze
znaną wariancją
znaną wariancją
2
2
Hipoteza
Hipoteza
H
H
0
0
:
:
m
m
=
=
m
m
0
0
Hipoteza
Hipoteza
H
H
1
1
:
:
m
m
m
m
0
0
Statystyka przy
Statystyka przy
prawdziwej
prawdziwej
H
H
0
0
ma rozkład normalny
ma rozkład normalny
N
N
(0,1) z obszarem krytycznym Q=
(0,1) z obszarem krytycznym Q=
{
{
U
U
: |
: |
U
U
|>
|>
u
u
}
}
u
u
-kwantyl rozkładu
-kwantyl rozkładu
normalnego
normalnego
N
N
(0,1)
(0,1)
n
m
X
U
0
83
Nieparametryczne testy
istotności
Testy zgodności – weryfikacja typu
Testy zgodności – weryfikacja typu
rozkładu – badanie zgodności uzyskanego
rozkładu – badanie zgodności uzyskanego
z próby rozkładu empirycznego z
z próby rozkładu empirycznego z
rozkładem hipotetycznym (teoretycznym)
rozkładem hipotetycznym (teoretycznym)
Testy niezależności zmiennych losowych
Testy niezależności zmiennych losowych
(testy losowości) – testy serii, testy
(testy losowości) – testy serii, testy
kombinatoryczne (pokerowy,
kombinatoryczne (pokerowy,
kolekcjonera)
kolekcjonera)
84
Testy zgodności
Test chi-kwadrat
Test chi-kwadrat
F
F
(x) – nieznany rozkład populacji generalnej
(x) – nieznany rozkład populacji generalnej
F
F
0
0
(x) – rozkład teoretyczny populacji
(x) – rozkład teoretyczny populacji
Grupowanie szeregu rozdzielczego o
Grupowanie szeregu rozdzielczego o
r
r
rozłącznych klasach i
rozłącznych klasach i
licznościach
licznościach
n
n
i
i
w i-tej klasie
w i-tej klasie
Dla empirycznego szeregu rozdzielczego wyznacza się
Dla empirycznego szeregu rozdzielczego wyznacza się
prawdopodobieństwa
prawdopodobieństwa
p
p
i
i
otrzymania w rozkładzie
otrzymania w rozkładzie
F
F
0
0
(x)
(x)
wyniku próby należącego do i-tej klasy
wyniku próby należącego do i-tej klasy
Dla każdej klasy i wyznacza się liczebności teoretyczne
Dla każdej klasy i wyznacza się liczebności teoretyczne
np
np
i
i
Wyznacza się wartość statystyki
Wyznacza się wartość statystyki
2
2
:
:
Wyznacza się obszar krytyczny
Wyznacza się obszar krytyczny
Porównanie
Porównanie
Test zgodności
Test zgodności
-Kołmogorowa, Kołmogorowa-Smirnowa
-Kołmogorowa, Kołmogorowa-Smirnowa
r
i
i
i
i
np
np
n
1
2
2
)
(
0
2
2
2
2
2
2
odrzucamy
to
,
Gdy
}
{
},
:
{
H
Q
P
Q