background image

1

Projektowanie 

Eksperymentów 

Symulacyjnych

dr inż. Dariusz Pierzchała

dr inż. Dariusz Pierzchała

background image

2

Podstawowe zagadnienia

model symulacyjny

model symulacyjny

rodzaje modeli symulacyjnych

rodzaje modeli symulacyjnych

etapy budowy modelu

etapy budowy modelu

warunki początkowe i końcowe

warunki początkowe i końcowe

momenty gromadzenia danych

momenty gromadzenia danych

identyfikacja typu rozkładu badanej 

identyfikacja typu rozkładu badanej 

charakterystyki

charakterystyki

czas trwania eksperymentu a liczba powtórzeń

czas trwania eksperymentu a liczba powtórzeń

plany losowania i plany eksperymentów

plany losowania i plany eksperymentów

metody redukcji wariancji estymatorów

metody redukcji wariancji estymatorów

przygotowanie „narzędzi” do statystycznej 

przygotowanie „narzędzi” do statystycznej 

analizy symulacji

analizy symulacji

background image

3

Symulacja komputerowa

Symulacja komputerowa - metoda badania 

Symulacja komputerowa - metoda badania 

lub naśladowania systemu rzeczywistego lub 

lub naśladowania systemu rzeczywistego lub 

teoretycznego poprzez zbudowanie jego 

teoretycznego poprzez zbudowanie jego 

modelu i jego implementacji komputerowej 

modelu i jego implementacji komputerowej 

a następnie eksperymentowanie na modelu i 

a następnie eksperymentowanie na modelu i 

analiza uzyskanych wyników.

analiza uzyskanych wyników.

[Najgebauer „Informatyczne systemy 

[Najgebauer „Informatyczne systemy 

wspomagania decyzji ...”]

wspomagania decyzji ...”]

Symulacja uosabia zasadę „poznawania 

Symulacja uosabia zasadę „poznawania 

poprzez wykonywanie”

poprzez wykonywanie”

background image

4

Proces symulacji

W procesie symulacji można wyróżnić trzy 

W procesie symulacji można wyróżnić trzy 

zasadnicze fazy:

zasadnicze fazy:

Budowa modelu symulacyjnego – obejmuje:

Budowa modelu symulacyjnego – obejmuje:

konstruowanie modelu matematycznego, odpowiadającego 

konstruowanie modelu matematycznego, odpowiadającego 

głównemu celu modelowania;

głównemu celu modelowania;

jego implementację komputerową, zależną od typu modelu i 

jego implementację komputerową, zależną od typu modelu i 

stosowanego języka symulacyjnego;

stosowanego języka symulacyjnego;

opracowanie planu eksperymentu.

opracowanie planu eksperymentu.

Eksperymentowanie – faza realizowania planu  badań 

Eksperymentowanie – faza realizowania planu  badań 

symulacyjnych – w zależności od zakresu badań może być 

symulacyjnych – w zależności od zakresu badań może być 

bardzo czasochłonna

bardzo czasochłonna

Analiza wyników eksperymentów - polega na 

Analiza wyników eksperymentów - polega na 

przeprowadzeniu estymacji wyznaczanych charakterystyk, 

przeprowadzeniu estymacji wyznaczanych charakterystyk, 

przeprowadzeniu weryfikacji postawionych w fazie 

przeprowadzeniu weryfikacji postawionych w fazie 

początkowej hipotez, wyznaczeniu modelu regresji itp. 

początkowej hipotez, wyznaczeniu modelu regresji itp. 

background image

5

Model symulacyjny

Model symulacyjny definiujemy jako: 

Model symulacyjny definiujemy jako: 

model formalny,

model formalny,

jego reprezentacja komputerowa dla potrzeb symulacji, 

jego reprezentacja komputerowa dla potrzeb symulacji, 

projekt eksperymentu,  

projekt eksperymentu,  

metoda analizy wyników eksperymentów symulacyjnych.

metoda analizy wyników eksperymentów symulacyjnych.

Składniki modelu:

Składniki modelu:

stany - opisują system w przedziale czasu; To kombinacja 

stany - opisują system w przedziale czasu; To kombinacja 

wartości zmiennych powstała, gdy każdemu atrybutowi obiektu 

wartości zmiennych powstała, gdy każdemu atrybutowi obiektu 

przyporządkujemy pewną zmienną, której zakres wartości 

przyporządkujemy pewną zmienną, której zakres wartości 

odpowiada wartościom, przyjmowanym przez ten atrybut; 

odpowiada wartościom, przyjmowanym przez ten atrybut; 

zdarzenia - zmiana stanu w ustalonej chwili ;

zdarzenia - zmiana stanu w ustalonej chwili ;

czas.

czas.

Przenoszenie systemu ze stanu do stanu zgodnie z 

Przenoszenie systemu ze stanu do stanu zgodnie z 

określonymi zasadami jest zatem symulacją; 

określonymi zasadami jest zatem symulacją; 

background image

6

Klasyfikacja modeli symulacyjnych -I

konceptualne (opisowe),

konceptualne (opisowe),

deklaratywne (wyróżnia się stany i zdarzenia),

deklaratywne (wyróżnia się stany i zdarzenia),

funkcjonalne (wyróżnia się funkcje i zmienne – 

funkcjonalne (wyróżnia się funkcje i zmienne – 

np. w  modelu obiektu),

np. w  modelu obiektu),

wyrażające zależności (ograniczone – 

wyrażające zależności (ograniczone – 

odzwierciedlają prawa rządzące działaniem 

odzwierciedlają prawa rządzące działaniem 

badanych systemów),

badanych systemów),

przestrzenne (wyrażające dekompozycję 

przestrzenne (wyrażające dekompozycję 

przestrzeni – przestrzeń jest obiektem lub 

przestrzeni – przestrzeń jest obiektem lub 

elementy przestrzeni są obiektami),

elementy przestrzeni są obiektami),

multimodele (grafowe lub sieciowe modele 

multimodele (grafowe lub sieciowe modele 

złożone z innych typów);

złożone z innych typów);

background image

7

Klasyfikacja modeli symulacyjnych -II

statyczne – pomijają czas lub opisują chwilowy stan 

statyczne – pomijają czas lub opisują chwilowy stan 

systemu w pewnym momencie (np. układ równań 

systemu w pewnym momencie (np. układ równań 

różniczkowych Chapmana-Kołmogorowa opisujących SMO 

różniczkowych Chapmana-Kołmogorowa opisujących SMO 

w stanie ustalonym);

w stanie ustalonym);

dynamiczne – wyraźnie podkreślają zjawisko czasu (np. 

dynamiczne – wyraźnie podkreślają zjawisko czasu (np. 

układ równań różniczkowych Chapmana-Kołmogorowa 

układ równań różniczkowych Chapmana-Kołmogorowa 

opisujących SMO w stanie przejściowym);

opisujących SMO w stanie przejściowym);

deterministyczne – brak losowych zależności w modelu 

deterministyczne – brak losowych zależności w modelu 

(np. prosty dwurównaniowy model Keynesowski zależności 

(np. prosty dwurównaniowy model Keynesowski zależności 

między dochodem narodowym i konsumpcją (bez 

między dochodem narodowym i konsumpcją (bez 

składnika losowego));

składnika losowego));

stochastyczne – niektóre z zależności w modelu mają 

stochastyczne – niektóre z zależności w modelu mają 

charakter losowy (np. w systemie obsługi klientów w 

charakter losowy (np. w systemie obsługi klientów w 

banku - losowy odstęp czasu między przybyciami klientów 

banku - losowy odstęp czasu między przybyciami klientów 

do kolejki do kasy itp.).

do kolejki do kasy itp.).

background image

8

Klasyfikacja modeli symulacyjnych -III

Podział modeli symulacyjnych ze względu 

Podział modeli symulacyjnych ze względu 

na stopień znajomości stanu elementów 

na stopień znajomości stanu elementów 

systemu, którego są modelem:

systemu, którego są modelem:

Stopień znajomości stanu elementów systemu 

 

Typ modelu  

symulacyjnego 

 

Wejścia systemu 

Formalny opis stanu 

systemu lub procesów 

zachodzących  

w systemie 

 

Wyjścia systemu 

Pierwszy 

znane 

nie znany 

znane 

Drugi 

znane 

znany 

nie znane 

Trzeci 

nie znane 

znany 

znane 

 

background image

9

Klasyfikacja modeli symulacyjnych -III

Modele 

Modele 

typu pierwszego:

typu pierwszego:

 

 

służą do naśladowania (identyfikacji) procesu lub 

służą do naśladowania (identyfikacji) procesu lub 

układu;

układu;

znany jest stan wejść i wyjść systemu (np. 

znany jest stan wejść i wyjść systemu (np. 

empirycznie), natomiast nie jest znany formalny 

empirycznie), natomiast nie jest znany formalny 

opis procesów zachodzących w systemie lub stanu 

opis procesów zachodzących w systemie lub stanu 

systemu; 

systemu; 

model ten wykorzystuje się do sprawdzania 

model ten wykorzystuje się do sprawdzania 

prawdziwości hipotez co do stanu systemu lub 

prawdziwości hipotez co do stanu systemu lub 

procesów w nim zachodzących (np. identyfikacja 

procesów w nim zachodzących (np. identyfikacja 

rodzaju funkcji trendu w modelach tendencji 

rodzaju funkcji trendu w modelach tendencji 

rozwojowej). 

rozwojowej). 

background image

10

Klasyfikacja modeli symulacyjnych -III

Modele 

Modele 

typu drugiego:

typu drugiego:

 

 

służą do badania systemu wprost;

służą do badania systemu wprost;

znany jest stan wejść systemu i formalny opis 

znany jest stan wejść systemu i formalny opis 

stanu systemu lub procesów zachodzących w 

stanu systemu lub procesów zachodzących w 

systemie, natomiast nie jest znany stan wyjść 

systemie, natomiast nie jest znany stan wyjść 

systemu;

systemu;

model ten wykorzystuje się do naśladowania 

model ten wykorzystuje się do naśladowania 

efektów np. decyzji. Sprawdzenie efektów decyzji 

efektów np. decyzji. Sprawdzenie efektów decyzji 

drogą symulacyjną, przed ich zastosowaniem w 

drogą symulacyjną, przed ich zastosowaniem w 

praktyce, może być bardziej owocne niż ich 

praktyce, może być bardziej owocne niż ich 

sprawdzenie metodą „prób i błędów”;

sprawdzenie metodą „prób i błędów”;

background image

11

Klasyfikacja modeli symulacyjnych -III

Modele 

Modele 

typu trzeciego:

typu trzeciego:

 

 

służą do naśladowania optymalnego 

służą do naśladowania optymalnego 

sterowania;

sterowania;

znany jest stan wyjść systemu i formalny opis 

znany jest stan wyjść systemu i formalny opis 

stanu systemu lub procesów zachodzących w 

stanu systemu lub procesów zachodzących w 

systemie, natomiast nie jest znany stan wejść 

systemie, natomiast nie jest znany stan wejść 

systemu;

systemu;

ten model wykorzystuje się m.in. do 

ten model wykorzystuje się m.in. do 

kierowania programowanego; 

kierowania programowanego; 

background image

12

Klasyfikacja symulacji

Symulacja interaktywna to taki sposób prowadzenia eksperymentu, 

Symulacja interaktywna to taki sposób prowadzenia eksperymentu, 

w którym użytkownik (badacz) może wpływać na jego przebieg w 

w którym użytkownik (badacz) może wpływać na jego przebieg w 

trakcie trwania eksperymentu poprzez zmianę parametrów modelu 

trakcie trwania eksperymentu poprzez zmianę parametrów modelu 

symulacyjnego.

symulacyjnego.

Rozproszona symulacja interaktywna (ang. Distributed Interactive 

Rozproszona symulacja interaktywna (ang. Distributed Interactive 

Simulation,DIS) realizacja eksperymentu symulacyjnego w 

Simulation,DIS) realizacja eksperymentu symulacyjnego w 

rozproszonym środowisku komputerowym. 

rozproszonym środowisku komputerowym. 

czasem

zdarzeniami

ciągła

Symulacja

dyskretna

Symulacja

t

0

t

0

t

k

t

1

t

k+1

 = t

+ t,  t=const

0

1

2

k

...

e

n

...

background image

13

Etapy budowy modelu symulacyjnego 

(1) określenie systemu;

(1) określenie systemu;

(2) sformułowanie modelu;

(2) sformułowanie modelu;

(3) ustalenie danych dla modelu;

(3) ustalenie danych dla modelu;

(4) zaprogramowanie modelu;

(4) zaprogramowanie modelu;

(5) planowanie 

eksperymentów 

(5) planowanie 

eksperymentów 

symulacyjnych;

symulacyjnych;

(6) ocenę uzyskanych wyników;

(6) ocenę uzyskanych wyników;

(7) ocenę adekwatności modelu;

(7) ocenę adekwatności modelu;

(8) 

(8) 

dokumentowanie.

dokumentowanie.

 

 

background image

14

Warunki początkowe i końcowe

Traktujemy model symulacyjny jak „czarną 

Traktujemy model symulacyjny jak „czarną 

skrzynkę” a następnie: 

skrzynkę” a następnie: 

określamy zestawy danych wejściowych;

określamy zestawy danych wejściowych;

ustalamy zestawy charakterystyk 

ustalamy zestawy charakterystyk 

wyjściowych;

wyjściowych;

dobieramy estymatory badanych 

dobieramy estymatory badanych 

charakterystyk -  określamy ich populację 

charakterystyk -  określamy ich populację 

generalną i rozkłady tych populacji;

generalną i rozkłady tych populacji;

ustalamy kryteria jakości badań 

ustalamy kryteria jakości badań 

symulacyjnych.

symulacyjnych.

background image

15

Określenie zestawów danych 

wejściowych

Eksperyment realizowany jest dla wielu parametrów 

Eksperyment realizowany jest dla wielu parametrów 

wejściowych i dla ustalonego zakresu zmienności tych 

wejściowych i dla ustalonego zakresu zmienności tych 

parametrów.

parametrów.

x

x

j

j

 

 





jmin

jmin

jmax

jmax

 

 

 ,

 ,

Doświadczenie rozpoczynamy od typowej konfiguracji 

Doświadczenie rozpoczynamy od typowej konfiguracji 

zmiennych wejściowych a następnie zmieniając jedną z 

zmiennych wejściowych a następnie zmieniając jedną z 

nich obserwujemy, jaki był efekt tej zmiany na odpowiedź 

nich obserwujemy, jaki był efekt tej zmiany na odpowiedź 

systemu.

systemu.

Dopuszczalne a nawet wymagane są zestawy danych 

Dopuszczalne a nawet wymagane są zestawy danych 

„nierealnych” lub niespotykanych w rzeczywistości – 

„nierealnych” lub niespotykanych w rzeczywistości – 

dlaczego?

dlaczego?

eksperymen

t

na obiekcie

badanym

x

1

x

2

x

m

we

wy

k

K

1,

j

m

1,

background image

16

Określenie zestawów danych 

wejściowych

E

E

ksperymenty symulacyjne prowadz

ksperymenty symulacyjne prowadz

one są

one są

 

 

m.in. 

m.in. 

po 

po 

to, by określić jakie mogą być konsekwencje 

to, by określić jakie mogą być konsekwencje 

przyjętych w danym eksperymencie założeń o 

przyjętych w danym eksperymencie założeń o 

zmianach

zmianach

 wartości parametrów wejściowych.

 wartości parametrów wejściowych.

Dają możliwość

Dają możliwość

 analiz

 analiz

y

y

 przyszłych możliwych stanów 

 przyszłych możliwych stanów 

systemu, np. 

systemu, np. 

gospodarki

gospodarki

 narodowej.

 narodowej.

 

 

Rezultaty analizy sprowadzają się 

Rezultaty analizy sprowadzają się 

często

często

 do stwierdzeń 

 do stwierdzeń 

typu

typu

:

:

 

 

„J

„J

eżeli ukształtują się 

eżeli ukształtują się 

dane 

dane 

warunki

warunki

,

,

 

 

przebieg

przebieg

 

 

zjawiska

zjawiska

 

 

będzie 

będzie 

następujący i prowadzona

następujący i prowadzona

 

 

będzie dana 

będzie dana 

polityka 

polityka 

decyzyjna,

decyzyjna,

 to wtedy osiągnięte zostaną 

 to wtedy osiągnięte zostaną 

następujące wyniki”

następujące wyniki”

.

.

 

 

Dla odróżnienia „p

Dla odróżnienia „p

rognoza

rognoza

 mówi nam o tym, jak 

 mówi nam o tym, jak 

najprawdopodobniej ukształtuje się 

najprawdopodobniej ukształtuje się 

określone 

określone 

zjawisko

zjawisko

 w przyszłości.

 w przyszłości.

background image

17

Określenie zestawów danych 

wejściowych

Dla wielu parametrów wejściowych i dla 

Dla wielu parametrów wejściowych i dla 

ustalonego zakresu zmienności tych 

ustalonego zakresu zmienności tych 

parametrów konstruuje się 

parametrów konstruuje się 

plan 

plan 

eksperymentu

eksperymentu

Planem eksperymentu nazywa się tablicę:

Planem eksperymentu nazywa się tablicę:

x

x

ij

ij

 - oznacza wartość czynnika 

 - oznacza wartość czynnika 

x

x

j

j

 w 

 w 

i

i

-tym 

-tym 

powtórzeniu eksperymentu

powtórzeniu eksperymentu

 

 

 

max

min

,

,

2

,

1

,

,

1

,

1

,

,

,...,

,...,

,

j

j

j

jnj

j

j

j

j

ij

m

j

n

i

ij

X

x

x

Q

background image

18

Określenie zestawów danych 

wejściowych

Pełne doświadczenia czynnikowe

Pełne doświadczenia czynnikowe

Doświadczenie  polega  na  sprawdzeniu  wszystkich 

Doświadczenie  polega  na  sprawdzeniu  wszystkich 

możliwych 

kombinacji 

wszystkich 

zmiennych 

możliwych 

kombinacji 

wszystkich 

zmiennych 

wejściowych  (czynników)  i  na  wszystkich  poziomach 

wejściowych  (czynników)  i  na  wszystkich  poziomach 

wartości. Wymaga to przeprowadzenie 

wartości. Wymaga to przeprowadzenie 

n*m”

n*m”

 prób

 prób

.

.

Zaletą pełnego doświadczenia czynnikowego jest to, że 

Zaletą pełnego doświadczenia czynnikowego jest to, że 

badając wszystkie możliwe przypadki, możemy znaleźć 

badając wszystkie możliwe przypadki, możemy znaleźć 

wpływ  na  odpowiedź  systemu  każdego  czynnika  z 

wpływ  na  odpowiedź  systemu  każdego  czynnika  z 

osobna oraz oddziaływań między nimi.

osobna oraz oddziaływań między nimi.

Główną  wadą  jest  natomiast  wysoki  koszt  takiego 

Główną  wadą  jest  natomiast  wysoki  koszt  takiego 

badania  biorąc  pod  uwagę  fakt,  że  każdy  pojedyncze 

badania  biorąc  pod  uwagę  fakt,  że  każdy  pojedyncze 

doświadczenie  może  być  wielokrotnie  powtórzone. 

doświadczenie  może  być  wielokrotnie  powtórzone. 

Koszt  ten  może  być  mierzony  czasem  realizacji 

Koszt  ten  może  być  mierzony  czasem  realizacji 

przedsięwzięcia oraz kosztem ekonomicznym.

przedsięwzięcia oraz kosztem ekonomicznym.

 

 

background image

19

Określenie zestawów danych 

wejściowych

Są trzy sposoby redukcji liczby pojedynczych 

Są trzy sposoby redukcji liczby pojedynczych 

eksperymentów:

eksperymentów:

zmniejszenie liczby poziomów każdego czynnika

zmniejszenie liczby poziomów każdego czynnika

zmniejszenie liczby czynników

zmniejszenie liczby czynników

użycie ułamkowego doświadczenia czynnikowego.

użycie ułamkowego doświadczenia czynnikowego.

W niektórych przypadkach możemy chcieć 

W niektórych przypadkach możemy chcieć 

sprawdzić jedynie 

sprawdzić jedynie 

dwa poziomy

dwa poziomy

 dla każdego 

 dla każdego 

czynnika a następnie określić względną ich wagę 

czynnika a następnie określić względną ich wagę 

oraz wpływ na odpowiedź systemu. 

oraz wpływ na odpowiedź systemu. 

Pełne doświadczenie czynnikowe, w którym 

Pełne doświadczenie czynnikowe, w którym 

wykorzystywanych jest k zmiennych wejściowych o 

wykorzystywanych jest k zmiennych wejściowych o 

dwóch

dwóch

 

 

poziomach

poziomach

 wartości wymaga 

 wartości wymaga 

przeprowadzenia 2

przeprowadzenia 2

k

k

 eksperymentów. 

 eksperymentów. 

background image

20

Określenie zestawów danych 

wejściowych

Ułamkowe doświadczenia czynnikowe

Ułamkowe doświadczenia czynnikowe

Stosowane, gdy liczba eksperymentów 

Stosowane, gdy liczba eksperymentów 

jest zbyt duża.

jest zbyt duża.

Ograniczenie liczby wymaganych 

Ograniczenie liczby wymaganych 

eksperymentów poprzez

eksperymentów poprzez

 jednoczesne

 jednoczesne

:

:

zmniejszenie liczby czynników podlegających 

zmniejszenie liczby czynników podlegających 

ocenie,

ocenie,

zmniejszenie liczby poziomów badanych 

zmniejszenie liczby poziomów badanych 

czynników.

czynników.

 

 

background image

21

Określenie zestawów danych 

wejściowych

I

I

nne układy eksperymentów

nne układy eksperymentów

układy czynnikowe z częściową 

układy czynnikowe z częściową 

replikacją, 

replikacją, 

układy obrotowe, 

układy obrotowe, 

kwadraty łacińskie, 

kwadraty łacińskie, 

kwadraty grecko-łacińskie, 

kwadraty grecko-łacińskie, 

układy powierzchni reakcji 

układy powierzchni reakcji 

background image

22

Szacowanie liczności próby

Liczność  próby

Liczność  próby

 

 

ma  znaczący  wpływ  na 

ma  znaczący  wpływ  na 

dokładność uzyskanych estymatorów

dokładność uzyskanych estymatorów

.

.

W

W

obec 

obec 

tego

tego

 prostą, lecz skuteczną metodą 

 prostą, lecz skuteczną metodą 

nadzorowania symulacji jest obliczanie na 

nadzorowania symulacji jest obliczanie na 

bieżąco wartości wariancji z próby dla 

bieżąco wartości wariancji z próby dla 

szacowanych charakterystyk i parametrów.

szacowanych charakterystyk i parametrów.

 

 

Na 

Na 

etapie przygotowania eksperymentu

etapie przygotowania eksperymentu

 

 

można ocenić,

można ocenić,

 jaka musi być liczność 

 jaka musi być liczność 

próby, aby uzyskać 

próby, aby uzyskać 

oszacowanie

oszacowanie

 na 

 na 

ustalonym poziomie ufności

ustalonym poziomie ufności

background image

23

Szacowanie liczności próby

Najczęściej rozkład populacji generalnej 

Najczęściej rozkład populacji generalnej 

jest normalny N(

jest normalny N(

,

,

)

)

,

,

 ale oba parametry 

 ale oba parametry 

tego rozkładu 

tego rozkładu 

zazwyczaj 

zazwyczaj 

nie są znane i 

nie są znane i 

muszą być szacowane na podstawie 

muszą być szacowane na podstawie 

próby. 

próby. 

Aby poznać wartoś

Aby poznać wartoś

ć

ć

 parametru 

 parametru 

dokonuje się losowania wstępnej próby, 

dokonuje się losowania wstępnej próby, 

zwanej pilotażową, o liczności 

zwanej pilotażową, o liczności 

n

n

0

0

 

 

i oblicza 

i oblicza 

się z niej wartość statystyki

się z niej wartość statystyki

z

U

i

U

i

n

n

X

X

1

1

0

2

1

0

(

)

background image

24

Szacowanie liczności próby

N

N

astępnie 

astępnie 

ze wzoru:

ze wzoru:

 

 

z

z

najdujemy minimalną liczność próby

najdujemy minimalną liczność próby

,

,

gdzie 

gdzie 

g

g

 jest połową długości

 jest połową długości

 

 

przedziału 

przedziału 

ufności

ufności

:  

:  

2





g

k

z

n

P X k

X X k

 







 

n

n

1

background image

25

Szacowanie liczności próby

Jeżeli nie możemy lub nie chcemy 

Jeżeli nie możemy lub nie chcemy 

przyjmować założenia o normalności 

przyjmować założenia o normalności 

rozkładu populacji generalnej, to możemy 

rozkładu populacji generalnej, to możemy 

skorzystać z nierówności Czebyszewa:

skorzystać z nierówności Czebyszewa:

Wymagana jest znajomość wartości 

Wymagana jest znajomość wartości 

odchylenia standardowego s zmiennej 

odchylenia standardowego s zmiennej 

losowej X - jeżeli nie jest ono znane, 

losowej X - jeżeli nie jest ono znane, 

można zastosować oszacowanie: 

można zastosować oszacowanie: 

z

U

i

U

i

n

n

X

X

1

1

0

2

1

0

(

)

1

}

|

{|X

P

background image

26

Szacowanie liczności próby

Z nierówności Czebyszewa wynika, że 

Z nierówności Czebyszewa wynika, że 

dla próby losowej x

dla próby losowej x

1

1

, x

, x

2

2

,...,x

,...,x

n

n

, dla której:

, dla której:

otrzymujemy:

otrzymujemy:

Z założenia  poziom ufności wynosi 1-a, 

Z założenia  poziom ufności wynosi 1-a, 

więc:

więc:

n

n

1

1

ˆ

i

i

x

x

2

2

1

}

|

{|

n

x

P

1

1

2

2

n

2

2

n

background image

27

Ustalenie zestawu charakterystyk 

wyjściowych

Wielokrotne przeprowadzenie eksperymentu 

Wielokrotne przeprowadzenie eksperymentu 

umożliwia powtórzenie badania systemu dla 

umożliwia powtórzenie badania systemu dla 

różnych chwil 

różnych chwil 

t

t

r

r

,

,

r

r

- kolejny 

- kolejny 

eksperyment

eksperyment

W „określonych” momentach gromadzone są 

W „określonych” momentach gromadzone są 

potrzebne dane.

potrzebne dane.

Na podstawie uzyskanych 

Na podstawie uzyskanych 

r

r

 wartości 

 wartości 

badanych charakterystyk systemu otrzymuje 

badanych charakterystyk systemu otrzymuje 

się próbę losową

się próbę losową

 pewnej

 pewnej

 populacji 

 populacji 

generalnej wszystkich 

generalnej wszystkich 

możliwych 

możliwych 

wyników 

wyników 

eksperymentów dla obserwowan

eksperymentów dla obserwowan

ych

ych

 

 

charakterystyk. 

charakterystyk. 

background image

28

Ustalenie zestawu charakterystyk 

wyjściowych

Zasadniczym celem symulacji jest wyznaczenie 

Zasadniczym celem symulacji jest wyznaczenie 

charakterystyk procesów stacjonarnych (ustalonych), 

charakterystyk procesów stacjonarnych (ustalonych), 

tzn. charakterystyk granicznego rozkładu 

tzn. charakterystyk granicznego rozkładu 

prawdopodobieństwa F(x) zmiennej losowej X 

prawdopodobieństwa F(x) zmiennej losowej X 

(pewnej charakterystyki badanego systemu), tj. 

(pewnej charakterystyki badanego systemu), tj. 

rozkładu, dla którego:

rozkładu, dla którego:

Przykładowe charakterystyki:

Przykładowe charakterystyki:

Terminowość realizacji 

Terminowość realizacji 

poszczególnych 

poszczególnych 

etapów 

etapów 

decyzyjnych;

decyzyjnych;

Oczekiwana liczba klientów w oddziale banku w ciągu dnia;

Oczekiwana liczba klientów w oddziale banku w ciągu dnia;

Wskaźnik rynku papierów wartościowych

Wskaźnik rynku papierów wartościowych

;

;

)

(

}

{

lim

x

F

x

X

P

n

n

background image

29

Ustalenie zestawu charakterystyk 

wyjściowych

Estymacja takich charakterystyk rozkładu F(x), jak 

Estymacja takich charakterystyk rozkładu F(x), jak 

średnia lub wariancja, na podstawie próby X

średnia lub wariancja, na podstawie próby X

1

1

X

X

2

2

, ..., X

, ..., X

n

n

 i za pomocą znanych metod statystyki 

 i za pomocą znanych metod statystyki 

matematycznej napotyka następujące trudności: 

matematycznej napotyka następujące trudności: 

nie jest znany a priori moment (oznaczmy go przez 

nie jest znany a priori moment (oznaczmy go przez 

m

m

), 

), 

od którego wszystkie kolejne zmienne losowe X

od którego wszystkie kolejne zmienne losowe X

m+1

m+1

X

X

m+2

m+2

, ..., X

, ..., X

n

n

 mają rozkład F(x); okres od 

 mają rozkład F(x); okres od 

1

1

 do 

 do 

m

m

 nosi 

 nosi 

nazwę 

nazwę 

fazy przejściowej

fazy przejściowej

;

;

warunkiem prawidłowej estymacji jest założenie, że 

warunkiem prawidłowej estymacji jest założenie, że 

rozkład F(x) jest rozkładem normalnym.

rozkład F(x) jest rozkładem normalnym.

zmienne losowe X

zmienne losowe X

i

i

 są najczęściej skorelowane (zwykle 

 są najczęściej skorelowane (zwykle 

dodatnio),   a zatem nie są niezależne, co wyklucza 

dodatnio),   a zatem nie są niezależne, co wyklucza 

możliwość zastosowania wprost reguł estymacji 

możliwość zastosowania wprost reguł estymacji 

zakładających niezależność elementów próby;

zakładających niezależność elementów próby;

background image

30

Ustalenie zestawu charakterystyk 

wyjściowych

skorelowane zmienne losowe X

skorelowane zmienne losowe X

i

i

Rozwiązanie 1: metoda niezależnych przebiegów 

Rozwiązanie 1: metoda niezależnych przebiegów 

(metoda replikacji):

(metoda replikacji):

wykonanie r niezależnych przebiegów symulacyjnych; 

wykonanie r niezależnych przebiegów symulacyjnych; 

wyznaczenie estymatorów punktowych żądanych parametrów 

wyznaczenie estymatorów punktowych żądanych parametrów 

w poszczególnych przebiegach;

w poszczególnych przebiegach;

przyjęcie za wynik średniej z ustalonych w ten sposób 

przyjęcie za wynik średniej z ustalonych w ten sposób 

estymatorów;

estymatorów;

odpowiednie przedziały ufności można również zbudować na 

odpowiednie przedziały ufności można również zbudować na 

podstawie wyznaczonego ciągu r estymatorów – z powodu 

podstawie wyznaczonego ciągu r estymatorów – z powodu 

niezależności przebiegów niezależne są także poszczególne 

niezależności przebiegów niezależne są także poszczególne 

estymatory. 

estymatory. 

(Wykonując kolejne przebiegi symulacyjne należy pamiętać o 

(Wykonując kolejne przebiegi symulacyjne należy pamiętać o 

odcięciu fazy przejściowej)

odcięciu fazy przejściowej)

background image

31

Ustalenie zestawu charakterystyk 

wyjściowych

skorelowane zmienne losowe X

skorelowane zmienne losowe X

i

i

Rozwiązanie 2: metoda pojedynczego 

Rozwiązanie 2: metoda pojedynczego 

przebiegu:

przebiegu:

Podstawę estymacji charakterystyk procesu przy 

Podstawę estymacji charakterystyk procesu przy 

tym podejściu stanowią wyniki pojedynczego 

tym podejściu stanowią wyniki pojedynczego 

przebiegu symulacyjnego, odpowiednio długiego i 

przebiegu symulacyjnego, odpowiednio długiego i 

podzielonego na rozłączne odcinki;

podzielonego na rozłączne odcinki;

Pojęcie odcinka jest utożsamiane z pojedynczym 

Pojęcie odcinka jest utożsamiane z pojedynczym 

przebiegiem w metodzie niezależnych przebiegów 

przebiegiem w metodzie niezależnych przebiegów 

(do szacowania poszczególnych parametrów stosuje 

(do szacowania poszczególnych parametrów stosuje 

się wprost procedury estymacji wykorzystywane w 

się wprost procedury estymacji wykorzystywane w 

metodzie niezależnych przebiegów);

metodzie niezależnych przebiegów);

background image

32

Estymatory charakterystyk

Uzyskane podczas symulacji

Uzyskane podczas symulacji

 zbiory danych, 

 zbiory danych, 

zawierające realizacje zmiennych losowych 

zawierające realizacje zmiennych losowych 

oraz wartości charakterystyk są 

oraz wartości charakterystyk są 

liczne

liczne

, wobec 

, wobec 

czego do dalszej analizy należy je przekształcić 

czego do dalszej analizy należy je przekształcić 

przy pomocy określonej funkcji próby losowej, 

przy pomocy określonej funkcji próby losowej, 

będącej również zmienną losową

będącej również zmienną losową

, tzn.

, tzn.

 

 

statystyk

statystyk

i

i

W celu oszacowania ustalonych w wyniku 

W celu oszacowania ustalonych w wyniku 

grania charakterystyk, należy uzyskać na 

grania charakterystyk, należy uzyskać na 

podstawie próby wartości 

podstawie próby wartości 

specjalnych statystyk 

specjalnych statystyk 

zwanych 

zwanych 

estymator

estymator

ami

ami

 tych charakterystyk. 

 tych charakterystyk. 

background image

33

Identyfikacja typu rozkładu badanej 

ch-yki

Załóżmy,  że  otrzymaliśmy  realizację  próby  losowej  dla 

Załóżmy,  że  otrzymaliśmy  realizację  próby  losowej  dla 

wartości wybranej charakterystyki X

wartości wybranej charakterystyki X

.

.

 Jest to skończony 

 Jest to skończony 

ciąg liczb:

ciąg liczb:

x

x

1

1

, x

, x

2

2

, ..., x

, ..., x

i

i

, ..., x

, ..., x

n

n

Przekształćmy 

ten 

ciąg 

do 

postaci 

ciągu 

Przekształćmy 

ten 

ciąg 

do 

postaci 

ciągu 

uporządkowanego rosnąco, tzn.

uporządkowanego rosnąco, tzn.

x

x

*

*

1

1

, x

, x

*

*

2

2

, ..., x

, ..., x

*

*

i

i

, ..., x

, ..., x

*

*

n

n

 ,

 ,

dla którego

dla którego

x

x

*

*

i+1 

i+1 

  x

  x

*

*

i

i

Następnie podzielmy obserwacje  x

Następnie podzielmy obserwacje  x

*

*

1

1

, x

, x

*

*

2

2

, ..., x

, ..., x

*

*

i

i

, ..., x

, ..., x

*

*

n

n

  

  

na  R  rozłącznych  klas,  R 

na  R  rozłącznych  klas,  R 

 

 

n

n

,  tworząc  szereg 

,  tworząc  szereg 

rozdzielczy,  z  którego  możemy  otrzymać  dystrybuantę 

rozdzielczy,  z  którego  możemy  otrzymać  dystrybuantę 

empiryczną F

empiryczną F

n

n

(x)

(x)

 

 

background image

34

Identyfikacja typu rozkładu badanej 

ch-yki

Dystrybuanta 

Dystrybuanta 

empiryczna:

empiryczna:

gdzie :

gdzie :

x

x

s

s

r

r

- środek r-tej klasy ;

- środek r-tej klasy ;

m

m

r

r

-  liczność  r-tej  klasy, 

-  liczność  r-tej  klasy, 

przy czym zachodzi .

przy czym zachodzi .

 

 



<

    

dla

        

1

    

dla

   

    

dla

        

0

)

(

1

1

1

1

s

R

s

r

s

r

i

i

s

x

x

x

x

n

m

x

x

x

F

n

background image

35

Identyfikacja typu rozkładu badanej 

ch-yki

Oznaczmy  przez  F

Oznaczmy  przez  F

0

0

  dystrybuantę  teoretyczną  rozkładu 

  dystrybuantę  teoretyczną  rozkładu 

populacji generalnej. Będziemy sprawdzać hipotezę 

populacji generalnej. Będziemy sprawdzać hipotezę 

H

H

: F

: F

0

0

= F

= F

n

n

.

.

Można pokazać, że następująca statystyka:

Można pokazać, że następująca statystyka:

 

 

   

   

     

     

przy  dużym 

przy  dużym 

n

n

  i  założeniu  prawdziwości  hipotezy 

  i  założeniu  prawdziwości  hipotezy 

H

H

  dąży  do 

  dąży  do 

rozkładu 

rozkładu 

2

2

-Pearsona o R-1 stopniach swobody. Ograniczeniem 

-Pearsona o R-1 stopniach swobody. Ograniczeniem 

dla tej metody jest konieczność posiadania dużej próby (

dla tej metody jest konieczność posiadania dużej próby (

n

n

30) 

30) 

oraz 

oraz 

m

m

r   

r   

  5

  5

,     

,     

              .

              .

  Obszar  krytyczny  dla  testu  Pearsona  jest 

  Obszar  krytyczny  dla  testu  Pearsona  jest 

postaci 

postaci 

,  gdzie   

,  gdzie   

jest  kwantylem  rozkładu 

jest  kwantylem  rozkładu 

2

2

  dla  R-1 

  dla  R-1 

stopni swobody przy poziomie istotności 

stopni swobody przy poziomie istotności 

.

.

 

 

m

F x

F x

F x

F x

r

r

s

r

s

r

s

r

s

r

R

 

n

n

(

)

( )

(

)

( )

1

2

1

1

R

(

, )

1

2

1

2

r

R

1,

background image

36

Analiza regresji

W analizie wyników symulacji 

W analizie wyników symulacji 

wykorzystuje się analizę regresji;

wykorzystuje się analizę regresji;

Jest to narzędzie do ustalenia postaci 

Jest to narzędzie do ustalenia postaci 

funkcyjnej zależności między pewnymi 

funkcyjnej zależności między pewnymi 

charakterystykami 

charakterystykami 

(np. na wejściu systemu mierzymy 

(np. na wejściu systemu mierzymy 

wartości pewnej charakterystyki X, a na 

wartości pewnej charakterystyki X, a na 

wyjściu tego systemu – wartości 

wyjściu tego systemu – wartości 

charakterystyki Y);

charakterystyki Y);

background image

37

Analiza regresji

Model:

Model:

y

y

t

t

=f

=f

t

t

(x

(x

1t

1t

, x

, x

2t

2t

,..., x

,..., x

kt

kt

,..., x

,..., x

Kt

Kt

,

,

t

t

), t=1,2,...,n, 

), t=1,2,...,n, 

k=1,2,...,K         

k=1,2,...,K         

y - zmienna objaśniana, regresant

y - zmienna objaśniana, regresant

x - zmienna objaśniająca, regresor, 

x - zmienna objaśniająca, regresor, 

 

 

- składnik losowy,

- składnik losowy,

t - numer kolejnej obserwacji,

t - numer kolejnej obserwacji,

k - numer kolejnej zmiennej objaśniającej

k - numer kolejnej zmiennej objaśniającej

background image

38

Analiza regresji

Rodzaje zależności:

Rodzaje zależności:

Zależność liniowa – f(x) jest funkcją liniową:

Zależność liniowa – f(x) jest funkcją liniową:

f(x) = 

f(x) = 





+

+





x,

x,

Zależność stochastyczna:

Zależność stochastyczna:

f(x) = 

f(x) = 





+

+





x + 

x + 

,

,

gdzie 

gdzie 

jest „składnikiem losowym” o znanym rozkładzie 

jest „składnikiem losowym” o znanym rozkładzie 

prawdopodobieństwa.

prawdopodobieństwa.

Dla wielu zmiennych objaśniających:

Dla wielu zmiennych objaśniających:

y = 

y = 





1

1

x

x

1

1

 + 

 + 

2

2

x

x

2

2

 + ... + 

 + ... + 

K

K

x

x

K

K

 + 

 + 

,  gdzie

,  gdzie

czynnik deterministyczny:

czynnik deterministyczny:





1

1

x

x

1

1

 + 

 + 

2

2

x

x

2

2

 + ... + 

 + ... + 

K

K

x

x

K

K

,

,

czynnik stochastyczny:

czynnik stochastyczny:

,

,

parametry strukturalne:

parametry strukturalne:

1

1

2

2

, ... , 

, ... , 

K

K

.

.

background image

39

Analiza regresji

Zapis wektorowy zależności modelu:

Zapis wektorowy zależności modelu:

Uwzględnienie wyrazu wolnego pociąga za sobą 

Uwzględnienie wyrazu wolnego pociąga za sobą 

konieczność wprowadzenia wektora kolumnowego 

konieczność wprowadzenia wektora kolumnowego 

x

x

1

1

t

t

=

=

1

1

1

,

,...,

1

,

1

1

t

t

K

k

kt

k

t

x

n

t

x

y

]

,...,

,

[

 

2

1

)

(

)

(

)

(

Kt

t

t

t

k

t

k

t

k

t

x

x

x

x

gdzie

x

y

K

k

:

2

1

)

(

background image

40

Analiza regresji

Macierzowy zapis modelu

Macierzowy zapis modelu

Kn

n

K

K

n

k

k

k

t

t

t

x

...

x

1

:

...

:

:

x

...

x

1

x

...

x

1

x

:

x

x

]

|

...

|

|

[

2

2

22

1

1

2

)

(

)2

(

)1

(

)

K(

)

2(

)

1(

x

x

x

X

)

(

)

(

)

(

t

k

t

ξ

y

background image

41

Analiza regresji

Estymacja parametrów modelu

Estymacja parametrów modelu

Rozważamy model, gdy spełnione są 

Rozważamy model, gdy spełnione są 

założenia schematu Gaussa-Markowa oraz 

założenia schematu Gaussa-Markowa oraz 

K=1 (regresja prosta):

K=1 (regresja prosta):

Wartość oczekiwana zmiennej objaśnianej 

Wartość oczekiwana zmiennej objaśnianej 

równa jest zatem: 

równa jest zatem: 

Powyższe równanie wyznacza linię regresji 

Powyższe równanie wyznacza linię regresji 

populacji generalnej

populacji generalnej

Wariancja zaś równa jest:

Wariancja zaś równa jest:

t

t

x

Y

E

1

0

)

(

2

2

2

1

0

1

0

2

2

)

(

)

(

))

(

(

)

(

t

t

t

t

t

t

t

E

x

-

x

E

Y

E

Y

E

Y

D

background image

42

Analiza regresji

Rozkład normalny:

Rozkład normalny:

Zmienne losowe Y

Zmienne losowe Y

t

t

 mają również 

 mają również 

rozkład normalny:

rozkład normalny:

Parametry 

Parametry 

1

1

 są nieznane i 

 są nieznane i 

podlegają oszacowaniu na podstawie 

podlegają oszacowaniu na podstawie 

próby statystycznej

próby statystycznej

Zatem linia regresji próby:

Zatem linia regresji próby:

)

,

(

:

2

t

t

N

)

,

(

:

2

1

0

t

t

x

N

Y

t

t

x

y

1

0

ˆ

ˆ

ˆ

background image

43

Analiza regresji

Estymatory

Estymatory

są funkcjami zmiennych losowych 

są funkcjami zmiennych losowych 

Y

Y

t

t

;

;

Różnice                            

Różnice                            

nazywamy resztami; 

nazywamy resztami; 

Mamy cztery funkcje:

Mamy cztery funkcje:

linia regresji populacji generalnej LRPG

linia regresji populacji generalnej LRPG

linia regresji próby LRP

linia regresji próby LRP

wartości empiryczne (populacja generalna) WEPG

wartości empiryczne (populacja generalna) WEPG

wartości empiryczne (próba) WEP

wartości empiryczne (próba) WEP

(WEPG = WEP)

(WEPG = WEP)

1

0

ˆ

,

ˆ

t

t

t

y

Y

e

ˆ

t

t

x

y

1

0

ˆ

ˆ

ˆ

t

t

x

EY

1

0

t

t

t

x

Y

1

0

t

t

t

e

x

Y

1

0

ˆ

ˆ

background image

44

Analiza regresji

Zgodnie z założeniami schematu Gaussa-

Zgodnie z założeniami schematu Gaussa-

Markowa cała informacja o nieznanych 

Markowa cała informacja o nieznanych 

parametrach modelu regresji jest zawarta w 

parametrach modelu regresji jest zawarta w 

próbie statystycznej;

próbie statystycznej;

Poszukujemy estymatora , który minimalizuje 

Poszukujemy estymatora , który minimalizuje 

sumę kwadratów reszt:

sumę kwadratów reszt:

Inaczej: szukamy linii, która jest najlepsza z 

punktu widzenia sumy kwadratów reszt e

(min)

Reszty e

t

 można traktować jako realizacje 

składnika losowego.

min

)

(

1

2

n

t

t

e

background image

45

Analiza regresji

min

)

(

7

1

2

t

t

e

x

y

1

0

ˆ

ˆ

ˆ

     x

1     

x

2        

x

3      

x

4      

x

5      

x

6      

x

7                            

         

x

4

e

background image

46

Analiza regresji

Otrzymujemy:

Otrzymujemy:

2

1

1

1

)

(

/

)

)(

(

ˆ

        

          

          

x

x

y

y

x

x

n

t

t

t

n

t

t

n

x

y

n

t

t

n

t

t

/

ˆ

ˆ

1

1

1

0





background image

47

Analiza regresji

Ocena modelu - współczynnik determinacji R

Ocena modelu - współczynnik determinacji R

2

2

  

  

Jest liczbą z przedziału <0, 1> albo po przekształceniu z przedziału 

Jest liczbą z przedziału <0, 1> albo po przekształceniu z przedziału 

<0%, 100%>

<0%, 100%>

Informuje, jak część zmienności zmiennej objaśnianej jest wyjaśniana 

Informuje, jak część zmienności zmiennej objaśnianej jest wyjaśniana 

przez zmienne objaśniające;

przez zmienne objaśniające;

Gdy wartość R

Gdy wartość R

2

2

 bliska jest 1 mówimy o bardzo dobrym dopasowaniu 

 bliska jest 1 mówimy o bardzo dobrym dopasowaniu 

modelu do danych empirycznych, a gdy jest bliska zeru, uznajemy, że 

modelu do danych empirycznych, a gdy jest bliska zeru, uznajemy, że 

zbudowany model nie wyjaśnia rzeczywistej zmienności zmiennej zależnej. 

zbudowany model nie wyjaśnia rzeczywistej zmienności zmiennej zależnej. 

(Przyjmuje się często, że wartość R

(Przyjmuje się często, że wartość R

2

2

 powinna być większa od 0,6 (60%);)

 powinna być większa od 0,6 (60%);)

Wyznacza się również dodatkowo skorygowany współczynnik 

Wyznacza się również dodatkowo skorygowany współczynnik 

determinacji R

determinacji R

2

2

*:

*:

Dla dowolnego modelu R

Dla dowolnego modelu R

2

2

 R

 R

2

2

. Jeżeli różnica pomiędzy liczbą obserwacji 

. Jeżeli różnica pomiędzy liczbą obserwacji 

a liczbą zmiennych jest duża, to obie miary zgodności mają zbliżone 

a liczbą zmiennych jest duża, to obie miary zgodności mają zbliżone 

wartości. 

wartości. 

W p.p. , zwłaszcza przy małej próbie, bardziej wiarygodny jest 

W p.p. , zwłaszcza przy małej próbie, bardziej wiarygodny jest 

skorygowany R

skorygowany R

2

2

*; 

*; 

R

R

R

k

n

k

2

2

*

2

1

)

1

(

background image

48

Analiza regresji

Test dla współczynników modelu regresji linowej (

i

):

Sprawdzeniu podlega hipoteza H

0

: =0

 

 

wobec 

alternatywnej w jednej z postaci H

1

: >0, <0, 0. 

Do weryfikacji hipotezy zerowej stosujemy statystykę 

testową o postaci: , gdzie b jest oszacowaniem 

parametru , S(b) jest błędem 

standardowym.

Statystyka t przy założeniu prawdziwości H

0

 ma 

rozkład t – Studenta o n-2 stopniach swobody.

H

0

 odrzucamy, gdy wartość bezwzględna statystyki 

testowej jest większa od wartości odczytanej z tablic 

danego rozkładu, np. gdy |t|  t

, n-2

Jeżeli nie odrzucimy H

0

, to wniosek, że parametr jest 

statystycznie nieistotny. 

)

(b

S

b

background image

49

Analiza regresji

Zależności zmiennych objaśnianych i 

Zależności zmiennych objaśnianych i 

objaśniających mogą być liniowe lub nieliniowe;

objaśniających mogą być liniowe lub nieliniowe;

Liniowa postać funkcji reprezentuje stały kierunek 

Liniowa postać funkcji reprezentuje stały kierunek 

rozwoju danego zjawiska, wyznaczony przez 

rozwoju danego zjawiska, wyznaczony przez 

współczynnik kierunkowy prostej;

współczynnik kierunkowy prostej;

W przypadku modelu nieliniowego sprowadzamy go 

W przypadku modelu nieliniowego sprowadzamy go 

do postaci liniowej.

do postaci liniowej.

Następnie stosuje się metody znane dla modeli 

Następnie stosuje się metody znane dla modeli 

liniowych.

liniowych.

Należy pamiętać, że przejście z modelu 

Należy pamiętać, że przejście z modelu 

nieliniowego do modelu liniowego w konsekwencji 

nieliniowego do modelu liniowego w konsekwencji 

musi być zastosowane również w odwrotnym 

musi być zastosowane również w odwrotnym 

przekształceniu. 

przekształceniu. 

background image

50

Analiza regresji

W celu oszacowania postaci funkcji stosuje 

W celu oszacowania postaci funkcji stosuje 

się m.in. badanie charakteru funkcji na 

się m.in. badanie charakteru funkcji na 

podstawie rozrzutu punktów empirycznych; 

podstawie rozrzutu punktów empirycznych; 

Metodę tę stosuje się zwłaszcza dla modeli 

Metodę tę stosuje się zwłaszcza dla modeli 

z jedna zmienną objaśniająca. 

z jedna zmienną objaśniająca. 

W innych przypadkach stosować należy 

W innych przypadkach stosować należy 

procedury komputerowego rozpoznawania 

procedury komputerowego rozpoznawania 

kształtów z wykresów rozrzutu punktów 

kształtów z wykresów rozrzutu punktów 

empirycznych.

empirycznych.

Rozważmy kilka przykładów typowych 

Rozważmy kilka przykładów typowych 

postaci związków dwóch zmiennych.

postaci związków dwóch zmiennych.

background image

51

Analiza regresji

Przykłady modeli nieliniowych sprowadzalnych do 

liniowych

• Model wielomianowy

     y=a

0

+a

1

x+ a

2

x

2

 +...+ a

k

x

k

+

możemy zastąpić zmienne x

i

 zmiennymi z

i

 lub 

logarytmować 
stronami równanie otrzymując:
    

y’=log y=loga

0

+loga

+log(x)+ loga

+ 2log(x) +...+ loga

+k log(x)+log 

    y’=[loga

0

+loga

+2loga

+...+ k log(a

k

)]

 

log(x)+ log =A 

log(x)+ log 

x

y

y=a+bx+cx

2

 

+dx

3

x

y

y=a+bx+cx

2

background image

52

Analiza regresji

Przykłady modeli nieliniowych sprowadzalnych 

do liniowych

• Model wykładniczy

y=ba

cx+

 

logarytmując obie strony otrzymujemy:             
y’=log(y)=log(b)+(cx+)log(a) = 

   = log(b)+[clog(a)] x+log(a) = b’+a’x+ c’

x

y

y=bx

a

 

,a<1

y=b+alog(x)

x

y

y=bx

,a>1

y=ba

x

background image

53

Analiza regresji

Przykłady modeli nieliniowych sprowadzalnych do 

liniowych

• Model potęgowy

y=a(x

1

)

b

(x

2

)

c

e

 

logarytmując obie strony logarytmem naturalnym 
otrzymujemy:

y’=ln(y)=ln(a)+bln(x

1

)+cln(x

2

)+

background image

54

Analiza regresji

Przykłady modeli nieliniowych sprowadzalnych 

do liniowych

• Model logarytmiczny

y=b+alog(x) + 

podstawiając x’=log(x) otrzymujemy:

y=b+a x’ + 

background image

55

Metody poprawiania jakości procesu 

symulacji

Wyróżnikiem jakości uzyskanych wyników jest:

Wyróżnikiem jakości uzyskanych wyników jest:

wariancja estymatora;

wariancja estymatora;

przedział ufności estymowanych charakterystyk 

przedział ufności estymowanych charakterystyk 

badanego procesu;

badanego procesu;

Zawężenie przedziału ufności jest możliwe 

Zawężenie przedziału ufności jest możliwe 

przez:

przez:

zwiększenie liczby obserwacji - wymaga zazwyczaj 

zwiększenie liczby obserwacji - wymaga zazwyczaj 

znacznego wydłużenia eksperymentu 

znacznego wydłużenia eksperymentu 

symulacyjnego (nie jest pożądane);

symulacyjnego (nie jest pożądane);

zmniejszenie wariancji - wymaga jedynie 

zmniejszenie wariancji - wymaga jedynie 

właściwego wyboru estymatora lub odpowiedniego 

właściwego wyboru estymatora lub odpowiedniego 

zorganizowania procesu generowania liczb 

zorganizowania procesu generowania liczb 

pseudolosowych (nie wymaga wydłużenia czasu 

pseudolosowych (nie wymaga wydłużenia czasu 

trwania eksperymentu);

trwania eksperymentu);

background image

56

Metody poprawiania jakości procesu 

symulacji

Metody redukcji wariancji:

Metody redukcji wariancji:

metoda zmiennych kontrolnych,

metoda zmiennych kontrolnych,

metoda losowania przeciwstawnego (tzw. 

metoda losowania przeciwstawnego (tzw. 

zmiennych antytetycznych),

zmiennych antytetycznych),

metoda losowania warstwowego

metoda losowania warstwowego

background image

57

Metody poprawiania jakości procesu 

symulacji

metoda zmiennych kontrolnych 

metoda zmiennych kontrolnych 

bazuje na znajomości np. wartości 

bazuje na znajomości np. wartości 

oczekiwanej wybranej zmiennej losowej 

oczekiwanej wybranej zmiennej losowej 

obserwowanej, silnie dodatnio skorelowanej 

obserwowanej, silnie dodatnio skorelowanej 

z badaną zmienną, wskutek czego uzyskuje 

z badaną zmienną, wskutek czego uzyskuje 

się redukcję wariancji;

się redukcję wariancji;

background image

58

Metody poprawiania jakości procesu 

symulacji

metoda losowania przeciwstawnego 

metoda losowania przeciwstawnego 

(zmiennych antytetycznych) 

(zmiennych antytetycznych) 

metoda polega na tym, że jeśli w jednym 

metoda polega na tym, że jeśli w jednym 

eksperymencie symulacyjnym wylosowaliśmy 

eksperymencie symulacyjnym wylosowaliśmy 

ciąg liczb pseudolosowych o rozkładzie 

ciąg liczb pseudolosowych o rozkładzie 

równomiernym z przedziału [0,1]: 

równomiernym z przedziału [0,1]: 

x

x

1

1

, x

, x

2

2

, ..., x

, ..., x

n

n

 

 

, to w kolejnym eksperymencie 

, to w kolejnym eksperymencie 

symulacyjnym korzystamy z liczb: 

symulacyjnym korzystamy z liczb: 

(1-

(1-

x

x

1

1

)

)

(1-

(1-

x

x

2

2

)

)

, ..., 

, ..., 

(1-

(1-

x

x

n

n

)

)

;

;

background image

59

Metody poprawiania jakości procesu 

symulacji

metoda losowania przeciwstawnego 

metoda losowania przeciwstawnego 

wylosowane ciągi liczb pseudolosowych o 

wylosowane ciągi liczb pseudolosowych o 

rozkładzie równomiernym z przedziału [0,1]:

rozkładzie równomiernym z przedziału [0,1]:

x

x

1

1

, x

, x

2

2

, ..., x

, ..., x

n

n

 , 

 , 

(1)

(1)

(1-

(1-

x

x

1

1

)

)

(1-

(1-

x

x

2

2

)

)

, ..., 

, ..., 

(1-

(1-

x

x

n

n

)

)

;

;

(2)

(2)

wariancja zmiennej losowej                    ,         

wariancja zmiennej losowej                    ,         

   , gdzie  i-ty element ciągu (1) jest realizacją 

   , gdzie  i-ty element ciągu (1) jest realizacją 

zmiennej losowej 

zmiennej losowej 

X

X

i

i

 a i-ty element ciągu (2) 

 a i-ty element ciągu (2) 

jest realizacją zmiennej losowej 

jest realizacją zmiennej losowej 

X

X

i

i

 :

 :

ulega zmniejszeniu, wskutek ujemnej 

ulega zmniejszeniu, wskutek ujemnej 

wartości  

wartości  

'

''

i

i

i

X

X

X

n

i

,

1

}

,

{

2

}

{

}

{

}

{

'

'

''

i

i

i

i

i

X

X

Cov

X

V

X

V

X

V

}

,

{

'

i

i

X

X

Cov

background image

60

Metody poprawiania jakości procesu 

symulacji

metoda losowania warstwowego

metoda losowania warstwowego

metoda  z kolei polega na tym, że dla i-tego elementu 

metoda  z kolei polega na tym, że dla i-tego elementu 

ciągu (1) (jako realizacji zmiennej  losowej 

ciągu (1) (jako realizacji zmiennej  losowej 

X

X

i

i

) liczb 

) liczb 

pseudolosowych o rozkładzie równomiernym z 

pseudolosowych o rozkładzie równomiernym z 

przedziału [0,1] wygenerowanych w eksperymencie 

przedziału [0,1] wygenerowanych w eksperymencie 

symulacyjnym ustala się liczbę 

symulacyjnym ustala się liczbę 

x

x

i

i

 skorelowaną z nim 

 skorelowaną z nim 

(jako realizację zmiennej losowej 

(jako realizację zmiennej losowej 

X

X

i

i

’ 

’ 

):

):

x

x

i

i

 używa się w kolejnym eksperymencie

 używa się w kolejnym eksperymencie

liczby te, jak poprzednio, są skorelowane i również dają 

liczby te, jak poprzednio, są skorelowane i również dają 

ujemną kowariancję; 

ujemną kowariancję; 



1

2

1

   

dla

       

,

2

1

2

1

0

   

dla

       

,

2

1

'

i

i

i

i

i

x

x

x

x

x

background image

61

Błędy eksperymentów symulacyjnych

Warunki poprawnego eksperymentu symulacyjnego:

Warunki poprawnego eksperymentu symulacyjnego:

właściwe rozpoznanie systemu, 

właściwe rozpoznanie systemu, 

poprawna konstrukcja modelu, 

poprawna konstrukcja modelu, 

trafny dobór stopnia szczegółowości modelu, 

trafny dobór stopnia szczegółowości modelu, 

niezawodne oprogramowanie, 

niezawodne oprogramowanie, 

starannie zaplanowane eksperymenty;

starannie zaplanowane eksperymenty;

Najczęściej spotykane błędy podczas tworzenia 

Najczęściej spotykane błędy podczas tworzenia 

modeli symulacyjnych i podczas ich eksploatacji:

modeli symulacyjnych i podczas ich eksploatacji:

źle określony cel symulacji;

źle określony cel symulacji;

nieodpowiedni poziom szczegółowości modelu;

nieodpowiedni poziom szczegółowości modelu;

zły język symulacyjny;

zły język symulacyjny;

nieodpowiedni udział użytkownika w opracowaniu modelu;

nieodpowiedni udział użytkownika w opracowaniu modelu;

background image

62

Źródła błędów symulacyjnych i sposoby 

ich kontrolowania

błędy modelowania

błędy modelowania

nieadekwatny model matematyczny

nieadekwatny model matematyczny

w wyniku weryfikacji modelu i walidacji 

w wyniku weryfikacji modelu i walidacji 

powinny być zidentyfikowane i usunięte

powinny być zidentyfikowane i usunięte

błędy programowania

błędy programowania

błędy implementacji modelu w języku 

błędy implementacji modelu w języku 

symulacyjnym

symulacyjnym

testowanie modelu symulacyjnego w oparciu 

testowanie modelu symulacyjnego w oparciu 

o prosty system, ze znaną postacią 

o prosty system, ze znaną postacią 

analityczną rozwiązania

analityczną rozwiązania

background image

63

Źródła błędów symulacyjnych i sposoby 

ich kontrolowania

błędy losowania - „set effect” i  „sequence effect”

błędy losowania - „set effect” i  „sequence effect”

złe generatory liczb pseudolosowych

złe generatory liczb pseudolosowych

poddanie generatorów testom losowości i zgodności 

poddanie generatorów testom losowości i zgodności 

rozkładów (minimum po 3 testy różne na losowość i żgodność)

rozkładów (minimum po 3 testy różne na losowość i żgodność)

stosowanie różnych technik redukcji wariancji

stosowanie różnych technik redukcji wariancji

błędy estymacji parametrycznej

błędy estymacji parametrycznej

błąd obciążenia początkowego (stan nieustalony) - „initial 

błąd obciążenia początkowego (stan nieustalony) - „initial 

bias”

bias”

gromadzenie danych wyjściowych po ustaleniu się stanu 

gromadzenie danych wyjściowych po ustaleniu się stanu 

systemu (warm up)

systemu (warm up)

statystyczna zależność wyników symulacji wskutek 

statystyczna zależność wyników symulacji wskutek 

autokorelacji i korelacji skrośnej i ograniczoność stosowania 

autokorelacji i korelacji skrośnej i ograniczoność stosowania 

CTG

CTG

stosowanie wielu powtórzeń eksperymentu, ustalanie paczek 

stosowanie wielu powtórzeń eksperymentu, ustalanie paczek 

wyników „batch means”, metoda regeneracji

wyników „batch means”, metoda regeneracji

background image

64

Materiał dodatkowy

background image

65

(

,

,

,...,

)

X X X

X

R

n

n

1

2

3



 przestrzeń prób

Populacja generalna - przypomnienie

Zbiór pewnych realnych 

Zbiór pewnych realnych 

elementów różniących się 

elementów różniących się 

wartościami badanych 

wartościami badanych 

zmiennych - cech np. zbiór 

zmiennych - cech np. zbiór 

ludzi w badanym 

ludzi w badanym 

społeczeństwie lub 

społeczeństwie lub 

nieskończony zbiór 

nieskończony zbiór 

możliwych powtórzeń 

możliwych powtórzeń 

pewnego eksperymentu, 

pewnego eksperymentu, 

wynikiem którego jest zbiór 

wynikiem którego jest zbiór 

wartości pewnych zmiennych 

wartości pewnych zmiennych 

- cech statystycznych 

- cech statystycznych 

Rozkładem populacji 

Rozkładem populacji 

generalnej nazywamy 

generalnej nazywamy 

rozkład wartości badanej 

rozkład wartości badanej 

cechy w tej populacji

cechy w tej populacji

Populacj
a
generaln
a

Cecha X

                                                 

background image

66

Model matematyczny rozkładu PG

Rozkład prawdopodobieństwa pewnej zmiennej 

Rozkład prawdopodobieństwa pewnej zmiennej 

losowej skokowej lub ciągłej

losowej skokowej lub ciągłej

Prawdopodobieństwo interpretuje się jako częstość 

Prawdopodobieństwo interpretuje się jako częstość 

względną występowania w populacji generalnej 

względną występowania w populacji generalnej 

elementów o określonych wartościach badanej cechy

elementów o określonych wartościach badanej cechy

Próba losowa - losowe wybrane elementy z populacji 

Próba losowa - losowe wybrane elementy z populacji 

generalnej o rozkładzie identycznym jak populacja 

generalnej o rozkładzie identycznym jak populacja 

generalna

generalna

Rozkład zmiennej losowej X jest dany przez 

Rozkład zmiennej losowej X jest dany przez 

dystrybuantę F(x,Q), zależną od nieznanej wartości 

dystrybuantę F(x,Q), zależną od nieznanej wartości 

parametru Q

parametru Q

Parametr rozkładu populacji generalnej Q jest 

Parametr rozkładu populacji generalnej Q jest 

przedmiotem estymacji na podstawie próby losowej 

przedmiotem estymacji na podstawie próby losowej 

background image

67

Estymatory, cechy estymatorów

ESTYMATOREM 

ESTYMATOREM 

szacowanego  parametru 

szacowanego  parametru 

 

 

rozkładu 

rozkładu 

F(x, 

F(x, 

populacji 

populacji 

nazywamy

nazywamy

 statystykę 

 statystykę 

Z

Z

n

n

 

 

= g(X), 

= g(X), 

której rozkład prawdopodobieństwa zależy 

której rozkład prawdopodobieństwa zależy 

od szacowanego parametru 

od szacowanego parametru 

 

 

i

i

 

 

często oznaczamy 

często oznaczamy 

go

go

    

    

 

 

 .

 .

Wartość estymatora 

Wartość estymatora 

g(x

g(x

1

1

, x

, x

2

2

, ... , x

, ... , x

n

n

),

),

 odpowiadająca 

 odpowiadająca 

konkretnej  realizacji  próby 

konkretnej  realizacji  próby 

(x

(x

1

1

,  x

,  x

2

2

,  ...  ,  x

,  ...  ,  x

n

n

),

),

  jest 

  jest 

liczbą, nazywaną oceną parametru 

liczbą, nazywaną oceną parametru 

Przy  wyborze  estymatora  należy  brać  pod  uwagę 

Przy  wyborze  estymatora  należy  brać  pod  uwagę 

jego 

podstawowe 

własności: 

nieobciążoność, 

jego 

podstawowe 

własności: 

nieobciążoność, 

efektywność, zgodność i dostateczność. 

efektywność, zgodność i dostateczność. 

n

background image

68

Metody estymacji punktowej

Metoda momentów

Metoda największej wiarogodności

Metoda najmniejszych kwadratów

background image

69

Metoda momentów

Momenty zwyczajne są funkcjami 

Momenty zwyczajne są funkcjami 

nieznanych parametrów:

nieznanych parametrów:

i

k

i

i

k

k

i

k

i

i

k

i

i

i

k

i

i

k

i

M

M

M

g

M

M

M

k

i

m

m

m

g

M

M

M

g

then

g

k

i

m

m

m

g

if

k

i

f

m

 

parametrów

 

zgodnymi

 

mi

estymatora

 

,...,

2

,

1

),

,...,

,

(

ˆ

empiryczne

momenty 

 

oznaczaj

ą

 

,...,

,

,...,

2

,

1

),

,...,

,

(

)

,...,

,

(

 

continue,

 

,...,

2

,

1

),

,...,

,

(

 

,...,

2

,

1

),

,...,

,

(

2

1

2

1

2

1

2

1

2

1

2

1

background image

70

Metoda największej wiarogodności

Gęstość prawdopodobieństwa zmiennej losowej 
X, której rozkład zależy od parametrów

Jeżeli                              jest próbą losową 
prostą, to

Jest funkcją wiarogodności

Estymator najwiarygodniejszy: 

 

)

,...,

,

(

1

k

x

f

)

,...,

,

(

2

1

n

X

X

X



n

i

k

i

n

i

k

i

k

n

x

p

x

f

x

x

x

L

1

2

1

1

2

1

2

1

2

1

)

,...,

,

,

(

)

,...,

,

,

(

)

,...,

,

,

,...,

,

(

k

i

L

L

L

i

R

n

k

,...,

2

,

1

,

0

)

(

),

(

max

)

ˆ

(

background image

71

Metoda najmniejszych 

kwadratów

Taki dobór estymatorów, aby 
zminimalizować wyrażenie

czyli

)

(

min

)

ˆ

(

)]

(

[

)

(

1

2

S

S

h

x

S

k

R

n

n

i

i

background image

72

Estymatory, cechy estymatorów

Estymator jest nieobciążony, gdy

Estymator jest nieobciążony, gdy

.

.

Gdy                                

Gdy                                

   

   

i jest to obciążenie 

i jest to obciążenie 

estymatora w n - elementowej próbie.

estymatora w n - elementowej próbie.

Przykłady:

Przykłady:

Niech 

Niech 

czyli jest to estymator nieobciążony

czyli jest to estymator nieobciążony

.

.

                              

                              

estymator wariancji 

estymator wariancji 

2

2

 populacji

 populacji

.  

.  

ES

ES

2

2

=(n-1/n)

=(n-1/n)

 

 

2

2

 - czyli 

 - czyli 

S

S

jest estymatorem obciążonym

jest estymatorem obciążonym

S

S

2

2

1

1

=(n/n-1) S

=(n/n-1) S

jest estymatorem nieobciążonym

jest estymatorem nieobciążonym

.

.

 

 

E

n



E

b

E

n

n

n

 

,

(

)

n

n

i

i

n

n

i

i

n

i

i

n

X

n

X

EX m

EX

E

n

X

n

EX

m

 

1

1

1

1

1

1

 oraz 

S

n

X

X

i

n

i

n

2

1

2

1

(

)

background image

73

Estymatory, cechy estymatorów

Asymptotyczna nieobciążoność:

Asymptotyczna nieobciążoność:

nazywamy    

nazywamy    

asymptotycznie nieobciążonym

asymptotycznie nieobciążonym

Efektywność, asymptotyczna 

Efektywność, asymptotyczna 

efektywność

efektywność

0

lim

 

którego

dla 

 

Estymator,

n

n

b

niejszy

najefektyw

 

znie

asymptotyc

jest 

 

ˆ

1

)

ˆ

e(

lim

,

1

)

ˆ

e(

0

      

,

)

ˆ

(

)

ˆ

(

)

ˆ

e(

niejszy

najefektyw

 

ˆ

)

ˆ

(

)

ˆ

(

2

*

2

*

2

*

2

ˆ

n

n

n

n

n

n

n

n

n

n

D

D

D

D

n

background image

74

Estymatory, cechy estymatorów

Zgodność

Zgodność

Estymator parametru jest zgodny, jeśli: 

Estymator parametru jest zgodny, jeśli: 

0

dla 

  

,

1

}

|

ˆ

{|

lim

czyli

ˆ

.

.

.

n

n

n

n

P

p

i

l

background image

75

Estymacja parametrów rozkładu 

badanych ch-yk

Mając typ rozkładu badanej charakterystyki możemy 

Mając typ rozkładu badanej charakterystyki możemy 

wyznaczyć estymatory parametrów tego rozkładu. 

wyznaczyć estymatory parametrów tego rozkładu. 

Jeżeli przyjmiemy, że rozkład populacji generalnej 

Jeżeli przyjmiemy, że rozkład populacji generalnej 

dla charakterystyki X jest normalny N(

dla charakterystyki X jest normalny N(

,

,

) (przy 

) (przy 

dostatecznie dużej liczbie przebiegów symulacyjnych 

dostatecznie dużej liczbie przebiegów symulacyjnych 

jest to wniosek                          z twierdzenia 

jest to wniosek                          z twierdzenia 

Lindeberga-Levy’ego), to estymatorami punktowymi 

Lindeberga-Levy’ego), to estymatorami punktowymi 

wartości oczekiwanych dla badanych charakterystyk 

wartości oczekiwanych dla badanych charakterystyk 

są wartości oczekiwane z próby

są wartości oczekiwane z próby

, np.

, np.

 

 

Niech X

Niech X

c

c

1

1

, X

, X

c

c

2 ,. . . ,

2 ,. . . ,

X

X

c

c

n

n

 oznaczają 

 oznaczają 

starty 

starty 

gracza w kolejnych 

gracza w kolejnych 

przebiegach symulacyjnych. Ponieważ przebiegów tych 

przebiegach symulacyjnych. Ponieważ przebiegów tych 

jest 

jest 

n

n

 stąd estymator punktowy wartości oczekiwanej 

 stąd estymator punktowy wartości oczekiwanej 

strat 

strat 

wyznaczamy

wyznaczamy

n

n

1

1

i

C

i

C

X

X

background image

76

Estymacja parametrów rozkładu 

badanych ch-yk

Niech X

Niech X

c

c

1

1

, X

, X

c

c

2 ,. . . ,

2 ,. . . ,

X

X

c

c

n

n

 oznaczają 

 oznaczają 

starty 

starty 

gracza 

gracza 

w kolejnych przebiegach symulacyjnych. 

w kolejnych przebiegach symulacyjnych. 

Ponieważ przebiegów tych jest 

Ponieważ przebiegów tych jest 

n

n

 stąd 

 stąd 

estymator punktowy wartości oczekiwanej 

estymator punktowy wartości oczekiwanej 

strat wyznaczamy

strat wyznaczamy

Wyznaczon

Wyznaczon

y

y

 estymator 

 estymator 

jest

jest

 estymator

 estymator

e

e

punktowym. Często jednak lepiej jest mieć 

punktowym. Często jednak lepiej jest mieć 

pewien przedział, w którym mieści się 

pewien przedział, w którym mieści się 

szacowana wartość parametru.

szacowana wartość parametru.

n

n

1

1

i

C

i

C

X

X

background image

77

Estymacja parametrów rozkładu 

badanych ch-yk

S

S

posób 

wyznaczenia 

estymatora 

posób 

wyznaczenia 

estymatora 

przedziałowego 

wartości 

oczekiwanej 

przedziałowego 

wartości 

oczekiwanej 

badanej zmiennej losowej X

badanej zmiennej losowej X

C

C

:

:

Wariancja estymatora  jest dana wzorem: 

Wariancja estymatora  jest dana wzorem: 

gdzie 

gdzie 

2

2

 jest wariancją zmiennej losowej X, tj. 

 jest wariancją zmiennej losowej X, tj. 

2

2

 = D

 = D

2

2

(X).

(X).

 

 

Nieobciążony estymator wariancji jest 

Nieobciążony estymator wariancji jest 

określony następująco:

określony następująco:

 

 

S X

2

2





 

n

2

1

2

2

1

2

1

1

1

1

1

n

n

n

n

n

n

(

)

X

X

X

X

i

i

i

i

background image

78

Estymacja parametrów rozkładu 

badanych ch-yk

Ponieważ 

wariancja 

jest 

nieznana 

Ponieważ 

wariancja 

jest 

nieznana 

(wyznaczamy  ją  z  próby  zarejestrowanej 

(wyznaczamy  ją  z  próby  zarejestrowanej 

podczas symulacji), więc zmienna losowa  

podczas symulacji), więc zmienna losowa  

k  

k  

postaci:

postaci:

 

 

     

     

ma  rozkład  t  Studenta  o 

ma  rozkład  t  Studenta  o 

n

n

-1  stopniach 

-1  stopniach 

swobody.  Zmiennej 

swobody.  Zmiennej 

k

k

  użyjemy  do  budowy 

  użyjemy  do  budowy 

przedziału ufności dla średniej

przedziału ufności dla średniej

.

.

 

 

k

n

X X

/

background image

79

Estymacja parametrów rozkładu 

badanych ch-yk

Przy ustalonym współczynniku ufności 1-

Przy ustalonym współczynniku ufności 1-

, z 

, z 

tablic  rozkładu  t-Studenta  dla 

tablic  rozkładu  t-Studenta  dla 

n-1

n-1

  stopni 

  stopni 

swobody  można  odczytać  wartość  k

swobody  można  odczytać  wartość  k

  i 

  i 

następnie 

dokonując 

przekształceń 

następnie 

dokonując 

przekształceń 

otrzymamy  następujący  wzór  na  przedział 

otrzymamy  następujący  wzór  na  przedział 

ufności wartości oczekiwanej :

ufności wartości oczekiwanej :

 

 

P X k

X X k

 







 

n

n

1

background image

80

Hipotezy i testy statystyczne

Hipoteza statystyczna

 to przypuszczenie, 

 to przypuszczenie, 

dotyczące rozkładu prawdopodobieństwa 

dotyczące rozkładu prawdopodobieństwa 

populacji:

populacji:

    

    

gdzie 

gdzie 

F(x)

F(x)

jest dystrybuantą rozkładu 

jest dystrybuantą rozkładu 

populacji, a 

populacji, a 

 jest pewnym zbiorem 

 jest pewnym zbiorem 

dystrybuant, zwany zbiorem hipotez 

dystrybuant, zwany zbiorem hipotez 

dopuszczalnych

dopuszczalnych

Dwa typy: hipoteza parametryczna i 

Dwa typy: hipoteza parametryczna i 

nieparametryczna

nieparametryczna

Test statystyczny

 – narzędzie do weryfikacji 

 – narzędzie do weryfikacji 

hipotez na podstawie prób losowych – reguła 

hipotez na podstawie prób losowych – reguła 

decyzyjna i jednocześnie zmienna losowa 

decyzyjna i jednocześnie zmienna losowa 

binarna (0- przyjąć hipotezę, 1- odrzucić)

binarna (0- przyjąć hipotezę, 1- odrzucić)

)

(

:

x

F

H

background image

81

Parametryczne testy istotności

Hipoteza prosta

Hipoteza prosta

Hipoteza złożona                          (alternatywna)

Hipoteza złożona                          (alternatywna)

Test statystyczny 

Test statystyczny 

T

T

 oparty na obszarze 

 oparty na obszarze 

krytycznym 

krytycznym 

 nazywa się testem istotności dla 

 nazywa się testem istotności dla 

sprawdzanej hipotezy zerowej (prostej)

sprawdzanej hipotezy zerowej (prostej)

Dla próby losowej 

Dla próby losowej 

X=

X=

(

(

X

X

1

1

X

X

2

2

,..., 

,..., 

X

X

n

n

)

)

 

 

 hipotezę 

 hipotezę 

H

H

odrzuca się z prawdopodobieństwem błędu I 

odrzuca się z prawdopodobieństwem błędu I 

rodzaju 

rodzaju 

 (zwanym poziomem istotności)

 (zwanym poziomem istotności)

Dla próby losowej 

Dla próby losowej 

X=

X=

(

(

X

X

1

1

X

X

2

2

,..., 

,..., 

X

X

n

n

)

)

 

 

 stwierdza 

 stwierdza 

się jedynie brak podstaw do odrzucenia 

się jedynie brak podstaw do odrzucenia 

hipotezy 

hipotezy 

H

H

0

1

0

0

:

:

H

H

background image

82

Test istotności dla średniej - 

przykład

Normalny rozkład populacji 

Normalny rozkład populacji 

N

N

(

(

,

,

) ze 

) ze 

znaną wariancją 

znaną wariancją 

2

2

Hipoteza 

Hipoteza 

H

H

0

0

m

m

=

=

m

m

0

0

Hipoteza 

Hipoteza 

H

H

1

1

m

m

m

m

0

0

Statystyka                     przy 

Statystyka                     przy 

prawdziwej 

prawdziwej 

H

H

ma rozkład normalny 

ma rozkład normalny 

N

N

(0,1) z obszarem krytycznym  Q= 

(0,1) z obszarem krytycznym  Q= 

{

{

U

U

: |

: |

U

U

|>

|>

u

u

u

u

-kwantyl rozkładu 

-kwantyl rozkładu 

normalnego 

normalnego 

N

N

(0,1) 

(0,1) 

n

m

X

U

0

background image

83

Nieparametryczne testy 

istotności

Testy zgodności – weryfikacja typu 

Testy zgodności – weryfikacja typu 

rozkładu – badanie zgodności uzyskanego 

rozkładu – badanie zgodności uzyskanego 

z próby rozkładu empirycznego z 

z próby rozkładu empirycznego z 

rozkładem hipotetycznym (teoretycznym)

rozkładem hipotetycznym (teoretycznym)

Testy niezależności zmiennych losowych 

Testy niezależności zmiennych losowych 

(testy losowości) – testy serii, testy 

(testy losowości) – testy serii, testy 

kombinatoryczne (pokerowy, 

kombinatoryczne (pokerowy, 

kolekcjonera)

kolekcjonera)

background image

84

Testy zgodności

Test chi-kwadrat

Test chi-kwadrat

F

F

(x) – nieznany rozkład populacji generalnej

(x) – nieznany rozkład populacji generalnej

F

F

0

0

(x) – rozkład teoretyczny populacji

(x) – rozkład teoretyczny populacji

Grupowanie szeregu rozdzielczego o 

Grupowanie szeregu rozdzielczego o 

r

r

 rozłącznych klasach i 

 rozłącznych klasach i 

licznościach 

licznościach 

n

n

w i-tej klasie

w i-tej klasie

Dla empirycznego szeregu rozdzielczego wyznacza się 

Dla empirycznego szeregu rozdzielczego wyznacza się 

prawdopodobieństwa 

prawdopodobieństwa 

p

p

otrzymania w rozkładzie 

otrzymania w rozkładzie 

F

F

0

0

(x) 

(x) 

wyniku próby należącego do i-tej klasy

wyniku próby należącego do i-tej klasy

Dla każdej klasy i wyznacza się liczebności teoretyczne 

Dla każdej klasy i wyznacza się liczebności teoretyczne 

np

np

i

i

Wyznacza się wartość statystyki 

Wyznacza się wartość statystyki 

2

2

:

:

Wyznacza się obszar krytyczny 

Wyznacza się obszar krytyczny 

Porównanie

Porównanie

 

 

Test zgodności 

Test zgodności 

-Kołmogorowa, Kołmogorowa-Smirnowa

-Kołmogorowa, Kołmogorowa-Smirnowa

r

i

i

i

i

np

np

n

1

2

2

)

(

0

2

2

2

2

2

2

odrzucamy 

 

 to

,

Gdy 

}

{

},

:

{

H

Q

P

Q


Document Outline