background image

 

 

GENEROWANIE LICZB 

LOSOWYCH

background image

 

 

Liczby

 

Losowe

Wiele procesów zachodzących w przyrodzie, technice, ekonomii i życiu społecznym 
sprawia  wrażenie  zjawisk  losowych,  a  więc  takich,  dla  których  nie  potrafimy 
przewidzieć  ich  przyszłego  przebiegu  ani  nie  potrafimy  ustalić przyczyn które je 
wywołały. W każdym z tych przypadków, niezależnie od tego, czy udaje nam się 
ustalić,  jakie  są  przyczyny  losowości  zjawiska,  możemy  spróbować  opisać  to 
zjawisko  ilościowo,  wykorzystując  do  tego  celu  pojęcie  prawdopodobieństwa 
rozumianego jako ilościowa miara niepewności – losowości. Podobnie jak w fizyce  
i w przyrodzie, efekty losowe mogą występować również w świecie liczb

background image

 

 

Liczba losowa to taka liczba, której wartość nie może zostać z góry przewidziana. 
Sekwencję liczb losowych można stworzyć wykonując np. serię niezależnych rzutów 
monetą i notując obserwowane wyniki pisząc 0 – gdy wynikiem rzutu jest reszka, oraz 
1 – gdy wynikiem rzutu jest orzeł. Ponieważ prawdopodobieństwo zaobserwowania 
reszki  jest  takie  samo  jak  zaobserwowania  orła  i  jest  ono  równe  ½,  więc  zmienna 
losowa  –  wynik  rzutu  –  ma  rozkład  dwupunktowy  i  przyjmuje  wartości  0  lub  1  z 
jednakowym  prawdopodobieństwem.  Mówimy,  że  ta  zmienna  losowa  ma  rozkład 
równomierny na zbiorze
 {0,1} lub rozkład dwupunktowy  z parametrem  p = ½.  
W wyniku takiego postępowania otrzymamy więc na przykład następujący ciąg liczb: 
1,0,0,1,1,...  Taki  ciąg  liczb  nazywa  się  ciągiem  liczb  losowych  o  rozkładzie 
równomiernym  na  zbiorze
  {0,1}  lub  ciągiem  liczb  losowych  o  rozkładzie 
dwupunktowym z parametrem 
p = ½. 
Monetę,  za  pomocą  której  otrzymamy  takie  ciągi  nazywa  się  generatorem  liczb 
losowych  o  rozkładzie  równomiernym  na  zbiorze
  {0,1}  lub  generatorem  liczb 
losowych o rozkładzie dwupunktowym z parametrem 
p = ½. 
 

background image

 

 

zadania związane z badaniami reprezentacyjnymi np. badania pewnych zjawisk 

społecznych na drodze szczegółowego opisu jednostek wybranych losowo z populacji 
interesujących nas obiektów lub zadania ze statystycznej kontroli jakości, w których 
partie różnych towarów opisuje się na podstawie badania losowo wybranych próbek 
tych towarów; 

zadania numeryczne rozwiązywane metodami Monte Carlo. Zadania numeryczne 

zastępujemy zadaniem z rachunku prawdopodobieństwa, w taki sposób, że związek 
pomiędzy  rozwiązaniami  obu  zadań  jest  znany,  a  zadanie  z  rachunku 
prawdopodobieństwa  rozwiązujemy  na  drodze  eksperymentu  statystycznego. 
Podstawową  część  tego  eksperymentu  stanowi  losowanie  próbki  z  odpowiedniej 
populacji, a więc generowanie odpowiedniego ciągu liczbowego; 

zadania  związane  z  badaniem  różnych  zjawisk  i  procesów  technicznych, 

ekonomicznych,  przyrodniczych  na  drodze  symulowania  (modelowania)  tych 
procesów i zjawisk na maszynach cyfrowych.  

 

Zadania, do rozwiązywania których 

używa się ciągów liczb losowych.

background image

 

 

GENEROWANIE LICZB 

LOSOWYCH 

O ROZKŁADZIE 

RÓWNOMIERNYM

background image

 

 

Metody generowania cyfrowego 

liczb losowych o rozkładzie 

równomiernym

Podstawowymi generatorami liczb losowych są generatory fizyczne, takie jak: 



moneta 



urna o odpowiedniej zawartości 



kostka do gry 



ruletka itp. 

są to urządzenia losowe.  
Generatory  tego  typu  mogą  być  przydatne  do  losowania  nie  dużych  próbek  dla 
badań reprezentacyjnych albo do „ręcznego” rozwiązywania zadań metodami Monte 
Carlo lub zadań z zakresu modelowania cyfrowego różnych zjawisk i procesów. 
 

background image

 

 

 
 
 

Przykładem fizycznego generatora liczb losowych jest generator korzystający ze 
zjawiska  promieniotwórczości:  w  pobliżu  źródła  promieniowania  umieszcza  się 
licznik promieniowania i przyrosty wskazań tego licznika w kolejnych przedziałach 
czasu o ustalonej długości traktuje się jako realizację pewnych zmiennych losowych. 
Przyjmuje  się,  że liczba cząsteczek wypromieniowanych przez jednorodny izotop 
jest zmienną losową o rozkładzie Poissona. 

 

background image

 

 

ZMIENNA LOSOWA O 

ROZKŁADZIE POISSONA Z 

PARAMETREM ct

 

2

1

2

0

2

0

ct

k

k

e

w

p

 

 

p ra w d o p o d o b i e ń s tw o , ż e  w  o d c i n k u  c z a s u  o  d ł u g o ś c i   z o s ta n i e  z a re j e s tro w a n a  
p a rz y s ta  l i c z b a  c z ą s te k  –  o z n a c z a m y  p rz e z  p

0

 

 

background image

 

 

Niech Z

1

 będzie nową zmienną losową przyjmującą  wartość 0, gdy stan licznika 

promieniowania  w  okresie  czasu  o  długości  t  zmieni  się  o  liczbę  parzystą,  oraz 
przyjmująca  wartość  1  w  przeciwnym  przypadku.  Zmienna  losowa  Z

ma  więc 

rozkład: 

P { Z

1

 = 0} = (1+) / 2 

P { Z

1

 = 1} = (1+) / 2 

 

gdzie  = e 

–2ct

  

Jeżeli intensywność c źródła promieniowania jest duża lub jeżeli odcinek czasu t jest 

długi to   jest małe i rozkład zmiennej losowej Z

1

 nieznacznie tylko różni się od 

rozkładu dwupunktowego z parametrem p= ½. 

 

background image

 

 

ZMIENNA LOSOWA O 

ROZKŁADZIE ROWNOMIERNYM 

NA PRZEDZIALE (0,1)

 

 

 

 

zwykle rozumie się jako zmienna losowa x ciągła, dla której 

 

1

1

1

0

0

0

}

{

r

dla

r

dla

r

dla

r

X

 

background image

 

 

Zrealizowanie  takiej  zmiennej  losowej  nie  jest  możliwe  na  żadnej  maszynie 
cyfrowej;  w  każdej  maszynie  można  operować  tylko  skończoną  liczbą  różnych 
wartości. 
Można zauważyć, że jeżeli zmienna losowa, której kolejnymi realizacjami są liczby 
takiego  ciągu,  jak  :  0,1,1,1,0,0,1,0,1,1,0,0,0,1,0......,  ma  rozkład  dwupunktowy              
z parametrem p = 1/2 , to prawdopodobieństwo otrzymania każdej z liczb postaci : 
0.0111, 0.0010, 0.1100, 0.0101 jest równe 2

-k

, a wiec otrzymany ciąg jest ciągiem 

realizacji zmiennej losowej o rozkładzie równomiernym na przedziale(0,1). 
Problemem  związanym  z  eksploatacja  generatorów  fizycznych  jest  problem  ich 
stabilności: niewielkie  zmiany własności fizycznych źródła lub zmiany warunków 
otoczenia mogą pociągnąć za sobą istotne zmiany własności otrzymywanych ciągów 
liczb  losowych.  W  związku  z  tym  generatory  fizyczne  wymagają  dodatkowych 
urządzeń testujących i korygujących, co znacznie komplikuje ich budowę. 

 

background image

 

 

OGÓLNA POSTAĆ 

GENERATORÓW LICZB 

LOSOWYCH

x

n+1 

= a

0

x

n

 + a

1

x

n-1 

+ ... + a

k

x

n-k 

+ b (1) 

 

Wszystkie liczby a

i

 , b oraz x

i

 we wzorze są liczbami całkowitymi z przedziału  

[ 0,M ). 

 

background image

 

 

Generatory postaci będziemy nazywali generatorami liniowymi.  

 

W szczególności: 

generatory postaci: 

n+1 

= cx 

(2) 

będziemy nazywali generatorami multyplikatywnymi, 

 

generatory postaci: x 

n+1 

 =  a x 

n

 + b,    b  0 (3) 

będziemy nazywali generatorami mieszanymi 

 

             generatory postaci: x

n+1 

= x

n

 + x

n-1 

(4) 

będziemy nazywali generatorami Fibonacciego 

 

Generator  postaci,  w  którym  wszystkie  liczby  a

i

  są  równe  zeru  lub  jedności, 

będziemy  nazywali  generatorem  addytywnym  lub  uogólnionym  generatorem 
Fibonacciego. 

 

 

background image

 

 

 
 

Stałe a, b, c w powyższych wzorach są liczbami całkowitymi z przedziału  (0,M). 
Jeżeli stałe początkowe  x

0

 , x

1

 ,......,x

k

 w generatorze(1);  x

w generatorze (2), (3); 

oraz  x

0

  i  x

1

  w  generatorze  (4)  są  liczbami  naturalnymi,  to  wszystkie  liczby  x

n

 

otrzymywane z tych generatorów są liczbami naturalnymi. Jako liczby o rozkładzie 
równomiernym na przedziale (0,1) przyjmujemy liczby : 

r

n

 = x

/ M 

w ciągu (r

n

), n = 1,2,..... występuje co najwyżej M różnych liczb. 

 

background image

 

 

WŁASNOŚCI 

STATYSTYCZNE 

GENERATORÓW

 

Rozważając  własności  statystyczne  generatorów  traktujemy  go  jako  pewne 
„urządzenie losowe”, takie jak np.: 



moneta, 



urna z odpowiednim zapasem różnych kul, 



ruletka  

Kolejną liczbę X

n

 produkowaną przez ten generator traktujemy więc jako zmienną 

losową i weryfikacja, czy generator produkuje liczby losowe o żądanym rozkładzie 
prawdopodobieństwa, sprowadza się do weryfikacji, czy ciąg X

o

, X

1

, ......., X

N  –1

 

może być traktowany jako N-elementowa próbka prosta z określonej populacji, tz. 
czy jest ona ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie 
prawdopodobieństwa. 
 

background image

 

 

 
 

 

Test statystyczne przeznaczone do weryfikacji generatorów liczb losowych można 
podzielić na dwie grupy:  



testy zgodności rozkładu  



testy niezależności ( testy losowości próbki) 

Testy  uporządkowania  próbki  to  wszelkiego  rodzaju  testy  serii,  testy  statystyk 
pozycyjnych, testy kombinatoryczne, takie jak np. test pokerowy . Testy te maja na 
celu  wykrycie  ewentualnych  tendencji  w  ciągach  liczb  produkowanych  przez 
generator, co prowadziłoby do dyskwalifikacji tego generatora.  

 

 

background image

 

 

WŁASNOŚCI ARYTMETYCZNE 

GENERATORÓW 

PROGRAMOWYCH

 

 

 

Generatory programowe 

 

x

n+1 

= f(x

n

            (1) 

x

n+1

 = g( x

n, 

x

n-1, ......,

x

n-k+1

)        (2) 

 

argumenty  funkcji  f  należą  do  zbioru  liczb  całkowitych;  a  wartości  są  liczbami 
całkowitymi nieujemnymi, wtedy (1) jest generatorem multyplikatywny a generator 
postaci (2) – generator liniowy. 

 

background image

 

 

Analiza  arytmetycznych  własności  generatorów  obejmuje  zwykle  
zagadnienie  momentów,  zagadnienie  autokorelacji  oraz  zagadnienie 
równomierności rozkładów wielowymiarowych. 
Oceny  generatorów  programowych  można  również  dokonać  w  inny 
sposób, nie odwołując się przy tym do probalistyki. Zamiast analizować 
różne własności ciągów liczb otrzymywanych z takich generatorów, takie 
jak  okresowość,  równomierność  rozkładu,  autokorelacji,  można  ocenić 
przydatność danego generatora do rozwiązania zadań określonego typu. 
Generatory  programowe,  które  spełniają  wszystkie  wymagania 
sformułowane  z  punktu  widzenia  rozwiązania  zadań  określonego  typu, 
przyjęto  nazwać  generatorami  liczb  quasi  –  losowych.  Generatory  takie 
ocenia się z punktu widzenia obliczania całek; do tego typu zadań można 
sprowadzić większość zadań rozwiązywanych metodami Monte Carlo oraz 
wiekszość zadań w badaniach reprezentacyjnych. 

 

background image

 

 

GENERATORY 

LINIOWE

background image

 

 

GENERATORY MULTYPLIKATYWNE

Generatory te zostały zaproponowane przez D. H. Lehmera w 1951 r. 

Są to generatory postaci: 

n+1 

= cx 

(mod M) 

przy czym c, x

0

, oraz wszystkie x

n

, są liczbami całkowitymi z 

przedziału [0,M ). 

Wtedy liczby 

n

 = x 

/ M  są liczbami z przedziału [0,1). 

Generator multiplikatywny jest generatorem okresowym. 

Przykład  

Gdy  M  =  2

m

,  m    3,  max.  jego  okres  jest  równy  2

m-2

.  Generator 

multiplikatywny osiąga ten okres, gdy x

0

 jest liczbą nieparzystą oraz 

gdy  c  3 (mod 8) lub c  5 (mod 8).  

Zapis a  b (mod c) oznacza, że różnica a – b dzieli się przez c,             

czyli że  a = cv + b dla pewnego całkowitego v.  

Na przykład dla m = 5, c = 11  3 (mod 8), x

0

 = 1, otrzymujemy ciąg: 

1, 11, 25, 19, 17, 27, 9, 3, 1,...; jest to ciąg o okresie 8. 

 

 

background image

 

 

GENERATOR MIESZANY

Generator mieszany został zaproponowany przez A. Rotenberga w 1960 r. 

Jest to generator postaci: 

n+1 

 =  a x 

n

 + b (mod M),    b  0 

przy czym a, b oraz x

0

 są liczbami całkowitymi z przedziału [0,M ). 

Za pomocą wzoru 

n

 = x 

/ M  otrzymujemy liczby z przedziału (0,1). 

Podobnie  jak  generator  multiplikatywny  generator  mieszany  jest  generatorem 
okresowym. W przypadku tym można jednak przez odpowiedni wybór parametrów 
a oraz b uzyskać generator o pełnym okresie tzn. generator o okresie M. 
Generator ma okres M, jeżeli: 

(1) 

b jest liczbą pierwszą względem M, 

(2) 

a  1 (mod p) dla każdego czynnika pierwszego p liczby M, 

(3) 

a   1 (mod 4), jeżeli 4 jest dzielnikiem liczby M

background image

 

 

GENERATORY ADDYTYWNE

Najprostszym generatorem addytywnym jest generator Fibonacciego 

x

n+1

 = x

 + x 

n-1

 (mod M) 

 
Jest to generator okresowy i w przypadku M = 2

m

 jego okres jest równy 3 x 2

m-1

 

niezależnie od wyboru stałych początkowych x

i x

1

background image

 

 

GENERATORY PUNKTÓW O ROZKŁADZIE 

RÓWNOMIERNYM NA KOSTKACH 

JEDNOSTKOWYCH W PRZESTRZENIACH 

WIELOWYMIAROWYC

 
 
Jeżeli (R

n

), n = 0, 1, 2,..., jest ciągiem niezależnych zmiennych losowych o jednakowym 

rozkładzie równomiernym na przedziale (0, 1), to k – wymiarowe zmienne losowe 

(R

jk

, R

jk + 1

, ..., R

(j + 1)k – 1

), j = 0, 1, 2, ..., 

są niezależne i mają jednakowy rozkład równomierny na kostce jednostkowej  (0, 1)

k

Fakt  ten  doprowadził  do  sformułowania  prostego  algorytmu  otrzymywania  punktów 
losowych o rozkładzie równomiernym na kostce (0, 1)

k

, jeżeli dany jest ciąg punktów 

losowych  na  przedziale  (0,  1)  –  kolejne  wyrazy  tego  ciągu  traktuje  się  jako  kolejne 
współrzędne generowanych punktów. 

background image

 

 

Takie  postępowanie  można  zastosować  bez  żadnych 
zastrzeżeń,  gdy  ciąg  liczb  losowych  z  przedziału  (0,  1) 
otrzymuje  się  za  pomocą  pewnego  rzeczywiście  losowego 
urządzenia  np.  fizycznego  generatora  liczb  losowych.  W 
przypadku,  gdy  ciąg  taki  otrzymuje  się  jako  ciąg  liczb 
pseudolosowych 

za 

pomocą 

pewnego 

generatora 

programowego,  mogą  pojawić  się  pewne  odchylenia  od 
równomierności rozkładu produkowanych w ten sposób liczb, 
a czasami otrzymanie takich punktów w opisany sposób jest 
niemożliwe. 
Ponieważ odchylenia od rozkładu równomiernego na kostce k 
– wymiarowej pochodzą stąd, że kolejne liczby pseudolosowe 
są na ogół ze sobą skorelowane, powstaje pomysł konstrukcji 
ciągu punktów (r

1

, r

2

, ..., r

k

) o rozkładzie równomiernym na 

kostce  (0,  1)

k

  w  ten  sposób,  żeby  każda  współrzędna 

generowanego  punktu  pochodziła  z  innego  generatora liczb 

background image

 

 

 

Uogólniając zapiszemy generator punktów 

r

(n)

 = (r

1

(n)

, r

2

(n)

, ..., r

k

(n)

), n = 0, 1, 2, ... 

w postaci 

 r

(n)

 = Ar 

(n-1)

 + b (mod 1) 

przy  czym  A  jest  macierzą  całkowitoliczbową  stopnia  k  oraz  b  jest  pewnym                        
wektorem o k składowych. 

 

background image

 

 

GENERATORY LICZB 

LOSOWYCH 

O DOWOLNYCH 

ROZKŁADACH 

PRAWDOPODOBIEŃST

WA

background image

 

 

OGÓLNE METODY 

KONSTRUKCJI 

GENERATORÓW LICZB 

LOSOWYCH O DANYM 

ROZKŁADZIE 

PRAWDOPODOBIEŃSTW

A

background image

 

 

Metoda odwracania 

dystrybuanty

Załóżmy, że F jest dystrybuantą pewnego rozkładu prawdopodobieństwa, a  

X

i

,  i = 1, 2, ..., 

jest ciągiem niezależnych zmiennych losowych o rozkładzie 
równomiernym na odcinku [ 0, 1]. Wówczas ciąg zmiennych losowych 
zdefiniowanych jako  

Y

i

 = F

-1

 (X

i

),  i = 1, 2, ..., 

jest ciągiem niezależnych zmiennych losowych o rozkładzie zadanym 
dystrybuantą F. 

background image

 

 

Rozważmy dystrybuantę rozkładu wykładniczego F (x) = 1 – e

-x

 

Funkcją do niej odwrotną jest  
F

-1

 (y) = -ln (1 – y) 

i dla niezależnych zmiennych losowych ciąg  
Y

i

 = - ln (1 – Xi), i = 1, 2, ...,  

jest ciągiem niezależnych zmiennych losowych o rozkładzie wykładniczym.

 

 

Przykład

background image

 

 

Metodę tę zaproponował J. von Neumann. Metoda ta oparta jest na tej własności 
zmiennych  losowych,  że  ich  histogram  z  próby  dąży  do  gęstości  rozkładu.                   
W  przypadku  jednowymiarowym  pozwala  ona  generować  liczby  losowe  o 
wartościach z przedziału (a, b) o rozkładzie zadanym gęstością prawdopodobieństwa 

f(x) spełniającą warunek f(x)  c dla x (a, b). W przypadku wielowymiarowym 

zmienna losowa przyjmuje wartości w kostce (a, b)

n

 

 

Metoda eliminacji

background image

 

 

Algorytm dla rozkładu jednowymiarowego.

1. Generujemy dwie liczby losowe R

1

 i R

2

, odpowiednio, 

R

1

 o rozkładzie U (a, b) 

R

2

 o rozkładzie U (0, c) 

2. Sprawdzamy, czy R

2

  f (R

1

). 

3. Jeżeli warunek jest spełniony, to przyjmujemy X = R

1

W  przeciwnym  wypadku  eliminujemy  wylosowany  punkt  i  powtarzamy 
losowanie z kroku 1. 

 

background image

 

 

Algorytm dla rozkładu wielowymiarowego

1. Generujemy n + 1 liczb losowych R

1

, R

2

, ..., R

n

, R

n + 1

, w tym  

R

1

, R

2

, ..., R

n

 o rozkładzie U (a, b),  

R

n + 1 

o rozkładzie U (0, c). 

2. Sprawdzamy, czy R

n

 + 1  f ( R

1

, R

2

, ..., R

n

). 

3. Jeżeli warunek jest spełniony, to przyjmujemy 
(X

1

, X

2

, ..., X

n

) = (R

1

, R

2

, ..., R

n

W przeciwnym wypadku eliminujemy wylosowany punkt i powtarzamy 
losowanie z kroku 1. 

background image

 

 

METODA SUPERPOZYCJI 

ROZKŁADÓW

Metoda superpozycji rozkładów została zaproponowana przez J. W. Butlera. 
Jeżeli przedstawimy gęstość f rozkładu zmiennej losowej x w postaci: 

f(x) = 

-

+

 

g

y

(x) h(y) dy 

gdzie  g

y

(x)  jest  gęstością  pewnego  rozkładu  prawdopodobieństwa,  zależną  od 

parametru y oraz h jest pewną gęstością prawdopodobieństwa. 
Wzór ten może być odczytany w następujący sposób: zmienna losowa X ma rozkład 
o gęstości g

y

 zależnej od pewnego parametru y, który z kolei jest zmienną losową o 

gęstości hjest wtedy gęstością bezwarunkowego rozkładu zmiennej losowej X. 
Wynika stąd prosty sposób generowania zmiennej losowej X: 

1. Wylosować y zgodnie z rozkładem gęstości h
2. Wylosować x zgodnie z rozkładem o gęstości g

y

, z parametrem wylosowanym 

w punkcie 1. 

background image

 

 

Kombinacja metody eliminacji 

i metody superpozycji

Niech zmienna losowa X ma rozkład o gęstości p w postaci: 

                                                                                                                 

 

p(x) =  

n

p

n

(x) 

                                                                                              

n=0 

 

gdzie 

n

  0, 

n

 = 1,  

natomiast  p

n

,  n  =  0,  1,  2,  ...,  są  pewnymi  gęstościami  prawdopodobieństwa 

zależnymi od parametru n.  
Każdą z gęstości p

n 

przedstawimy w postaci:  p

n

(x) = a

n

f

n

(x)g

n

(x) 

przy czym a

n

 > 0 są pewnymi stałymi,  

f

n

 są gęstościami prawdopodobieństwa oraz  

funkcje g

n

 spełniają warunki 0  g

n

(x)  1dla każdego x.  

background image

 

 

Algorytm generowania zmiennej 

losowej X:

 

1. Wylosować n zgodnie z rozkładem P{n = i} = 

i

2. Dla  wylosowanego  w  punkcie  1  parametru  n  wylosować  x według rozkładu 

prawdopodobieństwa o gęstości f

n

3. Wylosować  liczbę  R  z  populacji  o  rozkładzie  równomiernym  na  przedziale            

(0, 1). 

4. Jeżeli  R    g

n

(x)  przyjąć  x  za  realizację  generowanej  zmiennej  losowej  X;                

w przypadku przeciwnym powtórzyć wszystkie obliczenia od punktu 1. 

background image

 

 

METODY KONSTRUKCJI 

GENERATORÓW 

LICZB LOSOWYCH 

DLA 

WYBRANYCH 
ROZKŁADÓW

background image

 

 

ROZKŁADY DYSKRETNE

Istnieją dwa sposoby generowania zmiennej losowej dyskretnej zaproponowane 
przez G. Marsaglia. 
Niech zmienna losowa X o wartościach a, b, ..., m ma następujący rozkład: 

wartość zmiennej losowej 

prawdopodobieństwo 

0,023 = 0,0 + 0,02 + 0,003 

0,038 = 0,0 + 0,03 + 0,008 

0,074 = 0,0 + 0,07 + 0,004 

0,103 = 0,1 + 0,00 + 0,003 

0,148 = 0,1 + 0,04 + 0,008 

0,206 = 0,2 + 0,00 + 0,006 

0,140 = 0,1 + 0,04 + 0,000 

0,101 = 0,1 + 0,00 + 0,001 

0,093 = 0,0 + 0,09 + 0,003 

0,037 = 0,0 + 0,03 + 0,007 

0,026 = 0,0 + 0,02 + 0,006 

0,011 = 0,0 + 0,01 + 0,001 

background image

 

 

Metoda pierwsza

Polega ona na zapamiętaniu w kolejnych miejscach pamięci 000 – 999 wartości:  
„a” w miejscach 000 – 022, 
„b” w miejscach 023 – 060, 
„c” w miejscach 061 – 134,  
..., 
„m” w miejscach 989 – 999 
i generowaniu wartości zmiennej losowej X jako zawartości pamięci o numerze R, 
przy czym R jest zmienną losową o rozkładzie równomiernym na zbiorze liczb 
{000, 001, ..., 999} 

background image

 

 

Metoda druga

Załóżmy,  że  są  trzy  urny,  odpowiadające  kolejnym  cyfrom  wartości 
prawdopodobieństw.  
Niech  pierwsza  urna  zawiera:  jedną  kulę z wartością „d”, jedną z wartością „e”, 
dwie z wartościami „f” itd.: skład poszczególnych urn: 
I urna – 1d, 1e, 2f, 1g, 1h, 
II urna – 2a, 3b, 7c, 4e, 4g, 9i, 3j, 2k, 1m, 
III urna – 3a, 8b, 4c, 3d, ..., 1m. 
Losujemy  najpierw  urnę:  urnę  I  z  prawdopodobieństwem  0,6,  urnę  II  z 
prawdopodobieństwem 0,35 lub urnę III z prawdopodobieństwem 0,050. Z wybranej 
urny  losujemy  jedną  kulę  tak,  żeby  każda  kula  miała  jednakową  szansę 
wylosowania.  Wartość  odczytana  na  tej  kuli  jest  zmienną  losową  o  danym 
rozkładzie prawdopodobieństwa. 

background image

 

 

ROZKŁAD WYKŁADNICZY

Zmienna  losowa  W  ma  rozkład  wykładniczy,  jeżeli  jej  dystrybuanta  wyraża  się 
wzorem: 

               P{W  w} =  1 – e

-cw

 dla w  0 

                                     0 dla w < 0 

 

gdzie c > 0 jest pewną stałą.  
Niech X = cW 
Zmienna losowa X ma rozkład wykładniczy z wartością oczekiwaną równą jakości. 
Ponieważ ze zmiennej o rozkładzie wykładniczym z wartością oczekiwaną c = 1 
można otrzymać zmienną losową o rozkładzie wykładniczym z dowolną wartością 
parametru c, będziemy dalej rozpatrywali tylko zmienną losową X. 

 
 

background image

 

 

Metody generowania liczb 

o rozkładzie 

wykładniczym

background image

 

 

Metoda odwracania dystrybuanty 

zmiennej losowej z parametrem 

równym ln 2

Algorytm generowania zmiennej losowej X: 

1. Wygenerować  zmienną  losową  p  według  rozkładu  dyskretnego  określonego 

wzorem: 

P{p = k} = (1/2)

k+1

, k = 0, 1, 2, ..., 

2. Wygenerować  zmienną  losową  R  o  rozkładzie  równomiernym  na  przedziale  

(0, 1) i obliczyć:  

q = - log

2

 (1 – R/2) 

3. Obliczyć:  

X = p + q 

background image

 

 

Metoda J. von Neumanna  

metoda serii monotonicznych

Algorytm  tej  metody  oparty  jest  na  rejestrowaniu  monotonicznych  serii  w  ciągu 
zmiennych losowych o rozkładzie równomiernym na przedziale (0, 1). 
Obserwujemy kolejne serie postaci 

R

 R

1

  R

2

  ...  R

n

 < R

n+1

 

Numerując te serie kolejnymi liczbami 0, 1, 2, ... Numer pierwszej serii, w której 
jest liczbą nieparzystą, przyjmujemy za część całkowitą, natomiast wartość R

0

 w tej 

serii za część ułamkową generowanej liczby X 

background image

 

 

Metoda superpozycji 

G. Marsaglia i M. Sibuya

 

Algorytm generowania zmiennej losowej o rozkładzie wykładniczym. 

1. Wygenerować zmienną losową m zgodnie z rozkładem dyskretnym według wzoru: 

p

i

 = P{M = i} = (e

c

 – 1) e

-c(i = 1)

, i = 0, 1, 2, ..., 

2. Wygenerować zmienną losową N zgodnie z rozkładem dyskretnym według wzoru: 

Q

i

 = P{n = i} = c

i

 / e

c

 – 1  1 / i!, i = 1, 2, 3, ..., 

3. Wygenerować  N  zmiennych losowych R

1

, R

2

,  ...,  R

N

  niezależnych  o  jednakowym 

rozkładzie równomiernym na przedziale (0, 1). 

4. Obliczyć u = min(R

1

, R

2

, ..., R

N

). 

5. Obliczyć  

X = M + u 

background image

 

 

Metoda przybliżania rozkładu 

wykładniczego 

za pomocą rozkładu dyskretnego

Algorytm generowania zmiennej losowej 

1. Wygenerować  liczbę  losową  R  o  rozkładzie  równomiernym  na  przedziale            

(0,  1).  Jeżeli  R  <  e

-4,6

  =  0,010052,  wykonać  obliczenia  według  punktu  2,                

w przeciwnym przypadku według punktu 3. 

2. Obliczyć X = - ln R; koniec obliczeń. 
3. Wygenerować zmienną losową V zgodnie z rozkładem dyskretnym  

P{V = k / 10) = e

-k/10

 – e

-(k+1)/10

 

4. Wygenerować ną losową R o rozkładzie równomiernym na przedziale (0, 1). 
5. Obliczyć X = V + R/10; koniec obliczeń 

background image

 

 

ROZKŁAD NORMALNY

Ograniczymy  się  do  rozważania  zmiennej  losowej  X  o  rozkładzie  normalnym            
N(0, 1) z wartością oczekiwaną równą zeru i odchyleniem standardowym równym 
jedności, tzn. rozkładu o gęstości: 

(x) = 1 / 2  exp (- x

2

/2), - < x < + 

W przypadku, gdy należy generować zmienną Z o rozkładzie normalnym N(, ), 

generujemy X zgodnie z rozkładem jak wyżej i obliczamy Z według wzoru  

Z = X +  

background image

 

 

Metoda odwracania dystrybuanty

Funkcja  odwrotna  do  dystrybuanty  rozkładu  normalnego  nie  może  być 
przedstawiona za pomocą łatwej do obliczeń formuły, dlatego poszukuje się zwykle 
pewnych aproksymacji tej funkcji. 

e

-x2/2

  4e

-kx 

/ (1+e

-kx

)

2

, x>0 

gdzie k = 8/. Korzystając z tej aproksymacji dla funkcji (x) na dodatniej półosi, 

otrzymujemy  następującą  aproksymację  dla  dystrybuanty  rozkładu  normalnego  
N(0, 1) uciętego do wartości dodatnich 

y = (x) = (2 / 1 + e

-kx

) –1 

i stąd przybliżenie dla funkcji odwrotnej 

x = 1/k ln 1+y / 1 - y, 0<y<1 

background image

 

 

 
 

Jeżeli y ma rozkład równomierny na przedziale (0, 1), to x obliczone według wzoru:  

                             1          1 + y

 

                     x =         ln 

                             k          1 – y              , 0<y<1 

ma  w  przybliżeniu  rozkład  normalny  ucięty  do  wartości  dodatnich,  tzn.  rozkład            
o gęstości: 

P(x) = 2/  e

-x2

/2, x>0 

a więc SX, gdzie S jest zmienną losową o rozkładzie 

P{S = + 1} = P{S = -1} = ½ 

ma rozkład normalny N(0, 1). 

background image

 

 

Zastosowanie centralnego 

twierdzenia granicznego

Najbardziej  znana  metoda  generowania  zmiennej  losowej  X  o  rozkładzie 
normalnym  polega  na  przybliżaniu  jej  za  pomocą  sumy  niezależnych  zmiennych 
losowych  R

1

,  R

2

,  ...,  R

n

  o  jednakowym  rozkładzie  równomiernym  na  przedziale             

(0, 1). Ponieważ ER

i

 = ½ oraz D

2

R

i

 = 1/12, więc dla dostatecznie dużych n zmienna 

losowa 
                            (R

1

 + R

2

 = ... + R

n

) – n/2 

                   X = 
                                         n/12 

 

ma rozkład normalny N (0, 1). 

background image

 

 

Metoda eliminacji i superpozycji 

rozkładów

G.  Marsaglia  i  T.  A.  Bray  zaproponowali  generator  liczb  losowych  o  rozkładzie 
normalnym skonstruowany metodą eliminacji i superpozycji rozkładów, przy użyciu 

reprezentacji gęstości (x) tego rozkładu za pomocą sumy: 

(x) = a

1

f

1

(x) + a

2

f

2

(x) + a

3

f

3

(x) + a

4

f

4

(x) 

gdzie 

f

1

,  f

2

  oraz  f

3

  są  gęstościami  skupionymi  na  pewnym  przedziale              

(-a,  a),  natomiast  f

4

  jest  „ogonem”  rozkładu  normalnego  na  sumie 

przedziałów (-, -a) oraz (a, +).

 

background image

 

 

Losowanie z ogona rozkładu 

normalnego

Losowanie  z  ogona  (a,  +)  rozkładu  normalnego  można  przeprowadzić  np. 

generując pary niezależnych zmiennych losowych R

1

 i R

2

 o jednakowym rozkładzie 

równomiernym na przedziale (0, 1) dopóki nie będzie spełniony warunek  

R

2

  a (a

2

 – 2 ln R

1

)

-1/2

 

Wówczas za wygenerowaną wartość ogona (a, +) przyjąć liczbę  

(a

2

 – 2 ln R

1

)

1/2

a  następnie  wygenerowanej  w  ten  sposób  liczbie przypisać znak plus lub minus, 
każdy z jednakowym prawdopodobieństwem

.

 

background image

 

 

Wielowymiarowy rozkład normalny

G.  E.  Box  i  M.  E.  Muller  zaproponowali  generator  dwuwymiarowej  zmiennej 
losowej  o  rozkładzie  normalnym,  korzystając  z  faktu,  że  jeżeli  R1  i  R2  są 
niezależnymi zmiennymi losowymi o ozkładzie równomiernym na przedziale (0, 1), 
to zmienne losowe 

 

X

1

 = (-2 ln R

1

)

1/2

 cos2R

2

 

X

2

 = (-2 ln R

1

)

1/2

 sin2R

 

są niezależne i mają jednakowy rozkład normalny N(0, 1) 

 

background image

 

 

ROZKŁAD POTĘGOWY

 

Zmienna  losowa  X  ma  rozkład  potęgowy  z  parametrem  (  >  0),  jeżeli  jej 

dystrybuanta F

(x) = P{X  x} wyraża się wzorem: 

 

                                                   

0 dla x < 0 

                               F

(x) =    x

 dla 0  x  1 

                                              1 dla x > 1 
G. Bankovi oraz A. Bekessy opracowali metody polegające na zastąpieniu 

losowania  według  rozkładu  jak  wyżej  z  dowolnym  parametrem   

kombinacją losowań z takich rozkładów z parametrem całkowitym.

 

background image

 

 

Metoda pierwsza

Niech  będzie dowolną liczbą dodatnią. Dla każdego  > 0 można znaleźć taki ciąg 

liczb całkowitych 1  a

 a

2

  ... a

N

, żeby liczba 

                                 

N

    1 

                        =  

 

                               

j = 1

   a

j

 

różniła  się  od    o  nie  mniej  niż  .  Zamiast  generować  zmienną  o  rozkładzie 

potęgowym z parametrem  generujemy zmienną losową o rozkładzie z parametrem 
. Można pokazać, że jeżeli R

1

, R

2

, ..., R

N

 są zmiennymi losowymi niezależnymi o 

rozkładzie  równomiernym  na  przedziale  (0,  1),  to  zmienna  losowa  X  określona 

wzorem: 

X = max{R

a

1

1

, R

a

2

2

, ..., R

a

N

N

ma rozkład potęgowy z parametrem . 

 

background image

 

 

Metoda druga

Otrzymujemy  następujący algorytm generowania zmiennej losowej: 

1. Wygenerować zmienną losową R o rozkładzie równomiernym na 

przedziale  (0, 1) 

2. Jeżeli  R    1  -  ,  wykonać  obliczenia  według  punktu  3.  W 

przypadku przeciwnym – według punktu 4. 

3. Wygenerować zmienną losową X według rozkładu potęgowego z 

dystrybuantą F

(x) = x

; koniec obliczeń. 

4. Wygenerować  zmienną  losową  X

1

  zgodnie  z  rozkładem 

potęgowym o dystrybuancie F

(x) = x

 oraz zmienną losową X

2

 

zgodnie z rozkładem  o dystrybuancie F

(x) = x

5. Obliczyć X = X

1

X

2

; koniec obliczeń.  

background image

 

 

Metoda trzecia

Otrzymujemy  następujący algorytm generowania zmiennej losowej: 

1. Wylosować liczbę R zgodnie z rozkładem równomiernym na przedziale (0, 1)  

i znaleźć takie k, że: 

                                        

k-1

                   

                                               

i

  R <       

i

 

                                                             

i=1

   

                 

 

2. Wylosować k + 1 liczb R

0

, R

1

, ..., R

k

 i obliczyć: 

                                   X = (R

0

R

1

 ... R

k

)

1/

 

 

 

background image

 

 

ROZKŁAD BETA

Zmienna losowa X ma rozkład beta z parametrami (, ), jeżeli gęstość jej rozkładu 

prawdopodobieństwa wyraża się wzorem: 
                      1 
     f(x) =                  x

-1

 (1 – x)

-1  

dla 0  x  1 

                  B(, ) 

 

                  0 dla x < 0 lub x > 1 
 

przy czym  > 0,  > 0, B(, ) = ()()/( +), () jest funkcją gamma. 

background image

 

 

Metoda pierwsza

Algorytm generowania zmiennej losowej beta z całkowitymi parametrami (, ): 

1. Wygenerować  +  - 1 niezależnych zmiennych losowych R

1

, R

2

, ..., R

+-1

           

o jednakowym rozkładzie równomiernym na przedziale (0, 1). 

2. Uporządkować wygenerowane wartości w ciąg niemalejący. 

3. Wyznaczyć  -tą  liczbę  z  tego  ciągu  i  przyjąć  ją  za  wygenerowaną  wartość 

zmiennej losowej X

background image

 

 

Metoda druga

Algorytm  generowania  zmiennej  losowej  X  o  rozkładzie  beta  z  całkowitymi 

parametrami (, ): 

1.  Wygenerować  dwie  niezależne  zmienne  losowe  U  i  V,  jedną  o  rozkładzie 

potęgowym F

(x) i drugą o rozkładzie potęgowym F

-1

(x). 

2.  Jeżeli  U  +  V  >  1,  powtórzyć  generowanie  według  punktu  1.  W  przypadku 

przeciwnym przyjąć X = U

background image

 

 

Metoda trzecia

Ten sposób generowania zmiennej losowej X o rozkładzie beta z parametrami (, ) 

skonstruowano  na  podstawie  twierdzenia,  że  jeżeli  U  i  V  są  niezależnymi 

zmiennymi losowymi o rozkładzie gamma, U z parametrem  oraz V z parametrem 
, to zmienna losowa X określona wzorem:  

X = U / U + V 

ma rozkład beta z parametrami (, ). 

background image

 

 

ROZKŁAD GAMMA

Zmienna losowa X ma rozkład gamma z parametrem , jeżeli gęstość jej rozkładu 

prawdopodobieństwa wyraża się wzorem: 
                                1 
                f(x) =                x

-1

e

-x

  dla x > 0 

                              () 

 

                               0 dla x  0 

 

gdzie  > 0 oraz () jest funkcją gamma 

                () = 

0

 

x

-1

e

-x 

dx 

 
 
 

background image

 

 

Zmienna losowa o rozkładzie gamma 

z całkowitym parametrem λ

Aby otrzymać zmienną losową o rozkładzie gamma z całkowitym parametrem , 

wystarczy  wygenerować    niezależnych  zmiennych  losowych  R

1

,  R

2

,  ...,  R

                  

o  rozkładzie  równomiernym  na  przedziale  (0,  1)  i  wykonać  obliczenia  według 
wzoru: 

                                                                                                              

X = ln  Ri  

                                                                                                            i=1 

background image

 

 

Zmienna losowa o rozkładzie gamma 

z całkowitym parametrem λ

Zmienną losową X o rozkładzie gamma przedstawimy w postaci: 

X = X

1

 + X

X

3

 

Gdzie X

1

 ma rozkład gamma z parametrem n = [], X

2

 ma rozkład gamma                    

z parametrem równym jedności, X3 ma rozkład beta z parametrami (, 1-), 

gdzie    = -[] jest liczbą z przedziału (0, 1). 

 

background image

 

 

ROZKŁADY RAYLEIGHA 

I RICE`A

Zmienna  losowa  X  ma  rozkład  Rice`a,  jeżeli  gęstość  jej  rozkładu 
prawdopodobieństwa wyraża się wzorem: 

                      x                 x

2

 + 

2

           x 

        f(x) =           exp (-               ) I

0

 (          )        dla x > 0 

                     

2                           

2

2                         

2

 

                      

 

                     0 dla x  0 

 

Funkcja  I

0

(x)  jest  zmodyfikowaną  funkcją  Bessela  pierwszego  rodzaju  stopnia 

zerowego 
                    1   

2

                 

 

       1         x  

       I

0

(x) =         e

x cost 

dt =                (       )

2k 

                   2  

0                             k = 0 

   

(k!)

2

       2 

background image

 

 

 
 

W przypadku szczególnym  = 0 otrzymujemy rozkład Rayleigha o gęstości: 

                     y                    y

2

 

     g(y) =             exp( –              )       dla y > 0 
                     

2                             

2

2

 

                      
                     0 dla y  0 

 

 

background image

 

 

Generowanie zmiennej losowej Y 

o rozkładzie Rayleigha.

Generowanie  możemy  przeprowadzić  metodą  odwracania  dystrybuanty. 
Otrzymujemy wtedy dla zmiennej losowej Y 

Y =  - 2 ln

gdzie R ma rozkład równomierny na przedziale (0, 1).

  

background image

 

 

Generowanie zmiennej losowej 

o rozkładzie Rice`a

Dla generowania zmiennej losowej o rozkładzie Rice`a można skorzystać z faktu, że 
jeżeli zmienna losowa Y ma rozkład Rayleigha o gęstości g(x) oraz zmienna losowa 
R ma rozkład równomierny na przedziale (0, 1) i jeżeli zmienne losowe Y i R są 
niezależne, to zmienna losowa X określona wzorem: 

 

X =  

2

 + 

2

 – 2Y cos2R 

ma rozkład Rice`a o gęstości f(x). 

background image

 

 

ROZKŁAD 

PODWÓJNIE 

WYKŁADNICZY

Zmienna  losowa  X  ma  rozkład  podwójnie  wykładniczy,  jeżeli  jej  dystrybuanta 
wyraża się wzorem: 

 

F(x) = exp (-e

-x 

),  dla - < x < + 

background image

 

 

Zastosowanie metody odwrócenia 

dystrybuanty

Stosując metodę odwracania dystrybuanty otrzymujemy następujący algorytm: 

1. Wygenerować  zmienną  losową  R  o  rozkładzie  równomiernym  na  przedziale  

(0, 1). 

2. Obliczyć X = - ln(- lnR). 

Korzystając z faktu, że –lnR ma rozkład wykładniczy z dystrybuantą 1– e

-x

, możemy 

ten algorytm zmodyfikować: 

1.  Wygenerować  zmienną  losową  W  o  rozkładzie  wykładniczym  z  wartością 

oczekiwaną równą jedności. 

2.  Obliczyć X = - lnW 

 

background image

 

 

ROZKŁAD WEIBULLA

Zmienna  losowa  X  ma  rozkład Weibulla z parametrami (, ), jeżeli gęstość jej 

rozkładu prawdopodobieństwa wyraża się wzorem: 

                       

x

-1

exp(-x

) dla x > 0 

        f(x) =  
                     0 dla x  0 

 

gdzie  > 0,  > 0 są stałymi. Dystrybuanta tego rozkładu jest następująca: 

        F(x) = 1 – exp(-x

),  x >0 

background image

 

 

Metoda pierwsza

Metoda pierwsza opiera się na twierdzeniu, że jeżeli zmienna losowa Y ma rozkład 

wykładniczy  z  dystrybuantą  G(y)  =  1  –  e

-y

,  to  zmienna  losowa  X  =  CY

1/, 

gdzie          

C = 

-1/

, ma rozkład Weibulla z parametrami (, ). 

Zastosowanie tej metody prowadzi do algorytmu:  
wygenerować zmienną losową Y o rozkładzie wykładniczym i obliczyć:  

X = (Y/)

1/

 

background image

 

 

Metoda druga

Metoda ta prowadzi do algorytmu: 

1.  Wygenerować zmienną losową  N według rozkładu dyskretnego określonego 

wzorem: 

P{N = k} = 1/e

 - 1  

k

/k!,  k = 1, 2, ... 

2.  Wygenerować N niezależnych zmiennych losowych Z

1

, Z

2

, ..., Z

N

 o rozkładzie 

potęgowym z parametrem . 

3.  Wykonać obliczenia według wzoru: 

X = Cmin {Z

1

, Z

2

, ..., Z

N

Gdzie Cmin = (/)

1/

,  > 0, ma ucięty rozkład Weibulla

 

background image

 

 

ROZKŁAD FRÉCHETA

Zmienna losowa X ma rozkład Frecheta, jeżeli jej dystrybuanta wyraża się wzorem: 

F(x) = exp(-x

-

), x > 0,  > 0 

Odwracając dystrybuantę otrzymujemy dla zmiennej losowej X wyrażenie: 

X = (-lnR)

-1/

 

w którym R jest zmienną losową o rozkładzie równomiernym na przedziale (0, 1). 
Ponieważ zmienna losowa W = -lnR ma rozkład wykładniczy z dystrybuantą 1 – e

-x

otrzymujemy wzór: 

X = W

-1/

 

background image

 

 

TESTY STATYSTYCZNE 

DLA GENERATORÓW 

LICZB LOSOWYCH

background image

 

 

TESTY ZWIĄZANE Z 

MOMENTAMI

Standardowe postępowanie przy weryfikowaniu hipotezy H: (EX

N

 = ½) w stosunku 

do hipotezy alternatywnej K: (EX

N

  ½) jest następujące. 

Dla ustalonego poziomu istotności  znajdujemy takie liczby x

 

oraz x

, żeby 

P{X

N 

 x

} = P{X

N

 > x

} = /2 

Przy  czym  prawdopodobieństwa  te  obliczono  przy  założeniu,  że  hipoteza  H  jest 

prawdziwa.  Obliczenie  liczby  x

  wymaga  rozwiązania  równania,  którego  jedną 

stroną  jest  F

N

(x),  drugą  zaś  liczba  /2;  analogicznie  zaś  obliczenie  liczby  x

 

wymaga rozwiązania takiego równania z liczbą 1- po prawej stronie. 

Jeżeli  takie  liczby  zostaną  obliczone,  to  weryfikacja  hipotezy  sprowadza  się  do 
porównania  zaobserwowanej  wartości  zmiennej  losowej  X

N

  z  tymi  liczbami; 

zdarzenie X

N

 < x

 

oraz zdarzenie X

N 

> x

 prowadzą do odrzucenia weryfikowanej 

hipotezy. 

background image

 

 

TEST CHI-KWADRAT 

ZGODNOŚCI ROZKŁADY (TEST 

CZĘSTOŚCI)

Niech  zmienna  losowa    ma  rozkład  o  dystrybuancie  F  takiej,  że  F(a)  =  0  oraz         

F(b) = 1. Niech a

0

 = a < a

1

 < a

2

 < ... a

k

 = b oraz p

i

 = P{a

i-1 

<   a

i

}, i = 1,2, ...,. 

Rozważmy ciąg 

1

, 

2

, ..., 

N

 liczb losowych z pewnego generatora liczb losowych  

o  rozkładzie  z  dystrybuantą  F.  Niech  n

1

  będzie  liczbą  takich  elementów    tego 

ciągu, które spełniają warunek: a

i-1

 <   a

i

. Statystyka 

                        

k

      (n

i

 – Np

i

)

2               

1       

k

     ni

2

 

             

2

k-1 

=  =                     =                        - N  

                       

i=1

         Np

i

                N      

i=1     

 pi 

 

ma  w  przybliżeniu  rozkład  chi-kwadrat  o  (k-1)  stopniach  swobody.  Jeżeli  N  jest 
dostatecznie  duże,  to  statystyka  ta  służy  do  weryfikacji  hipotezy  o  rozkładzie 

zmiennej losowej  za pomocą tzw. testu chi-kwadrat 

background image

 

 

TEST ZGODNOŚCI ROZKŁADU 

PAR

Test par konstruujemy w następujący sposób. 
Niech n

i

 będzie liczbą takich elementów X w ciągu X

1

, X

2

, ..., X

N

, które spełniają 

warunek: a

i-1 

< X  a

i

. Obliczamy wartość statystyki 

1

2

 według wzoru: 

               

                 

k

           N             N 

             

2

   =    ( n

i

 -         )

2

 /  

                

1            

i=1                 

k              k 

 

Konstruujemy ciąg par (X

1

, X

2

), (X

2

, X

3

), ..., (X

N-1

X

N

). Niech n

ij

 będzie liczbą takich 

par (X, Y) w tym ciągu, które spełniają warunek: a

i-1 

< X  a

i

 oraz b

j-1 

< Y  b

j

Obliczamy wartość statystyki 

2

2

 zgodnie ze wzorem:  

               

                 

k     k

              -1           N-1 

             

2

   =        ( n

ij

 -           )

2

 /  

                

2            

i=1  j=1                      

k

2

              k

 

background image

 

 

 
 
 

Weryfikowaną  hipotezę  odrzucamy  na  poziomie  istotności  równym  ,                        

gdy   

2

2

-

2

1

 > 

2

(k

k, ),  

gdzie  

2

(,  )  oznacza  wartość  krytyczną  rozkładu  chi-kwarat  o    stopniach 

swobody. 

background image

 

 

TESTY SERII

Teoria weryfikowania hipotezy o niezależności zmiennych X

1

, X

2

, ..., X

N

 oparta na 

liczbie  R  serii  jest  następująca:  należy  –  dla  ustalonego  poziomu  istotności                 
 - znaleźć takie dwie liczby krytyczne R

1

 oraz R

2

, żeby 

P{R < R

1

} = P{R > R

2

} = /2 

Jeżeli  zaobserwowana  liczba  serii  jest  mniejsza  od  R

1

  lub  większa  od  R

2

weryfikowaną hipotezę odrzucamy. 

background image

 

 

TESTY ZGODNOŚCI 

ROZKŁADÓW

Jeżeli X

1

X

2

, ... jest ciągiem liczb niezależnych zmiennych losowych o rozkładzie 

równomiernym na przedziale (0, 1), to ciąg (X

1

X

2

, ..., X

m

), (X

m+1

X

m+2

, ..., X

2m

),... 

jest  ciągiem  niezależnych  zmiennych  losowych  o  jednakowym  rozkładzie 
równomiernym na m-wymiarowej kostce jednostkowej (0, 1)

m

. Niech  

y = hx

1

x

2

, ..., x

m

będzie  funkcją  m  zmiennych,  określoną  na  kostce  jednostkowej  (0,  1)

m

Przekształcając  ciąg  (X

1

,  X

2

,  ...,  X

m

),  (X

m+1

,  X

m+2

,  ...,  X

2m

),...  według  tej  funkcji 

otrzymujemy nowy ciąg Y

j

 = h(X

(j-1)m+1

X

(j-1)m+2

, ..., X

jm

),  j = 1, 2,... Jest to ciąg 

niezależnych zmiennych losowych o jednakowym rozkładzie. 

background image

 

 

Niech G będzie dystrybuantą rozkładu tych zmiennych losowych 

G(y) = P{Y

j

  y

Gdy  zmienne  losowe  X

1

,  X

2

,  ...  są  niezależne  i  mają  jednakowy  rozkład 

równomierny na przedziale (0, 1). Testowanie generatora na podstawie funkcji 

y = hx

1

x

2

, ..., x

m

przeprowadza się w następujący sposób: obserwuje się ciąg zmiennych losowych  
X

1

,  X

2

,  ...  i  przekształca  go  na  ciąg  zmiennych  losowych  Y

1

,  Y

2

,  ....  Dla  ciągu              

Y

1

,  Y

2

,...  weryfikuje  się  hipotezę,    że  jest  on  próbką  prostą  z  populacji                             

o dystrybuancie G. Odrzucenie tej hipotezy prowadzi do dyskwalifikacji generatora 
liczb losowych X

1

X

2

,... 

 

background image

 

 

TESTY KOMBINATORYCZNE

Test pokerowy

Niech  X

1

,  X

2

,  ...  będzie  ciągiem  liczb  z  pewnego  generatora  liczb  losowych                    

o rozkładzie z dystrybuantą F . Podzielmy zbiór wartości zmiennych losowych X na         
k  rozłącznych  „jednakowo  prawdopodobnych”  przedziałów  za  pomocą  punktów               
a

0

  <  a

1

  <  a

2

  <  ...  <  a

k-1

.  Jeżeli  zmienne  losowe  X

j

  mają  rzeczywiście  rozkład                   

z dystrybuantą F, to dla każdego przedziału (a

i-1

, a

i

P{a

i-1 

X

i

  a

i

} = 1/k 

Utwórzmy nowy ciąg zmiennych losowych Y

j

 zdefiniowanych wzorem: 

Y

j

 = i  jeżeli X

j

  (a

i

, a

i+1

), i = 0, 1, ..., k-1 

Zmienne  losowe  Y

j

  przyjmują  więc  tylko  wartości  0,  1,  2,  ...,  k-1,  każdą                          

z jednakowym prawdopodobieństwem. 

background image

 

 

Podzielmy ciąg Y

1

Y

2

, ... na piątki (Y

1

Y

2

, ..., Y

5

), (Y

6

Y

7

, ..., Y

10

),.... Ten nowy ciąg 

zbudowany jest z k

5

 różnych piątek. Będziemy wyróżniali następujące typy piątek: 

abcde (bust – każda liczba w piątce jest inna); 
aabcd  (para  –  w  piątce  są  dwie  liczby  jednakowe,  wszystkie  pozostałe  są 

różne); 

aabbc (dwie pary); 
aaabc (trójka); 
aaabb (full); 
aaaab (czwórka); 
aaaaa (piątka). 

Zgodność rozkładu piątek różnych typów sprawdza się za pomocą zwykłego testu 
chi-kwadrat. 

background image

 

 

Test kolekcjonera

Utwórzmy ciąg Y

1

Y

2

, ... tak jak w teście pokerowym. Będziemy obserwowali ten 

ciąg dopóki nie pojawią się w nim wszystkie k cyfry 0, 1, 2, ..., k-1. Niech r będzie 
długością zaobserwowanego odcinka ciągu. Można udowodnić, że zmienna losowa  
r ma rozkład prawdopodobieństwa określony wzorem: 

                     1      

k-2

                    

          p

r

 =              (-1) 

(  

k-1

 )(– 1 – )

r-1

r = k+ 1, ... 

                   k 

r-1      j=0                    j

 

 

Zgodność 

tego 

rozkładu 

prawdopodobieństwa 

rozkładem 

zaobserwowanym bada się za pomocą standardowego testu chi-kwadrat

 

background image

 

 

Test permutacji

Niech X

1

X

2

, ... będzie ciągiem niezależnych zmiennych losowych o jednakowym 

rozkładzie równomiernym na przedziale (0, 1) i rozpatrzymy ciąg (X

1

X

2

, ..., X

m

), 

(X

m+1

X

m+2

, ..., X

2m

),.... Przekształćmy każdy z punktów  

(X

(j-1)m+1

X

(j-1)m+2

, ...X

jm

), j= 1, 2, ..., przypisując każdej współrzędnej X

r

 numer n

r

jaki  ona  zajmuje  w  ciągu  liczb  X

(j-1)m+1

,  X

(j-1)m+2

,  ...X

jm

    po  jego  uporządkowaniu              

w ciąg rosnący. 
Jeżeli  ciąg  X

1

,  X

2

,  ...  jest  ciągiem  niezależnych  zmiennych  losowych,  to  każda 

permutacja (n

1

n

2

, ..., n

m

) liczb (1, 2, ..., 

m

) jest jednakowo prawdopodobna.  

Testem zgodności chi-kwadrat weryfikuje się hipotezę, że tak jest rzeczywiście.

 

background image

 

 

KONIEC


Document Outline