plik

Liczby

Losowe

Wiele procesów zachodzących w przyrodzie, technice, ekonomii i życiu społecznym
sprawia  wrażenie  zjawisk  losowych,  a  więc  takich,  dla  których  nie  potrafimy
przewidzieć  ich  przyszłego  przebiegu  ani  nie  potrafimy  ustalić przyczyn które je
wywołały. W każdym z tych przypadków, niezależnie od tego, czy udaje nam się
ustalić,  jakie  są  przyczyny  losowości  zjawiska,  możemy  spróbować  opisać  to
zjawisko  ilościowo,  wykorzystując  do  tego  celu  pojęcie  prawdopodobieństwa
rozumianego jako ilościowa miara niepewności – losowości. Podobnie jak w fizyce
i w przyrodzie, efekty losowe mogą występować również w świecie liczb

Liczba losowa to taka liczba, której wartość nie może zostać z góry przewidziana.
Sekwencję liczb losowych można stworzyć wykonując np. serię niezależnych rzutów
monetą i notując obserwowane wyniki pisząc 0 – gdy wynikiem rzutu jest reszka, oraz
1 – gdy wynikiem rzutu jest orzeł. Ponieważ prawdopodobieństwo zaobserwowania
reszki  jest  takie  samo  jak  zaobserwowania  orła  i  jest  ono  równe  ½,  więc  zmienna
losowa  –  wynik  rzutu  –  ma  rozkład  dwupunktowy  i  przyjmuje  wartości  0  lub  1  z
jednakowym  prawdopodobieństwem.  Mówimy,  że  ta  zmienna  losowa  ma  rozkład
równomierny na zbiorze {0,1} lub rozkład dwupunktowy  z parametrem  p = ½.
W wyniku takiego postępowania otrzymamy więc na przykład następujący ciąg liczb:
1,0,0,1,1,...  Taki  ciąg  liczb  nazywa  się  ciągiem  liczb  losowych  o  rozkładzie
równomiernym  na  zbiorze  {0,1}  lub  ciągiem  liczb  losowych  o  rozkładzie
dwupunktowym z parametrem p = ½.
Monetę,  za  pomocą  której  otrzymamy  takie  ciągi  nazywa  się  generatorem  liczb
losowych  o  rozkładzie  równomiernym  na  zbiorze  {0,1}  lub  generatorem  liczb
losowych o rozkładzie dwupunktowym z parametrem p = ½.

zadania związane z badaniami reprezentacyjnymi np. badania pewnych zjawisk

społecznych na drodze szczegółowego opisu jednostek wybranych losowo z populacji
interesujących nas obiektów lub zadania ze statystycznej kontroli jakości, w których
partie różnych towarów opisuje się na podstawie badania losowo wybranych próbek
tych towarów;

zadania numeryczne rozwiązywane metodami Monte Carlo. Zadania numeryczne

zastępujemy zadaniem z rachunku prawdopodobieństwa, w taki sposób, że związek
pomiędzy  rozwiązaniami  obu  zadań  jest  znany,  a  zadanie  z  rachunku
prawdopodobieństwa  rozwiązujemy  na  drodze  eksperymentu  statystycznego.
Podstawową  część  tego  eksperymentu  stanowi  losowanie  próbki  z  odpowiedniej
populacji, a więc generowanie odpowiedniego ciągu liczbowego;

zadania związane z badaniem różnych zjawisk i procesów technicznych,

ekonomicznych, przyrodniczych na drodze symulowania (modelowania) tych
procesów i zjawisk na maszynach cyfrowych.

Zadania, do rozwiązywania których

używa się ciągów liczb losowych.

Metody generowania cyfrowego

liczb losowych o rozkładzie

równomiernym

Podstawowymi generatorami liczb losowych są generatory fizyczne, takie jak:



moneta



urna o odpowiedniej zawartości



kostka do gry



ruletka itp.

są to urządzenia losowe.
Generatory tego typu mogą być przydatne do losowania nie dużych próbek dla
badań reprezentacyjnych albo do „ręcznego” rozwiązywania zadań metodami Monte
Carlo lub zadań z zakresu modelowania cyfrowego różnych zjawisk i procesów.

ZMIENNA LOSOWA O

ROZKŁADZIE POISSONA Z

PARAMETREM ct













p ra w d o p o d o b i e ń s tw o , ż e w o d c i n k u c z a s u o d ł u g o ś c i t z o s ta n i e z a re j e s tro w a n a
p a rz y s ta l i c z b a c z ą s te k – o z n a c z a m y p rz e z p

Niech Z

będzie nową zmienną losową przyjmującą wartość 0, gdy stan licznika

promieniowania w okresie czasu o długości t zmieni się o liczbę parzystą, oraz
przyjmująca wartość 1 w przeciwnym przypadku. Zmienna losowa Z

ma więc

rozkład:

P { Z

= 0} = (1+) / 2

P { Z

= 1} = (1+) / 2

gdzie  = e

–2ct

Jeżeli intensywność c źródła promieniowania jest duża lub jeżeli odcinek czasu t jest

długi to  jest małe i rozkład zmiennej losowej Z

nieznacznie tylko różni się od

rozkładu dwupunktowego z parametrem p= ½.

ZMIENNA LOSOWA O

ROZKŁADZIE ROWNOMIERNYM

NA PRZEDZIALE (0,1)

zwykle rozumie się jako zmienna losowa x ciągła, dla której















}

{

dla

Zrealizowanie  takiej  zmiennej  losowej  nie  jest  możliwe  na  żadnej  maszynie
cyfrowej;  w  każdej  maszynie  można  operować  tylko  skończoną  liczbą  różnych
wartości.
Można zauważyć, że jeżeli zmienna losowa, której kolejnymi realizacjami są liczby
takiego  ciągu,  jak  :  0,1,1,1,0,0,1,0,1,1,0,0,0,1,0......,  ma  rozkład  dwupunktowy
z parametrem p = 1/2 , to prawdopodobieństwo otrzymania każdej z liczb postaci :
0.0111, 0.0010, 0.1100, 0.0101 jest równe 2

-k

, a wiec otrzymany ciąg jest ciągiem

realizacji zmiennej losowej o rozkładzie równomiernym na przedziale(0,1).
Problemem  związanym  z  eksploatacja  generatorów  fizycznych  jest  problem  ich
stabilności: niewielkie  zmiany własności fizycznych źródła lub zmiany warunków
otoczenia mogą pociągnąć za sobą istotne zmiany własności otrzymywanych ciągów
liczb  losowych.  W  związku  z  tym  generatory  fizyczne  wymagają  dodatkowych
urządzeń testujących i korygujących, co znacznie komplikuje ich budowę.

OGÓLNA POSTAĆ

GENERATORÓW LICZB

LOSOWYCH

n+1

= a

+ a

n-1

+ ... + a

n-k

+ b (1)

Wszystkie liczby a

, b oraz x

we wzorze są liczbami całkowitymi z przedziału

[ 0,M ).

Generatory postaci będziemy nazywali generatorami liniowymi.

W szczególności:

generatory postaci: x

n+1

= cx

(2)

będziemy nazywali generatorami multyplikatywnymi,

generatory postaci: x

n+1

= a x

+ b, b  0 (3)

będziemy nazywali generatorami mieszanymi

generatory postaci: x

n+1

= x

+ x

n-1

(4)

będziemy nazywali generatorami Fibonacciego

Generator postaci, w którym wszystkie liczby a

są równe zeru lub jedności,

będziemy nazywali generatorem addytywnym lub uogólnionym generatorem
Fibonacciego.

Stałe a, b, c w powyższych wzorach są liczbami całkowitymi z przedziału (0,M).
Jeżeli stałe początkowe x

, x

,......,x

w generatorze(1); x

w generatorze (2), (3);

oraz x

i x

w generatorze (4) są liczbami naturalnymi, to wszystkie liczby x

otrzymywane z tych generatorów są liczbami naturalnymi. Jako liczby o rozkładzie
równomiernym na przedziale (0,1) przyjmujemy liczby :

= x

/ M

w ciągu (r

), n = 1,2,..... występuje co najwyżej M różnych liczb.

WŁASNOŚCI

STATYSTYCZNE

GENERATORÓW

Rozważając własności statystyczne generatorów traktujemy go jako pewne
„urządzenie losowe”, takie jak np.:



moneta,



urna z odpowiednim zapasem różnych kul,



ruletka

Kolejną liczbę X

produkowaną przez ten generator traktujemy więc jako zmienną

losową i weryfikacja, czy generator produkuje liczby losowe o żądanym rozkładzie
prawdopodobieństwa, sprowadza się do weryfikacji, czy ciąg X

, X

, ......., X

N –1

może być traktowany jako N-elementowa próbka prosta z określonej populacji, tz.
czy jest ona ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie
prawdopodobieństwa.

Test statystyczne przeznaczone do weryfikacji generatorów liczb losowych można
podzielić na dwie grupy:



testy zgodności rozkładu



testy niezależności ( testy losowości próbki)

Testy  uporządkowania  próbki  to  wszelkiego  rodzaju  testy  serii,  testy  statystyk
pozycyjnych, testy kombinatoryczne, takie jak np. test pokerowy . Testy te maja na
celu  wykrycie  ewentualnych  tendencji  w  ciągach  liczb  produkowanych  przez
generator, co prowadziłoby do dyskwalifikacji tego generatora.

WŁASNOŚCI ARYTMETYCZNE

GENERATORÓW

PROGRAMOWYCH

Generatory programowe

n+1

= f(x

) (1)

n+1

= g( x

n-1, ......,

n-k+1

) (2)

argumenty funkcji f należą do zbioru liczb całkowitych; a wartości są liczbami
całkowitymi nieujemnymi, wtedy (1) jest generatorem multyplikatywny a generator
postaci (2) – generator liniowy.

Analiza  arytmetycznych  własności  generatorów  obejmuje  zwykle
zagadnienie  momentów,  zagadnienie  autokorelacji  oraz  zagadnienie
równomierności rozkładów wielowymiarowych.
Oceny  generatorów  programowych  można  również  dokonać  w  inny
sposób, nie odwołując się przy tym do probalistyki. Zamiast analizować
różne własności ciągów liczb otrzymywanych z takich generatorów, takie
jak  okresowość,  równomierność  rozkładu,  autokorelacji,  można  ocenić
przydatność danego generatora do rozwiązania zadań określonego typu.
Generatory  programowe,  które  spełniają  wszystkie  wymagania
sformułowane  z  punktu  widzenia  rozwiązania  zadań  określonego  typu,
przyjęto  nazwać  generatorami  liczb  quasi  –  losowych.  Generatory  takie
ocenia się z punktu widzenia obliczania całek; do tego typu zadań można
sprowadzić większość zadań rozwiązywanych metodami Monte Carlo oraz
wiekszość zadań w badaniach reprezentacyjnych.

GENERATORY MULTYPLIKATYWNE

Generatory te zostały zaproponowane przez D. H. Lehmera w 1951 r.

Są to generatory postaci:

n+1

= cx

(mod M)

przy czym c, x

, oraz wszystkie x

, są liczbami całkowitymi z

przedziału [0,M ).

Wtedy liczby r

= x

/ M są liczbami z przedziału [0,1).

Generator multiplikatywny jest generatorem okresowym.

Przykład

Gdy M = 2

, m  3, max. jego okres jest równy 2

m-2

. Generator

multiplikatywny osiąga ten okres, gdy x

jest liczbą nieparzystą oraz

gdy c  3 (mod 8) lub c  5 (mod 8).

Zapis a  b (mod c) oznacza, że różnica a – b dzieli się przez c,

czyli że a = cv + b dla pewnego całkowitego v.

Na przykład dla m = 5, c = 11  3 (mod 8), x

= 1, otrzymujemy ciąg:

1, 11, 25, 19, 17, 27, 9, 3, 1,...; jest to ciąg o okresie 8.

GENERATOR MIESZANY

Generator mieszany został zaproponowany przez A. Rotenberga w 1960 r.

Jest to generator postaci:

n+1

= a x

+ b (mod M), b  0

przy czym a, b oraz x

są liczbami całkowitymi z przedziału [0,M ).

Za pomocą wzoru r

= x

/ M otrzymujemy liczby z przedziału (0,1).

Podobnie jak generator multiplikatywny generator mieszany jest generatorem
okresowym. W przypadku tym można jednak przez odpowiedni wybór parametrów
a oraz b uzyskać generator o pełnym okresie tzn. generator o okresie M.
Generator ma okres M, jeżeli:

(1)

b jest liczbą pierwszą względem M,

(2)

a  1 (mod p) dla każdego czynnika pierwszego p liczby M,

(3)

a  1 (mod 4), jeżeli 4 jest dzielnikiem liczby M

GENERATORY ADDYTYWNE

Najprostszym generatorem addytywnym jest generator Fibonacciego

n+1

= x

+ x

n-1

(mod M)

Jest to generator okresowy i w przypadku M = 2

jego okres jest równy 3 x 2

m-1

niezależnie od wyboru stałych początkowych x

i x

GENERATORY PUNKTÓW O ROZKŁADZIE

RÓWNOMIERNYM NA KOSTKACH

JEDNOSTKOWYCH W PRZESTRZENIACH

WIELOWYMIAROWYC

Jeżeli (R

), n = 0, 1, 2,..., jest ciągiem niezależnych zmiennych losowych o jednakowym

rozkładzie równomiernym na przedziale (0, 1), to k – wymiarowe zmienne losowe

, R

jk + 1

, ..., R

(j + 1)k – 1

), j = 0, 1, 2, ...,

są niezależne i mają jednakowy rozkład równomierny na kostce jednostkowej (0, 1)

Fakt ten doprowadził do sformułowania prostego algorytmu otrzymywania punktów
losowych o rozkładzie równomiernym na kostce (0, 1)

, jeżeli dany jest ciąg punktów

losowych na przedziale (0, 1) – kolejne wyrazy tego ciągu traktuje się jako kolejne
współrzędne generowanych punktów.

Takie  postępowanie  można  zastosować  bez  żadnych
zastrzeżeń,  gdy  ciąg  liczb  losowych  z  przedziału  (0,  1)
otrzymuje  się  za  pomocą  pewnego  rzeczywiście  losowego
urządzenia  np.  fizycznego  generatora  liczb  losowych.  W
przypadku,  gdy  ciąg  taki  otrzymuje  się  jako  ciąg  liczb
pseudolosowych

pomocą

pewnego

generatora

programowego, mogą pojawić się pewne odchylenia od
równomierności rozkładu produkowanych w ten sposób liczb,
a czasami otrzymanie takich punktów w opisany sposób jest
niemożliwe.
Ponieważ odchylenia od rozkładu równomiernego na kostce k
– wymiarowej pochodzą stąd, że kolejne liczby pseudolosowe
są na ogół ze sobą skorelowane, powstaje pomysł konstrukcji
ciągu punktów (r

, r

, ..., r

) o rozkładzie równomiernym na

kostce (0, 1)

w ten sposób, żeby każda współrzędna

generowanego punktu pochodziła z innego generatora liczb

Uogólniając zapiszemy generator punktów

(n)

= (r

(n)

, r

(n)

, ..., r

(n)

), n = 0, 1, 2, ...

w postaci

(n)

= Ar

(n-1)

+ b (mod 1)

przy czym A jest macierzą całkowitoliczbową stopnia k oraz b jest pewnym
wektorem o k składowych.

Metoda odwracania

dystrybuanty

Załóżmy, że F jest dystrybuantą pewnego rozkładu prawdopodobieństwa, a

, i = 1, 2, ...,

jest ciągiem niezależnych zmiennych losowych o rozkładzie
równomiernym na odcinku [ 0, 1]. Wówczas ciąg zmiennych losowych
zdefiniowanych jako

= F

-1

), i = 1, 2, ...,

jest ciągiem niezależnych zmiennych losowych o rozkładzie zadanym
dystrybuantą F.

Rozważmy dystrybuantę rozkładu wykładniczego F (x) = 1 – e

-x

Funkcją do niej odwrotną jest
F

-1

(y) = -ln (1 – y)

i dla niezależnych zmiennych losowych ciąg
Y

= - ln (1 – Xi), i = 1, 2, ...,

jest ciągiem niezależnych zmiennych losowych o rozkładzie wykładniczym.

Przykład

Algorytm dla rozkładu jednowymiarowego.

1. Generujemy dwie liczby losowe R

i R

, odpowiednio,

R

o rozkładzie U (a, b)

R

o rozkładzie U (0, c)

2. Sprawdzamy, czy R

 f (R

3. Jeżeli warunek jest spełniony, to przyjmujemy X = R

W przeciwnym wypadku eliminujemy wylosowany punkt i powtarzamy
losowanie z kroku 1.

Algorytm dla rozkładu wielowymiarowego

1. Generujemy n + 1 liczb losowych R

, R

, ..., R

, R

n + 1

, w tym

R

, R

, ..., R

o rozkładzie U (a, b),

R

n + 1

o rozkładzie U (0, c).

2. Sprawdzamy, czy R

+ 1  f ( R

, R

, ..., R

3. Jeżeli warunek jest spełniony, to przyjmujemy
(X

, X

, ..., X

) = (R

, R

, ..., R

)

W przeciwnym wypadku eliminujemy wylosowany punkt i powtarzamy
losowanie z kroku 1.

METODA SUPERPOZYCJI

ROZKŁADÓW

Metoda superpozycji rozkładów została zaproponowana przez J. W. Butlera.
Jeżeli przedstawimy gęstość f rozkładu zmiennej losowej x w postaci:

f(x) =





+

(x) h(y) dy

gdzie g

(x) jest gęstością pewnego rozkładu prawdopodobieństwa, zależną od

parametru y oraz h jest pewną gęstością prawdopodobieństwa.
Wzór ten może być odczytany w następujący sposób: zmienna losowa X ma rozkład
o gęstości g

zależnej od pewnego parametru y, który z kolei jest zmienną losową o

gęstości h; f jest wtedy gęstością bezwarunkowego rozkładu zmiennej losowej X.
Wynika stąd prosty sposób generowania zmiennej losowej X:

1. Wylosować y zgodnie z rozkładem gęstości h.
2. Wylosować x zgodnie z rozkładem o gęstości g

, z parametrem wylosowanym

w punkcie 1.

Kombinacja metody eliminacji

i metody superpozycji

Niech zmienna losowa X ma rozkład o gęstości p w postaci:



p(x) =  

(x)

n=0

gdzie 

 0, 

= 1,

natomiast p

, n = 0, 1, 2, ..., są pewnymi gęstościami prawdopodobieństwa

zależnymi od parametru n.
Każdą z gęstości p

przedstawimy w postaci: p

(x) = a

(x)g

(x)

przy czym a

> 0 są pewnymi stałymi,

są gęstościami prawdopodobieństwa oraz

funkcje g

spełniają warunki 0  g

(x)  1dla każdego x.

Algorytm generowania zmiennej

losowej X:

1. Wylosować n zgodnie z rozkładem P{n = i} = 

2. Dla wylosowanego w punkcie 1 parametru n wylosować x według rozkładu

prawdopodobieństwa o gęstości f

3. Wylosować liczbę R z populacji o rozkładzie równomiernym na przedziale

(0, 1).

4. Jeżeli R  g

(x) przyjąć x za realizację generowanej zmiennej losowej X;

w przypadku przeciwnym powtórzyć wszystkie obliczenia od punktu 1.

ROZKŁADY DYSKRETNE

Istnieją dwa sposoby generowania zmiennej losowej dyskretnej zaproponowane
przez G. Marsaglia.
Niech zmienna losowa X o wartościach a, b, ..., m ma następujący rozkład:

wartość zmiennej losowej

prawdopodobieństwo

0,023 = 0,0 + 0,02 + 0,003

0,038 = 0,0 + 0,03 + 0,008

0,074 = 0,0 + 0,07 + 0,004

0,103 = 0,1 + 0,00 + 0,003

0,148 = 0,1 + 0,04 + 0,008

0,206 = 0,2 + 0,00 + 0,006

0,140 = 0,1 + 0,04 + 0,000

0,101 = 0,1 + 0,00 + 0,001

0,093 = 0,0 + 0,09 + 0,003

0,037 = 0,0 + 0,03 + 0,007

0,026 = 0,0 + 0,02 + 0,006

0,011 = 0,0 + 0,01 + 0,001

ROZKŁAD WYKŁADNICZY

Zmienna losowa W ma rozkład wykładniczy, jeżeli jej dystrybuanta wyraża się
wzorem:

P{W  w} = 1 – e

-cw

dla w  0

0 dla w < 0

gdzie c > 0 jest pewną stałą.
Niech X = cW
Zmienna losowa X ma rozkład wykładniczy z wartością oczekiwaną równą jakości.
Ponieważ ze zmiennej o rozkładzie wykładniczym z wartością oczekiwaną c = 1
można otrzymać zmienną losową o rozkładzie wykładniczym z dowolną wartością
parametru c, będziemy dalej rozpatrywali tylko zmienną losową X.

Metoda odwracania dystrybuanty

zmiennej losowej z parametrem

równym ln 2

Algorytm generowania zmiennej losowej X:

1. Wygenerować zmienną losową p według rozkładu dyskretnego określonego

wzorem:

P{p = k} = (1/2)

k+1

, k = 0, 1, 2, ...,

2. Wygenerować zmienną losową R o rozkładzie równomiernym na przedziale

(0, 1) i obliczyć:

q = - log

(1 – R/2)

3. Obliczyć:

X = p + q

Metoda J. von Neumanna

metoda serii monotonicznych

Algorytm tej metody oparty jest na rejestrowaniu monotonicznych serii w ciągu
zmiennych losowych o rozkładzie równomiernym na przedziale (0, 1).
Obserwujemy kolejne serie postaci

 R

 ...  R

< R

n+1

Numerując te serie kolejnymi liczbami 0, 1, 2, ... Numer pierwszej serii, w której n
jest liczbą nieparzystą, przyjmujemy za część całkowitą, natomiast wartość R

w tej

serii za część ułamkową generowanej liczby X

Metoda superpozycji

G. Marsaglia i M. Sibuya

Algorytm generowania zmiennej losowej o rozkładzie wykładniczym.

1. Wygenerować zmienną losową m zgodnie z rozkładem dyskretnym według wzoru:

= P{M = i} = (e

– 1) e

-c(i = 1)

, i = 0, 1, 2, ...,

2. Wygenerować zmienną losową N zgodnie z rozkładem dyskretnym według wzoru:

= P{n = i} = c

/ e

– 1  1 / i!, i = 1, 2, 3, ...,

3. Wygenerować N zmiennych losowych R

, R

, ..., R

niezależnych o jednakowym

rozkładzie równomiernym na przedziale (0, 1).

4. Obliczyć u = min(R

, R

, ..., R

5. Obliczyć

X = M + u

Metoda przybliżania rozkładu

wykładniczego

za pomocą rozkładu dyskretnego

Algorytm generowania zmiennej losowej

1. Wygenerować liczbę losową R o rozkładzie równomiernym na przedziale

(0, 1). Jeżeli R < e

-4,6

= 0,010052, wykonać obliczenia według punktu 2,

w przeciwnym przypadku według punktu 3.

2. Obliczyć X = - ln R; koniec obliczeń.
3. Wygenerować zmienną losową V zgodnie z rozkładem dyskretnym

P{V = k / 10) = e

-k/10

– e

-(k+1)/10

4. Wygenerować ną losową R o rozkładzie równomiernym na przedziale (0, 1).
5. Obliczyć X = V + R/10; koniec obliczeń

Metoda odwracania dystrybuanty

Funkcja odwrotna do dystrybuanty rozkładu normalnego nie może być
przedstawiona za pomocą łatwej do obliczeń formuły, dlatego poszukuje się zwykle
pewnych aproksymacji tej funkcji.

-x2/2

 4e

-kx

/ (1+e

-kx

)

, x>0

gdzie k = 8/. Korzystając z tej aproksymacji dla funkcji (x) na dodatniej półosi,

otrzymujemy następującą aproksymację dla dystrybuanty rozkładu normalnego
N(0, 1) uciętego do wartości dodatnich

y = (x) = (2 / 1 + e

-kx

) –1

i stąd przybliżenie dla funkcji odwrotnej

x = 1/k ln 1+y / 1 - y, 0<y<1

Jeżeli y ma rozkład równomierny na przedziale (0, 1), to x obliczone według wzoru:

1 1 + y

x =  ln

k 1 – y , 0<y<1

ma w przybliżeniu rozkład normalny ucięty do wartości dodatnich, tzn. rozkład
o gęstości:

P(x) = 2/  e

-x2

/2, x>0

a więc SX, gdzie S jest zmienną losową o rozkładzie

P{S = + 1} = P{S = -1} = ½

ma rozkład normalny N(0, 1).

Zastosowanie centralnego

twierdzenia granicznego

Najbardziej  znana  metoda  generowania  zmiennej  losowej  X  o  rozkładzie
normalnym  polega  na  przybliżaniu  jej  za  pomocą  sumy  niezależnych  zmiennych
losowych  R

, R

, ..., R

o jednakowym rozkładzie równomiernym na przedziale

(0, 1). Ponieważ ER

= ½ oraz D

= 1/12, więc dla dostatecznie dużych n zmienna

losowa
(R

+ R

= ... + R

) – n/2

X =
n/12

ma rozkład normalny N (0, 1).

Metoda eliminacji i superpozycji

rozkładów

G. Marsaglia i T. A. Bray zaproponowali generator liczb losowych o rozkładzie
normalnym skonstruowany metodą eliminacji i superpozycji rozkładów, przy użyciu

reprezentacji gęstości (x) tego rozkładu za pomocą sumy:

(x) = a

(x) + a

(x)

gdzie

, f

oraz f

są gęstościami skupionymi na pewnym przedziale

(-a, a), natomiast f

jest „ogonem” rozkładu normalnego na sumie

przedziałów (-, -a) oraz (a, +).

Losowanie z ogona rozkładu

normalnego

Losowanie z ogona (a, +) rozkładu normalnego można przeprowadzić np.

generując pary niezależnych zmiennych losowych R

i R

o jednakowym rozkładzie

równomiernym na przedziale (0, 1) dopóki nie będzie spełniony warunek

 a (a

– 2 ln R

)

-1/2

Wówczas za wygenerowaną wartość ogona (a, +) przyjąć liczbę

– 2 ln R

)

1/2

a następnie wygenerowanej w ten sposób liczbie przypisać znak plus lub minus,
każdy z jednakowym prawdopodobieństwem

Wielowymiarowy rozkład normalny

G. E. Box i M. E. Muller zaproponowali generator dwuwymiarowej zmiennej
losowej o rozkładzie normalnym, korzystając z faktu, że jeżeli R1 i R2 są
niezależnymi zmiennymi losowymi o ozkładzie równomiernym na przedziale (0, 1),
to zmienne losowe

= (-2 ln R

)

1/2

cos2R

= (-2 ln R

)

1/2

sin2R

są niezależne i mają jednakowy rozkład normalny N(0, 1)

ROZKŁAD POTĘGOWY

Zmienna losowa X ma rozkład potęgowy z parametrem ( > 0), jeżeli jej

dystrybuanta F



(x) = P{X  x} wyraża się wzorem:

0 dla x < 0



(x) = x



dla 0  x  1

1 dla x > 1
G. Bankovi oraz A. Bekessy opracowali metody polegające na zastąpieniu

losowania według rozkładu jak wyżej z dowolnym parametrem 

kombinacją losowań z takich rozkładów z parametrem całkowitym.

Metoda pierwsza

Niech  będzie dowolną liczbą dodatnią. Dla każdego  > 0 można znaleźć taki ciąg

liczb całkowitych 1  a

 a

 ... a

, żeby liczba

 =



j = 1

różniła się od  o nie mniej niż . Zamiast generować zmienną o rozkładzie

potęgowym z parametrem  generujemy zmienną losową o rozkładzie z parametrem
. Można pokazać, że jeżeli R

, R

, ..., R

są zmiennymi losowymi niezależnymi o

rozkładzie równomiernym na przedziale (0, 1), to zmienna losowa X określona

wzorem:

X = max{R

, R

, ..., R

}

ma rozkład potęgowy z parametrem .

Metoda druga

Otrzymujemy następujący algorytm generowania zmiennej losowej:

1. Wygenerować zmienną losową R o rozkładzie równomiernym na

przedziale (0, 1)

2. Jeżeli R  1 - , wykonać obliczenia według punktu 3. W

przypadku przeciwnym – według punktu 4.

3. Wygenerować zmienną losową X według rozkładu potęgowego z

dystrybuantą F



(x) = x



; koniec obliczeń.

4. Wygenerować zmienną losową X

zgodnie z rozkładem

potęgowym o dystrybuancie F



(x) = x



oraz zmienną losową X

zgodnie z rozkładem o dystrybuancie F



(x) = x



5. Obliczyć X = X

; koniec obliczeń.

Metoda trzecia

Otrzymujemy następujący algorytm generowania zmiennej losowej:

1. Wylosować liczbę R zgodnie z rozkładem równomiernym na przedziale (0, 1)

i znaleźć takie k, że:

k-1

 

 

 R < 

i=1

 

2. Wylosować k + 1 liczb R

, R

, ..., R

i obliczyć:

X = (R

... R

)

1/

ROZKŁAD BETA

Zmienna losowa X ma rozkład beta z parametrami (, ), jeżeli gęstość jej rozkładu

prawdopodobieństwa wyraża się wzorem:
1
f(x) = x

-1

(1 – x)

-1

dla 0  x  1

B(, )

0 dla x < 0 lub x > 1

przy czym  > 0,  > 0, B(, ) = ()()/( +), () jest funkcją gamma.

Metoda pierwsza

Algorytm generowania zmiennej losowej beta z całkowitymi parametrami (, ):

1. Wygenerować  +  - 1 niezależnych zmiennych losowych R

, R

, ..., R

+-1

o jednakowym rozkładzie równomiernym na przedziale (0, 1).

2. Uporządkować wygenerowane wartości w ciąg niemalejący.

3. Wyznaczyć -tą liczbę z tego ciągu i przyjąć ją za wygenerowaną wartość

zmiennej losowej X.

Metoda druga

Algorytm generowania zmiennej losowej X o rozkładzie beta z całkowitymi

parametrami (, ):

1. Wygenerować dwie niezależne zmienne losowe U i V, jedną o rozkładzie

potęgowym F



(x) i drugą o rozkładzie potęgowym F

-1

(x).

2. Jeżeli U + V > 1, powtórzyć generowanie według punktu 1. W przypadku

przeciwnym przyjąć X = U.

ROZKŁAD GAMMA

Zmienna losowa X ma rozkład gamma z parametrem , jeżeli gęstość jej rozkładu

prawdopodobieństwa wyraża się wzorem:
1
f(x) = x

-1

-x

dla x > 0

()

0 dla x  0

gdzie  > 0 oraz () jest funkcją gamma

() =





-1

-x

Zmienna losowa o rozkładzie gamma

z całkowitym parametrem λ

Aby otrzymać zmienną losową o rozkładzie gamma z całkowitym parametrem ,

wystarczy wygenerować  niezależnych zmiennych losowych R

, R

, ..., R



o rozkładzie równomiernym na przedziale (0, 1) i wykonać obliczenia według
wzoru:



X = ln  Ri 

i=1

Zmienna losowa o rozkładzie gamma

z całkowitym parametrem λ

Zmienną losową X o rozkładzie gamma przedstawimy w postaci:

X = X

+ X

Gdzie X

ma rozkład gamma z parametrem n = [], X

ma rozkład gamma

z parametrem równym jedności, X3 ma rozkład beta z parametrami (, 1-),

gdzie  = -[] jest liczbą z przedziału (0, 1).

ROZKŁADY RAYLEIGHA

I RICE`A

Zmienna losowa X ma rozkład Rice`a, jeżeli gęstość jej rozkładu
prawdopodobieństwa wyraża się wzorem:

x x

+ 

x

f(x) = exp (- ) I

( ) dla x > 0



2



0 dla x  0

Funkcja I

(x) jest zmodyfikowaną funkcją Bessela pierwszego rodzaju stopnia

zerowego
1

2



1 x

(x) =  e

x cost

dt =  ( )

2

0 k = 0

(k!)

W przypadku szczególnym  = 0 otrzymujemy rozkład Rayleigha o gęstości:

y y

g(y) = exp( – ) dla y > 0


2

0 dla y  0

Generowanie zmiennej losowej

o rozkładzie Rice`a

Dla generowania zmiennej losowej o rozkładzie Rice`a można skorzystać z faktu, że
jeżeli zmienna losowa Y ma rozkład Rayleigha o gęstości g(x) oraz zmienna losowa
R ma rozkład równomierny na przedziale (0, 1) i jeżeli zmienne losowe Y i R są
niezależne, to zmienna losowa X określona wzorem:

X =  Y

+ 

– 2Y cos2R

ma rozkład Rice`a o gęstości f(x).

Zastosowanie metody odwrócenia

dystrybuanty

Stosując metodę odwracania dystrybuanty otrzymujemy następujący algorytm:

1. Wygenerować zmienną losową R o rozkładzie równomiernym na przedziale

(0, 1).

2. Obliczyć X = - ln(- lnR).

Korzystając z faktu, że –lnR ma rozkład wykładniczy z dystrybuantą 1– e

-x

, możemy

ten algorytm zmodyfikować:

1. Wygenerować zmienną losową W o rozkładzie wykładniczym z wartością

oczekiwaną równą jedności.

2. Obliczyć X = - lnW

ROZKŁAD WEIBULLA

Zmienna losowa X ma rozkład Weibulla z parametrami (, ), jeżeli gęstość jej

rozkładu prawdopodobieństwa wyraża się wzorem:

x

-1

exp(-x



) dla x > 0

f(x) =
0 dla x  0

gdzie  > 0,  > 0 są stałymi. Dystrybuanta tego rozkładu jest następująca:

F(x) = 1 – exp(-x



), x >0

Metoda pierwsza

Metoda pierwsza opiera się na twierdzeniu, że jeżeli zmienna losowa Y ma rozkład

wykładniczy z dystrybuantą G(y) = 1 – e

-y

, to zmienna losowa X = CY

1/,

gdzie

C = 

-1/

, ma rozkład Weibulla z parametrami (, ).

Zastosowanie tej metody prowadzi do algorytmu:
wygenerować zmienną losową Y o rozkładzie wykładniczym i obliczyć:

X = (Y/)

1/

Metoda druga

Metoda ta prowadzi do algorytmu:

1. Wygenerować zmienną losową N według rozkładu dyskretnego określonego

wzorem:

P{N = k} = 1/e



- 1  

/k!, k = 1, 2, ...

2. Wygenerować N niezależnych zmiennych losowych Z

, Z

, ..., Z

o rozkładzie

potęgowym z parametrem .

3. Wykonać obliczenia według wzoru:

X = Cmin {Z

, Z

, ..., Z

}

Gdzie Cmin = (/)

1/

,  > 0, ma ucięty rozkład Weibulla

ROZKŁAD FRÉCHETA

Zmienna losowa X ma rozkład Frecheta, jeżeli jej dystrybuanta wyraża się wzorem:

F(x) = exp(-x

-

), x > 0,  > 0

Odwracając dystrybuantę otrzymujemy dla zmiennej losowej X wyrażenie:

X = (-lnR)

-1/

w którym R jest zmienną losową o rozkładzie równomiernym na przedziale (0, 1).
Ponieważ zmienna losowa W = -lnR ma rozkład wykładniczy z dystrybuantą 1 – e

-x

otrzymujemy wzór:

X = W

-1/

TESTY ZWIĄZANE Z

MOMENTAMI

Standardowe postępowanie przy weryfikowaniu hipotezy H: (EX

= ½) w stosunku

do hipotezy alternatywnej K: (EX

 ½) jest następujące.

Dla ustalonego poziomu istotności  znajdujemy takie liczby x



oraz x



, żeby

P{X

 x



} = P{X

 > x



} = /2

Przy czym prawdopodobieństwa te obliczono przy założeniu, że hipoteza H jest

prawdziwa. Obliczenie liczby x



wymaga rozwiązania równania, którego jedną

stroną jest F

(x), drugą zaś liczba /2; analogicznie zaś obliczenie liczby x



wymaga rozwiązania takiego równania z liczbą 1- po prawej stronie.

Jeżeli takie liczby zostaną obliczone, to weryfikacja hipotezy sprowadza się do
porównania zaobserwowanej wartości zmiennej losowej X

z tymi liczbami;

zdarzenie X

< x



oraz zdarzenie X

> x



prowadzą do odrzucenia weryfikowanej

hipotezy.

TEST CHI-KWADRAT

ZGODNOŚCI ROZKŁADY (TEST

CZĘSTOŚCI)

Niech zmienna losowa  ma rozkład o dystrybuancie F takiej, że F(a) = 0 oraz

F(b) = 1. Niech a

= a < a

< a

< ... a

= b oraz p

= P{a

i-1

<   a

}, i = 1,2, ...,.

Rozważmy ciąg 

, 

, ..., 

liczb losowych z pewnego generatora liczb losowych

o rozkładzie z dystrybuantą F. Niech n

będzie liczbą takich elementów  tego

ciągu, które spełniają warunek: a

i-1

<   a

. Statystyka

– Np

)



k-1

=  = =  - N

i=1

ma w przybliżeniu rozkład chi-kwadrat o (k-1) stopniach swobody. Jeżeli N jest
dostatecznie duże, to statystyka ta służy do weryfikacji hipotezy o rozkładzie

zmiennej losowej  za pomocą tzw. testu chi-kwadrat

TEST ZGODNOŚCI ROZKŁADU

PAR

Test par konstruujemy w następujący sposób.
Niech n

będzie liczbą takich elementów X w ciągu X

, X

, ..., X

, które spełniają

warunek: a

i-1

< X  a

. Obliczamy wartość statystyki 

według wzoru:

N N



=  ( n

- )

i=1

k k

Konstruujemy ciąg par (X

, X

), (X

, X

), ..., (X

N-1

, X

). Niech n

będzie liczbą takich

par (X, Y) w tym ciągu, które spełniają warunek: a

i-1

< X  a

oraz b

j-1

< Y  b

Obliczamy wartość statystyki 

zgodnie ze wzorem:

k k

N -1 N-1



=   ( n

- )

i=1 j=1

Weryfikowaną hipotezę odrzucamy na poziomie istotności równym ,

gdy 

-

> 

- k, ),

gdzie 

(, ) oznacza wartość krytyczną rozkładu chi-kwarat o  stopniach

swobody.

TESTY SERII

Teoria weryfikowania hipotezy o niezależności zmiennych X

, X

, ..., X

oparta na

liczbie R serii jest następująca: należy – dla ustalonego poziomu istotności
 - znaleźć takie dwie liczby krytyczne R

oraz R

, żeby

P{R < R

} = P{R > R

} = /2

Jeżeli zaobserwowana liczba serii jest mniejsza od R

lub większa od R

weryfikowaną hipotezę odrzucamy.

TESTY ZGODNOŚCI

ROZKŁADÓW

Jeżeli X

, X

, ... jest ciągiem liczb niezależnych zmiennych losowych o rozkładzie

równomiernym na przedziale (0, 1), to ciąg (X

, X

, ..., X

), (X

m+1

, X

m+2

, ..., X

),...

jest ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie
równomiernym na m-wymiarowej kostce jednostkowej (0, 1)

. Niech

y = h( x

, x

, ..., x

)

będzie funkcją m zmiennych, określoną na kostce jednostkowej (0, 1)

Przekształcając ciąg (X

, X

, ..., X

), (X

m+1

, X

m+2

, ..., X

),... według tej funkcji

otrzymujemy nowy ciąg Y

= h(X

(j-1)m+1

, X

(j-1)m+2

, ..., X

), j = 1, 2,... Jest to ciąg

niezależnych zmiennych losowych o jednakowym rozkładzie.

Niech G będzie dystrybuantą rozkładu tych zmiennych losowych

G(y) = P{Y

 y}

Gdy zmienne losowe X

, X

, ... są niezależne i mają jednakowy rozkład

równomierny na przedziale (0, 1). Testowanie generatora na podstawie funkcji

y = h( x

, x

, ..., x

)

przeprowadza się w następujący sposób: obserwuje się ciąg zmiennych losowych
X

, X

, ... i przekształca go na ciąg zmiennych losowych Y

, Y

, .... Dla ciągu

, Y

,... weryfikuje się hipotezę, że jest on próbką prostą z populacji

o dystrybuancie G. Odrzucenie tej hipotezy prowadzi do dyskwalifikacji generatora
liczb losowych X

, X

,...

TESTY KOMBINATORYCZNE

Test pokerowy

Niech X

, X

, ... będzie ciągiem liczb z pewnego generatora liczb losowych

o rozkładzie z dystrybuantą F . Podzielmy zbiór wartości zmiennych losowych X na
k rozłącznych „jednakowo prawdopodobnych” przedziałów za pomocą punktów
a

< a

< ... < a

k-1

. Jeżeli zmienne losowe X

mają rzeczywiście rozkład

z dystrybuantą F, to dla każdego przedziału (a

i-1

, a

)

P{a

i-1

< X

 a

} = 1/k

Utwórzmy nowy ciąg zmiennych losowych Y

zdefiniowanych wzorem:

= i jeżeli X

 (a

, a

i+1

), i = 0, 1, ..., k-1

Zmienne losowe Y

przyjmują więc tylko wartości 0, 1, 2, ..., k-1, każdą

z jednakowym prawdopodobieństwem.

Podzielmy ciąg Y

, Y

, ... na piątki (Y

, Y

, ..., Y

), (Y

, Y

, ..., Y

),.... Ten nowy ciąg

zbudowany jest z k

różnych piątek. Będziemy wyróżniali następujące typy piątek:

abcde (bust – każda liczba w piątce jest inna);
aabcd (para – w piątce są dwie liczby jednakowe, wszystkie pozostałe są

różne);

aabbc (dwie pary);
aaabc (trójka);
aaabb (full);
aaaab (czwórka);
aaaaa (piątka).

Zgodność rozkładu piątek różnych typów sprawdza się za pomocą zwykłego testu
chi-kwadrat.

Test kolekcjonera

Utwórzmy ciąg Y

, Y

, ... tak jak w teście pokerowym. Będziemy obserwowali ten

ciąg dopóki nie pojawią się w nim wszystkie k cyfry 0, 1, 2, ..., k-1. Niech r będzie
długością zaobserwowanego odcinka ciągu. Można udowodnić, że zmienna losowa
r ma rozkład prawdopodobieństwa określony wzorem:

k-2

=  (-1)

(

k-1

)(k – 1 – j )

r-1

, r = k, k + 1, ...

r-1 j=0 j

Zgodność

tego

rozkładu

prawdopodobieństwa

rozkładem

zaobserwowanym bada się za pomocą standardowego testu chi-kwadrat

Test permutacji

Niech X

, X

, ... będzie ciągiem niezależnych zmiennych losowych o jednakowym

rozkładzie równomiernym na przedziale (0, 1) i rozpatrzymy ciąg (X

, X

, ..., X

m+1

, X

m+2

, ..., X

),.... Przekształćmy każdy z punktów

(j-1)m+1

, X

(j-1)m+2

, ...X

), j= 1, 2, ..., przypisując każdej współrzędnej X

numer n

jaki ona zajmuje w ciągu liczb X

(j-1)m+1

, X

(j-1)m+2

, ...X

po jego uporządkowaniu

w ciąg rosnący.
Jeżeli ciąg X

, X

, ... jest ciągiem niezależnych zmiennych losowych, to każda

permutacja (n

, n

, ..., n

) liczb (1, 2, ...,

) jest jednakowo prawdopodobna.

Testem zgodności chi-kwadrat weryfikuje się hipotezę, że tak jest rzeczywiście.

Document Outline