Liczby losowe madd03

background image

Metody Analizy

Danych

Doświadczalnych

Wykład 3

”Liczby losowe"

background image

Program na dziś

Liczby losowe i pseudolosowe;

Tablice liczb losowych;

Generatory liczb losowych: rozkład

równomierny;

Generatory liczb losowych: inne

rozkłady;

Testy na losowość

background image

Liczby losowe i

pseudolosowe

Zasadniczą cechą liczb losowych
jest to, że znajomość liczb
występujących w przeszłości nie
wpływa na skuteczność
przewidywania liczb przyszłych,
czyli prawdopodobieństwo
uzyskania określonej liczby przy
kolejnej próbie nie ulega
zmianom

, zdarzenia są zatem

niezależne.

Zazwyczaj liczby losowe są generowane
przez komputer na podstawie pewnego
wzoru matematycznego, realizowanego
rekurencyjnie z wykorzystaniem
poprzednich wyników. Dla zadanej
wartości początkowej, generator
zawsze wytworzy ten sam ciąg liczb
losowych. Znając ten ciąg, można
dokładnie przewidzieć liczbę następną.
To samo odnosi się również do
opublikowanych tablic liczb losowych,
bowiem jeśli osoba losująca zna tablice
to liczby zawarte w nich przestają być
losowe.

Liczby losowe, których

dokładny wykaz można poznać, noszą
nazwę liczb pseudolosowych.

background image

Tablice liczb

losowych

Pierwszą tablicę liczb losowych wydał w
roku 1927 L. H. Tippett pod tytułem
„Random Sampling Numbers". Zawierała
ona 41600 cyfr (od 0 do 9) pobranych z
danych ze spisu powszechnego w Wielkiej
Brytanii. Cyfry te uzyskano z liczb
wyrażających powierzchnie parafii, po
odrzuceniu dwóch pierwszych i dwóch
ostatnich cyfr z każdej liczby.
W 1939 R. A. Fisher i F. Yates podali tablicę
15000 cyfr losowych, uzyskaną przez
wypisanie cyfr od 15. do 19. z pewnych 20-
cyfrowych tablic logarytmicznych. W tym
samym roku Kendall, Babington i Smith
przedstawili tablicę 100000 cyfr losowo
uzyskanych za pomocą „elektrycznej
ruletki", czyli wirującego dysku z
oznaczeniami cyfr 0; 1; . . .; 9, obserwując w
przypadkowych chwilach wybrany sektor
ruletki.

Tablice liczb losowych miały ograniczoną
długość i zawierały tylko jeden ciąg takich
liczb. W celu przedłużenia ich żywotności
(nie można było stale wykorzystywać tych
samych liczb, bo to przeczyłoby idei
losowości) opracowywano algorytmy
wytwarzania ciągów losowych na
podstawie tablic. Oto taki przykładowy
algorytm dla tablic zawierających
pięciocyfrowe liczby:
1. Wybrać losowo liczbę pięciocyfrową z
tablicy.
2. Zredukować pierwszą cyfrę tej liczby
modulo 2, tak zmodyfikowana liczba
pięciocyfrowa wskaże numer wiersza w
tablicy.
3. Zredukować dwucyfrową końcówkę tej
liczby modulo 50. Tak otrzymana liczba
dwucyfrowa wskaże numer kolumny w
tablicy.
4. Rozpocząć ciąg losowy od wskazanej
pozycji w tablicy.

background image

Generatory liczb

losowych

Podstawowymi generatorami liczb
losowych są generatory fizyczne,
takie jak moneta, urna o
odpowiedniej zawartości, kostka do
gry lub generatory wykorzystujące
losowy przebieg zjawisk fizycznych
(rozpady promieniotwórcze,
termiczny szum w
półprzewodnikach).

Standardowym modelem
liczb losowych jest
jednostajny rozkład
prawdopodobieństwa.
Wygodnie jest generować
liczby losowe z przedziału
<0, 1>, bowiem liczby z tego
przedziału można wygodnie i
prosto przekształcić na
elementy dowolnego
przedziału. Natomiast
generowanie liczb losowych o
innych rozkładach sprowadza
się do wykonania
odpowiednich rachunków na
liczbach o rozkładzie
równomiernym.

background image

Generatory o

rozkładzie

równomiernym

Do najbardziej rozpowszechnionych
metod otrzymywania rozkładów
równomiernych należą metody
kongruentne, dzielące się na dwie
klasy: metody multiplikatywne
generowania liczb pseudolosowych i
metody addytywno-multiplikatywne
(mieszane) oraz generatory
Fibonacciego.

W

metodach mieszanych

generowanie liczb x

i

mniejszych niż dany dodatni moduł m
poczynając od dowolnej nieujemnej liczby x

0

< m

polega na obliczaniu kolejnych wartości
wyrażenia:

x

i

= [ ax

i-1

+ c] mod m

gdzie i = 1, 2, 3, ..., zaś stałe spełniają warunki:
0 < a < m, 0  c < m. Stała m najczęściej

oznacza zakres liczb całkowitych, które mogą
być reprezentowane w słowie maszynowym o
długości b bitów (m = 2

b

). Generator ten jest

generatorem okresowym, przy czym pełny okres
równy m mamy wtedy, gdy:

• c jest liczbą pierwszą względem m;

• a = k p + 1 dla każdego czynnika pierwszego
p liczby m (k jest dowolną liczbą całkowitą);

• a = k p + 4, jeżeli 4 jest dzielnikiem liczby m.

Multiplikatywnym generatorem
kongruentnym

nazywamy generator:

x

i

= ax

i-1

mod m

Generator ten jest także generatorem okresowym,
maksymalny jego okres jest równy 2 . Generator
multiplikatywny osiąga ten okres, gdy x

0

jest

liczbą nieparzystą oraz gdy c = k 8 + 3 lub c =
k 8 + 5 dla dowolnego całkowitego k.

Istnieją też

generatory addytywne

(nazywane też uogólnionymi generatorami
Fibonacciego), o ogólnej postaci:
x

i+1

= [a

0

x

i

+ a

1

x

i-1

+...+a

k

x

n-k

+b] mod m

gdzie a

i

są zawsze równe zeru lub jedności,

najprostsze generatory Fibonacciego
korzystają z zależności:
x

i+1

= [x

i

+ x

i-1

] mod m

Generatory te dobrze spełniają testy
równomierności rozkładu, gorzej
natomiast spełniają testy niezależności.
Duża ich atrakcyjność polega na szybkości
działania takich generatorów.

Kwadratowy generator kongruencyjny

jest stosowany w celu uniknięcia
liniowej zależności pomiędzy kolejnymi
liczbami

:

x

i+1

= [a

0

x

i

2

+ a

1

x

i

+b] mod m

okres tego generatora dla odpowiednio
dobranych parametrów może być równy
m.

background image

Generatory o

rozkładzie

nierównomierny

m

Jeżeli znamy funkcję gęstości rozkładu,

możemy zastosować

metodę eliminacji

(Neumanna)

, polegającą na:

1°. wygenerowaniu liczby losowej z

1

o

rozkładzie jednostajnym z przedziału <x

p

,x

k

>;

2°. wygenerowaniu liczby losowej z

2

o

rozkładzie jednostajnym z przedziału <0,y>;

3°. sprawdzeniu czy z

2

 f(z

1

). Jeżeli warunek

jest spełniony liczba z

1

jest liczbą losową o

wymaganym rozkładzie (jeżeli nie - wracamy
do punktu 1°).

Metoda

superpozycji rozkładów

:

Jeżeli g

y

(x) jest gęstością pewnego

rozkładu prawdopodobieństwa
zależna od pewnego parametru y
będącego zmienną losową o
gęstości h a gęstość rozkładu
zmiennej losowej który chcemy
wygenerować jest równa:

wówczas:
1°. generujemy liczbę losową y
zgodnie z rozkładem o gęstości h;
2°. generujemy liczbę losową x
zgodnie z rozkładem o gęstości g

y

z

parametrem y wylosowanym w
punkcie 1°.

 

   

dy

y

h

x

g

x

f

y



Natomiast gdy znamy dystrybuantę h(x)
generowanego rozkładu możemy
zastosować

metodę odwracania

dystrybuanty

. W tym przypadku:

1°. generujemy liczbę losową z

1

o

rozkładzie jednostajnym z przedziału <x

p

,x

k

>;

2°. obliczamy liczbę losową x na podstawie
wzoru:

przy czym x

p

 x

i

 z  x

i+1

< x

k

, natomiast

dystrybuanta jest reprezentowana przez
tablicę swych wartości w punktach x

i

:

h(x

i

)  h(z)  h(x

i+1

)

    

   

i

i

i

i

i

p

x

h

x

h

x

h

z

h

x

x

x

x

1

1

background image

Testowanie

generatorów

1. Testy zgodności (weryfikacja adekwatności
rozkładu)
-testy związane z momentami
-test chi-kwadrat
-testy serii
2. Testy niezależności (testy losowości próbki)
-testy zgodności rozkładów wielowymiarowych
-testy autokorelacji
-testy kombinatoryczne (uporządkowania
próbki)
3. Testy arytmetyczne (weryfikacja
zagadnienia aperiodyczności)
4. Testy za pomocą zadań kontrolnych

background image

Testy na

losowość

Serie

składają się z następujących po sobie punktów

pomiarowych (liczb losowych), które w wyraźny
sposób ukazują tendencję do wzrostu lub malenia
wartości. Na wykresie będą one widoczne jako
dodatnio lub ujemnie nachylone zbocze. Ponieważ
wystąpienie ograniczonej ilości serii o niewielkiej
długości jest dopuszczalne w przypadku liczb
losowych, należy odróżnić te serie wynikłe z
fluktuacji prawdopodobieństwa od innych serii.
Aby określić, czy serie występujące w zbiorze
danych są losowe należy obliczyć wartość średnią
dla tego zbioru a następnie wszystkim wartościom
nie większym niż średnia przyporządkować znak

minus a pozostałym znak minus.

Serie

Ilość serii N

ob

jest równa liczbie zmian

znaku powiększonej o 1. Przewidywana
ilość serii w zbiorze n liczb losowych
dana jest zależnością:
N

sp

= 1/3 (2n-1)

zaś odchylenie standardowe dla liczby
serii jest równe:

Następnie obliczamy stosunek:

90

/

29

16 

n

S

s

N

N

r

sp

ob

Ogólnie możemy stwierdzić, że r > 2
wskazuje na niskie
prawdopodobieństwo wystąpienia
takiej ilości serii w zbiorze liczb
losowych, r > 3 oznacza tak niskie
prawdopodobieństwo wystąpienia
serii, równoważne wystąpieniu
elementu zakłócającego losowość
(błąd w generatorze). Szczegółowe
analizy w przypadku n > 19
wymagają zastosowania rozkładu chi-
kwadrat, zaś dla mniejszych zbiorów
liczb należy zastosować rozkład t
Studenta. Liczba stopni swobody jest
równa n - 1.

background image

Testy na

losowość

Aby zbadać, czy w zbiorze liczb losowych

występują jakieś

trendy

musimy określić

nachylenie i odchylenie standardowe dla tego
zbioru. W tym celu metodą najmniejszych
kwadratów

prowadzimy

przez

punkty

odpowiadające tym liczbom prostą o nachyleniu
a. Następnie obliczamy stosunek:

i porównujemy z wartościami rozkładu t

Studenta dla (n - 2) stopni swobody (n oznacza
liczbę punktów). Znak stosunku określa nam z
jakim trendem mamy do czynienia.

Trendy i nachylenia

2

a

t

background image

Testy na

losowość

Innym sposobem sprawdzenia poprawności działania

generatora liczb losowych jest policzenie Średniego
Kwadratu

Kolejnych

Różnic

(MSSD)

pomiędzy

kolejnymi n liczbami losowymi i podstawienie tych
różnic do wzoru:

oraz obliczenie wariancji 

2

tego zbioru liczb i

podzielenie przez nią parametru MSSD. Dla n
dążącego do nieskończoności stosunek MSSD/

dąży

do 2. Większe wartości stosunku oznaczają, że
generator liczb losowych źle działa. Dla wartości
mniejszych

porównujemy

otrzymaną

liczbę

z

wartościami krytycznymi przedstawionymi w tabeli
zamieszczonej w skrypcie.

MSSD

1

1

2

1

n

x

x

MSSD

n

i

i

i

background image

Testy na

losowość

Test graficzny polega na przedstawieniu na

wykresie zależności pomiędzy wylosowanymi
liczbami, w ten sposób, że pierwsza
wylosowana liczba będzie współrzędną x
pierwszego punktu, druga liczba współrzędną
y tego punktu, trzecia liczba będzie
współrzędną x drugiego punktu, czwarta
współrzędną y tegoż, itd. Dla dobrego
generatora

równomiernego

otrzymujemy

kwadrat równomiernie pokryty punktami,
występowanie zagęszczeń punktów świadczy
o błędnym działaniu generatora.

Graficzny

background image

Koniec wykładu !

Literatura:

•R. Zieliński, Generatory liczb
losowych, WNT, Warszawa 1979.

•R. Wieczorkowski, R. Zieliński,
Komputerowe generatory liczb
losowych, WNT, Warszawa 1997.


Document Outline


Wyszukiwarka

Podobne podstrony:
Losowość i liczby losowe praca na seminarium, Wykłady rachunkowość bankowość
Liczby losowe
Liczby losowe, a kryptografia referat
Losowe liczby z dowolnego przedziału, excel
04 Liczby ujemne i ułamki w systemie binarnym
01Zmienne losowe dyskretneid 3335 ppt
FiR Zmienne losowe1
liczby wymierne
liczby rzymskie
liczbynaturalneII
Liczby zmiennoprzecinkowe
F 13 Liczby zespolone
MPiS cw 04 zmienne losowe
Liczby zesp razem
(eBook PL,matura, kompedium, nauka ) Matematyka liczby i zbiory maturalne kompedium fragmid 1287
liczby zespolone 6 id 267992 Nieznany
1 Liczby Zespolone

więcej podobnych podstron