Gdy rządzi przypadek...
Do czego może się przydać znajomość rachunku
prawdopodobieństwa?
Okazuje się, że pozwala on
fiskusowi łapać nieuczciwych podatników, pomaga
w łamaniu szyfrów, przydaje się grającym w lotto,
a także znajduje zastosowanie przy szyciu ubrań.
CENTRUM NAUKI
KOPERNIK
Eksper
ymentuj!
D
ziwna deska z kołkami i przegród-
kami, którą można obejrzeć na
wystawie, zwana jest tablicą Galtona.
Pozwala ona eksperymentalnie poka-
zać, na czym polega tak zwany roz-
kład zmiennej losowej – jedno z naj-
ważniejszych narzędzi współczesnej
statystyki.
Pojęcie zmiennej losowej pojawiło się
w matematyce w XVIII wieku za spra-
wą Blaisa Pascala i Pierre’a de Ferma-
ta, którzy usiłowali w matematyczne
ramy ująć to, co na pierwszy rzut oka
uchwycić się w te ramy nie da, czyli gry
losowe, takie jak kości czy ruletka.
Matematycy nie są w stanie odpo-
wiedzieć na pytanie, jakie padną licz-
by w najbliższym losowaniu Dużego
Lotka, mogą jednak zaprojektować
biznesowe podstawy gry losowej. Taka
gra nie może być zbyt trudna, by raz
na kilka losowań ktoś mógł wygrać,
i nie może być zbyt prosta, by nagroda
pieniężna za wylosowanie szóstki była
wystarczająco atrakcyjna.
Z czasem matematycy rozwinęli
ogromny aparat do badania zjawisk,
w których rządzi przypadek.
Tablica Galtona jest sposobem na
pokazanie pewnego eksperymentu
losowego. Kulka wrzucona na samej
górze spada na pierwszy kołek i z jed-
nakowym prawdopodobieństwem
może polecieć w lewo albo w pra-
wo. Piętro niżej jest tak samo i tak
dalej aż do przegródki na samym dole.
która każdemu numerowi przegródki
przyporządkowuje prawdopodobień-
stwo wpadnięcia do niej kulki, nazywa-
my rozkładem prawdopodobieństwa.
Łatwo zauważyć, że jeśli wrzucimy do
lejka na górze deski odpowiednio dużo
kulek, to w przegródkach zaczną się
one układać w krzywą przypominającą
dzwon. Dotykamy tu najważniejszego
twierdzenia rachunku prawdopodo-
bieństwa, zwanego centralnym twier-
dzeniem granicznym. Twierdzenie ma
kilka szczegółowych założeń i nie warto
przytaczać go w całości, ale można je
streścić w następujący sposób: w więk-
szości przypadków suma zmiennych
losowych jest zmienną losową o roz-
kładzie przypominającym dzwon.
Krzywa dzwonowa ma swoją nazwę
– mówimy o niej, że jest albo „roz-
kładem normalnym”, albo „krzywą
Gaussa”. Mówimy o niej „normalna”,
opisuje bowiem większość zjawisk loso-
wych spotykanych w codziennym życiu,
takich jak np. odchylenie od średniego
wzrostu, błąd pomiaru, wyniki głoso-
wania w wyborach, rozkład punktacji
z testów egzaminacyjnych itp.
Nazwisko Gaussa związane jest
z tym rozkładem dlatego, że ten wielki
niemiecki matematyk bardzo przyczy-
nił się do zrozumienia mechanizmów
rządzących rozkładem normalnym,
choć nie on go odkrył.
Eksperyment przypomina wielokrot-
ny rzut monetą – jak wypadnie resz-
ka, kierujemy kulkę w lewo, jak orzeł
– w prawo.
Wystarczy wrzucić kilka kulek do lej-
ka na górze, by zorientować się, że nie
wszystkie przegródki na dole zapełniają
się w jednakowym tempie. To logiczne,
bo do skrajnych przegródek prowadzi
mniej dróg dojścia niż do środkowych.
Prawdopodobieństwo trafienia kulki do
danej przegródki opisane jest przez tak
zwany schemat Bernoulliego, bardzo
często spotykany w szkole na wszelkich
klasówkach i sprawdzianach z rachun-
ku prawdopodobieństwa.
Jeśli ponumerujemy przegródki na
dole tablicy Galtona, to możemy mó-
wić, że numer przegródki, do której tra-
fi kulka, jest zmienną losową. Funkcję,
Rozkład normalny jest jednym z najważniejszych rozkładów statystycznych,
ponieważ opisuje wiele zjawisk, które spotykamy w naturze. Podlega mu wiele cech
fizjologicznych, np. wzrost uczniów w danej szkole lub masa ich ciała
Podstawowym rozkładem zmiennych
losowych jest rozkład normalny zwany
też rozkładem Gaussa. Ilustruje on
zjawiska, które cechuje przypadkowość
Fot. Corbis, East News, archiwum x2; rys. Małgorzata Świentczak
Szkic wykonany
przez Galtona
w 1889 roku
pokazuje
tablicę,
nazwaną od
jego nazwiska
tablicą Galtona.
Miała ona
zilustrować, jaki
wpływ na
mierzoną
wielkość mają
losowe
zdarzenia, które
z jednakowym
prawdopodo-
bieństwem
zwiększają
i zmniejszają
wyniki pomiaru
Trochę teorii
Eksper
ymentuj!
R
ozkłady prawdopodobieństwa sto-
sowane są we wszelkiego rodzaju
badaniach statystycznych. Na przykład
wzrost ludzi w określonej populacji
(np. dorosłych mężczyzn mieszkają-
cych w Polsce) układa się według roz-
kładu normalnego. Gdyby producenci
ubrań robili tyle samo garniturów na
każdy wzrost, w magazynach zosta-
wałoby im mnóstwo ubrań uszytych
na wyjątkowo wysokich ludzi i wyjąt-
kowo niskich. Dzięki rozkładowi nor-
malnemu łatwo oszacować, ile trzeba
zrobić sztuk w każdym rozmiarze przy
założeniu, że chcemy wyproduko-
wać, dajmy na to, 10 tys. garniturów.
W ten sposób każdy, kto wchodzi do
sklepu, ma szansę dobrać ubranie na
swój wzrost, a producenci nie muszą
wydawać niepotrzebnie pieniędzy na
to, co sprzedaje się słabo.
D
zieło „O grze w kości” Gerolama
Cardano (1501-1576) było pierwszą
znaną pracą poświęconą rachunkowi
prawdopodobieństwa.
Później tym samym zagadnieniem
zajmowali się w XVII wieku Pierre de Fer-
mat, Blaise Pascal i Christiaan Huygens.
Jednak dopiero w XVIII wieku Jakob Ber-
noulli i Abraham de Movire zaczęli trak-
tować rachunek prawdopodobieństwa
jako gałąź matematyki. Ponieważ na
początku głównie chodziło o opisanie
zasad rządzących grami hazardowymi,
wszystkie ówczesne prace skupiały się
na rozkładach dyskretnych, to znaczy
takich, w których liczba losowań jest
skończona (albo przeliczalna).
W XVIII wieku za sprawą Rogera Co-
tesa zaczęto stosować rachunek praw-
dopodobieństwa do szacowania błędów
pomiarowych, co było później rozwijane
przez Pierre’a-Simona Laplace’a, który ja-
ko pierwszy zaczął przedstawiać rozkład
błędu pomiarowego jako krzywą. To
właśnie jego teorię później wyszlifował
Carl Friedrich Gauss (1777-1855) i dziś
opis rozkładu normalnego jest często
zwany rozkładem Gaussa.
W trakcie badań nad geograficznymi
danymi pomiarowymi Gauss zauważył,
że część wyników odbiega od pewnej
średniej wartości. Na każdy wynik pomia-
rów odległości wpływało mnóstwo czyn-
ników, takich choćby jak temperatura po-
wietrza w danym dniu. Gauss stwierdził,
że pewne odchylenia są naturalne i nie
trzeba się nimi przejmować. Wcześniej
wielu naukowców tego nie wiedziało,
więc w ich pracach, w których dowodzą
eksperymentalnie swoich tez, możemy
znaleźć wyniki pomiarów, w których błąd
nie ma rozkładu Gaussa. Wprawdzie są
takie zjawiska, w których błąd pomiaru
rzeczywiście ma niegaussowski rozkład,
ale w większości wypadków dane eks-
perymentalne były po prostu delikatnie
fałszowane – uczeni wyrzucali wyniki ich
zdaniem sprzeczne z dowodzoną tezą.
W XX wieku probabilistyka wkroczyła
w nowe rejony, okazało się bowiem, że
nowa gałąź fizyki – fizyka kwantowa
– rządzi się właśnie prawami rachun-
ku prawdopodobieństwa. Wiele wła-
ściwości materii opisywanych jest jako
prawdopodobieństwo wystąpienia sumy
stanów kwantowych poszczególnych
cząsteczek elementarnych.
Znajomość rachunku prawdopodobieństwa przydaje się w wielu praktycznych
sytuacjach, np. w prowadzeniu interesów. Producenci ubrań muszą brać pod uwagę,
ile sztuk odzieży w konkretnym rozmiarze ma szanse znaleźć nabywców
Zasługę odkrycia rozkładu normalnego przypisuje się Carlowi Friedrichowi Gaussowi.
Podobizna tego wielkiego matematyka nazywanego przez sobie współczesnych
księciem matematyków widniała na dziesięciomarkowym banknocie
O historii
Współczesne zastosowania
W internecie
E
merytowany dziś profesor matema-
tyki Teodor Hill z Atlanty przepro-
wadził kiedyś ze studentami ekspery-
ment. Poprosił ich o wykonanie 200
rzutów monetą i zapisanie wyniku
losowania na kartce. Zasugerował też,
że jeśli komuś nie będzie się chciało
przeprowadzić losowania, może od-
dać kartkę z wymyślonymi wynikami.
Następnego dnia zebrał notatki i ku
zaskoczeniu studentów bez trudu
wskazał tych, którzy wpisali wyniki
z głowy. Na jakiej podstawie? Otóż
zazwyczaj wydaje się nam, że skoro
wypadł np. orzeł, to następna powin-
na wypaść reszka, żeby było bardziej
losowo. Unikamy więc ciągów orłów
lub reszek występujących po sobie
kilka razy z rzędu.
Tego typu wpadki mogą mieć po-
ważne konsekwencje dla osób, któ-
re próbują sfałszować np. zeznanie
podatkowe. Okazuje sie bowiem, że
częstość występowania określonych
cyfr na pierwszym miejscu w różnych
zbiorach danych nie jest jednakowa.
Prawidłowość tę matematycy nazy-
wają prawem Benforda i wystarczy
zastosować program komputerowy
opierający się na tym prawie, aby wy-
typować zeznania podatkowe, w które
wpisano dane wzięte z głowy.
1.
Poproś o pomoc w przeprowadze-
niu tego doświadczenia kilku kolegów
i koleżanek z klasy – niech każdy 20 ra-
zy rzuci monetą i zapisze, ile wypadło
orłów. Na tablicy narysuj tabelkę z licz-
bami od 0 do 20, po czym policz, ilu
uczniom wypadło 0 orłów, ilu 1, ilu
2 i tak dalej aż do 20. Dane z tabelki
można przedstawić w postaci wykresu,
gdzie na jednej osi będzie liczba or-
łów, na drugiej liczba uczniów, którzy
otrzymali dany wynik doświadczenia.
Jak wygląda wykres?
2.
Weź z kolektury Lotto 30 kuponów
Dużego Lotka i daj do wypełnienia 30
osobom. Zsumuj liczby zakreślone na
każdym kuponie i przedstaw otrzyma-
ne wyniki w formie wykresu jak w po-
przednim przypadku. Poproś kogoś,
Trójkąt Pascala
www.mathsisfun.com/pascals-
triangle.html
Interaktywna tablica Galtona
http://demonstrations.wolfram.com/
FlexibleGaltonBoard/
Prawo Benforda
http://mathworld.wolfram.com/
BenfordsLaw.html
Hazard i matematyka
http://serwisy.gazeta.pl/nauka
/1,34148,2476793.html
kto ma wystarczająco dużo cierpliwo-
ści, żeby wypełnił sam 30 kuponów,
zaznaczając, aby zrobił to losowo.
W tym przypadku sumy skreślonych
liczb prawdopodobnie nie ułożą się
w krzywą dzwonową. Dlaczego?
3.
Skreśl na kuponie Dużego Lotka
sześć dowolnych liczb i sześć liczb
w jednym rzędzie (pionowym lub po-
ziomym). Pokaż komuś, kto gra w Lot-
to, i spytaj, który układ ma większe
szanse na wylosowanie. Prawie nikt
z pytanych nie wskaże na liczby skre-
ślone w jednym rzędzie, choć z punktu
widzenia rachunku prawdopodobień-
stwa taki układ jest równie dobry jak
każdy inny. Ten sposób typowania
liczb ma jednak pewną zaletę – czy
potrafisz powiedzieć jaką?
W kryptologii jednym z najbezpiecz-
niejszych sposobów szyfrowania infor-
macji jest użycie tzw. klucza losowego
– czyli ciągu liczb losowych. W czasie
II wojny światowej Rosjanie wykorzy-
stywali ten sposób do szyfrowania
wiadomości. Tyle że do generowania
ksiąg kodowych wykorzystali litery
„losowo” wypisywane przez ludzi.
Niemcy dość szybko zorientowali się,
że klucze szyfrujące nie są w pełni
losowe – można było znaleźć w nich
pewne regularności wynikające z te-
go, że osoba pisząca „losowy” ciąg
znaków nie chciała używać liter, które
przed chwilą napisała, a co więcej,
pisząc na maszynie, nie chciała uży-
wać znaków ze środka klawiatury. To
pomogło w złamaniu pozornie bez-
piecznych szyfrów.
Nawet ciągi liczb otrzymywane za
pomocą komputera są liczbami pseu-
dolosowymi, gdyż są generowane
przez mikroprocesor według algo-
rytmu, którego punktem wyjścia jest
licznik cykli zegara od momentu uru-
chomienia mikroprocesora. Zakłada się
jednak, że moment startu programu
generującego liczby jest losowy, a poza
tym czas wykonywania zadania zależy
od czynników losowych – na przykład
liczby programów wykonywanych
przez mikroprocesor oprócz genera-
tora liczb losowych. Może się jednak
zdarzyć, że wyniki pracy takiego gene-
ratora będą bardzo powtarzalne.
W jaki sposób można więc znaleźć
prawdziwie losowy ciąg znaków.
W praktyce dobrym źródłem może
być na przykład zapis płci dzieci ro-
dzących się po kolei w jakimś szpitalu
w długim okresie.
Rozkład prawdopodobieństwa występo-
wania cyfr na pierwszym miejscu
w różnych zbiorach danych opisuje
prawo Benforda. Pozwala ono na wykry-
cie sfałszowanych zeznań podatkowych
Fot. Corbis, Centrum Nauki K
opernik
www.kopernik.org.pl
A to ciekawe
Więcej doświadczeń
CENTRUM NAUKI
KOPERNIK
Eksper
ymentuj!