Algorytm genetyczny – przykład
zastosowania
Zagadnienie magicznych kwadratów
Opis działania algorytmu
Zagadnienie magicznych kwadratów polega na wygenerowaniu kwadratu n×n, w
którym elementami są liczby 1, 2, ..., n
2
ułożone tak, by w każdej kolumnie, wierszu
i przekątnej suma wartości liczb była taka sama i wynosiła
1+n
2
2
· n.
8
1
6
3
5
7
4
9
2
Rysunek 1: Magiczny kwadrat dla n = 3.
Jest to zadanie łatwe jeżeli n jest stosunkowo małe. W przypadku dużych n za-
gadnienie jest trudne do rozwiązania. Jeżeli chcielibyśmy sprawdzić wszystkie moż-
liwości rozmieszczenie liczb w kwadracie to otrzymamy n
2
! różnych rozmieszczeń, a
to przy dużych n jest bardzo duża liczba.
Algorytm genetyczny wykorzystujący operatory krzyżowania
i mutacji
Do rozwiązania zagadnienia magicznych kwadratów wykorzystaliśmy algorytmy
genetyczne. Fenotypem w naszym zadaniu jest kwadrat o boku n z rozmieszczo-
nymi liczbami naturalnymi od 1 do n
2
. Rozmieszczenie liczb w kwadracie może być
dowolne, nam jednak chodzi o takie rozmieszczenie, dla którego suma elementów
każdego wiersza, kolumny i przekątnej będzie taka sama.
Algorytm przebiega w etapach:
1) losowanie osobników,
2) tworzenie potomstwa,
3) ocena otrzymanego potomstwa,
4) usuwanie powtarzających się chromosomów,
1
5) sortowanie populacji.
Pojedynczy genotyp (chromosom) wchodzący w skład populacji jest ciągiem
n
2
−elementowym o genach należących do zbioru {1, 2, ..., n
2
} (przy czym wartość
genu nie powtarza się - pojedynczy chromosom jest permutacją ciągu (1 2 ... n
2
).
Tworzenie potomstwa odbywa się przy wykorzystaniu operatorów genetycznych
mutacji i krzyżowania oraz dodatkowej operacji zamiany segmentów genów.
Krzyżowanie polega na wymianie segmentów genów między dwoma chromosoma-
mi. Mamy dwóch rodziców: rodzica 1 i rodzica 2. Aby skrzyżować dwa chromosomy
dokonujemy podzielenia każdego z nich na trzy segmenty w taki sposób aby segment
środkowy był jednakowej długości w obu chromosomach. Długość segmentu może
być jedną z wartości {1, 2, ...,
n
2
2
}. Tworzymy dwa nowe chromosomy takie same jak
rodzic 1 i rodzic 2. Nowe chromosomy będziemy modyfikować tak, aby wymienić
między nimi środkowe segmenty. Ponieważ geny nie są liczbami 0, 1 więc wymia-
na nie może być bezpośrednim zastąpieniem jednego segmentu drugim, ponieważ
otrzymane chromosomy zawierałyby powtórzone geny. Aby tego uniknąć stosujemy
zamianę elementów przeprowadzoną w sposób następujący. Modyfikujemy pierwsze-
go potomka. Sprawdzamy jaki gen znajduje się na pierwszym miejscu w środkowym
segmencie drugiego rodzica. Zamieniamy w pierwszym potomku gen o tej samej
wartości z genem znajdującym się na pierwszym miejscu w segmencie środkowym.
Tę samą procedurę powtarzamy dla wszystkich genów segmentu środkowego. W
analogiczny sposób modyfikujemy drugiego potomka. Przykład działania operatora
krzyżowania jest przedstawiony na rys. 2.
Para rodziców:
[1 3 5 k 8 6 4 2 k 7 9]
[4 k 5 6 8 1 k 2 3 9 7]
I iteracja:
[1 3 8 k 5 6 4 2 k 7 9]
[4 k 8 6 5 1 k 2 3 9 7]
II iteracja:
[1 3 8 k 5 6 4 2 k 7 9]
[4 k 8 6 5 1 k 2 3 9 7]
III iteracja:
[1 3 4 k 5 6 8 2 k 7 9]
[5 k 8 6 4 1 k 2 3 9 7]
Para potoków:
[2 3 4 k 5 6 8 1 k 7 9]
[5 k 8 6 4 2 k 1 3 9 7]
Rysunek 2: Przykład działania operatora krzyżowania dla n = 3.
Mutacja chromosomu to zamiana losowych dwóch genów miejscami. Taki spo-
sób mutacji wynika z wartości genów chromosomu. Ponieważ genami są różne liczby
naturalne, a nie wartości binarne, to nie ma możliwości zmiany wartości genu na
przeciwną. Ponieważ chromosom jest ciągiem n
2
liczb naturalnych, wiec mutacja
jest losową transpozycją.
Dodatkowo stosujemy operatory zamiany segmentów genów długości n odpowia-
dających kolumnom, wierszom lub przekątnym. Jest to na przykład zamiana miej-
scami dwóch wierszy, dwóch kolumn, wiersza i kolumny lub przekątnej z wierszem
czy kolumną. Omówione operatory genetyczne są stosowane w udziale procentowym:
− transpozycja
50%,
− krzyżowanie
30%,
− zamiany
20%.
Po wygenerowaniu potomstwa dokonujemy oceny potomków. Wykorzystując funk-
cję oceny tworzymy nową populację główną. Do populacji tej dołączane są te chro-
mosomy, dla których wartość funkcji oceny jest największa. Funkcja oceny przyjmu-
je wartości odpowiadające ilości kolumn, wierszy i przekątnych, dla których suma
2
wartości genów wynosi
1+n
2
2
· n. Maksymalną wartością funkcji oceny jest wartość
2n + 2 odpowiadająca wygenerowaniu chromosomu spełniającego warunki zadania,
tzn. chromosomu, któremu odpowiada kwadrat z jednakową sumą elementów w każ-
dym wierszu, kolumnie i na przekątnych.
Jeżeli nowowygenerowane chromosomy powtarzają się z chromosomami już ist-
niejącymi to je usuwamy.
Po utworzeniu nowej populacji dokonujemy sortowania chromosomów znajdują-
cych się w populacji w taki sposób, aby chromosomy były ułożone od największej
do najmniejszej wartości funkcji oceny. Do sortowania chromosomów używamy al-
gorytmu sortowania przez zliczanie. Jest to algorytm działający w czasie liniowym.
Program kończy działanie kiedy generuje chromosom, dla którego funkcja oceny
wynosi 2n + 2. Jeżeli funkcja oceny nie osiągnie takiej wartości, wówczas program
kończy działanie po wykonaniu maksymalnej ilości iteracji. Maksymalna ilość itera-
cji test ustalona w opcjach programu. W momencie wykonania maksymalnej ilości
iteracji następuje sprawdzenie wartości funkcji oceny w ostatnich iteracjach (w po-
łowie maksymalnej liczby iteracji). Jeżeli wzrastała wartość funkcji oceny wraz ze
wzrostem ilości iteracji, to czas działania programu zostaje wydłużony o połowę
maksymalnej ilości iteracji.
Algorytm umożliwiający działanie programu w sposób roz-
proszony
Ta czesc wykładu obejmuje zagadnienia daodatkowe, które nie zali-
czają się do sztucznej inteligencji. Umieszczenie informacji o realizacji
algorytmu w sposób rozproszony należy traktować jako formę dodatku
stanowiącą ciekawostkę. W przypadku realizacji programu dla dużych
kwadratów ilość informacji do przetworzenia jest tak duża, że możliwość
prowadzenia obliczeń na kilku lub kilkunastu komputerach w zanczącym
stopniu przyspiesza realizację zadania.
Program jest tak napisany aby móc działać na kilku komputerach wykonujących
równolegle operacje generowania nowych potomków. Wszystkie komputery wykonu-
ją operacje obliczeniowe poza jednym komputerem zarządzającym pracą całej sieci
zwanym serwerem.
Serwer pośredniczy w przesyłaniu danych (chromosomów) między klientami.
Serwer nie wykonuje żadnych operacji obliczeniowych. W serwerze znajduje się po-
pulacja generalna (główna) składająca się z N chromosomów o najwyższej funkcji
oceny. Serwer odbiera pakiety od klientów ocenia i modyfikuje populację generalną i
rozsyła chromosomy do klientów. Klient wykonując algorytm genetyczny generuje
z populacji podstawowej zbiór potomków, aktualizuje populację główną i przesyła
do serwera chromosomy o najwyższej funkcji oceny.
Serwer ma dwa wątki podstawowe, wątek główny i wątek serwera połączeń oraz
wątki odbierające dane (po jednym dla każdego połączenia). Wysylanie danych do
klientów realizowane jest przez wątek główny. Wątek główny nie obsługuje odbioru.
Dane odbierają wątki odbiorcze (każdy ma swoje połączenie). Watek główny dołącza
odebrane z sieci pakiety i dołącza je co jakiś czas do populacji głównej. Schemat
działania serwera przedstawia rys. 3.
Ogólnie można powiedzieć, że serwer połączeń:
1) nasłuchuje na gnieździe,
3
Rysunek 3: Działanie serwera.
2) jeżeli łączy się z nim klient to tworzy połączenie i generuje nowy wątek ”od-
biorcy” dla tego połączenia,
3) dla kolejki połączeń jest synchronizacja dostępu do zasobu za pomocą mutexsu,
4) w sekcji krytycznej gniazd dodaje nowy element.
Wątek odbiorcy:
− dodaje gniazdo sieciowe,
− nasłuchuje w nieskończonym czasie,
◦ jeśli odebrał cały chromosom to zapisuje go do populacji tymczasowej,
◦ jeśli otrzymał część genów chromosomu to czeka na pozostały fragment,
Wątek główny (co X sekund):
− dołącza populację tymczasową do populacji głównej,
− sortuje chromosomy w populacji,
− wysyła niewysłane chromosomy do klientów.
Poniewaą poszczególne wątki korzystają ze wspólnych zasobów konieczna jest
ich synchronizacja. W programie serwera posiadamy dwa zasoby współdzielone: ko-
lejkę połączeń z klientami oraz populację tymczasową. Do synchronizacji dostępu
stosujemy mutexy. Ochrona zasobów realizowana jest w następujący sposób.
Zasoby dzielone i synchronizacja serwera
− kolejka połączeń,
◦ każdy wpis to nowe połączenie,
◦ dodawanie w wątku serwera połączeń,
◦ usuwanie elementów w wątku odbiorcy po zerwaniu połączenia,
◦ przeglądanie kolejki w wątku głównym
◦ (ostanie trzy - synchronizacja dostępu do zasobu za pomocą mutexu),
4
− populacja tymczasowa,
◦ tablica i licznik osobników oczekujących do włączenia do populacji głów-
nej
◦ wątki ”odbiorcy” zapisują nowy odebrany chromosom,
◦ wątek główny odczytuje chromosom i dołącza go do poulacji głównej,
◦ (ostanie dwa - synchronizacja dostępu do zasobu za pomocą mutexu),
− jeśli połączenie zostaje zerwane to ( w sekcji krytycznej gniazd) usuwa gniazdo
z kolejki i kończy pracę,
− jeśli odbierze coś z sieci to:
◦ jeśli odebrał cały chromosom to zapisuje go do populacji tymczasowej,
◦ jeśli otrzymał część genów chromosomu to czeka na pozostały fragment,
Rysunek 4: Komunikacja sieciowa serwera.
Rysunek 5: Zarządzanie populacją w serwerze.
Jeśli chodzi o komunikację sieciową serwer i klient działają podobnie. Działanie
klienta w komunikacji sieciowej można podzielić na:
5
− wątek główny,
◦ generuje potomstwo nowej populacji,
◦ dołącza populację tymczasową,
◦ sortuje,
− wątek odbiorcy,
◦ nasłuchuje na gnieździe sieciowym,
◦ jeśli zerwie połączenie to ponownie nawiązuje połączenie po upływie 10s
(czynność te jest powtarzana wskazaną w programie ilość razy),
◦ jeśli odbiera dane to w przypadku gdy otrzymuje cały chromosom to
dodaje go do populacji tymczasowej, jeśli zaś tylko fragment – czeka na
pozostałą część chromosomu,
− wątek wysyłący,
◦ co Xs wysyła do serwera chromosomy (jeszcze nie wysłane),
◦ czeka,
terline
Rysunek 6: Komunikacja sieciowa i zarządzanie populacją klienta.
Klient przechowuje chromosomy w dwóch różnych populacjach. Populacja głów-
na zawiera chromosomy, które będą wysyłane do serwera. Jest tworzona z populacji
tymczasowej przez wybór najlepszych osobników. Populacja tymczasowa zawiera
chromosomy pochodzące z sieci, czyli od serwera, służące do nowej generacji, oraz
chromosomy otrzymane w wyniku stosowania operatorów genetycznych.
Synchronizacja dostępu do zasobów klienta
Program serwera, podobnie jak serwer, posiada zasoby współdzielone przez wiele
wątków. Z tego powodu konieczna jest ich ochrona za pomocą mutexow. Program
klienta posiada następujące zasoby dzielone:
− populacja główna,
◦ wątek główny przekazuje na niej cały czas, modyfikuje potomstwo i sor-
tuje,
6
◦ wątek wysyłający musi co pewien czas odczytać wszystkie chromosomy,
by móc wysłać nowe,
◦ (powyższe - synchronizacja dostępu do zasobu za pomocą mutexu),
− populacja tymczasowy,
◦ wątek odbiorcy,
· dodaje odebranych z sieci osobników do populacji tymczasowej,
◦ wątek główny,
· dołącza do populacji głównej na podstawie kryterium.
Każdy komputer kliencki wykonuje operacje obliczeniowe generowania nowych
osobników. Posiada populację główną osobników, którą tworzy z osobników pocho-
dzących z własnej generacji oraz z osobników otrzymywanych z sieci od serwera.
Istotne jest, jakie kryteria decydują o dołączeniu osobnika z sieci do populacji głów-
nej klienta. Osobniki dołączane do populacji głównej klienta pochdzą z dwóch źró-
deł: populacji tymczasowej klienta, która jest utworzona z potomków otrzymanych
w ostatniej iteracji, oraz otrzymane od serwera. Istnieje kilka sposobów dołączania
nowych osobników. Jednym z nich jest tryb jedno-stado. Kryterium to pozwala na
dołączenie nowego osobnika tylko w oparciu o funkcję oceny. Po upływie pewnego
czasu wszyscy klienci mają bardzo podobne populacje główne. Klienci wymieniają
się osobnikami z najlepszymi ocenami tak, że większość osobników jest jednakowa.
Tryb jedno stado:
− wszyscy klienci są tak jakby jednym klientem,
− wszyscy mają identyczny zestaw osobników (przeprowadzana jest co pewien
czas synchronizacja, ale z czasem wszyscy klienci mają tę samą populację),
Innym kryterium dołączania nowego osobnika do populacji głównej klienta jest
kryterium X% emigrantów. Kryterium to uwzględnia dotychczasową strukturę po-
pulacji głównej klienta. Nowych elementów dołączonych do populacji głównej może
być co najwyżej X%. Taki algorytm zachowuje dużą różnorodność populacji głów-
nych klientów i tym samym dużą różnicę między generowanymi potomkami.
X% emigrantów:
− tylko X% osobników może być pochodzenia obcego,
− jeżeli populacja główna zawiera już X% osobników obcego pochodzenia to
nadpisywani są najlepsi spośród nich,
− nie pozwala na zdominowanie jednej gałęzi nad wszystkimi stadami,
Trzecią metodą dołączania osobników obcego pochodzenia jest sposób ”propor-
cjonalny”. W ramach chromosomów o tej samej wartości funkcji oceny ma się znaj-
dować tyle samo osobników własnego pochodzenia co obcego. Takie kryterium po-
zwala na zachowanie różnic w populacjach głównych poszczególnych klientów i przez
to prowadzi do generowania przez nich innych osobników.
7
Proporcjonalny:
− przyjmowanych jest tyle samo osobników obcego pochodzenia o danej ocenie
ilu osobników własnego pochodzenia znajduje się w populacji,
− preferowana jest zawsze najlepsze oceny wypierając słabsze osobniki,
− nie pozwala na dominację obcych osobników.
Z obserwacji wynika, iż dominacja wszystkich populacji przez jeden typ osobni-
kow moze uniemożliwić rozwiązanie zadania. Może się tak stać jeśli osobnik z wysoka
ocena zostanie szybko znaleziony, ale jego modyfikacje nie prowadza do rozwiązania,
a jedynie do osobników o bardzo wysokiej ocenie. Na przykład osobnik ma ocenę 40
a optymalne rozwiązanie ma ocenę 42. W takim przypadku może się nie udać tak
zmodyfikować tego osobnika, żeby dostać wynik.
Przykład dołączania chromosomu do populacji głównej klienta.
Jedno-stado
Populacja głowna składa się z 20 chromosomów:
10
chromosomów o ocenie
19
7
chromosomów o ocenie
17
3
chromosomów o ocenie
15
dołączamy chromosom o ocenie 18
Nowa populacja:
10
chromosomów o ocenie
19
1
chromosom o ocenie
18
7
chromosomów o ocenie
17
2
chromosomów o ocenie
15
Ponieważ ”wygrywa” chromosom, którego funkcja oceny ma największą wartość.
X% emigrantów
Populacja głowna składa się z 20 chromosomów:
10
chromosomów o ocenie
19
w tym
5 obcych
7
chromosomów o ocenie
17
w tym
4 obce
3
chromosomów o ocenie
15
w tym
0 obcych
dołączamy chromosom o ocenie 18
Nowa populacja:
10
chromosomów o ocenie
19
w tym
5 obcych
1
chromosom o ocenie
18
w tym
1 obcy
6
chromosomów o ocenie
17
w tym
3 obce
3
chromosomów o ocenie
15
w tym
0 obcych
Ponieważ nowy chromosom zastąpił ”najsłabszego” spośród ”obcych”. W ramach
chromosomów z oceną 17 nastąpiła wymiana chromosomu.
8
Proporcjonalny
Populacja głowna składa się z 20 chromosomów:
10
chromosomów o ocenie
19
w tym
5 obcych
7
chromosomów o ocenie
17
w tym
3 obce
3
chromosomów o ocenie
15
w tym
1 obcy
dołączamy chromosom o ocenie 18
Nowa populacja:
10
chromosomów o ocenie
19
w tym
5 obcych
7
chromosomów o ocenie
17
w tym
3 obce
3
chromosomów o ocenie
15
w tym
1 obcy
Chromosom nie został dołączony do populacji ponieważ bazowa populacja nie za-
wierała chromosomu o ocenie 18.
Gdyby dołączyć chromosom o ocenie 17 to nowa populacja:
10
chromosomów o ocenie
19
w tym
5 obcych
7
chromosomów o ocenie
17
w tym
3 obce
3
chromosomów o ocenie
15
w tym
1 obcy
W ramach chromosomów z oceną 17 nastąpiła wymiana chromosomu.
9