plik

Rozdzia� 5 Techniki i operacje zaawansowane W kilku pocz�tkowych rozdzia�ach tej ksi��ki zajmowali�my si� tylko elementarnymi wersjami algorytmu genetycznego, opieraj�cymi si� g��wnie na wsp�dzia�aniu trzech operacji: reprodukcji, krzy�owania i mutacji. Skupiaj�c zainteresowanie na tych mechanizmach, byli�my w stanie dostrzec, tak od strony teoretycznej jak i empirycznej, centraln� rol� sztucznej selekcji i zrandomizowanej, uporz�dkowanej rekombinacji w niebiologicznych procesach poszukiwania genetycznego. Jednak w zapale do zachowania prostoty zaniedbali�my kilka interesuj�cych zjawisk i mechanizm�w, kt�re wyst�puj� w przyrodzie. W tym rozdziale spr�bujemy wydoby� i rozwa�y� ich rol�, maj�c na uwadze umocnienie odporno�ci przejawianej przez elementarne algorytmy genetyczne. Zakres i g��boko�� tych rozwa�a� b�d� z konieczno�ci ograniczone aktualnym stanem wiedzy na temat mechanizm�w naturalnych oraz tym, co uda�o si� dot�d wypraktykowa�. Mimo tych ogranicze�, rozpoznanie, analiza i implementacja zaawansowanych technik i operacji to najbardziej owocny kierunek dalszego udoskonalania algorytm�w genetycznych. Om�wimy tu niskopoziomowe mechanizmy, takie jak dominowanie, inwersja, duplikacja wewn�trzchromosomowa, delecja, translokacja i segregacja. Poprzez mechanizmy dzia�aj�ce na poziomie populacji, jak migracja, bariery reprodukcyjne i funkcje wsp�udzia�u uzyskamy efekty podobne do zjawisk wype�niania nisz ekologicznych i specjacji. Om�wimy tak�e zwi�zane z tym prace z dziedziny optymalizacji wielokryte-rialnej. Pr�cz tego zajmiemy si� operacjami genetycznymi wzbogaconymi wiedz� [knowledge-augmented] i innymi metodami wykorzystuj�cymi informacj� specyficzn� dla zadania. Na zako�czenie wyliczymy niekt�re spo�r�d ostatnich usi�owa� dostosowania algorytm�w genetycznych do wy�aniaj�cej si� w�a�nie architektury r�wnoleg�ych system�w komputerowych. 162 . 5. Techniki i operacje zaawansowane 5.1. Diploidalnyaparat genetyczny. Dominowanie i maskowanie _ Czytelnicy oczytani nieco w genetyce g�owi� si� zapewne, dlaczego do tej pory ignorowali�my kwesti� diploidalno�ci (podw�jnego zestawu chromosom�w) i dominowania (wa�nego rodzaju zale�no�ci fenotypu od genotypu). Czy� bowiem najbardziej elementarne podr�czniki genetyki nie rozpoczynaj� si� od om�wienia do�wiadcze� Mendla z grochem i jakiego� obja�nienia zjawiska dominowania? Ot� pomini�cie to mia�o na celu podkre�lenie zasadniczego znaczenia selekcji i rekombinacji. Tym niemniej, fakt istnienia tylu odnosz�cych powodzenie diploidalnych i poliploidalnych organizm�w stawia przed nami pytanie, czy mechanizmy te mog�yby by� skutecznie zastosowane w nie-biologicznych zagadnieniach poszukiwania genetycznego. W tym punkcie zapoznamy si� z zasadami funkcjonowania genotypu diploidalnego i dominowania, w celu wyja�nienia ich roli w os�anianiu alternatywnych rozwi�za� przed zbyt niszcz�cym dzia�aniem selekcji. Dotychczas rozwa�ali�my jedynie najprostszy rodzaj genotyp�w spotykanych w przyrodzie - o haploidalnej liczbie chromosom�w. W modelu tym pojedynczy ci�g kodowy zawiera ca�� informacj� istotn� dla rozpatrywanego zagadnienia. Mimo �e przyroda zna wiele organizm�w haploidalnych, wi�kszo�� z nich reprezentuje raczej nieskomplikowane formy �ycia. Wydaje si�, �e ilekro� przyroda chcia�a wytworzy� wy�sze postaci �ycia ro�linnego lub zwierz�cego, musia�a polega� na bardziej skomplikowanej strukturze genetycznej - genotypach o diploidalnej liczbie chromosom�w. Genotyp w postaci diploi-dalnej sk�ada si� z jednej lub wi�cej par chromosom�w (zwanych chromosomami homologicznymi], ka�dy z kt�rych przenosi informacj� s�u��c� tym samym funkcjom. Na poz�r taka redundancja mo�e si� wydawa� zb�dna i trudna do poj�cia. Po co przechowywa� pary gen�w s�u��cych tej samej funkcji? A je�li dwa geny z jednej pary wyznaczaj� r�ne �warto�ci" funkcji, to wjaki spos�b przyroda decyduje, kt�ry z nich dopu�ci� do g�osu? Aby udzieli� odpowiedzi na te pytania, rozwa�my diploidaln� struktur� chromosomow�, w kt�rej poszczeg�lne litery alfabetu reprezentuj� r�ne allele (warianty gen�w): AbCDe aBCde Ka�da litera na danej pozycji (locus) reprezentuje jeden allel; dwie odmiany tej samej litery (wielka i ma�a) odpowiadaj� przeciwstawnym allelom (odmianom genu). W przyrodzie ka�dy z alleli m�g�by warunkowa� odmienn� charakterystyk� fenotypow� (lub mie� pewien cz�stkowy wp�yw na jedn� lub wi�cej charakterystyk). Na przyk�ad allel B m�g�by warunkowa� br�zow� barw� oczu, a allel b - niebiesk�. Cho� opisana zasada nie odbiega wiele od obowi�zuj�cej w przypadku haploidalnym, jedna r�nica jest wyra�nie widoczna. Poniewa� mamy teraz par� gen�w warunkuj�cych t� sam� cech�, musi istnie� mechanizm decyduj�cy, kt�ry z dw�ch wariant�w wybra�, gdy� fenotyp nie mo�e mie� - na przyk�ad -jednocze�nie br�zowych i niebieskich oczu ^esli nie dopuszczamy, jak to si� niekiedy dzieje w naturze, mo�liwo�ci wyst�powania form po�rednich; tym jednak nie b�dziemy si� tu zajmowa�). 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 163 Podstawowy mechanizm s�u��cy do rozstrzygania takich konflikt�w genetycy nazywaj� dominowaniem. Zauwa�ono, �ejeden z alleli (allel dominuj�cy) zajmuj�cych ten sam locus ma pierwsze�stwo przed odmian� alternatywn� (allelem recesywnym). Dok�adniej, dany allel jest dominuj�cy, je�eli ulega ekspresji (przejawia si� w fenotypie), wyst�puj�c w parze z drugim allelem. Wracaj�c do przyk�adu, je�eli za�o�ymy, �e wielkie litery s� dominuj�ce, a ma�e - recesywne, to ekspresj� alleli mo�na wyrazi� nast�puj�co: AbCDe ABCde ABCDe Gen dominuj�cy przejawia si� w ka�dym przypadku, a gen recesywny - tylko gdy wyst�puje w parze z drugim genem recesywnym. W j�zyku genetyk�w m�wi si�, �e gen dominuj�cy przejawia si� zar�wno w stanie heterozygotycznym (mieszanym, Aa^A), jak i homozygotycznym (czystym, CC^C), natomiast allel recesywny przejawia si� tylko w stanie homozygotycznym (ee^e). Przedstawione regu�y wydaj� si� do�� przejrzyste. Na bardziej abstrakcyjnym poziomie mo�emy my�le� o dominowaniujako odwzorowaniu genotyp-fenotyp lubjako operacji redukcji genotypu. Je�lijednak b�dziemy pr�bowali nadal zg��bia� sens tych rozwi�za�, musz� si� one wyda� nader dziwaczne. W jakim celu przyroda najpierw dubluje informacj� przenoszon� za po�rednictwem genotypu, aby j� potem zredukowa� do po�owy, gdy przychodzi do jej wykorzystania? Wygl�da to pozornie na rozrzutno�� i niepotrzebn� �mud�; jednak przyroda nie jest utracjuszem, ani nie ulega zachciankom czy kaprysom. Musz� wi�c istnie� istotne powody nadmiarowo�ci wynikaj�cej ze struktury diploidalnej genotypu oraz zjawiska maskowania czy os�ony b�d�cego rezultatem dominowania. Diploidalno�� oraz dominowanie od dawna by�y przedmiotem studi�w genetycznych; przedstawiono liczne teorie maj�ce wyja�ni� ich rol�. Z naszego punktu widzenia najbardziej interesuj�ce s� hipotezy, wed�ug kt�rych podw�jny zestaw chromosom�w stanowi mechanizm do zapami�tywania tych alleli oraz ich kombinacji, kt�re w przesz�o�ci okaza�y si� po�yteczne, a dominowanie os�aniaje przed szkodliwym oddzia�ywaniem selekcji w aktualnie niesprzyjaj�cym �rodowisku. Z przyrodniczego punktu widzenia mo�na zrozumie� potrzeb� takiej rozproszonej, d�ugoterminowej pami�ci oraz �rodk�w chroni�cych t� pami�� przed nag�ym zniszczeniem. W toku ewolucji �ycia na Ziemi planeta nasza podlega�a wielu zmianom �rodowiskowym. Od wysokich do niskich, i zn�w umiarkowanych temperatur, od ciemno�ci do pe�ni �wiat�a i jakiego� po�redniego o�wietlenia - zmiany dokonywa�y si� dramatycznie i gwa�townie. Najbardziej efektywne okaza�y si� organizmy, kt�re by�y zdolne do szybkiej adaptacji do zmieniaj�cych si� warunk�w. Zwierz�ta i ro�liny o strukturze diploidalnej lub poliploidalnej by�y najbardziej zdolne do prze�ycia, gdy� ich aparat genetyczny nie zapomina� �atwo lekcji odebranych przed poprzednimi zmianami �rodowiska. Nadmiarowa pami�� genetyczna organizm�w diploidalnych umo�liwia jednoczesne przechowywanie r�nych rozwi�za� tego samego problemu, podczas gdy ujawnia si� tylko jedno okre�lone rozwi�zanie. Dzi�ki temu stare nauki nie ulegaj� na zawsze zapomnieniu, a dominowanie i jego przemiany umo�liwiaj� okazjonalne przypomnienie i sprawdzenie przydatno�ci dawno wyuczonych lekcji. 164 . 5. Techniki i operacje zaawansowane Znakomitym przyk�adem tej d�ugoterminowej pami�ci genetycznej mog� by� przemiany w r�wnowadze populacyjnej zaobserwowane w Wielkiej Brytanii w okresie rewolucji przemys�owej u pewnego gatunku �my". Pierwotnie dominuj�ca forma tego motyla mia�a bia�e skrzyd�a z ma�ymi czarnymi plamkami. Przed rewolucj� przemys�ow� ubarwienie takie zapewnia�o skuteczny kamufla� wobec ptak�w i innych naturalnych wrog�w w wyst�puj�cych w siedlisku �my, tj. w�r�d drzew pokrytych porostami. W po�owie dziewi�tnastego stulecia w okolicach miast przemys�owych zacz�to chwyta� osobniki nale��ce do odmiany ciemno ubarwionej. Staranne do�wiadczenia przeprowadzone przez Kettlewella (Berry, 1965) wykaza�y, �e nakrapiana wersja ubarwienia zapewnia�a korzy�ci w warunkach pierwotnych, podczas gdy odmiana melaniczna (ciemna) okaza�a si� korzystna w �rodowisku przemys�owym, w kt�rym porosty pokrywaj�ce pnie drzew wygin�y z powodu zanieczyszcze�. Okaza�o si�, �e ciemny kolor skrzyde� by� warunkowany przez pojedynczy dominuj�cy gen, co wskazuje, �e nast�pi�a zmiana w dominowaniu. Kiedy r�wnowaga przesun�a si� w stron� odmiany ciemno ubarwionej, sta�a si� ona form� dominuj�c�, natomiast odmiana nakrapiana �przesz�a do rezerwy". Zwr��my uwag�, �e forma melaniczna nie by�a nowym wynalazkiem; nie nast�pi�a tu �adna szcz�liwa mutacja, kt�ra w magiczny spos�b wymy�li�a potrzebn� zmian�. Przeciwnie, forma ciemna powsta�aju� wcze�niej, by� mo�ejako odpowied� biologiczna na lasy, w kt�rych porosty w spos�b naturalny nie wyst�powa�y. Gdy produkty uboczne przemys�u spowodowa�y zanik porost�w, forma melaniczna uzyska�a przewag� selekcyjn� i sta�a si� postaci� dominuj�c�. Maj�c w zanadrzu alternatywne rozwi�zanie, �ma bez trudu zaadaptowa�a si� w kr�tkim czasie do nowych warunk�w zmieniaj�cego si� �rodowiska. Przyk�ad ten pokazuje, w jaki spos�b diploidalno�� i dominowanie stwarzaj� os�on� dla alternatywnych rozwi�za� przed nadmiern� selekcj�. Widzimy tak�e, �e dominowanie nie jest stanem ustalonym raz na zawsze. Biolodzy wysun�li i udowodnili hipotez�, �e samo dominowanie podlega ewolucji. Inaczej m�wi�c, dominowanie lub niedo-minowanie okre�lonego allelu jest r�wnie� warunkowane genetycznie. Szczeg�owe aspekty biologiczne tego zagadnienia mo�na znale�� w pracy Fishera (1958) na temat ewolucji dominowania. Tutaj om�wimy niekt�re modele tych mechanizm�w u�ywane do cel�w poszukiwania genetycznego, aby dowiedzie� si�, jak rozwi�zano tam problemy reprezentacji struktury genetycznej, operacji dominowania oraz ewolucji tej ostatniej. 5.1.1. Diploidalno��idominowaniewalgorytmachgenetycznych. Zarys historyczny__________________________________________________________ W niekt�rych najwcze�niejszych zastosowaniach praktycznych algorytm�w genetycznych u�ywano ju� struktury diploidalnej i pos�ugiwano si� mechanizmem dominowania. W rozprawie Bagleya para chromosom�w homologicznych zostaje odwzorowana na okre�lony fenotyp za po�rednictwem zmiennego wzorca dominacji, zakodowanego jako cz�� samego chromosomu (Bagley, 1967, str. 136): '' �ma kr�paka, Biston betularia Q)rzyp. tlum.). 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie. 165 Ka�dy aktywny locus zawiera pr�cz informacji okre�laj�cej parametr, z kt�rym jest on zwi�zany i konkretnej warto�ci tego parametru, r�wnie� stopie� dominowania [dominance value\. Algorytm po prostu wybiera w ka�dym z loci allele o najwi�kszym stopniu dominowania. W przeciwie�stwie do sytuacji spotykanych w przyrodzie, kt�ra dopuszcza nieca�kowite dominowanie (czego wynikiem mog� by� np. plamiste oczy), wymagamy tu, aby zosta� wybrany dok�adnie jeden z homologicznych alleli. Proces podejmowania decyzji w sytuacjach remisowych jednakowe stopnie dominowania) uwzgl�dnia efekty pozycyjne i jest cokolwiek z�o�ony, trzeba go wi�c b�dzie naszkicowa� nieco dok�adniej. Jeden z dw�ch chromosom�w zostaje arbitralnie wybranyjako �kluczowy", po czym prze- , gl�da si� jego zawarto�� w kierunku od lewa na prawo. Przy ka�dorazowym napotkaniu aktywnego locus bada si� zawarto�� homologicznego locus w drugim chromosomie. Nast�puje por�wnanie stopni dominowania i wyb�r allelu odpowiadaj�cemu wy�szemu stopniowi dominowania. Je�eli stopnie dominowania s� jednakowe, rozstrzygni�cie zale�y od chromosomu kluczowego. To znaczy, sprawdza si� najbli�szy aktywny locus po�o�ony na lewo od rozpatrywanej pozycji w chromosomie kluczowym. Je�eli jest on dominuj�cy, to bie��cy locus w chromosomie kluczowym zostaje uznany za dominuj�cy, w przeciwnym razie dominuje homolog. Je�eli badany locus zajmuje pierwsz� aktywn� pozycj� w chromosomie kluczowym, to dominuje locus kluczowy. Wprowadzenie stopnia dominowania dIa ka�dego genu umo�liwi�o adaptacj� tego modelu w kolejnych pokoleniach. Niestety, jak stwierdzi� Bagley, stopnie dominowania okazywa�y tendencj� do wczesnej fiksacji, pozostawiaj�c w ten spos�b okre�lanie dominowania w r�kach cokolwiek skomplikowanego i dowolnego mechanizmu rozstrzygania remis�w. Co gorsza, Bagley wyj�� stopnie dominowania spod dzia�ania mechanizmu mutacji, przyspieszaj�c jeszcze w ten spos�b ich przedwczesn� zbie�no��. W dodatku Bagley nie dokona� por�wnania wariantu haploidalnego z diploidalnym, a we wszystkich rozpatrywanych przez niego przypadkach �rodowisko pozostawa�o stacjonarne. W rezultacie fiksacja stopni dominowania na wszystkich pozycjach doprowadzi�a do ustalenia si� arbitralnego, przypadkowego mechanizmu dominowania, uniemo�liwiaj�c wyci�gni�cie przekonywuj�cych wniosk�w. Ukierunkowane biologicznie badania Rosenberga (1967) obejmowa�y diploidalny model aparatu genetycznego; jednak ze wzgl�du na szczeg�owo��, z jak� podszed� on do modelowania proces�w biochemicznych, efekt dominowania nie by� osobno rozpatrywany. Wszelkie efekty zwi�zane z dominowaniem wynika�y u niego z obecno�ci lub nieobecno�ci okre�lonego enzymu. Enzym m�g� hamowa� lub u�atwia� zachodzenie reakcji biochemicznej, wp�ywaj�c ten spos�b na pewien wynik na poziomie fenotypu. Studium Hollstiena (1971) obj�o model diploidalny oraz ewoluuj�cy mechanizm dominowania. W istocie Hollstien opisa� dwa proste, ewoluuj�ce mechanizmy dominowania, a nast�pnie zastosowa� najprostszy z nich do bada� nad optymalizacj� funkcji. W pierwszym przypadku zamiast pojedynczego genu binarnego, u�ywano dw�ch: genu modyfikatora i genu funkcyjnego. Gen funkcyjny m�g� przyjmowa� normalne warto�ci 0 i 1 i by� u�ywany w zwyk�y spos�b do kodowania pewnego parametru. Gen modyfikator przyjmowa� warto�ci M lub m. Przy tym rozwi�zaniu allel 0 dominowa�, je�eli w przynajmniej jednym z homologicznych loci modyfikatorowych wyst�powa� allel M. 166 5. Techniki i operacje zaawansowane W efekcie otrzymywa�o si� wzorzec dominacji taki, jak na rys. 5.1. Hollstien zorientowa� si�, �e ca�y mechanizm mo�na upro�ci�, wprowadzaj�c zamiast gen�w modyfikator�w trzy allele dla ka�dego z loci. W takim modelu triallelicznym alfabet genetyczny sk�ada� si� z symboli 0, 1 i 2, przy czym 2 pe�ni�o rol� �dominuj�cego 1", a 1 - rol� �recesyw-nego 1". Odpowiedni wzorzec dominacji zosta� pokazany na rys. 5.2. Ca�y mechanizm mo�na podsumowa� stwierdzeniem, �e zar�wno 1 jak i 2 przejawiaj� si� jako 1, ale 2 dominuje nad 0 i 0 dominuje nad 1. Holland (1975) przeanalizowa� p�niej zachowanie takiego samego modelu triallelicznego w warunkach stacjonarnych, cho� wprowadzi� nieco bardziej przejrzyste oznaczenia {0, 1�, 1} w miejsce Hollstienowskich {0, 1, 2}. OM Om 1M 1 m OM Om 1 M Rys. 5.1. Wzorzec dominacji z genem modyfikatorem. Za Hollstienem (1971) o i Rys. 5.2. Wzorzec dominacji w modelu triallelicznym. Za Hollstienem (1971) Model trialleliczny Hollstiena-Hollanda ��cz�c oba rodzaje informacji (o dominowaniu i allelu) na pojedynczej pozycji jest najklarowniejsz� i najprostsz� z metod zaproponowanych do tej pory dla cel�w poszukiwania genetycznego. Przy tej metodzie allel o wy�szej warto�ci przystosowawczej staje si� dominuj�cy, os�aniaj�c w ten spos�b wariant recesywny. Potrzeba do tego minimum dodatkowej pami�ci (p� bitu na locus}, a co wi�cej zmiana dominowania mo�e by� bez trudu dokonywana za po�rednictwem operacji typu mutacyjnego, przekszta�caj�cej 2 w 1 (1 w 1� wed�ug notacji Hollanda) i odwrotnie. Mimo przejrzysto�ci tego modelu wyniki otrzymane przez Hollstiena w zwi�zku z wprowadzeniem diploidalno�ci i dominowania by�y niejednoznaczne. Chocia� w symulacjach oznaczonych Breed Type III r�norodno�� populacji (mierzona wa- 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 167 riancj� populacji) utrzymywa�a si� na wy�szym poziomie ni� w przypadku symulacji haploidalnych, nie zaobserwowano jednak istotnej poprawy �redniej czy ko�cowej efektywno�ci. Mo�e si� to wydawa� dziwne dop�ty, dop�ki nie zdamy sobie sprawy z faktu, �e Hollstien pos�ugiwa� si� jedynie funkcjami stacjonarnymi. Je�li sens diploidalno�ci--dominowania polega na os�onie, to istotnych r�nic w zachowaniu haploidalnych i dip-loidalnych algorytm�w genetycznych powinni�my si� spodziewa� wtedy, kiedy �rodowisko ulega przemianom w czasie. W tym �wietle jest rzecz� zastanawiaj�c�, �e nie przestudiowano takich zmian w zwi�zku z omawianym modelem. Brindle (1981) przeprowadzi�a eksperymenty z pewn� liczb� wariant�w dominowania w kontek�cie optymalizacji funkcji. Niestety, funkcje i kody, kt�rych u�ywa�a w badaniach, zosta�y p�niej zakwestionowane. Co wi�cej, zignorowa�a ona poprzednie prace na temat modeli dominacji i diploidalno�ci, a pewne opracowane przez ni� modele nie mia�y podstaw teoretycznych ani precedens�w biologicznych. �� *| Brindle rozwa�a�a sze�� nast�puj�cych wariant�w dominowania: 1) dominowaniesta�e,globalne,okre�lonelosowo, 2) dominowaniezmienne,globalne; ;�, 3) dominowanie zmienne, globalne, okre�lone deterministycznie; 4) wyb�r losowego chromosomu; 5) dominowanie lepszego chromosomu; 6) haploidaIna kontrola dominowania adaptacyjnego diploid�w. W przypadku dominowania sta�ego, globalnego, okre�lonego losowo, dominowanie alleli zostaje okre�lone na pocz�tku eksperymentu, raz na zawsze dla wszystkich loci. Wzorzec dominacji odpowiada serii rzut�w rzeteln� monet�. Allel dominuj�cy przejawia si� w stanie heterozygotycznym lub homozygotycznym, natomiast allel recesywny - tylko w stanie homozygotycznym. W przypadku dominowania zmiennego, globalnego, okre�la si� prawdopodobie�stwo dominowania danego allelu (0 lub 1) w okre�lonym locus. Jest ono r�wne frekwencji tego allelu w aktualnej populacji. Po obliczeniu frekwencji zer i jedynek w ka�dym z loci, o ekspresji allelu b�d�cego w stanie heterozygotycznym decyduje wynik odpowiedniej pr�by Bernoulliego. W nast�pnym wariancie (dominowanie zmienne, globalne, okre�lone deterministycznie) wyznacza si�, tak jak poprzednio, frekwencje zer i jedynek dla ka�dego z loci; jednak tym razem o ekspresji decyduje wi�kszo�� i allel maj�cy wi�ksz� frekwencj� w populacji zostaje uznany za dominuj�cy. W wariancie z wyborem losowego chromosomu tworzy si� (drog� kolejnych rzut�w beztendencyjn� monet�) losowy genotyp, a wszystkie jego allele zostaj� uznane za dominuj�ce. W wariancie z dominowaniem lepszego chromosomu chromosom o wy�szym wska�niku przystosowania (w parze chromosom�w homologicznych) zostaje uznany za dominuj�cy. W ostatnim modelu trzeci dodatkowy chromosom (haploid) przenosi adaptacyjny wzorzec dominacji, okre�laj�cy ekspresj� alleli w normalnej parze diploidalnej (Brindle, 1981, str. 115): !^HBMttMr* "" 168 5. Techniki i operacje zaawansowane Model haploidalny �rednia dla pokolenia wu -80 -70 - Jl ; F m i � � 1 H J , r , F � r p 1 ao -ff o> T� c P a so- 0 1 U) 2 40 - w L 30- 20- to - 0 - -� i � i P t�i m -ii � hH � *~ � �� < P �-H � -t � -H � � 1 � �i P -H ��- 100 200 Nr pokolenia 300 40P Rys. 5.3. Niestacjonarna wersja zagadnienia plecakowego. �rednie warto�ci rozwi�za� dla modelu haploidalnego. (Goldberg i Smith, 1987) 0) o t� e- 0_ 70 - .2 60 - g S 50 - 40 -30 -20 -10 - Model haploidalny Najlepsze rozwi�zanie w pokoleniu 100 300 400 200 Nr pokolenia Rys. 5.4. Niestacjonarna wersja zagadnienia plecakowego. Najlepsze rozwi�zania dla modelu haploidalnego. (Goldberg i Smith, 1987) 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 169 Najlepsz� metod� uzyskania wzorca dominacji, kt�ry przynosi�by najwi�ksze korzy�ci or-ganizmowi,jest pozostawienie algorytmowi genetycznemu zadania wytworzeniatego wzorca w spos�b dynamiczny. Ka�dy osobnik w populacji jest wyposa�ony w trzeci chromosom, kt�ry w fazie ewaluacji s�u�y jako wzorzec dominacji dla tego osobnika. Podczas cyklu reprodukcyjnego chromosom ten zachowuje si� jak organizm haploidalny, rekombinuj�c w fazie kojarzenia z analogicznym chromosomem drugiego z rodzic�w. Podlega on mutacji z tak� sam� cz�sto�ci�, jak chromosomy homologiczne. [...] Dobre wzorce dominacji powinny rozwija� si� r�wnolegle z dobrymi organizmami. Jest to najbardziej naturalny spo�r�d modeli przyj�tych przez Brindle. Podobnie jak wcze�niejsze propozycje Hollstiena (1971) i Bagleya (1967), metoda ta opiera si� na adaptacyjnym wzorcu dominacji; jednak Brindle ca�kowicie oddzieli�a wzorzec dominacji (geny modyfikatory) od normalnego chromosomu (gen�w funkcyjnych). Pod wzgl�dem biologicznym jest to niezrozumia�e. Genotypy wyst�puj�ce w przyrodzie nie s� w po�owie diploidalne, a w po�owie haploidalne. Ponadto wydaje si�, �e gen modyfikuj�cy powinien by� do�� ci�le zwi�zany z genem funkcyjnym, tworz�c trudny do rozbicia (na skutek krzy�owania) blok. Separacja, kt�r� narzuci�a Brindle, skutecznie likwiduje sprz�enia mi�dzy wzorcem dominacji a genami funkcyjnymi. S� tak�e i inne zastrze�enia do jej modeli. Dwa z nich wymagaj� u�ycia informacji globalnej do podejmowania decyzji na szczeblu lokalnym. Ju� wcze�niej mieli�my okazj� kwestionowa� pomys� algorytmu genetycznego na metapoziomie, gdy� zak�ada� on pos�ugiwanie si� informacj� globaln�. Te same zastrze�enia nale�y zg�osi� wobec u�ywania informacji globalnej do lokalnego decydowania o dominowaniu. Musimy jeszcze raz postawi� pytanie, w jaki spos�b informacja taka mia�aby by� dost�pna w przyrodzie. Cho� mo�e si� to wydawa� puryzmem genetycznym, nie chodzi tu wcale o �lepe na�ladownictwo przyrody dla samego siebie. G��wny urok naturalnych i sztucznych mechanizm�w genetycznych polega na tym, �e osi�gaj� one globalne skutki poprzez dzia�ania czysto lokalne. Je�li cho� raz wprowadzimy t� czy inn� operacj� globaln�, utracimy bezpowrotnie t� poci�gaj�c� w�a�ciwo��. A nie jest to bez znaczenia, je�li ostatecznie zale�y nam na uzyskaniu efektywnych implementacji tych metod dla komputer�w o architekturze r�wnoleg�ej. W swej rozprawie Brindle por�wna�a drog� symulacyjn� sze�� modeli; poniewa� jednak u�y�a niew�a�ciwego materia�u do bada� oraz rozpatrywa�a jedynie funkcje stacjonarne, zjawiska diploidalno�ci i dominacji nie zosta�y przez ni� skutecznie zbadane. W nieco nowszych pracach (Goldberg i Smith, 1987; R. E. Smith, 1987, 1988), g��wn� uwage po�wi�cono roli dominowania i diploidalno�ci jako struktur i mechanizm�w maskowania. Sm�th i ja por�wnali�my haploidalny AG, diploidalny AG ze sta�ym wzorcem dominacji (1 dominuje nad 0) oraz diploidalny trialleliczny AG Hollstiena--Hollanda pod wzgl�dem efektywno�ci, na przyk�adzie tzw. �lepego zagadnienia plecakowego. W zwyk�ym zagadnieniu plecakowym chodzi o maksymalizacj� ��cznej warto�ci przedmiot�w za�adowanych do plecaka, przy zachowaniu jednego lub wi�cej wi�z�w wagowych. Matematycznie zadanie formu�uje si� w zwi�z�y spos�b nast�puj�co: v,*,, gdzie*,e{0,l} pod warunkiem, �e Xw,x, 'c 0! co O OT Model diploidalny prosty Najlepsza rozwi�zanie w pokoleniu 100 200 3OO 400 Nr pokolenia Rys. 5.6. Niestacjonarna wersja zagadnienia plecakowego. Najlepsze rozwi�zania dla modelu diploidalnego ze statym wzorcem dominacji. (Goldberg i Smith, 1987) T t 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 171 Model trialleliczny �rednia dla pokolenia 300 400 100 200 Nr pokolenia Rys. 5.7. Niestacjonarna wersja zagadnienia plecakowego. �rednie warto�ci rozwi�za� dla modelu diploidalnegotriallelicznego. (Goldberg i Smith, 1987) .2 <0 v> o v> Model trialleliczny Najlepsze rozwi�zanie w pokoleniu 1 100 3OO 400 2OO Nr pokolenia Rys. 5.8. Niestacjonarna wersja zagadnienia plecakowego. Najlepsze rozwi�zania dla modelu diploidalnegotriallelicznego. (Goldberg i Smith, 1987) 172 5. Techniki i operacje zaawansowane W wersji ��lepej" algorytm nie zna, oczywi�cie, struktury zadania, warto�ci v, czy wag Wj. W tym przypadku zadanie zosta�o dodatkowo utrudnione przez wprowadzenie wi�z�w b�d�cych periodyczn� funkcj� czasu: W(t)e [W0, Wt}, przy czym co Tl>erirxi pokole� warto�� funkcji zmienia si� na przeciwn�. Na rysunkach 5.3-5.6 por�wnano haploidalny AG z prostym diploidalnym AG. Haploidalny AG nie by� w stanie dostosowa� si� do oscylacji, natomiast prosta wersja diploidalna potrafi�a za nimi do pewnego stopnia nad��y�. Wykonano r�wnie� eksperymenty z algorytmem triallelicznym Hollstiena-Hollanda. Jak mo�na by�o si� spodziewa�, otrzymane wyniki przewy�szy�y w istotnym stopniu rezultaty osi�gni�te przy u�yciu sta�ego wzorca dominacji. Na rysunkach 5.7 i 5.8 pokazano �rednie i najlepsze w pokoleniu rozwi�zania omawianego zadania. Poniewa� model trialleliczny umo�liwia ewolucj� wzorca dominacji na ka�dej pozycji, populacja jest dzi�ki temu zdolna do szybszej i pe�niejszej adaptacji ni� w przypadku sta�ego wzorca dominacji lub struktury haploidalnej. 5.1.2. Analiza diploidalno�ci i dominowania w algorytmach genetycznych ____ Dowody empiryczne na rzecz struktury diploidalnej i mechanizmu dominowania w algorytmach genetycznych zaczynaj� uk�ada� si� w bardziej zrozumia�� ca�o��. O ile dawniej uwa�ano diploidalno�� i dominowanie za magiczne lekarstwo na wszystkie niedomagania algorytm�w genetycznych, o tyle teraz g��wn� uwag� kieruje si� na ich rol� zwi�zan� z zabezpieczeniem niegdy� po�ytecznych schemat�w przed niszcz�cym dzia�aniem selekcji. Aktualnie zacz�to studiowa� te zagadnienia w kontek�cie zada� niestacjonarnych i mo�na przypuszcza�, �e przysz�e badania potwierdz� t� rol�. Za dowodami empirycznymi powinna pod��y� analiza teoretyczna. W tym punkcie poka�emy, jak dzia�a mechanizm przed�u�aj�cy �ycie aktualnie s�abszych schemat�w, b�d�cy efektem wsp�dzia�ania diploidalno�ci i dominowania. Zobaczymy r�wnie�, �e dzi�ki takiemu rozwi�zaniu mo�na zapewni� okre�lony poziom r�norodno�ci populacji przy mniejszej cz�sto�ci mutacji. Chc�c zrozumie� dzia�anie wspomnianego mechanizmu, rozwa�my najpierw, jaki wp�yw wywiera on na rozprzestrzenianie si� schemat�w. W rozdziale drugim otrzymali�my nast�puj�cy zwi�zek mi�dzy liczb� reprezentant�w schematu H w nast�pnym pokoleniu (m(H, t+ 1)) a liczb� tych�e w pokoleniu bie��cym (m(H, ?))�' m(H, t+\) > m(H, t) SL ] _ _ o(H)pr W powy�szej nier�wno�ci pc i pm oznaczaj�, odpowiednio, prawdopodobie�stwa krzy�owania i mutacji,f(ff) � �redni wska�nik przystosowania schematu,/- �redni wska�nik przystosowania populacji, d(ff) - rozpi�to�� schematu (odleg�o�� mi�dzy skrajnymi pozycjami ustalonymi) i o(H} - rz�d schematu (liczb� ustalonych pozycji). Nier�wno�� ta pozostanie w mocy po dodaniu diploidalno�ci i dominowania,jezeli uwzgl�dnimy w niej wp�yw dominowania i zjawiska ekspresji alleli na wielko�� redniego przystosowania 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 173 schematu/(H). R�nica b�dzie najlepiej widoczna, je�eli rozr�nimy poj�cia schematu rzeczywistego H i schematu ujawnionego He. Innymi s�owy, rzeczywisty schemat H mo�e si� przejawia� Iub nie, w zale�no�ci od swego statusu dominacyjnego oraz od aktualnego partnera homologicznego. Wymaga to wprowadzenia nast�puj�cej modyfikacji do naszej nier�wno�ci: ,� m(H, t+ 1) > m(H, t) %� [l - Pe ^- - o(H}Pm\ f Wszystko pozosta�o po staremu, z wyj�tkiem tego, �e �redni wska�nik przystosowania schematu H, f(H}, zosta� zast�piony przez �redni wska�nik przystosowania schematu ujawnionego He, f(He). W przypadku schematu ca�kowicie dominuj�cego �redni wsp�czynnik przystosowania zawsze r�wna si� �redniemu wsp�czynnikowi przystosowania schematu ujawnionego: < , i � � /tfO=/(ff,) -V . , , - : ' ^ ' . ! *f i �i W przypadku schematu dominowanego chcieliby�my, oczywi�cie, aby �redni wsp�czynnik schematu ujawnionego nie ust�powa� �redniemu wsp�czynnikowi schematu rzeczywistego: f(He)>f(ff) �,. ..' -...- ,..-� � ..-...- .,�..,.,.;,:..'. Sytuacja taka jest najbardziej prawdopodobna, kiedy wzorzec dominacji ma mo�liwo�� ewoluowania, jak sugerowali�my wcze�niej. Je�li to nast�pi, to aktualnie szkodliwy, zdominowany schemat nie b�dzie nara�ony na odsianie wskutek selekcji w takim stopniu, jak w analogicznym przypadku haploidalnym. W ten w�a�nie spos�b diploidalno�� i dominowanie chroni� schematy b�d�ce aktualnie w nie�asce. Aby nada� naszemu rozumowaniu bardziej wymierny charakter, rozwa�my prosty przyk�ad, w kt�rym mamy do czynienia z dwoma alternatywnymi, konkuruj�cymi schematami, jednym dominuj�cym i jednym recesywnym. Odpowiada to realnie dw�m al-lelom na tej samej pozycji lub dw�m schematom wielopozycyjnym, kt�re �zmonopolizowa�y" okre�lony podzbi�r pozycji. W obu przypadkach zak�adamy, �e konkurent dominuj�cy przejawia si� zar�wno w stanie heterozygotycznym, jak i homozygotycznym, natomiast konkurent recesywny przejawia si� tylko w stanie homozygotycznym. Przekszta�caj�c r�wnanie propagacji schemat�w" mo�emy wyznaczy� frekwencje P' alleli recesywnych w kolejnych pokoleniach t. Je�li za�o�ymy, �e istniej� tylko dwa konkuruj�ce schematy, przy czym forma dominuj�ca charakteryzuje si� sta�ym wska�nikiem �redniego przystosowania^,, a forma recesywna - odpowiednio/r, to w�wczas oczekiwana frekwencja recesyw�w w nast�pnym pokoleniu wyniesie (Goldberg i Smith, 1987): 11 W celu uproszczenia dalszej analizy autor zast�puje wyprowadzon� wcze�niej nier�wno�� r�wnaniem (przyp. ttum.). 174 . 5. Techniki i operacje zaawansowane Pt+] = P'K P' + r(] ~P') (1 - r)P' � P' + r gdzie r=ft//fr, a A"jest wsp�czynnikiem strat zwi�zanych z krzy�owaniem i mutacj�. Analogiczny zwi�zek mo�na wyprowadzi� w przypadku haploidalnym, w kt�rym szkodliwy wariant (recesyw) nie jest nigdy maskowany: K � .....v ; ��. ' - ' '�'��'''" "!"';;"' pi+[=p P' + r(\ -P') Na rysunku 5.9 wykre�lono zale�no�� stosunku frekwencji P'+I/P' od frekwencji P' dla wariant�w haploidalnego i diploidalnego. Najwa�niejszym wnioskiem, jaki mo�na wyci�gn�� z tych wykres�w, jest to, �e przy por�wnywalnych frekwencjach alleli wariant haploidalny odsiewa zawsze mocniej (mniejszy jest stosunek frekwencji) ani�eli wariant diploidalny. Oczywi�cie, nie oznacza to, �e wariant diploidalny dzia�a mniej efektywnie. W istocie, w przypadku diploidalnym cz�sto�� wyboru recesywu podczas reprodukcji jest niewielka (proporcjonalna do P2) �. Dzi�ki temu przydatne niegdy� rozwi�zania zostaj� zachowane, aby pewnego dnia podj�� walk�, bez nadmiernej propagacji i bez nadmiernego odsiewu. Podobne wnioski mo�na wysnu�, badaj�c historie frekwencji recesy-w�w, zobrazowane na rys. 5.10. Analogiczne wyniki dla modelu triallelicznego podaje Smith (1988). Przeprowadzona wy�ej analiza dowodzi jasno istnienia d�ugoterminowej pami�ci, b�d�cej skutkiem diploidalno�ci i dominowania. Z uwagi na to mo�emy si� spodziewa�, �e mutacja b�dzie odgrywa� jeszcze mniejsz� rol� w przypadku algorytm�w genetycznych stosuj�cych to rozwi�zanie. Holland (1975) przedstawi� analiz� wymaga� stawianych wobec mutacji w warunkach populacji stacjonarnej, por�wnuj�c przypadki struktur diploidalnych i haploidalnych2'. Mo�na pokaza�, �e dla struktur haploidalnych zwi�zek mi�dzy frekwencj� ^'+l okre�lonego allelu w nast�pnym pokoleniu a jego frekwencj� P' w bie��cym pokoleniu jest dany wzorem 3'+l _ (\-Z}P'+pm(\-P')-pmP> Wyst�puje tu suma trzech wyraz�w - sk�adnika wynikaj�cego z reprodukcji, sk�adnika reprezentuj�cego zysk z tytu�u mutacji oraz sk�adnika reprezentuj�cego strat� z tytu�u mutacji. Wielko�� e(/) reprezentuje wzgl�dne straty b�d�ce skutkiem dzia�ania innych operacji. W populacji stacjonarnej mamy P'+l =P'=PSX. Wyznaczaj�c st�d PM otrzymujemy P.. = Pm 11 Chodzi o form� homozygotyczn� Q>nyp. tlum.). 2) Analiza ta dotyczy przypadku dw�ch przeciwstawnych alleli rzyp. t�um.). 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 175 1,0000 0,9000 .2 I J J2 o,aooo - o s I o. a> 0,7000 - 0,9000 - 0,6000 0,OODOOB+00 fi=2 6,OOOOOB-01 1,00000>+0 Frekwencja w populacji graniczny � haploidalny R=2 Rys. 5.9. Wsp�czynnik zachowania p'+'/P' w zale�no�ci od frekwencji P' dla modelu haploidalnego (r = 2), diploidalnego (r = 2) \ granicznego diploidalnego (r=). Za Goldbergiem i Smithem (1987) 0,6000 o,oooo haploidalny R=2 10 eo 30 Numer ookolenia diploidalny R=2 graniczny diploidalny Rys. 5.10. Frekwencja Pw zale�no�ci od pokolenia /dla modelu haploidalnego (r = 2), diploidalnego (r = 2) i granicznego diploidalnego (r = oo). Za Goldbergiem i Smithem (1987) 176 5. Techniki i operacje zaawansowane Z r�wno�ci tej wynika (dla 8 du�ego w stosunku do pm), �e ko�cowa stacjonarna frekwencja allelu jest wprost proporcjonalna do tempa mutacji. Z kolei dla struktur diploidalnych mo�na pokaza�, �e zale�no�� mi�dzy frekwencj� allelu recesywnego w nast�pnym pokoleniuajego frekwencj� w pokoleniu bie��cymjest okre�lona wzorem W warunkach stacjonarno�ci otrzymujemy nast�puj�cy zwi�zek miedzy wymaganym tempem mutacji a frekwencj� allelu recesywnego: Przy niewielkiej frekwencji recesywnego allelu (Pss� 1) z r�wno�ci tej wynika, �e tempo mutacji niezb�dne do utrzymania tej�e frekwecji na sta�ym poziomie jest proporcjonalne do kwadratu frekwencji. Oczywi�cie, wyst�powanie tych samych frekwencji allelu w wariantach haploidalnym i diploidalnym nie oznacza, �e jest on w obu przypadkach w r�wnym stopniu wystawiony na selekcj�. Mimo tych samych frekwencji, w przypadku diploidalnym jest on poddawany pr�bie ze znacznie mniejsz� cz�sto�ci� (proporcjonaln� do kwadratu frekwencji). Wskazuje to na konieczno�� dokonywania sporadycznych zmian wzorca dominacji, aby umo�liwi� tak zmagazynowanym allelom sprawdzenie swojej warto�ci przystosowawczej w aktualnych warunkach. 5.1.3.Jmplementacja modelu triallelicznego Implementacja modelu triallelicznego Hollstiena-Hollanda wymaga wprowadzeniajedy-nie drobnych zmian w naszym programie SGA. Nale�y zmieni� struktury danych, tak aby uwzgl�dni� homologiczne pary chromosom�w oraz trzy allele na locus. Zmodyfikowane definicje i deklaracje danych dla SGA z dominowaniem (SGADOM) s� podane na wyd. 5.1. Zauwa�my, �e typ allele zosta� teraz zdefiniowany jako okrojony typ integer o zakresie -1..1 (w poprzedniej wersji by� zdefiniowany jako typ boolean). W nowej implementacji -1 odpowiada recesywnemu 1 (10 w notacji Hollanda), 0 odpowiada 0, a 1 - dominuj�cemu 1 (1 w notacji Hollanda). Relacja dominowania sprowadza si� przy takim sposobie kodowania do zwyk�ej relacji >. Okoliczno�� ta zosta�a wykorzystana w funkcji paskalowej mapdominance, zamieszczonej w wyd. 5.2. Wzorzec dominacji zostaje zastosowany do pary chromosom�w homologicznych w procedurze dominance, kt�ra wywo�uje mapdominance kolejno dla ka�dej pozycji w chromosomach (wyd. 5.3). Mechanizm wytwarzania potomstwa w modelu diploidalnym jest cokolwiek inny ' ni� w wersji haploidalnej. W procedurze gametogenesis homologiczna para chromosom�w produkuje par� gamet, kt�re z kolei zostaj� zap�odnione przez inn� par� gamet w procedurze fertilization. Proces ten jest niezupe�nie zgodny z rzeczywisto�ci� biologiczn�, jednak uwzgl�dnia on najwa�niejsze elementy, a istniej�ce r�nice maj� na celu zmniejszenie do minimum szkodliwych efekt�w wywo�anych niewielkimi rozmiarami populacji, na kt�rych najcz�ciej pracuj� algorytmy genetyczne. 5.1. Diploidalny aparat genetyczny. Dominowanie i maskowanie . 177 const maxpop maxstring version type allele chromosome chrompack parentid ' idpack individual population = 100; = 30; .,- � = 'vl.0'; = -1..1; { triallelic scheme (-1, 0, 1) } = array[l..maxstring] of allele; { trits } = array[1..2] of chromosome; = record xsite, parent:integer end; = array[1..2] of parentid; = record chrom:chrompack; { pack of chroms } echrom:chromosome; { expressed chrom } x, objective, fitness:real; parents:idpack; { parent info } end; = array[l..maxpop] of individual; oldpop, newpop:population; popsize, lchrom, gen, maxgen:integer; pcross, pmutation, sumfitness:real; nmutation, ncross:integer; avg, max, min:real; { non-overlapping } { integer globals } { Real globals } { Integer stats } { Real stats } Wyd. 5.1. Triaileliczny mechanizm dominowania w Pascalu (SGADOM): definicje i deklaracje struktur danych Nowe pokolenie powstaje pod kontrol� procedury generation, zamieszczonej w wyd. 5.4. R�ni si� ona od wersji oryginalnej tym, �e zosta�a przystosowana do procedur gametogenesis \fertilization. Podobniejak poprzednio, najpierw wybiera si� tu, przy u�yciu funkcji select, par� partner�w do skojarzenia. Nast�pnie dwukrotnie zostaje wywo�ana procedura gametogenesis, raz dla ka�dego z partner�w. Procedura fertilization z dw�ch par gamet tworzy dw�ch diploidalnych potomk�w; o tym, kt�re gamety po��cz� si�, decyduje rzut monet�. Po zap�odnieniu przeprowadza si� ewaluacj� wska�nik�w przystosowania, zapami�tuj�c przy okazji informacje o genealogii oraz punktach krzy�owania - do p�niejszego wykorzystania w szczeg�owym raporcie. functionmapdominance(allelel,allele2:allele):allele; { dominance map using > relation among (-1,0,1) } begin if (allelel >= allele2) then mapdominance := abs(allelel) else mapdominance := abs(allele2) end; procedur� dominance(var lchrom:integer; var homologous:chrompack; var expressed:chromosome ); 1 { express dominance - homologous pair --> single chrom } var j:integer; begin for j:=l to lchrom do expressed[j]:=mapdominance(homologous[l,j],homologous[2,j]) end; Wyd. 5.2. Trialleliczny mechanizm dominowania w Pascalu (SGADOM): funkcja mapdominance i procedura dominance 1 178 . 5. Techniki i operacje zaawansowane procedur� gametogenesis(var ancestor,gamete:individual; var lchrom, nmutation, ncross, jparent:integer; var pmutation, pcross:real); { Create a pair of gametes from a single parent } var j,jcross:integer; begin { handle crossover and mutation } -" crossover(ancestor.chromfl], ancestor.chrom[2], ' ' gamete.chrom[l], gamete.chrom[2], !,^'~- > lchrom, ncross, nmutation, jcross, pcross, pmutation); { set parent and crossing pointers } for j := 1 to 2 do with gamete do begin chromid[j].parent :=jparent; chromid[j].xsite := jcross; 7 end; end; .. -, �.',- ;� ,� � - .�� '� � � ' ~ ' " '' : ' procedur� fertilization(var chroml, chrom2:chromosome; var parentl, parent2:parentid; var newindividual:individual); begin with newindividual do begin , . chrom[l] := chroml; ��:.��'��". ' �' � chrom[2] := chrom2; chromid[l] := parentl; chromid[2] := parent2; end; end; Wyd. 5.3. Trialleliczny mechanizm dominowania w Pascalu (SGADOM): procedury gametogenesis \ fertilization � . . . .... , , ,.. , ,. ,. Opr�cz opisanych zmian niezb�dne s� niewielkie modyfikacje sposobu dokonywania mutacji, cz�ci inicjuj�cej programu i podprogramu sporz�dzaj�cego raport. Zmiany w tre�ci funkcji mutation odzwierciedlaj� fakt wyst�powania trzech alleli. Aby uzyska� w populacji pocz�tkowej przeci�tnie jednakow� frekwencj� jedynek i zer ulegaj�cych ekspresji, recesywne jedynki, zera oraz dominuj�ce jedynki powinny by� generowane losowo z prawdopodobie�stwami odpowiednio 0,25, 0,5 i 0,25. Procedura u�ywana przy tworzeniu raport�w writechrom, zosta�a zmodyfikowana tak, by wypisywa� poprawnie wszystkie trzy allele. Recesywnajedynka (lJ jest tu reprezentowana przez znak procentu (%). Zmiany w writechrom i mutation zosta�y podane na wyd. 5.5. 5.2. Inwersja i inne operacje rekonfiguracji Artyku�em wiary, na kt�rym opierali�my wcze�niejsze rozumowania dotycz�ce si�y algorytm�w genetycznych, by�o przekonanie, �e schematy o du�ej warto�ci przystosowawczej, ma�ej rozpi�to�ci i niskim rz�dzie, czyli tak zwane cegie�ki, ��cz� si� z innymi takimi cegie�kami, tworz�c ci�gi kodowe o ponadprzeci�tnej warto�ci przystosowawczej. Jednak r�ne przyk�ady zastosowa�, z kt�rymi si� zetkn�li�my, u�wiadomi�y nam, jak wielka dowolno�� wi��e si� z wyborem sposobu kodowania. Czy mo�emy wi�c mie� pewno��, �e schematy zwi�zane z kodem u�ytym w danym zadaniu b�d� rzeczywi�cie prowadzi� do 5.2. Inwersja i inne operacje rekonfiguracji 179 function other(jl:integer):integer; begin if (jl=l) then other := 2 else other := 1 end; procedur� generation; { Create a new generation through select, crossover, and rautation } var j, jl, j2, raatel, mate2, jcross:integer; gametel, gamete2:individual; begin j := 1; repeat { select, generate gametetes until newpop is filled } { pick 2 mates } matel := select(popsize, sumfitness, oldpop); {pick pair of mates } mate2 := select(popsize, sumfitness, oldpop); { make 4 gametes to make 2 zygotes } �" garaetogenesis(oldpop[matel], gametel, lchrom, nmutation, ncross, matel, '- pmutation, pcross); gametogenesis(oldpop[mate2], gamete2, lchrom, nmutation, ncross, mate2, pmutation, pcross); { flip honest coin to decide arrangement } if flip(0.5) then begin jl := 1; j2 := 1 end else begin jl := 1; j2 := 2 end; { fertilize without replacment } , '''" fertilization(gametel.chrom[jl], gametel.chromid[jl], v newpopljJ>; jl := other(jl); j2 := other(j2); fertilization(gametel.chrom[jl], gametel.chromid[jl], newpop[j+l]); { express, decode, and evaluate objective function } with newpop[j ] do begin dominance(lchrom, chrom, echrom); X := decode(echrom, lchrom); s objective := objfunc(x); end; with newpop[j+l] do begin dominance(lchrom, chrom, echrom); x := decode(echrom, lchrom); objective := objfunc(x); end; { Increment population index } j := j + 2; -� '>��" -' �' -' �. "->' -: until j>popsize ; - end; Wyd. 5.4. Trialleliczny mechanizm dominowania w Pascalu (SGADOM): zmodyfikowana procedura generation uwzgl�dniaj�ca dominowanie i diploidalno�� gamete2.chrom[j2], gamete2.chromid[i2], gamete2.chrom[j 2], gamete2.chromidLj2] , poprawy? Prawd� m�wi�c, nie mo�emy. Nie mamy �adnej pewno�ci, �e dowolny kod zastosowany w dowolnym zadaniu umo�liwi elementarnemu algorytmowi genetycznemu znajdowanie lepszych rozwi�za�. W pierwszej chwili stwierdzenie to mo�e wprawia� w zak�opotanie dop�ty, dop�ki nie u�wiadomimy sobie, �e przyroda r�wnie� nie mo�e by� pewna swoich kod�w i w zwi�zku z tym wypracowa�a mechanizmy, dzi�ki kt�rym mo�ejednocze�nie usprawnia� kod i poszukiwa� lepszych zestaw�w alleli. W tym punkcie zajmiemy si� badaniem takich w�a�nie mechanizm�w rekonfiguracji, aby zorientowa� si�, czy mo�naje efektywnie zastosowa� w algorytmach genetycznych. . - 180 5. Techniki i operacje zaawansowane function mutation(alleleval:allele; pmutation:real; var nmutation:integer):allele; { Mutate an allele w/ pmutation, count number of mutations } var mutate:boolean; temp:allele; begin mutate := flip(pmutation); { Flip the biased coin } if mutate then begin , nmutation := nmutation + 1; temp := alleleval + rnd(l,2); case temp of mutation mutation mutation { Add one or two } -1: 0: 1: 2: 3: = temp; = temp; = temp; = -l; = 0; mutation mutation end {case} end else mutation := alleleval; end; { No change } procedur� writechrom(var out:text; chrom:chromosome; lchrom:integer); { Write a chromosome as a string of l's (true's) and O's (false's) } var j:integer; ch:char; . begin for j := lchrom downto 1 do . ,� ... begin ; ,,,. case chrom[j] of -1: ch := '%'; ,<. .. .. V . '. . ,. 0: ch := '0'; . , 1: ch := '1'; " '. end; write(out,ch); end; end; Wyd. 5.5. Trialleliczny mechanizm dominowania w Pascalu (SGADOM): zmodyfikowana funkcja mutation \ procedura whtechrom, uwzgl�dniaj�ce dominowanie i diploidalno�� G��wnym naturalnym mechanizmem odpowiedzialnym za rekonfiguracj� kodu jest operacja inwersji. Podczas inwersji chromosom ulega przeci�ciu w dw�ch wybranych punktach, a nast�pnie �rodkowy jego odcinek ulega odwr�ceniu i po��czeniu z dwoma pozosta�ymi. Pocz�tkowo operacja taka mo�e si� wyda� do�� dziwaczna, je�li rozpatrywa� j� w kontek�cie naszych sztucznych chromosom�w-ci�g�w. Rozwa�my na przyk�ad nast�puj�cy o�miopozycyjny ci�g, w kt�rym wybieramy drog� losow� dwa punkty inwersji (powiedzmy miejsca 2 i 6, zaznaczone ni�ej znakiem A): i o i i i o i i Gdyby�my chcieli bezmy�lnie wykona� operacj� inwersji, otrzymaliby�my w rezultacie nast�puj�cy ci�g: � � i o o i 11 i i Nie wida� wcale, jak operacja inwersji mia�aby nam pom�c w znalezieniu nowej reprezentacji. W istocie, wygl�da na to, �e po prostu zmienia ona cz�ciowo porz�dek 5.2. Inwersja i inne operacje rekonfiguracji 181 u�o�enia alleli w ci�gu kodowym. K�opot bierze si� z zastosowania zbyt prostej reprezentacji. Pocz�wszy od pierwszego rozdzia�u zak�adali�my, �e funkcja allelu jest zwi�zana z jego po�o�eniem, z jego locus. W rzeczywisto�ci porz�dek gen�w w chromosomie mo�e zosta� odwr�cony, a mimo to b�d� one odpowiada� za produkcj� tego samego enzymu. Inaczej m�wi�c, w przyrodzie funkcje alleli nie zale�� od ich umiejscowienia. Aby zapewni� sobie tak� sam� swobod�, oznaczmy allele numerami od 1 do 8 i zobaczmy, co si� stanie, gdy wykonamy operacj� inwersji na tak rozszerzonej reprezentacji: - , . ..-. .,� 1 2 3 4 5 6 7 8 1 0 1 1 l 0 1 1 ; Gdy teraz dokonujemy tej samej inwersji, odnosimy j� r�wnie� do ci�gu numer�w: 1 2 6 5 4 3 7 8 1 0 0 1 1 1 1 1 Dzi�ki tej rozszerzonej reprezentacji poszczeg�lne bity zachowuj� swoje zamierzone znaczenie, niezale�nie od pozycji, na kt�rej si� znalaz�y. W terminach biologicznych rozszerzona reprezentacja rozdziela gen i locus. Ciekaw� konsekwencj� takiego poci�gni�cia jest to, �e wykonanie jednej samodzielnej inwersji nie wp�ywa bezpo�rednio na wska�nik przystosowania ci�gu. Poniewa� allele s� teraz ponumerowane, zmiana ich pozycji w ci�gu nie ma wp�ywu na wynik dekodowania ca�o�ci, tak wi�c wska�nik przystosowania pozostaje bez zmian. Jakkolwiek jest ju� rzecz� jasn�, dlaczego rozszerzona reprezentacja umo�liwia dokonywanie inwersji bez obawy pomieszania funkcji r�nych alleli, nie wiemy wci��, co pozytywnego wnosz� oba te pomys�y do sprawy poszukiwa� genetycznych. Przed chwil� w�a�nie stwierdzili�my, �e pojedyncza inwersja nie ma bezpo�redniego wp�ywu na warto�� przystosowawcz� ci�gu kodowego, po c� wi�c przyroda trudzi si� (i czemu my mieliby�my si� trudzi�) t� przypadkow� zabaw� w genetyczne �kom�rki do wynaj�cia"? Teoretyczn� stron� operacji inwersji zajmiemy si� nieco bardziej szczeg�owo w dalszej cz�ci tego punktu; na razie poprzesta�my na stwierdzeniu, �e inwersja mog�aby by� przydatna do poszukiwania korzystnych konfiguracji ci�g�w kodowych, podczas gdy w tym samym czasie inne operacje genetyczne s�u�� poszukiwaniu korzystnych zestaw�w alleli. Je�li aktualna populacja zawiera niekorzystne permutacje alleli (takie, przy kt�rych allele o silnych zwi�zkach epistatycznych czy te� nieliniowych s� po�o�one w odleg�ych od siebie miejscach chromosomu), to krzy�owanie rozbije z du�ym prawdopodobie�stwem bloki alleli o wa�nym znaczeniu przystosowawczym. Z drugiej strony, je�eli wskutek rekonfiguracji zmienimy ustawienie alleli, to istnieje pewna szansa, �e otrzymamy korzystne uporz�dkowanie, kt�re w nast�pstwie umo�liwi bardziej efektyw-n�propagacj� schemat�w-cegie�ek. :^ :, ,'?';,.-?;r v: Ju� wkr�tce poddamy to rozumowanie dok�adniejszej analizie. Natomiast w nast�pnym punkcie dokonamy przegl�du wcze�niejszych bada� na temat mechanizm�w rekonfiguracji w algorytmach genetycznych. 182 5. Techniki i operacje zaawansowane 5.2.1. Operacje rekonfiguracji w algorytmach genetycznych. Zarys historyczny_____________________________ Eksperymenty symulacyjne Bagleya (1967) obj�y tak�e inwersj�. Zaimplementowa� on prost� operacj� inwersji oraz rozszerzon� reprezentacj� ci�gu kodowego, kt�r� om�wili�my powy�ej i stan�� przed decyzj�, jak podej�� do krzy�owania niehomologicznych par ci�g�w. Dlaczego jest to istotny problem, mo�emy si� przekona� na przyk�adzie krzy�owania dw�ch nast�puj�cych ci�g�w A i B: A = B = Gdyby�my naiwnie skrzy�owali te ci�gi wed�ug zasady krzy�owania prostego, powiedzmy od pozycji czwartej (w miejscu zaznaczonym znakiem I), to otrzymaliby�my dwa potomne ci�gi nast�puj�cej postaci: 1234 5678 1011 1011 1265 4378 /; 1001 1111 A' = B' = 1 2 3 4 4 3 7 8 1 0 1 1 | 1 1 1 1 I 1 2 6 5 | 5 6 7 8 1 0 0 1 I 1 0 1 1 Wida� od razu, �e �aden z potomnych ci�g�w nie zawiera pe�nego garnituru gen�w - i w og�lno�ci, to w�a�nie jest g��wny argument przeciwko dopuszczaniu do krzy�owania dowolnie uporz�dkowanych ci�g�w. Bagley zastosowa� proste rozwi�zanie eliminuj�ce t� trudno��: zabroni� mianowicie krzy�owania niehomologicznych ci�g�w. Niestety, skutki tego poci�gni�cia nie by�y zach�caj�ce (Bagley, 1967, str. 168): Wyniki dotycz�ce inwersji [...] by�y cokolwiek rozczarowuj�ce. Najbardziej oczywistym skutkiem inwersji jest wyra�ne wyd�u�enie przebieg�w. Pami�tajmy, �e jedn� z konsekwencji inwersji jest zmniejszenie efektywnej intensywno�ci krzy�owa�, gdy� krzy�owanie fragment�w chromosom�w, kt�re nie s� pozycyjnie homologiczne, jest niedozwolone. Jak widzimy, mniejsza intensywno�� krzy�owa� odbija si� niekorzystnie na symulacji i ten efekt wywar� przemo�ny wp�yw na nasze wyniki. Po��dane konsekwencje inwersji, polegaj�ce na pojawieniu si� w populacji gamet, w kt�rych geograficzne zwi�zki gen�w odzwieciedla�yby kombinacje [...], nie zosta�y zaobserwowane. To niepowodzenie z inwersj� Bagley przypisa� charakterowi zadania (poszukiwanie strategii gry). Wyci�gn�� mianowicie wniosek, �e zadanie by�o nie do�� trudne (epistatycz-ne) na to, by inwersja mog�a wykaza� swe zalety. Ujmuj�c to inaczej, elementarny algorytm genetyczny bez inwersji dzia�a� zbyt dobrze, aby jego wersja uzupe�niona o in- 5.2. Inwersja i inne operacje rekonfiguracji 183 wersj� mog�a wykaza� si� wi�kszym tempem zbie�no�ci lub lepszym ko�cowym stopniem zbie�no�ci. Ta prawda (�e elementarny AG dzia�a zbyt dobrze) nieraz ju� wysz�a najaw od czasu studi�w Bagleya, co znacznie utrudni�o wykazanie, �e efekty sprz�enia odgrywaj� rol� w procesie poszukiwania genetycznego. By�y te� inne przyczyny tego, �e Bagley nie potrafi� wykaza� korzy�ci wynikaj�cych z inwersji. Pami�tajmy, �e Bagley dopuszcza� wymian� wy��cznie homologicznych podci�g�w podczas krzy�owania. Regu�a ta w istotny spos�b ogranicza zasi�g krzy�owania w populacji. Przyroda stosuje bardziej liberaln� polityk� w tym zakresie; podobnie mniej restryktywne regu�y wprowadzili p�niej inni badacze zainteresowani inwersj�. W swych badaniach dotycz�cych rozpoznawania postaci za pomoc� algorytmu genetycznego, Cavicchio (1970) zastosowa� nieograniczon� inwersj� wraz z nast�puj�cym po niej krzy�owaniem; jak wiemy jednak z rozdzia�u trzeciego, geny Cavicchia sk�ada�y si� z numer�w identyfikacyjnych pikseli zgrupowanych w detektorach. Przy takiej reprezentacji dowolna inwersja daje w wyniku ��ywotny" chromosom. Ponadto dalsze krzy�owanie par prowadzi do powstania sensownego potomstwa, niezale�nie od uporz�dkowania ci�g�w. Chocia� wi�c te korzystne w�a�ciwo�ci wynikaj� z ukierunkowanego problemowo sposobu kodowania, wyniki Cavicchia s� zach�caj�ce. W jednej z serii eksperyment�w, przy stosunkowo du�ych intensywno�ciach krzy�owa� i inwersji, otrzymano dobre tempo zbie�no�ci i wysoki stopie� ostatecznej zbie�no�ci. Natomiast badania Frantza (1972), po�wi�cone epistazie w procesach poszukiwania genetycznego, nie potrafi�y wykaza� przydatno�ci inwersji. Frantz wykona� pr�by z kilkoma wariantami inwersji i regu� kojarzenia dla funkcji o r�nym stopniu kont-' rolowanej nieliniowo�ci. Rozwa�a� on dwa warianty inwersji: 1) inwersjeliniowa[//near]; 2) inwersj� liniowo-boczn� [linear+end]. Inwersja liniowa to nazwa, kt�r� Frantz nada� zwyk�ej inwersji opisanej wcze�niej w tym rozdziale. W przypadku inwersji liniowo-bocznej wykonujemy z zadanym prawdopodobie�stwem (0,75) inwersj� liniow�. W przeciwnym razie wykonujemy z jednakowym prawdopodobie�stwem (0,125) inwersj� boczn� od jednego lub drugiego ko�ca ci�gu. W inwersji bocznej jednym z ko�c�w odwracanego segmentu jest lewy lub prawy koniec ca�ego ci�gu, natomiast drugi koniec segmentu zostaje wybrany losowo spo�r�d punkt�w le��cych nie dalej ni� w po�owie odleg�o�ci do drugiego ko�ca ci�gu. Inwersja liniowo--boczna by�a pomys�em, za pomoc� kt�rego Frantz pr�bowa� zmniejszy� tendencj� inwersji liniowej do nieproporcjonalnego faworyzowania alleli po�o�onych blisko �rodka ci�gu (na niekorzy�� alleli po�o�onych w pobli�u kra�c�w ci�gu). Ka�dy z wariant�w inwersji m�g� by� stosowany w jednym z dw�ch tryb�w: 1) inwersji ci�g�ej; 2) inwersji masowej. W trybie inwersji ci�g�ej operacja inwersji by�a wykonywana z ustalonym prawdopodobie�stwem p( dla ka�dego nowego osobnika w chwili jego powstania. Natomiast w trybie inwersji masowej, najpierw formowano ca�� now� populacj�, a nast�pnie po�owa osobnik�w tej populacji przechodzi�a identyczn� operacj� inwersji (z tymi samymi punktami 184 5. Techniki i operacje zaawansowane ko�cowymi). Inwersja masowa by�a pomy�lanajako �rodek powstrzymuj�cy rozrost pod-populacji nie wchodz�cych ze sob� w interakcje, co towarzyszy kojarzeniu na zasadach �cis�ej homologiczno�ci. Frantz wypr�bowa� cztery regu�y kojarzenia, maj�ce na celu zapobie�enie trudno�ciom powstaj�cym przy �naiwnym" krzy�owaniu par niehomologicznych: 1) kojarzenie �ci�le homologiczne; - ; 2) kojarzenienapodstawie�ywotno�ci; 3) kojarzeniewed�ugwzorca; , � '�:�� 4) kojarzeniewed�uglepszegowzorca. r �� ; Kojarzenie �ci�le homologiczne odpowiada wariantowi stosowanemu przez Bagleya (tylko ci�gi homologiczne mog� si� ze sob� kojarzy�). Kojarzenie na podstawie �ywotno�ci dopuszcza krzy�owanie partner�w niehomologicznych, ale je�li wynik�e st�d �potomstwo" nie posiada pe�nego garnituru gen�w, to nie zostaje w��czone do nowej populacji. W kojarzeniu wed�ug wzorca jeden z dw�ch losowo wybranych partner�w okre�la wzorcowy porz�dek ci�gu. Drugi z partner�w podlega w�wczas odpowiedniej rekonfiguracji przed wykonaniem krzy�owania. Rekonfiguracja gwarantuje �ywotno�� otrzymanego potomstwa. Kojarzenie wed�ug lepszego wzorca r�ni si� od poprzedniego tylko tym, �e osobnikiem wyznaczaj�cym wzorcowy porz�dek zostaje lepiej przystosowany partner. Pomimo liczby i r�norodno�ci wypr�bowanych opcji Frantzowi nie uda�o si� wykaza� istnienia wyra�nego efektu pozycyjnego. W dodatku nie potrafi� on r�wnie� dowie�� wyra�nej korzy�ci z zastosowania inwersji w jakiejkolwiek postaci, trybie czy kombinacji kojarzeniowej. U pod�o�a napotkanych przez niego trudno�ci le�a� wyb�r �rodowiska eksperymentalnego. Frantz u�ywa� kombinacji liniowych funkcji liniowych lub nieliniowych ze wzgl�du na sze�� do siedmiu alleli w 25-pozycyjnym ci�gu kodowym. Funkcje nieliniowe by�y zdefiniowane przy u�yciu tablic zawieraj�cych 26 lub 27 r�nych warto�ci odpowiadaj�cych poszczeg�lnym kombinacjom sze�ciu lub siedmiu alleli w grupie. Niestety, funkcje wybrane przez Frantza nie okaza�y si� wystarczaj�co trudne, by zastosowanie inwersji sta�o si� op�acalne. Jak zauwa�y� Bethke (1981), funkcja AG-trudna nie tylko musi by� epistatyczna, ale jej epistaza musi mie� zwodniczy charakter. Czyli w�skie schematy o wysokiej warto�ci przystosowawczej musz� kierowa� algorytm do z�ych obszar�w przestrzeni. Sprawa ta nie by�a przedmiotem studi�w Frantza, tak wi�c elementarny algorytm genetyczny by� w stanie szybko znajdowa� rozwi�zania. Po pracach Frantza nast�pi�a d�uga przerwa w badaniach nad zagadnieniem inwersji i innych mechanizm�w rekonfiguracji ci�g�w. Holland (1975) wspomina kr�tko o inwersji, prezentuj�c modyfikacj� twierdzenia o schematach, uwzgl�dniaj�c� przybli�one efekty zwyk�ej inwersji. P�niej niewiele by�o s�ycha� o mechanizmach rekonfiguracji, a� do mi�dzynarodowej konferencji na temat algorytm�w genetycznych i ich zastosowa� z 1985 r. Na konferencji tej kilku autor�w (Davis, 1985b; Goldberg i Lingle, 1985; Smith, 1985) opisali konstrukcj� operacji ��cz�cych w sobie cechy inwersji i krzy�owania. Cho� powsta�y one niezale�nie, operacje te maj� wiele podobie�stwa. Om�wimy tu ka�d� z tych trzech operacji: PMX fo>artially matched crossover}, OX [order crossover] oraz CX [cycle crossover\. -;^ r 5.2. Inwersja i inne operacje rekonfiguracji 185 Operacja PMX powsta�a w wyniku pr�b stawienia czo�a tzw. �lepej wersji zagadnienia komiwoja�era. W zwyk�ym zagadnieniu komiwoja�era (TSP) hipotetyczny komiwoja�er ma za zadanie objecha� wszystkie miasta z okre�lonego zbioru, tak by zminimalizowa� przebyt� drog�. W �lepej wersji tego zagadnienia zadanie komiwoja�era pozostaje nie zmienione, ale nie zna on d�ugo�ci przebytej drogi a� do chwili zako�czenia objazdu. Zagadnienie komiwoja�era jest samo przez si� problemem trudnym (nale�y do klasy problem�w, kt�re - jak si� s�dzi - nie daj� si� rozwi�za� w czasie wielomianowym), nawet bez nak�adania dodatkowych ogranicze�. Rozpatruj�c sposoby kodowania mo�liwe do zastosowania w tym zadaniu, nie�atwo wpa�� na rozwi�zanie, kt�re zapewni�oby rozs�dne dzia�ania na schematach-cegie�kach. Wydaje si� do�� naturalne, by w zagadnieniach uporz�dkowania takich jak TSP stosowa� kod permutacyjny. Na przyk�ad, w przypadku o�miu miast odwiedzanych w kolejno�ci rosn�cych numer�w, trasa podr�y mog�aby by� przedstawiona nast�puj�co: 1 2 3 4 5 6 7 8 Odwrotna kolejno�� odwiedzin odpowiada�aby permutacji: 8 7 6 5 4 3 2 1 Chocia� taka reprezentacja wygl�da do�� naturalnie, nie wida� na pierwszy rzut oka, jak mo�na by j� dopasowa� do og�lnego schematu reprezentacji przyj�tego dla algorytm�w genetycznych. Niedawno podj�li�my powa�ne wysi�ki, aby dokona� rozdzia�u mi�dzy funkcj� a po�o�eniem genu w chromosomie. Ujmuj�c to matematycznie, mogliby�my powiedzie�, �e przystosowanie/powinno by� funkcj� podzbioru alleli v^=/(v)); jednak w wielu zadaniach korzystna mo�e by� tak�e zale�no�� przystosowania od ustawienia alleli: przystosowanie by�oby wtedy funkcj� podzbioru alleli v i uporz�dkowania o tf=/(v, o)). W zagadnieniu komiwoja�era z reprezentacj� permutacyjn� osi�gn�li�my drugie ekstremum: przystosowanie jest tu funkcj� samego uporz�dkowania tf=f(o)). Mo�na by spekulowa� na temat wersji tego zadania, w kt�rej komiwoja�er musi podejmowa� decyzje podczas swych zabieg�w; decyzje takie nietrudno wtedy do��czy� do informacji o kolejno�ci odwiedzin, otrzymuj�c zagadnienie mieszane,/=/(v, o): -f . l 2 3 4 5 6 7 8 o o o o o o o o �''- '''''' ' �''"' ''"'" :""": '' W powy�szym przyk�adzie do porz�dku odwiedzin s� do��czone allele reprezentuj�ce informacj� o ka�dym mie�cie (zera). Chcemy w ten spos�b zaznaczy�, �e potencjalnie istnieje ca�e spektrum mo�liwych sposob�w kodowania, kt�re w mniejszym lub wi�kszym stopniu zale�� i od porz�dku i od sk�adu chromosomu. Je�li ju� raz zgodzili�my si� z tak� mo�liwo�ci�, powinni�my teraz poszuka� operacji analogicznej do krzy�owania, umo�liwiaj�cej wymian� wzorc�w uporz�dkowania mi�dzy rodzicami i przekazywanie ich dzieciom. Pami�tajmy, �e si�a metod genetycznych zasadza si� na po��czeniu efekt�w selekcji i rekombinacji; mutacja pe�ni rol� ubezpieczenia przeciw bezpowrotnej utracie materia�u genetycznego. W przypadku 186 5. Techniki i operacje zaawansowane reprezentacji por/�dkowej inwersja jest - podobnie jak mutacja - operacj� jednoar-gumentow�. Je�eli zamierzamy stworzy� operacj� o sile por�wnywalnej z si�� krzy�owania, musi to by� operacja dwuargumentowa (podobnie jak krzy�owanie) i musi ona ��czy� wzorce porz�dkowe pochodz�ce od ponadprzeci�tnych rodzic�w w jaki� sensowny spos�b. Goldberg i Lingle (1985) zaproponowali taki mechanizm w postaci operacjiPMX. �� .-�-.��.: ,";";--,vv-..^<;:.tf.r.i,--:;'.^.4>".".: * ; function find_city(city_name,n_city:city; var tour:tourarray):city; var jl:integer; begin jl:-0; repeat jl:=jl+l; .i. ' : . until ( (jl>n_city) or (tour[jl]=city_name) ); find_city:=jl; end; procedur� swap_city(city_posl,'city_pos2:integer; var1 tour:tourarray); var temp:city; begin temp:=tour[city_posl]; tour[city_posl]:=tour[city_pos2]j tour[city_pos2]:=temp; . ;y �:. ;,-_j . . :, , end; procedur� tour_norm(city_name,n_city:city; var tour:tourarray); var temp_tour:tourarray; jl,j2:city; begin -�'. ...'�;� � , -,-;. .�' . ' jl := find_city(city_name,n_city,tour); if (jl <> 1) then begin (* normalization *) for j2 := 1 to n_city do begin temp_tour[j 2]:=tour[j 1]; jl:=jl+l; if (jl>n_city) then jl:=l; end; �� ,"<� �- � ' tour:=temp_tour; end end; '' ;' procedur� cross_tour(n_city,lo_cross,hi_cross:city; var tour l_o ld, tour2_o ld, tour l_new, tour2_new: tourarray ); var jl,hi_test:integer; begin if traceison then writeln('lo_cross,hi_cross=',lo_cross,' ',hi_cross); hi_test := hi_cross + 1; if (hi_test>n_city) then hi_test:=l; tourl_new := tourl_old; tour2_new := tour2_old; if ( (lo_cross <> hi_cross) and (lo_cross <> hi_test) ) then begin '' jl := lo_cross; 4 while (jl<>hi_test) do begin (* mapped crossover on both tours *) swap_city(jl,find_city(tourl_old[jl],n_city,tour2_new),tour2_new); swap_city(jl,find city(tour2_old[jl],n_city,tourl_new),tourl_new); jl:=jl+l; if (jl>n_city) then jl:= 1; end; end; end; Wyd. 5.6. Operacja PMX w Pascalu. Procedura cross_four implementuj�ca PMX, u�ywa funkcji fincLcity\ procedury swap^city. Za Goldbergiem i Linglem (1985) 5.2. Inwersja i inne operacje rekonfiguracji 187 Podczas wykonywania PMX dwie reprezentacje (uwzgl�dniaj�ce uporz�dkowanie i sk�ad alleli) zostaj� ustawione jedna pod drug�, po czym dokonuje si� losowego wyboru dw�ch punkt�w podzia�u. Te dwa punkty wyznaczaj� sekcj� dopasowania [matching section], s�u��c� do okre�lenia przebiegu procesu krzy�owania, realizowanego za pomoc� transpozycji par element�w. Zobaczmy jak to dzia�a na przyk�adzie dw�ch nast�puj�cych ci�g�w: A = 9 8 4 B = 8 7 1 5 6 7 2 3 10 1 3 2 10 9 5 4 6 Wykonanie PMX odbywa si� drog� kolejnych transpozycji. Dopasowuj�c ci�g B do ci�gu A, zamieniamy miejscami 2 i 5, 3 i 6 oraz 10 i 7. Podobnie, dopasowuj�c ci�g A do ci�gu B, zamieniamy miejscami 5 i 2, 6 i 3 oraz 7 i 10. Po zako�czeniu tych dzia�a� otrzymujemy dwa ci�gi potomne: A' = 9 8 4 B' = 8 10 1 2 3 10 5 6 7 1 6 5 7 9 2 4 3 przy czym uporz�dkowanie ka�dego z nichjest wyznaczone po cz�ci przez obu rodzic�w. W wydruku 5.6 podano implementacj� PMX w postaci procedur paskalowych. Procedury te by�y u�yte do znalezienia rozwi�za� dw�ch zada� podanych przez Karga i Thompsona (1964), dotycz�cych odpowiednio 10 i 33 miast. Na rysunku 5.11 przedstawiono wykres d�ugo�ci najkr�tszej drogi znalezionej w danym pokoleniu w zale�no�ci od numeru pokolenia dla dw�ch niezale�nych przebieg�w algorytmu genetycznego, opartego na selekcji wg regu�y ruletki oraz operacji PMX. W jednym z przebieg�w znaleziono rozwi�zanie optymalne, a w drugim - bardzo bliskie optymalnemu. Wyniki dla 33 miast, pokazane na rys. 5.12, umo�liwiaj� por�wnanie najlepszych rozwi�za� (w kolejnych pokoleniach) dla wariant�w ruletka-PMX i ruletka-inwersja. Zdolno�� PMX do przestawiania parami daje tej operacji mo�liwo�� 450,Or N a> O 400,0 c 'n) 350,0 0 10 Pokolenie 15 20 Rys. 5.11. Algorytm genetyczny z operacj� PMX w �lepej wersji zagadnienia komiwoja�era dla 10 miast. W przebiegu 1 proces zbiega do optymalnego rozwi�zania. Wielko�� populacji n=200 przy pc = 0,6. Za Goldbergiem i Linglem (1985) 188 5. Techniki i operacje zaawansowane �bliskiego podej�cia" do rozwi�zania optymalnego, podczas gdy inwersja zacina si� na �fa�szywym p�askowy�u". Cho� wygl�da to zachecajaco,jednak w �wiecie, kt�ry widzia� ju� optymalne rozwi�zania zagadnie� TSP z 500 i 1000 miast, podobne przybli�one wyniki mog�yby zosta� skwitowane wzruszeniem ramion - p�ki nie u�wiadomimy sobie, �e algorytm genetyczny z PMX nie korzysta z informacji o odleg�o�ciach mi�dzy miastami. Ograniczenie si� do �lepych metod poszukiwania charakterystyczne dla ,,czystych'' algorytm�w genetycznych jest bardzo powa�nym ograniczeniem i pod koniec rozdzia�u om�wimy metody umo�liwiaj�ce algorytmowi genetycznemu korzystanie z informacji specyficznej dla zadania. Na razie pami�tajmy jednak, �e korzystanie z informacji specyficznej jest zawsze w�tpliwym dobrodziejstwem. U�ycie takiej informacji mo�e znacznie zwi�kszy� efektywno�� algorytmu, ale te� zawsze ogranicza zakres jego zastosowa�. 45 40- 35 T5 rzyp. tlum.). 5.2. Inwersja i inne operacje rekonfiguracji 191 Dla d�ugich ci�g�w r�wno�� ta redukuje si� do , ,,, P(przemieszczenia) = 2 (x - x2) gdzie x oznacza po�o�enie wzgl�dne: x=kll. To asymptotyczne wyra�enie osi�ga warto�� maksymaln� r�wn� 0,5 dla * = 0,5. Nier�wnomierno�� tego rozk�adu by�a przyczyn�, dla kt�rej Frantz wymy�li� inwersj� liniowo-boczn�, o kt�rej wspominali�my wcze�niej. Istniej� te� inne sposoby zmniejszenia tych efekt�w peryferyjnych. Jednym z nich (nie bez analogii przyrodniczych) jest potraktowanie chromosomu jako pier�cienia. W pozbawionym pocz�tku i ko�ca pier�cieniu ka�dy locus ma jednakowe prawdopodobie�stwo przemieszczenia pod wp�ywem inwersji. Z analogiczn� sytuacj� mieli�my do czynienia w rozdziale czwartym w przypadku krzy�owania dwupunktowego. Jeszcze inna mo�liwo�� to pozostawienie rzeczy takimi, jakie s� i zaakceptowanie zale�no�ci od pozycji. Niewykluczone, �e efekty peryferyjne mog� odgrywa� pewn� rol� tak w naturalnych, jak i w sztucznych procesach genetycznych, dzia�aj�c jako probabilistyczna tarcza u�atwiaj�ca tworzenie si� warto�ciowych zgrupowa� gen�w. Gdyby tak by�o, korzystne zgrupowania gen�w mog�yby migrowa� ku peryferiom �a�cucha u�ywaj�c os�ony owego �inwersyjnego cienia" w celu hamowania procesu destrukcji. Z drugiej strony nieustabilizowane zgrupowania gen�w mog�yby szuka� centrum �a�cucha, co zapewnia�oby im wi�ksze prawdopodobie�stwo przemieszcze�. Troska Frantza z powodu zale�no�ci prawdopodobie�stwa przemieszcze� od pozycji w �a�cuchu wydaje si� zupe�nie zrozumia�a. By� mo�e nale�a�oby wyr�wnywa� prawdopodobie�stwa, a mo�e, jak zauwa�yli�my wy�ej, zale�no�� taka jest daj�cym si� wykorzysta� efektem ubocznym inwersji. Je�eli naszym celem jest tylko znajdowanie �ci�le sprz�onych �cegie�ek", to absolutne po�o�enie w �a�cuchu nie wydaje si� spraw� o najwi�kszym znaczeniu. Bardziej uzasadnion� miar� potencja�u destrukcyjnego operacji jest w�wczas raczej stopie� zachowania wzgl�dnego skupienia gen�w. Holland (1975) uwzgl�dni� t� okoliczno��, obliczaj�c w nast�puj�cy spos�b prawdopodobie�stwo zniszczenia schematu wskutek inwersji: P(zmszczema) = 2p, 8(ff) F - � - 1 - / � 1 J Ostatni czynnik bierze si� st�d, �e je�li obydwa ko�ce odwracanego segmentu wypadaj� �wewn�trz" schematu, to rozpi�to�� schematu nie ulegnie przy tym zwi�kszeniu. Ilustruj� to poni�sze przyk�ady: Inwersja destruktywna ! ! 3 ! 2 6 ! ! ! ! ! 3 ! ! 2 6 ! ! ! ! �". ' * * 0 * 0 1 * * * * 0 * * 0 1 * * * * 192 . 5. Techniki i operacje zaawansowane Inwersja niedestruktywna \ ! 3 ! 2 6 ! ! ! ! ! 3 ! ! 2 6 ! ! ! * * 0 * 0 1 * * * * * * 0 0 * 1 * * * * U�yta tu notacja r�ni si� nieco od tej, kt�r� stosowali�my do tej pory. Alleliczny symbol uniwersalny (*) zachowuje tu zwyk�e znaczenie, natomiast wykrzykniki (!) s� u�ywane w celu zaznaczenia, �e pozosta�e nieokre�lone geny mog� wyst�pi� w dowolnym porz�dku. Hol!and w swej oryginalnej pracy nie pos�ugiwa� si� t� notacj� ani nie wprowadzi� poj�cia schematu lub wzorca porz�dkowego; bra� jednak pod uwag� mo�liwo�� zwi�kszenia rozpi�to�ci schematu pod wp�ywem inwersji. Pierwszym krokiem w kierunku og�lniejszej teorii schemat�w obejmuj�cej tak�e ich porz�dkowy aspekt by�o zdefiniowanie przeze mnie schemat�w porz�dkowych w zwi�zku z operacj� PMX (Goldberg i Lingle, 1985). W pracy tej okre�lono przestrze� wszystkich wzorc�w porz�dkowych, korzystaj�c z �porz�dkowego" symbolu uniwersalnego - wykrzyknika (!). Tak samo jak gwiazdki (*) okre�laj� wzorce podobie�stwa dla alleli (schematy �alleliczne" lub a-schematy), tak te� schematy porz�dkowe (nazwijmy je o-schematami) okre�laj� podobie�stwa w uporz�dkowaniu. Na przyk�ad o-schemat ! ! 2 3 ! ! ! ! ! ! , - okre�la podzbi�r wszystkich uporz�dkowa�, w kt�rych geny o numerach 2 i 3 wyst�puj� na pozycjach 3 i 4 odpowiednio. Dany schemat rz�du o wyznacza zatem (l-o)\ porz�dk�w na l-o nieokre�lonych pozycjach. Na przyk�ad w przypadku o-schematu okre�lonego powy�ej istnieje (10-2)! = 8! uporz�dkowa� symboli {1, 4, 5, 6, 7, 8, 9, 10} na o�miu nieokre�lonych pozycjach. Nietrudno znale�� liczb� o-schemat�w. Poniewa� istnieje sposob�w wyboru o ustalonych pozycji w ci�gu /-elementowym i poniewa� \ o I _ . . istnieje \o\ sposob�w rozmieszczenia / symboli na o miejscach, zatem ��czna liczba \o / o-schemat�w wynosi Proste rozumowanie wykazuje, �e ka�dy ci�g jest reprezentantem 2' schemat�w i �e populacja z�o�ona z n schemat�w reprezentuje od 2' do n � 2' takich o-schemat�w. Podana definicja o-schematujest tylkojedn� z ca�ego zbioru mo�liwych. Gdyby�my chcieli rozpatrywa� wzgl�dne po�o�enia alleli zamiast bezwgl�dnych, zdefiniowaliby�my wzgl�dne schematy porz�dkowe (o-schematy typu r). Mo�emy teraz u�y� zapisu r'(-) dla oznaczenia okre�lonej klasy schemat�w bezwgl�dnych (o-schemat�w typu a) d�ugo�ci /; w �rozwini�ciu" wyra�enia r'"(3!!28) otrzymamy w�wczas nast�puj�ce schematy: 5.2. Inwersja i inne operacje rekonfiguracji 193 3 ! ! 2 8 ! ! ! ! ! ! 3 ! ! 2 8 ! ! ! ! ! 1 3 ! ! 2 8 ! ! ! ! ! ! 3 ! ! 2 8 ! ! ! ! ! ! 3 ! ! 2 8 ! !, ! ! ! ! 3 ! ! 2 8 Je�li potraktujemy ci�g jako struktur� ko�ow� bez pocz�tku i ko�ca, to z tego samego wyra�enia otrzymamy ponadto nast�puj�ce o-schematy bezwgl�dne: 8 ! ! ! ! ! 3 ! ! 2 2 8 ! ! ! ! ! 3 ! ! ! 2 8 ! ! ! ! ! 3 ! ! ! 2 8 ! ! ! ! ! 3 Koncepcja ��lizgaj�cych si�" gen�w nasuwa pomys� rozwa�enia trzeciego typu o-schemat�w. Do tej pory m�wili�my o o-schemataeh, w kt�rych liczy�o si� bezwzgl�dne po�o�enie gen�w (typ a) oraz takich, w kt�rych liczy�o si� wzgl�dne po�o�enie gen�w (typ r). Rozwa�my teraz pewien �a�cuch gen�w o okre�lonej rozpi�to�ci i pozw�lmy ca�emu pakietowi przesuwa� si� (w sensie o-schemat�w typu r) przy zachowaniu rozpi�to�ci. Mo�emy teraz zdefiniowa� nowy typ o-schemat�w, kt�re mog�yby by� przydatne do scharakteryzowania pewnego typu problem�w; nazwijmy je wzgl�dnymi o-sche-matami z po�lizgiem (w skr�cie o-schematami typu rs). W celu opisania o-schemat�w typu rs wprowad�my zapis funkcyjny rs'&(-) dla oznaczenia okre�lonej klasy o-schemat�w wzgl�dnych o rozpi�to�ci 8 i d�ugo�ci /. Argumentem tej funkcji jest uporz�dkowana lista numer�w, kt�r� �rozwijamy" na zbi�r o-schemat�w typu r. Na przyk�ad o-schemat rs"}(238) rozwija si� na nast�puj�ce o-schematy typu r. r10 (2 3 ! ! 8) r10 (2 ! 3 ! 8) r10 (2 ! ! 3 8) Te schematy mo�na z kolei rozwin�� na o-schematy bezwgl�dne. W niekt�rych problemach nieistotne mo�e by� nawet wzgl�dne uporz�dkowanie ponumerowanych obiekt�w. Dla takich przypadk�w wprowadzimy ostatnie ju� rozszerzenie zapisu schemat�w, dopuszczaj�ce zmian� kolejno�ci numer�w: wzgl�dne o-schematy z po�lizgiem i zamian� (typ rse). Tak wi�c wyra�enie rse'^{-) rozwija nieuporz�dkowan� list� numer�w na zbi�r o-schemat�w typu rs. Na przyk�ad o-schemat typu rse rse1^ (2 3 8) rozwija si� na zbi�r 6 o-schemat�w typu rs, wyznaczonych przez sze�� permutacji liczb 2, 3 i 8. Te mog� by� z kolei rozwini�te na o-schematy typu r i a. ��czne rozpatrywanie o-schemat�w i a-schemat�w daje mo�liwo�� pe�niejszego zrozumienia zachowania si� algorytm�w genetycznych pod k�tem wsp�dzia�ania operacji ,,allelicznych'' i rekonfiguracyjnych. Perspektywa taka pog��bia si�, je�li zwr�cimy uwag� na to, �e twierdzenie o schematach rozci�ga si� na o-schematy, a-schematy, jak te� na kombinacje obu typ�w schemat�w. Trzeba jednak pami�ta�, �e prawdopodobie�stwo sfjft^^^^^^^ 194 . 5. Techniki i operacje zaawansowane prze�ycia schematu pod dzia�aniem danej operacji zale�y od typu tego schematu. Na przyk�ad w pracy Goldberga i Lingle'a (1985) wyznaczono prawdopodobie�stwo prze�ycia dla o-schemat�w typu a (bezwgl�dnych) pod dzia�aniem operacji PMX. Podane przez Hollanda (1975) �prawdopodobie�stwo zniszczenia schemat�w" dotyczy o-schemat�w typu rse (wzgl�dnych z po�lizgiem i zamian�). Pog��biona analiza przetwarzania schemat�w w rodzaju tej, kt�r� przeprowadzili�my w rozdziale drugim dla problemu MDP, powinna przyczyni� si� do dalszego teoretycznego wyja�nienia problemu wsp�dzia�ania o-schemat�w i a-schemat�w w rozwi�zywaniu konkretnych zada�. 5.3. Inne mikrooperacje Zapoznamy si� teraz pokr�tce z kilkoma mechanizmami niskopoziomowymi, kt�rych u�ycie proponowano w modelach adaptacyjnego poszukiwania genetycznego. S� to: segregacja, translokacja, duplikacja wewn�trzchromosomowa, delecja i zr�nicowanie p�ciowe. W por�wnaniu z mechanizmem dominowania i operacji rekonfiguracyjnych maj� one jednak dla algorytm�w genetycznych drugorz�dne znaczenie. 5.3.1. Segregacja, translokacja i struktury wielochromosomowe __________ Rozwa�ali�my do tej pory genotypy z�o�one z pojedynczego chromosomu (haploidalne) oraz z pojedynczej pary chromosom�w (diploidalne). W przyrodzie wi�kszo�� organizm�w jest wyposa�ona w genotypy z�o�one z wieIu chromosom�w. Na przyk�ad aparat genetyczny cz�owieka sk�ada si� z 23 par chromosom�w dip�oidalnych. Zastosowanie podobnego rozwi�zania w zagadnieniach zwi�zanych z poszukiwaniem genetycznym wymaga�oby kolejnego rozszerzenia reprezentacji genotypu, tak by stanowi� on list� k par ci�g�w kodowych (zak�adaj�c diploidalno��). Co jednak mia�oby uzasadnia� takie powi�kszenie z�o�ono�ci reprezentacji? Holland (1975) sugerowa�, �e genotypy wielochromosomowe mog�yby przyczyni� si� do zwi�kszenia mocy algorytm�w genetycznych, gdyby zastosowa� je ��cznie z operacjami segregacji i translokacji. Aby zrozumie� mechanizm segregacji, wyobra�my sobie proces tworzenia si� gamet w sytuacji, gdy genotyp sk�ada si� z wi�cej ni� jednej pary chromosom�w. Krzy�owanie (crossing-over} przebiegajak dawniej; kiedyjednak przyst�pujemy do utworzenia gamety, wybieramy w�wczas po jednym z chromosom�w homologicznych. Ten proces losowej selekcji, zwany segregacj�, skutecznie likwiduje wszelkie sprz�enia mi�dzy genami ulokowanymi w r�nych chromosomach. Oczywi�cie, geny ulokowane w tym samym chromosomie s� w dalszym ci�gu mniej lub bardziej �ci�le sprz�one, zale�nie od dziel�cego je dystansu. Segregacjajest u�yteczn� operacj� w sytuacji, gdy wzgl�dnie niezale�ne geny rozmie�ci�y si� w r�nych chromosomach. Niekorzystne allele nie mog� w�wczas rozprzestrzenia� si� wykorzystuj�c sprz�enia z nie zwi�zanymi z nimi allela-mi o du�ej warto�ci przystosowawczej. 5.3. Inne mikrooperacje . 195 Ostatnie stwierdzenie jest pewnego rodzaju wyznaniem wiary. Je�li bowiem segregacja mo�e czyni� u�ytek z w�a�ciwej organizacji chromosomu, to w jaki spos�b chromosom uzyskuje w�a�ciw� organizacj�? Holland sugerowa�, �e dzieje si� tak dzi�ki translokacji. Translokacj� mo�na traktowa� jako swego rodzaju crossing-over z udzia�em r�nych chromosom�w. Aby zaimplementowa� tak� operacj� na u�ytek algorytm�w genetycznych, musimy zaopatrzy� ka�dy allel w pewien rodzaj �etykiety", aby mo�na go by�o zidentyfikowa� po przerzuceniu do innego chromosomu wskutek translokacji. W przyrodzie zdarza si�, �e w wyniku translokacji mo�e powsta� genotyp z niepe�nym garniturem gen�w; wydaje si� jednak, �e w modelach poszukiwania genetycznego mo�e-myipowinni�mytegounika�. -:x;;;<, &;uf'- r^; �; Om�wione operacje nie by�y, jak dot�d, przedmiotem zbyt wielu eksperyment�w z modelami poszukiwania genetycznego. Hollstien (1971) zastosowa� operacj� zbli�on� do segregacji w badaniach dotycz�cych genotyp�w diploidalnych z�o�onych z jednej pary chromosom�w. Przyj�� on, �e segregacja polega na losowej wymianie alleli mi�dzy �a�cuchami rodzicielskimi podczas mejozy. Przeprowadzone eksperymenty mia�y ograniczony zakres i Hollstien nie sformu�owa� �adnych og�lnych wniosk�w dotycz�cych tej operacji. W p�niejszych badaniach zwi�zanych z zastosowaniem algorytm�w genetycznych w problematyce maszyn ucz�cych si� konieczne okaza�o si� wprowadzenie genotyp�w rozszerzonych oraz operacji przypominaj�cych segregacj� i translokacj� (Schaffer, 1984; Smith, 1980). 5.3.2. Duplikacja i delecja Duplikacja i delecja to kolejna para operacji niskopoziomowych, kt�re proponowano zastosowa� w modelach poszukiwa� genetycznych. Duplikacja wewn�trzchromosomowa dzia�a na zasadzie podwojenia okre�lonego genu i umieszczenia jednocze�nie obu kopii w chromosomie. Delecja polega na usuni�ciu z chromosomu zduplikowanego egzemplarza genu. Holland (1975) sugerowa�, �e operacje te mog� by� skutecznie u�ywane w celu adaptacyjnego regulowania intensywno�ci mutacji. Je�li podstawowa intensywno�� mutacji pozostaje sta�a, a w wyniku duplikacji otrzymamy k egzemplarzy danego genu, to efektywne prawdopodobie�stwo mutacji (prawdopodobie�stwo, �e co najmniej jedna z k kopii ulegnie mutacji) tego genu wzrasta k razy]). I odwrotnie, skutkiem delecji jest zmniejszenie efektywnej intensywno�ci mutacji. Zauwa�my przy tym, �e kiedy jeden z egzemplarzy takiego genu zostanie zmutowany, wtedy musimy jako� zdecydowa�, kt�ra z kopii ujawni si�. Z analogiczn� sytuacj� mieli�my do czynienia w przypadku dominowania. Rzeczywi�cie mo�emy przyj��, �e pojawienie si� wielokrotnych kopii genu wywo�uje zjawisko dominowania wewn�trzchromosomowego, w przeciwie�stwie do zwyk�ego dominowania mi�dzychromosomowego, kt�re wyst�puje przy diploidalno-�ci. Holland proponowa� zastosowanie metody arbitra�u zbli�onej do dominowania, ale do tej pory nie opublikowano �adnych wynik�w bada� tego typu mechanizm�w. Gdy kpm� \ fynyp. t�um.). 196 . 5. Techniki i operacje zaawansowane Mogliby�my postawi� pytanie, czy duplikacja wewn�trzchromosomowa oraz dele-cja s�u�� tylko jako adaptacyjny mechanizm regulacji tempa mutacji. By� mo�e po cz�ci tak jest, jednak mieli�my ju� okazj� spotka� si� z przyk�adem zastosowania duplikacji do znacznie istotniejszych cel�w. W rozdziale czwartym wspomnieli�my mianowicie, �e Cavicchio (1970) u�y� tej operacji do wytwarzania nowych detektor�w cech. Ka�dy z jego gen�w okre�la� zbi�r pikseli wchodz�cych w sk�ad detektora. Duplikacje wewn�trzchromosomowe nie stwarza�y w tym przypadku problemu arbitra�u, a nast�puj�ce dalej mutacje lub krzy�owania z udzia�em nowego detektora mog�y doprowadzi� do powstania lepszego, odpowiedniejszego detektora. Pod pewnymi wzgl�dami naturalne struktury genetyczne przypominaj� �niechlujne kodowanie" Cavicchia; wzi�cie pod uwag� metod kodowania dopuszczaj�cych nadmiarowo��, zmienn� d�ugo�� i niepe�n� specyfikacj� przynios�oby, by� mo�e, pewne korzy�ci1}. 5.3.3. Determinacja p�ci i zr�nicowanie p�ciowe To dziwne, a przynajmniej zastanawiaj�ce, dlaczego w ksi��ce, w kt�rej konstruujemy algorytmy oparte na wzorach zaczerpni�tych z naturalnych proces�w reprodukcji i z genetyki, nie pojawi� si� do tej pory temat p�ci. Nie sta�o si� tak z braku zainteresowania ani te� dlatego, �e p�e� jest ma�o znacz�cym wynalazkiem o zaniedbywalnych efektach ubocznych. W tym punkcie om�wimy mechanizm determinacji p�ci i zbadamy jego przydatno�� w modelach poszukiwania genetycznego. Przyroda nie funkcjonuje tak prosto, jak zak�adali�my. W naszych naiwnych metodach kojarzenia pozwalali�my ka�demu osobnikowi wchodzi� w zwi�zki z dowolnym innym osobnikiem i zawsze dokonywali�my takiego podzia�u wynik�ych st�d produkt�w genetycznych, aby uzyska� zdolny do prze�ycia genotyp. W przyrodzie wieIe organizm�w dzieli si� na dwie (lub wi�cej) r�nych p�ci i musz� one w jaki� spos�b wej�� ze sob� w kontakt, aby zapewni� przetrwanie gatunku. Szczeg�owy obraz determinacji p�ci wygl�da r�nie u r�nych gatunk�w; dla naszych cel�w wystarczaj�co reprezentatywny jest jednak przyk�ad cz�owieka. Jedna z 23 par chromosom�w ludzkich determinuje p�e�. Kobiety maj� dwa identyczne chromosomy p�ci (chromosomy X), a m�czy�ni - dwa r�ne ^eden chromosom X i jeden chromosom Y). Podczas gametogenezy m�czy�ni wytwarzaj� plemniki, kt�re przenosz� albo chromosom X albo chromosom Y (w jednakowych proporcjach), natomiast kobiety wytwarzaj� jajeczka, kt�re przenosz� jedynie chromosom X. Gdy dojdzie do zap�odnienia, w�wczas zestawienie (pewnego) chromosomu X pochodz�cego od kobiety z (losowym) chromosomem X lub Y pochodz�cym od m�czyzny prowadzi do oczekiwanego (i obserwowanego) stosunku liczbowego p�ci m�skiej i �e�skiej 1:1. " Istotnie, pomys� ten zosta� p�niej wykorzystany w postaci tzw. niechlujnych algorytm�w genetycznych; por. D.E. Goldberg, B. Korb, K. Deb, Messy Genetic Algorithms: Motivation, Analysis, and First Results, TCGA Report No. 89003, May 1989, University of Alabama nyp. t�um.). 5.3. Inne mikrooperacje . 197 Jfc i Mimo �e mechanizm determinacji p�ci u cz�owieka jest do�� przejrzysty, przyroda dorzuca tu kilka interesuj�cych komplikacji. Pewna liczba cech nie zwi�zanych z p�ci� mo�e dziedziczy� si� za po�rednictwem chromosom�w p�ci. Te tak zwane cechy sprz�one z p�ci� s� zwi�zane najcz�ciej z chromosomem X. W dodatku, chocia� u wi�kszo�ci organizm�w chromosom X zawiera loci, kt�rych brak w chromosomie Y, u niekt�rych organizm�w oba te chromosomy zawieraj� odcinki homologiczne. W takim przypadku crossing-over zachodz�cy w strefie homologicznej mo�e powodowa� wyst�powanie niepe�nego sprz�enia z p�ci�, w por�wnaniu do organizm�w, u kt�rych zupe�ny brak homologiczno�ci wyklucza crossing-over. Wszystko to jest bardzo ciekawe. Nie mo�emy jednak zrezygnowa� z naszego pragmatycznego podej�cia w zamian za kilka tajemnych szczeg��w procesu reprodukcji. Wracaj�c do meritum, co mo�e nam da� determinacja i zr�nicowanie p�ciowe z punktu widzenia algorytm�w genetycznych? Niestety, w literaturze na temat algorytm�w genetycznych brak na razie publikacji po�wi�conych teoretycznym lub empirycznym studiom tych mechanizm�w. Niemniej jednak proste rozumowanie mo�e doprowadzi� do satysfakcjonuj�cego wyja�nienia ich u�yteczno�ci. Jest oczywiste, �e uformowanie si� r�nic p�ciowych prowadzi do podzia�u gatunku na dwie (lub wi�cej) kooperuj�ce grupy. Takie rozdwojenie umo�liwia samcom i samicom nieco odmienn� specjalizacj�, dzi�ki czemu mog� one �zagospodarowa�" wi�ksz� przestrze� zachowa� s�u��cych prze�yciu, ni� by�oby to mo�liwe w ramach jednej konkuruj�cej populacji. Aby nada� temu rozumowaniu bardziej wymierny charakter, rozwa�my wyidealizowany przypadek demonstruj�cy korzy�ci p�yn�ce z kooperacji i specjalizacji b�d�cych konsekwencj� naturalnych r�nic p�ciowych. Przypu��my, �e osobnik mo�e wybiera� mi�dzy zdobywaniem po�ywienia (�polowanie") a opiek� nad potomstwem (�wychowywanie"). Niech h b�dzie u�amkiem czasu po�wi�conym na polowanie, a n - u�amkiem czasu po�wi�conym na wychowywanie. B�dziemy przyjmowa�, �e prawdopodobie�stwo prze�ycia potomstwa 5 jest proporcjonalne do iloczynu tych u�amk�w: Ka�dy osobnik musi dokona� podzia�u swych zaj�� na czynno�ci zwi�zane z polowaniem i czynno�ci zwi�zane z wychowywaniem. Je�eli nast�pnie za�o�ymy, �e z wykonywaniem tych czynno�ci wi��e si� dodatkowa strata czasu proporcjonalna do iloczynu obu �wsp�czynnik�w aktywno�ci" (spadek wydajno�ci), to otrzymamy nast�puj�ce r�wna-nieopisuj�cepodzia�czasuzu�ywanegoprzezosobnika: ;,.,;: :;�-, � n + h + anh � 1 . -.< �.�.-, , ,- ..�;, : ��.� :, gdzie a jest wsp�czynnikiem spadku wydajno�ci z powodu braku specjalizacji. Maksymalizuj�c warto�� s przy u�yciu elementarnych metod, otrzymujemy nast�puj�ce optymalne poziomy wychowywania n* i polowania h* dla poszczeg�lnego osobnika: n* = h* = 198 . 5. Techniki i operacje zaawansowane kt�re osi�gaj� w granicy dla a = 0 warto�� n* = h* = Q,5. Wyra�aj�c to s�owami, osobnik mo�e w najlepszym razie wybra� kompromis mi�dzy dwiema niezb�dnymi czynno�ciami; przewaga czasu wydatkowanego na kt�r�kolwiek z nich zostaje ukarana spadkiem prze�ywalno�ci potomstwa. Ilustruje to graficznie rys. 5.13, gdzie s� pokazane wykresy zale�no�ci prze�ywalno�ci s od wsp�czynnika aktywno�ci wychowawczej n dla przypa-dkowa=l ia = 0. "'�" :��< ��- �*.< �.��> ,< 0,50- �o �OT O C S 0,25- a> t! 0. 0,00- a-0 0,0 0,5 1,0 Opieka nad potomstwem - n Rys. 5.13. Aby zmaksymalizowa� szanse przetrwania gatunku, samotny osobnik musi szuka� kompromisu mi�dzy opiek� nad potomstwem a zdobywaniem po�ywienia. Spadek wydajno�ci zwi�zany z brakiem specjalizacji (a>0) dodatkowo zmniejsza mo�liwo�� ' osi�gni�cia wysokiej prze�ywalno�ci Je�li dopu�cimy kooperacj� dw�ch osobnik�w, pozwalaj�c im dzia�a� w charakterze jednostki my�liwsko-wychowawczej, otrzymamy podobny model prze�ywalno�ci potomstwa. Oznaczaj�c odpowiednie wsp�czynniki aktywno�ci osobnik�w 1 i 2 przez ht, nt, h2 i �2, mo�emy wyrazi� prawdopodobie�stwo prze�ycia 5 wzorem gdzie czynnik 1/2 wprowadzono, by umo�liwi� bezpo�rednie por�wnanie z przypadkiem pojedynczego osobnika (teraz jest dwa razy wi�cej g��w do wykarmienia i wychowania). Podzia� czasu obu osobnik�w opisuje si� nast�puj�cymi r�wnaniami: '""""� n{ + hi + anihl - 1, i = 1, 2 Maksymalizuj�c prze�ywalno�� s ze wzgl�du na wsp�czynniki aktywno�ci my�liwskiej i wychowawczej otrzymujemy dwa przypadki do rozpatrzenia. Bez spadku wydajno�ci z powodu braku specjalizacji prze�ywalno�� osi�ga maksimum wzd�u� prostej okre�lonej r�wnaniem 5.3. Inne mikrooperacje. 199 M* + �* = 1 ., � ; ,:,. = : jak pokazano na rys. 5.14a, przedstawiaj�cym wykres prze�ywalno�ci jako funkcji wsp�czynnik�w aktywno�ci wychowawczej. Gdy nie ma strat, w�wczas istnieje bodziec do wsp�pracy (prze�ywalno�� wzrasta z 0,25 do 0,5), ale nie ma bod�ca do specjalizacji; wystarczy, aby ��czny czas po�wi�cany przez oba osobniki na polowanie (wzgl�dnie wychowanie)wynositjeden. , ;'-^'>f Je�li jednak pojawiaj� si� straty (a>0), sytuacja zmienia si� zasadniczo, co pokazuje rys. 5.14b. Optymalne zachowanie wymaga teraz specjalizacji. Maksimum prze- *) s(ry^) s(n Rys. 5.14. Kooperacja osobnik�w zwi�ksza szanse przetrwania; je�li jednak nie nast�puje spadek wydajno�ci z powodu braku specjalizacji, to nie ma te� powod�w do specjalizacji (a). Je�li wyst�puje spadek wydajno�ci, maksymaln� prze�ywalno�� osi�ga si� przy maksymalnej specjalizacji (b) 200 5. Techniki i operacje zaawansowane �ywalno�ci otrzymuje si�, gdy (�,, �2) = (1, 0) lub (nt, n2) = (Q, 1). Mamy tu nadal przewag� w stosunku do przypadku osobnika samowystarczalnego, straty za� zostaj� zminimalizowane. Chocia� powy�szy model jest bardzo uproszczony, demonstruje on istot� kooperacji i specjalizacji, kt�rym s�u�y zr�nicowanie p�ciowe. Przysz�e pr�by z wykorzystaniem p�ciowo�ci w modelach poszukiwania genetycznego wyka�� zapewne przewag� tego typu mechanizmu w zagadnieniach wymagaj�cych, podobnie jak wy�ej, po��czenia kooperacji ze specjalizacj�. . � 5.4. Nisze i specjacja Zr�nicowanie p�ciowe otworzy�o drog� specjalizacji, kt�ra w przyrodzie si�ga jeszcze dalej poprzez specjacj� (powstawanie gatunk�w) i wype�nianie nisz ekologicznych. Intuicyjnie nisz� mo�emy przyr�wna� do okre�lonego �zawodu" lub funkcji pe�nionej przez dany organizm w �rodowisku, natomiast przez gatunek mo�emy rozumie� klas� organizm�w o wsp�lnej charakterystyce. Ten podzia� �rodowiska i organizm�w wykorzystuj�cych �rodowisko na odr�bne podzbiory jest tak powszechny w przyrodzie, �e rzadko po�wi�camy mu specjaln� uwag�. W �wietle tego mo�e wyda� si� niezrozumia�e, dlaczego jeszcze nie zaobserwowali�my stabilnych podpopulacji ci�g�w kodowych (czyli gatunk�w), zwi�zanych z r�nymi poddziedzinami funkcji (niszami) w wi�kszo�ci omawianych przyk�ad�w. W tym punkcie poka�emy, w jaki spos�b wprowadzenie nisz i gatunk�w mo�e dopom�c w procesie poszukiwania realizowanym za pomoc� algorytmu genetycznego, przedstawimy wyniki teoretyczne dotycz�ce tego problemu oraz wska�emy metod� urzeczywistnienia podobnych mechanizm�w w algorytmach genetycznych. o,o 0,5 X (a) R�wne wierzchoN;. ;h: ,:, 202 5. Techniki i operacje zaawansowane 5.4.1. Teoria nisz i gatunk�w Mimo �e istnieje obszerna literatura biologiczna na temat nisz ekologicznych i specjacji, jak dot�d niewiele uda�o si� z niej przenie�� na grunt algorytm�w genetycznych. Tak jak i w przypadku wielu innych pomys��w i operacji, pierwsze koncepcje teoretyczne maj�ce bezpo�rednie odniesienie do algorytm�w genetycznych przypisuje si� tu Hollandowi (1975). Aby zilustrowa� mechanizm nisz i specjacji, Holland pos�u�y� si� zmodyfikowan� wersj� zagadnienia dwuramiennego bandyty z podzia�em [sharing] wyp�aty. Prze�led�my zatem jego rozumowanie dla konkretnego sformu�owania tego problemu. Lewa kolejka J� dzieli si� 1 f mat�wygran� /\^ Prawa kolejka dzieli si� du�� wygran� Rys. 5.16. Dwuramienny bandyta z podzia�em wygranych pomi�dzy graczy w kolejkach Wyobra�my sobie dwuramiennego bandyt� z rys. 5.16. Tak jak w zagadnieniu dwuramiennego bandyty, kt�re rozwa�ali�my w rozdziale drugim, mamy tu dwa ramiona - lewe i prawe - i z ka�dym z nich jest zwi�zana inna �rednia wyp�ata. Przypu��my, �e dla prawego ramienia wynosi ona 75 dolar�w, a dla lewego - 25 dolar�w; podobnie jak w oryginalnym sformu�owaniu zagadnienia, pocz�tkowo nie wiemy, kt�re z ramion zapewnia wi�ksz� wygran�. Za��my nast�pnie, �e mamy populacj� z�o�on� ze 100 graczy i �e ka�dy z nich otrzymuje pe�n� kwot� wygranej zwi�zan� z ramieniem, kt�re wybra� w danej pr�bie. Je�li poprzestaniemy na tym i pozwolimy graczom wybiera� dowolne 5.4. Nisze i specjacja 203 rami�, to sytuacja b�dzie wygl�da� podobnie jak w pierwotnej wersji zagadnienia. Je�li gracze �reprodukuj� si�" proporcjonalnie do przystosowania, to coraz wi�ksza liczba cz�onk�w populacji powinna ustawia� si� w kolejce do lepszego (prawego) ramienia, a� wres/xie ca�a populacja skupi si� w jednej kolejce. Na razie nie mieli�my powodu oczekiwa� tworzenia si� nisz; wszystkie eksperymenty zostaj� w ostateczno�ci skierowane do najlepszego empirycznie ramienia. Wprowadzimy teraz istotn� modyfikacj� do zasad gry, kt�ra spowoduje tworzenie si� stabilnych podpopulacji wok� ka�dego z ramion. Zamiast wyp�aca� pe�n� wygran� ka�demu osobnikowi, b�dziemy j� dzieli� pomi�dzy graczy z danej kolejki. Na pierwszy rzut oka wygl�da to na do�� drobn� zmian�. W rzeczywisto�ci ta jedna modyfikacja poci�ga za sob� dramatyczne i zaskakuj�ce skutki. Aby przekona� si�jak i dlaczego zmienia si� zachowanie graczy, zwr��my uwag�, �e mimo nieco odmiennych regu� gry, cz�onkowie populacji nadal reprodukuj� si� proporcjonalnie do przystosowania. W zmodyfikowanej grze ka�dy osobnik otrzymuje wyp�at� zale�n� od ramienia, kt�re wybra� oraz od liczby osobnik�w stoj�cych w tej samej co on kolejce. W naszym konkretnym przyk�adzie osobnik ustawiony w kolejce do prawego ramienia otrzymuje - w przypadku gdy wszyscy pozostali gracze stoj� w tej samej kolejce - kwot� $75/100 = $0,75. Z drugiej strony, gdyby wszyscy gracze ustawili si� do lewego ramienia, ka�dy graj�cy otrzymywa�by kwot� $25/100 = $0,25. W obu przypadkach pewna liczba graczy ma motywacj� do zmiany kolejki. W pierwszym z nich pojedynczy gracz zmieniaj�cy kolejk� zarabia na tym kwot� $25,00 - $0,75 = $24,25. W drugim przypadku motywacja do zmiany kolejki jest jeszcze wi�ksza. Mo�emy wi�c spodziewa� si�, �e gdzie� po�rodku le�y punkt, w kt�rym nikomu nie op�aca si� ju� zmienia� kolejki. Dzieje si� tak, gdy wyp�aty dla poszczeg�lnych graczy w obu kolejkach s� jednakowe. Je�eli M jest wielko�ci� populacji i mk,we jest d�ugo�ci� kolejki do lewego ramienia, ml>rawe - d�ugo�ci� kolejki do prawego ramienia, flewf - �redni� wyp�at� dla lewego ramienia i fprawe - �redni� wyp�ata dla prawego ramienia, to punkt r�wnowagi okre�laj� r�wno�ci J\>rawe __ J]iruv* m,, Jltwe m W naszym przyk�adzie ca�kowite wyr�wnanie wyp�at indywidualnych nast�pi, gdy 75 graczy wybierze prawe rami�, a 25 graczy - lewe rami�, poniewa� $75/75 = $25/25 = $l. Bezpo�rednie uog�lnienie tego modelu na przypadek &-ramienny nie zmienia zasadniczej konkluzji. Wprowadzenie przymusowego podzia�u poci�ga za sob� formowanie si� stabilnych podpopulacji (gatunk�w) zwi�zanych z r�nymi ramionami (niszami). W dodatku liczba osobnik�w zajmuj�cych okre�lon� nisz� jest proporcjonalna do oczekiwanej wyp�aty z niszy. Jest to dok�adnie ten typ zachowania, kt�rego oczekiwali�my, rozpatruj�c zagadnienia wielomodalne z rys. 5.15. Oczywi�cie, przeniesienie koncepcji podzia�u na grunt prawdziwych algorytm�w genetycznych jest spraw� trudniejsz�, ni� sugeruje to powy�szy wyidealizowany przyk�ad. W rzeczywistym algorytmie genetycznym mamy do czynienia z wieloma ramionami i decyzja, kto i w jakim stopniu powinien korzysta� z podzia�u, nie jest banaln� kwesti�. W nast�pnym punkcie omawiamy 204 . 5. Techniki i operacje zaawansowane sposoby wywo�ania zjawiska formowania si� nisz za pomoc� mechanizmu podzia�u lub czego� w tym rodzaju. Przedtem jednak musimy zaj�� si� jeszcze jednym teoretycznym aspektem specjacji. Uznaj�c znaczenie podzia�u dla formowania si� nisz, mamy do dyspozycji prawie gotowy aparat teoretyczny, potrzebny do obja�nienia funkcjonowania tego mechanizmu w modelu poszukiwa� genetycznych; jednak pewna dodatkowa obserwacja przyrodnicza pozwoli nam osi�gn�� jeszcze wi�cej. Ot� w naszym elementarnym modelu pozwalali�my na losowe kojarzenie si� osobnik�w. Jest to niezgodne z wi�kszo�ci� przyk�ad�w biologicznych. Ludzie nie szukaj� partner�w w�r�d kot�w, a �aby w�r�d uczonych (cho� gdyby tak by�o, to mo�e mieliby�my naukowc�w chwytaj�cych w lot problemy). Spostrze�enie, �e przedstawiciele poszczeg�lnych gatunk�w nie s� sk�onni kojarzy� si� z osobnikami niepodobnymi do nich samych, stawia przed nami pytanie, dlaczego tak si� dzieje. M�wi�c inaczej, jak� korzy�� selekcyjn� przynosi regu�a stanowi�ca, �e podobne kojarzy si� z podobnym (kojarzenie selektywne dodatnie), kt�rej zdaje si� przestrzega� wi�kszo�� gatunk�w? Prosty przyk�ad z dziedziny optymalizacji funkcji zn�w dopomo�e nam w na�wietleniu podstawowej idei. Przypu��my, �e mamy do czynienia z funkcj� przybieraj�c� warto�ci maksymalne na przeciwleg�ych ko�cach odcinka, na kt�rym jest okre�lona (rys. 5.17). Je�li u�yjemy zwyk�ego dw�jkowego kodu pozycyjnego, to osobniki po�o�one w pobli�u lewego maksimum b�d� mia�y w sobie du�o zer, podczas gdy osobniki po�o�one w pobli�u prawego maksimum b�d� mia�y du�o jedynek (lewe maksimum funkcja osi�ga dla ci�gu 00000, a prawe - dla ci�gu 11111). W miar� jak post�puje proces reprodukcji, krzy�owania i mutacji, osobniki potomne b�d� na og� przypomina� f(x) Skrzy�owanie dobrze przystosowanych rodzic�w daje nieprzystosowane potomstwo Rys. 5.17. Prosta funkcja dwumodalna ilustruj�ca potrzeb� stosowania barier reprodukcyjnych. Krzy�owanie si� dw�ch niepodobnych niemaloptymalnych osobnik�w prawie zawsze prowadzi do degeneracji 5.4. Nisze i specjacja 205 takie ci�gi, jak 00111 lub 11000 (a wi�c stosunkowo bezu�yteczne - w tym przypadku - zestawienia zer i jedynek). Kojarzenie mi�dzygatunkowe prowadzi wi�c w ten spos�b do tworzenia upo�ledzonego potomstwa (degenerat�w). Je�eli natomiast uda si� wywrze� presj� w kierunku kojarzenia si� osobnik�w podobnych, to produkcja bezu�ytecznego potomstwa mo�e zosta� ograniczona. Wskazuje to na potrzeb� znalezienia metod wspomagaj�cych bardziej owocne wzorce kojarzenia. 5.4.2. Metody niszowe w poszukiwaniach genetycznych Realizowano ju� r�ne metody powoduj�ce formowanie si� nisz w algorytmach genetycznych. W niekt�rych z tych technik podzia� ujawnia si� w spos�b po�redni. Chocia� zagadnienie dwuramiennego bandyty z podzia�em jest prost� abstrakcj� formowania si� i wype�niania nisz ekologicznych, przyroda nie dzieli si� swymi dobrami w tak bezpo�redni spos�b. W naturalnych warunkach podzia� dochodzi do skutku poprzez konkurencj� i konflikt. Kiedy siedlisko pewnego organizmu zostaje przepe�nione, zamieszkuj�ce je osobniki s� zmuszone dzieli� mi�dzy siebie dost�pne zasoby. Cavicchio (1970) by�jednym z pierwszych, kt�rzy podj�li pr�b� wywo�ania ,,ni-szopodobnego" zachowania algorytmu genetycznego. Wprowadzi� on mechanizm nazwany preselekcj�. By�a to metoda polegaj�ca na zast�powaniu gorszego z rodzic�w przez jego potomka, o ile tylko potomek wykazywa� lepsze od niego przystosowanie. Populacja by�a dzi�ki temu zdolna do zachowania r�norodno�ci, gdy� ci�gi kodowe mia�y tendencj� do zast�powania podobnych do siebie jednego ze swych rodzic�w). Cavicchio twierdzi�, �e uda�o mu si� w ten spos�b utrzymywa� bardziej r�norodne populacje w szeregu przebieg�w symulacyjnych, przy stosunkowo niedu�ych rozmarach populacji (� = 20). De Jong (1970) uog�lni� technik� preselekcji w postaci modelu ze �ciskiem. W modelu tym u�ywa si� populacji mieszanych (wielopokoleniowych), przy czym nowe osobniki zast�puj� inne wed�ug kryterium podobie�stwa. Nowy osobnik zostaje por�wnany z losow� podpopulacj� o rozmiarze r�wnym czynnikowi �cisku CF. Osobnik o najwy�szym stopniu podobie�stwa (w sensie minimalnej liczby r�nic na poszczeg�lnych pozycjach) zostaje nast�pnie zast�piony przez nowoutworzony ci�g. Pocz�tkowo dzia�anie tego mechanizmu nie odbiega od losowego wyboru element�w do usuni�cia, gdy� wszystkie osobniki s� na og� w tym samym stopniu niepodobne do siebie. W miar� jak symulacja post�puje i coraz wi�cej osobnik�w w populacji upodabnia si� do siebie (zaczyna si� wy�ania� jeden lub wi�cej gatunk�w), zast�powanie jednych osobnik�w innymi, podobnymi do nich osobnikami, sprzyja utrzymaniu r�norodno�ci i tworzy przestrze� �yciow� dla dw�ch lub wi�cej gatunk�w. De Jong odni�s� sukces, stosuj�c model ze �ciskiem do funkcji wielomodalnych przy czynniku �cisku CF r�wnym 2 lub 3. Podobna metoda by�a p�niej u�yta w zastosowaniach zwi�zanych z maszynami ucz�cymi si� (Goldberg, 1983). Zwr��my uwag� na to, �e ani preselekcja Cavicchia, ani �cisk De Jonga nie wydaj� si� wykazywa� analogii do omawianego wcze�niej podzia�u zasob�w. Oba mechanizmy wywo�uj� jednak co� w rodzaju po�redniego podzia�u w nast�puj�cym 206 . 5. Techniki i operacje zaawansowane sensie. Pod nieobecno�� preselekcji lub �cisku osobnik w populacji mieszanej podlega wymianie losowej (zjednakowym prawdopodobie�stwem wyboru dla wszystkich). Je�eli osobnik jest wymieniany z wi�ksz� intensywno�ci� (ni� przy wymianie losowej), jak to dzieje si� przy �cisku lub preselekcji, gdy wy�ania si� gatunek, to traci cz�� dochodu" (potomstwa), poniewa� nie realizuje pe�nego potencja�u reprodukcyjnego. M�wi�c inaczej, chocia� �cisk i preselekcja koncentruj� si� na aspekcie zast�powania, to wymuszaj�c wcze�niejsze �odej�cie" przedstawicieli nazbyt licznych gatunk�w, redukuj� liczb� ich potomstwa, zwalniaj�c w ten spos�b miejsce dla innych. Najbardziej bezpo�rednie odniesienia do biologicznej teorii nisz w kontek�cie algorytm�w genetycznych mo�na znale�� w rozprawie Perry'ego (1984). W pracy tej Perry okre�la odwzorowanie genotyp-fenotyp, definiuje �rodowisko wieloczynnikowe oraz specjalny obiekt zwany schematem zewn�trznym. Schematy zewn�trzne to specyficzne wzorce podobie�stwa okre�lone przez projektanta systemu, s�u��ce do scharakteryzowania przynale�no�ci gatunkowej. Niestety, konieczno�� odwo�ania si� do interwencji czynnika zewn�trznego ogranicza mo�liwo�ci praktycznego zastosowania tej techniki w modelach poszukiwania genetycznego. Niemniej jednak Czytelnik interesuj�cy si� zwi�zkami mi�dzy biologiczn� teori� nisz a algorytmami genetycznymi znajdzie w tej pracy ciekawy materia�. Grosso (1985) r�wnie� nada� orientacj� biologiczn� swej pracy po�wi�conej mechanizmom formowania si� podpopulacji oraz migracji mi�dzy nimi. Poniewa� u�y� on do bada� multyplikatywnych funkcji celu faworyzuj�cych osobniki heterozygotyczne (efekt heterozji), otrzymane przeze� wyniki nie maj� bezpo�redniego zastosowania w wi�kszo�ci modeli poszukiwa� genetycznych; jednak�e Grosso by� w stanie wykaza� wy�szo�� umiarkowanej intensywno�ci migracji nad izolacj� podpopulacji (brakiem migracji) oraz panmi-ksj� (ca�kowit� swobod� kojarzenia prowadz�c� do wymieszania podpopulacji). Badania te sugeruj�, �e uwzgl�dnienie czynnika geograficznego w poszukiwaniach genetycznych mo�e sprzyja� formowaniu si� odr�bnych podpopulacji. Konieczne s� dalsze studia, aby wyja�ni�, jak mo�na tego dokona� w typowych zagadnieniach poszukiwania. Praktyczna metoda kreowania nisz i gatunk�w, oparta bezpo�rednio na idei podzia�u zasob�w, zosta�a opisana przez Goldberga i Richardsona (1987). Wprowadza si� tamfunkcj� wsp�tudzia�u [sharingfunction], kt�ra okre�la s�siedztwo i stopie� wsp�udzia�u dla ka�dego ci�gu kodowego w populacji. Aby zobaczy�, jak dzia�a ten mechanizm, rozwa�my znaneju� prostejednoargumentowe funkcje przystosowania z rys. 5.15 oraz liniow� funkcj� wsp�udzia�u, pokazan� na rys. 5.18. Liczb� wsp�udzia��w dla danego osobnika0 oblicza si�, sumuj�c wszystkie warto�ci funkcji wsp�udzia�u wnoszone przez inne ci�gi w populacji. Ci�gi znajduj�ce si� w bliskim s�siedztwie danego osobnika maj� du�e wsp�udzia�y (bliskie jedno�ci), natomiast ci�gi odleg�e - bardzo ma�e wsp�udzia�y (bliskie zeru). Poniewa� osobnik znajduje si� bardzo blisko (najbli�ej jak mo�na) siebie, zatem warto�� funkcji wsp�udzia�u wynosi dla niego 1 (podobnie jak dla ka�dego identycznego z nim ci�gu). Po zsumowaniu wszystkich obliczonych w ten " Liczba wsp�udzia��wjest miar� zapotrzebowania na zasoby �rodowiska w s�siedztwie danego osobnika tyrzyp. tlutn). 5.4. Nisze i specjacja 207 g o. I 1,0- 0,0 Odleg�o�� d^ = |fc-^H Rys. 5.18. Liniowa funkcja wsp�udzia�u. Za Goldbergitm i Richardsonem (1987) spos�b wsp�udzia��w, zdeprecjonowany wska�nik przystosowania osobnika oblicza si�, dziel�c jego potencjalny wska�nik przystosowania przez ��czn� liczb� wsp�udzia��w: /,(*i) = T: #10tt:1010 #01#:1100 ,. - ttOO#:0000 . ... i, * J W powy�szych ci�gach wzorce kojarzeniowe (podci�gi po�o�one na lewo od dwukropka) zosta�y zbudowane z symboli tr�jelementowego alfabetu 0, 1, #. Symbol 0 we wzorcu pasuje do symbolu 0 w cz�ci funkcjonalnej, podobnie 1 pasuje do 1, a # pasuje do 0 lub 1. W celu stwierdzenia, kt�re z ci�g�w kodowych mog� si� ze sob� kojarzy�, wzorzec kojarzeniowy jednego ci�gu zostaje por�wnany z cz�ci� funkcjonaln� drugiego ci�gu. Mo�na tu wprowadzi� r�ne regu�y: 1) pe�n� zgodno�� dwustronn�; 2) pe�n�zgodno��jednostronn�; . ,, ^,. 3) najlepsz� zgodno�� cz�ciow�. Cz�� funkcjonalna ci�gu zostaje zdekodowana w zwyk�y spos�b w celu okre�lenia warto�ci parametr�w i wska�nika przystosowania. Wracaj�c do przyk�adu, dwa pierwsze ci�gi s� zdatne do kojarzenia przy regule zgodno�ci dwustronnej, gdy� wzorzec kojarzeniowy ka�dego z nich pasuje do cz�ci funkcjonalnej drugiego (#10# pasuje do 1100 i #01# pasuje do 1010). Trzeci z ci�g�w nie jest kandydatem nadaj�cym si� do kojarzenia, gdy� jego wzorzec kojarzeniowy nie pasuje do cz�ci funkcjonalnej �adnego z pozosta�ych. Taki mechanizm kojarzenia jest do�� prosty, ale dlaczego w�a�ciwie powinni�my komplikowa� istniej�ce operacje? Przede wszystkim chcieliby�my, aby jednocze�nie z selekcj� genotyp�w pod wzgl�dem przystosowania mog�y ulega� adaptacji ich praktyki kojarzeniowe. Czyni�c wzorzec kojarzeniowy cz�ci� genotypu, poddajemy go selekcji i dzia�aniu operacji genetycznych Qak krzy�owanie, mutacja i inne). W ten spos�b populacja wykszta�ca drog� ewolucji preferencje reprodukcyjne, kt�re sprzyjaj� wytwarzaniu lepszego potomstwa. �w efekt drugiego rz�du mo�e si� pocz�tkowo wyda� niezgodny z intuicj�, ale przecie� mieli�my ju� okazj� dyskutowa� podobny mechanizm, kiedy rozwa�ali�my mo�liwo�� kontroli genetycznej nad parametrami algorytmu genetycznego, takimi jak prawdopodobie�stwa krzy�owania i mutacji (Bowen, 1986). Poniewa� 212 5. Techniki i operacje zaawansowane w aktualnie rozwa�anym przypadku �plakietki preferencyjne" nie wp�ywaj� bezpo�rednio na warto�� przystosowawcz� (nie zmieniaj� parametr�w rozwi�zania), wiec mamy tu w�a�ciwie do czynienia ze spraw� wydajno�ci: preferowanie dobrych partner�w zwi�ksza prawdopodobie�stwo dalszej poprawy wynik�w (zmniejsza prawdopodobie�stwo destrukcji), mo�emy zatem oczekiwa� wzrostu tempa poprawy w stosunku do algorytm�w bez adaptacyjnych barier reprodukcyjnych. Proponowano liczne ulepszenia podstawowej wersji mechanizmu. Jedno z zastrze�e� wysuwanych wobec metody Bookera dotyczy konieczno�ci do��czenia do ci�gu kodowego wzorca kojarzeniowego o tej samej d�ugo�ci, co cz�� funkcjonalna. Poniewa� mechanizm barier reprodukcyjnych przynosi w najlepszym razie wt�rne korzy�ci, nale�y w�tpi�, czy wartjest inwestycji w postaci co najmniej dwukrotnego zwi�kszenia pami�ci (nie wspominaj�c ju� o dodatkowym koszcie obliczeniowym zwi�zanym z por�wnywaniem pe�nych ci�g�w). W odpowiedzi na te obiekcje Holland (doniesienie prywatne, 1985) zaproponowa� zastosowanie trzycz�ciowych ci�g�w kodowych, sk�adaj�cych si� z kr�tkiego wzorca kojarzeniowego, kr�tkiego identyfikatora kojarzeniowego i cz�ci funkcjonalnej o pe�nej d�ugo�ci. Kr�tkie wzorce kojarzeniowe by�yby tu por�wnywane z kr�tkimi identyfikatorami kojarzeniowymi, a cz�ci funkcjonalne nie bra�yby udzia�u w tym rytuale godowym. Przyk�adowa para trzycz�ciowych chromosom�w mog�aby wygl�da� nast�puj�co: :: #10#:1010:10010011101010 #0##:1100:11111000010010 Zauwa�my, �e wzorzec pierwszego ci�gu pasuje do identyfikatora drugiego ci�gu i odwrotnie. Istnieje wiele odmian mechanizmu barier reprodukcyjnych. Spraw� otwart� pozostaje, czy lepszajest zgodno�� dwustronna czyjednostronna, a Booker (1982) posun�� si� nawet do sugestii, aby rozpatrywa� r�ne stopnie zgodno�ci cz�ciowej, kiedy nie ma mowy o pe�nej zgodno�ci. Chocia� te i podobne pomys�y brzmi� wiarogodnie, nie przedstawiono na razie wielu argument�w teoretycznych ani empirycznych na ich poparcie. W konsekwencji problem wzorc�w i identyfikator�w kojarzeniowych pozostaje wci�� p�odnymtematembadawczym. � 5.5. Optymalizacja wielokryterialna Wszystkie dotychczas prezentowane zadania optymalizacji i poszukiwania sprowadza�y si� do jednego kryterium. Kryterium to (reprezentowane przez funkcj� celu) by�o nast�pnie przekszta�cane do postaci funkcji przystosowania, po czym mogli�my ju� przyst�powa� do realizacji planu reprodukcyjnego z udzia�em operacji genetycznych. Podej�cie takie zdaje egzamin w wielu zagadnieniach, ale zdarza si�, �e mamy do czynienia z wieloma kryteriami jednocze�nie i nie jest rzecz� mo�liw� (ani rozs�dn�) wyra�a� je w po- 5.5. Optymalizacja wielokryterialna 213 staci jednej liczby. M�wimy w takich przypadkach, �e jest to problem optymalizacji wielokryterialnej lub polioptymalizacji. Zagadnienia te s� od dawna przedmiotem zainteresowania badaczy stosuj�cych tradycyjne techniki optymalizacji i poszukiwania. Niedawno (Schaffer, 1984) do rozwi�zania zadania optymalizacji wielokryterialnej u�yto algorytm�w genetycznych. W przypadku jednego kryterium poj�cie rozwi�zania optymalnego nie wymaga specjalnych wyja�nie�. Poszukujemy najlepszej (najwi�kszej lub najmniejszej) warto�ci pewnej, z za�o�enia dobrze okre�lonej funkcji celu (reprezentuj�cej u�yteczno�� lub koszl). Natomiast przy optymalizacji wielokryterialnej pojecie rozwi�zania optymalnego nie jest tak oczywiste. Je�eli z g�ry nie zgadzamy si� por�wnywa� ze sob� warto�ci r�nych kryteri�w (powiedzmy, jab�ek i pomara�czy), to musimy zaproponowa� tak� definicj� optymalno�ci, kt�ra respektuje integralno�� ka�dego z nich. Przychodzi nam tu z pomoc� poj�cie optymalno�ci w sensie Pareto. Najlepiej zilustrowa� je na prostym przyk�adzie. Przypu��my, �e producent �widget�w" chcia�by zminimalizowa� jednocze�nie wypadkowo�� przy pracy i koszty produkcji. Obydwa te kryteria maj� istotne znaczenie dla powodzenia jego przedsi�wzi�cia, a w dodatku konsekwencje wypadku nie�atwo przeliczy� na dolary. Tak wi�c przyk�ad ten jest dobrym kandydatem do optymalizacji wielokryterialnej. Przypu�my nast�pnie, �e istnieje pi�� mo�liwych wariant�w organizacji procesu produkcji (scenariusze A, B, C, D i E), o nast�puj�cych charakterystykach pod wzgl�dem kosztu i wypadkowo�ci: - ... A = (2, 10) (koszt produkcji, liczba wypadk�w przy pracy) # = (4,6) C=(8,4) D = (9,5) E=(1, 8) Dane te s� przedstawione na rys. 5.22 (wypadkowo�� w zale�no�ci od koszt�w). Na pierwszy rzut oka wykres ten nie wydaje si� by� specjalnie pouczaj�cy: wida� po prostu pi�� chaotycznie rozmieszczonych punkt�w. Po chwili zastanowienia odkrywamy jednak, �e najlepsze punkty znajduj� si� w obszarze po�o�onym w dolnej i lewej cz�ci prostok�ta. W szczeg�lno�ci scenariusze A, B i C sprawiaj� wra�enie dobrych kandydat�w do wyboru: wprawdzie �aden nie jest optymalny ze wzgl�du na ka�de z dw�ch kryteri�w jednocze�nie, ale decyzja wyboru kt�rego� z nich jest kwesti� kompromisu -je�li zyskujemy co� najednej osi, to tracimy na drugiej. W �argonie optymalizacyjnym m�wi si�, �e te trzy punkty reprezentuj� rozwi�zania niezdominowane, poniewa� nie istniej� �adne punkty, kt�re by�yby lepsze ze wzgl�du na wszystkie kryteria jednocze�nie. Z drugiej strony scenariusze D i E nie przedstawiaj� si� jako atrakcyjni kandydaci. Jest tak dlatego, �e obydwa rozwi�zania s� zdominowane przez jakie� inne. Scenariusz E (7, 8) jest zdominowany przez scenariusz B (4, 6), gdy� 4<7 i 6<8. A scenariusz D (9, 5) jest zdominowany przez C (8, 4), bo 8<9 i 4<5. Tak wi�c w tym zadaniu (i w innych zadaniach z wieloma kryteriami) zamiast jednej odpowiedzi otrzymujemy ca�y zbi�r rozwi�za�, z kt�rych �adne nie jest zdominowane przez drugie. 214 5. Techniki i operacje zaawansowane S� to rozwi�zania optymalne w s'ensie Pareto (P-optymalne). W rozwa�anym przypadku zbiorem scenariuszy P-optymalnychjest zbi�r {A, B, C}. Patrz�c od strony praktycznej, koncepcja optymalno�ci w sensie Pareto nie daje wskaz�wek co do wyboru ostatecznego rozwi�zania spo�r�d P-optymalnych. Decydent jest w ko�cu zmuszony samodzielnie oceni� wszystkie warianty przed wydaniem werdyktu. �o �w o o 10- A-(2. 10) D E-c, e> D Q C-(8. 4) a D-<9. 5) a Koszty produkcji Rys. 5.22. Ilustracja problemu optymalizacji wielokryterialnej. Por�wnanie pi�ciu scenariuszy ze wzgl�du na wypadkowo�� i koszty produkcji. Scenariusze A, B \ C s� niezdominowane Warunek optymalno�ci w sensie Pareto mo�na w �cis�ej postaci matematycznej sformu�owa� nast�puj�co: Powiemy, �e wektor*jest mniejszy (cz�ciowo) od wektoraj>, wtedy i tylko wtedy, gdy M�wimy wtedy r�wnie�, �e punktjjest zdominowany przez punktjc0. Je�eli dany punkt nie jest zdominowany przez �aden inny, to nazywamy go punktem niezdominowa-nym. B�dziemy u�ywa� tych podstawowych definicji, omawiaj�c zastosowanie algorytm�w genetycznych w zagadnieniach wielokryterialnych. Pomys� zastosowania poszukiwania genetycznego w problemach wielokryterialnych datuje si� od najwcze�niejszych eksperyment�w z algorytmami genetycznymi. Praca Rosenberga (1967) zawiera sugestie, kt�re musia�yby logicznie doprowadzi� do optymalizacji wielokryterialnej, gdyby autor zdecydowa� si�je zrealizowa�. Proponowa� on u�ycie wielu w�a�ciwo�ci (odpowiadaj�cych pewnym kompozycjom sk�adnik�w chemi- Autor u�ywa zamiennie termin�w punkt i wektor Q)rz.yp. tlum.). 5.5. Optymalizacja wielokryterialna 215 cznych) w symulacjach proces�w genetycznych i biochemicznych zachodz�cych w populacji organizm�wjednokom�rkowych. W faktycznej implementacji Rosenberg ograniczy� si� jednak do tylko jednej w�a�ciwo�ci, przez co jego pomys� mo�e by� uznany zaledwie za zapowied� nadchodz�cych zdarze�. Praktyczna metoda zosta�a rozwini�ta 17 lat p�niej przez Schaffera (1984) wjego programie VEGA (Vector Evaluated Genetic Algorithm). Schaffer rozszerzy� program GENESIS Grefenstette'a (1984a, b), dostosowuj�c go do zada� wielokryterialnych. Program tworzy� podpopulacje jednakowej wielko�ci, wewn�trz kt�rych by�a przeprowadzana selekcja ze wzgl�du na oddzielne kryteria w wektorze ewaluacji. Mimo �e selekcja odbywa�a si� niezale�nie dla ka�dego kryterium, kojarzenie i krzy�owanie przekracza�o granice podpopulacji. Schaffer zdawa� sobie spraw�, �e cho� metoda taka jest �atwa w implementacji, to selekcja wed�ug niezale�nych kryteri�w wykazuje tendencj� na niekorzy�� osobnik�w �po�rednich" (takich jak scenariusz B - dobrych ze wzgl�du na ka�de kryterium, ale nie najlepszych ze wzgl�du na �adne z nich). Stosowa� on r�ne heurystyki w��cznie z redystrybucj� d�br i krzy�owaniem linii, pr�buj�c przezwyci�y� t� trudno��, ale w ko�cu poprzesta� na zwyk�ej niezale�nej selekcji. Schaffer przetestowa� program VEGA na zestawie siedmiu funkcji. Poprawno�� programu zosta�a sprawdzona na przyk�adzie funkcji F1 De Jonga. Dwie proste funkcje zosta�y zaczerpni�te z literatury na temat optymalizacji wielokryterialnej (Vincent i Grantham, 1981), a cztery inne - z literatury dotycz�cej technik regulacji (zagadnienia identyfikacji z obiektami sterowanymi od drugiego do si�dmego rz�du). Chc�c pozna� typowe wyniki dzia�ania programu, rozwa�my drug� funkcj� Schaffera F2. Jest to funkcja wektorowa o dw�ch sk�adowych, zale�na od jednego parametru. Oznaczmy przez F21 pierwsz� sk�adow�, przez F22 - drug�, a przez t - parametr: F22(t) �-. �.. . .:, 10 - - , .' � :..� .. �:. F2l(t) Rys. 5.23. Rzut drugiej funkcji Schaffera (F2) na p�aszczyzn� rozwi�za�. Zaznaczono front Pareto punkt�w niezdominowanych 216 5. Techniki i operacje zaawansowane F2,(f) = t2 F22(�) = (t- 2)2 Rzut tej funkcji na p�aszczyzn� Pareto zosta� pokazany na rys. 5.23, z zaznaczeniem frontu Pareto punkt�w niezdominowanych. Wszystkie inne punkty s� zdominowane przez front i VEGA powinna umie� wyszuka� dobre rozwi�zania. Na rysunku 5.24 przedstawiono wyniki otrzymane przez program w pokoleniach 0 i 3. VEGA wykry�a front; jednak wida� pewn� tendencje do ignorowania punkt�w po�rednich. Legenda Legenda Of21(X) of22(X) ^^ Znacznik zdominowania -6,00 -4,00 -2,00 0,00 2,00 X Pokolenie 0 6,00 �1------- -4,00 -2,00 0,00 2,1 x Pokolenie 3 4,00 6,00 Rys. 5.24. Rozwi�zania drugiego zadania Schaffera otrzymane za pomoc� programu VEGA. Por�wnanie pokole� 0 i 3 (Schaffer, 1984). Przedruk za zezwoleniem Zjawisko dyskryminacji rozwi�za� po�rednich jest powa�nym problemem. W �adnym pokoleniu nie powinno by� tendencji skierowanej przeciwko jakimkolwiek lokalnie niezdominowanym osobnikom. Je�eli uznajemy koncepcj� optymalno�ci w sensie Pareto, to wszystkie takie osobniki powinny posiada� ten sam potencja� reprodukcyjny. Jednym ze sposob�w osi�gni�cia jednakowego potencja�u reprodukcyjnego dla wszystkich punkt�w na tym samym poziomie jest u�ycie specjalnej procedury sortuj�cej. Jest ona podobna do procedur nadawania rang stosowanych dla pojedynczego kryterium (Baker, l985); jednak w tym przypadku rangi s� zwi�zane ze �stopniem niezdomi-nowania". Wszystkie niezdominowane osobniki w bie��cej populacji zostaj� oznaczone, umieszczone na szczycie listy i otrzymuj� rang� 1. W nast�pnym kroku rozpatrujemy 5.6. Techniki oparte na wiedzy . 217 pozosta�� cz�� populacji i wyszukujemy nast�pn� parti� osobnik�w niezdominowanych, nadaj�c im rang� 2. Proces ten jest kontynuowany a� do nadania rang wszystkim osobnikom. Mo�emy w�wczas przyporz�dkowa� ka�demu osobnikowi - wed�ug jego rangi - liczb� potomnych kopii lub prawdopodobie�stwo reprodukcji. Aby zapewni� utrzymanie dostatecznego zr�nicowania populacji, procedura ta powinna by� u�ywana ��cznie z technikami formowania nisz i gatunk�w. Obecno�� nisz i gatunk�w mo�e by� szczeg�lnie pomocna w stabilizowaniu licznych podpopulacji, kt�re tworz� si� wzd�u� frontu Pareto, dzi�ki czemu mo�na unikn�� nadmiernej konkurencji mi�dzy odleg�ymi cz�onkami populacji. 5.6. Techniki oparte na wiedzy W ca�ym dotychczasowym wywodzie - przez prawie pi�� rozdzia��w tej ksi��ki - uporczywie lansowali�my tez�, �e istota dzia�ania algorytm�w genetycznych sprowadza si� do wsp�dzia�ania reprodukcji i krzy�owania. W rozdziale pierwszym wymian� schemat�w-cegie�ek o du�ej warto�ci przystosowawczej mi�dzy ci�gami kodowymi por�wnali�my niejasno do proces�w tw�rczego my�lenia u ludzi. Przeprowadzili�my mianowicie paralel� mi�dzy wymian� schemat�w, prowadz�c� do formowania nowych ci�g�w, a wymian� pogl�d�w, prowadz�c� do formowania nowych idei. Argumentacja ta wydawa�a si� w�wczas poci�gaj�ca, gdy� istotnie my, ludzie, zestawiamy ze sob� warto�ciowe pomys�y w poszukiwaniu nowych idei. Z drugiej jednak strony pogl�d, �e krzy�owanie losowe to istota mechanizmu tw�rczego my�lenia u ludzi wydaje si� zdecydowanie zbyt uproszczony. Szukaj�c nowych pomys��w, ludzie z ca�� pewno�ci� wybieraj� w spos�b bardziej �wiadomy koncepcje, z kt�rych skrzy�owania rodz� si� nowe idee. Ludzie pos�uguj� si� zasobem posiadanej wiedzy rozstrzygaj�c, kt�re pogl�dy mog� ze sob� wsp�gra�, i oceniaj�c (bez dokonywania bezpo�rednich pr�b lub eksperyment�w), czy efekt ich zestawienia ma dla nich jaki� sens. Inaczej m�wi�c, operacje tw�rczego my�lenia kieruj� si� (przynajmniej od czasu do czasu) wiedz�. Algorytmy genetyczne - przeciwnie - s� w swej najprostszej postaci procedurami �lepego poszukiwania: decyduj�c o tym, jakie pr�by b�d� zadowalaj�ce w nast�pnej turze, opieraj� si� wy��cznie na w�asno�ciach funkcji koduj�cej i warto�ciach funkcji celu. Okoliczno�� ta jest jednocze�nie b�ogos�awie�stwem i przekle�stwem. Z jednej strony niewra�liwo�� na informacj� specyficzn� dla zadania jest �r�d�em ich szerokiego zakresu zastosowa� (metoda, kt�ra daje dobre wyniki bez uwzgl�dniania szczeg�owej wiedzy o danym problemie, ma znaczne szanse odniesienia sukcesu w innej dziedzinie). Jednak z drugiej strony, ignoruj�c dost�pn� wiedz� o zadaniu, algorytmy genetyczne ustawiaj� si� na niekorzystnej pozycji w por�wnaniu z konkurencyjnymi metodami, kt�re czyni� u�ytek z tej informacji. W tym punkcie om�wimy r�ne sposoby po��czenia wiedzy szczeg�owej o zadaniu z mechanizmami algorytmu genetycznego. Zbadamy techniki hybrydyzacji, operacje wzbogacone wiedz� i metody aproksymowania funkcji celu. 218 . 5. Techniki i operacje zaawansowane 5.6.1. Hybrydyzacja Je�li dysponujemy szczeg�ow� wiedz� o zadaniu, to warto rozwa�y� po��czenie algorytmu genetycznego z jak�� wyspecjalizowan� technik� poszukiwania. Hybrydyzacja umo�liwia wykorzystanie �globalnego spojrzenia" algorytmu genetycznego zjednej strony i zbie�no�ci techniki wyspecjalizowanej z drugiej. Rozwi�zania takie by�y sugerowane przez licznych autor�w (Bethke, 1981; Bosworth, Foo i Zeigler, 1972; Goldberg, 1983) - nie ma jednak zbyt wielu publikacji na temat osi�gni�tych w ten spos�b wynik�w. Niemniej jednak sama idea jest prosta, ma merytoryczne uzasadnienie i mo�e by� stosowana w celu poprawy efektywno�ci ko�cowej procesu poszukiwa� genetycznych. Optymalizacja lokalna funkcji ci�g�ych jednej lub wielu zmiennych jest dobrze rozwini�t� dziedzin� wiedzy. Znane s� liczne techniki gradientowe i niegradientowe znajdowania ekstrem�w lokalnych w tego typu zadaniach (Avriel, 1976). Aby skonstruowa� algorytm hybrydowy dla funkcji g�adkiej, wystarczy po prostu �skrzy�owa�" preferowan� technik� lokalnego poszukiwania z algorytmem genetycznym. Algorytm genetyczny znajduje �wzg�rze", a technika lokalna wyst�puje w roli wspinacza, wdrapuj�cego si� na �szczyt". Metody hybrydowe mog� by� u�ywane nawet w zadaniach nie poddaj�cych si� technikom analitycznym. Na przyk�ad algorytmy zach�anne (Lawler, 1976; Sys�o, Deo i Kowalik, 1983) stanowi� odmian� technik lokalnych w zadaniach optymalizacji kom-binatorycznej, a dla wielu typowych zada� istniej� dobrze rozwini�te metody heurystycz-ne. Specyficzno�� technik poszukiwania lokalnego powoduje, �e dla ka�dego problemu lub klasy problem�w musimy tworzy� odr�bny algorytm hybrydowy. Nie mo�emy uciec od dylematu: efektywno�� czy og�lno��. Je�eli pragniemy korzysta� z wiedzy szczeg�owej, musimy by� gotowi po�wi�ci� nieco og�lno�ci; na szcz�cie mo�emy tu w znacznej mierze zastosowa� podej�cie modularne. Algorytm genetyczny � elementarny - zmodyfikowany Metoda lokalna � analityczna � zachtenna � inna Rys. 5.25. Hybrydyzacja algorytmu genetycznego, podej�cie wsadowe. Algorytm genetyczny wyszukuje rejon wierzcho�ka, a procedura lokalna ,,wdrapuje si�" na szczyt I 5.6. Techniki oparte na wiedzy . 219 Istnieje wiele sposob�w hybrydyzacji algorytmu genetycznego przy jednoczesnym zachowaniu istotnego poziomu modularyzacji. Na rysunku 5.25 zosta�o pokazane podej�cie �wsadowe". Przy tym podej�ciu algorytm genetyczny pracuje a� do osi�gni�cia znacznego stopnia zbie�no�ci populacji, a nast�pnie w��cza si� procedura optymalizacji lokalnej, startuj�c zjakich� 5-lO% najlepszych punkt�w ostatniego pokolenia. Mo�na wtedy stosowa� tak�e techniki niszowe i specjacyjne, opisane w poprzednim punkcie, w celu zapewnienia zr�nicowania populacji i powstania stabilnych podpopulacji zwi�zanych z r�nymi maksimami lokalnymi funkcji. Podej�cie r�wnoleg�e do hybrydyzacji zosta�o przedstawione na rys. 5.26. Zak�adamy tu dost�pno�� wielu pracuj�cych r�wnolegle procesor�w o mocy obliczeniowej wystarczaj�cej do wsp�bie�nego wyznaczania warto�ci funkcji dla poszczeg�lnych ci�g�w kodowych w danym pokoleniu. Procesory wsp�bie�ne mog� by� w ten spos�b u�yte do obliczania wska�nik�w przystosowania ci�g�w kodowych. Mo�na ich r�wnie� u�ywa� do wykonywania sporadycznych iteracji procedury lokalnego poszukiwania w celu ulepszenia bie��cego ci�gu kodowego. (Wi�cej na temat r�wnoleg�o�ci w algorytmach genetycznych powiemy w jednym z nast�pnych punkt�w.) ; Rys. 5.26. Hybrydyzacja algorytmu genetycznego, podej�cie r�wnoleg�e Bardziej �kanoniczn�" metod� lokaln�, nadaj�c� si� do hybrydyzacji z algorytmem genetycznym, jest metoda iterowanych ulepsze� pozycyjnych [gradientlike-bitwise improvement, G-bit improvement]. Wjednej ze swych prac (Goldberg, 1983) wskaza�em na podobie�stwa mi�dzy wykorzystaniem informacji o gradientach a zmian� poszczeg�lnych bit�w. Opieraj�c si� na tej idei, mo�na otrzyma� og�ln� procedur� lokalnego poszukiwania, niezale�n� od struktury konkretnego zadania � od sposobu kodowania rozwi�za�. Metoda iterowanych ulepsze� pozycyjnych sk�ada si� z nast�puj�cych trzech krok�w: -v �� <:�� , 1. Wybierz jeden lub kilka najlepszych ci�g�w kodowych z bie��cej populacji. 2. Zmieniaj warto�ci kolejnych bit�w w wybranym ci�gu lub ci�gach, zachowuj�c za ka�dym razem lepszy z dw�ch ostatnich wariant�w. 3. Po zako�czeniu powy�szych dzia�a� w��cz najlepszy znaleziony ci�g (lub k najlepszych ci�g�w) do populacji i kontynuuj zwyk�e poszukiwanie genetyczne. 220 5. Techniki i operacje zaawansowane Mo�na pokaza�, �e metoda iterowanych ulepsze� pozycyjnych jest zbie�na do optymalnego rozwi�zania dla ka�dej funkcji liniowej alleli. Mo�na j� dodatkowo wzmocni�, zapami�tuj�c histori� udanych modyfikacji i wykorzystuj�c t� informacj� przy podejmowaniu decyzji, czy w danej sytuacji op�aca si� prowadzi� dalsze pr�by ulepsze�. Inne rozszerzenie metody mog�oby polega� na eksperymentowaniu z parami lub tr�jkami bit�w; nale�y tu jednak zachowa� ostro�no��, aby nie doprowadzi� do kombinatorycznej eksplozji z�o�ono�ci nawet w przypadku ci�g�w o umiarkowanej d�ugo�ci. 5.6.2. Operacje wzbogacone wiedz� Techniki hybrydowe stanowi�jeden ze sposob�w wprowadzenia dodatkowej informacji, dzi�ki kt�rej mo�na przyspieszy� proces poszukiwania genetycznego. Dodatkowej informacji mo�na tak�e u�y� w celu lepszego ukierunkowania operacji genetycznych. Mo�emy w pewnym sensie m�wi� o �wspomaganiu" wiedz� szczeg�ow� losowego wyboru podczas operacji takich, jak mutacja i krzy�owanie. Pierwsze prace z tego zakresu dotyczy�y mutacji. Bosworth, Foo i Zeigler (1972) u�yli zmiennoprzecinkowej reprezentacji parametr�w w wielowymiarowym zadaniu optymalizacyjnym oraz zastosowali operacj� krzy�owania (na styku parametr�w) i kilka wariant�w mutacji uwzgl�dniaj�cych specyfik� zadania. Jeden z tych wariant�w obejmowa� metod� FIetchera-Reevesa (metod� gradient�w sprz�onych) w po��czeniu z metod� z�otego podzia�u. Podej�cie to przypomina nieco techniki hybrydowe omawiane w poprzednim punkcie. Mo�liwo�� uwzgl�dnienia wiedzy szczeg�owej w sposobie dzia�ania operacji genetycznej nie ogranicza si� do mutacji. Grefenstette, Gopal, Rosmaita i Van Gucht (1985) zaprojektowali heurystyczn�, �zach�ann�" operacj� krzy�owania dla zagadnienia komiwoja�era (TSP). Przyjrzyjmy si� metodom reprezentacji rozwi�za� i operacjom, kt�re zaproponowali wymienieni autorzy. Rozwa�ane przez nich sposoby reprezentacji obejmowa�y m. in. reprezentacj� porz�dkow� [ordinal], �cie�kow� \path] i opart� na relacji s�siedztwa [adjacency]. W przypadku reprezentacji porz�dkowej jest tworzony uporz�dkowany �stos" zawieraj�cy nazwy jeszcze nie odwiedzonych miast, a reprezentacj� trasy podr�y jest po prostu aktualny numer pozycji (na stosie) miasta, kt�re ma by� odwiedzone w pierwszej kolejno�ci. Zalet� reprezentacji porz�dkowej jest to, �e operacja krzy�owania zachowuje trasy0. Wad� tej reprezentacji jest natomiast fakt, �e drobne zmiany kodu mog� powodowa� kompletn� reorganizacj� trasy podr�y. W konsekwencji reprezentacja porz�dkowa nie wytwarza sensownych �cegie�ek", czyli dobrych kandydat�w do poszukiwania genetycznego. Inne reprezentacje, takie jak reprezentacja �cie�kowa (kolejne miasta na trasie) lub oparta na relacji s�siedztwa (warto��y na pozycji / oznacza, �e miastoy' nast�puje po mie�cie /), dostarczaj� bardziej sensownych �cegie�ek", ale operacja krzy�owania prostego, dzia�aj�c na dowolnej z tych reprezentacji, wytwarza sekwencje nie odpowiadaj�ce trasom. Aby si� o tym przekona�, rozwa�my przyk�adowe trasy w obu reprezentacjach. Tzn. wynik krzy�owania dw�ch tras jest zawsze dobrze okre�lon� tras� (przyp. t�um.). 5.6. Techniki oparte na wiedzy . 221 W reprezentacji �cie�kowej trasa (1 3 5 4 2) biegnie od miasta 1 kolejno przez miasta 3, 5, 4 i 2 z powrotem do miasta 1. Wida� wyra�nie, �e krzy�owanie nie gwarantuje w tym przypadku uzyskania poprawnych tras potomnych. Je�eli skrzy�ujemy trasy (5 4 3 2 1) i (1 2 3 4 5) w punkcie krzy�owania 3, to otrzymamy ci�gi potomne (5 4 3 4 5) i (1 2 3 1 2). W reprezentacji opartej na relacji s�siedztwa mamy do czynienia z tym samym problemem. W tej reprezentacji ci�g (5 4 1 3 2) opisuje tras� biegn�c� z miasta 1 do miasta 5, nast�pnie z miasta 5 do miasta 2, z miasta 2 do miasta 4, z miasta 4 do miasta 3 i z miasta 3 z powrotem do miasta 1. Skrzy�owanie dw�ch tras (5 4 1 3 2) i (2 3 4 5 1) w punkcie 3 daje w wyniku dwa ci�gi (5 4 1 5 1) i (2 3 4 3 2), nie b�d�ce trasami. \ W obliczu tego problemu autorzy pracy zdecydowali si� na reprezentacj� opart� na relacji s�siedztwa oraz wymy�lili heurystyczn� operacj� krzy�owania (krzy�owanie zach�anne), kt�ra konstruuje tras� potomn�, wybieraj�c lepsz� z dw�ch kraw�dzi rodziciel-skich(Grefenstetteiin.,1985,str.l64): , ,- : � Operacja ta konstruuje potomka z dw�ch tras rodzicielskich w nast�puj�cy spos�b: Wybierz losowe miasto jako pocz�tek trasy potomnej. Por�wnaj dwie kraw�dzie wychodz�ce z wybranego miasta w trasach rodzicielskich i wybierz kr�tsz� z nich. Kontynuuj pr�by przed�u�enia trasy cz�stkowej, wybieraj�c kr�tsz� z dw�ch nadaj�cych si� do tego kraw�dzi rodzicielskich. Je�eli kr�tsza kraw�d� powoduje powstanie cyklu w trasie cz�stkowej, to przed�u� j� wybieraj�c losow� kraw�d�. Kontynuuj to post�powanie a� do uzyskania pe�nej trasy. 200 miast Odlegtosc=1475,68 �>*�'<��'�'�' Populacja pocz�tkowa Rys. 5.27. Typowa trasa pocz�tkowa w zagadnieniu komiwoja�era dla 200 miast (Grefenstette i in., 1985). Przedruk za zezwoleniem 222 5. Techniki i operacje zaawansowane 200 miast Odlegtosc = 203,46 Pokolenie 493 24596 pr�b Rys. 5.28. Zagadnienie komiwoja�era dla 200 miast, najlepsza trasa w populacji 493 (ko�cowej). Metoda krzy�owania zach�annego (Grefenstette i in., 1985). Przedruk za zezwoleniem Zastosowanie tej operacji w po��czeniu z reprodukcj� przynios�o dobre wyniki dla zada� obejmuj�cych do 200 miast; otrzymano rozwi�zania prawie optymalne przy nak�adzie obliczeniowym tego samego rzedu, co w przypadku procedur symulowanego wy�arzania (Bonomi i Lutton, 1984; Kirkpatrick, Gelatt i Vecchi, 1983). Na rysunkach 5.27 i 5.28 por�wnano reprezentatywn� tras� w populacji pocz�tkowej z najlepsz� tras� w ostatnim pokoleniu dla zadania obejmuj�cego 200 miast. Podej�cie to nie daje si� bezpo�rednio por�wna� z �czystymi" metodami omawianymi wcze�niej w zwi�zku z operacjami re-konfiguracji. Krzy�owanie zach�anne korzysta w istotnym stopniu z wiedzy o odleg�o�ciach mi�dzy miastami. W przeciwie�stwie do tego operacje PMX, OX i CX nie zale�� od dodatkowej wiedzy szczeg�owej i nie nale�y ich por�wnywa� z operacjami, kt�re wykorzystuj� tak� informacj�. 5.6.3. Metody aproksymacyjne W wielu przypadkach dysponujemy wiedz� szczeg�ow�, kt�ra umo�liwia skonstruowanie przybli�onego modelu zadania. To z kolei daje mo�liwo�� lepszego lub gorszego aproksymowania funkcji celu. Stosuj�c algorytmy genetyczne, mo�emy wykorzysta� z po�ytkiem t� wiedz� w celu zredukowania liczby kosztownych oblicze� dok�adnych warto�ci funkcji. W r�nych zadaniach optymalizacji lub poszukiwania jednorazowe obliczenie warto�ci funkcji celu bywa z�o�onym procesem, obejmuj�cym wiele poziom�w podprogram�w, obliczenia numeryczne lub symboliczne oraz rozmaite funkcje 5.6. Techniki oparte na wiedzy . 223 koduj�ce i dekoduj�ce. Je�li wi�c aproksymacja warto�ci funkcji przynosi oszcz�dno�ci, umo�liwiaj�c przez to wykonanie wi�kszej liczby ewaluacji w tym samym czasie, to takie podej�cie mo�e by� warte zastosowania. Uwaga ta odnosi si� szczeg�lnie do algorytm�w genetycznych, jako �e zgodnie z naszymi oczekiwaniami powinny one wykazywa� odporno�� na b��dy i zak��cenia. Mieli�my ju� wcze�niej okazj� om�wi� pewn� technik� przybli�onej ewaluacji funkcji, zastosowan� przez Grefenstette'a i Fitzpatricka (1985) w pracy dotycz�cej odtwarzania obraz�w. Przypomnijmy, �e ewaluacja funkcji polega�a tam na obliczeniu ��cznej r�nicy pikseli tworz�cych dwa obrazy -jednego sprzed, a drugiego po wstrzykni�ciu �rodka cieniuj�cego do t�tnicy. Algorytm genetyczny mia� za zadanie znalezienie wsp�czynnik�w przekszta�cenia dwuliniowego, kt�re minimalizuje r�nic� mi�dzy obrazami. Obliczenia przeprowadzane w badaniach pilotowych by�y do�� kosztowne, gdy� ka�dy obraz sk�ada� si� ze 100x 100= 10000 pikseli. Po serii eksperyment�w Grefenstet-te i Fitzpatrick przekonali si�, �e przy ustalonej ��cznej liczbie operacji odejmowania pikseli (200000), najlepsze wyniki da�y przybli�one ewaluacje funkcji, dokonywane na podstawie losowej pr�by z�o�onej z zaledwie 10 (spo�r�d 10000) pikseli. Pomys� ten mo�e by� bezpo�rednio zastosowany w innych przypadkach, w kt�rych wchodzi w gr� pr�bkowanie warto�ci funkcji. Mo�emy r�wnie� wykorzysta� og�ln� ide� aproksymowa-nia warto�ci funkcji w zagadnieniach charakteryzuj�cych si� bardziej tradycyjn� struk-tur�matematyczn�. .,;: W wielu zagadnieniach optymalizacji dysponujemy do�� dok�adn� wiedz� na temat matematycznej postaci zar�wno modelu systemu, jak i funkcji celu. Wiedza ta umo�liwia skonstruowanie stosunkowo �tanich" przybli�onych modeli systemu. Przypu��my, �e mamy zmaksymalizowa� nast�puj�c� �idealn�" funkcj� celu: max/(s, d} gdzie s jest �-wymiarowym wektorem stanu, d za� m-wymiarowym wektorem decyzji. Za��my nast�pnie, �e matematyczny model systemujest dany przez r�wnanie wektorowe g(s, d) - 0, gdzie g jest n-wymiarow� funkcj� wektorow�. fMi ,,:-,; , Tradycyjny spos�b rozwi�zania powy�szego uk�adu r�wna� wi��e si� zazwyczaj z seri� przekszta�ce�, podczas kt�rych nale�y odgadn�� (przybli�one) warto�ci zmiennych stanu, dokona� linearyzacji nieliniowego modelu i wyznaczy� nowe warto�ci zmiennych stanu. Po znalezieniu rozwi�zania tak� metod� n�etrudnoju� przeprowadzi� analiz� wra-�liwo�cirozwi�zanianama�ezaburzenia: ,,,,, ,; A As = - ds dd Zmiany wektora stanu zosta�y tu wyra�one w postaci funkcji liniowej zmian wektora decyzji. Daje to mo�liwo�� obliczania liniowych poprawek do warto�ci funkcji celu, zgodnieznast�puj�c�r�wno�ci�: ,it- 224 5. Techniki i operacje zaawansowane Mo�emy tak�e oblicza� dok�adne warto�ci funkcji celu dla przybli�onych warto�ci zmiennych stanu. Jak�kolwiek metod� aproksymacji wybierzemy, musimy pami�ta�, �e ka�dy potomny ci�g kodowy ma dwoje rodzic�w, a zatem w obliczeniach przybli�onej warto�ci funkcji celu dla potomka powinni�my systematycznie uwzgl�dnia� dane pochodz�ce od obydwu ci�g�w rodzicielskich. Mo�na przy tym oprze� si� na: a) najbli�szym z rodzic�w; b) �redniej wa�onej obu rodzic�w; c) ostatnio ewaIuowanym rodzicu. Zgodnie z tym, ci�gi rodzicielskie mog� przekazywa� potomkom swojejakobiany w celu propagacji przybli�onego modelu i przybli�onych wska�nik�w przystosowania. Obliczaj�c poprawki do jakobian�w, mo�na stara� si� wyd�u�y� okres przydatno�ci modelu liniowego. Istniej� te� mo�liwo�ci otrzymania lepszego modelu przybli�onego na podstawie danych z ca�ej populacji, a nie tylko samych ci�g�w rodzicielskich. Techniki te nie zosta�y zastosowane w praktyce; powinny onejednak otworzy� drog� do zwi�kszenia konkurencyjno�ci metod poszukiwania genetycznego w sytuacji, kiedy naturalny proces modelowania prowadzi do konstrukcji modelu zlinearyzowanego. 5.7. Algorytmy genetyczne a architektura r�wnoleg�a____________________ Jest wielkim paradoksem, �e w �wiecie, w kt�rym algorytmy sekwencyjne przekszta�ca si� w r�wnoleg�e, zazwyczaj dzi�ki niezliczonym trikom i �ama�com, algorytmy genetyczne (z natury w wysokim stopniu r�wnoleg�e) s� realizowane sekwencyjnie za pomoc� r�wnie nienaturalnych chwyt�w. Musi wi�c dziwi� fakt, �e a� do niedawna bardzo niewiele wysi�ku po�wi�cano implementacji algorytm�w genetycznych w spos�b wykorzystuj�cy istniej�ce lub projektowane r�wnoleg�e architektury sprz�towe. W tym punkcie zajmiemy si� wi�c wsp�bie�nymi implementacjami algorytm�w genetycznych. Holland w jednej z najwcze�niejszych prac teoretycznych (1962c) rozpozna� wsp�bie�n� natur� paradygmatu reprodukcyjnego i inherentn� efektywno�� przetwarzania r�wnoleg�ego. Posun�� si� on nawet do rozwa�a� nad realizacj� plan�w reprodukcyjnych za pomoc� pewnego modelu komputera kom�rkowego (1959, 1962). Inni dawniejsi badacze nie po�wi�cili wiele uwagi mo�liwo�ciom, jakie nios�y wsp�bie�ne implementacje algorytm�w genetycznych. Bethke (1976) poda� r�ne oszacowania z�o�ono�ci dla okre�lonych sposob�w realizacji algorytmu genetycznego na maszynie r�wnoleg�ej. Doszed� on do wniosku, �e podstawowe w�skie gard�o �wczesnych realizacji b�dzie stanowi� obliczenie �redniego wska�nika przystosowania populacji. Nie pr�bowa� jednak zasymulowa� ani zaimplementowa� wsp�bie�nego algorytmu genetycznego. 5.7. Algorytmy genetyczne a architektura r�wnoleg�a 225 Grefenstette (1981) rozwa�a� kilka wsp�bie�nych implementacji algorytm�w genetycznych. Przedstawi� on w szczeg�lno�ci w zarysie cztery nast�puj�ce projekty organizacji algorytmu: . � , > < � a) synchroniczna scentralizowana; '* s b) p�synchroniczna scentralizowana; . � � � -. c) asynchroniczna rozproszona; �> ^ �< d) sieciowa. . -. , ' ' Organizacja synchroniczna scentralizowana zosta�a ju� wcze�niej przedstawiona na rys. 5.26. Mamy tu do czynienia z jednym procesem nadrz�dnym, kt�ry koordynuje k proces�w podrz�dnych. Proces nadrz�dny odpowiada za selekcj�, kojarzenie oraz wykonywanie operacji genetycznych. Procesy podrz�dne obliczaj� natomiast wska�niki przystosowania. Organizacja tajest przejrzysta i do�� atwa do realizacji, majednak dwie zasadnicze s�abo�ci. Po pierwsze du�a wariancja czasu niezb�dnego do obliczenia wska�nik�w przystosowania powoduje du�e straty. Po drugie niezawodno�� algorytmu zale�y bezpo�rednio od niezawodno�ci procesu nadrz�dnego. Je�li ten zawiedzie, ca�y system zatrzyma si�. Odpowiedzi� na pierwsz� trudno�� jest drugi projekt Grefenstette'a, or-ganiz'dC)apolsynchroniczna scentralizowana. Wym�g synchroniczno�ci zosta� tu zniesiony - elementy populacji s� wstawiane i selekcjonowane na bie��co, gdy tylko odpowied-ne procesy podrz�dne zako�cz� swoj� prac�. Mechanizm ten dzia�a podobnie do populacji mieszanych De Jonga ze wsp�czynnikiem wymiany G (rozdzia� 4). Organizacja p�synchroniczna scentralizowana jest r�wnie� zawodna ze wzgl�du na zale�no�� od zachowania jednego wyr�nionego procesu. W asynchronicznym rozproszonym algorytmie genetycznym (przedstawionym schematycznie na rys. 5.29) k identycznych procesor�w wykonuje niezale�nie od siebie zar�wno operacje genetyczne, jak i obliczenia wska�nik�w przystosowania, korzystaj�c Proces wsp�bie�ny N Proces wsp�bie�ny / Proces wsp�bie�ny �^ i k \ ' A Proces wsp�bie�ny Pami�� dzielona Proces wsp�bie�ny \ ^ r , i ^ L Proces wsp�bie�ny Proces wsp�bie�ny Proces wsp�bie�ny Rys. 5.29. Organizacja wsp�bie�nego asynchronicznego algorytmu genetycznego 226 5. Techniki i operacje zaawansowane ze wsp�lnej pami�ci dzielonej. Dost�p do pami�ci dzielonej jest ograniczony jedynie warunkiem, aby procesy nie odwo�ywa�y si� jednocze�nie do tego samego miejsca w pami�ci; poza tym nie ma tu innych wymaga� synchronizacyjnych. Organizacja ta jest nieco bardziej skomplikowana ni� dwie poprzednie, ale niezawodno�� systemu znacznie wzrasta. Dop�ki bowiem dzia�a cho� jeden z proces�w wsp�bie�nych i jaka� cz�� pami�ci dzielonej, dop�ty wykonywanie algorytmu posuwa si� naprz�d. Organizacja sieciowa zosta�a pokazana na rys. 5.30. W tym przypadku k niezale�nych algorytm�w genetycznych (obejmuj�cych operacje genetyczne i obliczanie wska�nik�w przystosowania) wykonuje si�, korzystaj�c z w�asnych, niezale�nych pami�ci. Owe k proces�w dzia�a autonomicznie z wyj�tkiem tego, �e najlepsze osobniki wykryte w danym pokoleniu s� rozsy�ane do innych podpopulacji poprzez sieciowy system komunikacyjny. Oznacza to znaczn� redukcj� potrzeb komunikacyjnych w stosunku do innych organizacji. System osi�ga wysok� niezawodno�� dzi�ki autonomiczno�ci niezale�nych proces�w. Rys. 5.30. Organizacja sieciowego algorytmu genetycznego Niedawno zasugerowa�em podej�cie obiektowe do implementacji wsp�bie�nego algorytmu genetycznego. Rozpatrujemy tu dwa modele implementacyjne: model wsp�lnotowy [community] oraz modelpylkowy fc>lantpollination]. Model wsp�lnotowy zosta� naszkicowany na rys. 5.31. Algorytm genetyczny jest tam rozdystrybuowany pomi�dzy zbi�r po��czonych ze sob� �wsp�lnot". W sk�ad wsp�lnot wchodz� domy przy��czone do centralnych, po��czonych wzajemnie miast. Rodzice produkuj� potomstwo w swoich domach i tam te� wyznacza si� wska�niki przystosowania. Dzieci s� nast�pnie wysy�ane do centralnego klubu m�odzie�owego (w mie�cie), gdzie spotykaj� si� ze swymi przysz�ymi partnerami. Po zawarciu zwi�zku pary udaj� si� do agencji handlu nieruchomo�ciami, by znale�� dla siebie dom. Domy s� oferowane ubiegaj�cym si� o nie parom w drodze przetargu. Je�li miasto jest aktualnie przeludnione, pary mog� si� zwr�ci� do agencji o znalezienie domu w innych wsp�lnotach i w razie potrzeby udaj� si� na dworzec autobusowy, aby przenie�� si� do innej wsp�lnoty. 5.7. Algorytmy genetyczne a architektura r�wnoleg�a 227 Wsp�lnota Rys. 5.31. Podej�cie obiektowe, model wsp�lnotowy algorytmu genetycznego Model py�kowy sk�ada si� z sieci �ro�lin" po��czonych kana�ami przenosz�cymi �py�ek" (rys. 5.32). Ziarna kie�kuj� i rozwijaj� si� w dojrza�e ro�liny wytwarzaj�ce py�ek, kt�ry jest roznoszony po ca�ej sieci. Z ka�dym kana�em sieci zwi�zane jest praw- Kanaty py�kowe Rys. 5.32. Podej�cie obiektowe, model py�kowy algorytmu genetycznego 228 5. Techniki i operacje zaawansowane dopodobie�stwo transmisji py�ku. Umo�liwia to tworzenie podpopulacji ro�lin izolowanych w mniejszym lub wi�kszym stopniu od innych. Py�ek zapyla dojrza�e ro�liny, powoduj�c powstanie nowych ziaren. Najlepsze ziarna zostaj� lokalnie wyselekcjonowane (w spos�b probabilistyczny) do kie�kowania, aby przekszta�ci� si� w dojrza�e ro�liny. Chocia� opisane modele obiektowe mog� wyda� si� zabawne, a nawet nieco fry-wolne, to zosta�y pomy�lane jak najbardziej powa�nie. Traktuj�c ka�d� sk�adow� procesu jako obiekt �atwiej mo�emy okre�li� ich zapotrzebowanie na moc obliczeniow�, wielko�� pami�ci i przepustowo�� kana��w komunikacyjnych. Dzi�ki temu powinni�my by� zdolni do efektywniejszej implementacji algorytmu genetycznego we wsp�bie�nych systemach komputerowych. W ostatnim czasie pojawi�o si� kilka doniesie� o symulacjach i implementacjach wsp�bie�nych (Jog i Van Gucht, 1987; Pettey, Leuze i Grefenstette, 1987; Suh i Van Gucht, 1987b; Tanese, 1987). Nale�y si� spodziewa� dalszego rozkwitu tego kierunku bada�, w miar� upowszechniania si� sprz�tu o architekturze r�wnoleg�ej i odpowiedniego oprogramowania wspomagaj�cego. 5.8. Podsumowanie W tym rozdziale om�wili�my niekt�re zaawansowane operacje i techniki s�u��ce usprawnieniu elementarnego algorytmu genetycznego. Na pocz�tek rozwa�yli�my rozmaite mikrooperacje, tj. operacje genetyczne dzia�aj�ce napoziomie chromosomu, obserwowane w przyrodzie. Om�wili�my kolejno: mechanizm dominowania i diploidalno��, operacje rekonfiguracji, segregacj�, translokacj�, duplikacj� i delecj�. Diploidalno�� w po��czeniu z dominowaniem zosta�y rozpatrzone jako metoda implementacji pami�ci d�ugoterminowej. Zar�wno teoria, jak i wyniki symulacji wskazuj� na przydatno�� takiego podej�cia w przypadku niestacjonarnych, a szczeg�lnie periodycznych funkcji przystosowania. Om�wili�my r�wnie� teori� i realizacje operacji rekonfiguruj�cych. Zastosowanie tych operacji wymaga wprowadzenia numeracji alleli (rozszerzonej reprezentacji). Om�wili�my operacje jednoargumentowe, takie jak inwersja, oraz dwuargumentowe, jak PMX, OX i CX. Teoria schemat�w daje si� uog�lni� na przypadek schemat�w porz�dkowych, zwi�zanych z operacjami rekonfiguracji. Zaproponowali�my klasyfikacj� schemat�w porz�dkowych (o-schemat�w), obejmuj�c� schematy bezwzgl�dne, wzgl�dne, z po�lizgiem i zamian�. Rozwa�yli�my tak�e inne operacje niskopoziomowe, jak segregacja i translokacja. Wymagaj� one rozszerzenia genotypu do postaci struktury wielochromosomowej. Ponadto duplikacja i delecja poci�gaj� za sob� konieczno�� wprowadzenia reprezentacji o zmiennej d�ugo�ci. Om�wili�my te� proces zr�nicowania p�ciowego i rol�, jak� mo�e on odgrywa� (umo�liwienie kooperacji i specjalizacji wewn�trzgatunkowej). Makrooperacje - operacje dzia�aj�ce na poziomie populacji - umo�liwiaj� z kolei r�nicowanie prowadz�ce do tworzenia si� nisz i powstawania gatunk�w. Podstawowe koncepcje teoretyczne, koncentruj�ce si� wok� idei podzia�u zasob�w i barier reproduk- 5.9. Zadania 229 cyjnych, doprowadzi�y nas do rozwa�enia pewnych rozwi�za� praktycznych. Zjawisko formowania si� nisz mo�na wywo�a� dzi�ki zastosowaniu technik tworzenia �cisku lub u�yciu funkcji wsp�udzia�u. Natomiast specjacj� mo�na uzyska� w wyniku wprowadzenia barier reprodukcyjnych (sztywnych lub adaptacyjnych). Om�wili�my nast�pnie pokrewny temat optymalizacji wielokryterialnej. Przedstawili�my w zarysie koncepcj� optymalno�ci w sensie Pareto (rozwi�za� niezdominowa-nych). Rozwa�yli�my tak�e metody selekcji opartej na wielu kryteriach. Selekcja wed�ug niezale�nych kryteri�w prowadzi do dyskryminacji rozwi�za� �po�rednich". U�ycie procedury sortuj�cej populacj� wed�ug stopnia niezdominowania osobnik�w powinno z�agodzi� t� trudno��, ale jak dot�d nie wypr�bowano praktycznie tej metody. v ;; Przedyskutowali�my trzy nurty technik opartych na wiedzy: hybrydyzacj�, operacje wzbogacone wiedz� i metody aproksymowania funkcji celu. Techniki te umo�liwiaj� wykorzystanie wiedzy szczeg�owej, dost�pnej w wielu zadaniach poszukiwania i optymalizacji. Na koniec om�wili�my zagadnienie implementacji algorytm�w genetycznych w sprz�cie o architekturze r�wnoleg�ej. Zakrawa na ironi� fakt, �e pomimo wsp�bie�nego charakteru naturalnych proces�w genetycznych, w literaturze na temat przetwarzania wsp�bie�nego nie po�wi�cono dot�d wi�kszej uwagi algorytmom genetycznym . Dopiero teraz teoretyczne i praktyczne badania w tym kierunku zaczynaj� wzbudza� wi�ksze zainteresowanie. Pod wieloma wzgl�dami uda�o nam si� zaledwie musn�� problematyk� stosowanego poszukiwania genetycznego. Opisane tu zaawansowane techniki i operacje powinny w praktyce doprowadzi� do dalszego usprawnienia i rozszerzenia zakresu zastosowa� algorytm�w genetycznych. ,;..� ,, . > 5.9. Zadania 5.1. Chromosom haploidalny sk�ada si� z jednego genu o dw�ch allelach, 1 i 0. Warto�� oczekiwana przystosowania wynosi/, = 1,5 dla allelu 1, af0= 1,2 dla allelu 0. Zak�adaj�c, �e nie wyst�puj� straty z tytu�u mutacji oraz �e populacja zawiera pocz�tkowo r�wn� liczb� obu rodzaj�w alleli, oblicz nast�puj�ce wielko�ci: a) oczekiwan� frekwencj� allelu 1 w pokoleniu 1, b) oczekiwan� liczb� pokole� potrzebnych do osi�gni�cia co najmniej 99-procen-towej frekwencji jedynek. 5.2. Wykonaj te same obliczenia, co w zadaniu 5.1 dla populacji diploidalnej, zak�adaj�c, �e allel 1 jest dominuj�cy, a dane dotycz�ce przystosowania odnosz� si� do alleli ujawnionych. 5.3. Za��my, �e wsp�czynnik strat dla pewnego allelu wynosi 50%. Wyznacz tempo mutacji niezb�dne do utrzymania l-procentowej frekwencji tego allelu w populacji haploidalnej i w populacji diploidalnej. Oblicz oczekiwan� cz�sto�� wyboru postaci recesywnej podczas reprodukcji. 230 5. Techniki i operacje zaawansowane 5.4. Pewna trasa ma reprezentacj� �cie�kow� (2 1 4 3 7 6 5 9 8 0). Wykonaj dla niej operacj� inwersji z punktami podzia�u 3 i 5. Wyznacz dolne ograniczenie prawdopodobie�stwa prze�ycia przy inwersji dla schematu [5!8] traktowanego jako: bezwzgl�dny o-schemat, wzgl�dny o-schemat, wzgl�dny o-schemat z po�lizgiem oraz wzgl�dny o-schemat z po�lizgiem i zamian�. 5.5. Oblicz ca�kowit� liczb� o-schemat�w (bezwzgl�dnych) dla ci�g�w kodowych d�ugo�ci /=10, 20,50i 100. 5.6. Rozwi� o-schemat r12(2!18) na bezwzgl�dne o-schematy, przy za�o�eniu struktury ko�owej. 5.7. Rozwi� wzgl�dny o-schemat z po�lizgiem ry^(2134) na o-schematy wzgl�dne. 5.8. Zak�adaj�c, �e w wyniku duplikacji wewn�trzchmosomowej w danym genotypie pojawi�o si� sze�� egzemplarzy danego allelu, a prawdopodobie�stwo mutacji dla pojedynczego allelu wynosi 0,05, oblicz prawdopodobie�stwo, �e mutacja dotknie 0, 1, 2, 3, 4, 5 i 6 egzemplarzy tego allelu. Podaj wyniki dok�adne oraz przybli�one (korzystaj�c z rozk�adu Poissona). 5.9. Operacja translokacji polega na podziale chromosomu w losowo wybranym punkcie (z jednakowym prawdopodobie�stwem) i do��czeniu odci�tego odcinka do innego chromosomu w obr�bie tego samego genotypu. Oszacuj prawdopodobie�stwo rozdzielenia dw�ch alleli odleg�ych od siebie o pi�� pozycji w ci�gu o d�ugo�ci 25. Prawdopodobie�stwo zaj�cia translokacji wynosi 0,3. 5.10. Obmy�l mechanizm reprodukcji p�ciowej (z u�yciem genu p�ci), kt�ry wytwarza trzy p�ci: m�sk�, �e�sk� i nijak� w stosunku 2:1:5. Podaj naturalne przyk�ady gatunk�w r�nicuj�cych si� wi�cej ni� o dwie p�ci. 5.11. Dla dw�jkowego problemu decyzyjnego z wyp�atami/, = 10 przy decyzji 1 i^o = 5 przy decyzji 0, oblicz oczekiwan� liczb� decyzji 1 w nast�pnym pokoleniu, je�li zastosowano zwyk�� metod� reprodukcji: a) bez podzia�u wyp�at, b) z (r�wnym) podzia�em wyp�at. Przyjmij, �e bie��ca populacja zawiera 70 jedynek i 30 zer. 5.12. W pewnej metodzie kojarzenia opartej na wzorcach kojarzeniowych dopuszcza si� cz�ciowe dopasowanie, je�li brak pe�nego dopasowania. Obmy�l miar� dopasowania, przy kt�rej pe�ne dopasowanie otrzymuje wy�sz� ocen� ni� jakiekolwiek cz�ciowe dopasowanie. 5.13. Metoda selekcji wielokryterialnej Schaffera (1984) faworyzuje rekordzist�w ze wzgl�du na jedno kryterium. Czy w przypadku zadania minimalizacji rodzi to wi�ksze problemy dla wkl�s�ego czy dla wypuk�ego frontu Pareto? Uzasadnij kr�tko swoj� odpowied�. 5.14. Rozwa�my zadanie maksymalizacji funkcji celu f(x, y)=x2+y2 na krzywej y=x* + 3x + 6 (model systemu). Znajd� przybli�enia liniowe obu funkcji w punkcie (x(), y0). Rozwa� dwie metody kombinacji modeli przybli�onych umo�liwiaj�ce propagacj� modelu przybli�onego bez konieczno�ci dokonywania dodatkowych ewaluacji funkcji. , i 5.10. �wiczenia komputerowe 231 5.10. �wiczenia komputerowe A. Zaimplementuj elementarny algorytm genetyczny z diploidalno�ci� i triallel�cznym mechanizmem dominowania. B. Zaprogramuj i przetestuj operacj� CX dla reprezentacji permutacyjnej. C. Zaprogramuj i przetestuj operacj� inwersji traktuj�c� permutacje jako struktury ko�owe. D. Opracuj metod� kodowania niechlujnego dla zagadnienia komiwoja�era, w kt�rej dopuszcza si� nadmiarowe wyst�pienia miast w reprezentacji �cie�kowej. Obmy�l i przetestuj procedur� dekodowania takiej niechlujnej reprezentacji. E. Zaprogramuj i przetestuj operacj� OX dla reprezentacji permutacyjnej. F. Zaprogramuj algorytm genetyczny z dwoma mechanizmami tworzenia nisz: metod� �cisku De Jonga i metod� funkcji wsp�udzia�u Goldberga-Richardsona. Por�wnaj i om�w wyniki uzyskane przy zastosowaniu obu mechanizm�w dla wybranej funkcji wielomodalnej. G. Zaprogramuj metod� wzorc�w kojarzeniowych Bookera i Hollanda. Zaimplementuj regu�y zgodno�ci dwustronnej i jednostronnej w postaci prze��czalnych opcji programu. H. Zastosuj wielokryterialny algorytm genetyczny do optymalizacji drugiej funkcji Schaffera (rys. 5.23 i 5.24). Pos�u� si� dwiema metodami selekcji: metod� niezale�nych kryteri�w Schaffera i metod� sortowania wg stopnia niezdominowania Goldber-ga. Por�wnaj i om�w otrzymane wyniki. I. Zaimplementuj metod� iterowanych ulepsze� pozycyjnych. Por�wnaj i om�w efektywno�� on-line \ off-line uzyskane dla funkcji De Jonga F\ \ F5 w eksperymentach bez u�ycia i z u�yciem tej metody. J. U�yj elementarnego algorytmu genetycznego do rozwi�zania problemu optymalizacji postawionego w zadaniu 5.14. Zaprogramuj metod� przybli�onej ewaluacji funkcji i rozwi�� ponownie ten sam problem. Por�wnaj wyniki otrzymane dla dok�adnej i przybli�onej ewaluacji funkcji.

Wyszukiwarka

Podobne podstrony:
05 Wykonywanie operacji obróbki skrawaniem
05 Wykonywanie operacji obróbki skrawaniemidX76
05 Techniki projekcyjne
Debugowanie NET Zaawansowane techniki diagnostyczne?bnet
Techniki negocjacji i mediacji w administracji wykłady 05 11 2013
technik rolnik21[05] o1 02 n
05 Sporządzanie rysunku technicznego odzieżowegoidX36
technik rolnik21[05] z3 02 n
technik rolnik21[05] o2 04 n
technik rolnik21[05] z2 01 n
Technik mechatronik11[50] Z1 05 u
05 Posługiwanie się dokumentacją techniczną (2)
MS Access 2000 PL Zaawansowane techniki programowania

więcej podobnych podstron