Elementa oprowadzenie do techniki sieci 219
Na początku, zanim proces uczenia wprowadzi do tego jakiś porządek, neurony mają w przestrzeni wejść dość przypadkowe położenia, więc błękitne kwadraciki są rozrzucone bez żadnego porządku, a linie łączące sąsiadów miotają się bez ładu i składu (rys. 10.11).
Rys. 10.11. Przykładowy obraz początkowego rozkładu wag neuronów Jak stwierdziłem w poprzednim akapicie - proces losowego nadawania wartości początkowych generuje wartości z przedziału, który Ty mu podasz. Zalecałem Ci, byś do badań wykorzystywał małe początkowe wartości współczynników wag (na przykład proponowane przez program 0,01), więc zazwyczaj to nieuporządkowane skupisko błękitnych kwadratów symbolizujących neurony zajmie gęsto wypełniony centralny obszar przestrzeni sygnałów wejściowych i będzie trudne do obejrzenia (tak jest na przykład na rysunku 10.10). Ponieważ jednak chciałem, żebyś się dokładniej przyjrzeć, jak wygląda początkowy stan sieci przed rozpoczęciem procesu uczenia -przed symulacją, której początkowy etap pokazuje rysunek 10.11 podałem w odpowiedzi na pytanie o zakres dla wstępnego losowania wag dużą wartość (konkretnie 7). Wiedziałem, że uczyć taką sieć będzie potem raczej trudno, ale chciałem, żebyś sam zobaczył na własne oczy, że początkowy stan sieci (a zwłaszcza początkowe położenia linii obrazujących wzajemne położenia sąsiadów) są zupełnie chaotyczne.
Po każdorazowym pokazaniu rozkładu położeń neuronów program zada Ci pytanie: “Ile kroków uczenia mam wykonać?”. Chodzi oczywiście o to, ile kroków ma być wykonane, zanim zobaczysz nową mapę rozkładu punktów. Najprościej na początku w odpowiedzi na każde pytanie naciskać Enter - program wtedy sam dobiera sobie potrzebne dane i wykonuje tyle kroków, żebyś wygodnie i skutecznie mógł obserwować kolejne etapy uczenia. Potem, gdy już dobrze “wczujesz się” w pracę programu - możesz sobie sam (według życzenia) wydłużać lub skracać odstępy pomiędzy kolejnymi prezentacjami wyników uczenia, oglądając jego przebieg w sposób bardziej efektowny (duże skoki i duże zmiany w obrazie działania sieci) lub dokładniejszy (małe skoki). Pod koniec procesu uczenia, gdy “postępy” jakie robi ucząca się sieć są już dość małe, celowe będzie podawanie bardzo