30 Struktura sieci
Skupiając uwagę na sieciach feedforward możemy stwierdzić, że do opisania ich struktury stosunkowo wygodny jest model warstwowy. W modelu tym zakłada się, że neurony zgrupowane są w pewne zespoły (warstwy), tak zorganizowane, że główne połączenia (i związane z nimi przepływy sygnałów odbywają się pomiędzy elementami sąsiednich warstw (rys. 2.4).
Wspominałem już o tym w poprzednim rozdziale, ale warto może powtórzyć, że połączenia pomiędzy neuronami sąsiednich warstw mogą być kształtowane na wiele sposobów (wedle uznania twórcy sieci), jednak najczęściej korzysta się ze schematu połączeń typu “każdy z każdym”, licząc na to, że proces uczenia doprowadzi do samorzutnego “wykrystalizowania się” potrzebnego zbioru połączeń - po prostu na wejściach, które okażą zbyteczne z punktu widzenia rozwiązywanego zadania, proces uczenia ustawi współczynniki (wag) wynoszące zero, co w praktyce przerwie te niepotrzebne połączenia.
Wśród warstw neuronów budujących sieć neuronową może być wyróżniona warstwa wejściowa. Warstwa ta otrzymuje dane z zewnątrz sieci (tą drogą wprowadzane są zadania podlegające rozwiązywaniu). Przy projektowaniu tej warstwy twórca sieci ma ułatwioną decyzję - liczba elementów tej warstwy jest bowiem ściśle zdeterminowana przez liczbę danych wejściowych, które trzeba brać pod uwagę przy rozwiązywaniu określonego zadania. Inna rzecz, że czasem samo tylko zdecydowanie się, ile i jakich danych należy wprowadzać do sieci, by poradziła sobie ona ze stawianym zadaniem, nie jest sprawą łatwą. Na przykład w zadaniu prognozowania kursów akcji na giełdzie - wiadomo, że niektórzy badacze osiągają tu bardzo zachęcające wyniki, przynoszące bardzo duże korzyści inwestorom, którzy w oparciu o produkowane przez sieć prognozy podejmują decyzje o zakupie lub sprzedaży określonych walorów. Jednak publikacje, jakie się na ten temat pojawiają, są bardzo powściągliwe w ujawnianiu, jakie dane stanowiły punkt wyjścia prowadzonych obliczeń. Owszem, mówi się o tym, że stosowano sieć, że ją uczono (podaje się nawet algorytm uczenia), podaje się wyniki (jak wiele zyskano dzięki trafnym inwestycjom, jak dokładnie sieć prognozowała zmiany kursów akcji - tu możliwe są bardzo ładne wykresy linii rzeczywistych zmian i linii prognoz), natomiast w odniesieniu do danych wejściowych mówi się tylko, że podawano informacje dotyczące wcześniejszych zmian notowań akcji oraz wyniki analiz finansowych notowanych na giełdzie spółek. Jak te dane preparowano, które