6
Systemy liniowe (nie tylko sieci neuronowe - ogólnie wszelkie systemy tego typu) mają wiele sympatycznych właściwości. Ich zachowanie jest dobrze i łatwo przewidywalne, a matematyczny opis jest prosty i zawsze możliwy do rozwiązania. Czy jest więc sens porzucać ten tak wygodny i sympatyczny grunt i szukać szczęścia w trudnej i skomplikowanej dziedzinie sieci nieliniowych?
Otóż jest taka konieczność.
- Dlaczego?
Powodów jest kilka, ale wymienię podstawowy: po prostu klasa zadań, jakie może rozwiązywać sieć zbudowana z nieliniowych neuronów, jest istotnie szersza, niż klasa zadań, jakie rozwiązuje sieć liniowa. Pierwsza sieć może realizować tylko takie zadania, które polegają na znalezieniu liniowego (to znaczy możliwego do przedstawienia za pomocą pewnej ustalonej macierzy transformacji) odwzorowania zbioru sygnałów wejściowych na zbiór sygnałów wyjściowych. Druga (to znaczy nieliniowa) sieć nie wykazuje podobnych ograniczeń. Charakter zależności wiążącej sygnały wyjściowe (odpowiedzi sieci) z sygnałami wejściowymi (to znaczy danymi będącymi punktem wyjścia do obliczeń) przy odpowiednio dużej, wielowarstwowej sieci nieliniowej może być - praktycznie dowolny. Nie jest to właściwe miejsce, by temat ten, mający wyraźnie teoretyczny i matematyczny charakter, dokładniej przedstawiać i szczegółowo drążyć -proponuję więc chwilowo przyjąć to stwierdzenie “na wiarę”. Pragnę Cię tylko zapewnić, że zagadnienie wyższości sieci nieliniowych nad liniowymi nie ma wyłącznie charakteru akademickiego (typu pamiętnych dyskusji “o wyższości Świąt Wielkiej Nocy nad Świętami Bożego Narodzenia”), lecz wiąże się bezpośrednio z oceną praktycznej użyteczności rozważanych tu narzędzi. Naprawdę istnieje spora grupa na wskroś praktycznych zadań,