8
Wielowarstwowe sieci neuronowe, które tak dogłębnie poznałeś w poprzednim rozdziale, mogą być używane do różnych celów. Wygodnie jest jednak rozważyć ich działanie i zachowanie w kontekście tak zwanego rozpoznawania obrazów. Rozpoznawanie obrazów jest zadaniem, w którym sieć neuronowa (lub inny automatyczny system rozpoznający) ma podejmować decyzje na temat przynależności określonych obiektów do ustalonych klas. Obiekty mogą być różnych rodzajów - mogą to być obrazy wprowadzone przez skaner lub “frame grabber” (od takich obiektów rozpoczął się rozwój tej dziedziny i od nich bierze ona swoją nazwę), mogą to być jednak również próbki sygnału dźwiękowego (na przykład komendy wydawane za pomocą mowy), opisy parametrów geofizycznych odwiertów, pomagające w rozpoznawaniu złóż geologicznych, symptomy pacjentów, których choroby należy diagnozować - i wiele innych.
Sieć neuronowa rozpoznająca obrazy ma zwykle kilka wejść, na które podawane są sygnały odpowiadające wyróżnionym cechom rozpoznawanych obiektów. Mogą to być na przykład współczynniki opisujące kształt części maszyn oglądanych za pomocą kamery TV. Na ogół wejść bywa dużo (na przykład w zadaniach rozpoznawania mowy sam używam sieci neuronowej o 98 wejściach), bo trzeba dokładnie “pokazać” sieci wszystkie cechy rozpoznawanego obiektu, żeby mogła się prawidłowo nauczyć go rozpoznawać. Jeśli na wejście sieci rozpoznającej podasz bezpośrednio obraz ze skanera lub z kamery TV - wówczas liczba wejść (równa liczbie pikseli na takim obrazie) może sięgać setek tysięcy!