temat identyfikacji dźwięku: wśród naszych zmysłów słuch zajmuje budź co bądź drugie miejsce po wzroku.
Chodzi tu zasadniczo o rozpoznanie mowy — sygnałów akustycznych najbogatszych w informacje. Od dawna już myślano o automatach reagujących na wypowiadane przez człowieka polecenia — przed ostatnią wojną światową konstruowano zegary, które, w momencie gdy radio podawało czas, same się regulowały. Minęło lat ponad dwadzieścia, od czasu, gdy pewierr* inżynier akustyk zbudował „skrzynkę arbuzową”, czyli pudło wypełnione aparaturą elektroniczną z mikrofonem na przedniej ściance i z czerwonym światełkiem na wierzchu. Gdy w rozmowie, toczącej się w pobliżu skrzynki, padało słowo „arbuz”, zapalała się na niej czerwona lampka. Teoretycznie więc można by zbudować jakieś 10 tysięcy podobnych skrzynek (tyle bowiem słów używa się w przeciętnej rozmowie) — i sprawa byłaby załatwiona. Techniczna realizacja wydaje się jednak mało prawdopodobna, zwłaszcza że niewiele jest tak łatwych do rozpoznania słów jak angielskie „arbuz” (watermelon — równomiernie rozmieszczone samogłoski „a”, „e”, „e”, „o” w stosunkowo długim wyrazie).
Wielu badaczy zajmujących się rozpoznawaniem obrazów stosowało później opracowane przez siebie metody do identyfikacji dźwięków. Nieraz zresztą jedno wynikało z drugiego: najpierw dokonywano zapisu graficznego widma częstotliwości wypowiadanego słowa, a następnie spektrogram ten badano w podobny sposób jak zwykłe obrazy. Tak postępowali Uhr i Vos-sler w latach 1961—1963, uzyskując przy pomocy wspomnianego już programu dla maszyny IBM 709 sto procent prawidłowych odpowiedzi (przy nieco uproszczonych spektrogra-mach cyfr oraz identycznym sposobie ich wy-
180