W niniejszym rozdziale przedstawiono podstawowe informacje dotyczące cech fonetycznych oraz podstawy teorii przetwarzania mowy. Znajdują się w nim również informacje na temat fizycznych właściwości fal dźwiękowych.
Wytwarzanie głosu jest bardzo złożonym zjawiskiem akustycznym i mechanicznym. Dźwięk, w kategoriach fizycznych jest wrażeniem słuchowym spowodowanym drganiami fal akustycznych rozchodzących się w ośrodku sprężystym. Fala akustyczna to zaburzenie gęstości w formie fali podłużnej rozchodzące się w powietrzu lub innym ośrodku. Są to zarówno te fale, które powodują wrażenia słuchowe, jak również fale o częstotliwościach wykraczających poza pasmo słyszalności ludzkich zmysłów. Ze względu na częstotliwość dźwięki możemy podzielić w następujący sposób [5]:
- infradźwięki - o częstotliwości poniżej 16 Hz,
- dźwięki słyszalne - o częstotliwości w paśmie 16 Hz-20 kHz,
- ultradźwięki - powyżej 20 kHz,
- hiperdźwięki - powyżej 1010 Hz.
Jak można zauważyć, że zakres dźwięków słyszalnych stanowi niewielki wycinek całego pasma dźwięków otaczających człowieka. Fizycznymi aspektami dźwięków są:
- widmo,
- natężenie,
- czas trwania dźwięku.
Wszystkie cechy dźwięku możemy łączyć w analizie wykorzystując fakt zmienności wybranych cech w trakcie trwania dźwięku. Wykorzystuje się je do poszukiwania złóż ropy naftowej czy badań skorupy ziemskiej [7]. Fale dźwiękowe służą też jako narzędzie do prowadzenia badań medycznych oraz materiałowych. Widmem dźwięku nazywamy rozkład natężenia składowych sinusoidalnych w funkcji ich