Sposoby zapisu dźwięku

1. Istota dźwięku

W kategoriach fizycznych dźwięk to zaburzenie falowe ośrodka sprężystego (takiego jak powietrze, woda czy metal), wywołujące wrażenie słuchowe.

W kategoriach psychofizjologicznych dźwięk to właśnie wrażenie słuchowe, które jest reakcją na fale akustyczne.

Dźwięk może być zapisany na różnych kanałach. Np. dźwięk stereofoniczny zawiera dwa kanały, lewy i prawy, na który nagrany jest nieco zmieniony sygnał, tak, aby stworzyć wrażenie głębi dźwięku.

Współczesne urządzenia zawierają więcej kanałów. Kanał można traktować jako osobny sygnał dźwiękowy.

Dźwięk można zapisać w sposób analogowy lub cyfrowy.

Złożona natura dźwięku (zjawisko fizyczne i zmysłowe) powoduje, że opisuje się go w dwóch płaszczyznach:

2. Wielkości charakteryzujące dźwięk.

Cechy fizyczne mają swoje odpowiedniki w grupie cech psychofizjologicznych, można więc określić dźwięk za pomocą par parametrów:

Częstotliwość

0x08 graphic
Ruch falowy najprościej zilustrować wykresem sinusoidy.

Amplituda - największe wychylenie cząstki z położenia równowagi.

Okres - czas potrzebny na wykonanie pełnego cyklu. (mierzony w sekundach)

Długość fali - droga, jaką fala akustyczna pokonuje w ciągu jednego cyklu.

Częstotliwość to liczba drgań wykonanych w czasie 1 sekundy.

Częstotliwość określa liczbę cykli zjawiska okresowego występujących w jednostce czasu.

0x08 graphic
Jednostką częstotliwości jest herc (Hz).

Częstotliwość 1 herca odpowiada występowaniu jednego zdarzenia (cyklu) w ciągu 1 sekundy.

Częstotliwość jest odwrotnością okresu. Im wyższa, tym krótszy okres drgań.

Zakres częstotliwości rozróżnianych przez zdrowego człowieka mieści się w zakresie 16 Hz - 20 kHz. Dźwięki poniżej 16 Hz to infradźwięki, powyżej 20 kHz to ultra- lub hiperdźwięki (ponad 100 MHz).

Wysokość dźwięku

Cechą subiektywną pozwalającą rozróżniać dźwięki o różnej częstotliwości jest ich wysokość.

Drgania z przedziału:

Zdolność rozpoznawania wysokości dźwięku zależy od czasu trwania.

Dźwięki zbyt krótkie to impulsy lub trzaski. Minimalny czas trwania impulsu zależy od częstotliwości. Od niej zależy również zdolność rozpoznawania zmian w wysokości dźwięku.

Natężenie dźwięku

Natężenie dźwięku określa energię „czoła” fali, przepływającą w konkretnym czasie przez określoną powierzchnię. Natężenie maleje wraz z kwadratem odległości od źródła dźwięku.

Natężenie dźwięku zależy od amplitudy drgań; jest większe, gdy amplituda drgań jest większa.

Głośność

Głośność to subiektywne odczucie natężenia dźwięku.

Zależy zarówno od natężenia jak i częstotliwości.

Im większe natężenie, tym większa głośność. Ale przy stałym natężeniu dźwięki niskie i wysokie wydają się cichsze niż dźwięki o średniej częstotliwości.

Widmo dźwięku

Każdy, dowolnie złożony, okresowy przebieg akustyczny (np. dźwięk muzyczny) dzięki analizie Fouriera można przedstawić, jako pewną kombinację tonów sinusoidalnych o różnej częstotliwości i amplitudzie.

0x08 graphic
Drgania można zilustrować w postaci prążków na osi częstotliwości tak, by każdej częstotliwości współtworzącej dźwięk odpowiadał jeden prążek o wysokości reprezentującej jej amplitudę.

Otrzymany w taki sposób obraz przedstawiający częstotliwości składowe i ich amplitudy tworzy widmo dźwięku.

Najcelniejszym obrazem dźwięku, w pełni uwzględniającym jego istotę, a więc zmienność amplitudy i częstotliwości w czasie jest widmo trójwymiarowe.

0x08 graphic
Barwa dźwięku

To subiektywna cecha dźwięku, która pozwala odróżnić brzmienia różnych instrumentów lub głosu. Uzależniona jest od ilości, rodzaju i natężenia tonów składowych. Barwa zmienia się m.in. wraz z wysokością dźwięku. Barwa dwóch różnych dźwięków o tym samym tonie różni się ze względu na inne spektrum harmoniczne.

3. Analogowy zapis dźwięku

0x08 graphic
Sygnał analogowy, to taki, w którym zmiany jednej wartości w sposób ciągły odpowiadają drugiej. Idea zapisu analogowego dźwięku polega na transformowaniu zmian dźwięku na zmiany parametrów fizycznych nośnika.

0x08 graphic
A zatem jeśli natężenie dźwięku rośnie, to rośnie też np. namagnesowanie nośnika.

Wadą zapisu analogowego jest nieuchronne pogarszanie się jakości dźwięku i pojawianie się tzw. szumów. Aby zapisać dźwięk analogowy należy zapisać jak zmienia się jego natężenie w czasie. Do tego celu można wykorzystać np. przetwornik elektroniczny, który zmieni natężenie dźwięku na natężenie indukcji magnetycznej na taśmie. W ten sposób wprost przełoży dźwięk na parametry fizyczne nośnika.

Na taśmie magnetofonowej zostanie odwzorowany wykres a taśma przesuwając się z określoną prędkością spowoduje, że punkt na taśmie odpowiada punktowi z wykresu.

Natężenie indukcji magnetycznej odpowiada natężeniu dźwięku.

4. Cyfrowy zapis dźwięku

By dźwięk mógł być wprowadzony do komputera, musi ulec przekształceniu na ciąg zer i jedynek. Cyfrowy zapis dźwięku polega na zapisaniu kształtu sygnału w postaci ciągu liczb. Następuje to w procesie próbkowania.

Kolejne naniesienia tych liczb na wykres pozwalają na graficzne przedstawienie przebiegu sygnału. Próbkowanie - sprawdzanie w równych odstępach czasu amplitudy sygnału i zapisywanie chwilowych jej wartości w kodzie binarnym.

Ciąg tych wartości to próbka.

Próbkowanie to również odwzorowanie ciągłej funkcji na jej nieciągłą postać w komputerze.

W taki sposób obraz sinusoidy można zamienić z pewnym przybliżeniem na sekwencję liczb wyrażających kolejne amplitudy.

0x08 graphic
0x01 graphic

Rysunek 4 Konwersja analogowo-cyfrowa

Jednym z najważniejszych parametrów określających dźwięk zapisany cyfrowo jest częstotliwość próbkowania.

Im większa częstotliwość próbkowania tym dokładniejsze odwzorowanie krzywej.

Jednostką częstotliwości jest herc (Hz)

Próbkowanie 100 razy na sekundę to próbkowanie z częstotliwością 100 Hz.

Im wyższa częstotliwość próbkowania, tym lepsza jakość dźwięku.

Ponieważ człowiek słyszy dźwięki o częstotliwości od ok. 16 Hz do ok. 18kHz, więc minimalna częstotliwość próbkowania powinna wynosić 2 razy 18 kHz czyli co najmniej 36 kHz. W praktyce stosuje się około 44 kHz, czyli 2 razy 22 kHz. Tyle potrzeba do wiernego odtworzenia muzyki bardzo dobrej jakości.

5. Kompresja audio.

Kompresja audio - to „pakowanie” danych dźwiękowych.

Są dwa rodzaj kompresji: kompresja stratna, kompresja bezstratna.

Kompresja bezstratna - zachowuje pełną informację o przebiegu sygnału dźwiękowego. Wynikowy plik ma mniejszy rozmiar, ale nie kosztem utraty części informacji.

Przykładem kompresji bezstratnej jest algorytm FLAC.

Kompresja stratna - wynikowy plik ma mały rozmiar, ale kosztem utraty części informacji. Kompresja ta obniża jakość dźwięku.
Przykładem kompresji stratnej jest algorytm wykorzystany w typowym kodowaniu plików MP3.

W przypadku pliku dźwiękowego zapisanego cyfrowo bez kompresji jego jakość zależy tylko od częstotliwości próbkowania. Niestety pliki takie są bardzo duże.

W przypadku pliku dźwiękowego poddanego kompresji stratnej jego jakość zależy od przepływności dźwięku.

Przepływność (bitrate) to liczba bitów przetwarzanych w ciągu sekundy.
W przypadku dźwięku przepływność wskazuje, ile bitów opisuje jedną sekundę pliku dźwiękowego.

Jednostką przepływności jest bit na sekundę oznaczany bps.

Im wyższa przepływność tym lepsza jakość dźwięku, i odwrotnie - niska przepływność to słaba jakość dźwięku. W formacie MP3 najczęściej stosuje się przepływność 128 kbps, rzadziej 192 kbps, jeszcze rzadziej 320 kbps.

6. Przetwornik A/C lub C/A

Przetwornik analogowo-cyfrowy A/C to układ służący do zamiany sygnału analogowego (ciągłego) na reprezentację cyfrową (sygnał cyfrowy).

Przetwarzanie A/C tworzą 3 etapy: próbkowanie, kwantyzacja, kodowanie.

Działanie przeciwne do wyżej wymienionego wykonuje przetwornik cyfrowo-analogowy C/A.

2

Rysunek 1 Wykres obrazujący ruch falowy

Rysunek 3 Zamiana różnic ciśnienia akustycznego na analogowy sygnał elektryczny

Rysunek 2 Widmo trójwymiarowe