Dodatek A - Próbkowanie dźwięku
Prawdopodobnie pierwszy raz zaglądasz tutaj dlatego, że szukasz plików dźwiękowych do ściągnięcia, których potrzebujesz do wykonania ćwiczeń z rozdziałów 9. i 11. Oto one:
Sekwensery MIDI
http://www.cubase.net
http://www.cakewolk.com
http://home.c2i.net/jaase/massiva.htm
Zapętlanie i edycja dźwięku
http://www.sonicfoundry.com
Darmowe próbki dźwięków
http://music4flash.com
http://deusx.com
http://www.flashsound.com
http://www.flashkit.com
Zabawne efekty dźwiękowe
http://www.wavcentral.com
Dalsza część tego dodatku pozwoli Ci lepiej zrozumieć, czym jest cyfrowy dźwięk oraz parę innych rzeczy, o których musisz pomyśleć w czasie tworzenia własnych dźwięków dla Internetu.
Dźwięk
Dźwięk przemieszcza się w powietrzu jako fala. Im większa fala, tym głośniejszy dźwięk. Pomyśl o kołach tworzących się na powierzchni stawu po wrzuceniu kamienia, aby wyobrazić sobie wygląd fali dźwiękowej. Koła rozchodzą się od punktu wrzucenia kamienia ze stałą prędkością (częstotliwością), która nie zależy od wielkości kamienia. Od wielkości kamienia zależy natomiast wysokość fali. Woda zostaje wypchnięta przez ciśnienie powstające w czasie uderzenia kamienia o jej powierzchnię. Im silniejsze uderzenie, tym wyższa fala.
Fala dźwiękowa działa bardzo podobnie: ciśnienie tworzone przez wibrujące obiekty przemieszcza cząsteczki powietrza i tworzy w powietrzu „koła”. Koła ciśnienia uderzają w błonę bębenkową, wprawiając ją w wibracje. Wibracja ta jest właśnie tym, co my słyszymy jako dźwięk. Koła cząsteczek powietrza tworzą falę dźwiękową:
RYSUNEK
volume - głośność
wavelength - długość fali
Wysokość fali reprezentuje głośność dźwięku. Jest ona określona przez siłę źródła dźwięku lub siłę początkowej wibracji, która spowodowała powstanie fali (Używając naszej analogii do stawu: im wyższy kamień, tym większe koła na wodzie).
Długość jednego, pojedynczego „zafalowania” (najpierw w górę, potem w dół) zwana jest długością fali. Liczba fal przechodzących przez określone miejsce w określonej jednostce czasu zwana jest częstotliwością fali i jest mierzona w hercach (Hz lub kHz).
Dźwięk cyfrowy
Zanim będziesz mógł przenieść jakikolwiek dźwięk do Flasha, najpierw musisz go przekształcić na postać cyfrową (czyli dyskretyzować). Dyskretyzator w większości przypadków będzie kartą dźwiękową z podłączonym od niej mikrofonem. Proces dyskretyzacji powoduje zapamiętywanie aktualnej wysokości fali dźwiękowej w regularnych odstępach czasu. Wielkość interwału zwana jest częstotliwością próbkowania: im większa częstotliwość, tym częściej pobierane są próbki. Proces ten jest często nazywany po prostu kwantyzacją lub próbkowaniem. Każdy poziom zwany jest próbką. Złożenie wszystkich próbek w kolejności ich rejestracji tworzy cyfrową postać fali dźwiękowej:
RYSUNEK
levels - poziom
rate - liczba próbek
Definicja częstotliwości próbkowania
Częstotliwość próbowania oznacza liczbę próbek pobranych na sekundę. Podobnie jak częstotliwość dźwięku, wyrażana jest w hercach. Częstotliwość próbkowania określa największą częstotliwość lub zakres dźwięku, który można zarejestrować. Jest takie prawo dotyczące próbkowania dźwięku (odkryte przez Nyquista), które mówi, że jeśli częstotliwość próbkowania jest dwa razy większa od częstotliwości rejestrowanego dźwięku, można próbkować dźwięk bez straty jakości. Na przykład najwyższą częstotliwością, jaką możemy usłyszeć, jest 20 kHz (dla noworodka) i około 10 do 16 kHz dla dorosłych. Oznacza to, że jeżeli dźwięk będzie próbkowany z częstotliwością 40 kHz, nikt nie będzie mógł rozróżnić tak gęsto próbkowanego dźwięku od prawdziwego. Z tego właśnie powodu na kompaktach zapisywany jest dźwięk próbkowany częstotliwością niewiele większą od 40 kHz. W praktyce możesz określić maksymalną częstotliwość próbkowania (która oznacza idealną cyfrową kopię) dla dźwięku, który ma zostać zarejestrowany. Dźwięk skrzypiec zawiera składowe harmoniczne, które rozciągają się poza granice słyszalności, więc musisz je rejestrować przy częstotliwości próbkowania wynoszącej 40 kHz. Normalna mowa nie przekracza przeważnie 10 kHz, więc możesz ją próbkować z częstotliwością 20 kHz. Linie telefoniczne przepuszczają tylko dźwięki o częstotliwości do 3,5 kHz, więc możesz tego rodzaju dźwięki rejestrować z jakością próbkowania wynoszącą tylko 8 kHz.
Wielu początkującym wydaje się, że jeśli próbkują gitarę wydającą dźwięki o częstotliwości 500 Hz, to częstotliwość próbkowania powinna wynosić 1000 Hz (1 kHz), aby zarejestrować dźwięk prawidłowo. Nie jest to jednak prawdą. Struna gitary posiada podstawową częstotliwość wynoszącą 500 Hz, ale także wiele składowych harmonicznych powyżej tej wartości. Mogą one wychodzić znacznie poza przyjętą skalę, nie wspominając o tym, że właśnie te składowe harmoniczne mogą powodować różnicę w dźwięku przy tej częstotliwości pomiędzy gitarą a puzonem. Jeśli chcesz uzyskać próbki muzyczne dobrej jakości, które zawierają pełny dźwięk, tworzony przez wszystkie składowe harmoniczne, musisz używać większych częstotliwości próbkowania.
Gdy tworzysz dźwięki dla Internetu, to najlepiej uczynisz, nagrywając basy. Bębny i inne basowe dźwięki nie potrzebują wysokich częstotliwości próbkowania, więc możesz optymalnie wykorzystać niewielką przepustowość istniejącą w Internecie.
Definicja poziomów kwantyzacji
Jak widzieliśmy wcześniej, każda próbka jest konwertowana do pewnego poziomu. Liczba dostępnych poziomów zależy od ilości miejsca przeznaczanego na każdą próbkę oraz od możliwości karty dźwiękowej, która musi zarejestrować liczbę binarną o wielkości 8, 16, 24 lub 32 bitów.
Dla 8 bitów możesz mieć 256 różnych poziomów, co wynika z liczby kombinacji, wynoszącej 28. Dla 16 bitów istnieje 65536 różnych poziomów (216) itd. Zauważ, że zwiększenie liczby poziomów z 8 do 16 bitów tylko podwoiło wielkość próbki, natomiast jakość odwzorowania dźwięku zwiększyła się aż 256 razy.
Ponieważ próbki zapamiętywane są jako liczby binarne, które mogą być tylko liczbami całkowitymi, proces próbkowania może wybierać tylko pomiędzy jednym poziomem a następnym. Jeśli dźwięk znajdzie się między dwoma poziomami, to powstanie różnica pomiędzy oryginalnym dźwiękiem a jego próbką. Błąd ten zwany jest błędem kwantyzacji i może być słyszany jako ciche brzęczenie lub trzaski. Jest to zniekształcenie, które czyni mowę tak metaliczną przez telefon:
RYSUNEK
Na rysunku kolejne poziomy próbkowania różnią się o jedną kratkę, więc różnica między poziomami odpowiada odległości widocznej na rysunku między dwoma strzałkami. Jak widzisz, sygnał po próbkowaniu przeważnie nie odpowiada rzeczywistej fali. Jeśli wybierzesz próbkowanie 8-bitowe, to tło dźwięku będziesz słyszał znacznie głośniej. Pamiętaj, że liczba poziomów próbkowania, z jaką będziesz rejestrował plik, znacznie wpływa na pojawiające się w nim szumy. Jednak próbki, które z natury rzeczy zawierają dużo szumu (eksplozje, trzaskanie drzwiami itp.), mogą być próbkowane z mniejszą liczbą poziomów, gdyż pomimo istnienia różnicy względem oryginału nie będą brzmiały wiele gorzej.
Jeśli jesteś szczególnie sprytny i pozwalasz na znaczną kwantyzację w swoich kompozycjach, możesz zamaskować szumy w szybko zmieniających się dźwiękach przez ukrycie ich za głośniejszymi dźwiękami perkusji (które, jak wspomnieliśmy wcześniej, nie wymagają szybkiego próbkowania). Kompresja MP3 używa tego sposobu do inteligentnego ukrycia szumów kwantyzacji. Gdy wykryje bardzo głośny basowy dźwięk, szuka dźwięków o wyższych częstotliwościach, które zostaną zagłuszone przez bas i zaczyna próbkować z mniejszą częstotliwością.
Ogólnie rzecz biorąc, możesz optymalizować szerokość pasma, używając wyższych poziomów próbkowania przy pierwszoplanowych lub głośnych dźwiękach w kompozycji, a niższych dla podkładu w tle. Musisz jednak zwracać uwagę na ciche przejścia dźwięku: powodują one największy i najbardziej słyszalny błąd kwantyzacji. Możesz jednak z tym walczyć przez ustawienie odpowiedniego poziomu nagrania.
Poziom nagrania
Poziomy dźwięku, którymi próbkujesz, mają duże znaczenie dla jakości dźwięku. W odróżnieniu od zwykłego nagrywania dźwięku błąd kwantyzacji w cyfrowym dźwięku jest zawsze stały, ponieważ jest wprowadzany w czasie procesu próbkowania, a nie w późniejszej obróbce dźwięku. Jeśli dźwięk jest cichy, używasz znacznie mniejszej liczby poziomów kwantyzacji niż zwykle. To powoduje, że poziom szumów jest znacznie większy niż w przypadku nagrywania analogowego. Najprostszym sposobem na obejście tego problemu jest odpowiednie ustawienie poziomu nagrania, tak aby była używana jak największa liczba poziomów kwantyzacji. Spowoduje to zwiększenie głośności nagrywanego dźwięku, lecz ograniczy jego zniekształcenie:
RYSUNEK
Jeśli będziesz ten dźwięk odtwarzał we Flashu, użyj obwiedni dźwięku do ustawienia z powrotem odpowiedniego poziomu dźwięku w kompozycji. Tym sposobem minimalizujesz efekt kwantyzacji i zwiększasz jakość nagrania. To zwiększa pole manewru przy późniejszej optymalizacji dźwięku dla potrzeb Internetu.
3