r14-05, ## Documents ##, flash5biblia


Rozdział 14.
Dźwięk — podstawy

W tym rozdziale:

Ten rozdział jest wprowadzeniem do podstawowych zagadnień związanych z dźwiękiem. Odpowiednie zastosowanie dźwięku w projekcie Flasha może dodać wyrazu i zwiększyć atrakcyjność prezentacji. Wynika to z faktu, że dźwięk angażuje kolejny zmysł widza. W połączeniu z formą wizualną i ruchem, dźwięk pogłębia wrażenia wywierane na widzu i jego odbiór filmu Flasha. Uważne planowanie i przywiązanie wagi do szczegółów technicznych może sprawić, że dźwięk stanie się jednym z głównych elementów przekazu. Zwykle dźwięk dodaje się do prezentacji jako ostatni element, lecz postaramy się namówić cię do innego podejścia, polegającego na zaplanowaniu spójnej prezentacji, będącej multimedialną ucztą zarówno dla wzroku jak i dla słuchu odbiorcy. W tym rozdziale wyjaśnimy pewne zagadnienia techniczne związane z dźwiękiem cyfrowym, takie jak częstotliwość próbkowania czy rozdzielczość bitowa. Omówimy też kwestię rozmiarów plików dźwiękowych oraz formaty tych plików, obsługiwane przez Flasha.

Próbkowanie i jakość dźwięku

Zanim zaczniesz stosować dźwięk w swoich projektach Flasha, powinieneś zdobyć podstawową wiedzę na temat dźwięku cyfrowego. W tym podrozdziale zapoznamy cię z zagadnieniami próbkowania, rozdzielczości bitowej i rozmiaru pliku dźwiękowego — oraz ich związkiem z dźwiękiem we Flashu.

Co to jest dźwięk?

Słuch jest jednym z pięciu głównych zmysłów człowieka. Dźwięk słyszymy wówczas, gdy drgania powietrza docierają do ucha. Głośność odbieranego dźwięku wynika z amplitudy, czyli intensywności tych drgań. Wysokość słyszanego dźwięku zależy od częstotliwości drgań. Częstotliwość drgań jest wyrażana w hercach (Hz).

W pełni sprawne ludzkie ucho rejestruje dźwięki w zakresie częstotliwości od 20 Hz do 20 000 Hz. Ta skala częstotliwości odpowiada słyszalnej skali dźwiękowej — od najniższych basów po wysokie soprany. Już tutaj zwróćmy uwagę na często popełniany błąd pojęciowy — częstotliwość dźwięku jest często mylona z częstotliwością próbkowania dźwięku cyfrowego, choć te dwa pojęcia dotyczą dwóch zupełnie różnych spraw.

Podstawowe parametry dźwięku cyfrowego

Gdy umieszczasz dźwięki w filmie Flasha, powinieneś zwrócić uwagę na kilka ich para­metrów wpływających na jakość dźwięku i rozmiar pliku. Jakość dźwięku jest ważna z tego względu, że wpływa na estetykę wrażeń słuchowych, z kolei rozmiar pliku jest nierozerwalnie związany z czasem jego przesyłania w Internecie. Najważniejszymi parametrami dźwięku wpływającymi na jakość dźwięku i rozmiar pliku są częstotli­wość próbkowania i rozdzielczość bitowa.

Częstotliwość próbkowania

Próbkowanie dźwięku polega na przetwarzaniu analogowego sygnału dźwiękowego na sygnał cyfrowy, czyli serię liczb opisujących chwilowe wartości sygnału. Pojedynczą liczbę reprezentującą chwilową wartość sygnału dźwiękowego nazywamy próbką. Częstotliwość próbkowania, wyrażana w hercach (Hz), określa liczbę próbek sygnału dźwiękowego pobieranych i występujących w ciągu jednej sekundy dźwięku. We wczesnych la­tach 40. dwu­dziestego wieku Harry Nyquist i Claude Shannon opracowali teorię, zgodnie z którą częstotliwość próbkowania musi być dwa razy większa od najwyższej częstotli­wości próbkowanego sygnału. Im wyższa jest częstotliwość próbkowania, tym wyższą częstotliwość można odwzorować w sygnale cyfrowym i tym dokładniej są odwzorowywane niższe częstotliwości. Zgodnie z teorią Nyquista-Shannona, aby zapisać sygnał dźwiękowy o zakresie częstotliwości od 20 Hz do 20 000 Hz w postaci serii próbek cyfrowych, sygnał ten trzeba spróbkować z częstotliwością nie mniejszą niż 40 000 Hz, czyli 40 kHz. Właśnie dlatego dźwięk na płytach kompaktowych — który bardzo dokładnie reprezentuje pierwotny sygnał dźwiękowy — cechu się częstotliwością próbkowania 44,1 kHz.

(((uwaga))) Próbka dźwiękowa to pojedyncza wartość liczbowa, reprezentująca chwilową wartość analogowego sygnału dźwiękowego. Plik dźwiękowy to seria takich próbek, reprezentująca przebieg nagranego sygnału dźwiękowego.

Im niższa jest częstotliwość próbkowania, czyli im mniej próbek sygnału jest pobieranych lub odtwarzanych w ciągu jednej sekundy, tym bardziej dźwięk cyfrowy odbiega od pierwotnego dźwięku analogowego. Obniżenie częstotliwości próbkowania posiada jednak pewną zaletę — proporcjonalnie do obniżenia częstotliwości próbkowania zmniejsza się też rozmiar pliku dźwiękowego. Na przykład 300-kilobajtowy plik dźwiękowy o częstotliwości próbkowania 44,1 kHz, po obniżeniu częstotliwości próbkowania do 22,05 kHz zmniejszy się do rozmiaru 150 kB. Tabela 14.1 zawiera dokładne zestawienie typowych częstotliwości próbkowania dźwięku i odpowiadających im jakości.

Tabela 14.1.
Częstotliwości próbkowania i jakość dźwięku

Częstotliwość próbkowania

Jakość

Zastosowania

48 kHz

Jakość studyjna

Dźwięki i muzyka zapisywane na nośnikach cyfrowych, takich jak miniDV, DAT, DVCam itp.

44,1 kHz

Jakość płyt kompaktowych

Wysoka wierność odtwarzanego dźwięku i muzyki.

32 kHz

Jakość zbliżona do CD

Kamery cyfrowe wysokiej klasy.

22,05 kHz

Jakość radiowa (fale ultrakrótkie)

Krótkie klipy muzyczne wysokiej jakości .

11,025 kHz

Akceptowalna
dla muzyki

Dłuższe klipy muzyczne, wysokiej jakości głos, dźwiękowe efekty specjalne.

5 kHz

Akceptowalna dla głosu lektora

„Płaski” głos mówiony, proste dźwięki dla przycisków.

Typową częstotliwością próbkowania dźwięku, stosowaną przez większość komputerowych kart dźwiękowych jest częstotliwość 44,1 kHz. Z tego względu dźwięk przeznaczony do odtwarzania na komputerach powinien mieć częstotliwość próbkowania będącą wielokrotnością częstotliwości 11,025. Dlatego zalecamy stosowanie częstotliwości próbkowania takich jak 44,1 kHz, 22,05 kHz i 11,025 dla wszelkich dźwięków komputerowych. (Choć dźwięki o częstotliwościach próbkowania innych niż częstotliwości 11,025 kHz, mogą dawać dobre wyniki na komputerze, na którym je przygotowujesz i na wielu innych komputerach, na niektórych mogą występować problemy. Stosowanie tej prostej zasady pozwoli ci uniknąć narzekań dotyczących trzasków i zniekształceń dźwięku). Stosowanie tej zasady jest jeszcze ważniejsze w przypadku pracy z dźwiękiem we Flashu. Gdy zaimportujesz do Flasha dźwięk o częstotliwości nie będącej wielokrotnością częstotliwości 11,025 kHz, program automatycznie zmienia częstotliwość próbkowania tego dźwięku, co wpływa odtwarzanie dźwięku niższego lub wyższego od pierwotnego. Ta sama zasada dotyczy eksportowania dźwięku, którym to zagadnieniem zajmiemy się w dalszej części rozdziału. Dodajmy również, że choć w interfejsie Flasha pojawiają się częstotliwości próbkowania takie jak 11 kHz, 22 kHz i 44 kHz, jest to po prostu skrótowy zapis częstotliwości próbkowania 11,025 kHz, 22,05 kHz i 44,1 kHz.

Rozdzielczość bitowa

Drugim kluczowym czynnikiem wpływającym na jakość dźwięku jest rozdzielczość bitowa. Rozdzielczość bitowa określa liczbę bitów opisujących każdą próbkę dźwięku (czyli każdą liczbę reprezentującą chwilową wartość sygnału). Rozdzielczość bitowa rośnie wykładniczo, czyli 8-bitowy dźwięk może zawierać 28, czyli 256 różnych poziomów wartości, zaś dźwięk 16-bitowy może ich zawierać już 216, czyli 65 536. Z tego względu cyfrowy dźwięk 16-bitowy zawiera znacznie więcej informacji o pierwotnym sygnale niż dźwięk 8-bitowy o tej samej długości. W rezultacie, dzięki dodatkowej informacji zawartej w dźwięku 16-bitowym jest zredukowany szum występujący w tle, zaś sam dźwięk jest bogatszy i czystszy. Ten sam dźwięk nagrany z rozdzielczością 8-bitową jest zaszumiony i „płytki”.

Redukcja rozmiaru pliku

Trzeba również pamiętać, że 16-bitowy plik dźwiękowy jest dwa razy większy od tego samego dźwięku zapisanego z jakością 8-bitową. Wynika to z konieczności zapisania dwa razy większej liczby w pliku wyższej jakości. Co jednak zrobić, gdy plik dźwiękowy jest zbyt duży? Dźwięk o wyższej rozdzielczości bitowej można skonwertować na dźwięk o niższej rozdzielczości; można też poprzez konwersję zredukować częstotliwość próbkowania dźwięku. W profesjonalnych studiach muzycznych tego typu konwersje wykonuje się za pomocą zaawansowanego sprzętu, jednak można je wykonać na komputerze osobistym za pomocą programu do edycji dźwięku. Więcej informacji na temat obniżania częstotliwości próbkowania i rozdzielczości bitowej znajdziesz w rozdziale 32., „Programy do edycji dźwięku”.

(((wskazówka))) Jeśli masz trudności ze zrozumieniem zagadnienia rozdzielczości bitowej dźwięku, zaś znasz się na skanowaniu obrazów fotograficznych, pomyśl o różnicy między 8-bitowym obrazem w skali szarości a 24-bitowym obrazem kolorowym. Pliki 8-bitowych obrazów w skali szarości (na przykład czarno-białych zdjęć) są znacznie mniejsze niż pliki obrazów o 24-bitowym kolorze (na przykład kolorowe fotografie), jednak 8-bitowe obrazy czarno-białe nie zawierają zbyt wielu informacji — jedynie 256 poziomów szarości. Z drugiej strony, 24-bitowe obrazy kolorowe zawierają 256-poziomowe kanały R, G i B, co daje w sumie paletę 16,7 miliona kolorów. Próbki dźwiękowe przeznaczone dla ucha ludzkiego nie wymagają aż tylu różnych poziomów wartości. 16-bitowe próbki dźwiękowe dają zakres dynamiczny składający się z ponad 64000 wartości — znacznie więcej, niż może rozróżnić ucho ludzkie.

W tabeli 14.2 porównujemy różne, najczęściej stosowane rozdzielczości bitowe dźwięku i ich zastosowania.

Tabela 14.2.
Rozdzielczości bitowe dźwięku i ich zastosowania

Rozdzielczość bitowa

Jakość

Zastosowania

16 bitów

Jakość płyty kompaktowej

Wysoka wierność dźwięków i muzyki.

12 bitów

Jakość bliska CD

Kamery cyfrowe wysokiej klasy.

8 bitów

Jakość radiowa FM

Krótkie klipy muzyczne wysokiej jakości.

4 bity

Akceptowalna dla muzyki

Dłuższe klipy muzyczne, wysokiej jakości głos lektora, dźwiękowe efekty specjalne.

Przeanalizuj rysunki 14.1 i 14.2, by porównać przebiegi sygnałów dźwiękowych z próbkowaną z różnymi częstotliwościami próbkowania i rozdzielczościami bitowymi. Oba rysunki prezentują przebieg dźwięku pochodzącego z tego samego źródła, lecz na każdym z nich dźwięk został spróbkowany z innymi parametrami. Przebieg dźwięku 16-bitowego o częstotliwości próbkowania 44,1 kHz zawiera dwa razy więcej „punktów” — czyli próbek — niż 8-bitowy dźwięk o częstotliwości próbkowania 11,025 kHz. Ponieważ dźwięk o wyższej częstotliwości próbkowania zawiera więcej próbek, odstępy czasowe pomiędzy poszczególnymi próbkami nie są tak wielkie jak w przypadku drugiego przebiegu. Więcej próbek zapewnia dokładniejszą reprezentację przebiegu dźwiękowego i czystszy, wierniejszy dźwięk.

0x01 graphic

Rysunek 14.1. Ten przebieg reprezentuje dźwięk o częstotliwości próbkowania 44 100 Hz i rozdzielczości 16-bitowej

0x01 graphic

Rysunek 14.2. Ten przebieg preprezentuje ten sam dźwięk, który pokazano na rysunku 14.1, jednak teraz jego częstotliwość próbkowania wynosi 11 025 Hz, a rozdzielczość jest 8-bitowa

(((wskazówka))) Błędem często popełnianym przez nowicjuszy jest założenie, że dźwięk 8-bitowy jest akceptowalny ze względu na fakt, że mieści się w dwa razy mniejszym pliku niż dźwięk 16-bitowy. Założenie to jest błędne z dwóch powodów. Po pierwsze, dźwięk 8-bitowy cechuje się znacznie gorszą jakością brzmienia niż dźwięk 16-bitowy. Po drugie, taka oszczędność jest nieopłacalna, ponieważ większość kompresorów dźwięku może operować jedynie na dźwięku 16-bitowym.

Kanały

Wszystkie pliki dźwiękowe są albo stereofoniczne (zawierają lewy i prawy kanał stereo), albo mo­nofoniczne (zawierają pojedynczy kanał). Pliki dźwięków stereo są dwa razy większe od pli­ków dźwięków mono, gdyż zawierają one dwa razy więcej informacji. W większości aplikacji przezna­czonych do przetwarzania i edycji dźwięków można zapisać lub wyeksportować dźwięk, który pierwotnie jest dźwiękiem stereofonicznym, w postaci jednokanałowego dźwięku monofoniczne­go, powstającego poprzez połączenie (zmieszanie) obu kanałów. Możliwe jest również zapisanie tyl­ko prawego bądź tylko lewego kanału dźwięku stereo jako od­dzielnego pliku .WAV lub .AIF.

W przypadku zaawansowanych aplikacji do wielościeżkowej edycji dźwięku, takich jak Deck II, ProTools czy Audio­Logic, można edytować dźwięk zawierający nawet osiem lub więcej ścieżek — w zależności od konfigu­racji systemu. Takie aplikacje dają muzykom szerokie pole do popisu w trakcie komponowania i miksowania klipów dźwiękowym. Aby takie klipy można było umieścić we Flashu, trzeba je zmiksować do postaci pliku stereo- lub monofonicznego i zapisać w for­macie WAV lub AIF. Więcej szczegółów na temat tego procesu znajdziesz w rozdziale 32, „Programy do edycji dźwięku”.

Rozmiar pliku

Rozmiary plików dźwiękowych powinny cię interesować z kilku powodów.

Wskazówki związane z używaniem dźwięku w projektach

Pracując z klipami dźwiękowymi, powinieneś starać się tworzyć jak najkrótsze klipy dźwiękowe. Oznacza to odcinanie wszelkich fragmentów przebiegu dźwiękowego, które są niepotrzebne, szczególnie na początku i na końcu klipu. Proces ten omawiamy dokładnie w rozdziale 15., „Import i edycja dźwięku we Flashu”, w odniesieniu do narzędzi dźwiękowych we Flashu, a następnie w rozdziale 32., „Programy do edycji dźwięku”, gdzie omawiamy zewnętrzne aplikacje służące do edycji dźwięku.

Jeśli planujesz umieścić w projekcie ścieżkę muzyczną, która będzie odtwarzana w tle, zastanów się nad możliwością utworzenia krótkiego klipu dźwiękowego, który można zapętlić. Zapętlanie klipów dźwiękowych również omawiamy w rozdziale 15., „Import i edycja dźwięku we Flashu”, i 32., „Programy do edycji dźwięku”.

Oto prosty wzór, na podstawie którego możesz obliczyć rozmiar pliku dźwiękowego w bajtach:

czas trwania dźwięku w sekundach × częstotliwość próbkowania w Hz × liczba kanałów ×(rozdzielczość bitowa / 8) = rozmiar pliku

* rozdzielczość bitową dzielimy przez 8, ponieważ w jednym bajcie mieści się 8 bitów.

Zgodnie z tym wzorem, 20-sekundowy stereofoniczny klip dźwiękowy i rozdzielczości 8-bitowej i częstotliwości próbkowania 11 kHz zmieści się w pliku o wielkości:

20 s ×11 025 Hz ×2 kanały × (8 bitów/8) = 441 000 Bajtów = 430 kB

Na temat doboru idealnej jakości plików dźwiękowych na potrzeby Flasha istnieją dwie szkoły. Szkoły te dzieli przede wszystkim fakt posiadania lub nieposiadania wysokiej jakości narzędzi do edycji dźwięku. Aby nie pokrzywdzić reprezentantów żadnej z tych szkół, przedstawiamy oba --> podejścia:

Formaty importowanych plików dźwiękowych

W poprzednich wersjach Flasha można było importować pliki dźwiękowe w kilku formatach — których wybór zależał głównie od platformy, na której pracowałeś. Flash nadal obsługuje te formaty i niezależnie od tego, na której platformie dany plik dźwiękowy został zaimportowany, otrzymany plik .FLA można edytować na każdej z tych platform. Wielką nowością we Flashu 5 jest możliwość importowania plików MP3.

(((nowość))) Flash 5 umożliwia import plików dźwiękowych w formacie MP3!

Oprócz plików w formacie MP3 Flash umożliwia również importowanie plików dźwiękowych w kilku innych formatach. Oto pełna lista formatów dźwiękowych importowanych przez Flasha:

(((uwaga))) Jeśli pracujesz równolegle na platformach PC i Macintosha, i jeśli pliki MP3 nie są jedynymi plikami dźwiękowymi, jakich używasz w swoich projektach, zadbaj o to, by dźwięki umieszczone w filmach .FLA były edytowalne na obu platformach. Nie polegaj na importowanym dźwięku, osadzonym w pliku .FLA, tak jakby był to źródłowy plik dźwiękowy. Zachowaj dźwięk zarówno w formacie .WAV, jak i .AIFF i umieść je w katalogach wraz z plikami .FLA na obu platformach. Oczywiście, takie działanie staje się zbędne po zainstalowaniu aplikacji QuickTime 4, ponieważ wówczas na obu platformach można edytować pliki w obu formatach.

(((początek szarego tła)))

Format MP3

Format MP3 jest interesujący zarówno ze względu na zastosowania jak i na rozwiązania technologiczne. Jest to najlepszy i najbardziej wydajny format kompresji dźwięku — pliki MP3 redukują rozmiar pliku dźwiękowego nawet dwunastokrotnie, bez wyraźnego spadku jakości dźwięku. Format MP3 został opracowany pod skrzydłami grupy Motion Picture Experts Group (MPEG) zgodnie z następującymi przesłankami: dźwięk o jakości płyty kompaktowej jest próbkowany z częstotliwością 44,1 kHz i posiada rozdzielczość 16-bitową, co daje około 1,4 miliona bitów danych w każdej sekundzie — lecz taka pojedyncza sekunda dźwięku zawiera mnóstwo danych o dźwiękach, które nie są słyszalne! Obmyślając algorytm kompresji, który redukuje ilość danych związanych z niesłyszalnymi dźwiękami, twórcy formatu MP3 umożliwili dostarczanie wysokiej jakości dźwięku przez Internet bez nadmiernych opóźnień (chodzi o opóźnienia pomiędzy rozpoczęciem odczytu a rozpoczęciem odtwarzania). Format MP3 można też opisać w taki sposób, że stosuje on techniki kodowania korzystające z wiedzy o percepcji człowieka, które redukują nakładające się i nadmiarowe informacje opisujące dźwięk. W postaci zaimplementowanej we Flashu 5 format MP3 posiada jeszcze jedną zaletę — umożliwia on strumieniowe przesyłanie danych dźwiękowych, co oznacza że program może rozpocząć odtwarzanie dźwięku jeszcze przed pobraniem całego pliku dźwiękowego. Format Shockwave Audio, który jest domyślnym schematem kompresji dźwięku w filmach Shockwave tworzonych w programie Director, jest w rzeczywistości formatem MP3 w przebraniu.

(((koniec szarego tła)))

Formaty kompresji dźwięku we Flashu

Choć domyślnym formatem kompresji --> dźwięku podczas publikowania [Author:MB] filmów jest format MP3, dźwięk osadzony w filmach można też kompresować z użyciem schematu ADPCM. Ponadto możesz zdecydować, jakiego formatu kompresji dźwięku użyjesz podczas eksportowania projektów .FLA do plików .SWF (patrz rozdział 39., „Współpraca z programami Dreamweaver i Director”). Blaski i cienie każdego z tych formatów omawiamy w poniższej liście.

Niezależnie od formatu kompresji, który wybrałeś ogólnie dla dźwięku w filmie, możesz indywidualnie określić schemat kompresji dla indywidualnych dźwięków zawartych w bibliotece filmu. Ponadto każdy z formatów kompresji posiada specyficzne opcje i parametry. Więcej informacji na temat parametrów kompresji dźwięku we Flashu znajdziesz w rozdziale 16., „Optymalizacja dźwięku”.

(((uwaga))) Kompresja ADPCM była domyślnym formatem kompresji dźwięku we wcześniejszych wersjach Flasha, takich jak Flash 2 czy 3. Pod względem wydajności nie może się on równać z formatem MP3, jednak jest użyteczna w sytuacjach, gdy wynikowy plik filmowy musi być kompatybilny z wszystkimi wcześniejszymi wersjami odtwarzacza Flash Player.

W tabeli 14.3 zebraliśmy informacje na temat formatów importowych Flasha dostępnych na różnych platformach.

Tabela 14.3.
Formaty dźwiękowe importowane przez Flasha 5

Format

Kompatybilność

Komentarz

Mac

PC

Flash 4

MP3

ü

ü

­—

Format międzyplatformowy, bogate zbiory w Internecie.

AIF

ü

ü

Standardowy format dźwiękowy na Macintoshu.

WAV

ü

ü

Standardowy format dźwiękowy na PC.

W tabeli 14.4 zebraliśmy informacje na temat zgodności formatów kompresji dźwięku we Flashu z poszczególnymi platformami.

Format

Kompatybilność

Komentarz

Mac

PC

Flash 3

ADPCM

ü

ü

ü

Dobry schemat kodujący, kompatybilność z wcześniejszymi wersjami Flasha.

MP3

ü

ü

ü

Najlepszy schemat kompresji, brak kompatybilności z wersjami 1, 2 i 3 Flasha, większe obciążenie procesora.

RAW

ü

ü

ü

Brak kompresji, bezstratny, duże rozmiary plików.

Podsumowanie

Ostatnia z wymienionych opcji tak naprawdę nie jest schematem kompresji, ponieważ zapisuje w filmie nieskompresowane dane dźwiękowe (przyp. tłum.).

2 Część I Podstawy obsługi systemu WhizBang (Nagłówek strony)

2 Dokument2

do składu> W oryginale długi akapit na górze strony 397 zawiera opis dwóch różnych podejść, dlatego rozbiłem ten opis na dwa punkty (co wygląda bardziej przejrzyście).

DO KOREKTY MERYTORYCZNEJ> Nieznacznie zmieniłem to zdanie. Zdanie w oryginale sugerowało, że z Flasha można wyeksportować dźwięk w formacie MP3, co jest nieprawdą. Dźwięk w tym formacie jest umieszczany w publikowanych filmach, lecz nie można wyeksportować samodzielnego pliku MP3.

DO KOREKTY MERYTORYCZNEJ> Dodałem (wiem to z wykładów na Politechnice)



Wyszukiwarka