r 14 07 PCGHQNYZKSN5YVFNMEX54LBVNTZPFSF2FUREFKI


Rozdział 14.
Dzwięk i obraz wideo
Spędzając miłe popołudnie na buszowaniu po sieci, odkrywasz nagle stronę zawierającą
długą listę animacji, z których chciałbyś skorzystać. Świetnie, myślisz, i przeglądasz li-
stę tytułów. I tu pojawia się problem: przy każdym z tytułów widnieje krótki opis, na
przykład, taki:
 Luther s Banana is a 1.2 megabyte AVI file with a CinePak codec and an
8-bit 22KHz two channel audio track.
Jeżeli rozumiesz ten opis, nie musisz czytać tego rozdziału. Przeczytaj, jeśli chciałbyś
się dowiedzieć czegoś o dzwięku i obrazie w powiązaniu z sieciami lub, gdy zdecydo-
wałeś, że musisz poznać znaczenie tych wszystkich dziwnych słów i liczb.
W tym rozdziale będziemy zajmować się cyfrowym dzwiękiem i obrazem wideo: jak
działają, w jakich formatach można je przechować i które z nich nadają się do zastoso-
wań sieciowych. Znajdziesz także kilka sugestii, skąd wziąć obraz i dzwięk oraz jak
wykorzystać go na Twoich stronach sieciowych. Oto niektóre z tematów, jakie zostaną
tu omówione:
cyfrowy dzwięk i obraz; podstawowe wiadomości,
popularne formaty zapisu dzwięku: MP3, Wave oraz RealAudio,
popularne formaty zapisu obrazu wideo: QuickTime, Video for Windows, MPEG
oraz RealAudio,
systemy kodowania obrazu wideo; jak działają, które z nich są najpopularniejsze
i najbardziej przydatne,
jak tworzyć pliki dzwiękowe i wideo na użytek sieci.
Dzwięk  wiadomości podstawowe
Czy chcesz dowiedzieć się czegoś na temat dzwięku w komputerach? Nauczyć się two-
rzyć własne pliki dzwiękowe z muzyką, głosem, efektami specjalnymi lub innymi
dziwnymi hałasami? Jeśli tak, czytasz właściwy tekst. W pierwszej części tego rozdzia-
łu dowiemy się kilku rzeczy o cyfrowym dzwięku w ogóle i o popularnych w sieci for-
matach plików, w których można go zapisywać. Opowiemy też o tym, jak na własny
użytek zapisać dzwięk w formacie cyfrowym i jak wprowadzić go do sieci.
402 Część 5. Multimedia i aplety Javy
Fale dzwiękowe
Być może pamiętasz z lekcji fizyki, że dzwięk to drgania powietrza, rozchodzące się
w postaci fali. Te drgania ludzkie ucho rejestruje jako dzwięk. Najprostsza fala dzwię-
kowa mogłaby wyglądać tak, jak to pokazuje rysunku. 14.1.
Rysunek 14.1.
Prosta fala dzwiękowa
O fali dzwiękowej musimy wiedzieć dwie ważne rzeczy. Po pierwsze, ma zawsze pew-
ną amplitudę, definiowaną jako odległość od linii środkowej (oznaczającej wartość ze-
rową dzwięku, czyli ciszę) do najwyższego lub najniższego punktu fali. Im większa
amplituda, tym głośniejszy dzwięk.
Po drugie, ma również częstotliwość, która określa prędkość, z jaką porusza się fala
(lub bardziej precyzyjnie  ilość fal przechodzących przez określony punkt w jednost-
ce czasu). Przy wysokich częstotliwościach  tj. gdy fala przemieszcza się prędzej 
słyszymy dzwięki wysokie, przy niskich, głębokie tony.
Prawdziwe dzwięki są znacznie bardziej skomplikowane niż ten opisany przez nas. Są
one sumą wielu różnych, nakładających się na siebie fal. Amplituda i częstotliwość są
jednak wśród tych wszystkich pojęć najważniejsze.
Konwersja fali dzwiękowej do postaci cyfrowej
Analogowa fala dzwiękowa (taka jak na rysunku 14.1) jest ciągłą linią. Poruszając się
wzdłuż niej, możemy odczytać nieskończenie wiele wartości amplitudy. Aby prze-
kształcić taką falę do postaci cyfrowej, komputer musi zmierzyć amplitudę w określo-
nych odstępach czasowych. Każda zmierzona wartość amplitudy nazywana jest próbką
(sample). Dlatego właśnie proces przekształcania dzwięku do postaci cyfrowej nazywa-
ny jest próbkowaniem dzwięku (ang. sampling). Rysunek 14.2 przedstawia, jak odczy-
tywane są wartości amplitudy fali przy próbkowaniu.
Rysunek 14.2.
Próbkowanie dzwięku
Im więcej pobierzemy próbek, tym dokładniej uda nam się odwzorować prawdziwy
kształt fali i tym doskonalszą jej imitację otrzymamy. Nie będzie to jednak identyczny
dzwięk. Ponieważ oryginalna fala posiada nieskończenie wiele różniących się amplitud,
Rozdział 14. Dzwięk i obraz wideo 403
nigdy nie uda nam się jej odtworzyć całkowicie wiernie. Jeżeli jednak pobierzemy
próbki bardzo gęsto, osiągniemy tak duże podobieństwo do pierwowzoru, że ludzkie ucho
nie zdoła wychwycić różnicy.
Ilość próbek pobieranych w ciągu sekundy zwana jest częstotliwością próbkowania (sample
rate). Zwykle mierzymy tę częstotliwość w kilohercach (kHz). Obecnie używa się kilku
różnych częstotliwości próbkowania; najpopularniejsze z nich to 11 kHz, 22 kHz i 44 kHz.
Liczby te są zaokrąglane dla wygody. Rzeczywiście używane częstotliwości wynoszą 11,025
kHz, 22,050 kHz i 44,1 kHz.
Oprócz częstotliwości próbkowania (sample rate) mamy też rozmiar próbkowania
(sample size), zwany też rozdzielczością próbkowania (sample resolution). Ogólnie
rzecz biorąc, do wyboru są dwie rozdzielczości: 8-bitowa i 16-bitowa. Rozdzielczość
próbkowania należy sobie wyobrażać jako ilość pionowych odcinków, na które dzieli-
my amplitudę fali przy jej pomiarze, od dolnego do górnego wierzchołka.
Wartości, które chcemy mierzyć, same nie są zależne od przyjętej rozdzielczości, ale
dokładność naszego pomiaru  tak. Jeśli do pomiaru, zamiast ośmioodcinkowej  po-
działki , zastosujemy szesnastoodcinkową, będziemy mogli odwzorować mniejsze róż-
nice amplitudy i uzyskamy wierniejszy obraz (patrz rysunek 14.3). To zupełnie tak sa-
mo, jak z 16-bitowym i 24-bitowym kolorem. 24-bitowa paleta barw jest bogatsza i po-
zwala lepiej odwzorowywać subtelne odcienie, ale także, korzystając z palety 16-bito-
wej, możemy odtworzyć kolory oryginału z niezłym przybliżeniem.
Rysunek 14.3.
Rozdzielczość
próbkowania
Częstotliwość próbkowania to liczba  próbek dzwięku pobieranych na sekundę przy
mierzeniu amplitudy fali. Wyrażamy ją w kilohercach (kHz). Rozdzielczość próbkowania jest
zwykle 8-bitowa lub 16-bitowa. Ta druga rozdzielczość pozwala dokładniej zapisać wynik
pomiaru, dzięki czemu możemy lepiej odwzorować oryginalny dzwięk.
Przy pobieraniu próbki dzwięku, rzeczywista wielkość zmierzonej amplitudy zaokrą-
glana jest do najbliższej kreski  podziałki . W żargonie specjalistów określa się to jako
kwantowanie(ang. quantizing). Jeśli korzystamy z 16-bitowej rozdzielczości próbkowa-
nia, mamy o wiele większą szansę, że zapisana wartość będzie bliższa zmierzonej warto-
ści oryginalnej niż wtedy, gdy pracujemy z rozdzielczością 8-bitową (patrz rysunek 14.4).
404 Część 5. Multimedia i aplety Javy
Rysunek 14.4.
Pobieranie
próbki dzwięku
Różnica pomiędzy oryginalną wartością, a zapisanym, zaokrąglonym wynikiem pomia-
ru zwana jest błędem kwantowania (ang. quantization error  to jeszcze jeden termin
ze specjalistycznego żargonu). Duża ilość błędów kwantowania powoduje powstawanie
świszczącego pogłosu w ostatecznie uzyskanym pliku audio.
Wszystko to, co powiedzieliśmy przed chwilą w tak zawiły sposób, sprowadza się do
jednego prostego twierdzenia: 16 bitów jest lepsze niż 8 bitów. Po co więc było tyle ga-
dać? No cóż, przynajmniej teraz wiesz dlaczego. Ogólna jakość dzwięku cyfrowego jest
powiązana zarówno z częstotliwością próbkowania (sample rate), jak i rozdzielczością
próbkowania (sample size). Ponieważ jednak ludzkie ucho łatwiej wychwytuje błędy
wynikające ze zbyt niskiej rozdzielczości, niż te, wynikające ze zbyt niskiej częstotli-
wości, należy przede wszystkim zwrócić uwagę na rozdzielczość. Jeśli to możliwe,
zawsze korzystaj z rozdzielczości 16-bitowej, a nie 8-bitowej. Pracując w 8 bitach, uży-
waj największej z dostępnych częstotliwości próbkowania  pozwoli Ci to częściowo
zrekompensować błędy.
Musisz także wiedzieć, że na jakość dzwięku ma wpływ również ilość kanałów, jakie
zapiszemy. Dzwięk można bowiem zapisywać przy użyciu wielu kanałów, zwykle czy-
ni siÄ™ tak w celu uzyskania stereofonicznego efektu. Przy jednym kanale mamy do czy-
nienia z dzwiękiem mono, przy dwóch mamy stereo, przy czterech kwadrofonię i tak
dalej. Zupełnie tak, jak w Twoim odbiorniku radiowym.
Im wyższa częstotliwość próbkowania, im wyższa rozdzielczość i im większa liczba kana-
łów, tym lepszej jakości dzwięk otrzymujemy. Przykładowo, dzwięk zapisany przy roz-
dzielczości 8-bitowej i częstotliwości próbkowania 8 kHz przypomina to, co zwykle sły-
szymy przez telefon. Natomiast 16-bitowy dzwięk stereofoniczny o częstotliwości 44 kHz
odpowiada już standardowi CD. Niestety, zupełnie tak, jak w przypadku obrazów, lepsza
jakość oznacza większe rozmiary pliku. Minuta 8-bitowej muzyki o częstotliwości 22 kHz
zajmie około 1,25 MB na Twoim dysku, zaś minuta muzyki o jakości typowej dla odtwa-
rzacza CD (16 bitów, 44 kHz) zajmie około 10 MB. Jak łatwo zgadnąć, stereo zajmie dwa
razy więcej miejsca niż mono.
A co z kompresją? Jeżeli pliki audio zajmują tyle miejsca, dlaczego nie postąpić tak, jak
to uczynili specjaliści od komputerowej grafiki i nie opracować mechanizmów kompre-
sji, które pozwolą zredukować rozmiary plików? Niestety, jak twierdzą eksperci w tej
dziedzinie (a nam wypada wierzyć im na słowo), pliki audio są niezmiernie trudne do
Rozdział 14. Dzwięk i obraz wideo 405
skompresowania. W gruncie rzeczy nie ma w tym nic dziwnego, jeśli wziąć pod uwagę,
jak bardzo złożone są fale dzwiękowe. Nie możemy w tym przypadku liczyć na odszu-
kanie jakichś powtarzających się wzorów i jednolitych obszarów, które tak znakomicie
ułatwiają kompresowanie obrazów. Wśród popularnych formatów zapisu dzwięku jest
zaledwie kilka takich, które mają wbudowany mechanizm kompresji.
Odtwarzanie dzwięku cyfrowego w postaci analogowej
Udało nam się zakodować analogowy dzwięk w cyfrowej postaci. Teraz chcemy go od-
tworzyć. Komputer staje przed zadaniem przetworzenia zakodowanych danych  sze-
regu cyfrowych  próbek dzwięku z powrotem do postaci analogowej fali.
Cyfrowy dzwięk składa się z milionów zapisanych próbek, z których każda odtwarzana
jest przez określony odcinek czasu (ten sam, w jakim przedtem próbka została pobrana).
Ponieważ w tym czasie zapisana wartość amplitudy dzwięku pozostaje stała, wytwarzana
fala dzwiękowa ma zębaty, poszarpany kształt, a dzwięk brzmi nieco dziwacznie (patrz
rysunek 14.5).
Rysunek 14.5.
Poszarpany
sygnał analogowy
Z tego powodu stosuje się specjalne filtry analogowe, które wygładzają kształt fali
dzwiękowej (patrz rysunek 14.6) wysyłanej z głośników Twojego komputera.
Rysunek 14.6.
Sygnał po wygładzeniu
Popularne formaty zapisu dzwięku
Teraz, gdy już wiemy, czym jest cyfrowy dzwięk, mówimy sposoby jego przechowy-
wania. Niestety, do tej pory nie ma takiego formatu plików audio, który stałby się stan-
dardem w sieci, tak jak to się stało z formatami GIF oraz JPEG w przypadku obrazów.
W użyciu jest wiele formatów, każdy z nich stosowany w innych przypadkach. W tym
rozdziale opiszemy pobieżnie najpopularniejsze formaty i zakres ich zastosowań.
406 Część 5. Multimedia i aplety Javy
Format µ-law (Mu-law), AU
Najbardziej rozpowszechnionym i najdostępniejszym z formatów zapisu dzwięku jest
format µ-law, wymawiany jak  mju-lo: (a czasem  ju-lo: , gdyż grecka litera µ przy-
pomina wyglądem literę  u ). Jest to format uniwersalny, dostępny na różnych platfor-
mach sprzętowych. Wykorzystywany jako standard zapisu dzwięku w systemach Sun
oraz NeXT, format µ-law zostaÅ‚ zaprojektowany w Stanach Zjednoczonych na użytek
telekomunikacji. Jego europejskim odpowiednikiem jest A-law, który zwykle niczym
siÄ™ od niego nie różni. Także sam format µ-law ma kilka odmian, z których wszystkie
występują pod tą samą nazwą. Wszystkie mogą być jednak bez problemu odczytywane
i odtwarzane na każdym sprzÄ™cie, który przyjmuje format µ-law. Pliki w formacie µ-
law zwane są czasem plikami AU, gdyż ich rozszerzenie to właśnie .au.
DzwiÄ™k zapisany w formacie µ-law jest monofoniczny, 8-bitowy, o czÄ™stotliwoÅ›ci 8KHz.
Sposób kodowania dzwięku różni się od stosowanego w większości innych formatów
o podobnych możliwoÅ›ciach. DziÄ™ki temu format µ-law ma lepszÄ… dynamikÄ™ (zróżni-
cowanie pomiędzy cichymi i głośnymi dzwiękami) niż inne formaty o równie niskiej
rozdzielczości i częstotliwości próbkowania. Za to wykazuje większą tendencję do wy-
stępowania syczącego pogłosu.
Niektóre programy pozwalajÄ… zapisać dzwiÄ™k w formacie µ-law z czÄ™stotliwoÅ›ciÄ…
próbkowania wyższą niż 8 kHz. Jednak tak zapisany plik może nie dać się odtworzyć na
innych platformach sprzÄ™towych. Jeżeli zamierzasz korzystać z formatu µ-law, pozostaÅ„
lepiej przy typowej częstotliwości 8 kHz.
JedynÄ… zaletÄ… formatu µ-law jest jego szeroka kompatybilność sprzÄ™towa. Pod wieloma
adresami sieciowymi, pod którymi rozpowszechniane są pliki audio wysokiej jakości,
zapisane w formatach, takich jak AIFF lub MPEG, znalezć też można kopie tych plików
zapisane w formacie µ-law. Pozwala to poszerzyć krÄ…g odbiorców.
Format AIFF/AIFC
AIFF (ang. Audio Interchange File Format) został opracowany przez firmę Apple. Pier-
wotnie przeznaczono go dla systemu Macintosh. Pózniej zaadoptował go także system
SGI. Jeśli chodzi o elastyczność użytkowania, AIFF jest doskonałym formatem. Pozwala
zapisywać dzwięk mono lub stereo, z rozdzielczością 8- lub 16-bitową przy wielu różnych
częstotliwościach próbkowania. Pliki w formacie AIFF mają rozszerzenie .aiff lub .aif.
Format AIFC to odmiana formatu AIFF z wbudowanÄ… kompresjÄ…. Podstawowym algo-
rytmem kompresji jest MACE (ang. Macintosh Audio Compression/Expansion) wystÄ™-
pujący w dwóch odmianach: MACE3 (kompresja 3:1) oraz MACE6 (kompresja 6:1).
Kompresja MACE w obu swych wersjach jest kompresją stratną. Nie można więc ocze-
kiwać, że dzwięk zapisany w formacie AIFC będzie miał jakość równie wysoką, jak za-
pisany w formacie AIFF. Nie powinno być natomiast żadnych problemów z odtwarza-
niem. Odtwarzacze, które potrafią odczytać plik AIFF, potrafią też z reguły odczytać
plik AIFC. Przy wyborze formatu AIFF lub AIFC powinniśmy się więc kierować wy-
maganiami co do jakości dzwięku z jednej strony, a wielkości pliku z drugiej.
Rozdział 14. Dzwięk i obraz wideo 407
Format SND systemu Macintosh
Format SND, czasem zwany po prostu  dzwiękiem systemowym Mac-a  Macintosh
System Sounds  wykorzystywany jest tylko w systemie Macintosh do zapisu rozma-
itych prostych dzwięków, pisków i dzwonków, jakie towarzyszą pracy na komputerze.
Pliki SND mogą zawierać cyfrowe próbki lub serię poleceń i być odtwarzane przez Ma-
cintosh Sound Manager. Pliki SND nie sÄ… zbytnio rozpowszechnione w sieci ze wzglÄ™-
du na kompatybilność wyłącznie z systemem Macintosh. Są za to łatwo dostępne, a ich
konwersja do innego formatu dzwiękowego nie przysparza żadnych trudności.
Format WAVE systemu Windows
Format WAVE lub RIFF WAVE, zwany też WAV z powodu charakterystycznego dla
niego rozszerzenia (.wav), został opracowany przez Microsoft dla systemu IBM.
Z chwilą wprowadzenia tego formatu w wersji 3.1 systemu Windows, stał się on stan-
dardem dla komputerów IBM. Formaty WAVE oraz AIFF mają ze sobą wiele wspólne-
go, zwłaszcza pod względem elastyczności użytkowania. Również w plikach WAVE
możemy zapisywać dzwięk z rozmaitą rozdzielczością, częstotliwością próbkowania
i liczbą kanałów. Dodatkowo pliki WAVE mogą wykorzystywać kilka algorytmów
kompresji. WAVE jest domyślnym formatem zapisu plików dzwiękowych w systemach
Windows i z tego względu stał się najpopularniejszym formatem ogólnego przeznaczenia.
Format MPEG Audio
MPEG (ang. Moving Picture Experts Group) jest organizacjÄ… zajmujÄ…ca siÄ™ przede
wszystkim standaryzacją metod kompresji cyfrowego obrazu wideo. Ponieważ jednak
na taśmach wideo obrazowi towarzyszy zwykle dzwięk, również kompresja dzwięku
znalazła się w kręgu zainteresowań tej grupy. Algorytm kompresji dzwięku formatu
MPEG jest zdecydowanie zbyt skomplikowany, by go tu omawiać, innymi słowy, sama
go nie rozumiem. Jeśli jednak będziesz zainteresowany tym tematem, to szczegółowe
informacje znajdziesz w pliku MPEG FAQ na większości sieciowych stron, zajmują-
cych się rozprowadzaniem plików FAQ w Usenecie. Adres jednej z tych stron podałam
na końcu tego rozdziału.
Pliki dzwiękowe w formacie MPEG niezwykle szybko zdobyły popularność w sieci.
Format MP3 oferuje doskonałe możliwości kompresji oraz wysoką jakość dzwięku,
dzięki czemu wielu muzyków zdecydowało się rozprowadzać swoje utwory w tej posta-
ci. Dostępnych jest także wiele programów odczytujących ścieżki dzwiękowe z płyt
kompaktowych i zapisujących je w formacie MP3, co pozwala na zapisanie utworów
muzycznych na dysku i pózniejsze ich odtwarzanie. Dystrybucja tych plików bez zgody
wydawcy płyty kompaktowej jest nielegalna, jednak wiele osób tworzy kopie piosenek
na swój prywatny użytek. Doskonałą witryną poświęconą MP3 jest MP3.com http://
www.mp3.com/.
408 Część 5. Multimedia i aplety Javy
Format RealAudio
Pliki w formacie RealAudio wymagajÄ… odtwarzacza RealAudio lub odpowiedniego do-
datku i są rozpowszechniane za pomocą serwera RealAudio. Obecnie występują w dwóch
odmianach. Format 14.4 nadaje się do odtwarzania przy użyciu modemu 14,4 kb
i szybszego, otrzymujemy monofoniczny dzwięk o jakości AM. Format 28.8 nadaje się
do odtwarzania przy użyciu modemu 28,8 kb i szybszego, otrzymujemy monofoniczny
dzwięk o jakości  prawie-FM . Format RealAudio był początkowo tworzony jako for-
mat strumieniowany. W odróżnieniu od plików WAVE, które przed odtworzeniem
trzeba pobrać w całości, pliki (lub raczej strumienie audio) RealAudio wymagają tylko
pobrania i przechowania w buforze kilku sekund utworu lub transmisji, która następnie
może być odtwarzana w czasie rzeczywistym. Dzięki temu ich wykorzystanie
w Internecie jest znacznie bardziej praktyczne. Korzystając z plików RealAudio, użyt-
kownicy mogą słuchać ich już w trakcie pobierania, nie muszą czekać, aż plik zostanie
pobrany w całości.
Oba formaty, 14.4 oraz 28.8, wyposażone są w wysoce skuteczny algorytm stratnej
kompresji, zaprojektowany specjalnie dla nich. Pliki z dzwiękiem, zapisane w formacie
RealAudio, są zwykle o wiele mniejsze, niż analogiczne pliki zapisane w formacie
AIFF lub WAVE, ale też jakość dzwięku bywa zwykle niższa. Więcej informacji na
temat formatu RealAudio możesz znalezć na witrynie http://www.real.com/; z witryny
tej będziesz także mógł skopiować odtwarzacz RealAudio Player oraz Serwer.
Windows Media
Firma Microsoft stworzyła format plików audio i wideo określany jako Advanced Stre-
aming Format, którego można użyć do tworzenia plików audio strumieniowo przeka-
zywanych przez Internet. Pliki te są bardzo elastyczne, można je kompresować do nie-
wielkich rozmiarów i przesyłać łączami o niewielkiej przepustowości lub też zastoso-
wać kompresję o mniejszym stopniu, aby zapewnić lepszą jakość odtwarzania. Pliki
dzwiękowe Windows Media zostały zaprojektowane w celu zastąpienia strumieniowa-
nych plików audio w formacie RealAudio G2 oraz plików MP3. Więcej informacji na
temat technologii Windows Media można znalezć pod adresem
http://www.microsoft.com/windows/windowsmedia/pl/default.asp 1.
Skąd brać pliki dzwiękowe?
Skąd brać pliki dzwiękowe do wykorzystania na stronach sieciowych? Jest wiele róż-
nych zródeł:
mając do dyspozycji odpowiedni komputer z napędem CD, możemy nagrywać
cyfrowy dzwięk wprost ze zwykłej płyty kompaktowej. Oczywiście, musimy mieć
do dyspozycji taki napęd CD-ROM, który to umożliwia. Jeśli tak właśnie planujesz
1
Angielską wersję tej strony można znalezć pod adresem
http://www.microsoft.com/windows/windowsmedia/en/default.asp.
Rozdział 14. Dzwięk i obraz wideo 409
zrobić, nie zapomnij o kwestii praw autorskich. Większość nagrań wydanych na
płytach jest zastrzeżona, a właściciele praw autorskich mogą nie być zachwyceni,
gdy fragmenty ich utworów zaczną być bezpłatnie rozpowszechniane w Internecie;
wiele sieciowych archiwów przechowuje zestawy krótkich dzwiękowych plików,
zapisanych w formacie odpowiednim dla tego systemu, w którym się specjalizują
(format SND dla systemu Macintosh, WAV dla Windows, AU dla Uniksa w wersji
Sun itd.).
Należy pamiętać, że dzwięki ściągnięte z sieci, podobnie jak obrazy mogą być własnością
kogoś, kto nie zamierza ich nam udostępniać. Bądz ostrożny, jeśli chodzi o wykorzystanie
 znalezionych plików dzwiękowych.
Na rynku dostępne są komercyjne  klipy dzwiękowe w różnych formatach, przezna-
czone dla różnych systemów. Ich zaletą jest to, że zwykle są własnością publiczną (pu-
blic domain) lub też można je wykorzystywać bezpłatnie (royalty free). Możesz je więc
dołączyć do strony sieciowej bez uiszczania opłaty i załatwiania specjalnych zezwoleń.
Próbkowanie dzwięku
Najciekawszym dzwiękiem na stronie sieciowej będzie ten, który sam sobie nagrasz.
Jak już mówiliśmy wcześniej, proces tworzenia cyfrowego dzwięku zwany jest prób-
kowaniem (sampling). W tym rozdziale opowiemy trochÄ™ o potrzebnym do tego sprzÄ™-
cie i o dostępnym oprogramowaniu, jakiego możemy używać do próbkowania i zapisy-
wania dzwięku.
Jak można się spodziewać, dla otrzymania wysokiej jakości plików dzwiękowych
(w celu umieszczenia ich w sieci) niezbędne jest zakupienie drogiego sprzętu. Wybór
jest bardzo szeroki. Jednak, w miarę upływu czasu, te drogie technologie stają się coraz
bardziej rozpowszechnione i przystępne cenowo. Najlepsze, co w tej sytuacji możemy
zrobić, to opisać pewne ogólne tendencje w tej branży. Po szczegółowe informacje zwróć
się do lokalnego dystrybutora takiego sprzętu lub poszukaj ich w czasopismach o tematy-
ce komputerowej.
Próbkowanie na PC
Do próbkowania dzwięku na PC potrzebujemy karty dzwiękowej. Większość takich
kart pozwala zapisywać i odtwarzać dzwięk w zakresie od 8-bitowego dzwięku mono-
fonicznego o częstotliwości 11 kHz lub 22 kHz, aż do 16-bitowego dzwięku stereo
o częstotliwości 44 kHz. Postaraj się o kartę 16-bitową. Pozwoli Ci to uzyskać lepszą
jakość dzwięku, który zapisujesz w postaci cyfrowej, ale są też i inne powody. Więk-
szość nowych gier i programów multimedialnych przystosowana jest do wykorzysty-
wania dzwięku 16-bitowego, jeśli zapewnimy im odpowiednią kartę, wrażenie będzie
o wiele lepsze. Można podłączyć magnetofon lub mikrofon do właściwego gniazda na
tej karcie (line-in jack) albo posłużyć się standardowym mikrofonem. Teraz pojawia się
kwestia oprogramowania.
410 Część 5. Multimedia i aplety Javy
System Windows zaopatrzony jest w prosty program do nagrywania, zwany Rejestrato-
rem Dzwięku (Sound Recorder  jaka trafna nazwa!). Zdolny jest on nagrywać 8-
bitowy dzwięk monofoniczny z częstotliwością 22 kHz. Dla bardzo prostych dzwięków,
głosów i drobnych efektów dzwiękowych, ten program (pokazany na rysunku 14.7)
może być zupełnie wystarczający.
Rysunek 14.7.
Program
Rejestrator Dzwięku
systemu Windows
Również do karty dzwiękowej, którą nabyłeś, powinny być dołączone programy umoż-
liwiające nagrywanie i edycję dzwięku. Standardowa karta Sound Blaster sprzedawana
jest z kilkoma aplikacjami tego typu, między innymi z programem WaveEditor pokaza-
nym na rysunku 14.8. Program ten pozwala nagrywać i edytować dzwięk o szerokiej ga-
mie parametrów.
Rysunek 14.8.
Program WaveEditor
dołączony do karty
Sound Blaster
Jeśli zamierzasz serio zająć się obróbką dzwięku, może ci się przydać CoolEdit. CoolE-
dit to edytor dzwięku (typu shareware) o olbrzymiej ilości opcji. Pozwala nagrywać na
większości kart dzwiękowych. Potrafi odczytywać i zapisywać dzwięk w różnych for-
matach, można go więc używać do konwersji. Można nawet za jego pośrednictwem ob-
sługiwać odtwarzacz CD. Zarejestrowanie pełnej wersji programu CoolEdit kosztuje 50
dolarów. Istnieje także możliwość zarejestrowania wersji Light, jej koszt wynosi 25 do-
larów, a program posiada większość możliwości funkcjonalnych pełnej wersji. Więcej
informacji na temat tego programu można znalezć na WWW, pod adresem
http://www.syntrillium.com/.
RealProducer jest narzędziem wybieranym przez wszystkie osoby, które chcą tworzyć
pliki w formacie RealAudio. Program pozwala rejestrować dzwięk i zapisywać go
w postaci plików RealAudio oraz konwertować pliki, zapisane w innych formatach, do
formatu RealAudio. Więcej informacji na temat tego narzędzia można znalezć na
WWW pod adresem http://www.real.com/products/tools/index.html.
Jeśli planujesz pracować intensywnie z plikami audio i wideo, być może zainteresuje
Cię program Adobe Premiere, od dawna ceniony przez użytkowników komputerów
Macintosh. Ma on wielkie możliwości w zakresie nagrywania dzwięku, obrazu oraz in-
Rozdział 14. Dzwięk i obraz wideo 411
tegracji obu. Może współpracować z większością kart dzwiękowych. Program ten jest
dostępny zarówno w wersji przeznaczonej dla systemów Windows, jak i komputerów
Macintosh. Jest droższy, ale jest to jedno z najlepszych dostępnych narzędzi.
Próbkowanie na Macintoshach
Komputery Macintosh mają dzwięk zabudowany od wielu lat, a większość z nich wy-
posażona jest we wbudowany lub też w oddzielny mikrofon, dołączany za pośrednic-
twem kabla. Możemy nagrywać wprost przez mikrofon (otrzymujemy wtedy 8-bitowy
dzwięk o częstotliwości 22 kHz) lub podłączyć standardową wtyczkę audio stereo do
gniazda stereo z tyłu komputera. Większość nowszych Mac-ów potrafi nagrywać
16 bitowy dzwięk o częstotliwości do 48 kHz. Częstotliwość 44 kHz odpowiada dzwię-
kowi o jakości CD, a 48 kHz jakości magnetofonu cyfrowego DAT (Digital Audio Ta-
pe). Sprawdz w dokumentacji Twojego komputera, jakie ma możliwości.
Aby nagrać zwykły 8-bitowy dzwięk monofoniczny o częstotliwości 22 kHz, gdy pla-
nowana długość nagrania nie przekracza 10 sekund, możemy skorzystać z panelu steru-
jącego Sound. Jest on standardową częścią systemu operacyjnego Maca. Wystarczy
wybrać Add i kliknąć przycisk Record (patrz rysunek 14.9).
Rysunek 14.9.
Nagrywanie
za pośrednictwem
panelu sterujÄ…cego
dzwiękiem
Aby dokładniej kontrolować przebieg nagrywania, będziemy potrzebować dodatkowe-
go oprogramowania. Jest mnóstwo narzędzi działających w systemie Mac, od doskona-
łego bezpłatnego programu SoundMachine (do nagrywania i konwersji dzwięku) i sha-
rewareowego SoundHack (do edycji), aż po komercyjne aplikacje w rodzaju
Macromedia s SoundEdit 16. Świetnym narzędziem jest też program Adobe Premiere,
o którym mówiliśmy już wcześniej, w podrozdziale poświęconym komputerom PC.
Szczególnie przydatny będzie wtedy, gdy pracę nad dzwiękiem zamierzamy łączyć
z pracÄ… nad obrazem wideo (patrz rysunek 14.10).
Rysunek 14.10.
Opcje nagrywania
programu
Adobe Premiere
412 Część 5. Multimedia i aplety Javy
Próbkowanie w systemach uniksowych
Większość nowszych stacji uniksowych posiada wbudowane mikrofony, które pozwala-
ją nagrywać dzwięk 16-bitowy. Szczegóły znajdziesz w dokumentacji technicznej.
Konwersja plików dzwiękowych
Plik dzwiękowy może być zapisany w niewłaściwym formacie, to znaczy nie w tym,
w którym chcielibyśmy go zapisać. W tym podrozdziale wymienimy kilka programów,
które potrafią odczytywać i konwertować pliki dzwiękowe do wielu popularnych
formatów.
Dla systemów Unix oraz zgodnych ze standardem PC można stosować program o na-
zwie SOX autorstwa Lance-a Norskoga. Potrafi on konwertować pliki do wielu forma-
tów, w tym AU, WAV, AIFF oraz macintoshowego SND. Można też w nim dokonywać
elementarnej obróbki dzwięku, czyli filtrowania, zmiany częstotliwości i odwracania
kierunku czasu w pliku dzwiękowym.
W systemie DOS można używać programu WAVany Billa Neisiusa. Pozwala on kon-
wertować większość popularnych formatów (w tym AU oraz SND systemu Macintosh)
do formatu WAV.
Dla Windows mamy doskonały program Waveform Hold and Modify (WHAM), który
pozwala odtwarzać, edytować i konwertować pliki dzwiękowe. Świetnie może posłużyć
jako pomocnicza aplikacja dla sieciowej przeglÄ…darki.
W systemie Macintosh można korzystać z bezpłatnego (freeware) programu SoundApp
Normana Franke-a, który odczytuje i odtwarza większość plików dzwiękowych i kon-
wertuje je do formatu WAV, Macintosh SND, AIFF oraz NeXT (lecz, co ciekawe, nie
do formatu AU systemu Unix Sun). Również bezpłatny program Ulaw (wymawiać
z  u ) potrafi konwertować dzwięk z formatu SND systemu Macintosh do formatu AU.
Ewentualne zródła dodatkowych informacji na temat tych programów wymieniono
w dodatku A.
Aby przekonwertować dowolny plik dzwiękowy do formatu RealAudio, musimy mieć
program RealAudio Encoder. Można go otrzymać bezpłatnie wraz z zestawem RealAu-
dio Server lub też można ściągnąć go za pośrednictwem sieci ze strony Real Audio
http://www.real.com/.
Dzwięk w sieci
Teraz, gdy zaprezentowaliśmy rozmaite opcje nagrywania i opracowywania plików au-
dio, pora na kilka ostrzeżeń odnośnie wykorzystania takich plików w sieci.
Rozdział 14. Dzwięk i obraz wideo 413
Wszystkie zagadnienia dotyczące prędkości przekazywania informacji oraz umieszcza-
nia obrazów na stronach WWW, można także odnieść do plików dzwiękowych, im
więcej umieścisz ich na stronie, tym dłużej użytkownik będzie musiał czekać na jej po-
branie i wyświetlenie. Poniżej podałam kilka pomocnych informacji, które mogą Ci się
przydać przy wykorzystywaniu plików dzwiękowych na stronach WWW:
większość komputerów podłączonych do sieci zdolnych jest do odtwarzania
dzwięku 16-bitowego, zaś przy odtwarzaniu takiego dzwięku na komputerze
o 8 bitowej karcie dzwiękowej mogą pojawić się dziwaczne efekty uboczne.
Aby zapewnić jak najlepszą jakość dzwięku jak najszerszej publiczności,
umieszczaj na Twoich stronach sieciowych wyłącznie pliki 8-bitowe lub równolegle
dwie wersje plików: 8-bitową i 16-bitową;
aby umieszczony na sieciowej stronie dzwięk był jak najlepszej jakości, nagrywaj
go zawsze z najwyższą częstotliwością i rozdzielczością próbkowania, jaką możesz
osiągnąć. Następnie użyj edytora dzwięku w celu przekonwertowania nagrania
do 8 bitów. Jest wiele programów do konwersji i obróbki dzwięku, których można
do tego użyć. Szczególnie powinieneś zainteresować się pakietem SOX dla Uniksa
i systemu DOS. Znajdziesz tam kilka filtrów, które mogą Ci pomóc poprawić jakość
8-bitowego dzwięku;
staraj się ograniczać wielkość plików, zapisując dzwięk z rozdzielczością 8-bitową,
obniżając częstotliwość próbkowania i rezygnując z dzwięku stereofonicznego
na rzecz monofonicznego;
na stronie sieciowej powinniśmy zawsze umieszczać informację na temat formatu
pliku audio: czy jest to WAVE, AIFF, czy też inny format. Nie zapomnij, że nie ma
jeszcze ustalonego standardu dla zapisu dzwięku w sieci. Czytelnicy Twojej strony
mogą się słusznie zirytować, jeśli poświęcą mnóstwo czasu na ściągnięcie pliku
dzwiękowego, a potem okaże się, że nie mogą go odtworzyć za pomocą
posiadanego oprogramowania. Miłym gestem w stronę czytelników jest też
zamieszczenie informacji o rozmiarach pliku; dzięki temu będą oni mogli
przewidzieć, jak długo potrwa oczekiwanie;
jeśli bardzo zależy Ci na jakości, w związku z czym musisz umieszczać na swojej
stronie duże pliki audio, zastanów się nad zlokalizowaniem na tej samej stronie
pomniejszonych wersji Twoich plików w formacie µ-law. BÄ™dzie to swego rodzaju
podgląd zawartości właściwego pliku na użytek tych odbiorców, którzy nie są
w stanie odtwarzać wyższej jakości dzwięku na swoim sprzęcie;
zajmujesz się tworzeniem dzwięku w formacie RealAudio? Większość tych porad
stosuje się także do Ciebie. Jeśli jednak chcesz się dowiedzieć, jakich wskazówek
może Ci udzielić firma RealAudio odnośnie uzyskania jak najwyższej jakości
dzwięku, odwiedz ich stronę
http://www.realaudio.com/help/content/ audiohints.html.
Cyfrowy obraz wideo
Digitalizacja obrazu wideo jest bardzo ciekawym kierunkiem rozwoju branży kompute-
rowej, interesującym zarówno producentów sprzętu komputerowego, jak i programi-
414 Część 5. Multimedia i aplety Javy
stów (zwłaszcza tych zajmujących się grami i programami multimedialnymi), a także
wszystkich tych, którzy po prostu lubią nowości. W sieci cyfrowy obraz wideo spoty-
kamy zwykle w postaci małych filmowych  klipów . Najczęściej znajdujemy je
w multimedialnych archiwach.
Nie jestem w stanie dokonać w tej książce pełnego przeglądu technologii, wykorzysty-
wanych do przetwarzania obrazu wideo. Po części dlatego, że są one dość skompliko-
wane, ale przede wszystkim dlatego, że postęp w tej dziedzinie jest nieomal równie
szybki, jak ten, któremu podlega sama sieć. Mogę jednak podać tu kilka wskazówek do-
tyczących tworzenia i umieszczania w sieci krótkich filmików.
Analogowy i cyfrowy obraz wideo
Analogowe wideo, podobnie jak analogowe audio, to płynny strumień informacji,
w tym przypadku dzwięków i obrazów. Aby pobrać je do komputera, potrzebujemy kar-
ty wideo. Dokonuje ona próbkowania dostarczonego materiału filmowego w regular-
nych okresach czasu, zupełnie tak samo, jak karta dzwiękowa czyni to z nagranym
dzwiękiem. Przy każdym pobraniu próbki pojedynczy obraz kodowany jest z określoną
rozdzielczością  tak powstaje ujęcie (frame). Gdy odtwarzamy potem cyfrowy film,
ujęcia wyświetlane są kolejno, dając złudzenie ruchu. Liczba ujęć wyświetlanych na se-
kundę (frames per second, czyli f/s) określa prędkość odtwarzania (frame rate). Jest to
pojęcie analogiczne do częstości próbkowania (sampling rate) przy digitalizacji dzwię-
ku. Im wyższa jest prędkość odtwarzania, innymi słowy, im więcej ujęć przypada na
sekundę filmu, tym wierniej odwzorowany zostaje analogowy oryginał.
Oprócz prędkości odtwarzania, duże znaczenie ma także wielkość ujęcia, czyli jego rze-
czywiste wymiary, wyrażone w pikselach (patrz rysunek 14.11).
Rysunek 14.11.
Prędkość odtwarzania
i wielkość ujęcia
Ujęcie to pojedynczy obraz z sekwencji, która razem składa się na cyfrowy film zapisany w
pliku wideo. Prędkość odtwarzania (frame rate) to liczba ujęć wyświetlanych w ciągu
sekundy, zaś wielkość ujęcia (frame size) to rozmiary pojedynczego ujęcia wyrażone w
Rozdział 14. Dzwięk i obraz wideo 415
pikselach.
Prędkość odtwarzania standardowego, pełnoekranowego pliku wideo, jaki możesz uzy-
skać na Twoim odtwarzaczu wideo, wynosi 30 ujęć na sekundę (f/s). Tę prędkość od-
twarzania określa się czasem jako  pełną  full-motion video. Pełna prędkość odtwa-
rzania, przy pełnoekranowym obrazie, to niedościgniony wzorzec dla informatyków
i wszelkich specjalistów od cyfrowego obrazu. Na ogół muszą się oni zadowalać o wiele
mniejszą prędkością odtwarzania i rozdzielczością, jeśli chcą zachować płynność akcji.
Dlaczego tak się dzieje? Dla analogowego obrazu wideo 30 ujęć na sekundę to żaden
problem. Po jednym ujęciu wyświetlane jest kolejne, gładko i sprawnie. Natomiast przy
obrazie cyfrowym każde kolejne ujęcie musi zostać odczytane z dysku, w razie potrze-
by zdekompresowane i możliwie jak najszybciej przerzucone na ekran. Aby proces ten
przebiegał poprawnie, potrzebujemy niebagatelnej mocy obliczeniowej, szybkiego
twardego dysku i jeszcze szybszej karty graficznej. Wymagania te są tym większe, im
większą zastosujemy rozdzielczość obrazu i prędkość odtwarzania.
Co się dzieje, gdy prędkość odtwarzania filmu zaczyna przekraczać możliwości naszego
komputera? W takiej sytuacji komputer zaczyna opuszczać niektóre ujęcia, po prostu
pomija je przy wyświetlaniu. W ciągu sekundy pokazywanych jest mniej obrazów, niż
zaplanowano. Efekt jest taki, jakby zmniejszono prędkość odtwarzania. Ruch traci
płynność, akcja rwie się i chwilami ustaje. To się naprawdę czasami zdarza.
Wkrótce odkryjesz, że znaczna część tej pracy polega na znajdowaniu kompromisów
pomiędzy wymaganiami co do jakości a możliwościami sprzętu, na jakim pracujesz.
Więcej na temat tych kompromisów powiem w dalszej części rozdziału.
Kompresja i dekompresja obrazu wideo (Codec)
Jak już wcześniej mówiłam, pliki z obrazami oraz pliki dzwiękowe zajmują bardzo wie-
le miejsca na dysku. Teraz wyobraz sobie połączenie obu tych rzeczy: setki, a nawet ty-
siące obrazów plus ścieżka dzwiękowa. To pozwoli Ci wyobrazić sobie, jakie rozmiary
może osiągnąć plik wideo. Im większy plik, tym trudniej będzie komputerowi poradzić
sobie z nim przy zachowaniu rozsądnego tempa obliczeń i tym bardziej prawdopodobne
się staje, że ucierpi płynność odtwarzania. Dlatego właśnie kwestia kompresji
i dekompresji nabiera szczególnego znaczenia przy plikach wideo. Wiele na tym polu
zostało już zrobione.
Algorytm stosowany do kompresji i dekompresji cyfrowego obrazu wideo określany
jest zwykle jednym terminem: codec (ang. COmpression/DECompresion). Inaczej niż
w przypadku algorytmów kompresji stosowanych dla pojedynczych obrazów, algoryt-
my kompresji wideo nie są ściśle powiązane z formatem pliku, w którym zapisujemy
obraz wideo. Na ogół, w ramach danego formatu, możemy stosować wiele różnych al-
gorytmów kompresji i dekompresji. Przy odtwarzaniu pliku, format sam rozpoznaje, jaki
rodzaj kompresji należy zastosować. Więcej informacji na temat algorytmów codec znaj-
dziesz w dalszej części tego rozdziału, w podrozdziale poświęconym kompresji filmów.
416 Część 5. Multimedia i aplety Javy
Formaty plików
Mamy cyfrowy obraz, zapisany w pliku i gotowy do odtworzenia. Taki cyfrowy  film
może być oparty na obrazie wideo zarejestrowanym kamerą albo może być komputero-
wo wygenerowanÄ… animacjÄ…. W obu przypadkach stajemy przed problemem wyboru
odpowiedniego formatu.
W obecnej chwili mamy pięć liczących się formatów w tej branży, a także w sieci. Są
to: QuickTime, Video for Windows (VfW), MPEG, RealVideo oraz Windows Media.
Format QuickTime
Jakkolwiek format QuickTime został utworzony przez firmę Apple na użytek kompute-
rów Macintosh, to ze wszystkich plików wideo spotykanych w sieci, te w formacie Qu-
ickTime najlepiej spełniają funkcję łącznika pomiędzy różnymi systemami i platforma-
mi sprzętowymi (drugie miejsce w tym rankingu zajmuje format MPEG). Oprogramo-
wanie firmy Apple obejmuje format QuickTime oraz prosty odtwarzacz, zwany Movie-
Player lub SimplePlayer. Pliki QuickTime mogą być odtwarzane za pośrednictwem pa-
kietu QuickTime for Windows (QTfW) lub bezpłatnego programu Xanim, który pozwa-
la odtwarzać je w systemie Unix oraz X Window. Pliki w formacie QuickTime mają
rozszerzenie .qt lub .mov.
Format QuickTime pozwala wykorzystywać wiele różnych algorytmów kompresji,
a w szczególności CinePak, Indeo oraz Sorenson. Wszystkie te algorytmy mają uniwer-
salny charakter i można je wykorzystywać w różnych systemach. Przeczytaj też pod-
rozdział   Algorytmy kompresji w dalszej części tego rozdziału.
Jeśli tworzysz pliki wideo na komputerze Macintosh i zapisujesz je w formacie QuickTime,
musisz zawsze sprawdzić, czy wszystkie warstwy obrazu zostały połączone w jedną
( spłaszczone ). Inaczej plik nie będzie mógł zostać odczytany w innym systemie. Przejrzyj
też podrozdział   Otrzymywanie i konwersja obrazu wideo w dalszej części tego
rozdziału.
Format Video for Windows (AVI)
Format Video for Windows (VfW) został opracowany przez Microsoft i stanowi stan-
dard w edycji wideo na PC. Pliki VfW zwane są też często plikami AVI, z powodu
swego rozszerzenia: .avi (ang. Audio/Video Interleave). Format VfW stał się bardzo po-
pularny wśród użytkowników PC, istnieje też mnóstwo animacji zapisanych w tym wła-
śnie formacie. Jednak poza granicami świata PC trudno znalezć odtwarzacz, który by
ten format przyjmował. Dlatego właśnie pliki VfW są mniej odpowiednie do sieci niż pli-
ki QuickTime.
Rozdział 14. Dzwięk i obraz wideo 417
Format MPEG Video
MPEG jest zarówno formatem pliku, jak i algorytmem kompresji. Format MPEG wy-
stępuje w trzech odmianach. Mamy MPEG wideo, który pozwala zapisywać tylko obra-
zy, MPEG audio, omówiony we wcześniejszej części tego rozdziału oraz system
MPEG, który pozwala łączyć obraz ze ścieżką dzwiękową.
Pliki MPEG zapewniają doskonałą jakość obrazu, lecz proces ich dekompresji jest dość
powolny. Z tego powodu wiele dekoderów plików MPEG jest wspomaganych sprzęto-
wo. Kiedyś oznaczało to, że była Ci potrzebna dodatkowa karta, aby odtwarzać pliki
MPEG prawidłowo, bez opuszczania wielu ujęć. Aktualnie moc obliczeniowa proceso-
rów, w jakie są wyposażane nowe komputery PC, umożliwia dekodowanie obrazu zapi-
sanego w formacie MPEG bez konieczności zastosowania specjalnych urządzeń sprzę-
towych. W rzeczywistości, filmy DVD są kodowane przy wykorzystaniu formatu
MPEG i można je odtwarzać na komputerach osobistych bez żadnych dodatkowych
urządzeń sprzętowych.
Następna wada tego formatu, jeśli chodzi o jego praktyczne wykorzystanie w sieci, to
duże koszty kodowania obrazu w pliku MPEG. Potrzebny jest sprzętowy kompresor.
Ceny urządzeń tego rodzaju wyrażane są w tysiącach dolarów. W miarę, jak format
MPEG zyskuje na popularności, ceny te będą prawdopodobnie spadać. Na razie jednak
lepszym pomysłem wydaje się wybranie takiego formatu dla plików wideo, który nie
wymaga sprzętowych inwestycji. Chyba, że masz dostęp do potrzebnego sprzętu lub też
gotów jesteś do wszelkich poświęceń, jeśli chodzi o Twoją pracę.
Zamiast samemu kupować urządzenie kodujące, możesz zlecić wykonanie kodowania
agencji, zajmującej się produkcją wideo. Niektóre z tych firm wyposażone są w odpowiednie
kompresory i mogą zapisać Twoją pracę w formacie MPEG, zazwyczaj licząc sobie
określoną stawkę od minuty filmu. Ceny takich usług stale spadają, podobnie jak spada cena
potrzebnego do tego sprzętu. Korzystanie z usług agencji może okazać się dla Ciebie
optymalnym rozwiązaniem, jeśli z jakichś przyczyn bardzo zależy Ci na formacie MPEG.
RealVideo
RealVideo stara się wywrzeć taki sam wpływ na rynek internetowego obrazu, jaki na
rynek internetowego audio wywarło RealAudio. Firma RealNetworks zintegrowała
klienta RealVideo z programem RealPlayer, dzięki czemu jego użytkownicy mogą
oglądać strumieniowany obraz przekazywany Internetem, podobnie jak wcześniej mogli
słuchać strumieniowanego dzwięku. RealVideo wykorzystuje niezwykle efektywną me-
todą kompresji oraz niewielkie ramki, dzięki czemu strumieniowany obraz mogą oglą-
dać nawet osoby korzystające z łączy o niewielkiej przepustowości. Niestety, transmisja
obrazu wymaga łączy o większej przepustowości niż transmisja dzwięku, co sprawia, że
oglądanie obrazu przy wykorzystaniu zwykłego połączenia modemowego jest prak-
tycznie niemożliwe. Niemniej jednak, przypuszcza się, że transmisja obrazu Internetem
stanie się bardziej użyteczna i popularna, gdy tylko połączenia o większej przepustowo-
ści zaczną być częściej stosowane w domach. Więcej informacji na temat RealVideo
można znalezć na witrynie firmy RealNetworks pod adresem
http://www.real.com.
418 Część 5. Multimedia i aplety Javy
Windows Media
Opracowany przez firmÄ™ Microsoft format Windows Media Advanced Streaming For-
mat umożliwia obsługę zarówno plików audio, jak i audio-wideo. W efekcie, program
Media Player pozwala użytkownikom nie tylko słuchać strumieniowanego dzwięku
przekazywanego przez Internet, lecz także oglądać strumieniowany obraz. Format ASF
boryka się z tymi samymi problemami, co RealVideo, większość użytkowników nie dys-
ponuje łączem o wystarczającej przepustowości, aby korzystać z obrazu przekazywanego
Internetem. Format przekazywania obrazu opracowany przez firmę Microsoft daje więk-
sze możliwości wykorzystania połączeń o dużej przepustowości niż format RealVideo;
niemniej jednak dla przeważającej większości odbiorców różnica ta nie ma większego
znaczenia. Więcej informacji na ten temat możesz znalezć na WWW pod adresem:
http://www.microsoft.com/windows/windowsmedia/pl/default.asp.
Kompresja obrazu wideo
Tak jak i w przypadku pojedynczych obrazów oraz dzwięku, dla cyfrowego obrazu wideo
kompresja jest bardzo ważna. Nawet szczególnie ważna, gdyż odtworzenie choćby krót-
kiego filmu wymaga przechowania i odczytania olbrzymiej ilości danych. Na szczęście
dla cyfrowego obrazu wideo opracowano tyle metod kompresji, że jest z czego wybierać.
Jak już wcześniej mówiliśmy, algorytmy kompresji obrazu wideo określamy jako sys-
temy kodowania  codecs. Termin codec oznacza jednocześnie algorytm kompresji
oraz dekompresji obrazu. Kompresja następuje w chwili tworzenia lub zapisywania pli-
ku. Dekompresja następuje na bieżąco w trakcie odtwarzania. System kodowania nie
jest integralną częścią pliku z cyfrowym obrazem wideo: zapisując film do pliku w da-
nym formacie, zazwyczaj możemy wybrać jeden spośród kilku dostępnych algorytmów
kompresji. (Przy odtwarzaniu pliku odpowiedni algorytm dekompresji zostanie wybra-
ny i zastosowany automatycznie.)
W tym podrozdziale omówimy ogólnie metody kompresji obrazu wideo, zaś w następ-
nym opowiemy bardziej szczegółowo o kilku wybranych algorytmach, których mógłbyś
użyć dla Twoich plików.
Kodowanie symetryczne i asymetryczne
Systemy kodowania często określa się jako symetryczne lub asymetryczne (patrz rysu-
nek 14.12). Terminy te odnoszą się do zagadnienia zachowania równowagi pomiędzy
szybkością kompresji a szybkością dekompresji. Przy kodowaniu symetrycznym, kom-
presja filmowego obrazu zajmuje tyle samo czasu, co jego pózniejsza dekompresja.
Wpływa to pozytywnie na sprawność tworzenia takich plików wideo, ale niekoniecznie
na ich odtwarzanie. Przy kodowaniu asymetrycznym proces kompresowania obrazu wi-
deo trwa długo, za to czas jego dekompresji przy odtwarzaniu jest krótki. Należy pamię-
tać, że im krótszy jest czas dekompresji, tym większą prędkość odtwarzania pliku mo-
żemy osiągnąć.
Rozdział 14. Dzwięk i obraz wideo 419
Rysunek 14.12.
Kodowanie symetryczne
a kodowanie
niesymetryczne
Z tego względu asymetryczne systemy kodowania są korzystniejsze. Większość syste-
mów kodowania wykazuje przynajmniej niewielką asymetrię, czas kompresji z reguły
bywa dłuższy. Dla niektórych, czas ten jest o wiele, wiele dłuższy.
Porównywanie ujęć
Jak jest kompresowany obraz wideo? Są dwie możliwości. Po pierwsze, każde kolejne
ujęcie może być kompresowane jak zwykły, pojedynczy obraz, a następnie dekompre-
sowane przy odtwarzaniu. Druga metoda polega na tzw. porównywaniu ujęć (frame
differencing). Frame differencing to nie system kodowania, to po prostu pewna technika
pracy, z której mogą korzystać różne systemy kodowania.
Przy odtwarzaniu pliku wideo najwięcej czasu zajmuje dekompresja i wyświetlanie ko-
lejnych ujęć. Trzeba to robić szybko, by zachować założoną prędkość odtwarzania fil-
mu bez konieczności opuszczania niektórych ujęć. Gdy komputer przestaje nadążać
z dekompresją i wyświetlaniem, niektóre ujęcia muszą być pomijane, co burzy wrażenie
płynności ruchu. Porównywanie ujęć (frame differencing) to sposób na przyspieszenie
dekompresji i wyświetlania. Ujęcie z pliku, dla którego użyto tej metody, zawiera
o wiele mniej informacji niż ujęcie ze zwykłego pliku wideo. Nie znajdziemy w nim
bowiem całego obrazu, a jedynie te jego części, które uległy zmianie względem ujęcia po-
przedniego. Ta zmieniona część obrazu jest zwykle o wiele mniejsza od jego całej po-
wierzchni; dzięki temu komputer ma mniej pracy i łatwiej jest mu nadążyć z wyświetla-
niem. Z tego samego powodu mniejsze stają się rozmiary całego pliku z obrazem wideo.
Rysunek 14.13 przedstawia prosty przykład zastosowania metody frame differencing.
Porównywanie ujęć (ang. Frame differencing) to technika kompresji, która opiera się
na zapisywaniu w kolejnych ujęciach tylko tych fragmentów obrazu, które zmieniły się
względem poprzedniego ujęcia.
Porównywanie ujęć sprawdza się najlepiej w statycznych scenach typu  gadające gło-
wy , gdzie tło pozostaje nieruchome, jedynie stosunkowo niewielkie obiekty na pierw-
szym planie wykonują jakieś ruchy. Dla tych filmów, w których cały obraz zmienia się
szybko z ujęcia na ujęcie, metoda frame differencing nie będzie się dobrze sprawdzać.
420 Część 5. Multimedia i aplety Javy
Rysunek 14.13.
Porównywanie ujęć
Ujęcia kluczowe
Porównywanie ujęć bazuje na ujęciach kluczowych (ang. key frames) zapisywanych w pliku
filmu. Ujęcia kluczowe są zapisywane w całości i umieszczane w odpowiednich odstępach.
Na ich podstawie obliczane są różnice pomiędzy kolejnymi ujęciami filmu.
W tym przypadku porównywanie ujęć zasadza się na istnieniu tzw. ujęć kluczowych
(key frames). Są one zapisywane w całości, służą za wzorce, na podstawie których okre-
śla się różnice, jakie trzeba zapisać dla ujęć pośrednich. Przy wyświetleniu każdego ko-
lejnego ujęcia obliczane na nowo są tylko partie powierzchni, różniące się od ujęcia po-
przedniego, które znów obliczane jest na podstawie ujęcia jeszcze wcześniejszego i tak
dalej, aż dojdziemy do ujęcia kluczowego. Rysunek 14.14 obrazuje proces porównywa-
nia ujęć przy zastosowaniu metody ujęć kluczowych.
Rysunek 14.14.
Porównywanie ujęć
i ujęcia kluczowe
Oczywiście, im dalej od ujęcia kluczowego się znajdziemy, tym więcej będzie zmienio-
nych miejsc i tym więcej informacji do przeliczenia. W związku z tym rośnie prawdo-
podobieństwo powstania opóznień i zmniejszenia prędkości odtwarzania. Dlatego roz-
Rozdział 14. Dzwięk i obraz wideo 421
stawienie ujęć kluczowych w dostatecznie krótkich odstępach czasu ma zasadnicze
znaczenie dla osiągnięcia optymalnej kompresji i gładkości odtwarzania. Z drugiej strony,
ujęcia kluczowe zapisywane są w całości, zawierają o wiele więcej informacji niż zwy-
kłe ujęcia pośrednie, które zawierają tylko ewentualne różnice. Dlatego też nie chcemy
mieć ich w pliku zbyt wielu; ich odczytanie i wyświetlenie zajmuje komputerowi sporo
czasu. Gęstość rozmieszczenia ujęć kluczowych możemy regulować, korzystając z ja-
kiegoś programu do edycji obrazu wideo. Ogólnie przyjętą zasadą jest umieszczanie
jednego ujęcia kluczowego na sekundę wyświetlonego filmu. Przy prędkości odtwarza-
nia 15 f/s oznacza to, że co piętnaste ujęcie w pliku powinno być ujęciem kluczowym.
Wspomaganie sprzętowe
Jak już wspominałam, ogromne ilości informacji, jakie trzeba przetworzyć przy reje-
stracji, kompresji oraz odtwarzaniu filmów sprawiają, iż jedynie bardzo szybkie i po-
tężne komputery mogą obsługiwać filmy, w których klatki mają duże wymiary i są od-
twarzane z dużą prędkością. Choć istnieją popularne programowe systemy kodowania,
których można używać do obsługi wideo o niewielkich wymiarach i szybkości odtwa-
rzania klatek, to jednak, gdy zajmiesz siÄ™ filmami bardziej zaawansowanymi technolo-
gicznie, zazwyczaj będziesz wolał zainwestować w sprzętowy system kodowania.
Sprzętowe urządzenia wspomagające to zazwyczaj karty wideo, montowane w kompu-
terze. Karty te są wyposażone w specjalne układy służące od obróbki cyfrowych plików
wideo, zazwyczaj zakodowanych w systemach MEPG lub JPEG (opiszÄ™ je w dalszej
części rozdziału). Jest wysoce prawdopodobne, że w przyszłości takie układy przetwa-
rzające obraz mogą stać się standardowym wyposażeniem wielu komputerów. Jak na
razie jednak, komputery podłączone do Internetu rzadko kiedy dysponują wspomaga-
niem sprzętowym i nie powinieneś zakładać możliwości wykorzystania tych rozwiązań
przy tworzeniu obrazów wideo.
Systemy kodowania
Istnieje kilka doskonałych systemów kodowania przeznaczonych do programowej, jak
i wspomaganej sprzętowo, rejestracji obrazu i jego odtwarzania. Dwa najpopularniejsze,
CinePak oraz Indeo, mają charakter międzyplatformowy (Mac, Windows oraz Unix).
Także algorytm JPEG jest bardzo rozpowszechniony przy kompresji obrazów wideo,
zwłaszcza często wykorzystuje się go przy pobieraniu obrazu z taśmy wideo.
Algorytm CinePak
System kodowania CinePak, poprzednio noszÄ…cy nazwÄ™ Compact Video, to najpopular-
niejszy algorytm kompresji dla formatu QuickTime. Może też być wykorzystywany
w plikach zapisanych w formacie VfW. CinePak to algorytm kompresji stratnej. Jeśli
więc zdecydujesz się z niego korzystać, staraj się zawsze, by Twój wyjściowy materiał
filmowy był jak najlepszej jakości.
422 Część 5. Multimedia i aplety Javy
Algorytm CinePak korzysta z metody porównywania ujęć (frame differencing) i jest
wysoce asymetryczny, tak że czas kompresji obrazu jest bardzo wysoki (widziałem kie-
dyś 15-sekundowy film, którego kompresja zajęła całą godzinę). Z drugiej strony, gdy
już kompresja zostanie dokonana, odtwarzanie pliku przebiega gładko, a jego rozmiary
są zdumiewająco małe.
Algorytm Indeo
System kodowania Indeo Video jest nieco mniej rozpowszechniony niż CinePak, ale
szybko go dogania. Indeo został opracowany przez firmę Intel na potrzeby karty Intel
Smart Video Recorder, doskonałego urządzenia do ściągania obrazu wideo z taśmy. Al-
gorytm Indeo może stosować kompresję stratną lub bezstratną, wykorzystuje metodę
porównywania ujęć (frame differencing) i jest znacznie mniej asymetryczny niż Cine-
Pak. Dekompresja obrazu przy odtwarzaniu pliku zajmuje jednak więcej czasu, niż wte-
dy, gdy zapiszemy ten sam film w systemie kodowania CinePak. Dlatego też na słab-
szych komputerach, które nie dysponują odpowiednią mocą obliczeniową, może łatwiej
dojść do opuszczania niektórych ujęć.
Indeo pierwotnie mógł być używany wyłącznie dla plików w formacie VfW, lecz obec-
nie jego zakres zastosowań poszerzył się. Format QuickTime 2.0 również może z niego
korzystać. Wpływa to na rosnącą popularność tego algorytmu.
Algorytm JPEG
Kompresja JPEG? Czy to nie jest standardowy algorytm kompresji map bitowych?
Owszem, dokładnie ten sam algorytm kompresji może zostać użyty przy kodowaniu ob-
razu wideo (wtedy zwany jest czasem algorytmem motion JPEG). Nie zapominajmy, że
film jest sekwencją ujęć, a każde ujęcie to po prostu pojedynczy obraz, zazwyczaj foto-
grafia cyfrowa. Każdy z tych obrazów może zostać z powodzeniem skompresowany za
pomocą zwykłego algorytmu JPEG.
Korzystanie z algorytmu JPEG, jako systemu kodowania obrazu wideo, ma dwie poważne
wady: nie jest przeprowadzane porównywanie ujęć (frame differencing), a dekompresja
obrazu przy wyświetlaniu jest powolna. Ponieważ algorytm JPEG zaprojektowano dla po-
jedynczych obrazów, kompresja poszczególnych ujęć filmu przebiega, tak jakby to były
oddzielne mapy bitowe. Każde ujęcie kompresowane jest osobno, bez porównywania
z innymi. Przy odtwarzaniu takiego pliku każde z ujęć jest osobno dekompresowane i wy-
świetlane, jedno po drugim. Istnieje spore prawdopodobieństwo, że komputer nie nadąży
i dojdzie do opuszczenia niektórych ujęć, na czym ucierpi ogólna jakość odtwarzanego
filmu. Dzięki zastosowaniu sprzętowego wspomagania można tego uniknąć. Wspomaga-
ny w ten sposób algorytm JPEG może okazać się zadziwiająco sprawny i szybki, szybszy
nawet niż te systemy kodowania, które stosują porównywanie ujęć, ale za to są całkowicie
programowe. JPEG gwarantuje przy tym doskonałą jakość obrazu i jest prawdopodobnie
najłatwiej dostępnym algorytmem kompresji obrazu. Przy tych wszystkich zaletach, JPEG
nie najlepiej nadaje się do kompresowania plików, które chcemy umieścić w sieci. Po-
dobnie rzecz się ma ze wszystkimi innymi formatami wspomaganymi sprzętowo, nie
można zakładać, że nasi odbiorcy będą odpowiednio wyposażeni.
Rozdział 14. Dzwięk i obraz wideo 423
Z innej strony, algorytm JPEG może być bardzo przydatny przy pobieraniu obrazów
z taśmy wideo. Korzysta z niego wiele urządzeń z tej grupy. Jeśli ostatecznie planujesz
użyć systemu kodowania CinePak przy Twojej pracy, to dobrym posunięciem będzie
rozpocząć od ściągnięcia obrazu kodowanego właśnie w systemie JPEG (o ile tylko po-
brane nagranie zmieści się na Twoim twardym dysku, zanim uda Ci się je ostatecznie
skompresować).
Algorytm MPEG
Wspominamy tu o formacie MPEG, gdyż jest to zarówno format pliku, jak i system ko-
dowania. Jak już mówiliśmy wcześniej, w poświęconym mu podrozdziale, MPEG za-
pewnia doskonałą jakość obrazu, lecz jego dekompresja wymaga sprzętowego wspo-
magania. Również sprzęt pozwalający zapisywać pliki w tym formacie jest raczej
kosztowny, a więc praca nad obrazem wideo zakodowanym w systemie MPEG to po-
ważne przedsięwzięcie. Tworząc pliki do umieszczenia w sieci, powinieneś raczej
trzymać się formatów całkowicie programowych, jak CinePak lub Indeo.
Zasady działania algorytmu kompresji MPEG są bardzo złożone i zdecydowanie wykraczają
poza tematykę poruszaną w tej książce. Jeśli interesuje Cię ten temat, zajrzyj do pliku MPEG
FAQ (adres sieciowy znajdziesz wśród innych zródeł i odnośników na końcu tego rozdziału).
Digitalizacja obrazu wideo
Czy już chcesz wyprodukować własny film do sieci? Proces ściągania obrazu, podobnie
jak proces nagrywania dzwięku, jest całkiem prosty, o ile mamy już potrzebne wyposa-
żenie. Instalujemy kartę, podłączamy do niej nasz odtwarzacz (VCR) lub kamerę, a po-
tem wystarczy wszystko włączyć  i już!
Szczegóły techniczne mogą się oczywiście różnić, zależnie od platformy sprzętowej,
z jakiej korzystamy. Ostatnio zresztą jesteśmy świadkami istnej eksplozji nowych pro-
duktów w tej branży. W tej książce spróbujemy dokonać ogólnego przeglądu technik
digitalizacji obrazu wideo. Bardziej szczegółowe informacje możesz otrzymać od lokal-
nego dystrybutora sprzętu komputerowego albo też znalezć je w prasie komputerowej.
Analogowy sygnał wideo
Nie trzeba szczególnie dobrze znać się na analogowym wideo, by zapisać fragment fil-
mu w postaci cyfrowej, chyba że nasze zainteresowania sięgają o wiele głębiej. O ana-
logowym obrazie wideo należy jednak wiedzieć dwie rzeczy: jaki mamy do dyspozycji
sygnał wideo oraz jak jest on kodowany.
Sposób podłączenia do komputera naszego sprzętu wideo zależy od rodzaju sygnału
wideo, z jakiego ten sprzęt korzysta. Może to być sygnał composite lub też sygnał typu
S-video. Sygnał composite to typowy sygnał wideo, jaki wykorzystuje Twój telewizor,
odtwarzacz (VCR) i kamera wideo (camcorder). Jeśli korzystasz z takich urządzeń, to
424 Część 5. Multimedia i aplety Javy
najprawdopodobniej masz do czynienia właśnie z sygnałem typu composite. Natomiast
sygnał S-video, przekazywany za pomocą innego typu kabla, jest sygnałem bardziej
ekskluzywnym, gdzie informacja o kolorze i o jasności została rozdzielona dla osią-
gnięcia lepszej jakości obrazu. Aby jednak pracować z sygnałem S-video, musisz po-
siadać specjalny sprzęt.
Po podłączeniu wszystkiego, pora zastanowić się nad tym, w jakim formacie kodowany
jest obraz, który będzie przesyłany do komputera. W użyciu są trzy formaty: NTSC (Na-
tional Television Standards Committe), używany w większej części Ameryki Północnej
oraz w Japonii; PAL (Phase Alteration Line), używany w zachodniej Europie, Wielkiej
Brytanii oraz na Åšrodkowym Wschodzie i na koniec SECAM (Systeme Electronic Pour
ColeurAvec Memoire), wykorzystywany we Francji i Rosji.
Większość kart do pobierania obrazu wideo przyjmuje sygnał kodowany w formacie
NTSC oraz PAL. Zazwyczaj nie musimy się o to martwić. Jeśli nie wiesz, w jakim for-
macie pracuje Twój sprzęt, a mieszkasz w USA, to najprawdopodobniej będzie to
NTSC. Jeżeli mieszkasz gdzie indziej, lepiej sprawdz, jaki format kodowania sygnału
wideo masz do dyspozycji i czy Twoja karta sobie z nim poradzi.
Obraz wideo na PC
Rynek niedrogich kart do pobierania obrazu wideo na PC rozwinÄ…Å‚ siÄ™ ostatnio lawino-
wo. Jeśli więc interesujesz się cyfrowym obrazem wideo na PC, doradzam wizytę
w sklepie ze sprzętem komputerowym. Tam dowiesz się, co jest aktualnie dostępne i co
jest zalecane.
Na poziomie podstawowym, nieocenionym narzędziem do tworzenia prostych nagrań
wideo na platformie PC (a także Mac) jest QuickCam firmy Connectix. Początkowo do-
stępna była tylko jednak, czarno-biała kamera QuickCam, która kosztowała 100 USD.
Teraz dostępna jest cała seria tych kamer, rejestrują one obraz w kolorze, a najtańsza
z nich kosztuje 50 USD. Najlepsza kamera QuickCam kosztuje 150 USD i jest w stanie
rejestrować obraz z rozdzielczością 640x480 pikseli. Więcej informacji o tych produk-
tach możesz znalezć na WWW pod adresem
http://www.quickcam.com.
Firma Microsoft stworzyła grupę narzędzi służących do tworzenia i edycji plików audio
i wideo oraz do konwersji różnych plików multimedialnych do formatu ASF wykorzy-
stywanych przez platformę Windows Media. Narzędzia te można znalezć pod adresem:
http://www.microsoft.com/windows/windowsmedia/download/default.asp
Windows Media Encoder jest używany do tworzenia plików audio oraz wideo zapisa-
nych w formacie ASF. W pakiecie dostępnych jest także kilka innych narzędzi służą-
cych do indeksowania plików audio oraz wideo, integracji tych plików z prezentacjami
tworzonymi w programie Microsoft PowerPoint oraz konwertowania plików multime-
dialnych zapisanych w różnych formatach, do formatu ASF.
Rozdział 14. Dzwięk i obraz wideo 425
Rysunek 14.15.
Program VidEdit
Także firma Intel dysponuje produktem służącym do rejestracji obrazu wideo. Nosi on
nazwę Intel PC Camera, a w jego skład wchodzi kamera wideo podłączana do kompute-
ra oraz oprogramowanie do rejestracji obrazu i zapisywania go na dysku. Kamera zosta-
ła także wyposażona w specjalne gniazdko umożliwiające rejestrowanie obrazu z tele-
wizora lub kamery wideo. Oprogramowanie dostarczane wraz z kamerą umożliwia
tworzenie plików AVI oraz plików w formacie Intel IVS. Więcej informacji na temat
tego produktu można znalezć na WWW pod adresem:
http://www.intel.com/pccamera/
Na rynku dostępny jest także pakiet Adobe Premiere; jest to drogi pakiet służący do re-
jestracji i edycji obrazu wideo, działający w systemach Windows oraz Mac OS. Jest on
bardzo popularny wśród osób profesjonalnie zajmujących się obróbką obrazów wideo,
korzystających z komputerów Macintosh i warto się nim zainteresować, jeśli planujesz
poważniej zająć się obróbką obrazu. Program umożliwia rejestrację obrazu i dzwięku,
rejestrację obu tych mediów z różnych zródeł, daje duże możliwości edycji zarówno ob-
razu, jak i dzwięku i umożliwia zapis plików z różnymi ujęciami kluczowymi i przy
wykorzystaniu różnych systemów kodowania. Więcej informacji na temat tego produk-
tu możesz znalezć na WWW pod adresem:
http://www.adobe.com/products/premiere
Rysunek 14.16.
Program
Adobe Premiere
426 Część 5. Multimedia i aplety Javy
Obraz wideo na Mac-ach
Wiele nowych komputerów Macintosh jest wyposażonych w porty Firewire, do których
można podłączać kamery wideo dysponujące interfejsem Firewire. Można także kupić
systemy rejestracji obrazu umożliwiające współpracę z komputerami Macintosh, któ-
rych koszt waha się od kilkuset do kilku tysięcy dolarów.
Dostępne są kamery QuickCam firmy Connctix, w wersjach przeznaczonych do współ-
pracy z komputerami Macintosh. Są to doskonałe, tanie kamery przeznaczone do zasto-
sowań amatorskich.
Do poważnych zastosowań na komputerach Macintosh wykorzystywany jest zazwyczaj
program Adobe Premiere. Używa go większość profesjonalistów. Dostępne są także in-
ne programy, takie jak: VideoShop firmy Avid, który jest tańszy i reklamowany jako ła-
twiejszy w obsłudze od Adobe Premiere oraz program VideoFusion firmy Radius, który
jest rozprowadzany wraz z systemem Video Vision.
W końcu, iMac DV zawiera program o nazwie iMovie, który umożliwia edycje klipów
wideo i zapisywanie ich w kamerach wyposażonych w interfejs Firewire oraz eksport
filmów zapisanych w formacie QuickTime.
Obraz wideo w systemach uniksowych
Zależnie od tego, na jakiej stacji Unix pracujesz, możesz mieć wbudowaną kartę wideo
lub możesz być zmuszony zakupić taki sprzęt oddzielnie. Drogie, nowoczesne stacje
SGI oraz Sun mają gniazdka typu video input, wyposażone są też w oprogramowanie do
ściągania obrazu wideo a niekiedy nawet w małe, kolorowe kamery. I tym razem po
szczegółowe informacje powinieneś zwrócić się do dystrybutora.
Uzyskiwanie i konwersja plików wideo
Zupełnie tak samo, jak w przypadku map bitowych oraz dzwięku, wideoklipy możemy
zrobić sami, ściągnąć je z sieci lub zakupić. Czasem może okazać się, że uzyskany plik
wideo wymaga przerobienia, zmiany formatu lub systemu kodowania. Tego rodzaju
operacje zazwyczaj najlepiej jest wykonywać za pomocą tego samego programu, które-
go użyliśmy do ściągnięcia oryginalnego obrazu z taśmy. Jeśli nie mamy takiego pro-
gramu lub jeśli nasz plik wideo pochodzi z innego zródła, będzie nam potrzebne jakieś
proste narzędzie do konwersji.
Do konwersji plików AVI do formatu MPEG można wykorzystać komercyjny program
XingCD; istnieją także narzędzia do konwersji plików AVI do Quick-Time. Jednym
z nich jest SmartCap firmy Intel, który potrafi zmieniać pliki AVI na QuickTime i na
odwrót, pod warunkiem, że użyjemy systemu kodowania Indeo. Aby wykorzystać pliki
AVI, potrzebny będzie pakiet programów Video for Windows, autorstwa Microsoft-u.
Natomiast do odtworzenia pliku w formacie QuickTime niezbędny jest pakiet Quick-
Time for Windows firmy Apple. Oba te pakiety musimy mieć, aby konwertować pliki
z jednego z tych formatów do drugiego.
Rozdział 14. Dzwięk i obraz wideo 427
Pracując na Macintoshu, do konwersji plików możemy wykorzystać bezpłatny (freeware)
program Sparkle. Sparkle potrafi odczytywać i odtwarzać pliki MPEG oraz QuickTi-
me a, także dokonywać konwersji pomiędzy tymi formatami. Dodatkowo można użyć
programu AVI->Quick, który zamienia pliki AVI (Video for Windows) na pliki w for-
macie QuickTime.
Jeśli do zapisywania Twoich plików używasz formatu QuickTime, ale chciałbyś, by
pliki te można było odtwarzać także na innych platformach sprzętowych, nie tylko na
komputerach Macintosh, powinieneś  spłaszczyć ten plik. Spłaszczenie pliku Quick-
Time oznacza przesunięcie wszystkich danych na jeden poziom, tak by informacja mo-
gła być odczytana również na innych platformach sprzętowych.
Przy pracy w systemie Macintosh, do spłaszczania plików wideo w formacie QuickTi-
me może posłużyć mały, bezpłatny programik o nazwie FastPlayer. W systemie Win-
dows to samo zadanie może spełnić program Qflat. Adresy FTP dotyczące tych pro-
gramów i inne informacje znajdziesz w dodatku A.
Jeśli chcesz rejestrować obraz wideo i zapisywać go w formacie RealVideo lub konwer-
tować do tego formatu obrazy wideo zapisane w innych formatach, możesz wykorzy-
stać do tego celu program Real Producer firmy Real Networks. Został on stworzony
specjalnie w celu edycji plików audio i wideo przeznaczonych do transmisji przy wyko-
rzystaniu serwerów medialnych firmy i odtwarzania przy użyciu RealPlayera. Więcej
informacji na ten temat możesz znalezć na WWW pod adresem:
http://www.real.com/products/tools/index.html
Pliki wideo w sieci
Korzystając ze zwyczajnego biurkowego komputera i przeciętnego sprzętu wideo, jaki
zwykle wala się po domu, nie zdołamy wyprodukować rzeczywiście dobrego wideokli-
pu o dużej rozdzielczości obrazu i dużej prędkości odtwarzania. Jest to ambitny cel nawet
dla profesjonalistów, którzy na specjalistyczny sprzęt wydali po kilka tysięcy dolarów.
Wszystkim, co możemy osiągnąć za pomocą naszego zwykłego domowego wyposaże-
nia, jest krótki filmik (mniej niż minutę) wyświetlany w niewielkim oknie, przy prędko-
ści odtwarzania tak dobranej, by uniknąć poważniejszych zakłóceń prędkości ruchu.
Nawet wtedy rozmiary pliku, jaki uzyskamy, będą spore. Jak już wielokrotnie podkre-
ślałam, umieszczanie w sieci plików o dużych rozmiarach nie jest dobrym pomysłem,
ze względu na ich długi czas transmisji przez sieciowe złącze.
Musimy więc pójść na kompromis. Ostateczny rozmiar pliku wideo zależy od kilku
czynników:
rozmiar obrazu (rozdzielczość). Im mniejsza powierzchnia obrazu, tym mniej mamy
do zapisania na dysku informacji. Ukierunkuj siÄ™ na rozdzielczość 240×180,
160×120 a nawet jeszcze mniejszÄ…;
428 Część 5. Multimedia i aplety Javy
prędkość odtwarzania. Im mniej ujęć na sekundę, tym mniejszy plik; niestety,
tym gorzej z gładkością ruchu i płynnością akcji. Zachowanie dostatecznej
prędkości odtwarzania to jeden z najważniejszych czynników, decyduje o dobrym
wrażeniu widza. Jeżeli więc pozostaje Ci jakieś pole do manewru, spróbuj najpierw
oszczędzić na czym innym niż prędkość odtwarzania. 15 ujęć na sekundę uchodzi
za bardzo dobrą prędkość odtwarzania dla cyfrowego wideo, być może uda
Ci się zejść do 10 bez drastycznego pogorszenia sytuacji;
głębia koloru. Podobnie jak w przypadku pojedynczych obrazów, ograniczenie
liczby barw występujących w obrazie ma zbawienny wpływ na wielkość pliku;
ścieżka dzwiękowa. Stosuje się tu wszystko, o czym mówiliśmy wcześniej.
(Możesz też w ogóle zrezygnować ze ścieżki dzwiękowej, oczywiście o ile się da.);
algorytm kompresji. Pewne systemy kodowania sprawdzają się lepiej niż inne
dla określonego rodzaju obrazu wideo. Przykładowo, te które stosują metodę
porównywania ujęć (frame differencing) są lepsze dla filmów, w których sporą część
kadru zajmuje nieruchome tło. Większość programów pozwala poeksperymentować
z różnymi systemami kodowania i różną gęstością rozmieszczenia ujęć kluczowych.
Wypróbuj kilka wersji, aby wybrać najmniejszy plik.
Nie tylko rozmiar pliku się liczy. Jakość obrazu i prędkość odtwarzania także mają duże
znaczenie i musimy je brać pod uwagę, podejmując ostateczne decyzje. Możemy, na
przykład, poświęcić wysoką jakość obrazu na rzecz gładkiego, płynnego odtwarzania
lub ograniczyć ilość barw, ale za to wprowadzić ścieżkę dzwiękową.
Jeśli chodzi o produkcję wideoklipów, jest kilka zasad, których warto przestrzegać.
Dzięki temu uda się nam osiągnąć optymalną jakość dzwięku i obrazu, przy zachowaniu
stosunkowo niewielkich rozmiarów pliku, tak by móc łatwo przesyłać go w sieci:
ściągaj obraz wprost z kamery za pomocą karty wideo. Jeśli musisz użyć taśmy
wideo, postaraj się o taśmę jak najlepszej jakości;
jeśli możesz użyć sprzętu S-video, użyj go;
ścieżkę dzwiękową nagrywaj oddzielnie, korzystając ze wskazówek podanych
w pierwszej części tego rozdziału. Pózniej dołączysz ją do pliku w programie
do edycji obrazu wideo;
podobnie jak w przypadku dzwięku, także obraz wideo należy tworzyć
z zachowaniem jak najlepszej jakości. Pózniej możemy użyć programu do edycji,
aby ograniczyć liczbę kolorów, rozdzielczość, prędkość odtwarzania itd.
Efekt będzie lepszy, niż gdybyśmy dokonali próbkowania obrazu przy niższych
ustawieniach tych parametrów. Trzeba jednak pamiętać, że do przechowania takiego
pliku wideo na czas jego edycji potrzebne nam będzie mnóstwo pamięci dyskowej,
dyski o pojemności wielu gigabajtów nie są niczym niezwykłym w tej branży;
kompresji dokonuj na samym końcu. Jeśli to możliwe, ściągaj obrazy
kompresowane algorytmem JPEG, przy zachowaniu najlepszej jakości na jaką
możesz sobie pozwolić. Zasadniczej kompresji całości dokonasz pózniej.
Oczywiście to także wymaga dużej ilości miejsca na dysku.
Rozdział 14. Dzwięk i obraz wideo 429
yródła informacji
Więcej informacji na temat formatów audio znajdziesz w poświęconych tym zagadnie-
niom plikach FAQ, m.in. pod adresem ftp://rtfm.mit.edu/pub/usenet/news.answers oraz
ftp://ftp.uu.net/usenet/news.answers.
Dobrym wprowadzeniem w techniczne aspekty tworzenia cyfrowego dzwięku i obrazu
wideo jest  Desktop Multimedia Bible autorstwa Jeffa Burgera. W książce tej znalezć
można wyczerpujący opis analogowego oraz cyfrowego dzwięku i obrazu wideo, jak
również wiele informacji na temat tworzenia nagrań audio i wideo.
Jeżeli interesujesz się cyfrowym obrazem wideo oraz filmowaniem, polecam książkę
 How to digitize video autorstwa Nelsa Johnsona, Freda Gaulta oraz Marka Florence-
a, wydawnictwa John Wiley & Sons. Książka ta zajmuje się wszelkimi aspektami cy-
frowego obrazu wideo, zawiera mnóstwo informacji na temat potrzebnego sprzętu
i oprogramowania, a ponadto towarzyszy jej CD-ROM wypełniony oprogramowaniem,
z którego możemy korzystać w systemie Windows oraz na Mac-ach.
Aby dowiedzieć się więcej o formacie MPEG (który nie jest szeroko omawiany w wy-
żej wymienionej książce) najlepiej zapoznaj się z plikiem MPEG FAQ. Możesz go
ściągnąć z każdego miejsca, które zapewnia dostęp do plików FAQ Usenetu. By zdobyć
więcej informacji o formacie QuickTime, koniecznie skorzystaj z adresu http://www.
apple.com/quicktime/. Znajdziesz tam mnóstwo informacji o samym formacie, jak rów-
nież przykładowe animacje i doskonale opracowany plik QuickTime.FAQ. Możesz tam
nawet zamawiać oprogramowanie dla tego formatu.
Podsumowanie
Spośród plików audio i wideo rozpowszechnianych w sieci, większość przechowywana
jest w plikach zewnętrznych (offline). Jednak nawet wtedy dzwięk i ruchomy obraz mo-
gą wspaniale wzbogacić Twoją stronę sieciową, zwłaszcza jeśli masz coś ciekawego do
pokazania. Przy wielu dostępnych obecnie, niedrogich urządzeniach do próbkowania
dzwięku i obrazu wideo, tworzenie własnych animacji i plików dzwiękowych stało się
możliwe nawet dla tych, którzy nie dysponują wielką ilością pieniędzy, ani też znacz-
nym doświadczeniem w produkcji filmowej.
Oto krótkie podsumowanie wiadomości podanych w tym rozdziale.
Jeśli chodzi o pliki audio, nie ma standardowego formatu o uniwersalnym, międzysyste-
mowym charakterze. Pliki w formacie AU mogą być odtwarzane na większości platform
sprzętowych, ale jakość dzwięku nie jest wtedy najlepsza. Pliki AIFF oraz WAVE pozwa-
lają uzyskać wysoką jakość dzwięku, oba w przybliżeniu równie wysoką, ale żaden z nich
nie został przystosowany do działania poza własną platformą sprzętową (dla AIFF jest to
Mac, dla WAVE Windows). Format MPEG Audio spopularyzował się w sieci dzięki ist-
nieniu archiwum plików dzwiękowych, o nazwie Internet Underground Music Archive,
ale kodowanie pliku w tym formacie jest kosztowne. Na koniec, format RealAudio, może
być wykorzystywany do odtwarzania dzwięku na bieżąco, w trakcie ładowania pliku. Aby
to jednak działało, zarówno serwer, jak i ładująca plik przeglądarka muszą posiadać do-
datkowe oprogramowanie.
430 Część 5. Multimedia i aplety Javy
Dla cyfrowego obrazu wideo najpopularniejszymi formatami sÄ… QuickTime oraz MPEG.
Z tych dwu, na czoło wysuwa się QuickTime ze względu na swój uniwersalny, między-
platformowy charakter i wyłącznie programowe odtwarzanie. Dla plików w formacie
QuickTime możemy stosować algorytm kompresji CinePak lub IndeoVideo; oba są
bardzo dobre, choć CinePak jest odrobinę bardziej rozpowszechniony, zwłaszcza wśród
przeglÄ…darek systemu Unix.
Przy tworzeniu plików audio i wideo należy trzymać się tych samych zasad: zawsze ko-
rzystać przy nagrywaniu z najlepszego sprzętu, jaki mamy do dyspozycji i zawsze do-
konywać próbkowania analogowego materiału, przy takich ustawieniach parametrów,
by otrzymać plik jak najlepszej jakości. Następnie, za pomocą programu do edycji
konwertujemy plik do niższej rozdzielczości oraz częstotliwości (w przypadku obrazu
wideo, prędkości odtwarzania), aż do otrzymania pliku o takich rozmiarach, by nadawał
się do praktycznego wykorzystania, na przykład, w sieci. Jako że pliki audio i wideo są
duże, zawsze pamiętajmy o umieszczeniu w sieci opisów wszystkich plików przyłączo-
nych do naszej strony. W opisie musi znalezć się informacja o formacie pliku i o jego
rozmiarach.
Warsztat
W tej części rozdziału znajdziesz pytania i odpowiedzi, quiz oraz ćwiczenia związane
z wykorzystaniem dzwięków oraz obrazów wideo na WWW.
Pytania i odpowiedzi
P. Chciałbym utworzyć stronę w rodzaju tych, które mają wbudowaną  szpiegow-
skÄ… kamerÄ™ filmujÄ…cÄ… co parÄ™ minut mnie albo moje akwarium z rybkami, al-
bo cokolwiek innego. Jak to zrobić?
O. Szczegółowej odpowiedzi na to pytanie nie da się udzielić w oderwaniu od systemu,
na którym pracujesz i jego możliwości. Jeśli masz przyłączoną do komputera kame-
rę, która może fotografować Ciebie lub Twoje otoczenie, musisz znalezć jakiś spo-
sób, by nakazać robienie tych zdjęć co kilka minut. W systemie Unix możesz użyć
polecenia cron; na Mac-u lub na PC trzeba utworzyć odpowiednie makropolecenie
i użyć programu, który potrafi śledzić poruszenia twej myszy oraz klawiatury (może
znajdziesz gdzieś oprogramowanie wideo z wbudowaną funkcją czasową, choć do tej
chwili nie napotkałam programu tego typu).
Następnie, gdy mamy już plik z obrazem, kolejnym wyzwaniem staje się dokonanie
automatycznej konwersji do formatu GIF lub JPEG i umieszczenie go w serwerze
sieciowym. Jeśli serwer sieciowy i komputer, przy którym zainstalowana jest kame-
ra, to jedna i ta sama maszyna, nie ma problemu. Jeżeli jednak przesyłasz pliki na
swój serwer, będziesz musiał opracować jakiś system automatycznego przenoszenia
ich na właściwe miejsce.
Rozdział 14. Dzwięk i obraz wideo 431
Quiz
1. Spróbuj przetłumaczyć:  Luther s Banana to 1.2 megabajtowy plik AVI
z algorytmem codec CinePak i dwuścieżkową, 22 kHz ścieżką dzwiękową.
2. Czym jest próbkowanie?
3. Jaka jest główna (a być może jedyna) zaleta formatu µ-low?
4. Czym jest codec i co ma on wspólnego z formatami zapisu obrazu wideo?
5. Który z formatów zapisu obrazu wideo: AVI czy QuickTime lepiej nadaje się
do wykorzystania na witrynie WWW, której użytkownicy korzystają z różnych
przeglÄ…darek?
Odpowiedzi
1.  Luther s Banana to plik zapisany w formacie Video for Windows skompresowany
do wielkości 1,2 MB przy wykorzystaniu algorytmu codec CinePak i dysponujący
ścieżką dzwiękową stereo o przeciętnej jakości.
2. Próbkowanie to proces konwersji dzwięku analogowego do postaci sygnału
cyfrowego, realizowany poprzez pomiar amplitudy fali dzwiękowej w wybranych
punktach czasu. Każdy taki pomiar nazywany jest próbką.
3. JedynÄ… zaletÄ… formatu µ-low jest możliwość korzystania z niego na wielu
platformach systemowych.
4. Codec (ang. COmpresion/DECompresion) jest algorytmem służącym do kompresji
i dekompresji obrazu wideo. Algorytmy kompresji wideo, podobnie jak algorytmy
kompresji obrazów nie są ściśle powiązane z konkretnymi formatami zapisu plików
wideo. Typowy format zapisu obrazu wideo może wykorzystywać wiele różnych
algorytmów kompresji i zazwyczaj wybiera odpowiedni z nich na bieżąco, podczas
odtwarzania obrazu.
5. Format AVI jest dobrze wykorzystywany tylko na komputerach PC, z tego względu,
aby przyciągnąć więcej użytkowników (w tym osoby korzystające z komputerów
Macintosh) do witryny WWW, należy użyć formatu QuickTime.
Ćwiczenia
1. Odwiedz Internet Underground Music Archive, poszukaj ulubionego zespołu
lub rodzaju muzyki i skopiuj kilka utworów zapisanych w różnych formatach,
porównując ich wielkość oraz jakość dzwięku.
2. WykorzystujÄ…c dowolnÄ… z popularnych wyszukiwarek (takich jak Yahoo!,
Lycos, itp.), poszukaj na WWW plików wideo. Jak wiele spośród nich to pliki AVI,
QuickTime, MPEG? Czy istnieją jakieś reguły określające, jakie rodzaje witryn
częściej wykorzystują pewien format plików wideo niż inne formaty?
432 Część 5. Multimedia i aplety Javy


Wyszukiwarka

Podobne podstrony:
14 07 Pily tarczowe v1 1
14 07
Irak będzie dostarczał połowę gazu dla Nabucco (14 07 2009)
C5 (X7) B2CB011MP0 14 07 13 Prezentacja PrzyrzÄ…dy
07 (14)

więcej podobnych podstron