Formaty plików dźwiękowych

background image

Formaty plików
dźwiękowych

Aktualnie wykorzystywanych jest
kilkanaście formatów plików
dźwiękowych, z których każdy ma
swoje unikalne zalety i wady.

background image

Audio Interchange File Format (AIFF). Pliki dźwiękowe
tego typu nie są kompresowane, a najczęściej korzystają z
nich

użytkownicy

komputerów

Macintosh.

Pliki

zapisywane w tym formacie mogą być bardzo duże.

AIF, .AIFF - popularny niegdyś na Macintoshach,
obecnie rozpowszechniony również na pecetach. Pliki
AIFF nie są kompresowane, chociaż istnieje format AIFF-
C, który umożliwia kompresję nawet w stopniu 6:1.
*Wiekszość odtwarzaczy muzycznych wspiera nadal
.AIF, .AIFF.

Musical Instrument Digital Interface (MIDI). Pliki
tego typu zawierają raczej syntezowane niż nagrywane
dźwięki. Pliki MIDI są bardzo małe. Jednak ze względu na
fakt, iż nie można cofać odtwarzanego dźwięku, pliki MIDI
mają ograniczone zastosowanie.

background image

MIDI –pliki tego typu są najprostsza formą
przechowywania muzyki w postaci cyfrowej, gdyż w
pliku tym są zarejestrowane tylko informacje takie jak:
instrument, nuta, czas itd. Pliki te charakteryzują się
małą objętością (dają się jeszcze dość skutecznie
skompresować) ,ale jakość muzyki zależy od płyty
dźwiękowej, to znaczy jakiego systemu ta płyta używa
aby odtworzyć dany instrument. Dzieje się tak dlatego,
że MIDI nie digitalizuje, nie kompresuje realnych
dźwięków, a jest językiem opisującym, jakie dźwięki ma
wygenerować syntezator znajdujący się na karcie
muzycznej. Dzięki temu 10 kB plik MIDI może
odpowiadać nawet 1 minucie odgrywanego dźwięku!
Jakość dźwięku jest zależna przede wszystkim od karty
dźwiękowej i jej ceny. Niestety nie zapisuje się w tym
formacie vocalu. Dlatego też jest to format nadający się
przede wszystkim do słuchania muzyki klasycznej.

background image

µ-low ( nazywane także „dźwiękiem podstawowym”), to
najstarszy format zapisu dźwięku na Internecie. Jednak
jego niska jakość sprawia, iż aktualnie nie jest on
szczególnie atrakcyjny. Jego zaletą jest natomiast
niewielki rozmiar plików.
 
Motion Picture Experts Group
(MPEG) Audio oferuje
trzy typy (lub poziomy) plików dźwiękowych i jest
bardzo popularne ze względu na szeroką akceptację i
obsługę tego formatu zapisu dźwięku i obrazu. Aktualnie
najbardziej popularnym formatem plików dźwiękowych
jest MP3, oferujący dźwięk o jakości porównywalnej z
jakością muzyki z płyt kompaktowych a jednocześnie
bardzo mały rozmiar plików.

background image

WAV (lub WAVE) - format plików dźwiękowych stworzony
przez Microsoft oraz IBM. Pomimo, że może może zawierać
dowolny

kodek

audio,

zazwyczaj

stosuje

się

nieskompresowany PCM, co negatywnie wpływa na
wielkość pliku. Pliki WAV stosowane są do zapisu krótkich
dźwięków oraz, jeżeli rozmiar pliku nie.ma.znaczenia.
Muzykę z płyt CD-Audio można bezstratnie zapisać w tym
formacie za pomocą tak zwanych ripperów, jednak tak
utworzone pliki mają bardzo duży rozmiar (około 172 kB na
sekundę), toteż zwykle zwykle zapisuje się je w formatach
ze stratną kompresją.
Wave dźwięk zapisywany bez kompresji. Podstawową wadą
tego formatu jest jego ogromna objętość (pliki o wysokiej
jakości 1 min = 10MB). Z tego powodu pliki tego formatu są
nieprzydatne w sieci. Jest to natomiast bardzo dobry format
do przetwarzania dźwięków i późniejszej konwersji na inne
formaty. Obsługuje go większość edytorów dźwięku i
programów konwertujących. Pliki wave rozpoznaje się po
rozszerzeniu “.wav”.
*.WAV odtwarza praktycznie każdy program multimedialny

background image

MP3 (MPEG-1/2 Audio Layer-3) - to popularny format stratnej
kompresji dźwięku opierający się na zmodyfikowanej dyskretnej
transformacie

cosinusowej

i

używający

modelu

psychoakustycznego. Format został stworzony we Fraunhofer
Institute. Przy tworzeniu jego pierwszej implementacji
wykorzystywany był m.in. utwór Suzanne Vegi Tom's Diner w
celu dostosowania kompresji do brzmienia ludzkiego głosu.
 
Dźwięk skompresowany z przepływnością (ang. bitrate) 128 kbps
daje zazwyczaj zadowalającą jakość na przeciętnym sprzęcie
odsłuchowym w komputerach osobistych (128 kbps przyjmuje się
jako odpowiadającą niskiej jakości odtwarzaczom CD), dźwięk
skompresowany przy 192 kbps jest dla większości ludzi
nieodróżnialny od oryginału. Niektórzy słuchacze w celu
uzyskania większej jakości dźwięku stosują jeszcze słabszą
kompresję (256 lub nawet 320 kbps). Jakość zależy również w
dużym stopniu od używanego do kompresji enkodera.
 
Pierwotnie do kompresji MP3 stosowano Constant Bit Rate
(CBR), czyli do każdej ramki używano tej samej ilości bitów.
Współcześnie używa się raczej Variable Bit Rate (VBR)
charakteryzującego się zmienną przepływnością w wybranym
przedziale podczas kodowania.
*.MP3 odtwarza praktycznie każdy program multimedialny

background image

Mp3 (MPEG2 Layer-3) Wykorzystuje algorytm stratnej
kompresji, dzięki czemu rozmiar pliku MP3 jest dużo mniejszy
niż pliku zapisanego bez kompresji. Pliki formatu MP3
rozpoznaje się po rozszerzeniu “.mp3”. Jest to jeden z
najbardziej rozpowszechnionych formatów w Internecie.
Związane jest to z możliwością zapisu dźwięku w plikach o
małej objętości zachowując dodatkowo dosyć dużą jakość
dźwięku. Osiąga się to poprzez usuwanie słabszych dźwięków,
które i tak byłyby nie słyszalne dla ludzkiego mózgu. Poza tym,
z powodu ograniczonego czasu reakcji naszego mózgu, słabsze
dźwięki są niesłyszalne na krótko przed i po wystąpieniu
silnego sygnału i także one są usuwane. Daje to w efekcie
nawet 12-krotne zmniejszenie objętości w stosunku do pliku
typu WAV bez zauważalnej straty jakości. Format MPEG Layer
3 można podzielić na dwie kategorie:
1. MPEG-1 Layer 3 (dźwięk próblowany z częstotliwością 32,
44,1 lub 48 kHz) i
2. MPEG-2 Layer 3 (16, 22,05 lub 24 kHz).
 Dźwięk może być przechowywany w pliku w trzech
podformatach (layers), różniących się od siebie jedynie
stopniem kompresji.
• Layer 1 umożliwia czterokrotne zmniejszenie objętości
nieskompresowanego pliku (np. w formacie WAVE)
• Layer2 –
ośmiokrotne
• Layer 3 nawet dwunastokrotne.Kompresja
pociąga za sobą oczywiście utratę jakości, ale dźwięk jest
wciąż niemal tak samo doskonały, jak na płytach CD.

background image

Mp3Pro to następca MP3. Powstał dzięki firmie
Thomson oraz naukowcom z Franhouver. Pliki Mp3Pro
różnią się od zwykłych Mp3 praktycznie tylko rozmiarem-
zajmują go o połowę mniej. Zapewnia on jakość
porównywalną do mp3, przy zdecydowanie mniejszym
bitrate (czasem wystarczy nawet 64 kbit/s, by uzyskać
jakość odpowiadającą 128 kbit/s "zwykłego" mpeg layer-
3). Jakość tego formatu, pomimo zdecydowanie
mniejszego "nominalnego" bitrate, jest podobna, a może
nawet lepsza od mp3.
 

background image

MPC (Musepack) - format stratnej kompresji dźwięku,
bazujący na algorytmach MPEG Layer-2 (MP2), jednakże
znacznie w stosunku do nich rozbudowany. Format został
zaprojektowany tak, by dawać dźwięk nierozróżnialny od
oryginału przy standardowych ustawieniach (tzw.
przezroczystość, ang. transparency), co osiąga przy
przepływności (bitrate) niższej niż inne popularne kodeki
(jak np. MP3). Algorytm zaprojektowano tak, aby
przechowywał jak najwięcej informacji, dlatego najlepiej
sprawdza się dla wysokich przepływności (od 140 kbit/s
wzwyż), natomiast dla przepływności poniżej 112 kbit/s
jakość dźwięku w tym formacie gwałtownie spada.
Wzorcowa implementacja Musepack jest szybsza niż
większość popularnych kodeków dźwięku.

background image

APE (Monkey's Audio) - Jeden z
najpopularniejszych bezstratnych kodeków dźwięku.
Pozwala zmniejszyć wielkość plików o 40% do 50%.
Pliki zawierające dźwięk w tym formacie mają
rozszerzenie. APE Program zawiera w sobie plugin
dla programu Winamp ,aby mógł odtwarzać pliki z
tym rozszerzeniem. Pliki .APE pozwalają zmienić się
na pliki WAV bez utraty jakości.

background image

FLAC (Free Lossless Audio Codec) - format
bezstratnej kompresji dźwięku z rodziny
kodeków Ogg. Format ten jest rozwijany przez
Xiph.Org Foundation i kojarzony z Wolnym
Oprogramowaniem. W przeciwieństwie do
stratnych kodeków dźwięku takich jak Vorbis,
MP3 i AAC, kodek FLAC nie usuwa żadnych
danych ze strumienia audio, dzięki czemu po
dekompresji otrzymujemy dźwięk identyczny z
pierwowzorem. Format FLAC jest obecnie
obsługiwany przez większość oprogramowania
służącego do edycji/odtwarzania audio
(czasami wymagana jest odpowiednia
wtyczka).

background image

AAC (Advanced Audio Coding) - algorytm
stratnej kompresji danych dźwiękowych, którego
specyfikacja została opublikowana w roku 1997.
Format AAC zaprojektowany został jako następca
MP3, oferujący lepszą jakość dźwięku przy
podobnym rozmiarze danych. Uzywany przrz
Apple w popularnym iTunes Music Store.
Wiekszość odtwarzaczy muzycznych wspiera
nadal ten format plików.
AAC Format zapewnia
około 2-krotnie lepszą kompresję dźwięku, jednak
pliki przez niego wygenerowane mogą brzmieć
nieco "sztucznie". Ponadto AAC nie jest zbyt
rozpowszechnionym formatem (w porównaniu do
mp3, vqf, czy ogg).
 

background image

RealAudio - format kompresji dźwięku stworzony
przez firme RealNetworks. Kodek został
opracowany głownie z myślą o wykorzystaniu go
w strumieniowaniu dźwięku przy łączu
internetowym o niskiej przepustowości. Wiele
radii internetowych korzysta z RealAudio przy
transmitowaniu audycji przez Internet.
Rozszerzenie plików RealAudio to .ra, .rm lub
.ram.
Główną aplikacją do odtwarzania RealAudio jest
RealPlayer.

background image

OFR (OptimFROG) - format bezstratnej
kompresji dźwięku. OptimFROG
zapewnia najlepszą jakość kompresji,
lecz ma długi czas dekodowania co
powoduje duże zużycie procesora
podczas odtwarzania

background image

OGG - strumieni danych, popularyzowany przez
fundację Xiph.org, stworzony by wspierać inicjatywy
związane z rozwojem wolnego oprogramowania do
kodowania i dekodowania multimediów. Często
spotykany, zapis dużymi literami “OGG” jest
nieprawidłowy. Jest to także nazwa rodziny kodeków,
co powoduje częste nieporozumienia: np. film zapisany
w kontenerze AVI może zawierać strumień dźwięku
Vorbis, a w kontenerze Ogg może znajdować się
strumień dźwięku w formacie MP3 i obraz kodowany
jako DivX/XviD. Kontener Ogg może zawierać wiele
multipleksowanych strumieni dźwięku, obrazu i
napisów. Zgodnie ze specyfikacją wszystkie pliki w tym
formacie, niezależnie od zawartości, powinny mieć
rozszerzenie .ogg, jednak w praktyce często stosuje
się je tylko do muzyki i dźwięków, a filmom nadaje się
rozszerzenie

.ogm.

Jest

to

prawdopodobnie

spowodowane

tym,

że

użytkownicy

wolą

wyspecjalizowane programy do odtwarzania muzyki i
filmów, które uruchamiają się właśnie w zależności od
rozszerzenia danego pliku.
*Popularniejsze programy obsługują ten format

background image

SHN (Shorten) - starszy format bezstratnej
kompresji dźwięku. Ma gorsza kompresje od
WavPack, FLAC i Monkey's Audio.
Aczkolwiek jescze popularny z powodu dużej
ilośći dostępnych legalnie nagrań
koncertowych zapisanych w tym formacie.

background image

WMA (Windows Media Audio) - Windows
Media Audio został stworzony przez firmę
Mcrosoft. Użytkownicy zauważyli, że o ile WMA
znakomicie radzi sobie z kompresją muzyki, to
kompresja nagranej mowy pozostawia wiele do
życzenia. Wprawdzie wiele z tych wad
wyeliminowano lub chociaż poprawiono w
najnowszej wersji kodeka ? Windows Media Audio
8? ale jakościowo nadal ustępuje on MP3.
Zgodnie z zapewnieniem producenta funkcja
kodowania Windows Media Audio 8 dostarcza
dźwięk o jakości jak z płyty CD i rozmiarze
dwukrotnie mniejszym niż pliki w formacie MP3,
dzięki czemu podwaja ilość miejsca
przeznaczonego na przechowywanie muzyki i
skraca czas pobierania muzyki cyfrowej o jakości
płyt CD.Atutem tego standardu jest strumieniowa
obsługa plików i łatwa integracja ze środowiskiem
XML. Najczęściej dane zakodowane za pomocą
WMA umieszcza się w kontenerze ASF *.WMA
odtwarza praktycznie każdy program
multimedialny

background image

WV (WavPAck) - format bezstratnej
kompresji dźwięku podobny do FLAC.
WavPAck ma troche lepsza komresje
niż FLAC co sprawia, że staje się coraz
popularniejszy.

background image

Twin VQ (Transform-domain Weighted Interleave
Vector Quantization) nazywany tez VQF (pliki
zapisane w tym formacie mają rozszerzenie *.vqf). W
przeciwieństwie

do

MP3,

TWIN

VQ

został

opracowany przez firmę komercyjną - NTT Human
Interface Laboratories. Twin VQ jest podobnie jak
Mp3 formatem służącym do zapisu cyfrowego audio.
Twin VQ posiada w przeciwieństwie do MP3 dwie
prędkości kompresowania dźwięku zachowując przy
tym jakość CD :
• 80 kbit/sec (sekunda dźwięku zajmuje 10 KB)
• 96 kbit/sec (sekunda dźwięku zajmuje 12 KB).
 
W porównaniu z formatem MP3 o tej samej
częstotliwości próbkowania, VQF daje kompresję
lepszą o ok. 35 procent.

background image

Należy również wspomnieć o formacie RMF,
czyli Rich Music Format. Jest to
zaawansowana technika, pozwalająca
uzyskać bardzo bogate brzmienie, przy
niewielkiej objętości pliku. Jest to ciągle
jednak mało popularna technika ale z którą
wiąże się wielkie nadzieje na przyszłość.


Document Outline


Wyszukiwarka

Podobne podstrony:
Formaty plików muzycznych
Rodzaje plików dźwiękowych Odtwarzacze multimedialne
FORMATY PLIKóW Bmpfrmat
Formaty plikow graficznych
FORMATY PLIKóW Wav
Soboń Jacek formaty plikow graficznych
Format plików ARW Sony RAWy
4 Formaty plikow w DTP
K Rutkowski Formaty plików graficznych
Tworzenie plików dźwiękowych z lektorem
Formaty plików audio
Formaty plików video
Formaty plików Audio
opisz formaty plików jpg, gif, bmp
wojciech marosz multimedia formaty plikow graficznych
13 formaty plikow graficznych uczniowie
Chawraj Michal Multimedia i Grafika Komputerowa Grafika rastrowa i wektorowa i formaty plikow grafic
Trzy dowolne programy do obsługi poczty elektronicznej, formaty plików graficznej

więcej podobnych podstron