Formaty plików 
dźwiękowych 
Aktualnie wykorzystywanych jest 
kilkanaście formatów plików 
dźwiękowych, z których każdy ma 
swoje unikalne zalety i wady. 
Audio Interchange File Format (AIFF). Pliki dźwiękowe 
tego typu nie są kompresowane, a najczęściej korzystają z 
nich 
użytkownicy
komputerów
Macintosh.
Pliki
zapisywane w tym formacie mogą być bardzo duże.
  AIF,  .AIFF  -  popularny  niegdyś  na  Macintoshach, 
obecnie  rozpowszechniony  również  na  pecetach.  Pliki 
AIFF nie są kompresowane, chociaż istnieje format AIFF-
C, który umożliwia kompresję nawet w stopniu 6:1. 
*Wiekszość  odtwarzaczy  muzycznych  wspiera  nadal 
.AIF, .AIFF.
Musical Instrument Digital Interface (MIDI). Pliki 
tego typu zawierają raczej syntezowane niż nagrywane 
dźwięki. Pliki MIDI są bardzo małe. Jednak ze względu na 
fakt, iż nie można cofać odtwarzanego dźwięku, pliki MIDI 
mają ograniczone zastosowanie. 
MIDI  –pliki  tego  typu  są  najprostsza  formą 
przechowywania  muzyki  w  postaci  cyfrowej,  gdyż  w 
pliku tym są zarejestrowane  tylko informacje takie jak: 
instrument,  nuta,  czas  itd.  Pliki  te  charakteryzują  się 
małą  objętością  (dają  się  jeszcze  dość  skutecznie 
skompresować)  ,ale  jakość  muzyki  zależy  od  płyty 
dźwiękowej,  to  znaczy  jakiego  systemu  ta  płyta  używa 
aby odtworzyć dany instrument. Dzieje się tak dlatego, 
że  MIDI  nie  digitalizuje,  nie  kompresuje  realnych 
dźwięków, a jest językiem opisującym, jakie dźwięki ma 
wygenerować  syntezator  znajdujący  się  na  karcie 
muzycznej.  Dzięki  temu  10  kB  plik  MIDI  może 
odpowiadać  nawet  1  minucie  odgrywanego  dźwięku! 
Jakość dźwięku jest zależna przede wszystkim od karty 
dźwiękowej  i  jej  ceny.  Niestety  nie  zapisuje  się  w  tym 
formacie vocalu. Dlatego też jest to format nadający się 
przede wszystkim do słuchania muzyki klasycznej.
µ-low  ( nazywane także „dźwiękiem podstawowym”), to 
najstarszy  format  zapisu  dźwięku  na  Internecie.  Jednak 
jego  niska  jakość  sprawia,  iż  aktualnie  nie  jest  on 
szczególnie  atrakcyjny.  Jego  zaletą  jest  natomiast 
niewielki rozmiar plików.
 
Motion Picture Experts Group (MPEG) Audio oferuje 
trzy typy (lub poziomy) plików dźwiękowych i jest 
bardzo popularne ze względu na szeroką akceptację i 
obsługę tego formatu zapisu dźwięku i obrazu. Aktualnie 
najbardziej popularnym formatem plików dźwiękowych 
jest MP3, oferujący dźwięk o jakości porównywalnej z 
jakością muzyki z płyt kompaktowych a jednocześnie 
bardzo mały rozmiar plików. 
WAV (lub WAVE) - format plików dźwiękowych stworzony 
przez Microsoft oraz IBM. Pomimo, że może może zawierać 
dowolny 
kodek
audio,
zazwyczaj
stosuje
się
nieskompresowany  PCM,  co  negatywnie  wpływa  na 
wielkość  pliku.  Pliki  WAV  stosowane  są  do  zapisu  krótkich 
dźwięków  oraz,  jeżeli  rozmiar  pliku  nie.ma.znaczenia. 
Muzykę  z  płyt  CD-Audio  można  bezstratnie  zapisać  w  tym 
formacie  za  pomocą  tak  zwanych  ripperów,  jednak  tak 
utworzone pliki mają bardzo duży rozmiar (około 172 kB na 
sekundę),  toteż  zwykle  zwykle  zapisuje  się  je  w  formatach 
ze stratną kompresją. 
Wave dźwięk zapisywany bez kompresji. Podstawową wadą 
tego formatu jest jego ogromna objętość (pliki o wysokiej 
jakości 1 min = 10MB). Z tego powodu pliki tego formatu są 
nieprzydatne w sieci. Jest to natomiast bardzo dobry format 
do przetwarzania dźwięków i późniejszej konwersji na inne 
formaty. Obsługuje go większość edytorów dźwięku i 
programów konwertujących. Pliki wave rozpoznaje się po 
rozszerzeniu “.wav”.
*.WAV odtwarza praktycznie każdy program multimedialny 
MP3 (MPEG-1/2 Audio Layer-3) - to popularny format stratnej 
kompresji  dźwięku  opierający  się  na  zmodyfikowanej  dyskretnej 
transformacie 
cosinusowej
i
używający
modelu
psychoakustycznego.  Format  został  stworzony  we  Fraunhofer 
Institute.  Przy  tworzeniu  jego  pierwszej  implementacji 
wykorzystywany  był  m.in.  utwór  Suzanne  Vegi  Tom's  Diner  w 
celu dostosowania kompresji do brzmienia ludzkiego głosu. 
 
Dźwięk skompresowany z przepływnością (ang. bitrate) 128 kbps 
daje  zazwyczaj  zadowalającą  jakość  na  przeciętnym  sprzęcie 
odsłuchowym w komputerach osobistych (128 kbps przyjmuje się 
jako  odpowiadającą  niskiej  jakości  odtwarzaczom  CD),  dźwięk 
skompresowany  przy  192  kbps  jest  dla  większości  ludzi 
nieodróżnialny  od  oryginału.  Niektórzy  słuchacze  w  celu 
uzyskania  większej  jakości  dźwięku  stosują  jeszcze  słabszą 
kompresję  (256  lub  nawet  320  kbps).  Jakość  zależy  również  w 
dużym stopniu od używanego do kompresji enkodera.
 
Pierwotnie do kompresji MP3 stosowano Constant Bit Rate 
(CBR), czyli do każdej ramki używano tej samej ilości bitów. 
Współcześnie używa się raczej Variable Bit Rate (VBR) 
charakteryzującego się zmienną przepływnością w wybranym 
przedziale podczas kodowania. 
*.MP3 odtwarza praktycznie każdy program multimedialny 
Mp3  (MPEG2  Layer-3)  Wykorzystuje  algorytm  stratnej 
kompresji, dzięki czemu rozmiar pliku MP3 jest dużo mniejszy 
niż  pliku  zapisanego  bez  kompresji.  Pliki  formatu  MP3 
rozpoznaje  się  po  rozszerzeniu  “.mp3”.  Jest  to  jeden  z 
najbardziej  rozpowszechnionych  formatów  w  Internecie. 
Związane  jest  to  z  możliwością  zapisu  dźwięku  w  plikach  o 
małej  objętości  zachowując  dodatkowo  dosyć  dużą  jakość 
dźwięku. Osiąga się to poprzez usuwanie słabszych dźwięków, 
które i tak byłyby nie słyszalne dla ludzkiego mózgu. Poza tym, 
z powodu ograniczonego czasu reakcji naszego mózgu, słabsze 
dźwięki  są  niesłyszalne  na  krótko  przed  i  po  wystąpieniu 
silnego  sygnału  i  także  one  są  usuwane.  Daje  to  w  efekcie 
nawet  12-krotne  zmniejszenie  objętości  w  stosunku  do  pliku 
typu WAV bez zauważalnej straty jakości. Format MPEG Layer 
3 można podzielić na dwie kategorie:
1.  MPEG-1  Layer  3  (dźwięk  próblowany  z  częstotliwością  32, 
44,1 lub 48 kHz) i
2. MPEG-2 Layer 3 (16, 22,05 lub 24 kHz).
 Dźwięk  może  być  przechowywany  w  pliku  w  trzech 
podformatach  (layers),  różniących  się  od  siebie  jedynie 
stopniem kompresji.
•  Layer  1  umożliwia  czterokrotne  zmniejszenie  objętości 
nieskompresowanego pliku (np. w formacie WAVE) • Layer2 – 
ośmiokrotne  •  Layer  3  nawet  dwunastokrotne.Kompresja 
pociąga  za  sobą  oczywiście  utratę  jakości,  ale  dźwięk  jest 
wciąż niemal tak samo doskonały, jak na płytach CD. 
Mp3Pro  to  następca  MP3.  Powstał  dzięki  firmie 
Thomson  oraz  naukowcom  z  Franhouver.  Pliki  Mp3Pro 
różnią się od zwykłych Mp3 praktycznie tylko rozmiarem- 
zajmują  go  o  połowę  mniej.  Zapewnia  on  jakość 
porównywalną  do  mp3,  przy  zdecydowanie  mniejszym 
bitrate  (czasem  wystarczy  nawet  64  kbit/s,  by  uzyskać 
jakość  odpowiadającą  128  kbit/s  "zwykłego"  mpeg  layer-
3).  Jakość  tego  formatu,  pomimo  zdecydowanie 
mniejszego  "nominalnego"  bitrate,  jest  podobna,  a  może 
nawet lepsza od mp3.
 
MPC (Musepack) - format stratnej kompresji dźwięku, 
bazujący na algorytmach MPEG Layer-2 (MP2), jednakże 
znacznie w stosunku do nich rozbudowany. Format został 
zaprojektowany tak, by dawać dźwięk nierozróżnialny od 
oryginału przy standardowych ustawieniach (tzw. 
przezroczystość, ang. transparency), co osiąga przy 
przepływności (bitrate) niższej niż inne popularne kodeki 
(jak np. MP3). Algorytm zaprojektowano tak, aby 
przechowywał jak najwięcej informacji, dlatego najlepiej 
sprawdza się dla wysokich przepływności (od 140 kbit/s 
wzwyż), natomiast dla przepływności poniżej 112 kbit/s 
jakość dźwięku w tym formacie gwałtownie spada. 
Wzorcowa implementacja Musepack jest szybsza niż 
większość popularnych kodeków dźwięku. 
APE (Monkey's Audio) - Jeden z 
najpopularniejszych bezstratnych kodeków dźwięku. 
Pozwala zmniejszyć wielkość plików o 40% do 50%. 
Pliki zawierające dźwięk w tym formacie mają 
rozszerzenie. APE  Program zawiera w sobie plugin 
dla programu Winamp ,aby mógł odtwarzać pliki z 
tym rozszerzeniem. Pliki .APE pozwalają zmienić się 
na pliki WAV bez utraty jakości. 
FLAC (Free Lossless Audio Codec) - format 
bezstratnej kompresji dźwięku z rodziny 
kodeków Ogg. Format ten jest rozwijany przez 
Xiph.Org Foundation i kojarzony z Wolnym 
Oprogramowaniem. W przeciwieństwie do 
stratnych kodeków dźwięku takich jak Vorbis, 
MP3 i AAC, kodek FLAC nie usuwa żadnych 
danych ze strumienia audio, dzięki czemu po 
dekompresji otrzymujemy dźwięk identyczny z 
pierwowzorem. Format FLAC jest obecnie 
obsługiwany przez większość oprogramowania 
służącego do edycji/odtwarzania audio 
(czasami wymagana jest odpowiednia 
wtyczka). 
AAC  (Advanced  Audio  Coding)  -  algorytm 
stratnej  kompresji  danych  dźwiękowych,  którego 
specyfikacja  została  opublikowana  w  roku  1997. 
Format AAC zaprojektowany został jako następca 
MP3,  oferujący  lepszą  jakość  dźwięku  przy 
podobnym  rozmiarze  danych.  Uzywany  przrz 
Apple  w  popularnym  iTunes  Music  Store. 
Wiekszość  odtwarzaczy  muzycznych  wspiera 
nadal  ten  format  plików.  AAC  Format  zapewnia 
około 2-krotnie lepszą kompresję dźwięku, jednak 
pliki  przez  niego  wygenerowane  mogą  brzmieć 
nieco  "sztucznie".  Ponadto  AAC  nie  jest  zbyt 
rozpowszechnionym  formatem  (w  porównaniu  do 
mp3, vqf, czy ogg).
 
RealAudio - format kompresji dźwięku stworzony 
przez firme RealNetworks. Kodek został 
opracowany głownie z myślą o wykorzystaniu go 
w strumieniowaniu dźwięku przy łączu 
internetowym o niskiej przepustowości. Wiele 
radii internetowych korzysta z RealAudio przy 
transmitowaniu audycji przez Internet. 
Rozszerzenie plików RealAudio to .ra, .rm lub 
.ram. 
Główną aplikacją do odtwarzania RealAudio jest 
RealPlayer. 
OFR (OptimFROG) - format bezstratnej 
kompresji dźwięku. OptimFROG 
zapewnia najlepszą jakość kompresji, 
lecz ma długi czas dekodowania co 
powoduje duże zużycie procesora 
podczas odtwarzania 
OGG  -  strumieni  danych,  popularyzowany  przez 
fundację  Xiph.org,  stworzony  by  wspierać  inicjatywy 
związane  z  rozwojem  wolnego  oprogramowania  do 
kodowania  i  dekodowania  multimediów.  Często 
spotykany,  zapis  dużymi  literami  “OGG”  jest 
nieprawidłowy.  Jest  to  także  nazwa  rodziny  kodeków, 
co powoduje częste nieporozumienia: np. film zapisany 
w  kontenerze  AVI  może  zawierać  strumień  dźwięku 
Vorbis,  a  w  kontenerze  Ogg  może  znajdować  się 
strumień  dźwięku  w  formacie  MP3  i  obraz  kodowany 
jako  DivX/XviD.  Kontener  Ogg  może  zawierać  wiele 
multipleksowanych  strumieni  dźwięku,  obrazu  i 
napisów. Zgodnie ze specyfikacją wszystkie pliki w tym 
formacie,  niezależnie  od  zawartości,  powinny  mieć 
rozszerzenie  .ogg,  jednak  w  praktyce  często  stosuje 
się je tylko do muzyki i dźwięków, a filmom nadaje się 
rozszerzenie 
.ogm.
Jest
to
prawdopodobnie
spowodowane
tym,
że
użytkownicy
wolą
wyspecjalizowane  programy  do  odtwarzania  muzyki  i 
filmów, które uruchamiają się właśnie w zależności od 
rozszerzenia danego pliku. 
*Popularniejsze programy obsługują ten format 
SHN (Shorten) - starszy format bezstratnej 
kompresji dźwięku. Ma gorsza kompresje od 
WavPack, FLAC i Monkey's Audio. 
Aczkolwiek jescze popularny z powodu dużej 
ilośći dostępnych legalnie nagrań 
koncertowych zapisanych w tym formacie. 
WMA (Windows Media Audio) - Windows 
Media Audio został stworzony przez firmę 
Mcrosoft. Użytkownicy zauważyli, że o ile WMA 
znakomicie radzi sobie z kompresją muzyki, to 
kompresja nagranej mowy pozostawia wiele do 
życzenia. Wprawdzie wiele z tych wad 
wyeliminowano lub chociaż poprawiono w 
najnowszej wersji kodeka ? Windows Media Audio 
8? ale jakościowo nadal ustępuje on MP3. 
Zgodnie z zapewnieniem producenta funkcja 
kodowania Windows Media Audio 8 dostarcza 
dźwięk o jakości jak z płyty CD i rozmiarze 
dwukrotnie mniejszym niż pliki w formacie MP3, 
dzięki czemu podwaja ilość miejsca 
przeznaczonego na przechowywanie muzyki i 
skraca czas pobierania muzyki cyfrowej o jakości 
płyt CD.Atutem tego standardu jest strumieniowa 
obsługa plików i łatwa integracja ze środowiskiem 
XML. Najczęściej dane zakodowane za pomocą 
WMA umieszcza się w kontenerze ASF *.WMA 
odtwarza praktycznie każdy program 
multimedialny 
WV (WavPAck) - format bezstratnej 
kompresji dźwięku podobny do FLAC. 
WavPAck ma troche lepsza komresje 
niż FLAC co sprawia, że staje się coraz 
popularniejszy. 
Twin  VQ  (Transform-domain  Weighted  Interleave 
Vector  Quantization)  nazywany  tez  VQF  (pliki 
zapisane w tym formacie mają rozszerzenie *.vqf). W 
przeciwieństwie 
do
MP3,
TWIN
VQ
został
opracowany  przez  firmę  komercyjną  -  NTT  Human 
Interface  Laboratories.  Twin  VQ  jest  podobnie  jak 
Mp3 formatem służącym do zapisu cyfrowego audio. 
Twin  VQ  posiada  w  przeciwieństwie  do  MP3  dwie 
prędkości  kompresowania  dźwięku  zachowując  przy 
tym jakość CD :
• 80 kbit/sec (sekunda dźwięku zajmuje 10 KB)
• 96 kbit/sec (sekunda dźwięku zajmuje 12 KB).
 
W  porównaniu  z  formatem  MP3  o  tej  samej 
częstotliwości  próbkowania,  VQF  daje  kompresję 
lepszą o ok. 35 procent.
Należy również wspomnieć o formacie RMF, 
czyli Rich Music Format. Jest to 
zaawansowana technika, pozwalająca 
uzyskać bardzo bogate brzmienie, przy 
niewielkiej objętości pliku. Jest to ciągle 
jednak mało popularna technika ale z którą 
wiąże się wielkie nadzieje na przyszłość.