Multimedia
Wykład 11
Kodowanie i kompresja
sygnałów audio
dr inż. Stefan Brachmański
pok.505 C-5
E-mail:
stefan.brachmanski@pwr.wroc.pl
Standardy kodowania dzwięku
" Zalecenia ITU-T:
G.711
" PCM (Pulse Code Modulation) najstarsza metoda
kodowania,
" częstotliwość próbkowania 8 kHz, przepływność 64 kb/s,
G.727
" ADPCM (Adaptive Differential Pulse Code Modulation)
" Kodowanie sygnałów audio w pasmie 7 kHz,
" Redukcja strumienia do 40, 32, 24, 16 kb/s,
" Kompresja 2:1
" Działa na zasadzie odczytu różnicy pomiędzy kolejnymi
próbkami głosowymi
Standardy kodowania dzwięku
G.728
" Zakodowany strumień audio 16 kb/s lub 32 kb/s,
" Wykorzystane kodowanie LD-CELP
" Kompresja 4:1
G.729
" Kodowanie sygnału audio w pasmie telefonicznym 8kHz z
wykorzystaniem kodera CS-ACELP,
" Zakodowany strumień audio - 8 kb/s
" Kompresja 8:1
G.723
" Wykorzystuje algorytm ACELP, pasmo telefoniczne,
" Zakodowany strumień audio 5,3 lub 6,4 kb/s
" O najwyższej kompresji 12:1
MPEG-1 Audio Layer 3 (MP3)
Podstawowe parametry kompresji MPEG audio dla sygnału stereofonicznego
jakości CD
Kodowanie Podział Wymagana przepustowość sygnału
PCM CD Quality 1 : 1 1,4 Mbit/s
Layer I 4 : 1 384 kbit/s
Layer II 8 : 1 192 kbit/s
Layer III (MP3) 12 : 1 128 kbit/s
MPEG-1 Audio Layer 3 (MP3)
Ilustracja efektu maskowania. (linia czarna - próg słyszalności, próg maskowania,
zielone słupki - dzwięki, które mogą zostać podczas kompresji zamaskowane,
czerwony słupek - dzwięk słyszalny)
MPEG-1 Audio Layer 3 (MP3)
Ilustracja efektu niesłyszenia słabych dzwięków w obecności dzwięku silnego.
MPEG-1 Audio Layer 3 (MP3)
Ilustracja działania modelu psychoakustycznego dla efektu maskowania.
Advanced Audio Coding (AAC)
Standard AAC (Advanced Audio Coding) jest formatem kompresji
stratnej wykorzystującym rozwiązania zawarte w standardach
MPEG-2 oraz MPEG-4. Kodek AAC pozwala na kodowanie z
częstotliwością próbkowania do 96 kHz, umożliwiając jednoczesną
obsługę do 48 kanałów o pełnym paśmie przenoszenia w jednym
strumieniu danych. Kodek ten oferuje cztery podstawowe profile
kodowania, a mianowicie: LC (Low Complexity), MAIN (Main
Profile), SRS (Sample-Rate Scalable) lub AAC-SSR (Scalable
Sample Rate) oraz LTP (Long Term Prediction).
Podobnie jak w MP3, koder AAC reprezentuje sygnał w dziedzinie częstotliwości,
za pośrednictwem współczynników zmodyfikowanego przekształcenia
kosinusowego (MDCT), w którym bloki próbek pobierane z 50% zakładką są
ważone oknem i poddane przekształceniu DCT-4.
Windows Media Audio (WMA)
Standard WMA (Windows Media Audio) jest formatem kompresji dzwięku
opracowanym przez firmę Microsoft. Format ten, podobnie jak MP3,
opiera się na modelu psychoakustycznym wykorzystującym
niedoskonałości ucha ludzkiego.
Kodowanie sygnału fonicznego może być realizowane ze stałą
przepływnością strumienia bitowego CBR (Constant Bit Rate) bądz ze
zmienną VBR (Variable Bit Rate). Dodatkowo w nowszych generacjach
WMA wprowadzono możliwość kodowania ze średnią gęstością
strumienia bitowego ABR (Average Bit Rate). Kodek WMA posiada opcję
zapisu dzwięku próbkowanego z częstotliwością 96 KHz / 24-bit (w wersji
WMA PRO), a także możliwość zapisu dzwięku wielokanałowego.
Kodowanie parametryczne - wokodery
Wokoder (vocoder (voice coder) ) urządzenie, które
wydobywa ustalone parametry nadawanego sygnału mowy,
koduje je i przesyła do odbiornika, w którym na ich podstawie
dokonuje się odtworzenia (syntezy) sygnału o zadanych
parametrach, czyli nadanego sygnału mowy
Analizator Syntezator
Zakłócenia
(szum)
Sygnał
+
Wiadomość Sygnał
Szum
Nadawca Koder Dekoder Odbiorca
Kanał
Wyszukiwarka
Podobne podstrony:
wprowadz w11Metody numeryczne w11Sekrety skutecznych prezentacji multimedialnych24#5901 dydaktyk aplikacji multimedialnychw11 uwaga swiadomosc?zw11 3micros multimetry www przeklej plKOMLOGO Multimedialny Pakiet Logopedyczny część I i II(1)WNUM W11JME3 multimediahash multimapMultimediaService LabInstructionwięcej podobnych podstron