Kodeki dźwięku i obrazu 11

Kodeki dźwięku i obrazu 2011/2012

1. Podstawowe zasady próbkowania i kwantyzacji sygnału analogowego. ~by pilot_1804

• Próbkowanie (kwantowanie w czasie) - proces tworzenia sygnału dyskretnego, reprezentującego

sygnał ciągły za pomocą ciągu wartości nazywanych próbkami. Zwykle jest jednym z etapów

przetwarzania sygnału analogowego na cyfrowy.

Zasada: Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty informacji z

powrotem do postaci analogowej, musi być spełniony warunek twierdzenia Kotielnikowa-Shannona

o próbkowaniu: częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma

sygnału. Jeśli ten warunek nie jest spełniony, wówczas występuje zjawisko aliasingu.

• Kwantyzacja to nieodwracalne nieliniowe odwzorowanie statyczne zmniejszające dokładność

danych przez ograniczenie ich zbioru wartości.

Zasada: Sygnał analogowy może przyjmować dowolne wartości, systemy cyfrowe natomiast są w

stanie przetwarzać tylko sygnały reprezentowane słowami o skończonej liczbie bitów. Taka

reprezentacja wymaga zatem skończonej liczby poziomów reprezentacji. W tym

przypadku: kwantyzacja to proces polegający na przypisaniu wartości analogowych do

najbliższych poziomów reprezentacji, co wiąże się z nieuniknioną i nieodwracalną utratą

informacji.

2. Techniki próbkowania ~by kobejn 669

Próbkowanie dolnopasmowe

Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty informacji

z powrotem do postaci analogowej, musi być spełniony warunek twierdzenia

Kotielnikowa-Shannona o próbkowaniu (tak zwany warunek Nyquista). Mówi on, że

częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma sygnału.

Próbkowanie pasmowe

Technika ta polega na takim wyborze częstotliwości próbkowania, aby podczas powielania

widma sygnału analogowego w wyniku próbkowania, nie zniekształcać widma składowej

użytecznej.

Próbkowanie pasmowe zmniejsza wymagania dotyczące szybkości oraz pojemności pamięci

przetwornika A/C.

Przyjmując, że częstotliwość f2 jest częstotliwością składowej nośnej, o wysokiej

częstotliwości, a szerokość pasma sygnału użytecznego wynosi 2*f1, to częstotliwość

próbkowania fp należy wybrać z zakresu obliczonego według zależności:

((2*f2-2*f1)/m)>=fp>=((2*f2+2*f1)/(m+1))

Optymalną częstotliwość próbkowania fpo, w środku akceptowanych pasm tej

częstotliwości, wyznacza zależność:

fpo=((f2-f1)/m)+((f2+f1)/(m+1))

Próbkowanie kwadraturowe

W przypadku sygnałów pasmowych, dla których częstotliwość środkowa jest znacznie większa

od szerokości ich pasma prókowanie z szybkością dwóktortnie większą od

częstotliwościmaksymalnej jest nieekonomiczne. Wiąże się to bowiem z wysokimi kosztami

konwertera A/C. Stąd też w systemach telekomunikacyjnych, gdzie tego typu sygnały

spotykane są bardzo często, stosuje się rozwiązania, które umożliwiają próbkowanie ze

znacznie mniejszymi szybkościami. Takim rozwiązaniem jest kwadraturowy konwerter A/C.

W tym przypadku sygnał jest jeszcze po stronie analogowej przekształcany do postaci

podstawowopasmowej(ulokowanej wokół pulsacji zerowej) tak, że konwersji A/C dokonujemy

przy już niewielkiej szybkości próbkowania.

Rodzaje kwantyzacji

Skalarna

kwantowane są niezależnie pojedyncze wartości

-równomierna (ang. uniform),

-nierównomierna (ang. nonuniform).

Przy kwantyzacji równomiernej różnica pomiędzy sąsiednimi poziomami decyzyjnymi

jest jednakowa, przy kwantyzacji nierównomiernej tak nie jest

Wektorowa

kwantowanych jest jednocześnie kilka wartości (co najmniej dwie).

3. Podstawowe właściwości wzroku i słuchu umożliwiające kompresję informacji ~by bpi

Kodowanie perceptualne dźwięku jest kodowaniem stratnym, stratną kompresją dźwięku.

Kompresja perceptualna jest oparta na właściwościach słuchu człowieka. Część informacji z

sygnału wejściowego jest tracona, jednak algorytm kompresji jest tak skonstruowany, aby straty te

były niezauważalne lub jak najmniej zauważalne dla człowieka.

Kompresja bezstratna jest nieefektywna ze względu na wysoką entropię informacji sygnału

fonicznego, dlatego też do kompresji dźwięku stosuje się kompresję stratną, zaś aby efekty strat

były jak najmniej dokuczliwe dla człowieka, stosuje się kompresję perceptualną.

To samo dotyczy również obrazu, który często (szczególnie zdjęcia) jest kodowany stratnie

perceptualnie, tj. w oparciu o właściwości wzroku człowieka, tak, aby straty były dla człowieka

niewidoczne lub jak najmniej widoczne.

Istnieją różne standardy kodowania perceptualnego:

• ATRAC - Adaptive Transform Acoustic Coding, stosowany w rejestratorach dźwięku wysokiej

jakości firmy Sony,

• AC-3, stosowany w HDTV (High Definition Television) i płytach DVD,

• PASC - Precission Adaptive Subband Coding, stosowany w magnetofonach cyforwych DCC

Philipsa i Matsushity,

• MUSICAM - Masking-pattern Universal Subband Integrated Coding And Multiplexing,

stosowany w radiofonii cyfrowej DAB (Digital Audio Broadcasting),

• MPEG - Moving Pictures Expert Group - do kodowania sygnału audiowizualnego na niskiej

przepływności binarnej.

właściwości oka ludzkiego - oko ludzkie-nie jest idealnym przetwornikiem, nie jest w stanie

dostrzec wszystkich detali w transmitowanych obrazach, a więc z obrazów tych można usunąć

część informacji nie powodując przy tym pogorszenia subiektywnej oceny jakości obrazu.

Właściwości oka ludzkiego wykorzystywano także w analogowych standardach telewizyjnych -

mniejsza rozdzielczość oka dla obrazów kolorowych niż monochromatycznych pozwala na ponad

dwukrotne ograniczenie pasma sygnału chrominancji w stosunku do pasma sygnału luminancji;

kodowanie percepcyjne wykorzystuje dwie właściwości słuchu ludzkiego - próg słyszalności i

zjawisko maskowania.

4. MAX przepustowość kanału telekomunikacyjnego ~by Miriv

Przepustowość (pojemność kanału, ang. throughput) w telekomunikacji i informatyce –

maksymalna ilość informacji (mierzonej w bitach), jaka może być przesyłana przez dany kanał

telekomunikacyjny lub łącze w jednostce czasu (mierzonej w sekundach).

Przepustowość mierzy się w bitach na sekundę (b/s)

Graniczną pojemność kanału wyliczamy na podstawie twierdzenia Shannona:

C=W*log2[1+(S/N)]

gdzie:

W – szerokość pasma (podawaną w Hz),

S/N – stosunek mocy sygnału do mocy szumów (obie wartości podawane w skali liniowej).

5. Przyczyny ograniczeń możliwości odbioru sygnałów analogowych i cyfrowych ~by Pawcio4

Ogólnie można wyróżnić następujące przyczyny pogorszenia jakości odbioru, związane

bezpośrednio z odbiornikiem:

 blokowanie silnym sygnałem,

 modulację skrośną,

 odpowiedzi niepożądane,

 intermodulacji.

Jeżeli telewizor wyposażony został w tuner DVB-T MPEG-2 oznacza to, iż odbiór sygnału

cyfrowej telewizji naziemnej w Polsce za pośrednictwem fabrycznie wbudowanego tunera nie jest

możliwy, gdyż urządzenie to nie obsługuje kodeka MPEG-4 (standardu kodowania cyfrowej emisji

naziemnej).

Przyczyną braku odbioru jest niedostateczny poziom odbieranego sygnału TV. Powinna być

zastosowana antena na dachu albo antena w inny sposób zamocowana na takiej wysokości, żeby

była zdolna do odbioru sygnału cyfrowego (tj. antena z wysokim zyskiem).Nie stosuje się anten

pokojowych do odbierania sygnału DVB-T/Digital, ponieważ najczęściej nie odbierają one

dostatecznie silnego sygnału dla cyfrowych TV. Zintegrowane cyfrowe TV wymagają

intensywności sygnału 85% lub lepszej. Jeżeli odbierany sygnał jest na poziomie 65% – 80%, to ten

problem jest zwykle rozwiązywany przez włączenie wzmacniacza sygnału pomiędzy gniazdkiem

antenowym i wejściem RF telewizora. Jeżeli poziom sygnału jest poniżej 60%, to antena TV musi

być zmodernizowana.

Podstawową przyczyną jest wykorzystanie (wg harmonogramu tymczasowe) bardzo wysokiej

częstotliwości (818 MHz) nadawania.

W związku z tym instalacje antenowe muszą być bezwzględnie wykonane w sposób profesjonalny.

Elementy instalacji muszą być przystosowane do pracy w tak wysokich częstotliwościach.

Każde odstępstwo od tych zasad może powodować problemy w odbiorze. Po pierwsze z powodu

wnikania w instalację sygnałów zakłócających, po wtóre za duże straty poziomu sygnału na

instalacji lub/i za mały zysk anteny.

Wiele osób posiada anteny tzw "siatkowe". Bardzo rzadko spotykane są takie anteny wykonane

zgodnie z normami. Ponadto dla poprawy działania wbudowywane są w nie prymitywne

wzmacniacze, które często umożliwiają w ogóle odbiór programów analogowych, ale utrudniają

odbiór cyfrowych. Niekiedy także wzbudzają się blokując w ten sposób odbiór sąsiadom nawet w

promieniu kilkudziesięciu metrów.

Niestety nie można przyjmować reguły, że jeśli mam bardzo dobry odbiór analogowy, to także

odbiór programów cyfrowych będzie poprawny. Bywa niekiedy wręcz odwrotnie. Przy złej jakości

programów analogowych może być poprawny odbiór programów cyfrowych, jeśli instalacja jest

wykonana poprawnie.

6. Rodzaje zabezpieczeń informacji przed błędami transmisji. ~by suchy99

Dwukrotne przesyłanie informacji

Ponieważ odbiornik "wie", iż informacja odebrana podwójnie, powinna być taka sama, może ją

sobie porównać. Na przedostatniej pozycji jest różnica. Teraz odbiornik wie już, iż odebrał dane z

błędem. Kanałem zwrotnym może poprosić nadajnik o powtórzenie ostatniej transmisji danych.

Zwróć uwagę, iż w tym systemie nie wiemy, które z dwóch odebranych słówek jest poprawne, a

które zawiera błąd. Sama różnica nie wystarcza do odtworzenia właściwej informacji. Dlatego taki

kod nazywamy kodem wykrywającym błędy - kodem detekcyjnym (ang. EDC - Error Detection

Code). Prawdopodobieństwo, iż błąd pojawi się w obu przekazach na tej samej pozycji (wtedy

słówka będą oba błędne, ale takie same, co spowoduje ich akceptację przez odbiornik), jest

naprawdę bardzo małe.

Bit parzystości

Polega to na tym, iż do przesyłanego słówka dodajemy jeden bit o takim stanie, aby liczba

wszystkich bitów o stanie 1 w tak powiększonym słowie informacyjnym była parzysta (czyli

podzielna przez 2). Załóżmy, iż przesyłamy słówka 4-bitowe. Poniżej przedstawiamy kilka

przykładów rozszerzania takich słówek do 5-bitowych z bitem parzystości.

Suma kontrolna

Polega ona na tym, iż kolejno przesyłane porcje danych traktujemy jak liczby binarne. Sumujemy je

ograniczając wynik do określonej liczby bitów (np. 8, 16, 32 lub 64). Otrzymaną w ten sposób sumę

dołączamy na koniec przesłanego bloku informacji. Odbiornik również tworzy sumę kontrolną

odbieranych danych. Następnie sprawdza swoją sumę z sumą odczytaną na końcu transmisji bloku

danych. Jeśli sumy się różnią, to znaczy, iż w odebranym bloku wystąpił błąd.

Adler-32

Algorytm Adler-32 polega na wyliczaniu dwóch sum kontrolnych, które nazwiemy A i B. Obie

sumy są 16-bitowe. Suma A powstaje przez zsumowanie modulo 65521 danych w bloku - suma ma

początkowo wartość 1. Suma B jest sumą modulo 65521 kolejnych wartości sumy A. Na końcu

sumy A i B łączy się w jedną sumę kontrolną 32 bitową - B zajmuje starsze 16 bitów, A zajmuje

młodsze. Użyta do operacji modulo liczba 65521 jest

największą liczbą pierwszą mniejszą od 216 = 65536.

Suma kontrolna Fletchera Jest to

bardzo podobny algorytm do sumy kontrolnej Adler-32. Różnica polega na zastąpieniu operacji

modulo 65521 operacją modulo 65535 (jest to wartość 16-bitowa, w której wszystkie 16 bitów

znajduje się w stanie 1). Sumy początkowe startują od wartości 65535.

7. Podstawowe rodzaje modulacji analogowych i cyfrowych ~by kubilho & ravaleks

Analogowe:

Modulacje amplitudy:

- AM – Modulacja amplitudy. Jest to nałożenie się fali sygnałowej na falę nośną, po wcześniejszym

dodaniu do niej składowej stałej (telewizja analogowa - wizja).

- SSB – Jest rodzajem modulacji AM, lecz tworzenie sygnału nadawanego jest procesem bardziej

złożonym. Wysyłany jest tylko zakres częstotliwości sygnałowych użytecznych (np. mowa).

Wysyłana jest tylko dodatnia część widma sygnału informacyjnego. W odbiorniku część ujemna

(urojona) jest odtwarzana. CB radio.

- DSB-SC – Jest to rodzaj modulacji AM lecz o większej sprawności. Sygnał informacyjny jest

nakładany na falę nośną lecz bez dodawania składowej stałej. Zyskuje się dzięki temu większą

sprawność ponieważ fala nośna jest usuwana ale pasmo pozostaje podwojonym pasmem

podstawowym.

Modulacja częstotliwości (FM):

czyli kodowanie informacji w fali nośnej przez zmiany jej chwilowej częstotliwości, w zależności

od sygnału wejściowego. Mniej podatna na zakłucenia, lepsza sprawność niż AM. Telewizja

analogowa – fonia, radio.

Modulacja fazy (PM):

Zmiana fazy sygnału nośnego w takt sygnału informacyjnego.

Cyfrowe:

• PSK

modulacja fazy (PM) dla sygnałów cyfrowych, czyli kluczowanie fazy PSK. Przy stałej

amplitudzie i częstotliwości harmonicznego sygnału nośnej stany charakterystyczne uzyskuje się

przez przesunięcie fazy w zależności od stanu informacji pierwotnej

• FSK

modulacja częstotliwości (FM) dla sygnałów cyfrowych, czyli kluczowanie z przesuwem

częstotliwości FSK. Przy stałej amplitudzie harmonicznego sygnału nośnego następuje zmiana

częstotliwości: niższej dla symbolu "zera logicznego" i wyższej dla "jedynki logicznej" informacji

binarnej.

• AM-PM

Modulacja QAM

Inną, powszechnie stosowaną metodą jest modulacja QAM (Quadrature Amplitude Modulation).

Jest to modulacja amplitudy dwóch nośnych przesuniętych względem siebie w fazie o 90°. QAM

reprezentuje więc grupę modulacji, w których w takt sygnału modulującego ulega zmianie zarówno

amplituda, jak i faza nośnej. Możliwe są rozmaite kombinacje, np. 16- i 32-wartościowe (rys. 5).

Modulacja QAM jest stosowana w modemach.

• ASK/PAM

• KODOWE

Systemy szerokopasmowe lub systemy z rozproszonym widmem (ang. spread spectrum) są to takie,

w których sygnał transmitowany jest w szerokim paśmie częstotliwości - setki do tysięcy razy

szerszym niż minimalne pasmo potrzebne do jego wysłania w przypadku konwencjonalnych metod.

W efekcie, energia transmitowanego sygnału jest rozproszona na szerokie spektrum. Z tego powodu

emitowana moc jest niska w każdym wąskim wycinku tego pasma i jest znacznie niższa niż w

przypadku systemów konwencjonalnych.

Dwie najpopularniejsze techniki rozpraszania widma to

DSSS

FHSS

Istnieją również inne mniej popularne

Pulsed-FM

UWB

8. Modulacje cyfrowe stosowane w kodekach AV ~by pitur1

OFDM (ang. Orthogonal Frequency-Division Multiplexing, Ortogonalne zwielokrotnianie w

dziedzinie częstotliwości) – metoda modulacji polegająca na jednoczesnej transmisji wielu

strumieni danych na ortogonalnych częstotliwościach nośnych.

Rozłożenie transmisji o dużej przepływności na kilka wolniejszych strumieni umożliwia

pracę systemu w kanałach, w których występuje zjawisko wielodrogowości. Jest szeroko

stosowana w technice dostępu do internetu ADSL czy systemie telewizji cyfrowej DVB-T i

DVB-T2.

Ogólne zasady działania

Zwiększanie przepływności transmisji danych napotyka na barierę w postaci zjawiska

wielodrogowości. Polega ono na tym, że sygnał radiowy dociera do odbiornika w kilku

kopiach, które są wzajemnie przesunięte w czasie. Jeżeli opóźnienia te są rzędu czasu trwania

pojedynczego symbolu lub dłuższe, to odbiornik demoduluje jednocześnie kilka różnych

bitów, zamiast oczekiwanego pojedynczego, co uniemożliwia lub znacznie utrudnia poprawne

odtworzenie danych. Modulacja OFDM jest sposobem na uniknięcie tego problemu. Zamiast

jednej szybkiej transmisji przesyła się wiele wolnych strumieni danych, które są przez to

mniej narażone na uszkodzenie w wyniku wielodrogowości. OFDM jest oparta na metodzie

współdzielenia pasma z podziałem w częstotliwości (FDM, z ang. frequency division

multiplexing) i transmisje odbywają się na oddzielnych podnośnych (ang. subcarriers).

Najczęściej stosowanym modulacjami podnośnych w OFDM są modulacje fazowe (PSK) i

oraz amplitudowo-fazowe (QAM). Odległości poszczególnych podnośnych dobrane są tak,

aby wyeliminować wzajemne zakłócenia.

Modulacje podnośnych OFDM!!

QPSK, 16QAM, 64QAM

Wykorzystanie: Systemy telewizji cyfrowej DVB-T, DVB-T2, DVB-H, T-DMB i ISDB-T.

9. Przyczyny, możliwości kompresji obrazów ruchomych ~by chorwat

Przyczyny:

-Jest stosowana głównie ze względu na ograniczenie prędkości przesyłania sygnałów (dźwięku,

grafiki, obrazów ruchomych i in.) i pojemności nośników informacji; polega na kodowaniu

danych, pozwalającym na redukcję nadmiaru informacji w przesyłanym strumieniu, a jednocześnie

umożliwiającym późniejsze ich odtworzenie.

(przykładowo)

Objętosc, która zajmuje jedna klatka przechwyconego, nieskompresowanego obrazu w

rozdzielczosci 640x480 w 16-bitowej głębi kolorów wynosi 614 kB,co daje nam przy

przechwytywaniu 25 klatek na sekundę, niemal 15,5 MB na sekundę. (w skrócie: Kompresja

obrazów ruchomych jest koniecznością ze względu na wielkość plików wideo )

-Wzrost możliwosci sprzętu powoduje wprost proporcjonalny wzrost wymagan klienta w stosunku

do swojego systemu moniotingu. To połaczenie rosnacych wymagan klienta, wraz z ogromną

iloscią miejsca potrzebnego do zapisu nieskompresowanego materiału, skutecznie umożliwia

rezygnacje ze stosowania kompresji obrazu.

Możliwości:

(wygooglałem, że najnowszym kodekiem do kompresji obrazów ruchomych jest mpeg-4, więc

zakładam, że chodzi o jego możliwości)

Standard MPEG-4 Visual umożliwia kodowanie hybrydowe naturalnych obrazów i wideo wraz z

syntetycznymi scenami (generowanymi przez komputer). Pozwala to na przykład na wirtualną

obecność uczestników wideokonferencji. W tym celu standardowe narzędzia wizualne wspierają

algorytmy kodowania naturalnych zdjęć i sekwencji wideo, a także narzędzia do obsługi kompresji

syntetycznych grafiki 2-D i 3-D.

Poniższe podrozdziały zawierają szczegółowy przegląd funkcjonalności narzędzi i algorytmów w

standardzie MPEG-4.

Obsługiwane formaty:

MPEG-4 wspiera następujące formaty i strumienie bitów:

-Strumienie bitów: zazwyczaj od 5 kbit / s, do ponad 1 Gbit / s

-Formaty: progresywne, także filmy z przeplotem

-Rozdzielczości: zazwyczaj od sub-QCIF do Studio-resolution (4k x 4k piksele)

Wydajność kompresji:

-Dla wszystkich wartości strumieni bitów algorytmy są bardzo wydajne. Obejmuje to kompaktowe

kodowania tekstury w wysokiej jakości, regulowane w zakresie dobrej jakości i z bardzo wysokim

współczynnikiem kompresji.

-Kompresja tekstur do mapowania sieci 2-D i 3-D.

-Dowolny dostęp do funkcji umożliwiających wstawienie pauzy, przewijanie do przodu i do tyłu.

Odporność na błędy:

Elastyczne dostosowanie do występowania błędów pozwala na szeroki dostęp do zdjęć i wideo,

oraz przesyłania mediów w szerokim zakresie. Jest to możliwe, dzięki funkcjonowaniu algorytmów

kompresji obrazów i wideo w środowiskach narażonych na błąd niskiej jakości (tj. mniej niż 64

Kb / s). Istnieją narzędzia, które są odpowiednie do używania standardu przy paśmie o ograniczonej

przepustowości i są one odporne na błąd dostępu do sieci.

10. Pełny schemat blokowy systemu kodowego ~by Merfolk

11. Systemy transmisji fonii cyfrowej w TV analogowej ~by Vbrake

(Generalnie znalazłem tylko 2 systemy, co jest dosyć podejrzane.)

a) System NICAM (Near Instantaneous Companded Audio Multiplex) – System ten realizuje

transmisję dwóch niezależnych kanałów dźwiękowych. Kanały te mogą składać się na sygnał

stereofoniczny, stanowić dwie oddzielne ścieżki dźwiękowe lub przenosić dane z przepustowością

352 kb/s każdy. Odbiornik telewizyjny przystosowany do odbioru tych sygnałów powinien być

wyposażony w demodulator DQPSK i dekoder sygnału NICAM. System ten zapewnia pasmo

sygnału audio 40 Hz -15 kHz przy częstotliwości próbkowania 32kHz

b) Dolby Surround – system dźwięku przestrzennego A/52 stworzony przez firmę Dolby

Laboratories Inc., do powszechnej dostępności wprowadzony w roku 1982 i od tamtej pory

stosowany powszechnie w salach kinowych oraz mieszkaniach prywatnych. System ten działa przy

użyciu procesora Dolby, w którym odbywają się matematyczne kalkulacje mające na celu

urealistycznienie dźwięku oraz poprawienie jego jakości i płynności.

12. Kodeki obrazów statycznych- parametry i zasada działania ~by regis90

Kompresja obrazów cyfrowych pozwala na zmniejszenie rozmiaru danych opisujących obraz.

Zależnie od tego, czy po dekompresji możliwe jest odtworzenie idealnego obrazu źródłowego, czy

też dane zostaną częściowo zmienione (przez usunięcie drobnych szczegółów lub dodanie

artefaktycznych elementów) dzielimy metody kompresji na:

stratną

-JPEG

-JPEG 2000

-JNG

bezstratną

-BMP

-PNG

-GIF

Zasada działania kompresji stratnej:

-obraz jest dzielony na bloki 8x8 lub 16x16

-każdy blok poddawany jest DCT (dyskretna transformata cosinusowa)

-współczynniki DCT są kwantowane (zaokrąglane do pewnych wartości)

-skwantowane współczynniki są kodowane bezstratnie

Parametry:

(Nie jestem pewien co do parametrów ale chodzi chyba o:)

-stopień kompresji

-przepływność (bitrate)

-tryb pracy wydajność/jakość

-liczba przebiegów

-rozdzielczość?

13. Kodeki obrazów dynamicznych- parametry i zasada działania ~by chorwat &

jarek2499

Zasada działania:

Kodeki obrazów dynamicznych, na przykład liczne warianty MPEG, redukują ilość danych, łącząc

ze sobą sekwencje z wielu pojedynczych obrazów. Kodek zapisuje w całości tylko obraz pierwszy,

a z następnych tylko te jego części, które różnią się od obrazu poprzedniego. Tak więc dla

przykładu: dla nagrania startującego samolotu kodek zapisuje tylko ruchy samolotu, pomijając

elementy nieruchome, takie jak tło.

Parametry:

• tryb kodowania

• szybkość kompresji

• jakość kompresji

• dopuszczalne obciążenie CPU podczas kompresji

14. Kodeki foniczne- parametry i zasada działania ~by Miriv

AAC (ang. Advanced Audio Coding) – algorytm stratnej kompresji danych dźwiękowych. Format

AAC zaprojektowany został jako następca MP3, oferujący lepszą jakość dźwięku przy podobnym

rozmiarze danych.

Kompresja AAC jest modularna i oferuje standardowo cztery profile:

-LC,

-MAIN,

-SRS,

-LTP.

Rozwinieciem AAC jest AAC+.

FLAC (ang. Free Lossless Audio Codec) – format bezstratnej kompresji dźwięku z rodziny

kodeków Ogg. Format ten jest rozwijany.

W przeciwieństwie do stratnych kodeków dźwięku takich jak Vorbis, MP3 i AAC, kodek FLAC nie

usuwa żadnych danych ze strumienia audio, dzięki czemu po dekompresji otrzymujemy dźwięk

identyczny z pierwowzorem.

MP3 (MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego

uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3.

Standard MP3 wykorzystuje ponadto model psychoakustyczny w celu osiągnięcia pożądanego

stopnia kompresjii stratnej. Polega to na tym, że zostają usunięte te informacje o dźwięku, które są

niezauważalne lub mało istotne dla człowieka, w sensie odbioru słuchowego. Z modelu

psychoakustycznego wynika, że człowiek najlepiej słyszy dźwięki w okolicach 2-4 kHz.

WAV (ang. wave form audio format) — format plików dźwiękowych stworzony przez Microsoft

oraz IBM.

Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach audio takich jak

odtwarzacze i cyfrowe dyktafony.

WMA(Windows Media Audio) - format kompresji dźwięku stworzony przez Microsoft. W

zamierzeniach producenta ma konkurować z formatem MP3.

Wyszukiwarka

Podobne podstrony:
Montaż dzwieku i obrazu
Kompresja dzwieku i obrazu wideo Real World
07 Synteza dźwięku i obrazu MIDI w syntezie dzwieku
Cw11, Politechnika Wrocławska - Materiały, fizyka 2, paczka 1, 11 modul younga predkosc dzwieku
Materiały na Systemy sensoryczne i wizyjne analiza obrazu i dźwięku 1
11 01 2013 dźwięki wokół nas
11 Nagrywanie i obróbka warstwy dźwiękowej filmów
NanDUB rozdzial obrazu i dzwieku
12 Instalowanie systemów projekcji obrazu i dźwięku
Zarz[1] finan przeds 11 analiza wskaz
11 Siłowniki
11 BIOCHEMIA horyzontalny transfer genów
PKM NOWY W T II 11
wyklad 11

więcej podobnych podstron