Kodeki dźwięku i obrazu 2011/2012
1. Podstawowe zasady próbkowania i kwantyzacji sygnału analogowego. ~by pilot_1804
• Próbkowanie (kwantowanie w czasie) - proces tworzenia sygnału dyskretnego, reprezentującego
sygnał ciągły za pomocą ciągu wartości nazywanych próbkami. Zwykle jest jednym z etapów
przetwarzania sygnału analogowego na cyfrowy.
Zasada: Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty informacji z
powrotem do postaci analogowej, musi być spełniony warunek twierdzenia Kotielnikowa-Shannona
o próbkowaniu: częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma
sygnału. Jeśli ten warunek nie jest spełniony, wówczas występuje zjawisko aliasingu.
• Kwantyzacja to nieodwracalne nieliniowe odwzorowanie statyczne zmniejszające dokładność
danych przez ograniczenie ich zbioru wartości.
Zasada: Sygnał analogowy może przyjmować dowolne wartości, systemy cyfrowe natomiast są w
stanie przetwarzać tylko sygnały reprezentowane słowami o skończonej liczbie bitów. Taka
reprezentacja wymaga zatem skończonej liczby poziomów reprezentacji. W tym
przypadku: kwantyzacja to proces polegający na przypisaniu wartości analogowych do
najbliższych poziomów reprezentacji, co wiąże się z nieuniknioną i nieodwracalną utratą
informacji.
2. Techniki próbkowania ~by kobejn 669
Próbkowanie dolnopasmowe
Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty informacji
z powrotem do postaci analogowej, musi być spełniony warunek twierdzenia
Kotielnikowa-Shannona o próbkowaniu (tak zwany warunek Nyquista). Mówi on, że
częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma sygnału.
Próbkowanie pasmowe
Technika ta polega na takim wyborze częstotliwości próbkowania, aby podczas powielania
widma sygnału analogowego w wyniku próbkowania, nie zniekształcać widma składowej
użytecznej.
Próbkowanie pasmowe zmniejsza wymagania dotyczące szybkości oraz pojemności pamięci
przetwornika A/C.
Przyjmując, że częstotliwość f2 jest częstotliwością składowej nośnej, o wysokiej
częstotliwości, a szerokość pasma sygnału użytecznego wynosi 2*f1, to częstotliwość
próbkowania fp należy wybrać z zakresu obliczonego według zależności:
((2*f2-2*f1)/m)>=fp>=((2*f2+2*f1)/(m+1))
Optymalną częstotliwość próbkowania fpo, w środku akceptowanych pasm tej
częstotliwości, wyznacza zależność:
fpo=((f2-f1)/m)+((f2+f1)/(m+1))
Próbkowanie kwadraturowe
W przypadku sygnałów pasmowych, dla których częstotliwość środkowa jest znacznie większa
od szerokości ich pasma prókowanie z szybkością dwóktortnie większą od
częstotliwościmaksymalnej jest nieekonomiczne. Wiąże się to bowiem z wysokimi kosztami
konwertera A/C. Stąd też w systemach telekomunikacyjnych, gdzie tego typu sygnały
spotykane są bardzo często, stosuje się rozwiązania, które umożliwiają próbkowanie ze
znacznie mniejszymi szybkościami. Takim rozwiązaniem jest kwadraturowy konwerter A/C.
W tym przypadku sygnał jest jeszcze po stronie analogowej przekształcany do postaci
podstawowopasmowej(ulokowanej wokół pulsacji zerowej) tak, że konwersji A/C dokonujemy
przy już niewielkiej szybkości próbkowania.
Rodzaje kwantyzacji
Skalarna
kwantowane są niezależnie pojedyncze wartości
-równomierna (ang. uniform),
-nierównomierna (ang. nonuniform).
Przy kwantyzacji równomiernej różnica pomiędzy sąsiednimi poziomami decyzyjnymi
jest jednakowa, przy kwantyzacji nierównomiernej tak nie jest
Wektorowa
kwantowanych jest jednocześnie kilka wartości (co najmniej dwie).
3. Podstawowe właściwości wzroku i słuchu umożliwiające kompresję informacji ~by bpi
Kodowanie perceptualne dźwięku jest kodowaniem stratnym, stratną kompresją dźwięku.
Kompresja perceptualna jest oparta na właściwościach słuchu człowieka. Część informacji z
sygnału wejściowego jest tracona, jednak algorytm kompresji jest tak skonstruowany, aby straty te
były niezauważalne lub jak najmniej zauważalne dla człowieka.
Kompresja bezstratna jest nieefektywna ze względu na wysoką entropię informacji sygnału
fonicznego, dlatego też do kompresji dźwięku stosuje się kompresję stratną, zaś aby efekty strat
były jak najmniej dokuczliwe dla człowieka, stosuje się kompresję perceptualną.
To samo dotyczy również obrazu, który często (szczególnie zdjęcia) jest kodowany stratnie
perceptualnie, tj. w oparciu o właściwości wzroku człowieka, tak, aby straty były dla człowieka
niewidoczne lub jak najmniej widoczne.
Istnieją różne standardy kodowania perceptualnego:
• ATRAC - Adaptive Transform Acoustic Coding, stosowany w rejestratorach dźwięku wysokiej
jakości firmy Sony,
• AC-3, stosowany w HDTV (High Definition Television) i płytach DVD,
• PASC - Precission Adaptive Subband Coding, stosowany w magnetofonach cyforwych DCC
Philipsa i Matsushity,
• MUSICAM - Masking-pattern Universal Subband Integrated Coding And Multiplexing,
stosowany w radiofonii cyfrowej DAB (Digital Audio Broadcasting),
• MPEG - Moving Pictures Expert Group - do kodowania sygnału audiowizualnego na niskiej
przepływności binarnej.
właściwości oka ludzkiego - oko ludzkie-nie jest idealnym przetwornikiem, nie jest w stanie
dostrzec wszystkich detali w transmitowanych obrazach, a więc z obrazów tych można usunąć
część informacji nie powodując przy tym pogorszenia subiektywnej oceny jakości obrazu.
Właściwości oka ludzkiego wykorzystywano także w analogowych standardach telewizyjnych -
mniejsza rozdzielczość oka dla obrazów kolorowych niż monochromatycznych pozwala na ponad
dwukrotne ograniczenie pasma sygnału chrominancji w stosunku do pasma sygnału luminancji;
kodowanie percepcyjne wykorzystuje dwie właściwości słuchu ludzkiego - próg słyszalności i
zjawisko maskowania.
4. MAX przepustowość kanału telekomunikacyjnego ~by Miriv
Przepustowość (pojemność kanału, ang. throughput) w telekomunikacji i informatyce –
maksymalna ilość informacji (mierzonej w bitach), jaka może być przesyłana przez dany kanał
telekomunikacyjny lub łącze w jednostce czasu (mierzonej w sekundach).
Przepustowość mierzy się w bitach na sekundę (b/s)
Graniczną pojemność kanału wyliczamy na podstawie twierdzenia Shannona:
C=W*log2[1+(S/N)]
gdzie:
W – szerokość pasma (podawaną w Hz),
S/N – stosunek mocy sygnału do mocy szumów (obie wartości podawane w skali liniowej).
5. Przyczyny ograniczeń możliwości odbioru sygnałów analogowych i cyfrowych ~by Pawcio4
Ogólnie można wyróżnić następujące przyczyny pogorszenia jakości odbioru, związane
bezpośrednio z odbiornikiem:
blokowanie silnym sygnałem,
modulację skrośną,
odpowiedzi niepożądane,
intermodulacji.
Jeżeli telewizor wyposażony został w tuner DVB-T MPEG-2 oznacza to, iż odbiór sygnału
cyfrowej telewizji naziemnej w Polsce za pośrednictwem fabrycznie wbudowanego tunera nie jest
możliwy, gdyż urządzenie to nie obsługuje kodeka MPEG-4 (standardu kodowania cyfrowej emisji
naziemnej).
Przyczyną braku odbioru jest niedostateczny poziom odbieranego sygnału TV. Powinna być
zastosowana antena na dachu albo antena w inny sposób zamocowana na takiej wysokości, żeby
była zdolna do odbioru sygnału cyfrowego (tj. antena z wysokim zyskiem).Nie stosuje się anten
pokojowych do odbierania sygnału DVB-T/Digital, ponieważ najczęściej nie odbierają one
dostatecznie silnego sygnału dla cyfrowych TV. Zintegrowane cyfrowe TV wymagają
intensywności sygnału 85% lub lepszej. Jeżeli odbierany sygnał jest na poziomie 65% – 80%, to ten
problem jest zwykle rozwiązywany przez włączenie wzmacniacza sygnału pomiędzy gniazdkiem
antenowym i wejściem RF telewizora. Jeżeli poziom sygnału jest poniżej 60%, to antena TV musi
być zmodernizowana.
Podstawową przyczyną jest wykorzystanie (wg harmonogramu tymczasowe) bardzo wysokiej
częstotliwości (818 MHz) nadawania.
W związku z tym instalacje antenowe muszą być bezwzględnie wykonane w sposób profesjonalny.
Elementy instalacji muszą być przystosowane do pracy w tak wysokich częstotliwościach.
Każde odstępstwo od tych zasad może powodować problemy w odbiorze. Po pierwsze z powodu
wnikania w instalację sygnałów zakłócających, po wtóre za duże straty poziomu sygnału na
instalacji lub/i za mały zysk anteny.
Wiele osób posiada anteny tzw "siatkowe". Bardzo rzadko spotykane są takie anteny wykonane
zgodnie z normami. Ponadto dla poprawy działania wbudowywane są w nie prymitywne
wzmacniacze, które często umożliwiają w ogóle odbiór programów analogowych, ale utrudniają
odbiór cyfrowych. Niekiedy także wzbudzają się blokując w ten sposób odbiór sąsiadom nawet w
promieniu kilkudziesięciu metrów.
Niestety nie można przyjmować reguły, że jeśli mam bardzo dobry odbiór analogowy, to także
odbiór programów cyfrowych będzie poprawny. Bywa niekiedy wręcz odwrotnie. Przy złej jakości
programów analogowych może być poprawny odbiór programów cyfrowych, jeśli instalacja jest
wykonana poprawnie.
6. Rodzaje zabezpieczeń informacji przed błędami transmisji. ~by suchy99
Dwukrotne przesyłanie informacji
Ponieważ odbiornik "wie", iż informacja odebrana podwójnie, powinna być taka sama, może ją
sobie porównać. Na przedostatniej pozycji jest różnica. Teraz odbiornik wie już, iż odebrał dane z
błędem. Kanałem zwrotnym może poprosić nadajnik o powtórzenie ostatniej transmisji danych.
Zwróć uwagę, iż w tym systemie nie wiemy, które z dwóch odebranych słówek jest poprawne, a
które zawiera błąd. Sama różnica nie wystarcza do odtworzenia właściwej informacji. Dlatego taki
kod nazywamy kodem wykrywającym błędy - kodem detekcyjnym (ang. EDC - Error Detection
Code). Prawdopodobieństwo, iż błąd pojawi się w obu przekazach na tej samej pozycji (wtedy
słówka będą oba błędne, ale takie same, co spowoduje ich akceptację przez odbiornik), jest
naprawdę bardzo małe.
Bit parzystości
Polega to na tym, iż do przesyłanego słówka dodajemy jeden bit o takim stanie, aby liczba
wszystkich bitów o stanie 1 w tak powiększonym słowie informacyjnym była parzysta (czyli
podzielna przez 2). Załóżmy, iż przesyłamy słówka 4-bitowe. Poniżej przedstawiamy kilka
przykładów rozszerzania takich słówek do 5-bitowych z bitem parzystości.
Suma kontrolna
Polega ona na tym, iż kolejno przesyłane porcje danych traktujemy jak liczby binarne. Sumujemy je
ograniczając wynik do określonej liczby bitów (np. 8, 16, 32 lub 64). Otrzymaną w ten sposób sumę
dołączamy na koniec przesłanego bloku informacji. Odbiornik również tworzy sumę kontrolną
odbieranych danych. Następnie sprawdza swoją sumę z sumą odczytaną na końcu transmisji bloku
danych. Jeśli sumy się różnią, to znaczy, iż w odebranym bloku wystąpił błąd.
Adler-32
Algorytm Adler-32 polega na wyliczaniu dwóch sum kontrolnych, które nazwiemy A i B. Obie
sumy są 16-bitowe. Suma A powstaje przez zsumowanie modulo 65521 danych w bloku - suma ma
początkowo wartość 1. Suma B jest sumą modulo 65521 kolejnych wartości sumy A. Na końcu
sumy A i B łączy się w jedną sumę kontrolną 32 bitową - B zajmuje starsze 16 bitów, A zajmuje
młodsze. Użyta do operacji modulo liczba 65521 jest
największą liczbą pierwszą mniejszą od 216 = 65536.
Suma kontrolna Fletchera Jest to
bardzo podobny algorytm do sumy kontrolnej Adler-32. Różnica polega na zastąpieniu operacji
modulo 65521 operacją modulo 65535 (jest to wartość 16-bitowa, w której wszystkie 16 bitów
znajduje się w stanie 1). Sumy początkowe startują od wartości 65535.
7. Podstawowe rodzaje modulacji analogowych i cyfrowych ~by kubilho & ravaleks
Analogowe:
Modulacje amplitudy:
- AM – Modulacja amplitudy. Jest to nałożenie się fali sygnałowej na falę nośną, po wcześniejszym
dodaniu do niej składowej stałej (telewizja analogowa - wizja).
- SSB – Jest rodzajem modulacji AM, lecz tworzenie sygnału nadawanego jest procesem bardziej
złożonym. Wysyłany jest tylko zakres częstotliwości sygnałowych użytecznych (np. mowa).
Wysyłana jest tylko dodatnia część widma sygnału informacyjnego. W odbiorniku część ujemna
(urojona) jest odtwarzana. CB radio.
- DSB-SC – Jest to rodzaj modulacji AM lecz o większej sprawności. Sygnał informacyjny jest
nakładany na falę nośną lecz bez dodawania składowej stałej. Zyskuje się dzięki temu większą
sprawność ponieważ fala nośna jest usuwana ale pasmo pozostaje podwojonym pasmem
podstawowym.
Modulacja częstotliwości (FM):
czyli kodowanie informacji w fali nośnej przez zmiany jej chwilowej częstotliwości, w zależności
od sygnału wejściowego. Mniej podatna na zakłucenia, lepsza sprawność niż AM. Telewizja
analogowa – fonia, radio.
Modulacja fazy (PM):
Zmiana fazy sygnału nośnego w takt sygnału informacyjnego.
Cyfrowe:
• PSK
modulacja fazy (PM) dla sygnałów cyfrowych, czyli kluczowanie fazy PSK. Przy stałej
amplitudzie i częstotliwości harmonicznego sygnału nośnej stany charakterystyczne uzyskuje się
przez przesunięcie fazy w zależności od stanu informacji pierwotnej
• FSK
modulacja częstotliwości (FM) dla sygnałów cyfrowych, czyli kluczowanie z przesuwem
częstotliwości FSK. Przy stałej amplitudzie harmonicznego sygnału nośnego następuje zmiana
częstotliwości: niższej dla symbolu "zera logicznego" i wyższej dla "jedynki logicznej" informacji
binarnej.
• AM-PM
Modulacja QAM
Inną, powszechnie stosowaną metodą jest modulacja QAM (Quadrature Amplitude Modulation).
Jest to modulacja amplitudy dwóch nośnych przesuniętych względem siebie w fazie o 90°. QAM
reprezentuje więc grupę modulacji, w których w takt sygnału modulującego ulega zmianie zarówno
amplituda, jak i faza nośnej. Możliwe są rozmaite kombinacje, np. 16- i 32-wartościowe (rys. 5).
Modulacja QAM jest stosowana w modemach.
• ASK/PAM
• KODOWE
Systemy szerokopasmowe lub systemy z rozproszonym widmem (ang. spread spectrum) są to takie,
w których sygnał transmitowany jest w szerokim paśmie częstotliwości - setki do tysięcy razy
szerszym niż minimalne pasmo potrzebne do jego wysłania w przypadku konwencjonalnych metod.
W efekcie, energia transmitowanego sygnału jest rozproszona na szerokie spektrum. Z tego powodu
emitowana moc jest niska w każdym wąskim wycinku tego pasma i jest znacznie niższa niż w
przypadku systemów konwencjonalnych.
Dwie najpopularniejsze techniki rozpraszania widma to
DSSS
FHSS
Istnieją również inne mniej popularne
Pulsed-FM
UWB
8. Modulacje cyfrowe stosowane w kodekach AV ~by pitur1
OFDM (ang. Orthogonal Frequency-Division Multiplexing, Ortogonalne zwielokrotnianie w
dziedzinie częstotliwości) – metoda modulacji polegająca na jednoczesnej transmisji wielu
strumieni danych na ortogonalnych częstotliwościach nośnych.
Rozłożenie transmisji o dużej przepływności na kilka wolniejszych strumieni umożliwia
pracę systemu w kanałach, w których występuje zjawisko wielodrogowości. Jest szeroko
stosowana w technice dostępu do internetu ADSL czy systemie telewizji cyfrowej DVB-T i
DVB-T2.
Ogólne zasady działania
Zwiększanie przepływności transmisji danych napotyka na barierę w postaci zjawiska
wielodrogowości. Polega ono na tym, że sygnał radiowy dociera do odbiornika w kilku
kopiach, które są wzajemnie przesunięte w czasie. Jeżeli opóźnienia te są rzędu czasu trwania
pojedynczego symbolu lub dłuższe, to odbiornik demoduluje jednocześnie kilka różnych
bitów, zamiast oczekiwanego pojedynczego, co uniemożliwia lub znacznie utrudnia poprawne
odtworzenie danych. Modulacja OFDM jest sposobem na uniknięcie tego problemu. Zamiast
jednej szybkiej transmisji przesyła się wiele wolnych strumieni danych, które są przez to
mniej narażone na uszkodzenie w wyniku wielodrogowości. OFDM jest oparta na metodzie
współdzielenia pasma z podziałem w częstotliwości (FDM, z ang. frequency division
multiplexing) i transmisje odbywają się na oddzielnych podnośnych (ang. subcarriers).
Najczęściej stosowanym modulacjami podnośnych w OFDM są modulacje fazowe (PSK) i
oraz amplitudowo-fazowe (QAM). Odległości poszczególnych podnośnych dobrane są tak,
aby wyeliminować wzajemne zakłócenia.
Modulacje podnośnych OFDM!!
QPSK, 16QAM, 64QAM
Wykorzystanie: Systemy telewizji cyfrowej DVB-T, DVB-T2, DVB-H, T-DMB i ISDB-T.
9. Przyczyny, możliwości kompresji obrazów ruchomych ~by chorwat
Przyczyny:
-Jest stosowana głównie ze względu na ograniczenie prędkości przesyłania sygnałów (dźwięku,
grafiki, obrazów ruchomych i in.) i pojemności nośników informacji; polega na kodowaniu
danych, pozwalającym na redukcję nadmiaru informacji w przesyłanym strumieniu, a jednocześnie
umożliwiającym późniejsze ich odtworzenie.
(przykładowo)
Objętosc, która zajmuje jedna klatka przechwyconego, nieskompresowanego obrazu w
rozdzielczosci 640x480 w 16-bitowej głębi kolorów wynosi 614 kB,co daje nam przy
przechwytywaniu 25 klatek na sekundę, niemal 15,5 MB na sekundę. (w skrócie: Kompresja
obrazów ruchomych jest koniecznością ze względu na wielkość plików wideo )
-Wzrost możliwosci sprzętu powoduje wprost proporcjonalny wzrost wymagan klienta w stosunku
do swojego systemu moniotingu. To połaczenie rosnacych wymagan klienta, wraz z ogromną
iloscią miejsca potrzebnego do zapisu nieskompresowanego materiału, skutecznie umożliwia
rezygnacje ze stosowania kompresji obrazu.
Możliwości:
(wygooglałem, że najnowszym kodekiem do kompresji obrazów ruchomych jest mpeg-4, więc
zakładam, że chodzi o jego możliwości)
Standard MPEG-4 Visual umożliwia kodowanie hybrydowe naturalnych obrazów i wideo wraz z
syntetycznymi scenami (generowanymi przez komputer). Pozwala to na przykład na wirtualną
obecność uczestników wideokonferencji. W tym celu standardowe narzędzia wizualne wspierają
algorytmy kodowania naturalnych zdjęć i sekwencji wideo, a także narzędzia do obsługi kompresji
syntetycznych grafiki 2-D i 3-D.
Poniższe podrozdziały zawierają szczegółowy przegląd funkcjonalności narzędzi i algorytmów w
standardzie MPEG-4.
Obsługiwane formaty:
MPEG-4 wspiera następujące formaty i strumienie bitów:
-Strumienie bitów: zazwyczaj od 5 kbit / s, do ponad 1 Gbit / s
-Formaty: progresywne, także filmy z przeplotem
-Rozdzielczości: zazwyczaj od sub-QCIF do Studio-resolution (4k x 4k piksele)
Wydajność kompresji:
-Dla wszystkich wartości strumieni bitów algorytmy są bardzo wydajne. Obejmuje to kompaktowe
kodowania tekstury w wysokiej jakości, regulowane w zakresie dobrej jakości i z bardzo wysokim
współczynnikiem kompresji.
-Kompresja tekstur do mapowania sieci 2-D i 3-D.
-Dowolny dostęp do funkcji umożliwiających wstawienie pauzy, przewijanie do przodu i do tyłu.
Odporność na błędy:
Elastyczne dostosowanie do występowania błędów pozwala na szeroki dostęp do zdjęć i wideo,
oraz przesyłania mediów w szerokim zakresie. Jest to możliwe, dzięki funkcjonowaniu algorytmów
kompresji obrazów i wideo w środowiskach narażonych na błąd niskiej jakości (tj. mniej niż 64
Kb / s). Istnieją narzędzia, które są odpowiednie do używania standardu przy paśmie o ograniczonej
przepustowości i są one odporne na błąd dostępu do sieci.
10. Pełny schemat blokowy systemu kodowego ~by Merfolk
11. Systemy transmisji fonii cyfrowej w TV analogowej ~by Vbrake
(Generalnie znalazłem tylko 2 systemy, co jest dosyć podejrzane.)
a) System NICAM (Near Instantaneous Companded Audio Multiplex) – System ten realizuje
transmisję dwóch niezależnych kanałów dźwiękowych. Kanały te mogą składać się na sygnał
stereofoniczny, stanowić dwie oddzielne ścieżki dźwiękowe lub przenosić dane z przepustowością
352 kb/s każdy. Odbiornik telewizyjny przystosowany do odbioru tych sygnałów powinien być
wyposażony w demodulator DQPSK i dekoder sygnału NICAM. System ten zapewnia pasmo
sygnału audio 40 Hz -15 kHz przy częstotliwości próbkowania 32kHz
b) Dolby Surround – system dźwięku przestrzennego A/52 stworzony przez firmę Dolby
Laboratories Inc., do powszechnej dostępności wprowadzony w roku 1982 i od tamtej pory
stosowany powszechnie w salach kinowych oraz mieszkaniach prywatnych. System ten działa przy
użyciu procesora Dolby, w którym odbywają się matematyczne kalkulacje mające na celu
urealistycznienie dźwięku oraz poprawienie jego jakości i płynności.
12. Kodeki obrazów statycznych- parametry i zasada działania ~by regis90
Kompresja obrazów cyfrowych pozwala na zmniejszenie rozmiaru danych opisujących obraz.
Zależnie od tego, czy po dekompresji możliwe jest odtworzenie idealnego obrazu źródłowego, czy
też dane zostaną częściowo zmienione (przez usunięcie drobnych szczegółów lub dodanie
artefaktycznych elementów) dzielimy metody kompresji na:
stratną
-JPEG
-JPEG 2000
-JNG
bezstratną
-BMP
-PNG
-GIF
Zasada działania kompresji stratnej:
-obraz jest dzielony na bloki 8x8 lub 16x16
-każdy blok poddawany jest DCT (dyskretna transformata cosinusowa)
-współczynniki DCT są kwantowane (zaokrąglane do pewnych wartości)
-skwantowane współczynniki są kodowane bezstratnie
Parametry:
(Nie jestem pewien co do parametrów ale chodzi chyba o:)
-stopień kompresji
-przepływność (bitrate)
-tryb pracy wydajność/jakość
-liczba przebiegów
-rozdzielczość?
13. Kodeki obrazów dynamicznych- parametry i zasada działania ~by chorwat &
jarek2499
Zasada działania:
Kodeki obrazów dynamicznych, na przykład liczne warianty MPEG, redukują ilość danych, łącząc
ze sobą sekwencje z wielu pojedynczych obrazów. Kodek zapisuje w całości tylko obraz pierwszy,
a z następnych tylko te jego części, które różnią się od obrazu poprzedniego. Tak więc dla
przykładu: dla nagrania startującego samolotu kodek zapisuje tylko ruchy samolotu, pomijając
elementy nieruchome, takie jak tło.
Parametry:
• tryb kodowania
• szybkość kompresji
• jakość kompresji
• dopuszczalne obciążenie CPU podczas kompresji
14. Kodeki foniczne- parametry i zasada działania ~by Miriv
AAC (ang. Advanced Audio Coding) – algorytm stratnej kompresji danych dźwiękowych. Format
AAC zaprojektowany został jako następca MP3, oferujący lepszą jakość dźwięku przy podobnym
rozmiarze danych.
Kompresja AAC jest modularna i oferuje standardowo cztery profile:
-LC,
-MAIN,
-SRS,
-LTP.
Rozwinieciem AAC jest AAC+.
FLAC (ang. Free Lossless Audio Codec) – format bezstratnej kompresji dźwięku z rodziny
kodeków Ogg. Format ten jest rozwijany.
W przeciwieństwie do stratnych kodeków dźwięku takich jak Vorbis, MP3 i AAC, kodek FLAC nie
usuwa żadnych danych ze strumienia audio, dzięki czemu po dekompresji otrzymujemy dźwięk
identyczny z pierwowzorem.
MP3 (MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego
uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3.
Standard MP3 wykorzystuje ponadto model psychoakustyczny w celu osiągnięcia pożądanego
stopnia kompresjii stratnej. Polega to na tym, że zostają usunięte te informacje o dźwięku, które są
niezauważalne lub mało istotne dla człowieka, w sensie odbioru słuchowego. Z modelu
psychoakustycznego wynika, że człowiek najlepiej słyszy dźwięki w okolicach 2-4 kHz.
WAV (ang. wave form audio format) — format plików dźwiękowych stworzony przez Microsoft
oraz IBM.
Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach audio takich jak
odtwarzacze i cyfrowe dyktafony.
WMA(Windows Media Audio) - format kompresji dźwięku stworzony przez Microsoft. W
zamierzeniach producenta ma konkurować z formatem MP3.