Strumienie wideo charakterystyki, kodowanie, kontenery
TECHNOLOGIA INFORMACYJNA
GRAFIKA 3D A STRUMIENIE WIDEO
茵 Grafika tr贸jwymiarowa pozwala tworzy膰 obrazy
ruchome pseudorealistyczne wykorzystuj膮c w
tym celu mo偶liwo艣ci wsp贸艂czesnych kart
graficznych - pos艂uguje si臋 opisem i manipulacj膮
obiektami 艣wiata 3D kt贸ry nast臋pnie jest
wy艣wietlany w projekcji p艂askiej - przy
odpowiednio szybkich komputerach tworz膮c
wra偶enie p艂ynnej sekwencji wideo
茵 Strumie艅 wideo korzysta z klasycznej techniki
projekcji poklatkowej ca艂ej sceny - ka偶da klatka
musi by膰 w odpowiedni spos贸b zapisana aby
p贸zniej mo偶liwe by艂o jej pokazanie
WPROWADZENIE
茵 Post臋p technologiczny i d膮偶enie do perfekcji w
multimediach owocuje dziesi膮tkami nowych
format贸w i standard贸w cyfrowego wideo
茵 Otrzymujemy coraz pojemniejsze no艣niki
danych, a grupy specjalist贸w w dziedzinie
przetwarzania sygna艂贸w dostarczaj膮 coraz
wydajniejsze algorytmy kompresji obrazu i
dzwi臋ku
茵 Pewne idee pomimo zmiany technologii i
sta艂ego post臋pu w dziedzinie multimedi贸w nie
uleg艂y jednak wi臋kszym zmianom
WPROWADZENIE
茵 Ostatnie lata rozwoju multimedi贸w to
prawdziwy boom w zakresie stopnia kompresji
i jednocze艣nie zwi臋kszania jako艣ci strumieni
wideo
茵 Do niedawna kr贸luj膮cy w plikach AVI format
DivX zosta艂 praktycznie zdeklasowany przez
prawie 100% wzrost kompresji osi膮gni臋ty w
plikach RMVB (przy por贸wnywalnej jako艣ci)
茵 Nic nie wskazuje na to i偶 osi膮gni臋to kres
mo偶liwo艣ci technicznych budowy
wydajniejszych i jako艣ciowo lepszych
system贸w
PRZEGLD ISTNIEJCYCH FORMAT脫W
KODOWANIA WIDEO
茵 Ustawiaj膮c chronologicznie najwa偶niejsze
historycznie formaty uzyskujemy list臋 kt贸r膮
otwiera format MPEG-1 (1991r), nast臋pnie
mamy:
绅 QuickTime (1991)
绅 MPEG-2 (1994)
绅 MPEG-4 (1998)
绅 DiviX (1998)
绅 Windows Media (1998)
绅 RealMedia (1999)
绅 XviD (2001)
绅 Flash Video (2001)
绅 AVC (2003)
FORMAT KODOWANIA MPEG-1
茵 Tw贸rc膮 ca艂ej rodziny format贸w kodowania MPEG
jest Moving Picture Experts Group.
茵 Opracowany w 1991 r. wykorzystywany jest do
kompresowania popularnych do dzisiaj p艂yt VCD
茵 Doczeka艂 si臋 dw贸ch implementacji (VCD 1.1 i 2.0).
Nowsza obs艂uguje system PAL, same 艣cie偶ki audio
oraz albumy zdj臋膰, oferuje tak偶e interaktywn膮
obs艂ug臋 i lepsz膮 jako艣膰 dzwi臋ku
茵 Strumie艅 wideo charakteryzuje si臋 jako艣ci膮
por贸wnywaln膮 z filmami VHS oraz dzwi臋kiem
stereofonicznym o jako艣ci zbli偶onej do CD-Audio
FORMAT KODOWANIA MPEG-1
茵 Jedna p艂yta CD dzi臋ki temu kompresorowi jest w
stanie zmie艣ci膰 ok. 70 minut materia艂u wideo
茵 Nieskompresowana sekunda materia艂u filmowego
w rozdzielczo艣ci PAL z towarzysz膮cym jej
dzwi臋kiem wymaga ok. 30 MB przestrzeni
dyskowej - nawet dla wsp贸艂czesnych system贸w
komputerowych jest do niebagatelna warto艣膰
茵 Kompresor MPEG-1 pozwala ograniczy膰 ten
strumie艅 do ok. 200 kB - nawet historyczne
systemy komputerowe mog艂y sobie z takim
strumieniem danych poradzi膰
MPEG-1 METODA KODOWANIA
茵 Ko艅cowy efekt dzia艂ania kompresora to z艂o偶enie kilku
r贸偶nych technik kodowania zar贸wno w zakresie operacji
na obrazie jak i dzwi臋ku:
茵 Pierwsza to podpr贸bkowanie chrominancji
(czyli zubo偶enie informacji o kolorze w kodowanym
strumieniu), kt贸rej zmiany s膮 s艂abo zauwa偶alne dla oka
ludzkiego.
Y odpowiada obrazowi w skali szaro艣ci (czarno bia艂emu) a U i V barwom i nasyceniu.
茵 Algorytm nazywany transformat膮 cosinusow膮 pozwala,
po podziale klatek na bloki 8x8, opisa膰 je znacznie
kr贸tsz膮 sekwencj膮 danych
MPEG-1 METODA KODOWANIA
茵 G艂贸wnym procesem kompresora MPEG jest
kompensacja ruchu, kt贸ra dzieli klatk臋 na bloki
16x16 i wzgl臋dem klatki kluczowej (pierwszej z
kompresowanej sekwencji podobnych do siebie
klatek) uzupe艂nia ich danymi kolejne podobne
bloki nast臋pnej klatki
茵 Kompresja dzwi臋ku bazuje na usuni臋ciu s艂abo
s艂yszalnych, wysokich cz臋stotliwo艣ci oraz wyci臋ciu
sygna艂贸w o niskiej amplitudzie, kt贸re poprzedzaj膮
lub nast臋puj膮 po sygna艂ach o wysokiej amplitudzie
MPEG-1 METODA KODOWANIA
茵 W przypadku sygna艂u stereofonicznego
upraszczana jest te偶 r贸偶nica mi臋dzy kana艂ami
茵 Tak przekszta艂cony strumie艅 w kolejnym etapie
kodowania zostaje skompresowany poznanym
wcze艣niej algorytmem Huffmana (sekwencje
pojawiaj膮ce si臋 najcz臋艣ciej kodowane s膮 z
wykorzystaniem kr贸tkich symboli binarnych)
茵 Zalet膮 algorytmu jest niski poziom skomplikowania
i niewielkie wymagania, wad膮 s艂aba jako艣膰
ko艅cowego strumienia wideo.
FORMAT KODOWANIA MPEG-2
茵 Opracowany w 1994 r. jako rozszerzenie
MPEG-1 sta艂 si臋 w kr贸tkim czasie standardem
dla telewizji cyfrowej DVB oraz, po pewnych
modyfikacjach, dla film贸w zapisywanych na
p艂ytach standardu DVD
茵 Lepszy stopie艅 kompresji, mniejsze straty
jako艣ci i wi臋ksza pojemno艣膰 p艂yty DVD
umo偶liwi艂y kompresowanie obraz贸w w pe艂nej
rozdzielczo艣ci PAL lub NTSC
FORMAT KODOWANIA MPEG-2
茵 Zdecydowanie wzros艂y wymagania w zakresie
przepustowo艣ci. W wypadku MPEG-1 by艂o to tylko
1,5 Mb/s, MPEG-2 wymaga ju偶 10,08 Mb/s
茵 Towarzysz膮cy obrazowi dzwi臋k charakteryzuje si臋
wi臋ksz膮 cz臋stotliwo艣ci膮 pr贸bkowania dor贸wnuj膮c膮
magnetofonom cyfrowym
茵 Standard DVD-Video umo偶liwia osadzenie nawet
do sze艣ciu 艣cie偶ek dzwi臋kowych oraz list
dialogowych w wielu j臋zykach.
FORMAT KODOWANIA MPEG-2
茵 Format MPEG-2 trafi艂 te偶 na standardowe p艂yty CD
i znany jest pod nazw膮 Super Video-CD (SVCD)
茵 Obraz kompresowany przez kodek ma w tym
wypadku rozdzielczo艣膰 480x480 punkt贸w dla
NTSC i 480x576 punkt贸w dla standardu PAL
茵 Wymagana przepustowo艣膰 oscyluje w granicach
ok. 2,7 Mb/s (razem z dzwi臋kiem)
茵 Na p艂ycie SVCD mo偶na zapisa膰 nawet 60minut
materia艂u, mo偶liwe jest osadzenie w strumieniu
dw贸ch 艣cie偶ek audio oraz dodanie do filmu
czterech r贸偶nych list dialogowych
& A FORMAT KODOWANIE MPEG-3& ?
茵 Nigdy nie wykroczy艂 poza faz臋 projektu
茵 Stowarzyszenie MPEG (Moving Picture Experts
Group) wycofa艂o si臋 z opracowania jego
implementacji. Mia艂 by膰 wykorzystany przy
realizacji telewizji du偶ej rozdzielczo艣ci (HD TV),
jednak w tej roli doskonale sprawdzi艂 si臋 jego
starszy brat - MPEG-2
FORMAT KODOWANIA MPEG-4
茵 Opracowany w 1998 roku MPEG-4 jest czym艣
wi臋cej ni偶 tylko rozwini臋ciem dw贸ch poprzednich
kompresor贸w.
茵 Bazuje na elementach obrazu naturalnego,
definiuj膮c je jako obiekty AVO (Audio Visual
Objects). Dzi臋ki podzia艂owi tre艣ci obrazu na
obiekty mo偶liwa jest implementacja us艂ug
manipuluj膮cych atrybutami obiekt贸w (np. wi臋ksza
przepustowo艣膰 dla obiekt贸w postaci, a mniejsza
dla t艂a). Dotyczy to r贸wnie偶 towarzysz膮cego filmowi
dzwi臋ku AAC (Advanced Audio Coding).
FORMAT KODOWANIA MPEG-4
茵 Implementacja MPEG-4 obejmuje opis j臋zyka
VRML (Virtual Reality Modeling Language)
茵 Kodek wspiera ochron臋 praw autorskich i oferuje
szeroki przedzia艂 przepustowo艣ci - od 64 Kb/s do
10 Mb/s, co rozszerza horyzont jego zastosowa艅
茵 W rzeczywisto艣ci niewiele z mo偶liwo艣ci bardzo
elastycznego MPEG-4 jest wykorzystywanych
茵 Kompresor doczeka艂 si臋 innych implementacji pod
powszechnie rozpoznawanymi nazwami DivX i XviD
FORMAT KODOWANIA MPEG-4 DIVIX
茵 Format DivX powsta艂 w 1998 roku i by艂 pirack膮
wersj膮 kodeka MPEG-4 firmy Microsoft
茵 Francuz Jerome Rota z艂ama艂 jego oryginalny kod,
umo偶liwiaj膮c wykorzystanie kontenera AVI, a nie
jak w oryginale ASF, do skompresowanych
strumieni.
茵 Tak narodzi艂 si臋 DivX ;-) 3.11 oraz moda na
konwersj臋 film贸w z p艂yt DVD do plik贸w AVI, kt贸re
mo偶na zmie艣ci膰 (wraz z dzwi臋kiem w formacie
MP3) na standardowej p艂ycie CD i to z jako艣ci膮
nieznacznie ust臋puj膮c膮 orygina艂owi
FORMAT KODOWANIA MPEG-4 DIVIX
茵 W 2000 roku Rota za艂o偶y艂 w艂asn膮 firm臋 i
skomercjalizowa艂 kompresor
茵 Pi臋膰 lat p贸zniej zaprezentowana zosta艂a nowa
wersja - DivX 6.0. Od tej pory kodek nie jest
typowym kompresorem do plik贸w AVI, a platform膮
podobn膮 do MPEG-2.
茵 Umo偶liwia tworzenie interaktywnych menu,
dodawanie list dialogowych w formacie XSUB, kilku
艣cie偶ek audio, a tak偶e podzia艂 filmu na sceny oraz
przechowywanie innych metadanych w pliku.
FORMAT KODOWANIA MPEG-4 XVID
茵 Rozpowszechnienie si臋 kompresora DivX, a
nast臋pnie jego komercyjny charakter zaowocowa艂y
pr贸bami stworzenia analogicznego kompresora na
licencji GNU GPL (GNU -rekurencyjny akronim od
GNU's Not UNIX, GPL-General Public Licence).
茵 Pierwsze pr贸by implementacji nie powiod艂y si臋.
茵 Dopiero w roku 2001, kiedy projekt DivX rozga艂臋zi艂
si臋, powsta艂 oparty na kodzie zr贸d艂owym
DivX-a 4.0 kodek nazwany anagramem swojego
poprzednika - XviD
FORMAT KODOWANIA MPEG-4 XVID
茵 Film wideo jest sekwencj膮 obraz贸w zwanych ramkami. W
standardzie telewizyjnym PAL w sekundzie przesy艂anych
jest 25 ramek obrazu
茵 Enkodery MPEG zapisuj膮 takie zbiory klatek w pakietach
nazywanych Group of Pictures (GOP). Na jedn膮 GOP
sk艂ada si臋 zazwyczaj od 12 do 15 ramek
茵 Enkoder MPEG dzieli ka偶d膮 ramk臋 na makrobloki i dla
ka偶dego z nich wyznacza warto艣ci koloru oraz jasno艣ci
zapisywane w kilku blokach. Kodowanie informacji
zawartych w ka偶dym bloku odbywa si臋 z wykorzystaniem
technik intra- i interkodowania
FORMAT KODOWANIA MPEG -
INTRAKODOWANIE
茵 Pierwsza ramka, zwana kluczow膮 (Intra Frame), w
pakiecie GOP zawsze podlega intrakodowaniu. Oznacza
to, 偶e enkoder, podobnie jak w przypadku kompresji
JPEG, wykonuje przekszta艂cenia wy艂膮cznie na bazie
informacji zawartych w tej ramce.
茵 Kodowanie odbywa si臋 za po艣rednictwem dyskretnej
transformaty cosinusowej (DCT), kt贸ra oblicza rozk艂ad
cz臋stotliwo艣ci odpowiadaj膮cy obrazowi. Nast臋pnie w
wyniku kwantyzacji warto艣ci poszczeg贸lnych cz臋sto艣ci
zaokr膮glane s膮 do liczb ca艂kowitych, przy czym w
obszarze wysokich cz臋stotliwo艣ci cz臋艣膰 warto艣ci jest
usuwana. Otrzymany w ten spos贸b zbi贸r warto艣ci mo偶e
by膰 p贸zniej bezstratnie skompresowany
FORMAT KODOWANIA MPEG -
INTRAKODOWANIE
茵 W ka偶dej grupie GOP wyst臋puje tylko jedna ramka
kluczowa (I-Frame). Wszystkie pozosta艂e ramki
po艣rednie (Predicted- i Bidirectional-Frame) s膮
interkodowane
茵 Oznacza to, 偶e algorytm kompresji ramek P i B
wykorzystuje informacje z poprzednich lub z nast臋pnych
obraz贸w. R贸偶nice pomi臋dzy ramkami wyra偶ane s膮 za
po艣rednictwem wektor贸w przesuni臋cia. Wektory
przesuni臋cia ramek P opisuj膮 zmiany w stosunku do
poprzedniej ramki I-Frame. Z kolei ramki B obliczane s膮
na podstawie informacji pochodz膮cych z wcze艣niejszych
ramek I i P oraz z p贸zniejszych ramek P
FORMAT KODOWANIA REALVIDEO
茵 Nazwa przypisywana jest ca艂ej linii produkt贸w firmy
RealNetworks, u偶ywanych do dekompresji
materia艂贸w transferowanych na 偶ywo przez
Internet.
茵 Firma wypu艣ci艂a na rynek sw贸j pierwszy
dekompresor w 1997 roku pod nazw膮 RealVideo7,
kt贸ry bazowa艂 na kodeku H.263. Obecna wersja
RealVideo 10 jest oparta na technologii Helix.
茵 W mi臋dzyczasie powsta艂 dekoder o zmiennej
przepustowo艣ci (VBR - Variable Bit Rate ), jednak
s艂abo nadawa艂 si臋 on do strumieniowania poprzez
Sie膰
FORMAT KODOWANIA REALVIDEO
茵 Nowym formatem zainteresowali si臋 jednak
amatorzy film贸w
茵 Dzi臋ki jego ogromnym mo偶liwo艣ciom na
dyskach twardych i p艂ytach CD (via Internet
naturalnie) zago艣ci艂y pliki z rozszerzeniem
RMVB (Real Media Variable Bitrate)
茵 Mo偶na przy jego pomocy umie艣ci膰 na
standardowej p艂ycie CD nie jeden, ale dwa filmy
i to z jako艣ci膮 dor贸wnuj膮c膮 r贸偶nym wariantom
formatu MPEG-4
FORMAT KODOWANIA WINDOWS MEDIA
茵 Jest przyk艂adem licznej rodziny zamkni臋tych
kompresor贸w giganta z Redmond
茵 Taki stan rzeczy utrzymywa艂 si臋 w przypadku
standard贸w Windows Media 7 i 8 - kodek贸w
stworzonych do obs艂ugi strumieni wideo przy
niskich przepustowo艣ciach, wykorzystywanych
g艂贸wnie do przesy艂ania film贸w przez Sie膰
茵 W roku 2003 pojawi艂 si臋 Windows Media 9,
kt贸rego mo偶liwo艣ci nie ograniczaj膮 si臋 do przesy艂u
obrazu przez Internet, ale wspieraj膮 te偶
technologie HD TV i system zarz膮dzania prawami
cyfrowymi DRM (Digital Rights Management).
FORMAT KODOWANIA WINDOWS MEDIA
茵 Aby cieszy膰 si臋 zaletami telewizji HD, potrzebny
jest wydajny komputer z procesorem taktowanym
zegarem min. 2,2 GHz
茵 Popularnym kontenerem multimedialnym dla
strumieni WMV (Windows Media Video) z
towarzysz膮cym dzwi臋kiem WMA (Windows Media
Audio) jest format ASF, czyli Advanced Systems
Format (do niedawna Advanced Streaming Format)
茵 W odr贸偶nieniu od kompresor贸w Windows Media
specyfikacja ASF zosta艂a udost臋pniona.
FORMAT KODOWANIA WINDOWS MEDIA
茵 Towarzysz膮cym filmom kompresor WMA (Windows
Media Audio) w zamierzeniach autor贸w mia艂 by膰
konkurencj膮 dla powszechnego standardu MP3
ale nie mog膮c z nim skutecznie konkurowa膰
rozwijany jest wy艂膮cznie w kierunku obs艂ugi
strumieni wideo.
茵 Standard WMA doczeka艂 si臋 ju偶 czterech wersji
rozwojowych - ostatnia oznaczona numerem 10
jest bardzo zaawansowanym narz臋dziem
oferuj膮cym du偶o wi臋ksze od swoich poprzednik贸w
mo偶liwo艣ci - niestety nie jest ju偶 z nimi zgodna
programowo
STANDARDY H.264 I X.264
茵 Historycznie prace nad standardem rozpocz臋艂y w
2003r. dwie organizacje ITU-T (International
Telecommunication Union - Telecommunication
Standardization Sector) Video Coding Group oraz
ISO/IEC (/International Electrotechnical
Commission) Moving Picture Experts Group 艂膮cz膮c
si臋 w ramach projektu w Joint Video Team (JVT)
茵 Ze strony MPEG kodek nosi nazw臋 MPEG-4 Part
10 ze strony ITU-T nazwany jest jako H.262 s膮
r贸wnie偶 u偶ywane nazwy alternatywne AVC
(Advanced Video Coding) i X.264 (wersja free)
STANDARDY H.264 I X.264
茵 Algorytm H.264 dysponuje technikami
wprowadzonymi w standardach MPEG-2 i MPEG-4,
jednak偶e w wersji bardziej rozwini臋tej ni偶 w
koncepcjach pierwotnych oferuje 40-procentow膮
redukcj臋 wielko艣ci strumienia w stosunku do
standardu DivX.
茵 H.264 dzieli obraz na mniejsze elementy i
wykorzystuje zmienne wielko艣ci blok贸w oraz
wektory przesuni臋cia. Pozwala to uzyska膰 znacznie
lepsz膮 jako艣膰 obrazu przy takiej samej wielko艣ci
danych. Korzy艣ci te okupione s膮 wi臋kszymi
wymaganiami sprz臋towymi (3GHz!)
STANDARDY H.264 INTRAKODOWANIE
茵 Operacje intrakodowania dla luminancji
wykonywane s膮 na blokach o rozmiarze 454
punkty. Pozwala to na dok艂adniejsze odwzorowanie
niewielkich detali obrazu. Dzi臋ki temu H.264
zapobiega na przyk艂ad powstawaniu
charakterystycznych zniekszta艂ce艅 na kraw臋dziach
liter.
茵 Dla fragment贸w obrazu pozbawionych wysokich
cz臋stotliwo艣ci, a wi臋c obszar贸w o jednorodnym tle
z niewielk膮 liczb膮 detali, enkoder H.264 mo偶e
zwi臋kszy膰 rozmiar bloku do 16516.
STANDARDY H.264 INTRAKODOWANIE
茵 Podczas interkodowania rozmiary blok贸w
zmieniaj膮 si臋 w zakresie od 16516 do 454. Dla
bloku o rozmiarze 858 enkoder mo偶e wprowadzi膰
dalszy podzia艂 na bloki o wielko艣ci 454 punkty.
茵 Najwa偶niejsz膮 zalet膮 wynikaj膮c膮 z H.264 jest
mo偶liwo艣膰 u偶ycia przez enkoder do 16 wektor贸w
przesuni臋cia dla ka偶dego makrobloku (w
przypadku blok贸w o rozmiarze 454). Dzi臋ki temu
zmiany pomi臋dzy poszczeg贸lnymi obrazami mog膮
by膰 opisane znacznie dok艂adniej za pomoc膮
wektor贸w przesuni臋cia.
STANDARDY H.264 PREDYKCJA
WIELORAMKOWA
茵 Enkoder H.264 nie musi tworzy膰 wektor贸w
przesuni臋cia bazuj膮c na informacjach
pochodz膮cych tylko z jednej ramki (poprzedniej lub
nast臋pnej), ale mo偶e do tego celu wykorzysta膰
dowoln膮 liczb臋 ramek.
茵 Mo偶liwe jest wyznaczanie wektor贸w przesuni臋cia
w stosunku do ramek typu B, czego nie potrafi膮
robi膰 enkodery MPEG-2 i MPEG-4. Efektem jest
dalszy wzrost stopnia kompresji, poniewa偶
wszystkie ramki mog膮 by膰 ramkami odniesienia
wykorzystywanymi do tworzenia wektor贸w
STANDARDY H.264 PREDYKCJA
膯WIER膯PIKSELOWA
茵 W wielu sekwencjach po艂o偶enie obiekt贸w w
kolejnych ramkach prawie si臋 nie zmienia. Aby
mo偶liwie najdok艂adniej odzwierciedli膰 te
minimalne zmiany, enkoder MPEG stosuje
technik臋 Sub Pixel Interpolation. Dzi臋ki niej
wektory przesuni臋cia nie musz膮 operowa膰 na
liczbach ca艂kowitych.
茵 Najnowsze kodeki MPEG-4 - takie jak DivX -mog膮
opcjonalnie dzia艂a膰 z dok艂adno艣ci膮 do jednej
czwartej piksela, natomiast standard H.264
zawiera zintegrowan膮 funkcj臋 Quarter Pixel
Prediction.
QUICKTIME FIRMY APPLE
茵 Pocz膮tki QuickTime'a si臋gaj膮 1991 roku, kiedy to
pojawi艂a si臋 na rynku wersja 1.0 zintegrowana z
systemem Macintosh
茵 Kontener multimedialny MOV zawiera dane
skompresowane kodekami firmy Apple (Road
Pizza), SuperMath (Cinepak), Sorenson (SVQ),
MPEG (MPEG-2, MPEG-4, H.264).
茵 Dzi臋ki nowym kompresorom typu AVC czy H.264
QuickTime wspiera HD DVD.
茵 Oferuje mo偶liwo艣膰 stosowania dzwi臋ku
wielokana艂owego 5.1
Wyszukiwarka
Podobne podstrony:
TI 99 08 19 B M pl(1)TI 03 03 08 T pl(1)TI Wyk艂ad 08W07 W08 SCRTI 03 10 08 B pl(1)TI 02 10 30 T pl(2)TI 00 11 27 B pl(2)TI 01 11 14 T M plTI 01 09 21 T pl(1)TI 02 05 29 T B pl(1)TI 00 08 22 T pl(2)TI 99 09 24 T B pl(1)wi臋cej podobnych podstron