09 grafika dzwiek video


Technologie informacyjne
- cyfrowe formy informacji
grafika, dzwięk, video
Cyfrowe formy informacji
Grafika
Grafika
komputerowa
komputerowa
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 2 / 58
Grafika komputerowa
Grafika komputerowa  dział informatyki zajmujący się wykorzystaniem
komputerów do generowania obrazów oraz wizualizacją rzeczywistych
danych. Grafika komputerowa jest obecnie narzędziem powszechnie
stosowanym w nauce, technice, kulturze oraz rozrywce.
Przykładowe zastosowania:
kartografia,
wizualizacja danych pomiarowych (np. w formie wykresów),
wizualizacja symulacji komputerowych,
diagnostyka medyczna,
kreślenie i projektowanie wspomagane komputerowo (CAD),
przygotowanie publikacji (DTP),
efekty specjalne w filmach,
gry komputerowe.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 3 / 58
Grafika komputerowa
Rodzaje grafiki komputerowej:
Grafika dwuwymiarowa (grafika 2D)  wszystkie obiekty są płaskie
(w szczególności ka\dy obraz rastrowy wpada do tej kategorii).
Grafika trójwymiarowa (grafika 3D)  obiekty są umieszczone w przestrzeni
trójwymiarowej i celem programu komputerowego jest przede wszystkim
przedstawienie trójwymiarowego świata na dwuwymiarowym obrazie.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 4 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Rodzaje grafiki komputerowej:
Grafika wektorowa  obraz jest rysowany za pomocą kresek lub łuków i innych
figur geometrycznych, dla których zapamiętywane są charakterystyczne
dane, (np. dla okręgu będzie to środek i promień, dla odcinka współrzędne
punktów końcowych).
Grafika rastrowa (bitmapowa)  obraz jest budowany z prostokÄ…tnej siatki
le\ących blisko siebie punktów (tzw. pikseli), dla których zapamiętywane są
określone cechy (kolor, natę\enie)
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 5 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Cechy grafiki rastrowej:
Umo\liwia uzyskanie du\ego realizmu kolorystycznego poprzez
indywidualne określanie barwy ka\dego elementu.
Nie pozwala na dokonywanie transformacji geometrycznych na
elementach składowych (obrazu)
Wielkość plików szybko rośnie wraz z rozdzielczością (liczbą pikseli)
obrazu.
Cechy grafiki wektorowej:
Doskonale nadaje się do reprezentowania obrazów zawierających
elementy strukturalne.
Umo\liwia dokonywanie płynnych transformacji elementów obrazu, tak
jak i jego całości bez utraty jakości prezentacji.
Wielkość plików słabo zale\y od rozdzielczości obrazu, jest tylko funkcją
ilości i zło\oności opisu jego elementów składowych.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 6 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Skalowanie obrazów:
obraz obraz
W przeciwieństwie do grafiki rastrowej grafika
wektorowy rastrowy
wektorowa jest grafiką w pełni skalowalną,
co oznacza, i\ obrazy wektorowe mo\na
nieograniczenie powiększać oraz zmieniać ich
proporcje bez uszczerbku na jakości. Ma to
swoje uzasadnienie w matematycznym opisie
elementów (prymitywów), Sama jakość obrazu
uzale\niona jest wyłącznie od dokładności opisu
obrazu przez prymitywy.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 7 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Konwersja obrazów:
Obrazy wektorowe mo\na łatwo przetwarzać w ich odpowiedniki bitmapowe
podając jedynie docelową rozdzielczość obrazu rastrowego.
Operacja konwersji w przeciwnÄ… stronÄ™, tzw. wektoryzacja lub trasowanie, jest
trudna i niejednokrotnie nie daje spodziewanych wyników.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 8 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Przykładowe zastosowanie grafiki rastrowej:
Grafika fotorealistyczna,
Cyfrowa obróbka obrazu,
Fotografia cyfrowa,
Telewizja cyfrowa i wideo,
Internet.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 9 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Przykładowe zastosowanie grafiki wektorowej:
Rysunek techniczny,
Komputerowe wspomaganie projektowania
(Computer Aided Design  CAD),
Animacje Macromedia Flash (WWW),
Programy rysujÄ…ce wykresy.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 10 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Formaty plików grafiki rastrowej:
BMP  mapa bitowa o ró\nej palecie barw: 1 (mono), 8 (256 odcieni),
24 bity na piksel (full color),
TIF  Tagget Image File Format  standardowy format stosowany
w poligrafii. Bardzo wiele odmian pod względem palety kolorów i metod
kompresji (np. Huffmana, LZW),
GIF  Graphics Image Format  zapis z przeplotem linii. (umo\liwia
wstępne uproszczone wyświetlanie). Paleta barw uproszczona do 256
pozycji. Kompresja bezstratna LZW (Lempel-Ziv-Welch). Mo\e zawierać
więcej ni\ jeden obraz (gify animowane),
JPG, JPEG  pełna paleta barw RGB. Zwykle stosuje się stratną, lecz
bardzo wydajnÄ… kompresjÄ™ DCT.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 11 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Formaty plików grafiki rastrowej: (ciąg dalszy)
TGA  Targa  Dość szeroko stosowany format o palecie 8, 16, 24, 32
(true color) bity na piksel. Mo\e obsługiwać tzw. kanał alfa (tj. zawierać
informacje o przezroczystości)
PNG  Potrable Network Graphics  unowocześniony format w stosunku
do GIF, z ulepszonym mechanizmem kompresji, pełną paletą barw, kanał
alfa
PCX  format programu Paintbrush/Paint. Kilka wersji o ró\nej palecie
barw 1, 4, 8, 24 bity na piksel
Istnieją darmowe programy do konwersji pomiędzy ró\nymi formatami,
np. program XnView
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 12 / 58
Grafika komputerowa  wektorowa "! rastrowa
"!
"!
"!
Formaty plików grafiki wektorowej
WMF  Windows Meta File  uniwersalny format zapisu wektorowego
stosowany w MS Windows
CDR  format zapisu zbiorów programu CorelDraw
DXF  format zapisu zbiorów programu AutoCAD
EPS, PS  Encapsulated Postscript  właściwie język opisu stron
opracowany przez firmę Adobe. Stosowany w zapisie dla celów
poligraficznych. Obsługiwany sprzętowo przez wiele rodzajów drukarek i
profesjonalnych systemów drukowania
CGM  Computer Graphics Metafile - format opracowany dla
dokumentów elektronicznych. Posiada liczne zastosowania
przemysłowe.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 13 / 58
Cyfrowe formy informacji
Kodowanie
Kodowanie
kolorów
kolorów
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 14 / 58
Kodowanie koloru - budowa oka
Sposób kodowania koloru jest ściśle związany z budową oka i sposobem
postrzegania kształtów i kolorów przez człowieka.
Na siatkówce oka znajdują się dwa
rodzaje światłoczułych receptorów:
czopki i pręciki.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 15 / 58
Kodowanie koloru - budowa oka
Czopki - światłoczułe receptory siatkówki oka, które umo\liwiają widzenie kolorów
przy dobrym oświetleniu. Ludzkie oko zawiera trzy rodzaje czopków,
z których ka\dy ma inną charakterystykę widmową, czyli reaguje na światło
z innego zakresu barw. Pierwszy rodzaj reaguje głównie na światło
czerwone (ok. 700 nm), drugi na światło zielone (ok. 530 nm) i ostatni na
światło niebieskie (ok. 420 nm).
Pręciki - światłoczułe receptory siatkówki oka, które umo\liwiają czarno-białe
widzenie przy słabym oświetleniu. Odpowiadają za postrzeganie kształtów
i ruchu.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 16 / 58
Kodowanie koloru - budowa oka
Względna absorpcja światła czopków (S, M, L) i pręcików (R) przez ludzkie oko.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 17 / 58
Kodowanie koloru - model RGB
Model RGB  jeden z modeli przestrzeni barw, wynikający z właściwości
odbiorczych ludzkiego oka, w którym wra\enie widzenia dowolnej barwy
mo\na wywołać przez zmieszanie w ustalonych proporcjach trzech wiązek
światła o barwie czerwonej, zielonej i niebieskiej.
Jego nazwa powstała ze zło\enia pierwszych liter
angielskich nazw barw: R  red (czerwonej),
G  green (zielonej) i B  blue (niebieskiej),
Kolor w przestrzeni barw jest opisywany trzema współrzędnymi RGB.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 18 / 58
Kodowanie koloru - model RGB
Sześcian kolorów RGB
Kolor w przestrzeni barw jest opisywany trzema współrzędnymi RGB.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 19 / 58
Kodowanie koloru - model RGB
Synteza addytywna - zjawisko mieszania barw poprzez sumowanie wiÄ…zek
światła widzialnego ró\nych długości.
Synteza addytywna zachodzi np. podczas projekcji na biały
ekran światła ze zródeł o ró\nych barwach: w miejscu
oświetlonym jednocześnie ró\nymi barwami światła oko
ludzkie widzi odbity strumień światła będący sumą
wszystkich padajÄ…cych w to miejsce barw. W oparciu o
syntezÄ™ addywnÄ… mieszania barw pracujÄ… monitory oraz
inne wyświetlacze kolorowe, emitując wiązki świateł Red
(czerwony), Green (zielony), Blue (niebieski) (RGB). Czarny
ekran to wynik braku emisji światła, a biały to wynik zło\enia
świateł R + G + B z maksymalną jasnością.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 20 / 58
Kodowanie koloru - model CMYK
Synteza subtraktywna - zjawisko mieszania barw poprzez odejmowanie
promieniowań widzialnych ró\nych długości (najczęściej poprzez
pochłanianie niektórych długości fal przez powierzchnię, od której odbija się
światło białe).
Cyan
Magenta
Yellow
Synteza subtraktywna zachodzi np. przy mieszaniu farb
blacK
o ró\nych barwach: w miejscu pokrytym farbą powstałą ze
zmieszania farb o ró\nych barwach oko ludzkie widzi
odbity strumień światła będący tą częścią światła białego,
która zostanie po pochłonięciu wszystkich składowych
barwnych przez poszczególne farby wchodzące w skład
mieszanki.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 21 / 58
Kodowanie koloru - model CMYK
Sześcian kolorów CMYK
Kolor w przestrzeni barw mo\na opisać trzema współrzędnymi CMY.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 22 / 58
Kodowanie koloru - model HSV
Model HSV (ang. Hue Saturation Value)  model opisu przestrzeni barw, w którym
wszystkie barwy są postrzegane jako światło pochodzące z oświetlenia.
Według tego modelu wszelkie barwy wywodzą się ze światła białego, gdzie
część widma zostaje wchłonięta, a część odbita od oświetlanych
przedmiotów.
Symbole w nazwie modelu to pierwsze litery nazw
angielskich dla składowych opisu barwy:
H  częstotliwość światła (ang. Hue) wyra\ona
kÄ…tem na kole barw.
S  nasycenie koloru (ang. Saturation) jako
promień podstawy.
V  (ang. Value) równowa\na nazwie
B  moc światła białego (ang. Brightness) jako
wysokość sto\ka.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 23 / 58
Kodowanie koloru
W grafice komputerowej do kodowania koloru najczęściej wykorzystuje się model
RGB, w którym poszczególne składowe koloru są zakodowane jako liczby
całkowite zapisane na określonej liczbie bitów.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 24 / 58
Grafika rastrowa  kodowanie obrazu
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 25 / 58
Grafika rastrowa  kodowanie obrazu
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 26 / 58
Grafika rastrowa  kodowanie obrazu
True color  32- lub 24- bity / piksel
kolor piksela zapisany na 3 bajtach
dostępne 16 777 216 ró\nych kolorów !
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 5,76MB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 27 / 58
Grafika rastrowa  kodowanie obrazu
High color  16- lub 15- bity / piksel
kolor piksela zapisany na 2 bajtach
(R, B - 5 bitów, G  6 bitów)
dostępne 65 536 ró\nych kolorów !
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 3,84MB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 28 / 58
Grafika rastrowa  kodowanie obrazu
Paleta adaptacyjna  8- bitów / piksel
kolor piksela zapisany na 1 bajcie
dostępne 256 ró\nych kolorów spośród
16 777 216 ró\nych kolorów.
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 1,92 MB !!!
Uwaga!. Dopasowanie kolorów mo\e być
znacznie gorsze, jeśli w systemie są
wyświetlane inne pliki graficzne.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 29 / 58
Grafika rastrowa  kodowanie obrazu
Microsoft Windows default 16-color palette
kolor piksela zapisany na 4 bitach
dostępne 16 kolorów.
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 0,96 MB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 30 / 58
Grafika rastrowa  kodowanie obrazu
Gray scale 8- bitów / piksel
kolor piksela zapisany na 1 bajcie
składowe RGB mają taką samą wartość
dostępne 256 poziomów szarości.
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 1,92 MB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 31 / 58
Grafika rastrowa  kodowanie obrazu
2-bit Grayscale
kolor piksela zapisany na 2 bitach
dostępne 4 kolory
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 480 KB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 32 / 58
Grafika rastrowa  kodowanie obrazu
Monochrome (1-bit)
kolor piksela zapisany na 1 bicie
dostępne 2 kolory
obraz o rozmiarze 1600 x 1200 zajmuje
ponad 240 KB !!!
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 33 / 58
Grafika rastrowa  kompresja danych
Zmniejszenie objętości plików graficznych mo\na uzyskać za pomocą kompresji
danych.
Kompresja danych - zmiana sposobu zapisu informacji tak, aby zmniejszyć
redundancję i tym samym objętość zbioru, nie zmieniając przenoszonych
informacji. Innymi słowy chodzi o wyra\enie tego samego zestawu informacji,
lecz za pomocą mniejszej liczby bitów. Działaniem przeciwnym do kompresji
jest dekompresja.
Algorytmy kompresji dzieli siÄ™ na bezstratne i stratne
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 34 / 58
Grafika rastrowa  kompresja danych
Kompresja bezstratna (ang. lossless compression) to ogólna nazwa takich metod
upakowywania informacji do postaci zawierającej zmniejszoną liczbę bitów
tak, aby całą informację dało się z tej postaci odtworzyć do identycznej
postaci pierwotnej.
Kompresja bezstratna działa dobrze na danych, w których występuje du\a
regularność powtórzeń pewnych ciągów bitów. np. obrazy rastrowe zawierające
du\e jednolite obszary.
Jest słabo skuteczna dla obrazów rastrowych zawierających obrazy naturalne
(np. zdjęcia krajobrazowe).
Kompresja bezstratna nie jest skuteczna dla danych losowych.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 35 / 58
Grafika rastrowa  kompresja danych
Formaty plików graficznych wykorzystujące kompresją bezstratną:
GIF  format pliku graficznego z kompresją bezstratną, który jest powszechnie
u\ywany na stronach WWW, gdy\ pozwala na tworzenie animacji z paletÄ…
256 kolorów i dwustanową przezroczystością.
PNG (ang. Portable Network Graphics)  format plików graficznych oraz system
bezstratnej kompresji danych graficznych, opracowany jako następca
formatu GIF.
TIFF (ang. Tagged Image File Format)  jeden z najbardziej rozpowszechnionych
i uniwersalnych formatów plików graficznych. Słu\y do zapisywania grafiki
bitmapowej. U\ywany jest obecnie w DTP, grafice trójwymiarowej, w
obrazowaniu medycznym itd.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 36 / 58
Grafika rastrowa  kompresja danych
Kompresja stratna - to metody zmniejszania ilości bitów potrzebnych do
wyra\enia danej informacji, które nie dają gwarancji, \e odtworzona
informacja będzie identyczna z oryginałem. Dla niektórych danych algorytm
kompresji stratnej mo\e odtworzyć informację w sposób identyczny.
Algorytmy kompresji stratnej do kompresji dzwięku i obrazu zazwyczaj posługują
się modelami psychoakustycznymi oraz psychowizualnymi, tak by minimalizować
widoczne dla człowieka ró\nice w stosunku do oryginału.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 37 / 58
Grafika rastrowa  kompresja danych
oryginał silna kompresja bardzo silna kompresja
196662B 4070B. (25%) 1741B (5%)
efekt działania filtra wykrywającego krawędzie
bez kompresji po bardzo silnej kompresji
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 38 / 58
Grafika rastrowa  kompresja danych
Formaty plików graficznych wykorzystujące kompresją stratną:
JPEG  standard kompresji statycznych obrazów rastrowych, przeznaczony
głównie do przetwarzania obrazów naturalnych (zdjęć satelitarnych, pejza\y,
portretów itp.), charakteryzujących się płynnymi przejściami barw oraz
brakiem lub małą ilością ostrych krawędzi i drobnych detali. Format plików
JPEG/JFIF jest jednym z najczęściej stosowanych formatów grafiki na
stronach WWW.
DjVu - to jeden z formatów plików graficznych stosowany w bibliotekach cyfrowych
ze względu na dobrą jakość grafiki przy jednocześnie małych rozmiarach
plików. Grafika w formacie DjVu zajmuje przeciętnie od 5 do 10 razy mniej
miejsca na dysku ni\ format JPEG.
Pliki zapisywane w tym formacie posiadajÄ… rozszerzenie "djvu" lub "djv".
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 39 / 58
Cyfrowe formy informacji
Kodowanie
Kodowanie
dzwięku
dzwięku
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 40 / 58
Kodowanie dzwięków
Dzwięk  fala akustyczna rozchodząca się w danym ośrodku sprę\ystym
(ciele stałym, płynie, gazie) zdolna wytworzyć wra\enie słuchowe, które dla
człowieka zawarte jest w paśmie między częstotliwościami granicznymi
od ok. 16 Hz do 20 kHz.
Dzwięk rejestrowany przez mikrofon ma postać sygnału analogowego
przypominającego sinusoidę o zmiennej częstotliwości i amplitudzie.
Przetworzenie sygnału analogowego na cyfrowy wymaga dwóch kroków:
próbkowanie
kwantyzacja
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 41 / 58
Kodowanie dzwięków
Próbkowanie (dyskretyzacja, kwantowanie w czasie) to proces stworzenia sygnału
impulsowego reprezentującego sygnał ciągły.
Ludzkie ucho słyszy dzwięki do częstotliwości około 20 kHz.
Jako wystarczającą częstotliwość próbkowania przyjęto 44 100 próbek na sekundę
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 42 / 58
Kodowanie dzwięków
Kwantyzacja  (drugi po próbkowaniu) etap procesu przetwarzania sygnału
analogowego na cyfrowy, który polega na na przypisaniu wartości
analogowych do najbli\szych poziomów reprezentacji. Kwantyzacja wią\e
siÄ™ z nieuniknionÄ… i nieodwracalnÄ… utratÄ… informacji. Utrata jest tym mniejszÄ…
im jest więcej dostępnych poziomów reprezentacji.
Poziomy reprezentacji koduje się za pomocą liczb całkowitych 16 bitowych ( 65536
poziomów ) lub ośmio bitowych ( 256 poziomów).
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 43 / 58
Kodowanie dzwięków
Jakość dzwięku:
Częstość próbkowania: (np. 11.025 kHz, 22.05 kHz, 44.1 kHz)
Rozmiar próbki: ilość zapisanej informacji (np. 8 bit, 16 bit)
Jakość zapisanego dzwięku jest tym lepsza im większy jest częstotliwość
próbkowania i rozmiar próbki. Niestety rośnie wtedy równie\ rozmiar zbioru.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 44 / 58
Kodowanie dzwięków
Formaty popularnych plików dzwiękowych:
CD-Audio - standard cyfrowego zapisu dzwięku na płycie kompaktowej,
wykorzystujący do tego celu kodowanie PCM o częstotliwości próbkowania
44,1 kHz i rozdzielczości 16 bitów na próbkę.
WAV - format charakterystyczny dla platformy Windows, pozwala na zapis muzyki
z jakością płyty kompaktowej (44.1 kHz, 16 bit, stereo). Pliki w tym formacie
są bardzo du\e (1 sekunda dzwięku to 172 kB).
Minimalne ustawienia: 8 bit, mono, 8 kHz (1 sekunda dzwięku to 8 kB).
MIDI (Musical Instruments Digital Interface) ze względu na małe rozmiary plików
jest często wykorzystywany do tworzenia podkładu muzycznego dla stron
WWW. Plik nie zawiera spróbkowanego dzwięku, lecz specyficzny rodzaj
zapisu nutowego danego utworu.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 45 / 58
Kodowanie dzwięków
Format plików dzwiękowych wykorzystujące kompresją stratną:
MP3 (ang. MPEG-1/2 Audio Layer-3) to format stratnej kompresji dzwięku
opierajÄ…cy siÄ™ na zmodyfikowanej dyskretnej transformacie cosinusowej i
u\ywajÄ…cy modelu psychoakustycznego.
Pliki w tym formacie posiadajÄ… rozszerzenie .mp3.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 46 / 58
Kodowanie dzwięków
Model psychoakustyczny to matematyczny model mówiący jakie informacje
o dzwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są.
Modele psychoakustyczne przewidują zakres słyszalności od 20 Hz-20 kHz.
Ponadto uwzględnia się maskowanie jednych dzwięków przez inne:
maskowanie sąsiednich częstotliwości(maskowanie jednoczesne): ciche
dzwięki o częstotliwościach zbli\onych do częstotliwości dzwięku głośnego nie
są słyszalne
maskowanie dzwięków następujących (maskowanie pobodzcowe): głośny
dzwięk potrafi zagłuszyć cichsze dzwięki następujące zaraz po nim
maskowanie dzwięków poprzedzających (maskowanie wsteczne): cichy
dzwięk poprzedzający w krótkim czasie dzwięk głośny nie jest słyszalny.
Model psychoakustyczny jest podstawą działania algorytmu kompresji stratnej
dzwięku wykorzystywanej w plikach formatu mp3
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 47 / 58
Cyfrowe formy informacji
kodowanie
kodowanie
obrazów wideo
obrazów wideo
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 48 / 58
Obrazy wideo
Obraz wideo - sekwencja obrazów połączona z dzwiękiem
zapisana na nośniku magnetycznym lub elektronicznym.
Częstość klatek  liczba klatek wyświetlanych na sekundę:
25 klatek/sekundÄ™ (w Europie)
30 klatek/sekundÄ™ (w Ameryce)
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 49 / 58
Sposoby przesyłania sygnału wideo
Analogowe:
Cyfrowe:
Binarne:
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 50 / 58
Standardy TV
Obecnie stosowane są następujące standardy telewizyjne:
PAL  625 linii / 50 półobrazów  korekcja błędów (stosowany w Polsce)
Pal cyfrowy - 768x576, 50 półobrazów/s
NTSC  525 linii / 60 półobrazów/s  brak korekcji błędów
NTSC cyfrowy - 768x480, 60 półobrazów/s
HDTV - 1920 × 1080 lub 1280 × 720
Zalety HDTV:
Zwiększona rozdzielczość, przez co większa ilość pikseli sprawia, \e obraz
na du\ych ekranach jest bardziej naturalny.
Obraz jest transmitowany w formacie 16:9, dzięki czemu mo\na w pełni
wykorzystać ekrany panoramiczne montowane w wielu nowych
telewizorach
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 51 / 58
Standardy TV
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 52 / 58
Standardy TV
Dla systemu PAL:
prędkość odtwarzania: 25 klatek na sekundę
wielkość klatki : 720 x 576 pikseli
liczba kolorów: 24 bity.
Ilość pamięci?
1 sekunda: 25 * 720 x 576 * 24 H" 30 MB
H"
H"
H"
1 minuta: 30 MB * 60 H" 1,8 GB
H"
H"
H"
1 godzina: 1.8 GB *60 H" 108 GB
H"
H"
H"
Zapis obrazu wideo wymaga stosowania kompresji stratnej !
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 53 / 58
Kodowanie  dekodowanie obrazu wideo
Kodek (skrót od "koder/dekoder"), - urządzenie lub program
zdolny do przekształcania strumienia danych lub sygnału.
Kodeki mogą zmienić strumień danych w formę zakodowaną (często w celu
transmisji, składowania lub zaszyfrowania) lub odzyskać (odkodować) strumień
danych z formy zakodowanej, by umo\liwić ich odtwarzanie bądz obróbkę.
MPEG (ang. Moving Picture Experts Group) - grupa robocza zajmujÄ…ca siÄ™
rozwojem standardów kodowania audio i wideo.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 54 / 58
Technika kompresji obrazów wideo
Algorytmy stratnej kompresji obrazu (np. MPEG) wykorzystujÄ… metody kompresji
bazujące na analizie mo\liwości i ograniczeń ludzkiego zmysłu wzroku:
Podpróbkowanie chrominancji. Kolory RGB są zapisywane w standardzie
YUV (Y  luminancja (jasność), U, V  chrominancja koloru niebieskiego
i czerwonego). Na ka\de 2x2 punkty luminancji przypada zaledwie jeden punkt
chrominancji U i jeden V.
Kodowanie transformatowe. Obraz ka\dej klatki dzielony jest na bloki o
wielkości 8x8 punktów, a następnie dokonuje się transformacji cosinusową,
Kompensacja ruchu. Zamiast podawania w ka\dej klatce informacji o ka\dym
pikselu, podaje się dane o pikselach, które zmieniły swoje cechy.
Kodowanie Hoffmana (algorytm bezstratny). Informacja o wektorach ruchu i
współczynnikach DCT jest kodowana kodem Huffmana. w którym wartości
bardzo prawdopodobne są reprezentowane przez krótsze ciągi zer i jedynek, a
mało prawdopodobne - przez dłu\sze.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 55 / 58
Kodowanie wideo - kompensacja ruchu
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 56 / 58
Standardy kompresji obrazów wideo
MPEG-1 - format kodowania video o rozdzielczości 352x240 i 25 klatek / sekundę
- strumień danych 1.5Mb/s
- słaba jakość wideo (porównywalna z VHS).
MPEG-2 - rozdzielczość od 352x288 do 1920x1152
- strumień danych 500Kb/s 10Mb/s
- format filmu DVD
MPEG-4 - rozdzielczość od 352x258 do 1920x1088
- strumień danych 20Kb/s do 4 Mb/s
- format filmu DivX 5.1.1
- przesyłanie multimediów w sieci.
AVI (Audio Video Interleaved)  popularne w systemie Windows pliki
zawierające dane wideo i audio, tworzone za pomocą ró\nych koderów.
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 57 / 58
Formaty płyt wideo
format rozdzielczość strumień obrazu Dzwięk Kodek
VCD 352x288 1150 224 kb/s MPEG-1
Video CD 44,1 KHz
SVCD 480x576 2600 384 Kb/s MPEG-2
44.1 kHz
Xsvcd 352x576 do 9 Mb/s 48 KHz MPEG-2
480x576 zmienny zmienny bitrate
zmienna
DVD video 720x576 zmienny analogowy lub cyfrowy, MPEG-2
zmienny 48 kHz
zmienny bitrate.
do 8 kanałów
Technologie informacyjne  grafika, dzwięk, video Autor: Paweł Rogaliński  Instytut Informatyki, Automatyki i Robotyki PWr 58 / 58


Wyszukiwarka

Podobne podstrony:
Rozdział 09 Grafika PC
2 09 Grafika (2)
Fabryka dźwięków syntetycznych 2010 11 09 Cover Edition
09 GIMP tworzenie grafiki na potrzeby WWW (cz2)
Fabryka dźwięków syntetycznych 2010 09 26
2009 09 Dual Image Controlling Monitors & Video Projectors with Randr
2010 09 Ćwiczenie 4 Korektor barwy dźwięku
2008 09 Trzy wymiary Blendera [Grafika]
Fabryka dźwięków syntetycznych 2010 09 05 Dub Techno Edition
Fabryka dźwięków syntetycznych 2010 09 12 Chillout Edition
pref 09
amd102 io pl09
2002 09 Creating Virtual Worlds with Pov Ray and the Right Front End
Wyświetlacz MMI z 6 kanałowym procesorem dźwięku (9VD)
Analiza?N Ocena dzialan na rzecz?zpieczenstwa energetycznego dostawy gazu listopad 09

więcej podobnych podstron