Analogowy zapis dźwięku i obrazu
Kaseta magnetofonowa
Kaseta magnetofonowa (CC lub z ang. Compact Cassette – kaseta kompaktowa), to kaseta
przeznaczona do magnetofonów kasetowych opracowana przez firmę Philips w 1963 roku.
Służy również jako nośnik do przechowywania danych.
Standard kasety magnetofonowej opracowany przez Philipsa w 1963 roku. Szerokość taśmy
magnetycznej w kasecie wynosi 3.81 mm (0.15 cala), a prędkość przesuwu 4.76 cm/s.
Wymiary kasety wynoszą odpowiednio: długość 102 mm, szerokość 64 mm i grubość 12 mm.
Najczęściej spotykane są kasety C60 (taśma o długości 85 m i grubości 18 mikronów). Daje
to długość nagrania 2 × 30 minut. Kaseta C90 (2 × 45 minut) ma 132 m długości i 12
mikronów grubości. Kaseta C120 ze względu na zbyt delikatną i cienką taśmę nie jest często
stosowana.
Były produkowane przez: 3M, AGFA, BASF, Grundig, Hitachi, JVC, Maxell, Memorex,
Philips, Scotch, Sony, TDK, Technics Toshiba i inne mniejsze firmy. W Polsce produkowana
przez: Zakłady Wyrobów Chemicznych CHEMITEX STILON w Gorzowie Wielkopolskim
oraz Zakłady Wyrobów Chemicznych CHEMITEX WISKORD w Szczecinie.
Nośnikiem magnetycznym taśmy jest:
•
Type I (Normal position, IEC-I, normalna, żelazowa) – Fe
2
O
3
•
Type II (High position, IEC-II, chromowa) – CrO
2
•
Type III (IEC-III, mieszana, chromowo-żelazowa) – FeCr – standard używany bardzo
krótko w latach 70. XX wieku
•
Type IV (Metal position, IEC-IV, metalowa) – Fe
Kasety magnetofonowe należały niegdyś – obok płyt gramofonowych do najpopularniejszych
nośników dźwięku, a przed upowszechnieniem się płyt kompaktowych CD – jako nośnik
danych. Używana była jako pamięć masowa w popularnych komputerach 8-bitowych jak:
Atari, Commodore, ZX Spectrum, Timex, Amstrad CPC.
VHS
VHS (ang. Video Home System, czasami błędnie rozwijany jako Vertical Helical Scan, co jest
określeniem systemu zapisu) - w latach osiemdziesiątych i dziewięćdziesiątych popularny
standard zapisu i odtwarzania kaset wideo przeznaczony dla rynku konsumenckiego.
Historia
System został opracowany przez firmę JVC w roku 1976. Pierwszym magnetowidem tego
systemu produkowanym seryjnie był JVC HR-3300 zaprezentowany w połowie 1976 roku. W
latach osiemdziesiątych VHS wygrał walkę o prymat na rynku z konkurencyjnymi formatami
Betamax (opracowanym przez Sony) oraz video 2000 (Philips), które były bardziej
zaawansowane technologicznie. O zwycięstwie formatów zadecydowała niska cena VHS oraz
błędy w polityce firmy SONY, która kupując pod koniec lat 80. licencje na VHS zaprzestała
promocji Betamaxa, oraz zakazując wydawania na swoim nośniku filmów pornograficznych,
które na VHS były ogólnie dostępne.
Z dniem 28 października 2008 firma JVC zakończyła produkcję nośników VHS.
Produkowała je jako ostatnia, powodem zakończenia produkcji było wyparcie popularnych
"kaset" przez płytę DVD. Już w 2001r. więcej filmów sprzedano na nowoczesnych nośnikach
niż na relikcie lat 80 i 90 XX w.
Dane techniczne
Rozdzielczość pozioma obrazu w formacie VHS wynosi 240 linii, a w odmianie HQ - 250
linii. Wymiary kasety w mm 188 × 104 × 25, czas zapisu maks. 300 minut (istnieje
możliwość podwojenia i potrojenia ze stratą jakości).
W formacie VHS fonia zapisywana jest wzdłuż taśmy przy krawędzi; przy przesuwie 2,34
cm/sek uzyskuje pasmo 80 Hz—10 kHz. Wobec wymagań polepszania jakości dźwięku
opracowano w latach 80. sposób zapisu na poziomie hi-fi dodatkowymi głowicami
wirującymi w głębszej warstwie taśmy tzw. multipleks głębokościowy. Skos ścieżek audio
jest inny od skosu ścieżek video, co uniemożliwia zakłócenia między nimi. Osiągnięte pasmo:
20 Hz—20 kHz, dynamika powyżej 90 dB. Magnetowidy tego typu oznaczone są VHS hi-fi,
mają minimum 4 głowice na bębnie wizyjnym (2 video + 2 audio).
Pokrewne formaty
S-VHS
Istnieje także format S-VHS (Super-VHS) opracowany na bazie VHS, zapisujący jednak
sygnał na wyższej częstotliwości, a więc kompatybilny z VHS tylko w jedną stronę. Oznacza
to, że nie można odtwarzać kaset S-VHS na magnetowidzie VHS, odwrotnie tak. Sygnał w
magnetowidach S-VHS na wyjściu rozdzielony jest na dwie składowe: luminancję
(informacja o jasności) i chrominancję (informacja o kolorze), dzięki czemu barwy są lepiej
reprodukowane a rozdzielczość przewyższa 400 linii. W formacie S-VHS standardowo
dźwięk zapisywany jest na poziomie hi-fi. Modele najwyższej klasy 7-głowicowe posiadają
dodatkową głowicę kasującą (4 video + 2 audio + 1 flying erase head).
VHS-C
Kompatybilny ze standardowym VHS jest mikro format VHS-C, który po załadowaniu do
kasety matki jest odtwarzany w standardowym magnetowidzie VHS. Pracująca na mniejszych
kasetach pochodna VHS znalazła zastosowanie w domowych kamerach video. Analogicznie
opracowano kamery S-VHS-C.
D-VHS
Istnieje także odmiana D-VHS (Digital VHS, początkowo Data VHS), oparta o kasety o
takich samych właściwościach jak S-VHS, jednak od czasu ekspansji DVD jest produktem
kolekcjonerskim. Format ten zapewnia dobrą jakość obrazu cyfrowego na poziomie 500 linii
przy bardzo długim czasie nagrywania na kasecie: nawet do kilkunastu godzin obrazu
cyfrowego przyzwoitej jakości, lub kilkudziesięciu godzin przy jakości VHS (ok. 250 linii).
Fenomen tych magnetowidów to także jakość nagrań analogowych VHS na poziomie 300
linii oraz możliwość rejestracji cyfrowo w formacie HDTV (High Definition TV) w
rozdzielczości 1080 linii - jeżeli strumień danych nie przekracza 14,1 Mbit/s na jednej
czterogodzinnej kasecie E-240 S-VHS mieści się ok. 5,75 godziny video w jakości
wielokrotnie przekraczającej standard DVD. To wszystko przy możliwości bezstratnego
kopiowania i zgrywania, którą zapewnia technologia cyfrowa. System wręcz idealny, jednak
mniej wygodny od płyty DVD, co prawdopodobnie zdecydowało o jego rynkowej przegranej.
Kaseta wideo
Z Wikipedii
Brak wersji przejrzanej
Skocz do: nawigacji, szukaj
Kaseta wideo, system VHS
Kaseta wideo (ang. Video Casette, stąd także kaseta video) — kaseta z taśmą magnetyczną
przeznaczona do zapisu, przechowywania i późniejszego odtwarzania sygnału
audiowizualnego w magnetowidzie.
Pierwsze standardy budowy i działania kaset wideo oraz odpowiednich urządzeń powstały
jeszcze w latach 70. Pierwszą kasetę VHS wyprodukowała japońska firma JVC. W 1975 r.
powstał standard Betamax, rok później VHS, a pod koniec lat 70. format Video 2000.
Standardy różnią się samą techniką zapisu informacji, szerokością taśmy, maksymalną
długością nagrania oraz obudową (kasetką).
W połowie lat 80. najpopularniejszy stał się format VHS i współcześnie przez "kasetę wideo"
najczęściej rozumie się właśnie kasetę VHS. Udoskonaloną formą tego standardu jest kaseta
S-VHS.
Inne formaty kasetowe: Video 8mm (taśma 8mm metaliczna), VCR LP (szpulki położone
współosiowo), CVC (minikasetka z taśmą 6mm), V-Cord I i II (pierwszy kasetowy
magnetowid domowy) oraz Quasar VX.
Magnetowid
Magnetowid – urządzenie elektroniczne służące do zapisu i odtwarzania obrazu (wizji) i
dźwięku (fonii) na specjalnych kasetach. Ze względu na budowę rozróżnia się urządzenia
studyjne oraz urządzenia domowego użytku. Magnetowidy, jako urządzenia domowego
użytku wyposażone są w odbiornik sygnału telewizyjnego (ang. tuner). Stanowi to
rozwinięcie wcześniejszego rozwiązania jakim był odtwarzacz wideo oraz urządzenia
przejściowego – odtwarzacza wideo z funkcją nagrywania. Integracja z tunerem skutkowała
wprowadzeniem kolejnej funkcji: programator (ang. timer), pozwalającej użytkownikowi
automatycznie rejestrować programy nadawane przez telewizję; urządzenia bez tunera
telewizyjnego nazywane są potocznie "odtwarzaczami" (czasem "z możliwością
nagrywania"). Zasada ta nie dotyczyła urządzeń studyjnych, gdzie nie wymagany był
zintegrowany odbiornik sygnału telewizyjnego.
Typowo w magnetowidzie sygnał wizyjny zapisywany jest przez zespół głowic (najczęściej 2
lub 4) ustawionych ukośnie względem przesuwającej się taśmy (tzw. zapis helikalny). Fonia
oraz tzw. ścieżka trakująca (synchronizacji) zapisywana jest na brzegu taśmy. Modele
oznaczone symbolem HiFi rejestrują wysokiej klasy dźwięk dodatkowymi głowicami
wirującymi (VHS w głębszej warstwie taśmy), głowicami wizyjnymi razem z pasmem wizji
(Betamax, Video 8 mm) – także cyfrowo PCM (Betamax), lub głowicami wizyjnymi na
przedłużeniu ścieżki wizyjnej cyfrowo w formacie PCM (Video 8 mm). Formaty Betamax,
HiFi i PCM służył również w niektórych studiach nagrań jako wzorcowy magnetofon
edycyjny.
Na przykład magnetowid wyposażony jest w specjalny układ elektroniczny – taki jak w
komputerze – sterujący pracą urządzenia i umożliwiający jego programowanie, np. nagranie
interesującej nas audycji.
Magnetowidy do użytku amatorskiego ("domowe") oferują niezbyt wysoką jakość zapisu
obrazu. Zapis na kasecie VHS w standardzie PAL posiada rozdzielczość pionową jedynie 240
linii w porównaniu do 550 linii obrazu telewizyjnego.
W krajach europejskich najbardziej rozpowszechnionym standardem jest VHS – niestety
najsłabszy z systemów do tej pory opracowanych, nazywany złośliwe często Very Horrible
System.
Inne standardy kasetowe to:
•
sprzęt domowego użytku: S-VHS (400 linii), Hi8 (440 linii), Video 8 mm (260 linii),
Video 2000 (270 linii), W-WHS, D-VHS, Digital-8 (500 linii), MiniDV, VHS-C,
SVHS-C, Betamax (270 linii), SuperBeta (290 linii), ED-Beta (500 linii),
•
sprzęt studyjny: U-Matic, Betacam, Betacam SP, Betacam SX, Digital Betacam,
MPEG IMX, HDVS, HDV, DVCAM, HDCAM, HDCAM SR, DVCPRO,
DVCPRO50, DVCPRO HD, Digital S, MII, D1, D2, D5.
Niektóre z wymienionych standardów zapisu magnetycznego na kasetach z opracowano z
przeznaczeniem prawie wyłącznie do kamer, jednak spotyka się również magnetowidy
obsługujące te standardy bez konieczności stosowania specjalnych adapterów.
W latach 80. używane były również domowe magnetowidy systemów: video 2000 zwany
także video 2x4 (oznaczenie kaset VCC 480 dla kaset dwustronnych 2×4 godziny, 270 linii),
CVC (260 linii – miniaturowy magnetowid na taśmie 6 mm), V-Cord I i II, Quasar VX oraz
VCR LP (format Philipsa produkowany również w PRL, 270 linii – szpulki w kasecie jedna
nad drugą). Warto pamiętać, że najgorszy studyjny magnetowid szpulowy kolorowy z lat 60.
oferował lepszą rozdzielczość i dynamikę niż najlepszy standard amatorski z lat 90.
Obecnie jakość amatorskiego MiniDV można porównywać z jakością studyjną (500 linii).
W ostatnim czasie magnetowidy tracą na popularności na skutek upowszechniania się DVD,
które zapewniają obraz i dźwięk o wyższej jakości w porównaniu z zapisem VHS.
Magnetowidy cyfrowe oraz płyty VCD (Video CD) i DVD-Video przechowują obraz i
dźwięk w postaci skompresowanej. Płyty VCD i DVD-Video nie ulegają zużyciu w trakcie
odtwarzania (w odróżnieniu od wszystkich nośników magnetycznych z zapisem
analogowym). Płyty DVD-Video nie nazywa się celowo dyskami wizyjnymi, gdyż treścią są
zapisywane dane cyfrowe, zawierające zarówno obraz, dźwięk, rozbudowane menu jak i inne
dane przeznaczone do odczytu w komputerach multimedialnych. Obraz na płycie DVD-Video
jest generowany sztucznie i tanie odtwarzacze wyświetlają kolory nie zawsze naturalne.
Dźwięk DVD-Video jest przy tym ostry i nieprzyjemny w porównaniu do dobrego Audio
analogowego na poziomie HiFi (dźwięk zapisywany przez wirujący głowice – BetaHiFi, S-
VHS, HiFi, Video8, Hi8).
DVD-Video oferuje nieco gorszą jakość od kaset MiniDV (mniej artefaktów kompresji na
kasecie).
Formaty dysków wizyjnych rozpowszechnione w latach 80. i 90. XX wieku to np. LaserVison
oraz VHD.
Były produkowane przez znane marki, takich firm jak: Sony, Hitachi, Sanyo, Philips,
Grundig, Samsung, Matsushita (Panasonic, JVC), Sharp, Toshiba, Funai, Aiwa, Akai, Otake,
Goldstar, Manta, Daewoo, LG.
W czasach PRL kupowane były przeważnie z Pewexu.
Głowica elektromagnetyczna
Głowica elektromagnetyczna - element konstrukcyjny urządzeń dokonujących odczytu/zapisu
na nośniku ferromagnetycznym, np drucie stalowym lub taśmie magnetycznie z tworzywa
sztucznego pokrytej materiałem ferromagnetycznym.
Głowica stanowi cewkę, której rdzeń ma szczelinę, nad którą przesuwa się taśma. W czasie
zapisu zmiany pola elektromagnetycznego w szczelinie powodują zmiany namagnesowania
taśmy, a podczas odczytu zmiany pola elektromagnetycznego taśmy powodują wzbudzenie
napięcia w cewce głowicy.
Rdzenie głowic wykonywane są z cienkich blach permalojowych, ze stopów sen-alloy, sen-
dust itp. Głowice posiadają dwie szczeliny : - roboczą -tylną (głowice odtwarzające i
uniwersalne jej nie posiadają) Szerokość szczeliny roboczej dla głowicy zapisującej powinna
by równa połowie grubości warstwy magnetycznej taśmy, zaś dla głowicy odczytującej
szerokość ta powinna być jak najmniejsza aby uzyskać jak największe pasmo przenoszenia
(szerokość szczeliny 0,5-1 µm). W głowicach uniwersalnych jest szerokość szczeliny
roboczej jest kompromisem pomiędzy powyższymi wartościami. Szczelina tylna w głowicy
zapisującej ma redukować pozostałość magnetyczną, unikając w ten sposób trwałego
namagnesowania głowicy.
Taśma magnetyczna
Taśma magnetyczna - jest rodzajem nośnika danych w postaci paska taśmy z tworzywa
sztucznego. Zapis i odczyt taśmy wykorzystuje ferromagnetyzm - taśma pokryta jest
granulkami materiału ferromagnetycznego (najczęściej tlenki żelaza i chromu). Podczas
zapisu głowica elektromagnetyczna za pomocą "silnego" pola ustawia domeny magnetyczne
("namagnesowuje") taśmę, a podczas odczytu wychwytuje zmiany pola spowodowane
różnym namagnesowaniem taśmy. Technologia taśm może wydawać się przestarzała, jednak
jest to nieprawda - obecnie najbardziej pojemnym nośnikiem danych są wciąż taśmy
magnetyczne w streamerach. Jest to spowodowane tym, że taśma po zwinięciu na szpulę ma
ogromną gęstość objętościową zapisu danych (na jednej szpuli może być kilometr taśmy).
Technologie wykorzystujące taśmy magnetyczne:
•
Reel to reel ¼"
- taśma do tzw. magnetofonów szpulowych (szerokość taśmy - ćwierć
cala)
•
Compact casette
- kaseta używana jako nośnik muzyki audio
•
Micro casette
- mniejsza wersja standardu (używana w dyktafonach, automatycznych
sekretarkach)
•
VHS
- kasety video
•
streamer
- urządzenie do magazynowania dużych ilości danych
•
DAT
/DDS - cyfrowe taśmy firmy Sony.
Cyfrowy zapis dźwięku i obrazu
Video CD
Video Compact Disc (VCD) to format zapisu cyfrowego strumienia audio-wideo na płycie
kompaktowej. Format ten jest poprzednikiem DVD.
Specyfikacja techniczna
Video
•
Kodek: MPEG-1
•
Rozdzielczość:
o
NTSC: 352x240
o
PAL/SECAM: 352x288
•
Wymiary (Format):
o
NTSC: 107:80 (0.3% różnicy od 4:3)
o
PAL/SECAM: 4:3
•
Ilość pełnych klatek na sekundę:
o
NTSC: 29,97 (30/1,001) lub 23,976 (24/1,001)
o
PAL/SECAM: 25
•
Bitrate: 1 150 kilobitów na sekundę
o
Zmienność Bitrate'u: CBR (stały)
Ogólna jakość obrazu miała być podobna do VHS, ale ze względu na artefakty i niższą
rozdzielczość obrazu (zwłaszcza pionową) jest zazwyczaj niższa, niż na dobrej jakości
niezużytej kasecie VHS. Z drugiej strony jakość VCD nie spada przy kolejnych
odtworzeniach. Na źle skompresowanych VCD, z szybkim ruchem mogą występować
artefakty blokowe ("pikseloza").
Video CD jest pod większością względów kompatybilne z DVD-Video, poza video
nagranymi z częstotliwością klatek równą 23,976 na sekundę. Standard DVD-Video wymaga,
by każdy strumień wideo MPEG-1 był skompresowany z częstotliwością 25 lub 29,97 klatek
na sekundę.
Audio
•
Kodek: MPEG-1 Audio Layer II
•
Częstotliwość próbkowania: 44 100 herców (44.1 kHz)
•
Kanały: Dwa kanały mono, lub jeden stereo
•
Bitrate: 224 kilobitów na sekundę
o
Zmienność Bitrate'u: CBR (stały)
Jak większość opartych na CD standardów, audio VCD jest niekompatybilne ze standardem
DVD-Video ze względu na różnicę w częstotliwości próbkowania; DVD wymagają 48 kHz,
natomiast VCD używają 44.1 kHz.
Inne informacje
Płyta VCD nagrywana jest na zwykłej płycie CD w przynajmniej dwóch sesjach. Na
pierwszej sesji znajdują się dane sterujące, informacje służące do korekcji błędów i czasem
inne pliki (np. trailery, zdjęcia reklamowe itp.). Na drugiej sesji umieszcza się właściwe pliki
filmu. Może to być jeden lub więcej plików. Ponieważ w tej sesji nie zawarto danych z
informacjami potrzebnymi do korekcji błędów wolna przestrzeń może zostać
zagospodarowana na plik o wielkości np. 770 MB (na płycie 700 MB). Bitrate nagrywanego
plików z video odpowiada temu stosowanemu podczas zapisu CD-Audio, by umożliwić
odczyt tak nagranych płyt czytnikom 1x, które w chwili wdrażania standardu były jeszcze w
użyciu. Pojedyncza płyta VCD może więc przechowywać dokładnie tyle minut video (po
odliczeniu niewielkiej części pojemności zużytej na pierwszą sesję), ile płyta o tej samej
pojemności mogłaby audio, co w porównaniu do kompresji MPEG-4 część 2 przy tej jakości
jest wartością wyjątkowo niską. Płyty VCD mogą być odtwarzane przez komputerowe
napędy CD-ROM oraz stacjonarne (podłączane do telewizora) odtwarzacze VCD. Również
odtwarzacze DVD potrafią odtwarzać VCD.
Video CD zostało wprowadzone przez koncerny Philips i Sony w roku 1993. Był to standard
VCD 1.1.
W 1995 roku rozwinął się standard do VCD 2.0. Dodano obsługę: MPEG Segmented Play
Items (SPI), zdjęć, strumieni muzyki (bez obrazu), interaktywnej kontroli odtwarzania (PBC),
łączenia możliwości odtwarzania zarówno zawartości w standardzie NTSC, jak i PAL,
wyższej jakości muzyki (bitrate 384kbps) oraz kilka pomniejszych rzeczy.
Udoskonaloną wersją VCD jest standard SVCD, który pozwala zapisać na standardowej
płycie CD film skompresowany kodekiem MPEG-2 - tym samym, co w DVD, ale z mniejszą
rozdzielczością obrazu.
Istnieje wiele wariacji standardu VCD, między innymi XVCD, który pozwala na uzyskanie
większej jakości kosztem krótszego czasu nagrania. Tylko niektóre urządzenia odtwarzające
VCD radzą sobie z tymi modyfikacjami.
Najefektywniejszą metodą nagrania filmu na płycie CD-R jest jednak użycie jednego z
nowoczesnych kodeków, takiego jak XviD, zgodny z MPEG-4 część 2, wspierany przez
większość nowszych odtwarzaczy.
CD-Audio
CD-Audio, Audio-CD, CD-DA (ang. Compact Disc Digital Audio) – standard cyfrowego
zapisu dźwięku na płycie kompaktowej, wykorzystujący do tego celu kodowanie PCM o
częstotliwości próbkowania 44,1 kHz i rozdzielczości 16 bitów na próbkę.
Opis
Płyta CD pozwala na zapis dwóch kanałów (stereo). Muzyka jest podzielona na ścieżki, po
których można przeskakiwać bez konieczności przewijania. Jeśli płyta została zapisana w
systemie Track-At-Once (TAO) między ścieżkami będzie 2-sekundowa przerwa, można to
ominąć nagrywając płytę w systemie Disc-At-Once (DAO).
Dane zapisywane na dysku CD-Audio poddawane są kodowaniu CIRC, służącemu do
korekcji błędów, a następnie kodowaniu kanałowemu EFM, zwiększającemu upakowanie
danych.
CD-DA zawiera standardowo 74 minuty nagrania podzielonego na maksymalnie 99 części.
Przy największym dopuszczalnym zwężeniu rowka (1,497 µm) długość nagrania można
zwiększyć do 79 minut i 40 sekund (przy przekroczeniu standardów - nawet do 90 albo 99
minut, przy czym takie płyty powodują dużo problemów z odczytem, szczególnie w starszych
odtwarzaczach).
Płyty CD-DA charakteryzują się dosyć wysoką jakością dźwięku, a przy tym są stosunkowo
odporne na zabrudzenia (kurz, odciski palców) i zarysowania.
Historia
Pierwsza płyta kompaktowa CD-DA pojawiła się na rynku w 1982. Była ona wypromowana
pod naciskiem przemysłu fonograficznego. Trzy lata później, w 1985 nośnik przystosowano
dla potrzeb PC i stał się on najbardziej popularnym uniwersalnym medium, które - jak na owe
czasy - miało dosyć dużą pojemność 636 MB. Pierwotnym przeznaczeniem płyt CD-DA było
przechowywanie muzyki. Z czasem opracowano systemy danych dostosowane do różnej
zawartości płyty (dane, sekwencje wideo).
DVD-Audio
DVD-Audio - format zapisywania muzyki na płytach DVD. Daje on możliwość zapisu
sygnału monofonicznego, stereofonicznego, a także przestrzennego (5.1). Rozwiązanie to
oferuje również możliwość zapisu dźwięku z różną częstotliwością próbkowania (44,1 / 48 /
88,2 / 96 / 176,4 lub 192 kHz) oraz różną rozdzielczością bitową (16, 20 lub 24 bity). Ponadto
istnieje możliwość ustawiania różnej częstotliwość próbkowania oraz rozdzielczość bitowa
dla poszczególnych tracków na płycie oraz w obrębie poszczególnych kanałów systemu 5.1.
Format DVD-A przewiduje również przenoszenie metadanych związanych z algorytmem
downmixu.
Obecnie format ten nie jest popularny, m.in. ze względu na wyższą cenę urządzeń
potrafiących odtwarzać płyty w nim nagrane, ograniczoną dostępność muzyki w tym
formacie, i w końcu niewielkie zapotrzebowanie na korzyści oferowane przez DVD-Audio.
Ponadto istnieje drugi, konkurencyjny format zapisu muzyki - SACD.
DVD-Video
DVD-Video to standard definiujący zawartość dysków DVD.
Standard DVD-Video definiuje następujące elementy:
•
system plików na płycie DVD to najczęściej ISO 9660, taki sam jak na płytach CD-
ROM
•
rozmieszczenie plików na płycie, ich nazewnictwo
•
format zapisu wideo - algorytm kompresji stratnej MPEG-2 (najczęściej stosowane
rozdzielczości to 720×576 dla systemu PAL i 720×480 dla NTSC)
•
format zapisu dźwięku - standardowo każda ścieżka musi być zapisana w jednym z
poniższych formatów:
o
zwykłe, nieskompresowane PCM
o
Dolby Digital (AC-3)
o
MPEG-2 audio
•
opcjonalnie:
o
DTS
o
SDDS
•
jak oba strumienie (tj. audio i wideo) są połączone sobą - w plikach VOB.
Możliwości, jakie oferuje DVD-Video:
•
ponad 2 godziny filmu w wysokiej jakości (maks. 8 lub do 30 godzin filmu o jakości
VHS)
•
skalowanie 4:3 i 16:9
•
osiem wysokiej jakości ścieżek audio, każda z maks. 8 kanałami
•
do 32 zestawy napisów
•
do 9 ustawień kamery do wyboru podczas odtwarzania
•
menu startowe i możliwość tworzenia prostych programów interaktywnych (gry itd.)
•
brak konieczności przewijania, bezpośredni dostęp do wybranego momentu filmu
poprzez sceny (ang. chapters), tytuły (ang. titles) oraz podanie dokładnej lokalizacji
(godziny/minuty/sekundy)
Większość odtwarzaczy DVD oferuje jeszcze opcje takie jak:
•
zoom 2×, 4×
•
zwalnianie/przyśpieszanie tempa odtwarzania filmu
•
możliwość odtwarzania płyt CD-Audio, niektóre radzą sobie też z muzyką w formacie
MP3 i WMA oraz filmami w DivX.
Kodeki
Kodek jest skrótem od "koder/dekoder", co oznacza urządzenie lub program zdolny do
przekształcania strumienia danych lub sygnału. Kodeki mogą zmienić strumień danych w
formę zakodowaną (często w celu transmisji, składowania lub zaszyfrowania) lub odzyskać
(odkodować) strumień danych z formy zakodowanej, by umożliwić ich odtwarzanie bądź
obróbkę. Kodeki są często użyte w wideokonferencjach oraz strumieniowaniu obrazu lub
dźwięku.
Na przykład wiele multimedialnych strumieni danych potrzebuje zawierać jednocześnie dane
dźwiękowe i obraz oraz często metainformacje opisujące np. synchronizację dźwięku i
obrazu. Każdy z tych trzech fragmentów strumienia danych może być opracowany przez
oddzielne programy, sprzęt i procesy, lecz aby strumień danych multimedialnych był
użyteczny, musi być połączony. Do tego właśnie służą kontenery multimedialne.
Kodeki są często mylone z formatami danych (kontenerami multimedialnymi) używanymi do
przechowywania zakodowanego dźwięku i obrazu (np. ".ogg", ".mpg", ".avi", ".mov", ".mkv"
itp).
DivX
DivX - stratna metoda kompresji obrazu filmowego, w nowszych wersjach zgodna z MPEG-4
część 2, pozwalającą zapisać na zwykłej płycie kompaktowej filmy o długości ok. 90 min. i
jakości niewiele ustępującej DVD-Video. Wykorzystywana także do przesyłania filmów
przez Internet.
Do odtwarzania wymagany jest układ komputerowy posiadający odpowiednio wydajny
procesor do dekodowania programowego (np. komputer osobisty lub konsola Xbox) lub
dekoder sprzętowy (np. w niektórych odtwarzaczach DVD).
Pierwotnie pod nazwą "DivX ;-)" występowała nielegalnie udostępniona, zmodyfikowana
wersja kodeka MPEG 4 autorstwa Microsoftu. Warto jednak zauważyć, że kodek ten,
pomimo sugerującej to nazwy, nie jest zgodny ze standardem MPEG-4 (tak samo DivX 3) -
Microsoft nazwał go tak ponieważ myślał, że zostanie on właśnie wybrany jako ten standard.
Ponieważ tak się nie stało, kolejne wersje tego kodeka nosiły już nazwę Windows Media
Video. Autorzy DivX-a postanowili jednak stworzyć własną implementację kodeka MPEG-4.
W ten sposób powstał Project Mayo, z którego następnie wykształcił się obecny, komercyjny
DivX oraz otwarty XviD. Wersje DivX od 4 wzwyż są zgodne ze standardem MPEG-4 ASP.
Xvid
Xvid (dawniej XviD) - stratny kodek obrazu zgodny z ISO MPEG-4 część 2, wydany na
licencji GNU GPL. Jego nazwa jest celowym anagramem nazwy kodeka DivX, który jest
zamkniętą implementacją tego samego standardu.
Xvid to najczęściej stosowany kodek w sieciach p2p. Używany jest do kompresji plików
filmowych.
MPEG
MPEG (ang. Moving Picture Experts Group) - grupa robocza ISO/IEC zajmująca się
rozwojem standardów kodowania audio i wideo, a także zatwierdzona przez ISO grupa
powszechnie stosowanych formatów zapisu danych zawierających obraz i dźwięk. Wśród
tych standardów znajdują się m.in. najpopularniejszy format kompresji dźwięku, stosowany w
komputerach osobistych i odtwarzaczach przenośnych MP3 oraz opracowany dość dawno
przez grupę niezależnych ekspertów standard używany jest do zapisu filmów Video CD,
DVD i transmisji telewizji cyfrowej (MPEG 2).
Grupa MPEG powstała w 1988 roku, do pierwszego spotkania doszło w maju 1988 w
Ottawie. Jej celem było opracowanie standardu kodowania wideo wraz z dźwiękiem. Rozwój
technologii wymógł konieczność opracowania sposobu kompresji, ponieważ np. obraz PAL
zwykle składa się 25 klatek na sekundę, 720 punktów w poziomie i 576 punktów w pionie, a
kolor każdego z tych punktów opisany jest 24 bitami. Oznacza to, że każda sekunda
nieskompresowanego obrazu w standardzie PAL ma wielkość prawie 30 megabajtów. Jak
łatwo wyliczyć półtoragodzinny film zajmie ponad 156 gigabajtów - zmieści się na 224
krążkach CD. Ponieważ taka ilość danych drastycznie przekraczała możliwości dostępnego na
ówczesnym rynku konsumenckim sprzętu, zarówno jeśli chodzi o możliwości składowania
danych, jak i ich przesyłu czy odczytu z nośników danych, cyfrowe odtwarzanie wideo
wymagało opracowania wydajnych standardów kompresji.
Formaty
W 1991 roku opracowano oficjalną specyfikację standardu MPEG-1. Obraz ma w nim
rozdzielczość 352x240 punktów i jest wyskalowany do odtwarzania pełnoekranowego, a
przepustowość wynosi 1,5 Mb/s. Trzecia warstwa standardu MPEG-1 dotyczy kodowania
dźwięku i jest wykorzystywana w popularnym formacie MP3.
W roku 1994 pojawiła się specyfikacja standardu MPEG-2, w którym maksymalna
rozdzielczość obrazu wynosi 1920x1152 punktów, a prędkość transferu waha się między 3 a
130 Mb/s.
MPEG-3 został oryginalnie zaprojektowany dla HDTV, został jednak porzucony gdy okazało
się, że format MPEG-2 jest dla telewizji wysokiej rozdzielczości w zupełności wystarczający.
MPEG-4 jest przystosowany głównie do kompresji danych strumieniowych
(wideokonferencje), dlatego posiadał zaimplementowane funkcje ochronne przed błędami
przesyłu. Ich usunięcie i drobne usprawnienia w części 2 standardu przez młodego Francuza
Jerome Rota zaowocowało powstaniem kodeka DivX ;-). Od tej pory rozpoczął się
dynamiczny rozwój tej gałęzi multimediów, oraz powstanie coraz bardziej wydajnych
kodeków, takich jak XviD. Część 3. standardu MPEG-4 opisuje kodek audio AAC. Część 10.
opisuje jeszcze wydajniejszy algorytm kompresji, nazwany AVC - Advanced Video Coding
(zalecenie ITU-T H.264).
MPEG-7 to standard opisu danych multimedialnych. Umożliwia zapis informacji o cechach
obrazu: kształtach, kolorach, teksturach. Na podstawie tych danych możliwe jest szybkie i
trafne odnajdywanie obrazów podobnych do siebie.
MPEG-21 to przyszłościowy standard, mający na celu dalszą standaryzację treści
multimedialnych.
Techniki kompresji
[edytuj]
W kodowaniu obrazu MPEG 1, 2 i 4 wykorzystywane są różne metody kompresji bazujące na
analizie możliwości i ograniczeń ludzkiego zmysłu wzroku:
•
Podpróbkowanie chrominancji. W obrazie cyfrowym kolor każdego punktu kodowany
jest przy pomocy trzech 8-bitowych wartości. Informują one o nasyceniu punktu
kolorami: czerwonym (red), zielonym (green) oraz niebieskim (blue)- standard RGB.
W cyfrowym obrazie wideo do zdefiniowania koloru punktu używa się standardu
YUV, w którym używane są parametry luminancji (jasności, oznaczenie Y) oraz
chrominancji (unikatowy kolor, oznaczenie U i V). Aby zobaczyć obraz wideo należy
przeprowadzić konwersję danych o kolorach ze standardu RGB na YUV. Jak
wykazały badania, informacja kolorystyczna ma mniejsze znaczenie dla ludzkiego
oka, dlatego stosuje się "podpróbkowanie" - najczęściej na każde 2x2 punkty
luminancji przypada zaledwie jeden punkt chrominancji U i jeden V.
•
Kompensacja ruchu. Często w filmach występują momenty, w których na ekranie
ruszają się tylko postacie, a tło pozostaje niezmienione (np. sceny rozmowy). Zamiast
podawania w każdej klatce informacji o każdym pikselu, podaje się dane o pikselach,
które zmieniły swoje cechy. Dla każdego makrobloku (16x16 punktów) oblicza się
wektor, wskazujący na miejsce w klatce odniesienia (najczęściej jest to poprzednia
klatka filmu), które jest najbardziej podobne do kodowanego makrobloku. Do
odbiornika przesyła się wartość wektora i różnicę względem "podobnego"
makrobloku. Ta operacja pozwala na ogromną redukcję przesyłanych danych.
•
Kodowanie transformatowe. Obraz każdej klatki dzielony jest na bloki o wielkości
8x8 punktów, a następnie dokonuje się na takim bloku operacji matematycznej
nazywanej transformatą cosinusową, która informację o wszystkich 64 punktach
pozwala zapisać na zaledwie kilku liczbach bez zauważalnej straty jakości.
•
Kodowanie Huffmana. Informacja o wektorach ruchu i współczynnikach DCT jest
kodowana kodem Huffmana. Wartości bardzo prawdopodobne są reprezentowane
przez krótsze ciągi zer i jedynek, a mało prawdopodobne - przez dłuższe.
Podsumowując: najpierw następuje odtworzenie informacji zero-jedynkowej przy pomocy
dekodowania Huffmana. Uzyskuje się dwa rodzaje klatek: kluczowe — zawierające pełne
obrazy oraz predykcyjne, zawierające różnice między klatkami kluczowymi i oryginalnymi w
filmie. Następnie strumienie bitów z klatek predykcyjnych są poddawane odwrotnej
transformacji cosinusowej celem odtworzenia przybliżonych obrazów, będących wynikiem
poprzesuwania bloków z klatki odniesienia zgodnie z wektorami ruchu. Następnie obrazy te
są dodawane do klatek odniesienia (również odtworzonych za pomocą odwrotnej
transformacji cosinusowej), dzięki czemu odtworzone zostają pozostałe klatki filmu. Tak w
skrócie wygląda uzyskanie obrazu poddanego kompresji MPEG.
Niestety, aby odtworzyć tak skompresowany film jest potrzebny komputer o odpowiedniej
mocy obliczeniowej. Do VideoCD wystarczy już Pentium 166 MHz. Do DivX uważa się, że
procesor 300 MHz obciążony minimalnie przez system operacyjny jest w stanie sobie
poradzić z dekompresją w czasie rzeczywistym.
Rozwój technologii informatycznej – rosnąca moc obliczeniowa i spadające koszty sprzętu
komputerowego czynią tę przeszkodę coraz mniej istotną, co zaowocowało m.in.
przenośnymi odtwarzaczami DVD czy możliwością odtwarzania plików wideo m.in. w
standardzie H.264 na piątej generacji odtwarzaczy iPod.
MP3
MP3 (ang. MPEG-1/2 Audio Layer-3) to format stratnej kompresji dźwięku opierający się na
zmodyfikowanej dyskretnej transformacie cosinusowej i używający modelu
psychoakustycznego. Format został stworzony we Fraunhofer-Institut für Integrierte
Schaltungen. Przy tworzeniu jego pierwszej implementacji wykorzystywany był m.in. utwór
Suzanne Vegi Tom's Diner w celu dostosowania kompresji do brzmienia ludzkiego głosu.
Pliki w tym formacie posiadają rozszerzenie .mp3.
Kompresja
Pierwotnie do kompresji MP3 stosowano Constant Bit Rate (CBR), czyli do każdej ramki
używano tej samej ilości bitów. Współcześnie używa się częściej Variable Bit Rate (VBR)
charakteryzującego się zmienną przepływnością w wybranym przedziale podczas kodowania.
CBR dostępne w MP3:
•
8 kb/s
•
16 kb/s
•
24 kb/s
•
32 kb/s
•
40 kb/s
•
48 kb/s
•
56 kb/s
•
64 kb/s
•
80 kb/s
•
96 kb/s
•
112 kb/s
•
128 kb/s
•
160 kb/s
•
192 kb/s
•
224 kb/s
•
256 kb/s
•
320 kb/s
Kanały
Kodowany dźwięk może posiadać postać zarówno jednokanałową (mono) jak i dwukanałową
(stereo). Istnieje też format MP3 Surround (do zapisu dźwięku wielokanałowego 5.1)
wstecznie zgodny z wcześniejszym standardem.
Stereo
Dla dźwięku stereofonicznego format MP3 posiada trzy tryby kompresji:
•
dual channel – w którym dźwięk jest zapisywany jako dwa odrębne kanały
monofoniczne.
•
stereo (stereo mode 0) – w którym każda ramka zapisywana jest algorytmem left/right
stereo
.
•
joint stereo (stereo mode 1) – w którym dla każdej ramki wybierany jest najlepszy dla
niej algorytm zapisu dźwięku stereo.
Stosowanymi w kompresji MP3 algorytmami kodowania ramki dźwięku stereofonicznego są:
•
left/right stereo (simple stereo, independent channel) – w którym dźwięk w kanałach
prawym i lewym jest kodowany niezależnie, może jednak zmieniać się liczba bitów
przeznaczonych na każdy z kanałów. Efektywny dla ramek, w których oba kanały
różnią się w dużym stopniu.
•
middle/side stereo – w którym sygnał stereo kodowany jest w postaci pary wartości
oznaczających sumę (L+R) oraz różnicę (L-R) kanałów. Efektywny dla ramek, w
których oba kanały przyjmują podobne wartości.
•
intensity stereo – w którym sygnał stereo dla niektórych (głównie wysokich)
częstotliwości kodowany jest jako monofoniczna wartość uzupełniona o wektor
określający kierunek, z którego dochodzi dźwięk. W praktyce stosowany tylko przy
niskiej przepływności (poniżej 80 kbps). Niektóre enkodery (np. LAME) w ogóle nie
stosują tego algorytmu.
MP3 Surround
Rozszerzenie formatu mp3 stworzone przez twórców tego formatu pozwalające na zapis
formatu 5.1. Zapisywane są dwa kanały tak jak we zwykłej mp3, a informacja potrzebna do
wygenerowania dodatkowych kanałów jest zapisana w Tagach mp3. Dzięki temu rozwiązaniu
mp3 można odtwarzać jako zwykłe stereo na odtwarzaczach sprzętowych. Zapisanie
dodatkowych kanałów zajmuje mało miejsca (ponieważ zapisywana jest informacja jak z
dwóch kanałów wygenerować inne). Najprawdopodobniej to rozwiązanie zostanie
skopiowanie do innych kompresorów dźwięku.
[1]
WAV
WAV ( ang. waveform audio format ) - format plików dźwiękowych stworzony przez
Microsoft oraz IBM. WAVE bazuje na formacie RIFF, poszerzając go o informacje o
strumieniu audio, takie jak użyty kodek, częstotliwość próbkowania czy ilość kanałów. WAV
podobnie jak RIFF został przewidziany dla komputerów IBM PC, toteż wszystkie zmienne
zapisywane są w formacie little endian. Odpowiednikiem WAV dla komputerów PowerPC
jest AIFF.
Mimo że pliki WAVE mogą być zapisane przy użyciu dowolnych kodeków audio, zazwyczaj
stosuje się nieskompresowany format PCM, który powoduje, że pliki zajmują dużo miejsca
(około 172 kB na sekundę dla jakości CD). Inną wadą formatu jest ograniczenie wielkości
pliku do 4 GB, ze względu na 32-bitowe zmienne. Format WAV został częściowo wyparty
przez formaty kompresji stratnej. Mimo to, dzięki swojej prostocie, nadal znajduje szerokie
zastosowania. Wykorzystywany jest w edycji dźwięku oraz w przenośnych urządzeniach
audio takich jak odtwarzacze i cyfrowe dyktafony.
AVI
AVI (ang. Audio Video Interleave) to kontener danych audiowizualnych. Został
wprowadzony w roku 1992 przez firmę Microsoft jako element strategii przystosowania
systemu Windows do obsługi multimediów, stanowiący część technologii Video for
Windows.
Technologia
Format AVI jest specjalną odmianą formatu RIFF. Od formatu RIFF zapożyczono sposób
zapisywania danych poprzez ich podział na części. Każdy „kawałek” oznaczany jest
identyfikatorem FourCC. Format AVI rozszerza tę technologię dodając dwa lub opcjonalnie
trzy „podkawałki”. Pierwszy z nich (hdrl) stanowi nagłówek pliku i zawiera metadane
określające plik video, takie jak rozmiar obrazu i liczbę klatek. Drugi „podkawałek” (movi)
zawiera właściwe dane audiowizualne. Trzeci opcjonalny (idxl) gromadzi informacje o
położeniu „kawałków” wewnątrz pliku AVI.
Zapisywanie danych umożliwia proces zwany kodowaniem, zaś odczyt - dekodowanie.
Technologia RIFF wykorzystana w formacie AVI daje możliwość kodowania danych
nieskompresowanych lub poddanych kompresji. Najczęściej stosowane w nim formaty
kompresji obrazu to XviD, DivX, Intel Real Time Video, Indeo, Cinepak, MJPEG, Editable
MPEG, VDOWave, ClearVideo/RealVideo, QPEG, MPEG-4 część 2 i inne.