AUDIO
1/11
AUDIO
Nieco informacji na temat AKUSTYKI
Dźwięki – mechaniczna (falowa) natura rozchodzenia się dźwięków w ośrodku sprężystym - częstotliwość 20 – 20 000 Hz, zakres ok. 10 oktaw
Natężenie dźwięku – odwrotnie proporcjonalne do kwadratu odległości Ton dźwięku – harmoniczne (podstawowy i kilka wielokrotnych) Odtwarzanie dźwięków –głośniki elektrodynamiczne – rola obudowy i przegrody w zestawie, subwoofer,
usytuowanie zestawów głośnikowych w pomieszczeniu – tłumienie lub wzmacnianie niskich częstotliwości – zobrazowanie przestrzeni dźwięku, systemy pasywne i aktywne Słuchawki – izolacja od otoczenia (system aktywny redukcji hałasu), pasmo, impedancja, system mocowania na głowie, na (w) uchu, bezprzewodowe, minimalizacja wpływu pomieszczenia na jakość dźwięku
Mikrofony
– pogaduchy internetowe, nauka języków…
– magnetoelektryczne, pojemnościowe , wymagają zasilania, piezoelektryczne Mikrofony wstęgowe (ribbon microphones)
Mikrofon wielo- i jednokierunkowy, efekt bliskości – wzmocnienie niskich tonów (pykanie) Charakterystyki
1. fizyczne – ‘lavaliere’ – shotgun – paraboliczne
2. elektryczne – impedancja (niska – 50-600 Ω, wysoka – 50 kΩ) – poziom sygnału (mV, dB) – sygnał
zrównoważony (dwa przewody + ekran), niezrównoważony (jeden przewód + ekran) Jakość dźwięku – zakres częstotliwości (50-15 000 Hz), kolor dźwięku dr inż. Andrzej Celmerowski acel4@o2.pl
MULTIMEDIA
AUDIO
2/11
Pojęcie: AUDIO – elektryczny równoważnik dźwięku – bez względu na system kodowania analogowy (analog audio) – zazw. napięcie proporcjonalne do natężenia dźwięku cyfrowy (digital audio) – modulacja impulsowo-kodowa PCM (pulse code modulation) -
wartość liczbowa reprezentuje poziom dźwięku w danym momencie
kodowanie analogowo-cyfrowe i cyfrowo-analogowe –
częstotliwość próbkowania (sampling rate) i rozdzielczość (resolution) jakość dźwięku
częstotliwość próbkowania 8 kHz (telefon), 16 (komunikacja multimedialna), 22 i 32 (RTV
cyfrowe), 44,1 (CD), 48 (magnetofony DAT), 96 (DVD), 192 HDTV i HD-DVD
rozdzielczość – 8, 16, 24 lub 32-bitowa
przepływowość – Bit Rate – liczba bitów opisująca 1 sekundę danych (dla MP3 standardowo 96 –
128 – 192 kbit/s) – w odniesieniu do ich odtwarzania (zapisu) w czasie rzeczywistym!
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
3/11
Możliwości PC w zakresie audio
1. wytwarzanie, synteza dźwięków
2. przechwytywanie dźwięków ze świata zewnętrznego
3. miksowanie i edycja generowanych lub przechwyconych dźwięków
4. poprzez MIDI (Musical Instrument Digital Interface) sterowanie procesem wytwarzania dźwięków w innych urządzeniach
5. odtwarzanie całej zarejestrowanej kakofonii poprzez głośniki dowolnego rodzaju pierwsze PC-ty – generator tonów 1,19 MHz – dzielnik 16-bitowy – najniższy - 18 Hz modulacja szerokościowo-impulsowa – zegar płyty głównej
synteza dżwięków
•
substraktywna – różnokształtne generatory – miksowanie – filtracja
•
addytywna – liczne generatory sinusoidalne – miksowanie
•
FM – dwa sygnały sinusoidalne – nośnik i modulator
•
Wave Table (sampling) – charakterystyczne przebiegi falowe przechowywane w tablicy elektronicznej – modyfikacja częstotliwości, filtracja harmonicznych, zmiana czasów narastania, podtrzymywania i wygasania
• technologie zaawansowane
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
4/11
karta dźwiękowa - zadania
- konwersja analogowo-cyfrowa i cyfrowo-analogowa
- synteza własnych dźwięków (niektóre)
- miksowanie dźwięków
- wzmacnianie
- obsługa CD-ROM
- obsługa portu MIDI (Musical Instrument Device Interface)
STANDARDY I ZGODNOŚĆ KARTY
Ad Lib – pierwszy standard
Sound Blaster Live– Creative Labs – 16-bitowy dźwięk cyfrowy, synteza WT (WaveTable), oparta na naturalnych próbkach dźwięku; doskonałe MIDI
Sound Blaster Platinium - rozszerzona, Dolby AC 5.1
AC’97 Audio Codec’97 – standard (Intel) łączący część cyfrową i analogową urządzeń audio (karta dźwiękowa, modem...) w oddzielnym układzie Audio Digital Controller, bądź zintegrowanie go z chipsetem płyty – eliminuje to dublowanie przez urządzenia obróbki tych samych sygnałów, współpraca z urządzeniami standardu AMR – Audio/Modem Riser (46 stykowe złącze na płycie)
DSP (Digital Signal Procesor) – cyfrowy procesor sygnału audio
-
MWave – Texas Instr. I IBM
-
VCOS – AT&T
-
Windows DSP – Windows Sound System
Dolby Digital, DTS Digital Theater 5.1 ma 5 kanałów, potrzebne są 4 głośniki i jedna kolumna niskotonowa.
THX – THXver5.1 standard dźwięku lepszy niż DD, ale mniej rozpowszechniony.
Dolby Surround EX 7.1 - używa kino, 7 kanałów.
Inne standardy: Dolby Digital EX 6.1, DTS (Dolby Theatre System) -ES 6.1
Oznaczenie: 2.1 5.1 6.1 7.1 – cyfra po kropce oznacza sobwoofer, cyfra przed – liczbę głośników satelitarnych otaczających słuchacza
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
5/11
SYSTEMY KODOWANIA AUDIO
Kompresja audio – bardzo uciążliwa programowo
przy jakości CD stereo (dla próbkowania 44,1 kHz i 16-bitowej rozdzielczości) 1 sekunda dźwięku wymaga ok.150 000 bajtów (1 minuta – 10,5 MB)
1. GCIT G.711 A.Law (µ-Law) – metoda kompresji dynamiki amplitudy – telefonia, 2:1, kod 8-b zastępuje 16-bitowy
2. LPC – Linear Predictive Coding - metoda predykcji liniowej – w oparciu o model kanału głosowego (krtaniowy), nienaturalny dźwięk po dekompresji, ‘gadające maszyny’ – militaria, (st.komp. 40)
3. Code Excited Linear Predictor – jw. oraz porównanie wejścia i wyjścia z korekcją błędów 4. GSM 6.10 Audio – metoda pobudzania równomiernego - telekomunikacja, kompresja w czasie rzeczywistym, jakość mowy ludzkiej
5. Microsoft ADPCM (Adaptative Delta Pulse Code Modulation) – metoda przyrostowa, zapamiętywane są tylko różnice między kolejnymi próbkami, kompresja w czasie rzeczywistym, encyklopedia Encarta (st.komp. 4)
6. AC-3 (Dolby Digital) – metoda wierności percepcyjnej – usunięcie informacji percepcyjnie nieistotnej – MPEG-1 cz.3-audio, dyski DVD, HDTV w USA – kanały 5.1
7. AAC (Advanced Audio Coding) – 6 kanałowy system prezentacji dźwięku, 8 kanałów komentatorskich – MPEG-2 cz.7 audio (st.komp. 10)
8. CELP – Code Excited Linear Prediction – metoda pobudzania kodowego (w oparciu o tablice różnicowe dźwięków) – G.728 True Speech – lepsza jakość niż GSM
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
6/11
TECHNOLOGIE AUDIO
–
pliki deskryptorowe – opis sposobu wytwarzania dźwięku, definicje instrumentów (SBI – pojedyncze instrumenty Creative Labs, IBK – deskryptory wielu – 128 –
instrumentów MIDI)
–
pliki sterujące – sterują pracą instrumentów, ‘nuty’ dla syntezatorów (MID dla MIDI, RMI dla Resourche Interchange Format)
–
pliki kształtu fali – bitowy obraz dźwięku – oddaje jego wszystkie niuanse (WAV dla Windows)
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
7/11
FORMATY PLIKÓW AUDIO
AIFF – Audio Interchange File Format – Macintosh i Silicon Graphics Samoopisujące się, spakowane
Bezpośrednio nie są zgodne z PC
IBK Sound Blaster Instrument Bank
Definicja 128 instrumentów, każdy instrument ma 9-bajtową nazwę i 16-bajtowy deskryptor, plik 3024 bajtów
MOD pliki sterujące dla Commodore i Amigi, zaadaptowany dla PC
Komputerowe przeboje ‘combos’
Próbki dźwięków, głosów lub taktów w plikach .SAM
MID Musical Instrument Digital Imterface
Pliki sterujące w multimediach, polecenia dla syntezatorów MIDI
*.MID, .MIDI, .RMI - syntezowane lub próbkowane, bez możliwości zapisu śpiewu, niewielkie pliki, mogą automatycznie wyświetlać partytury i łatwo je programować Struktura
1. wspólny nagłówek
2. porcja ścieżek (truck chunks) – identyfikator i zdarzenia MIDI – czas zdarzenia i rodzaj zdarzenia
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
8/11
RMI – standard IBM i Microsoft MIDI, spełnia normy RIFF
SBI pliki instrumentów dla Sound Blaster Instrument
Definiują pojedyncze instrumenty, synteza FM dla SB, pliki 51-bajtów
SND - platformy Amiga, Apple, NeXT, SUN – różne!
VOC – Sound Blaster
Przechowują zdigitalizowane dane głosowe (i nie tylko)
Struktura
1. blok nagłówkowy – identyfikatory
2. blok danych – podbloki 9 typów (1-mono 8-bit, 8-stereo 8-bit, 9-zastępuje 1 i 8, 2-kontynuacja bloku, 6 i 7-pętle, 3-wyciszenie, 4-synchronizacja z tekstem, 5-dodają tekst) WAV, WAVE
bez kompresji, bardzo dobra jakość i wierność dźwięku
Przechowują próbkowane cyfrowo wartości kształtu fali
Struktura
1. nagłówek identyfikacyjny – identyfikator, rodzaj kodowania, liczba kanałów, częstotliwość próbkowania, głębia bitowa sygnału
2. porcje składowe danych – długość danych, dane
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
9/11
MP3 - część standardu MPEG-1 warstwy 3, niezwykle rozpowszechniony, kompresja (stratna) rzędu kilkunastu, oparta o model psychoakustyczny. Jakość bliska CD wymaga strumienia 128
kbitów/sek, spotykane zakresy od kilkunastu kb/s (mowa, wiadomości strumieniowo, monofonicznie) do 256 kb/s (HI-FI stereo).
Kodowanie VBR (Variable Bit Rate) ze zmienną przepływowością daje nieco lepszą jakość przy tej samej wielkości plików.
Bitrate
jakość dźwięku
gatunek muzyki
poniżej 128
bardzo mocno zniekształcona, metaliczny przydźwięk
128
mocno zniekształcona
dance, techno
160
dobra
rock, elektroniczna
192
bardzo dobra, zbliżona do CD
instrumentalna, poważna jazz
256 i więcej
jakość CD
muzyka poważna
MP3Pro - nieco mniejsze pliki, lepsza jakość, ale mało rozpowszechniony.
VFQ - podobny do MP3, nieco lepsza kompresja ale mało rozpowszechniony.
OGG - używa zmiennego kodowania (VBR), nieopatentowany, wielokanałowy dźwięk przestrzenny.
WMA – mają 1/3 objętości MP3! Przy 48 Kb/s jakość WMA nie ustępuje MP3 przy 128 Kb/s (dźwięki są nieco rozmyte)
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
10/11
MIDI – Musical Instrument Digital Interface
System sterowania do łączenia instrumentów elektronicznych
MIDI – sterowanie zewnętrznymi instrumentami muzycznymi – PC pełni rolę sekwensera
– ‘dyrygenta’ orkiestry
Analogia do zapisu nutowego – MIDI jest zapisem dla całej orkiestry, każdego instrumentu, głosu i dźwięku generowanego przez
syntezator
MIDI to jeszcze jeden port szeregowy w systemie PC – złączki typu DIN jack (5-pinowe) Zazwyczaj MIDI sprzętowo zgodny jest ze standardem Roland MPU-401
General MIDI
16 przypisań instrumentów – każdy dla grupy 8 instrumentów – razem 128 instrumentów 47 dźwięków bębnów (mapa perkusji)
sterowane głosy kierowane są do kanałów – każdy oddzielnie lub razem – kanały 1-9 dla instrumentów, 10 dla perkusji, 11-16 do dyspozycji muzyka
Basic MIDI – 4 kanały (13-16)
Extended MIDI – 10 kanałów (1-10)
dr inż. Andrzej Celmerowski acel4@o2.pl
AUDIO
11/11
Komunikaty MIDI
1. status kanału – kanał podstawowy (basic), steruje urządzeniem podłączonym do MIDI
– kanały głosowe (voice), steruje indywidualnym głosem
2. tryb przekazywania komunikatów przez odbiornik poszczególnym głosom instrumentu
- OMNI – grupuje kanały (on) lub odseparowuje od siebie (off)
-
MONO – scala wszystkie komunikaty kanałów i przesyła je do jednego głosu
-
POLY – kieruje komunikaty z jednego kanału do wszystkich głosów odbiornika 3. informacja systemowa
-
Ogólne – dla wszystkich odbiorników
-
Wyłączne – dla konkretnego odbiornika
-
Czasu rzeczywistego – do synchronizacji zdarzeń
4. aftertouch – 122 specyficznych wartości – siła uderzenia, stan przełączników...
Zakres nut 128 (fortepian: 88, -21, +19), dźwięk ‘middle C’ – pozycja 60
Możliwość synchronizacji z czasem zewnętrznym
dr inż. Andrzej Celmerowski acel4@o2.pl