Systemy operacyjne i sieci komputerowe
Podstawy fizyczne dźwięku
Dźwięk jest wytwarzany przez ciała drgające, które wywołują fale akustyczna.
Docierająca fala powoduje wrażenia dźwiękowe powstające w uchu człowieka. Najprostszym
rodzajem drgań są drgania sinusoidalne. Każde drganie charakteryzują następujące parametry:
amplituda (maksymalne wychylenie membrany z poziomu równowagi)
częstotliwość (liczba drgań membrany na sekundę - Hz). Wielkością odwrotna do
częstotliwości jest okres - czyli czas w którym źródło dźwięku wykonuje jedno pełno
drganie. Amplituda drgań jest związaną z głośnością odbieranego dźwięku. Natomiast
częstotliwość drgań odpowiada za wysokość słyszanego dźwięku. Im większa
częstotliwość tym dźwięk wydaje się być wyższy.
Ludzie słyszą dźwięki z zakresu ok. 15 Hz do 20 kHz. Granice te ulęgają zmianie w
zależności od wieku, stopnia zmęczenia, stanu emocjonalnego itp. Tony poniżej 400 Hz
odbiera się jako niskie, w przedziale 400 Hz - 3000 Hz jako średnie, a powyżej 3 kHz jako
wysokie.
Ton (drganie proste) jest najprostszym dźwiękiem. Jednak większość dźwięków spotykanych
w otoczeniu jest bardziej złożona. Drgania te można przedstawić jako suma pewnych drgań
prostych o różnych częstotliwościach i amplitudach. Dźwięki takie nazywa się wielotonami.
Jeżeli w widmie dźwięku wszystkie występujące składowe są całkowitą wielokrotnością
pewnej częstotliwości, to dźwięk taki nazywa się wielotonem harmonicznym, a każdy jego
ton to składowa harmoniczna. Ton podstawowy jest to ton będący największym wspólnym
podzielnikiem tonów składowych. Subiektywne wrażenie wysokości wielotonu jest związane
z tonem podstawowym. Może on w ogóle nie występować, a będzie słyszany. Np. jeśli
docierający dźwięk daje sie rozłożyć na tony harmoniczne o częstotliwościach 440 Hz, 660
Hz i 880 Hz, to wysokości dźwięku słyszanego będzie odpowiadać częstotliwości 220 Hz.
Inna kategoria dźwięku są szumy - czyli dźwięk, którego widmo akustyczne jest ciągłe, tzn.
Występują w nim wszystkie częstotliwości składowe. Jeżeli wszystkie częstotliwości
składowe maja te same amplitudy, to szum taki nazywa się białym. W przypadku, gdy
niektóre zakresy częstotliwości maja większe amplitudy niż inne, szum taki nazywa się
kolorowym.
Obwiednia dźwięku jest zależnością amplitudy od czasu. W największym przybliżeniu w
obwiedni dźwięku wyróżnić cztery fazy:
narastanie (attack); amplituda dźwięku narasta od zera do głośności maksymalnej
opadanie (decay);
dźwięk nieco zmienia swoja głośność ustalenie (sustain);
natężenie dźwięku trwa przez pewien czas na ustalonym poziomie - wybrzmiewanie
(release);
głośność dźwięku maleje do zera.
Obwiednie nazywa się często obwiednia ADSR (skrót od pierwszych liter poszczególnych
faz). Czasy trwania każdej z faz są charakterystyczne dla różnych instrumentów i dodatkowo,
obok barwy, ułatwiają rozpoznanie instrumentów.
Systemy operacyjne i sieci komputerowe
Budowa karty dźwiękowej
Typowa współczesna karta dźwiękowa jest wyposażona w:
przetwornik analogowo-cyfrowy (ADC)
przetwornik cyfrowo-analogowy (DAC)
zestaw generatorów FM (generuje dźwięk wykorzystując modulacje częstotliwości
i/lub tabela próbek dźwiękowych - wave table)
wbudowany wzmacniacz (wzmacnia sygnał do poziomu napięcia, które może
sterować małymi głośniczkami lub słuchawkami)
wejście i wyjście sygnału zewnętrznego (line in i line out)
złącze MIDI (do sterowania zewnętrznymi urządzeniami muzycznymi)
mikser sygnałów z różnych źródeł dźwięku i regulacji poziomu niskich i wysokich
tonów (wspólna dla wszystkich kanałów)
dynamiczne filtry dolno- i górnoprzepustowe
sterownik napędu CD-ROM
Najczęściej dzisiejsze karty są stereofoniczne. Karta może ewentualnie przetwarzać
zdigitalizowany
dźwięk
za
pomocą
procesora
sygnałów
dźwiękowych.
MIDI
Złącze MIDI służy do podłączenia komputera z innymi urządzeniami muzycznymi
wyposażonych w złącze tego standardu. Koncepcja MIDI została wprowadzona we
wczesnych latach osiemdziesiątych. Interfejs MIDI (Musical Instrument Digital Interface),
czyli cyfrowy interfejs dla instrumentów muzycznych umożliwia łączenie urządzeń
spełniających jego założenia w siec. Wszystko co zostanie zagrane na klawiaturze komputera
czy tez zewnętrznym instrumencie klawiszowym (klawiatura MIDI), może być
zarejestrowane przez komputer w jego pamięci. Analogicznie, dowolne dane zapisane w
pamięci komputera mogą zostać odegrane przez syntezator klawiszowy. Zapis
poszczególnych utworów w standardzie MIDI nie składa się z poszczególnych dźwięków,
lecz z informacji jaka nutę, przez jaki czas i na którym instrumencie należy zagrać. W
przypadku cyfrowych plików muzycznych konieczne mogą być miliony bajtów, by
zarejestrować i odtworzyć zaledwie kilka minut muzyki, natomiast plik MIDI składający się
zaledwie z kilku tysięcy bajtów może zawierać instrukcje wykonawcze umożliwiające
odtworzenie godzin muzyki.
Plik MIDI jest komputerowym odpowiednikiem nut. Na dane MIDI składają się
komunikaty wielu rożnych typów. Najczęściej używane to Note Number (wartość nuty, która
należy zagrać), Note On (kiedy zacząć grac nutę), Velocity (siła z jaka zagrać nutę), Note Off
(kiedy zakończyć odgrywanie nuty), Channel Number (tzw. numer kanału, czyli instrument,
który ma zagrać nutę).
Mikser
Mikser zezwala na obróbkę i miksowanie dźwięków pochodzących z mikrofonu,
syntezatora FM, wejścia line-in, odtwarzacza CD, czy tez źródeł dźwięku zapisanego
cyfrowo. Na wielu kartach mikser umożliwia regulacje wysokich i niskich tonów, regulacji
głośności (główny, i np. dźwięk z CD, syntezy FM, wejścia in-line, wejście mikrofonowe),
jednoczesnego nagrywanie z kilku źródeł (można wybrać np. mikrofon i podkład muzyczny z
Audio CD).
Systemy operacyjne i sieci komputerowe
Procesor DSP
Najważniejszym układem na karcie dźwiękowej jest cyfrowy procesor dźwięku
(DSP). Przetwarza wszystkie komendy dotyczące dźwięku przekazywane przez aplikacje.
Układ DSP instruuje wszystkie inne układy dźwiękowe, aby spowodować wygenerowanie
dźwięków. Gdy program chce zagrać określoną sekwencje dźwięków za pośrednictwem
syntezatora FM, procesor DSP musi przejąć dane od komputera i poinstruować układ FM, jak
ma zagrać pożądaną sekwencje muzyczna. Inny przykładem jest odtworzenie zapisanych
cyfrowo próbek - układ DSP przetwarza dane z postaci cyfrowej na analogowa. Procesor DSP
może
wiec
pełnić
funkcje
przetwornika
DAC,
a
także
ADC.
Procesor sygnału cyfrowego zajmuje się przetwarzaniem dźwięku w postaci cyfrowej,
umożliwiając uzyskanie wszelkiego rodzajów efektów akustycznych (pogłos, echo, chorus
itp.), kształtowanie obwiedni dźwięku (narastanie, podtrzymanie, wybrzmiewanie),
miksowanie i poprawianie sygnału czy tez syntezę i rozpoznawanie mowy. Procesor DSP
znacznie rozszerza możliwości karty, ale powoduje również podwyższenie jej ceny.
Konfiguracja kart dźwiękowych
Aby poprawnie zainstalować w systemie kartę dźwiękową należy ustawić sprzętowo
(na karcie) lub programowo (za pomocą dołączonego do karty programu):
numer portu
numer kanału DMA
numer przerwania IRQ
Karty Sound Blaster domyślnie używają numer portu 220h lub (rzadziej spotykana
konfiguracja) 240h. Inne karty dźwiękowe mogą używać innego portu. W przypadku wyboru
błędnego numeru portu (np. wykorzystywanego juz przez inna kartę) komunikacja pomiędzy
karta a komputerem może przebiegać blednie lub wręcz będzie niemożliwa. Objawia się to
nie działaniem karty (brak dźwięku), ewentualnie dziwnymi objawami (np. przerywanym
dźwiękiem). Podobnie karta może się zachowywać w przypadku złego skonfigurowania
kanału DMA. Najczęściej wykorzystywany jest numer 1. Przerwanie umożliwia
poinformowanie komputer, ze karta zada jej obsłużenia. W przypadku wyboru nie
prawidłowego numery przerwania karta nie wyda żadnego dźwięku, a także może to
doprowadzić nawet do zawieszenia systemu. Powszechnie wykorzystywane numery IRQ to 5
lub 7.
Dla kart z rodziny Sound Blaster i ich klonów (duża część kart dostępnych na rynku) w
środowisku DOS powinna być ustawiona zmienna BLASTER, która zawiera w sobie numery
portu, kanału DMA, przerwania, a także typ karty - np. dla Sound Blaster Pro numer ten
wynosi 4. Np. BLASTER=A220 D1 I5 T4.
W przypadku uaktywnienia ze specjalnych funkcji, jakie oferują układy DSP należy
najczęściej załadować driver dla karty muzycznej.
Systemy operacyjne i sieci komputerowe
Pliki zawierające zapis dźwiękowy
WAV
Format stosowany w Microsoft Windows. Zawiera zdigitalizowany dźwięk - próbkę
opatrzona nagłówkiem Tak wiec pomijając nagłówek plik zawiera czyste dane - cyfrowo
zapisany dźwięk Natomiast w nagłówku są zapisana dane o próbce - częstotliwość z jaka
dźwięk
był
próbkowany,
rozdzielczość
próbki,
mono
czy
stereo.
VOC
Format podobny do plików WAV, lecz struktura nagłówka jest nieco inna. Poza tym niczym
się nie różnią, pod warunkiem, ze dane nie są upakowane z wykorzystaniem techniki bloków
ciszy.
MOD
Plik typu MOD zawiera w sobie próbki (sample), które można wydzielić za pomocą
odpowiedniego programu do tworzenia muzyki oraz sam zapis muzyki. Format powstał
specjalnie dla komputerów AMIGA, dlatego tez oferuje cztery kanały. Dla każdego kanału
istnieje oddzielna ścieżką zapisem odgrywanych próbek.
MP3 (MPEG Layer 3)
Format kompresji plików muzycznych pozwalający znacznie zredukować wielkość
zajmowanego przez nie miejsca (przeciętnie od dziesięciu do dwunastu razy w porównaniu z
plikami WAV) przy minimalnym spadku jakości utworu.
Mała wielkość plików MP3 i wynikająca z tego łatwość przesyłania ich za pośrednictwem
Internetu w połączeniu z niemal doskonałą jakością dźwięku przyczyniły się ogromnej
popularności tego formatu.
MP3 wykorzystuje bardzo wydajny algorytm kompresji polegający na odrzuceniu
częstotliwości, które w danym fragmencie muzycznym nie są słyszalne dla ludzkiego ucha
(tzw. częstotliwości maskowane, spoza pasma 2 Hz; 4 KHz oraz dźwięki zagłuszane przez
inne dźwięki o tej samej częstotliwości lecz większym natężeniu). Takie rozwiązanie sprawia,
że utwór muzyczny zajmujący w postaci nieskompresowanej 50 MB, po zapisaniu w formacie
MP3 zmniejsza swoją objętość do ok. 4 MB. Format ten wykorzystywany jest także w
multimediach (zob. Flash) oraz mediach strumieniowych (zob. ShoutCast), gdzie pozwala
przesyłać dźwięk jakości CD (stereo, 16-bitów, 44 kHz) łączami o przepustowości 128 Kb/s.
Wersja formatu - MPEG Layer IV; łączy w sobie znacznie lepsze wyniki kompresji plików z
uniwersalnością. MP4 nie wymaga oddzielnego programu do odtwarzania; odtwarzacz wraz z
muzyką zapisany jest w jednym pliku wykonywalnym.