Wydanie pierwsze
ISBN 83-85455-69-8
SPIS TREŚCI
Spis treści
SPIS ILUSTRACJI 6
WSTĘP 7
1. SOUND BLASTER - PODSTAWY 9
2. OBSŁUGA PLIKÓW VOC 11
2. l STRUKTURA PLIKU VOC 11 2.2 STEROWNIK CT-VOICE 16
SPOSÓB KORZYSTANIA ZE STEROWNIKA 16 OMÓWIENIE FUNKCJI STEROWNIKA 20
ZASADY KORZYSTANIA Z FUNKCJI 27 BIBLIOTEKA VOC.TPU 28 PRZYKŁADY 38 2 3
OBSŁUGA WIĘKSZYCH PLIKÓW 42
SPIS TREŚCI
3. OBSŁUGA PLIKÓW CMF 53
3.1 STRUKTURA PLIKÓW CMF 53 Blok nagłówka 54 Blok instrumentów 55 Blok
muzyczny 55
3.2 FORMATY SBI i IBK 55
3.3 STEROWNIK SBFM 57
SPOSÓB KORZYSTANIA ZE STEROWNIKA 58 OPIS FUNKCJI STEROWNIKA 59
ZASADY KORZYSTANIA Z FUNKCJI 63 BIBLIOTEKA CMF.TPU 64
3.4 PRZYKŁADY 73
4. PROGRAMOWANIE DSP 79
4.1 ZASADY OBSŁUGI DSP 79 Zerowanie DSP 80 Zapis do DSP 80 Odczyt z
DSP 81 Obsługa przerwania DSP 81
4.2 TRYB BEZPOŚREDNI 82
4.3 Tryb DMA 93
4.4 OBSŁUGA ZŁĄCZA MIDI 97 Tryb bezpośredni 98 Tryb przerwań 99
4.5 KOMENDY DSP 99 Rozkaz 1xh 99 Rozkaz 2xh 101 Rozkaz 3xh 101 Rozkaz
40h 102 Rozkaz 7xh 102 Rozkaz Dxh 102 Rozkaz E l h 103
4.6 BADANIE KONFIGURACJI SB 104
5. PROGRAMOWANIE SYNTEZERA FM 109
5. l FUNKCJONOWANIE SYNTEZERA FM 109
SPIS TREŚCI
5.2 ZASADY OBSŁUGI SYNTEZERA FM 112 Zapis danej do rejestru 113 Odczyt rejestru
statusowego 113
5.3 PRZYKŁADY 122
6. SYGNAŁY l ICH PRZETWARZANIE 131
6. l Co to są sygnały i jak je dzielimy 131
6.2 Przetwarzanie analogowo-cyfrowe 133 Próbkowanie 134 Kwantyzacja 135
6.3 Filtracja cyfrowa 136
6.4 Analiza widmowa sygnału 139
6.5 Rozpoznawanie mowy ludzkiej 140
7. FORMAT WAV 147 LITERATURA 151
6
SPIS ILUSTRACJI
1.
2.
3.
4.
5.
6.
7.
8.
9.
Karta Sound Blaster w wersji 2.0 10
Struktura pliku VOC z pętlą Repeat Loop 15
Mechanizm odwoływania się do funkcji CT-VOICE 17
Obwiednia ADSR (Attack/Decay/Sustain/Relase) 110
Synteza operatorowa 112
Dwa typy obwiedni 116
Synteza FM i addytywna 120
Kształt fali generowanej przez oscylator operatora 121
Widmo prążkowe 132
10. Przetwarzanie analogowo-cyfrowe 134
11. Efekt niejednoznaczności 134
12. Aliasing 135
13. Przykładowa charakterystyka kwantyzatora 136
14. Charakterystyki filtrów dolno- i środkowoprzepustowego 137
15. Wpływ dobroci na kształt charakterystyki filtru 137
16. Ograniczenie zakresu zmian amplitudy 141
17. Przykładowy wykres widmowy 144
18. Widmo prążkowe 145
19. Aproksymacja przebiegu wykresu widmowego 145
WSTĘP
WSTĘP
Od kilku już lat multimedia to dziedzina zdobywająca coraz większą popularność. Kluczową rolę w technice
multimedialnej odgrywa dźwięk. Jego źródłem są specjalne karty - np. opisywany w książce Sound Blaster.
Karty takie są też obsługiwane przez programy rozrywkowe. Niestety mało jest publikacji poświęconych
zasadom ich programowania i omawiających to zagadnienie w sposób wyczerpujący. Mam nadzieję, że moja
książka wypełni choć w części tę lukę i okaże się pomocna dla wszystkich zainteresowanych tworzeniem
oprogramowania współpracującego z kartami SB. Wszystkie przykłady prezentowane w pracy zostały
przygotowane przy użyciu kompilatora Turbo Pascal w wersji 6.0 firmy Borland Inc. Ich teksty źródłowe
oraz kompilaty znajdzie Czytelnik na dyskietce dołączonej do książki. Zakładam, że Czytelnik ma
umiejętność programowania w dowolnym języku oraz elementarną wiedzę na temat funkcjonowania
systemu DOS i architektury komputerów PC.
Mimo że przedstawione przykłady napisane zostały w Pascalu, nic nie stoi na przeszkodzie, aby opisywane
w pracy algorytmy wykorzystać pisząc programy w innych językach - np. C, Assembler. Ostatni rozdział
poświęcony jest zagadnieniom związanym z przetwarzaniem dźwięku: filtrom cyfrowym, analizie
widmowej, rozpo-
WSTĘP
znawaniu mowy. Traktować go należy wyłącznie jako wprowadzenie do opisywanych tematów.
Na koniec chciałbym podziękować Matce oraz Kasi Byczkowskiej bez pomocy której książka ta być może w
ogóle by nie powstała
Autor
9
SOUND BLASTER - PODSTAWY
l. SOUND BLASTER - PODSTAWY
Karta Sound Blaster po raz pierwszy zaprezentowana została w 1989 roku. Kilka miesięcy później była już
najlepiej sprzedającym się rozszerzeniem muzycznym przeznaczonym dla komputerów PC. Przyczyny
niewątpliwego sukcesu to z pewnością dość duże możliwości i niska cena przy zachowaniu zgodności
programowej z wcześniejszym dominantem - kartą AdLib firmy AdLib Inc. Obecnie, nawet w chwili gdy
faktycznym standardem są już karty 16-bitowe, poczciwy SB wciąż trzyma się dobrze. Dzieje się tak między
innymi dlatego, że najprostszą kartę zgodną ze standardem SB 2.0 nabyć już można za cenę niższą niż 100
złotych.
Oto garść podstawowych informacji na temat parametrów karty Sound Blaster:
• 11-głosowy syntezer FM. Może pracować w dwóch trybach:
w trybie melodycznym (9 głosów) i w trybie rytmicznym (możliwość syntezy sześciu różnych brzmień i
korzystania z pięciu brzmień perkusyjnych: bęben basowy, talerz, werbel, bębenek i high hat). Syntezer
FM zapewnia zgodność z kartą AdLib -oparty jest na tym samym układzie (FM1312).
• Możliwość zapisu i odtwarzania próbkowanych dźwięków. Konwersja analogowo-cyfrowa i cyfrowo-
analogowa realizowana jest przez serce karty SB - układ DSP [Digital Sound Processor).
ROZDZIAŁ 1
Próbkowanie i odtwarzanie kolejnych próbek dźwięku może odbywać się z różną (w zależności od wersji karty)
częstotliwością. l tak dla kart w wersjach l.x maksymalna częstotliwość próbkowania wynosi 12 kHz,
maksymalna częstotliwość odtwarzania - 23 kHz, w wersji 2.0 (wymiana DSP z 1.05 na 2.00) maksymalna
częstotliwość próbkowania to 15 kHz, a odtwarzania - 44,1 kHz. Zapis dźwięku we wszystkich wersjach karty
jest dokonywany z 8-bitową rozdzielczością. Układ DSP zapewnia możliwość kompresji samplowanego
sygnału w czasie rzeczywistym według trzech algorytmów (ADPCM 4:1, 3:1, 2:1). Dekompresja może być
realizowana w czasie rzeczywistym.
• Możliwość współpracy z urządzeniami MIDI. Urządzeń wyposażonych w złącza typu MIDI niestety nie możemy
połączyć bezpośrednio do karty Sound Blaster - konieczne jest użycie tzw. Sound Blaster MIDI Kit. Jest tak,
ponieważ na karcie nie znajdują się standardowe gniazda MIDI (DIN).
• Możliwość współpracy z joystick'iem analogowym. W wersji 1.0 karty znajduje się też moduł CMS upgrade. Był
on instalowany w celu zapewnienia zgodności z poprzednim wyrobem firmy - kartą Gamę Blaster, zawierającą
układ 12-głosowej syntezy AM.
Rysunek l przedstawia rozmieszczenie najważniejszych elementów karty Sound Blaster 2.0.
h UNE-IN LLJP WE MIKROFON
|Potefiqomeł fegutwy gtosnosd
WYStUCHAWK.
Złqcze JOY/MO
Rys.! Karta Sound Blaster w wersjl 2.0
11
OBSŁUGA PLIKÓW VOC
2. OBSŁUGA PLIKÓW TOĆ
Format VOC (Creative Voice File) to przyjęty przez firmę Creative Labs Inc. format zapisu plików
zawierających dane dźwiękowe. Pliki tego typu obsługują programy dołączane do kart serii Sound Blaster.
Przykładem mogą być programy VOXK1T i VEDIT. Zaletą jest duża funkcjonalność i uniwersalność
plików VOC. Ich obsługa jest bardzo prosta - informacje w nich zawarte całkowicie opisują sposób
odtwarzania (w strukturze VOC znalazło się miejsce na dane dotyczące częstotliwości próbkowania
dźwięku, a także sposobu kompresji danych). Tematem tego rozdziału jest stosowanie sterowników
dostarczanych przez Creative Labs Inc. przy programowaniu obsługi plików zapisanych w tym formacie.
2.1 STRUKTURA PLIKU VOC
Zasadniczo w strukturze pliku VOC wyróżnić można dwa bloki: blok nagłówka i blok danych. Blok
nagłówka lo blok przechowujący identyfikator pliku, numer wersji oraz (bardzo ważne przy
programowaniu) adres początku bloku danych. Blok danych to naturalnie część pliku przeznaczona do
przechowywania danych dźwiękowych. Może być on podzielony na kilka, funkcjonalnie różnych, części.
ROZDZIAŁ 2
Blok nagłówka
Położenie względem początku pliku
Opis
0-19
20-21
21-23
24-25
Opis pliku. W tym miejscu przechowywany Jest napis:
,.Crealive Voice File" oraz bajt o wartości szesnastkowej 1A.
Przesunięcie początku bloku danych względem początku pliku. Wartość lego stówa wykorzystujemy programując
obsługę pliku VOC (długość nagłówka dla różnych wersji formatu może być przecież inna).
Numer wersji formatu pliku. Młodszy bajt przechowuje mniej znaczącą część numeru, starszy - bardziej znaczącą.
Kod identyfikacyjny pliku VOC ułatwiający rozpoznanie pliku zapisanego w tym formacie. Jest równy sumie słowa
przechowującego numer wersji formatu i słowa o wartości szesnastkowej 1234.
Blok danych
Ta część pliku podzielona jest na wiele podbloków spełniających różne funkcje. Regułą jest tu, że pierwszy bajt
podbloku specyfikuje jego typ. W zasadzie programista nie musi wnikać w strukturę poszczególnych podbloków,
gdyż za odpowiednią interpretację zawartych w nich danych odpowiedzialne są funkcje sterowników CT-VOICE i
CVDSK, opisywane w dalszej części rozdziału. Znajomość funkcji podbloków jest jednak konieczna do pełnego
wykorzystania możliwości dostarczanych programiście.
A oto jak przedstawiają się dostępne typy podbloków:
• Typ O - Terminator (podblok kończący)
Pojedynczy bajt o wartości O (BLKTYPE=0). Ten podblok kończy cały blok danych. Procedura odtwarzająca
dźwięk kończy działanie po napotkaniu tego podbloku.
• Typ l - Voice Data (dane dźwiękowe)
Podblok przechowujący spróbkowany dźwięk wraz z opisem. Jego struktura przedstawia się następująco:
13
OBSŁUGA PLIKÓW VOC
Przesunięcie Opis
O Bajt o wartości l używany przy identyfikacji podbloku (BLKTYPE=1).
l Trzy bajty opisujące ilość bajtów zajmowanych przez blok (BLKLEN). Liczba bajtów
przeznaczonych na próbkę to wartość pola BLKLEN pomniejszona o 2.
4 Bajt, którego wartość informuje o częstotliwości z jaką dźwięk był spróbkowany (SR).
Przechowywaną w nim liczbę obliczyć można korzystając ze wzoru:
SR = 256- 1000000/f gdzie f to częstotliwość wyrażona w Hz.
5 Bajt opisujący metodę zastosowanej kompresji danych (PACK). Znaczenie różnych wartości:
O - bez kompresji
1 - kompresja metodą 4-bit
2 - kompresjo metodą 2.6-bit
3 - kompresjo 2-bit
6 Początek ciągu bajtów próbki.
Typ 2 - Voice Continuation (kontynuacja)
Podblok przechowujący dane będące kontynuacją zapisanych w podbloku typu l. Ten typ podbloku
przydatny jest w sytuacjach, gdy długość zapisywanej próbki jest na tyle duża, że 3 bajty pola BLKLEN
w podbloku l nie okazują się nie wystarczające.
Przesunięcie Opis
O Bajt BLKTYPE o wartości 2.
l Trzy bajty opisujące długość bloku (BLKLEN).
4 Początek ciągu bajtów próbki.
Typ 3 - Silence (cisza)
Podblok definiujący okres ciszy. Użycie podbloków tego typu może okazać się przydatne tam, gdzie
zależy nam na oszczędności pamięci dyskowej (także operacyjnej na czas odtwarzania), a próbka
dźwiękowa zawiera okresy ciszy (przynajmniej względnej).
ROZDZIAŁ 2
Przesunięcie Opis
Bajt BLKTYPE o wartości 3.
Trzy bajty pola BLKLEN. Wartość tego pola dla tego typu podbloku wynosi zawsze 3.
Dwubajtowe pole PERIOD określające czas trwania ciszy wyrażony w jednostkach cyklu próbkowania
(odwrotność częstotliwości próbkowania wyrażonej wHz).
Bajt pola SR, którego wartość wyliczamy według wzoru przedstawionego przy opisie typu
Voice Data.
Typ 4 - Marker
Funkcja podbloku tego typu jest dość specyficzna. Mianowicie sterownik CT-VOICE, podczas odtwarzania
dźwięku, modyfikuje słowo statusowe wartością przechowywaną w tym podbloku. Badanie słowa statusowego
pozwala więc sprawdzić, która część bloku danych pliku VOC jest aktualnie odtwarzana. Ułatwić lo więc może
realizację prezentacji graficzno-dźwięko-wych, gdzie kluczową rolę spełnia synchronizacja dźwięku z
wyświetlanym obrazem.
Przesunięcie Opis
O Bajt BLKTYPE o wartości 4.
l Pole BLKLEN o długości trzech bajtów i stałej wartości 2.
4 Dwubajtowy marker o wartości zawierającej się w przedziale (l.FFFEh).
Typ 5 - ASCII text (tekst ASCII)
W zasadzie funkcja tego podbloku ograniczona jest do przechowywania ciągu znaków ASCII. Zastosowanie tego
typu jest raczej ograniczone (w zasadzie wyłącznie komentarze dodawane do zdigitalizowanych dźwięków).
Przesunięcie Opis
O Jednobajtowe pole BLKTYPE przechowujące wartość 5.
15
OBSŁUGA PLIKÓW VOC
l Pole BLKTYPE o długości 3 bajty i wartości równej długości ciągu znaków ASCII
powiększonej o l.
4 Początek ciągu ASCII zakończonego bajtem o wartości równej 0.
Typ 6 - Repeat Loop (początek pętli repetycji)
Jeżeli zdarzy się, że jakiś dźwięk chcemy odtwarzać cyklicznie większą ilość razy, to idealnym
rozwiązaniem wydaje się być zastosowanie podbloku tego typu. Pozwala on na wielokrotne odtwarzanie
próbki dźwiękowej umieszczonej w podblokach umieszczonych po nim. Przy założeniu, że plik zawierać
ma odgłos (np. strzału - do wykorzystania w grze zręcznościowej) powtarzany cyklicznie n razy i
zapisany w podbloku typu Voice Data, struktura tego pliku wyglądać może jak na rysunku 2.
Nagłówek pliku
BInkAmych
——^ Repeat Loop Vaice Dola
——— End Repeat Loop Terminator
Rys. 2 Struktura pliku VOC z pętlą Repeat Loop Struktura podbloku Repeat Loop:
Przesunięcie Opis
Typ bloku (BLKTYPE=6). Pole BLKLEN o wartości 2.
Dwa bajty przechowujące licznik repetycji (COUNT). Słowo przechowywane w tym polu
determinuje liczbę powtórzeń. Po napotkaniu podbloku End Repeat Loop sterownik CT-
YOICE powtórzy odtwarzanie następujących po Repeat Loop COUNT razy. Łączna suma
odtworzeń jest więc równa COUNT+1. Warto wiedzieć, że jeśli zadana liczba powtórzeń
równa będzie FFFFh, pętla realizowana będzie bez końca (tzn. aż do momentu użycia
funkcji zakończenia operacji - nr 8).
POZDZIAŁ 2
Typ 7 - End Repeat Loop
Podblok tego typu należy umieścić zaraz po ciągu podbloków, które chcemy objąć działaniem pętli
zainicjowanej przez pod-blok typu Repeal Luop.
Przesunięcie Opis
Pole BLKTYPE o wartości 7. Pole BLKLEN o wartości 0.
2.2 STEROWNIK CT-VOICE
Sterownik CT-VOICE (Crealive memory modę Voice driver) jest dołączany, wraz z resztą oprogramowania, do
kart dźwiękowych serii Sound Blasier. Jego kod znajduje się w pliku CT-VOICE.DRV. Udostępnia on
programiście podstawowe funkcje związane z obsługą plików formatu VOC. Jego dostępność jest warunkiem
koniecznym do uruchomienia części oprogramowania. Przykładem może tu być edytor plików dźwiękowych
VEDIT korzystający podczas zapisu i odtwarzania dźwięku z jego funkcji. Jego umiejscowienie na dysku
możemy zmienić, należy Jednak odpowiednio zmodyfikować wartość zmiennej środowiskowej SOUND.
SPOSÓB KORZYSTANIA ZE STEROWNIKA
W pliku CT-VOICE.DRV znajduje się kod sterownika CT-VOICE. Ogólnie rzecz biorąc, do jego funkcji
odwołujemy się umieszczając przekazywane mu parametry w odpowiednich rejestrach i wywołując go
assemblerową instrukcją CALL (daleką). Wpierw musimy naturalnie załadować go do pamięci. Mechanizm
odwoływania się do jego funkcji przedstawia schematycznie rysunek 3.
17
OBSŁUGA PLIKÓW VOC
Kod naszego programu —— CALL FAR
Kod sterówka CT Voice
JMP
Ciąg ASCII opisujący' sterownik
Re|es'ry na stos <— Wykonanie 'unkc|i t-.piestryze s'osu RETF
Rys. 3 Mechanizm odwoływania się do funkcji CT-YOICE Kolejność, w jakiej musimy wykonywać procedury
przygotowujące sterownik do działania, przedstawić można następująco:
1. Odszukanie pliku CT-VOICE.DRV. Jeżeli nie ma go w aktualnym dla naszego programu katalogu,
należy skorzystać ze zmiennej środowiskowej SOUND, w której (pod warunkiem, że użytkownik
komputera umieścił odpowiednią komendę w AUTOE-XEC.BAT) przechowywana jest ścieżka do
katalogu, w którym znajdują się sterowniki do karty Sound Blasier.
2. Sprawdzenie rozmiaru pliku CT-VOICE.DRV- Testowanie wielkości pliku jest tutaj konieczne, gdyż
rozmiary CT-VOICE.DRV dla różnych wersji sterownika mogą się dość znacznie różnić.
3. Rezerwacja odpowiedniego obszaru pamięci operacyjnej.
4. Wczytanie zawartości pliku CT-VOICE.DRV do zarezerwowanego obszaru. Należy zwrócić uwagę, że
przesunięcie początku kodu sterownika względem początku zajmowanego przez niego segmentu musi być
równe 0.
5. Sprawdzenie, czy wczytany plik zawiera kod sterownika. Najprościej wykonać to wykorzystując fakt, że
w oryginalnym pliku CT-VOICE.DRV od pozycji 3 rozpoczyna się ciąg znaków; „CT-VO-ICE".
Czynność sprawdzenia poprawności przeprowadzić można oczywiście przed wczytaniem do pamięci całego
pliku. Przykładowa procedura ładowania sterownika CT-V01CE zaimple-mentowana w języku Turbo
Pascal wyglądać może następująco:
Const
Sterownik w_pamieci:booiean=false:
{ czy już zatad3waliśmy sterownik do pamięci} var
ROZDZIAŁ 2
sterownik:pointer;
{ wskaźnik początku kodu sterownika ustawiany przez } {funkcję Przygot:UJ_sterownik}
Function Przygc)tuj_sterowmk:boolean;
Var
s:flle;
specyfikacja:string;
rozmianseg s,ofs^s:word;
Co_jest_sterownik:boo!ean;
Function lstnieje[Plłk:stringi:boolean;
Var
f:file;
Begin
assigntf.Plik],
{Sl-}
reset[fl;
closetO;
{$!+} tstnieje:=[10result=03 End;
Begin
if Scerowntk_w_pamieci then exit:;
{ gdy wcześniej załadowany} specyfikacja:='CT-VOICE.DRV;
if not fscniejeCspecyfikacja) then
specyfikacja: =getE^vt
l
SaUNa'3+
l
\DRV\CT-VOICE.DRV';
{ gdy nie odnaleziony w bieżącym katalogu } if not IstniejeCspecyfikacja) then
begin
Przygotui_sterownik:=fa!se;
exit {nie udatosię}
end;
assignts,specyfikacja);
reset[s,1); { otwieramy znaleziony plik } rozmiar:=fileSize[s); {pobieramy rozmiar} getmemCsterownik, rozmiar); {
rezerwujemy pamięć } b!ockreadEs,sterownik^,filesize[s]]; {odczyt} cioseEs); {zamykamy plik} seg_s:=seg[ste^ow^ik
/\
];
{segment} ofs_s; ^fstsCerownik^ ], { przesunięcie } toJest_sterownik:=[MemW[seg_s:ofs_s-3]=$5443);
{tutaj sprawdziliśmy, czy wczytany plik zawiera kod }
{sterownika CT-YOICE} if not toJest_sterownik then begin
19
OBSŁUGA PLIKÓW VOC
Przygotu)_scerownik;=false;
freemem[sterownik,rozmiar]:
exic end:
Przygotu]^sterownik:=tnJe { Wszystko jest w porządku }
End;
Do wczytanego z pomocą tej funkcji sterownika odwołać się można (przy założeniu, że na jego kod wskazuje
zmienna Sterownik) np. tak:
as m
Tutaj nadajemy wybranym rejestrom odpowiednie wartości catl sterownik
Odczytujemy z rejestrów zwrócone przez funkcję wyniki end;
Naturalnie, aby nasz program uczynić bardziej uniwersalnym, możemy dołączyć do jego kodu zawartość
pliku CT-VOICE.DRV na etapie konsolidacji. Wtedy zbędna staje się naturalnie jego obecność na dysku
użytkownika. Programujący w języku Turbo Pascal postąpić może wg następującego schematu:
1. Przygotować plik CT-VOICE.DRV używając dołączonego do kompilatora programu
BINOBJ.EXE;
B1NOBJ CT-VOICE.DRV CT-YOlCE.OBJ Yoice
2. Przygotować bibliotekę zawierającą procedurę związaną z kodem sterownika:
Unit VOCDrv; { nazwa przykładowej biblioteki} Interface
procedurę voice;
Implementatian
{$LcI:-voice.obj}
procedurę valce;
exCernal End.
3. Na początku naszego programu, w linii, w której wyszczególniamy używane biblioteki, po
instrukcji USES dopisać nazwę VOC-Drv (tak nazwaliśmy stworzoną w punkcie 2 bibliotekę).
ROZDZIAŁ 2
Do włączonego w ten sposób kodu sterownika odwołujemy się korzystając z możliwości umieszczania w
programie wstawek assem-blerowych:
asm
Wypełniamy parametran odpowiednie rejestry cali far ptrvoice Odczyt wyników z rejestrów end:
Jakkolwiek byśmy kodu sterownika nie umieścili w pamięci operacyjnej, jest jeszcze jedna rzecz, o której pamiętać
musimy. Używanie funkcji CT-VOICE wymaga uprzedniej rezerwacji jednego, szes-nastobitowego słowa w
pamięci na zmienną używaną przez sterownik. Zmienna ta to Ct-Voice Status. Przechowuje ona wartość dodatnią
całkowitą (w Turbo Pascalu typ Word). imiennej tej sterownik może więc nadawać wartości z przedziału O -
FFFFh. Modyfikacji jej wartości dokonuje w następujących przypadkach:
1. Podczas inicjalizacji. Po wykonaniu funkcji 3 sterownik nadaje zmiennej statusowej wartość 0.
2. Rozpoczynając odtwarzanie/zapis danych dźwiękowych (wartość FFFFh).
3. W momencie zakończenia operacji odtwarzania/zapisu danych dźwiękowych (nadawana wartość: 0).
4. Gdy podczas odtwarzania bloku danych pliku dźwiękowego sterownik natrafi na podblok typu Marker, wpisuje
do zmiennej statusowej przechowywaną w nim wartość. Jak wspomniałem przy opisie struktury pliku formatu
VOC, używając podbloków typu Marker, możemy podzielić plik dźwiękowy na kilka części i informacje
odczytywane z Ct-Voice Status podczas odtwarzania wykorzystać do synchronizacji dźwięku z działaniami
programu.
OMÓWIENIE FUNKCJI STEROWNIKA
W tej części książki omówię udostępniane przez sterownik CT-VO-ICE funkcje. Generalnie rzecz biorąc, każdą z
nich wywołuje się jednakowo - przez wywołanie dalekim CALL kodu sterownika. Numer funkcji oraz parametry
dla niej umieszczamy w rejestrach mikroprocesora (w BX numer, w pozostałych parametry). Jeżeli funkcja ma
OBSŁUGA PUKOW VOC
21
zwracać jakieś wartości, to na ogół odczytujemy je z rejestru AX (w przypadku danej 4-bajtowej z pary
DX:AX). Istotny jest fakt, że wartości pozostałych rejestrów (także flagowego) są zachowywane.
Funkcja B: Pobierz wersję sterownika
Wejście: BX=0 Wyjście: AH - główny numer wersji
AL - mniej znacząca część nuinem wersji
Opis: Funkcja zwraca numer wersji sterownika. Sprawdzenie wersji jest wskazane, jeżeli nasz program
wczytuje sterownik z dysku użytkownika.
Funkcja 1: Ustawienie adresu bazowego
Wejście: BX=1
AX- adres bazowy Wyjście: brak
Opis: Ta funkcja pozwala na ustawienie portu we/wy używanego przez sterownik do komunikacji z kartą.
Jeżeli nasz program korzysta z tej funkcji, to powinien wywołać ją jako pierwszą. Dostępne
wartości adresu bazowego to:
210h, 220h, 230h, 240h, 250h i 260h (dla kart Sound Bla-ster 2.0 dopuszczalne wartości to
220h i 240h). Warto, by program umożliwiał użytkownikowi wybór adresu. Należy zwrócić
uwagę, że wartością domyślną (ustawioną za pomocą zworek na karcie przez producenta) jest
220h. Taki leż adres będzie używany przez sterownik w wypadku, jeżeli nasz program nie
odwoła się do lej funkcji.
Funkcja 2: Ustawienie numeru przerwania dla DMĄ
Wejście: BX=2
AX= numer przerwania
Wyjście: brak
Opis: Używając tej funkcji program może ustawić numer iinii IRQ używanej przez kartę Sound Blaster
do sygnalizacji końca transmisji danych. Funkcja ta powinna być (jeśli wystąpiła potrzeba jej
użycia) wywołana zaraz po funk-
ROZDZIAŁ 2
cji numer l (ustawienie adresu bazowego). Wartości, jakie przekazać możemy jako parametr, to 2, 3, 5
i 7. Domyślny numer przerwania IRQ to 7.
Funkcja 3: Inicjalizacja sterownika
Wejście: BX=3
Wyjście: AX = O, gdy wszystko przebiegło pomyślnie,
1 - błąd karty Sound Blaster
2 - błąd operacji zapisu/odczytu (źle ustawiony adres bazowy)
3 - błąd przerwania
Opis: Program powinien wywoływać lę funkcję przed skorzystaniem z pozostałych (oczywiście pomijając
funkcje zmiany adresu bazowego i numeru przerwania IRQ). Zwrócona w rejestrze AX wartość
wskazuje, czy procedura inicjalizacji przebiegła bezbłędnie. W przypadku wykrycia błędu działanie
naszego programu powinno być przerwane. Bardzo istotnym jest fakt, że po inicjalizacji sterownika
układ DAĆ zostaje włączony (konwersja danych cyfrowych do postaci analogowej). W zasadzie
wyłącznie funkcje 0-2 mogą być wywoływane przed wykonaniem procedury inicjalizacji. Z funkcji
inicjalizacji korzystamy jednorazowo.
Funkcja 4: Włącz/Wytocz DAĆ
Wejście: BX=4
AL=0, aby wyłączyć AL = l, aby włączyć DAĆ Wyjście: brak
Opis: Korzystając z funkcji można włączać i wyłączać układ DAĆ odpowiedzialny za konwersję danych
cyfrowych do postaci analogowej. Pozostawienie DAĆ w stanie włączonym na czas zapisu dźwięku do
pamięci powoduje, że jednocześnie z zapisem dane kierowane są także na wyjście, co powodować
może powstawanie dodatkowych szumów podczas samplingu. Dlatego przed rozpo-
OBSŁUGA PLIKÓW VOC
23
częciem zapisu dźwięku (funkcja 7) należy wyłączyć DAĆ. Piszę o wyłączaniu układu DAĆ,
mimo że w rzeczywistości chodzi właściwie o odłączenie wzmacniacza na jego wyjściu. Z
punktu widzenia programisty nie ma to jednak żadnego znaczenia.
Funkcja 5: Ustaw adres zmiennej statusowej
Wejście: BX=5
ES:DI == adres słowa w pamięci operacyjnej przeznaczonego na zmienną Ct-Voice Status
Wyjście: brak
Opis: Sterownik CT-VOICE modyfikuje podczas działania poszczególnych funkcji szesnasiobitowe słowo,
którego adres może wskazać korzystający ze sterownika program. Omówienie funkcji zmiennej
z nim związanej znalazło się w rozdziale „Sposób korzystania ze sterownika".
Funkcja 6: Rozpocznij odtwarzanie dźwięku
Wejście: BX=6
ES:DI = adres bufora Wyjście: brak
Opis: Funkcja rozpoczyna odtwarzanie dźwięku z wykorzystaniem układu DMĄ. Zaraz po jej wywołaniu
sterownik wpisuje do zmiennej statusowej wartość FFFFh. Po rozpoczęciu odtwarzania
sterownik oddaje sterowanie programowi wywołującemu, zaraz po czym nasz program zająć się
może realizacją innych zadań (w grach i programach prezentacyjnych np. animacją). Dane
przeznaczone do odtworzenia z pomocą tej funkcji muszą być zapisane w formacie przyjętym
przez Creative Labs Inc. (opis w rozdziale „Struktura pliku VOC"). Uwaga: para rejestrów
ES:DI wskazywać musi nie na początek pliku umieszczonego w pamięci, ale na początek Bloku
Danych tego pliku. Przypominam tu, że początek błoku danych znaleźć możemy odczytując
słowo o przesunięciu 20 względem początku nagłówka. Badając wartość
ROZDZIAŁ 2
zmiennej o adresie ustawionym funkcja 5 sprawdzać możemy, czy plik dźwiękowy jest odtwarzany,
czy też procedura odtwarzania została już zakończona (wówczas wartość zmiennej statusowej jest
równa 0). Należy pamiętać, że jednocześnie odtwarzać można wyłącznie jeden plik i w momencie, gdy
chcemy rozpocząć odgrywanie następnego, musimy użyć funkcji 8 (zatrzymanie operacji).
Funkcja 7: Rozpocznij zapis dźwięku
Wejście: BX-7
AX = częstotliwość próbkowania DX:CX = rozmiar bufora
ES:Dl = adres bufora przeznaczonego na składowanie odczytanych z przetwornika analogowo-
cyfrowego danych
Wyjście: brak
Opis: Funkcja pozwala na zapis danych z przetwornika A/C do rozpoczynającego się od komórki wskazywanej
przez parę ES:Dl bufora o rozmiarze zadanym wartościami rejestrów DX:CX. Sterownik CT-YOICE
używa układu DMĄ, a co za tym idzie, zapis dźwięku odbywa się (podobnie jak odtwarzanie) „w tle".
Zmienna statusowa zapisywana jest po rozpoczęciu próbkowania wartością FFFFh i, po jego
zakończeniu, wartością 0. Jednym z parametrów, jakich oczekuje funkcja, jest częstotliwość
próbkowania podawana w rejestrze AX. Zakres, w jakim mieścić się ona mieścić, jest ściśle związany
z typem karty. I tak dla Sound Blaster'a w wersjach l.x maksymalna wartość wynosi 12000, a dla
karty Sound Blaster w wersji 2.0 największa możliwa częstotliwość wynosi 15000. W obu
przypadkach minimalna wartość to 4000.
Funkcja 8: Zakończenie operacji We/Wy
Wejście:
Wyjście:
BX=8 brak
25
OBSŁUGA PLIKÓW VOC
Opis: Funkcja przerywa odtwarzanie (zapis) dźwięku i nadaje zmiennej statusowej wartość 0.
Funkcja 9: Zakończenie pracy ze sterownikiem Wejście:BX==9 Wyjście: brak
Opis: Funkcja deinicjalizuje kartę dźwiękową i wyłącza układ DAĆ, Program powinien wywoływać ją
kończąc działanie.
Funkcja 10: Zawieś odtwarzanie dźwięku
Wejście: BX=10
Wyjście: AX = O, gdy operacja przebiegła prawidłowo AX = l, gdy żaden plik nie był
odtwarzany
Opis: Funkcja pozwala na zawieszenie odtwarzania dźwięku (pauza). Wartość zmiennej statusowej
zachowuje swoją wartość. Jeśli wywołamy tę funkcję w przypadku, gdy procedura odtwarzania
nie była aktywna, zwróconą w AX wartością będzie l.
Funkcja 11: Wznów odtwarzanie dźwięku
Wejście: BX=11 Wyjście: AX = O, gdy wszystko w porządku
AX = l, gdy odtwarzanie nie zostało zawieszone
Opis: Funkcja służy do wznowienia zawieszonego przy użyciu funkcji 10 odtwarzania dźwięku.
Funkcja 12: Przerwij pętlę
Wejście: BX==12
AX-= l, aby zakończyć natychmiastowo AX== O, gdy chcemy, aby sterownik odworzył
powtarzany pętlą blok do końca
Wyjście: AX=0, gdy operacja przebiegła pomyślnie AX= l oznacza, że pętla nie była aktywna
ROZDZIAŁ 2
Opis: Format VOC pozwala na zdefiniowanie pętli odtwarzania. Podbloki umieszczone między podblokiem typu
6 a podblokiem typu 7 będą odtwarzane cyklicznie zadaną liczbę razy. Jeżeli wykonywanie pętli
chcielibyśmy z jakichś powodów przerwać, użyteczna okazuje się być właśnie funkcja 12. Zakończenie
pętli może przebiegać na dwa sposoby: pierwszy (AX=1) polega na tym, że sterownik natychmiast
„przeskakuje" do podbloku następującego po pętli, drugi (AX=0) polega na tym, że sterownik kończy
odtwarzanie podbloków objętych działaniem pętli i (nie zważając na wartość licznika repelycji)
rozpoczyna odtwarzanie następnych danych.
Funkcja 13: Ustawienie pułapki użytkownika
Wejście: BX=13
DX:AX== adres procedury użytkownika Wyjście: brak
Opis: Sterownik CT-VOICE umożliwia wskazanie procedury, która wywoływana będzie każdorazowo, gdy
rozpoczynane będzie odtwarzanie nowego podbloku. Sterownik przekazuje naszej procedurze adres
nowego podbloku w parze rejestrów ES:BX. Przy jej tworzeniu zadbać musimy o spełnienie kilku
warunków:
• kończyć się powinna instrukcją assemblera RET (daleką);
• zachowywać wartości wszystkich rejestrów (także rejestru flagowego, ale z pominięciem wskaźnika
przeniesienia);
• wskaźnik przeniesienia rejestru flagowego procedura powinna zerować, gdy chcemy, by nowy
podblok był odtworzony (gdy nie chcemy - powinna go ustawić);
• powinna zerować wskaźnik przeniesienia, gdy nowy podblok jest podblokiem kończącym
(Terminator).
Jeżeli chcemy zabronić wywoływania naszej procedury, wystarczy wywołać funkcję 13 zerując
uprzednio rejestry AX i DX (wskazać adres 0:0).
27
OBSŁUGA PLIKÓW VOC
ZASADY KORZYSTANIA Z FUNKCJI
Zanim zaczniemy wykorzystywać podane funkcje sterownika CT-V01CE. musimy poznać kilka
elementarnych zasad, jakich powinniśmy się trzymać przy wykorzystaniu go. Najprościej będzie,
gdy zaprezentuję schematy, wg których postępować należy chcąc rozpocząć lub zakończyć pracę
ze sterownikiem, odtworzyć próbkę dźwiękową lub zapisać dźwięk.
Rozpoczynanie pracy:
1. Rezerwacja pamięci i wczytanie do niej sterownika.
2. Jeśli jest to konieczne, modyfikacja adresu bazowego z wykorzystaniem funkcji l.
3. Zmiana numeru przerwania IRQ przy pomocy funkcji 2.
4. Inicjalizacja sterownika - wywołanie funkcji 3.
5. Ustawienie adresu zmiennej statusowej. Oczywiście wykonanie czynności 2 i 3 jest opcjonalne -
jeżeli nie zostaną wykonane, przyjęte zostaną domyślne wartości numeru przerwania oraz adresu
bazowego.
Zakończenie pracy:
1. Wywołanie funkcji 9 - deinicjalizacja sterownika.
2. Zwolnienie pamięci operacyjnej przydzielonej sterownikowi.
Odtwarzanie dźwięku:
1. Rezerwacja odpowiedniego obszaru pamięci operacyjnej i wczytanie do niego zawartości pliku
dźwiękowego VOC.
2. Odczytanie szesnastobitowego słowa o przesunięciu 20 względem początku pliku. Jego wartość
określa długość nagłówka.
3. Włączenie układu DAĆ (funkcja 4). Jeżeli odtwarzamy dźwięk zaraz po inicjalizacji sterownika,
czynność tę można pominąć.
4. Wywołanie funkcji 6 (odtworzenie dźwięku) z podaniem w parze rejestrów ES:DI wyznaczonego
adresu początku bloku danych.
5. Czekać na moment w którym zmiennej statusowej nadana zostanie wartość O (koniec).
Podczas oczekiwania na zakończenie odtwarzania nasz program może wykonywać inne
czynności. Używając funkcji 10 i 11 możemy zatrzymywać i wznawiać wykonywanie procedury
odtwarzającej a wywołując funkcję 8 - zakończyć jej działanie. Odczytując wartość zmiennej
statuso-
ROZDZIAŁ 2
wej możemy, pod warunkiem uprzedniego wzbogacenia naszego pliku o podbloki typu Marker, sprawdzić,
który fragment próbki dźwiękowej jest aktualnie odtwarzany.
Zapis dźwięku:
2.
3.
4.
Rezerwacja pamięci przeznaczonej na bufor danych. Wyłączenie układu DAĆ (funkcja 4). Wywołanie funkcji
zapisu danych (nr 7). Oczekiwanie na zakończenie zapisu. Proces możemy przerwać z pomocą funkcji 3.
Osiągnięcie końca bufora lub koniec zapisu spowodowany wykonaniem funkcji 8 sterownik sygnalizuje nadaniem
zmiennej statusowej wartości 0. Jako ostatnią czynność uważać można zapis spróbkowanego dźwięku do pliku.
Należy tu pamiętać, że utworzony przez sterownik blok danych poprzedzić należy spreparowanym odpowiednio
nagłówkiem.
BIBLIOTEKA VOC.TPU
W rozdziale tym prezentuję wersję źródłową przykładowej biblioteki gotowej do skompilowania przy użyciu
kompilatora Turbo Pascal w wersji 6.0 lub nowszej- Posiadacze starszych wersji mogą w prosty sposób
zmodyfikować tekst biblioteki (przez zamianę wstawek assemblerowych typu ASM na INLINE). Przy tworzeniu
procedur główny nacisk postawiłem na czytelność i zrozumiałość. Ponieważ pełen tekst biblioteki znajdzie
Czytelnik na dołączonej do książki dyskietce w pliku VOC.PAS, listing zamieszczony w książce pozwoliłem sobie
przerywać komentarzami. unit;\/OC:
interface
typeVRodzajBledu=tVOk,
YBrakSterowniks,
YZaMaloPamieci,
YZłyNaglowekSterownika,
YBIadInicjelizacji,
YUszkodzonaKarta,
YBIadWeWy,
VZIyNumepPrzerwaniaD!aDMA,
YBIadZwolnienia,
YBrakPIiku,
VToNieVOC,
OBSŁUGA PLIKÓW VOC
29
Typ VRodzajBledu jest typem wyliczeniowym i określa większość błędów, jakie mogą pojawić się podczas
realizacji zaimplemetowanych w bibliotece procedur. Poniżej zadeklarowana została zmienna VOC_Blad typu
VRodzajBledu, której zadaniem będzie przechowanie nadanej w trakcie realizacji procedur (funkcji) wartości.
Naturalnie taki sposób opisania błędów (typem wyliczeniowym) może się komuś wydawać nienaturalny, ale
moim zdaniem, przyczyni się on znacznie do zwiększenia przejrzystości prezentowanego tekstu.
var
VOC_Blad:VRod2ajBledu;
\/OCSCatus:word;
\/SterownikZainstalowany;Boo[ean;
VDIugoscNag!owka:byte;
Oprócz zmiennej VOC_BLAD wśród globalnych zmiennych udostępnianych przez bibliotekę znalazły się:
VOCStatus (zmienna statusowa, której lokalizację w RAM wskażemy sterownikowi), VSterownik-
Zainstalowany typu Boolean (informacja o tym, czy CT-VOICE został już wczytany do pamięci operacyjnej)
oraz VDlugoscNaglowka (jak sama nazwa wskazuje, przechowamy tam wielkość potrzebną przy wyliczaniu
pozycji bloku danych pliku VOC).
procedure VlnicjujSterownik[Port,lrq:word3;
function VWersjaSterownika:word;
procedurę YWylaczDAC:
procedurę YWIaczDAC;
procedurę VOdczyta|PlikVOC(var bufor:pointer;spec:string);
procedurę VZarezerwujPamiec(var gdzie:painter;ile:longint);
procedurę VZwolnijPamiectgdzie:pomter);
function VOpisBledu:string;
procedurę YDeinstatuJSterownik;
procedurę VOdtworzVOC[buror;pointer);
procedurę VOdtwor'zJeszczeRaz(bufor;poinCer];
procedurę VZakonczOperacjeVOC;
procedurę VPauzaVOC;
procedurę VKanCynuuiOdtwarzanieVOC;
procedurę VPrzerwijPet!eVOC[iak:word);
procedurę VZapiszBlokEczesc:word;dlug;word;p'poincer);
procedurę VOdtworzBloktwsk:pointer];
ROZDZIAŁ 2
W części implementacyjnej zadeklarowałem użycie dwóch zmiennych globalnych: VSTEROWNIK (przechowa
wskazanie na obszar zajmowany przez kod CT-VOICE) oraz VDawnaProceduraWyjscia (wykorzystywana do
przechowania zastanej wartości ExitProc). Zmienna VSTEROWNIK jest używana przez wszystkie (za wyjątkiem
VOpisBledu) wymienione w części interface procedury i funkcje. Należy zwrócić uwagę, że przed wykonaniem
procedury VInicjujSte-rownik ma wartość nieokreśloną, a co za tym idzie, niedopuszczalne wtedy jest wykonanie
jakiejkolwiek innej funkcji (procedury). irnplemenCaton
uses dos.crt;
var
Vsterawnik:pointer;
VDawnaProceduraWyj'scia:pointer;
function lsCnieJe[Plik:string):boolean:
var
f:file;
begin
assign[f,P!ik);
{$!-} resetCfl;
closetf];
{$!+} lstnieje:=(!OresulC=03 end;
procedurę VZarezerwujPamiec(var gdzie:pointer;i!e:longint);
var
rregisters:
ilasc:word;
begrn
i
ilosc:=[ile+15) shr4; {ile paragrafów} rah:=$48; {numer ustugi DOS-u } rbx;=ilosc;
MsDosCr);
if Crbx<>ilosc) Chen VOC_blad:=VZaMaloPamieci e!se begin
VOC_blad:=VOk;
gdzie:=pt;rtr.ax,G) end
end:
31
OBSŁUGA PLIKÓW VOC
Procedura YZarezerwujPamiec wywoływana jest z pozostałych w celu allokacji zadanego obszaru pamięci
operacyjnej. Jej parametry to zmienna typu Pointer, pod jaką postawione zostanie wskazanie 'na
zarezerwowany fragment RAM, oraz zmienna typu Longint specyti-kująca rozmiar potrzebnego obszaru.
Procedura allokuje wielokrotność 16 bajtów. W przypadku wystąpienia błędu zmiennej VOC_BLAD nadaje
wartość VZaMaloPamieci. Zdefiniowana poniżej procedura VZwolnij Pamięć zwalnia wskazywany przez
parametr obszar.
prxedureVZwolni)P3miecCgdzie:point,er);
var
p:registers;
besm
nah:=$49;
nes;=segtgdzie^3:
msdostr);
if (rax=7)or[nax=93 Chen VOC_blad:=VBIadZwolnienia end;
procedurę VlnicjufSterownik(Port,lrq:word];
var
s:file;
specyfikacja:strlng;
seg_SiOfs_s:word, status_seg,status_ofs:word;
toJest_sterownik:bDolean;
wynik:word;
begin
if YSterownikZainstalowany then exit;
specyfikacja: ='0^0^. DRV
1
;
if not IstniejeCspecyfikscja) then
specyfikacja: =getEnv('SOUND•)+
l
\DRV\CT-VOICE.DRV':
if not IsCnieJsCspecyfikscja] then
begin
VQC_Blad:=VBrakSterownika:
exit
end:
assignis,specyfikacja), reset(s,1);
VZarezer'wuJPamiec[Vsterownik,fileSi2e(sl);
ifVOC_blad<>VOkthenexit;
blockreadts.Ysterownik^.filesizets]);
closets);
seg_s:=seg[Vste^
t
ownik
/
');
ofs_s:=ofs(Vsterownik^];
tOJest;_sCerownik:=[MemW[seg_s:ofs_s+3]=$5443];
ROZDZIAŁ 2
S not tOJest_sterown ik Chen begir VCC^b[ad;=VZ!yNaglawekSt;erownika;
exit end, if porcoO then asm
mov bx,1 mov ax,port callVst;erowmk end;
if irq<>0 then asm
movbx,2 mov ax,irq całłYstercwnik end, StaCus_seg:=segtVOCstaCus);
Stat:us_ofs:=ofs[VOCsC3tus];
asm
mav bx,3 cali Ysterownik mov wynik,ax mov bx,5
mov es,status_seg movdi,staCusJ)fs cali Ysterownik end;
case wynik of
0:VOC_blad:=VOk;
1: VOC_btad:=VL)szkodzonakarta;
2: VOC_blad:=VBladWeWy;
3: VOC_blad:=VZIyNumerPrzerwaniaDlaDMA
end;
end;
Procedura VInicjujSterownik spełnia kluczową rolę w bibliotece. Jej działania polega na wczytaniu kodu sterownika
i jego inicjalizacji. Dodatkowo, podając parametry różne od O możemy spowodować zmianę adresu bazowego i
numeru używanego podczas transmisji przerwania. Końcowy fragment procedury odpowiedzialny jest za wskazanie
sterownikowi lokalizacji słowa przeznaczonego na zmienną statusową. Zdefiniowana poniżej funkcja
YWersjaSterownika zwraca wartość typu WORD, której bardziej starszy bajt odpowiada bardziej znaczącej części
numeru wersji, a młodszy - mniej znaczą-
33
OBSŁUGA PLIKÓW VOC
čej. Procedury VWyIaczDAC i YWIaczDAC odpowiadają za włączanie i wyłączanie układu konwersji DAĆ.
function YWersjaSte równika,vwrd;
var
begin
asm
mov bx,0
cali Ysterownik
niovw,ax
end;
VWer'SjaSterownjka:=w
end;
procedurę YWylaczDAC;
assembler;
asm
mDV bx,4 mov al,0 cal!Vscerownik
end;
procedurę VWIaczDAC;
assembler;
asm
movbx,4
mov al,1
całłYsterownik end;
Niżej znalazła się definicja procedury VOdczytajPlikVOC. Oczekuje ona podania zmiennej wskaźnikowej,
której zostanie nadana wartość odpowiadająca wskazaniu zajmowanego przez plik obszaru oraz
podania specyfikacji pliku dźwiękowego, który chcemy wczytać. Sprawdzenie, czy mamy do czynienia z
plikiem formatu VOC polega tu na przyrównaniu słowa złożonego z dwóch pierwszych bajtów pliku do
7243h (znaki „C" i „r" z napisu „Creative Voice File"). procedurę
VOdczycajPlikVOCCvarbufarpointer;spec;st ring];
var
plik_VQC:file;
rozmiar_pliku:longlnt;
Blokow:wor'd;
wynik:word;
miejsce.pointer;
bogiń ifnoC IsCmejeEspec] then
ROZDZIAŁ 2
beoHi VOC_Blad-=VBrakPliku:
exit end;
assign(plik_VOC.spec]:
re5et;(p!ik_VOC,1);
rozmiar_pliku:=fileSize(plik_VOC);
VZarezerwuiPamiecEbufor,rozmiarJ3liku3;
if VOC_blad< >VOk chen exit:
Bloków: =0:
repeat
miejsce: =Pt^[seg(bufo^
A
)+Blokow
ł
4096,ofs(bufo^'
^
]];
blockread[plik_VOC,miejsce" $FFFF,wynik);
lnc(B!okow3 untilwynik=0;
close(plik_VOC]:
if MemW[seg(bufo^•
^
]:ofs(bufo^-
^
)]<>$7^43
then VOC_blad:=VToNieVOC;
yDlugoscNagiawki^MemCsegtbufor^hofstbufor^l+^a]
end;
No i najważniejsze - odtworzenie wczytanego pliku - procedura VOdtworzVOC. Warto zwrócić uwagę, że
przesunięcie w adresie segmentowym przekazywanym sterownikowi powiększane jest o rozmiar nagłówka
wczytanego pliku.
procedurę VOdtwor2VOC(bufor:poini;er);
var
buf_s,buf_o:word;
begin
bu^s^segróufor^ł;
bufJ^ofsCbufor^+YDIugascNaglowka;
YWIaczDAC;
as m
movbx,6 moves,buf_s movdi,buf_o całłYsterownik
end
end;
W bibliotece zdefiniowałem także drugą procedurę odtwarzającą wskazywaną zadaną zmienną próbkę
(VOdtworzJeszczeRaz). Jedyna różnica między nią a procedurą VOdtworzVOC polega na pominięciu w
VOdtworzJeszczeRaz włączania układu DAĆ.
procedurę VOdt;worzJeszczeRaz[bufor:pointer);
var
but s,but o:word;
OBSŁUGA PUKÓW VOC
35
buf_s;=seg[bufor^);
buf o^ofstbufor^l+YDlugoscNaglowkE aem
movbx,6
moves,buf_s
movdi,buf_o
cali Ysterownik end
end;
Procedura YZakonczOperacje może być używana zawsze, gdy chcemy zakończyć odtwarzanie lub zapis
dźwięku. Procedury VPauza-VOC i VKontynuujOdtwarzanieVOC służą do chwilowego zawieszania i
wznawiania odtwarzania.
procedurę VZakonczOperacjeVOC;
assembier;
as m
mov bx,8 ca!!Vsterownik
end;
procedurę VPauzaVOC:
var
odp;word;
begin as m
mov bx, 10 cali VsCerownik movodp,ax end;
ifodp=1 then voc^b[ad:=VSBNieOdCwarzal end;
procedurę VKontynuujOdtwarzanieVOC;
var
odp:wor'd:
begin as m
mov bx, 11 cali Ysterownik movodp,ax end;
if odp=1 chen VOC_blad:=VSBNieOdCwarzal end;
procedurę VPrzerwiJPetteVOCCiak:word);
ROZDZIAŁ 2
begin
end;
odp:word;
i [fnot[jakin[0,1I]theniak:=1;
asm
mav bx,12
movax,jak
cali Ysterowmk
movodp,ax end:
ifodp=1 thenVOC_blad:=VNieByloPetli
W bibliotece znalazła się także procedura zapisu dźwięku do pamięci operacyjnej. Jako parametrów oczekuje ona
dwóch wielkości typu WORD określających częstotliwość próbkowania dźwięku oraz rozmiar bufora oraz wskazania
na bufor przeznaczony na zapis danych. Należy pamiętać, że po dokonaniu zapisu we wskazanym buforze
znajdować się będzie wyłącznie blok danych i, przed ewentualnym zapisem do pliku, należy poprzedzić go
nagłówkiem.
procedurę VZapiszBlok[czest:word;dlug:ward;p: pointę?];
begin
ifczest<400Cthen begin
VOC_blad:=VZIaCzestotliwosc;
exit end:
YWylaczDAC;
asm
movbx,7 mavax, cześć movdx,0 movcx,dlug les di,p callVsterownik end end;
Poniższa procedura stanowi pewne uzupełnienie zestawu narzędzi służących odtwarzaniu dźwięku. VOdtworzBlok
pomija wielkość nagłówka przy wskazywaniu sterownikowi bufora z danymi, a co za tym idzie, doskonale nadaje
się do odgrywania zapisanego z użyciem VZapiszBlok bloku danych.
procedurę VOdtworzBIok(wsk:pointer);
var
37
OBSŁUGA PLIKÓW VOC
przechowa) :byte:
begin
przechowaj :=VDIugoscNaglowka;
V0ugosc^aglowka:=0;
VOdtworzVOC(wsk);
VDIugoscNaglowka:= przechowaj
end
Funkcja VOpisBledu pełni rolę pomocniczą. Zwraca łańcuch ASCII opisujący błąd związany z
aktualną wartością zmiennej VOC_BLAD.
function VOpisBledu:sCring;
begin
case VOCJ)lad of
V0k:
VapisBledu;='Ok.';
YBrakSterownika:
VopisBledu:='Nie znaleziono pliku CT-VOICE.ORV';
VZaMaloPamieci:
VopisBledu:='ZbyC mało pamięci operacyjnej.':
VZIyNaglowekSterownika:
VapisB!edu:='Zty nagłówek CT-VOICE.DRV';
YBIadInicjalizacji:
VopisBledu:='Bład podczas inicjalizacji sterownika.';
VL)szkodzonaKarta:
VopisBledu:='Btędne działanie karty dźwiękowej.';
VBladWeWy:
VopisBledu:='Btad podczas zapisu/odczytu z portów karty,';
YZłyNumerPrzerwaniaDlaDMA:
VopisBledu:='Niewłaściwy numer przerwania IRQ.';
YBIadZwolnienia:
VopisBledu:='Błąd zwolnienia pamięci.';
YBrakPtiku:
VopisBledu;='BrBk pliku .VOC.';
VToNieVOC:
VopisBledu:='Błędny nagłówek pliku .VOC,';
VSBNieOdtwarzal:
VopisBledu:='Żaden plik nie byt odtwarzany
1
;
VNieByiaPecli:
VopisBledu:='Nie było aktywnej pętli.';
VZtaCzestotliwosc:
VopisBledu:='Zta częstotliwość próbkowania,' end end;
Ostatnią publiczną procedurą biblioteki jest VDeinstalujSterownik. Można ją wywołać w programie, by
deinicjałizować CT-VOłCE i zwolnić zajmowaną przez jego kod pamięć. Jego wywołaniem
ROZDZIAŁ 2
w przypadku zakończenia działania programu zajmie się nowa procedura wyjścia - VOCExit.
procedurę YDanstalujScerownik;
begm
(f YSterownikZainsCalowsny then begin as m
mov bx,9 całłYsterownik end;
VZwolni|PamiectVsterownik);
VSt:erownik2ainsCalowany:=false end end;
($F+) procedurę VOCExtt:;
begin
YOeinscalujScerownik;
ExitProc:==VDawnaProceduraWyjscia end;
{SF-}
begin
VDawnaProceduraWyJscia;=ExitProc;
ExitProc:=@VOCExit:
VSterown ikZainsCalowany: = False;
VOCstaCus:=0;
VOC 81ad;=VOk
end.
PRZYKŁADY
W poprzednim rozdziale zaprezentowałem kompletną, gotową do użycia bibliotekę funkcji i
procedur użyteczną przy programowaniu obsługi plików VOC. Aby bardziej jeszcze rozjaśnić
zasady korzystania ze sterownika, przedstawię przykład programu wykorzystującego jego usługi.
Jego zadaniem będzie odtwarzanie zawartości zadanego parametrem pliku formatu VOC:
program Zagraj;
{$M 16000,0,50000} uses crt.YOC:
var
b:pointer;
39
OBSŁUGA PLIKÓW VOC
procedurę koncZJesli_zle;
begin
lfVOC_Btad<>VOkthen begin
wnteln[VapisBledu);
halt end end:
begin
if paramcount<>1 then begin
wricelnC Użycie: ZAGRAJ plik');
wriceinfplik - plik w formacie VOC');
halt end;
Vlnic}ujSCerownik(0,0);
kończ (esli_zle:
VOdczytaJPlikVOC[b,paramstrE13);
koncz_jesli_zle;
VOdCworzVOCEb);
wricelnrOdtwarzam. Wciśnij ESC aby przerwać...');
repeat untii tkeypressed3orfVOCStatus=0);
if keypressed then VZakonczQperacjeVOC
end,
Wspomniałem, że parametrami dla VInicjujSterownik mogą być (w przypadku, gdy ustawienia karty nie są
standardowe) adres bazowy i numer przerwania IRQ. Warto byłoby, aby nasze programy, zanim zainicjują
działanie sterownika, sprawdziły je. Jednym ze sposobów jest odczytanie wartości zmiennej środowiskowej
BLASTER. Oczywiście w przypadku, gdyby w pamięci komputera, na jakim uruchomiony został nasz
program, nie znajdowała się zmienna o tej nazwie, możemy np. zwrócić się z zapylaniem do użytkownika
(sposób praktykowany - przekonać się o tym można przyglądając się kilku popularnym grom). Innym
sposobem jest badanie każdego z portów i przerwań. Ta metoda zostanie omówiona w dalszej części książki.
Poniżej przedstawiam proste funkcje zwracające interesujące nas wartości po uprzednim odczytaniu ich ze
zmiennej BLASTER:
function adres_bazowy:word;
var
lancuch.string;
pozycja:byte;
begin
ROZDZIAŁ 2
łańcuch: =GeCEnvt'8LAS7OT:
if Uancucho"] then pozycjB:=pos['A', łańcuch)
elsepozycja:=0, if pozycJaoOchen begm
ad^es_bazowy:=256
fr
[o^d[l6^cuch[pozycja-1]]-4B] +^6
ł
[o^d[lancuch[pozyc^a+^])-4B] +ord([ancuch[pozycja+3])-48
end else adres_bazowy:=$220 end;
function numer_IRQ:byte' var
lancuch:string;
pozycja;byte;
begin lancuch:=SetEnv['BLĄSTER'];
if [lancucho") Chen pozycja:=pas(T.lancuch] else pozycja:=0;
ifpozycjaoOthen
numer_IRQ:=ord[lancuch[pozycja+1]]-48 else
numer_IRQ:=7 end;
Bywa, że chcielibyśmy, aby użytkownik programu nie miał dostępu do używanych przez program plików VOC (tzn.
nie mógł przez np. prostą podmianę zmienić efektów dźwiękowych w naszej grze). Najprostszym sposobem wydaje
się wtedy zmiana ich nazwy i, częściowo, struktury [np. obcięcie nagłówka i pozostawienie tylko bloku danych) lub
np. „sklejenie" ich w jeden plik i przechowywanie przez program położenia poszczególnych „składowych". W
przypadku niewielu plików za sposób można także uznać połączenie ich zawartości z kodem naszego programu.
Poniżej prezentuję przykładowy listing. Program odtwarza włączone na etapie konsolidacji dane dźwiękowe
zapisane w formacie VOC. Korzysta także ze skonsolidowanego ze swoim kodem sterownika. Podobny programik
może na przykład znaleźć zastosowanie przy tworzeniu plików wsadowych (podczas działania których komunikaty
będą np. wypowiadane za pośrednictwem SB).
program p1;
usesVOCDrv;
{tekst biblioteki zamieszczony przy opisie sposobu
obsług/ą PLIKÓW VOC
korzystane ze sterownika CT-WICE}
{$Lexample1,obj} procedurę Dźwięk:
external:
kod procedury Dźwięk to zawartość pliku example1.obj utworzonego w następujący sposób:
BINDBJ example1.voc example1,obj Dźwięk
}
var
Status ;word:
segm, przesuń, wynik:ward;
procedurę Odtworz_zaw_pliku(si0iword];
begin
o:=o+$1A:
{ długość nagłówka dla tej wersji formatu }
asm
mov bx,6
mov es,s
mov di,o
cali far ptrvoice end;
nepeat unti Status =0 {czekamy na koniec} end;
begin
Status =0;
WriteInCBum bum bum,..'3; {informacja } asm
movbx,3
cali far ptrvcice
nnov wynik,ax end;
ifwynikoOthen
begin wnteInfBłąd podczas inicjalizacji sterownika.');
halt end;
segm:=segEStatusl;
przesuń; =ofs[Status], asm
mov bx,5
mov es,segm
mov di, przesuń
ROZDZIAŁ 2
end.
OdCworz_zcWJ^Ikutseg[D2wiek),of5EDzwiek]);
as m
movbx,9
cali far ptrvai[:e end end. {ijuż}
2.3 OBSŁUGA WIĘKSZYCH PLIKÓW
Praca z plikami formatu VOC przy użyciu standardowego sterownika CT-VOICE jest wygodna, ale nie
pozbawiona wad. Za podstawową należy uznać fakt, że niemożliwe jest odtworzenie pliku o rozmiarach
przekraczających wielkość dostępnego do zaallokowa-nia obszaru RAM. Poza tym konieczność ładowania pliku
do pamięci przed odtworzeniem zmusza nas do walki o niemal każdy bajt. Kłopotliwy Jest też zapis dźwięku o
nieco większej długości. Okazuje się, że wśród rozpowszechnianych wraz z kartą plików znajduje się
CTVDSK.DRV, zawierający kod sterownika (Creative Disk Double-Buffering Voice Driver), przy użyciu
którego możemy odgrywać pliki bezpośrednio z dysku i zapisywać prosto do pliku (!). Pomysł jest prosty -
sterownik wykorzystuje zdefiniowany wcześniej bufor dzieląc go na dwie części, do jednej „doczytując" kolejne
partie pliku, z drugiej zaś odtwarzając uprzednio „doczytane". Funkcje nowego sterownika niewiele różnią się od
funkcji standardowego CT-VOICE. Oto opis kilku z nich, niezbędnych do zapisu i odtwarzania danych
dźwiękowych wprost z dysku, a nie udostępnianych (lub wymagających odmiennych parametrów) przez kod
zawarty w CT-VOI-CE.DRV:
Funkcja 3: Inicjalizacja sterownika
Wejście: BX=3
AX= rozmiar bufora Wyjście: AX - kod błędu
O - wykonanie bezbłędne
1 - błędne działanie karty Sound Blaster
2 - zły adres bazowy (błąd odczytu/zapisu)
3 - zły numer przerwania IRQ
43
OBSŁUGA PLIKÓW VOC
Opis: Jednym z wymaganych przez funkcję parametrów jest - podawany w rejestrze AX - rozmiar bufora.
Parametr len rozumiany jest jako ilość bloków wielkości 4 KB, składających się na bufor. Tak
więc. jeśli na potrzeby bufora allokujemy 32 KB, rejestrowi AX nadajemy wartość 8. Jak już
wspomniałem, zdefiniowany bufor podzielony zostanie na dwie równe części. Można więc
powiedzieć, że w AX podajemy rozmiar każdej z tych dwóch części będący wielokrotnością 2
KB.
Funkcja 5: Ustawienie adresu zmiennej statusowej
Wejście: BX=5
DX = numer segmentu z adresu zmiennej AX == przesunięcie wewnąirzsegmentowe zmiennej
Wyjście: brak
Opis: Wywołując tę funkcję wskazujemy sterownikowi lokalizację szesnastobitowego stówa
przeznaczonego na zmienną statusową. Sterownik podczas pracy nadaje lej zmiennej różne
wartości. Badając je możemy stwierdzić, na jakim etapie działania znajduje się procedura
odtwarzania dźwięku. Dokładniejszy opis znajdzie Czytelnik we wcześniejszej części książki
(opis CT-VOICE).
Funkcja 6: Odtworzenie zawartości pliku
Wejście: BX=6
AX = uchwyt pliku
Wyjście: AX - informacja o tym, czy wystąpił jakiś błąd (O oznacza wykonanie pomyślne)
Opis: Działanie funkcji polega na rozpoczęciu odtwarzania pliku z użyciem zainicjowanego wcześniej
bufora. Parametrem funkcji jest uchwyt pliku - wielkość zwracana przez usługi DOS po jego
otwarciu. Odgrywanie pliku z użyciem tej funkcji wiąże się z cyklicznymi odczytami z pamięci
masowej. Należy zwrócić uwagę, że częstotliwość odwołań do dysku jest odwrotnie
proporcjonalna do rozmiaru bufora.
ROZDZIAŁ 2
Funkcja 7: Zapis dźwięku do pliku
Wejście: BX=7
AX= uchwyt pliku DX= częstotliwość
Wyjście: AX - informacja o ewentualnym błędzie (O - wykonanie bezbłędne)
Opis: Wywołanie tej funkcji rozpoczyna zapis do pliku danych dźwiękowych pobieranych z przetwornika
analogowo-cyfrowego z częstotliwością zadaną przez wartość rejestru DX.
Funkcja 14: Informacja o błędzie
Wejście: BX==14 Wyjście: DX - kod błędu DOS
AX- kod błędu sterownika
Opis: Funkcję wywołujemy w wypadku, gdy próba wykonania innej funkcji sterownika nie powiodła się. Badając
zwrócone wartości możemy poznać przyczynę powstania błędu.
Funkcja 15: Inicjalizacja bufora
Wejście: BX=15
DX = numer segmentu początku bufora
AX = przesunięcie wewnątrz segmentu początku bufora
CX = rozmiar bufora w 4 KB blokach Wyjście: brak
Opis: Wykonanie funkcji jest konieczne przed próbą odtworzenia jakiegokolwiek pliku. Wywołując ją
wskazujemy sterownikowi miejsce w pamięci operacyjnej, gdzie ulokowaliśmy bufor używany przy
odtwarzaniu.
Skoro poznaliśmy już nowe funkcje sterownika, czas na zapoznanie się z podstawowymi zasadami korzystania z
niego:
45
OBSŁUGA PLIKÓW VOC
Rozpoczęcie pracy:
1. Otwarcie pliku CTVDSK.DRV, sprawdzenie jego rozmiaru i allo-kacja niezbędnego obszaru pamięci
operacyjnej.
2. Wczytanie kodu sterownika i zamknięcie pliku.
3. Inicjalizacja bufora używanego przez sterownik (allokacja pamięci i użycie funkcji 15). Jeżeli czynność
ta nie poprzedzi inicjali-zacji sterownika, driver sam zarezerwuje bufor w pamięci operacyjnej.
4. Modyfikacja adresu bazowego używanego przez sterownik.
5. Zmiana numeru przerwania IRQ wykorzystywanego podczas transmisji danych.
6. Inicjalizacja sterownika (funkcja numer 3).
7. Wskazanie lokalizacji zmiennej statusowej. Przed inicjalizacją sterownika nasz program może także
przejąć kontrolę przerwania 24h (obsługa błędów krytycznych). Dodatkowo należy pamiętać, że w
przypadku wystąpienia jakiegoś błędu użyć możemy funkcji 14 (informacja o błędzie).
Odtwarzanie:
1. Otworzenie pliku zawierającego dane dźwiękowe i zapisanego w formacie VOC.
2. Włączenie układu DAĆ (czynność jest zbędna, gdy odtwarzamy plik zaraz po inicjalizacji sterownika i gdy
układ DAĆ nie był wyłączany).
3. Wywołanie funkcji 6 z podaniem w rejestrze AX uchwytu do otwartego pliku.
4. Oczekiwanie na moment, w którym zmiennej statusowej nadana zostanie wartość O (koniec). Podczas
oczekiwania na zakończenie odtwarzania nasz program może wykonywać inne czynności. Używając
funkcji 10 i 11 możemy zatrzymywać i wznawiać wykonywanie procedury odtwarzającej, a wywołując
funkcję 8 - zakończyć jej działanie. Odczytując wartość zmiennej statusowej możemy, pod warunkiem
uprzedniego wzbogacenia naszego pliku o podbloki typu Marker, sprawdzić, który fragment próbki
dźwiękowej jest aktualnie odtwarzany. Podczas odtwarzania wciąż możemy odwoływać się do napędów
dyskowych z użyciem usług DOS'u. Istnieją natomiast pewne ograniczenia dotyczące wykorzystania
przez program przerwań 8h (Timer), l On (Video), 13h (usługi BlOS-u dotyczące operacji dyskowych)
HOZDZfAŁ 2
i 28h. Ich obsługę przejmuje na czas działania sterownik. Można je wykorzystywać jedynie:
• przed inicjalizacją oraz po deinicjalizacji,
po inicjalizacji oraz przed deimcjalizacją.
6. Po zakończeniu odtwarzania należy zamknąć plik z danymi dźwiękowymi
Zapis dźwięku:
1. Otwarcie pliku przeznaczonego do zapisu danych.
2. Wyłączenie (z użyciem odpowiedniej funkcji sterownika) układu DAĆ.
3. Wywołanie funkcji 7 (zapis) z odpowiednimi parametrami.
4. Wykonywanie innych czynności. Podczas zapisu dźwięku nasz program może wykonywać inne zadania. Chcąc
zakończyć zapis dźwięku wystarczy wywołać funkcję 8 sterownika. Informację o tym, czy zapis dźwięku wciąż
trwa, można uzyskać odczytując wartość zmiennej statusowej (O oznacza zakończenie zapisu).
5. Zamknięcie pliku, do którego zapisywaliśmy dźwięk. Należy zwrócić uwagę, że dane zapisywane są przez
sterownik w formacie VOC, nie ma więc już potrzeby (jak przy sterowniku CT-VOICE) zapisu nagłówka przed
utworzoną przez driver strukturą-
Zakończenie pracy:
1. Zakończenie procedury odtwarzania (jeśli jest aktywna) i zamknięcie plików dźwiękowych.
2. Wywołanie funkcji deinstalacji sterownika.
3. Zwolnienie pamięci zajmowanej przez kod sterownika i bufor. Jeśli rozpoczynając pracę nasz program przejął
obsługę przerwania 24h. po deinicjalizacji sterownika powinien przywrócić pierwotną wartość wektora.
Wykorzystanie CTVDSK.DRV to prosty sposób na wzbogacenie dłuższej prezentacji o dźwięk czy też gry o
muzykę. Moim jednak zdaniem, wykorzystanie plików VOC do przechowywania i odtwarzania „w tle"
zdigitalizowanej muzyki nie jest pomysłem najlepszym (na jedną sekundę przywoicie słyszalnego dźwięku musimy
przecież przeznaczyć co najmniej kilka KB) - znacznie wygodniej jest, według mnie, wykorzystać muzykę zapisaną
w formacie CMF.
47
OBSŁUGA PLIKÓW VOC
Skoro opisałem już metodykę wykorzystania CTVDSK.DRV, czas na przykład; będzie nim tekst źródłowy
programu odtwarzającego zadany parametrem plik.
{$M 16000.0,50000}
program DskPIay;
uses
dos,crt;
var
sCerownik:pointer; {wskazanie na początek kodu } Dbufferpointer; { wskazanie na bufor} Error:byte; {
numer błędu } YOCStatus.word; {zmiennastacusowa} P:fite;
Uchwyt:word absolute P: { rzut: P na pole 16-bic } ch:char;
Zat,rzymany:boolean; {czy zsCrTymaliśmyodtwarzanie}
function lscniejetPEik:string]'boolean;
var
f:file;
begin
assigntf.Plik);
{$!-}
resectf];
close(f);
{$!+}
Istnieje: ^[IDresult^Ol end;
function Czy to_plik_VOC[spec:string):boolean, var
u:tile;
tab:array[Q,.3] of char;
begin
assign(u,spec3;
reset(u,1);
iffilesize[u)>31 chen
{ nagłówek + początek bloku danych }
begin
blockreadEu,tab,4);
CzyJ:o_plik_VOC
^[tab^+tabdl+tab^l+cabtS^Crea');
endelse Czy_l;o_plik_VOC:=falsE:
ROZDZIAŁ 2
cbselu)
end;
procedurę 2are2erwuj_parniectvargd2)e:poinCer:iie'longinti;
var
r:regisCers;
ilosc:word:
begin
ilość: =(ile-15] shr4:
nah;=$4S:
rbx:=ilosc;
MsOosCr-);
if [r.bxoilosc] then Error^S e.se begin
Error:=0;
gdzie:=ptr(r,ax,0) end
end;
procedurę Zwolnij^pamiectgdzie.pointer);
var
p:registers;
begin
rah:=$49:
r.es:=segtgdzie^);
msdostr];
iftr.ax^7]or[rax=9)then Error:=3 end;
procedurę lnicjuj_sterownik[PorC,lrq,Size:word);
var
sifile;
specyfikacja:string;
segment, przesuń :word;
CoJest_stercwnik:boolean;
wynik:word;
begin
specyfikacja:='CTVDSK,DRV;
if not Istniejetspecyfikacjał then
specyfikacja: ^getEnyfSaUND^+ADR^CTYDSK.DRY';
if not IscriejeCspecyfikacja] then
begin
Error=1;
exit
end;
S5sign[s,specyfikacjal:
resetCs.l);
OBSŁUGA PLIKÓW VOC
Za reasrwJ |_Damec (ste rownik.fileSizetsJ);
ifErroroO then exit:
blockreadts,sterownik^ ,nlesize[5)], {wczyta) kod } closets], segment, =seg[ste''ownlk
/s
);
p^zesun;-=of5[5t.e^ownlk
/\
]; { adres początku kodu } tOJesC^stero^nik^tMemWLsegmenc przesuń+31 =$5443):
Co_)est sterownik: ==Co_)est_sterownik
and EMemW[segment:przesun+5]=$4456):
if noc COJest^sterownik then begin
ErrDr':=4;
exit
end;
Za^e^er'vuu^_pam^ec[Dbuffe^.s^^e
ft
4Q95];
if ErraroO then exit;
segment; =seg[Dbuffe^
/\
];
przesuń: ^fstDbuffer-^];
asm
mov bx,15
mov dx,segment
mov ax,prze5Lin
mov cx,size
cali sterownik end:
if portoOthen
asm
mov bx,1 mov ax,port cali sterownik
end;
ifirqo0then
asm
mov bx,2 mov3x,irq cali sterownik
end;
segment: =seg[VOCstatus3;
przesuń: =ofs[VOCstatus];
asm
mov bx,3
mov ax,size
cali sterownik
mov wynik, ax
mov bx,5
movdx,segment
movax,przesuń
cali sterownik end:
ROZDZIAŁ 2
OBSŁUGA PLIKÓW VOC
procedurę Kontynuuj;
begin ZaCrzymany:=false;
asm
mov bx,11
cali sterownik end end;
procedurę Deinstalu^sterownik;
begin asm
movbx,9 cali sterownik end;
Zwolnij_pamlecEsterownik];
ZwDlnij_pamiec[Dbuffer3 end;
procedurę KonczJesli_zle;
begin
ifError=Othen exit;
case Error of 1: writeInCBrak pliku CTVDSK.DRV3:
2: writeInCBład przydziału pamięci']:
3: writeln['Btad zwolnienia pamięci');
4: writelnC'Zły nagłówek sterownika'];
5; writelnC'Błędne dziatanie karty']:
B: writeInCBtąd obsługi portów karty');
7: wntelnC'Btędny numer IRQ');
8: wricelnt'Brak wskazanego pliku") end;
halt
end;
begin
begin
end;
if paramcountol then { nie podano parametru }
writeInCUżycie: DiskPtayplik');
writefnCplik- plik w formacie VOC');
hale
if not IstniejeCparamstrII)) then begin
wnteln^Brak wskazanego pliku');
halt
casewynkof
0: Error;=0;
1: Error:=5;
S: Error;=6;
3:Error:=7 end
end;
procedurę DdtworzJ)likl)aki:stnng);
var handle:word;
begin assIgnLPjaki):
{$F-} resetiPI;
{$F+} ifioresulcoOthen begin
Error:=B;
exit end;
handle;=Uchwyt:
asm
movbx,6
movax, handle
cali sterownik end end;
procedurę Zakończ odtwarzanie;
hegin
ifVOCStatus<>Othen {jeśli jeszcze gra } asm
movbx,8 cali sterownik end;
{$F-} close(P]:
{$F-} end;
procedurę Pauza;
begin Zatrzymany: =true;
asm
mov bx,10
catl sterownik end end;
ROZDZIAŁ 2
OBSŁUGA PLIKÓW CMF
53
ifnotC2y_Co_pllk_VDCtparBmstr(1]} then begin
wnteInCPlik nie jeść zapisany w formacie VOC'
halt end:
Inicjuj sterownik(0,D,103; { bufor 40 KB} koncz_Jesli_zle:
2atr'zymany:=false;
OdCworz_plik[paramstrt1l];
writeInCOdtwarzam...'];
writeInfSPACE - pauza, ESC - koniec'3;
repeac
if keypressedthen ch:=r-eadkeyelse ch:=#0;
ifch=^32then
case Zatr-zymany of
true: KontynJJ);
false; Pauza end uncii
[VOCStat;us=0)or[ch=^27], Zakoncz^odCwarzanie;
Deinst;aluj_sterownik
3. OBSŁUGA PLIKÓW CMF
W rozdziale omówię sposób obsługi plików
zapisanych w formacie CMF (Creative Musie
File). Struktura ta została stworzona do
przechowywania danych muzycznych. Przy ich
odtwarzaniu najłatwiej jest wykorzystać
sterownik SBFM. Jego funkcje umożliwiają
odtwarzanie muzyki „w tle", a co za tym idzie,
np. proste wzbogacenie programów
rozrywkowych o podkład muzyczny.
3.1 STRUKTURA PLIKÓW CMF
Sposób, w jaki zorganizowane są pliki CMF,
przedstawia się w następujący sposób:
1. Blok nagłówka
Blok zawiera podstawowe informacje o
zawartości pliku.
2. Blok instrumentów
Definicje instrumentów użytych przy
odtwarzaniu muzyki. Wartość informująca
o ilości 16-bajtowych definicji
przechowywana jest w bloku nagłówka.
3. Blok muzyczny
Muzyka zapisana w zunifikowanej formie.
ROZDZIAŁ 3
Omówię teraz każdy z 3 bloków pliku CMF. Blok nagłówka
Przesunięcie (szesnastkowo)
Opis
00-03h Identyfikator pliku - 4 znaki ASCII „CTMF". 04-05h Wersja formatu CMF.
Starszy bajt słowa przechowuje bardziej znaczącą część numeru wersji, młodsza - mniej znaczącą
część.
06-07h Przesunięcie Bloku instrumentów względem początku pliku CMF.
08-09h Przesunięcie Bloku muzycznego względem początku pliku.
OA-OBh Ilość cykli zegarowych odpowiadających ćwierćnucie.
Dla przykładu: jeżeli częstotliwość zegara wynosi 96 Hz, a wartość tempa to 120, wartość
ta powinna być równa 48 (domyślnie).
OC-ODh Ilość cykli zegarowych w ciągu sekundy.
Częstotliwość zegara O wyrażona w Hz (1/sek). Wartością domyślną jest 96. Zalecany przedział
wartości to (20,160).
OE-OFh Przesunięcie tytułu względem początku pliku.
Wartość opisująca położenie ciągu znaków ASCII zakończonych bajtem równym O (ciąg
ASCIIZ). Brak tytułu utworu sygnalizowany jest zerową wartością przesunięcia.
10-1 Ih Przesunięcie danych kompozytora względem początku pliku.
Wartość opisuje położenie danych dotyczących kompozytora (np. nazwisko). Dane
kompozytora muszą być zapisane jako ciąg ASCIIZ. Brak danych sygnalizowany jest zerową
wartością przesunięcia.
12-13h Położenie komentarzy.
Szesnastobitowe słowo opisujące położenie ciągu ASCIIZ zawierającego komentarz
względem początku płiku
55
OBSŁUGA PLIKÓW CMF
CMF. Długość wskazywanego ciągu nie powinna przekraczać 32 bajtów.
14-23n Tabela zajęcia kanałów.
Szesnastobajtowa tablica przechowująca informacje o wykorzystywanych przy odtwarzaniu
muzyki kanałach. Wartość l bajtu odpowiadającego danemu kanałowi oznacza jego
wykorzystanie.
24-25h Ilość używanych instrumentów.
Wartość opisująca ilość używanych przy odtwarzaniu muzyki instrumentów.
26-27h Tempo podstawowe. Główne tempo utworu.
28h-.. Od tego miejsca rozpoczynają się ciągi znakowe opisujące tytuł, dane kompozytora ulworu i
komentarze.
Blok instrumentów
Blok zawierający rekordy o długości 16 bajtów, opisujące używane przez utwór instrumenty. Ilość pól opisuje
słowo nagłówka o przesunięciu 24h względem początku pliku. Położenie bloku instrumentów opisuje słowo o
przesunięciu 6h. Każdy rekord zawiera obraz wartości rejestrów danego kanału FM. Rekord przechowuje
wartości równe zawartym w obszarze rozpoczynającym się od przesunięcia 24h pliku SBI (SBI - Sound
Blaster Instrument File to format zapisu opisu instrumentów używany np. przez program IEDIT).
Blok muzyczny
Format, w jakim zapisane są dane opisujące muzykę, jest zbliżony do formatu SMF (Standard
MIDI Format). Opisuje on utwory jedności eżk owe, wielokanałowe i polifoniczne. Maksymalna
liczba kanałów to 16.
3.2 FORMATY SBI i IBK
Pliki zapisane w formacie SBI (Sound Blaster Instrument) przechowują dane opisujące pojedynczy
instrument. Większość pól struktury SBI można skojarzyć z odpowiednimi rejestrami układu syntezatora FM
i ich zawartość może być bezpośrednio do nich wpisana w celu
ROZDZIAŁ 3
zdefiniowania danego brzmienia. Długość pliku zapisanego w formacie SBI jest stała i wynosi 51 bajtów. Poniżej
prezentuję, jak przedstawia się jego struktura. Dokładniejsze opisy znaczenia poszczególnych pól znajdzie Czytelnik
w rozdziale poświęconym bezpośredniemu programowaniu syntezatora FM.
Przesunięcie (szesnastkowol
Opis
00-03 04-23
24
25
26
27
28
29
2A 2B
2C
Identyfikator pliku. Ciąg znaków „SBI" zakończony bajtem o wartości lAh
Nazwa instrumentu. Ciąg ASCI1Z (znaki ASCII i bajt o wartości 0) zawierający nazwę instrumentu Baji opisujący
charakterystykę fali modulującej Bajt opisujący charakterystykę fali nośnej
bit 7 - vibrato wysokości - tremolo (AM) bit 6 - vibrato amplitudy (VIB) bit 5 - dźwięk podtrzymany (EG-TYP) bit
4 - skalowanie obwiedni (KSR) bity 3-0 - mnożnik częstotliwości (MULTIPLE) Skalowanie/Poziom wyjściowy
fali modulującej Skatowanie/Poziom wyjściowy fali nośnej bity 7-6 - skalowanie poziomu (KSL) bity 5-0 -
poziom wyjściowy fali nośnej (TL)
Bajt opisujący proces narastania i opadania fali modulującej
Narastanie i opadanie fali nośnej
bity 7-^ - prędkość narastania (AR) bity 3-0 - prędkość opadania (DR)
Bajt, którego bity opisują poziom podtrzymania i prędkość wygasania fali modulującej
Poziom podtrzymania i prędkość wygasania fali nośnej bity 7-^ - poziom podtrzymania (SL) bity 3-0 - prędkość
wygasania fali (RR)
Wybór fali modulującej
57
OBSŁUGA PUKÓW CMF
2D Wybór tali nośnej
bity 7-2 - wy zerowane
2F
bity 1-0 -wybór fali (WS) Sprzężenie zwrotne/połączenie
bity 7-4 - wyzerowne
bity 3-1 - sprzężenie zwrotne układu modulatora
bit O - połączenie 2F-33 Zarezerwowane
Funkcje i znaczenie poszczególnych bitów odpowiednich pól opisujących falę modulującą i nośną są identyczne.
Bajty o przesunięciach 24-33h odpowiadają kolejnym polom definicji instrumentu w bloku instrumentów pliku
CMF.
Ponieważ używanie plików SBI do przechowywania definicji pojedynczych instrumentów może być, przy
większej ich liczbie, niewygodne, stworzono format IBK (Sound Blaster Instrument Bank), umożliwiający
zgrupowanie w jednym pliku większej ilości definicji. Maksymalna liczba opisywanych plikiem IBK
instrumentów wynosi 128. Struktura IBK przedstawia się następująco:
Przesunięcie Opis (szesnastkowo)
00-03 Identyfikator pliku - ciąg „IBK" zakończony bajtem O wartości lAh.
04-803 Parametry instrumentów. Obszar o wielkości 2 KB przeznaczony na przechowanie definicji 128
instrumentów (po 16 bajtów na każdy).
804-C83 Nazwy instrumentów. Tablica zawierająca nazwy każdego z opisywanych w pliku instrumentów.
Nazwę pojedynczego instrumentu stanowi ciąg 9 znaków ASCII zakończony bajtem o wartości 0.
3.3 STEROWNIK SBFM
W rozdziale omówię sposób wykorzystania rezydentnego sterownika Sound Blaster FM. Używając go można w
prosty sposób odtwa-
ROZDZIAŁ 3
rzać muzykę zapisaną w formacie CMF, wykorzystując układ syntezatora FM (Frecjuency Modulation) będący
częścią karty dźwiękowej.
SPOSÓB KORZYSTANIA ZE STEROWNIKA
Sterownik SBFM instalujemy w pamięci operacyjnej uruchamiając program SBFMDRV.COM. Program
przechwytuje obsługę jednego z przerwań o numerze zawierającym się w przedziale 80h..BFh (wybiera pierwsze
nie zajęte). Przesunięcie wewnątrzsegmentowe początku kodu nowej procedury obsługi przerwania jest równe 0. Do
funkcji sterownika odwołujemy się wykonując obsługiwane przez niego przerwanie (rozkazem assemblerowym
INT). Wpierw jednak musimy sprawdzić, obsługę którego przerwania przejął sterownik. Najprościej zrobić to
badając dla każdego „podejrzanego" (od 80h do BFh) kod procedury obsługi. W kodzie oryginalnego SBFM, od
przesunięcia 103h względem komórki wskazywanej przez wektor przerwania rozpoczynać się powinna 5-bajtowa
sygnatura „FMDW.
Wszystkie parametry przekazujemy driverowi z pomocą rejestrów mikroprocesora. Numer funkcji, z której
chcielibyśmy skorzystać, umieszczamy w BX. a parametry w pozostałych. Po wykonaniu funkcji sterownik
umieszcza (czasem nie) kod wyniku w rejestrze AX (odczytując jego zawartość dowiedzieć się możemy, czy
operacja przebiegła pomyślnie, czy też nie).
Wartości wszystkich rejestrów wraz z flagowym (oprócz AX i DX) są przez sterownik zachowywane.
Podobnie jak sterownik CT-VOICE, SBFM modyfikuje wskazaną przez program zmienną zwaną dalej zmienną
statusową. Dla drive-ra SBFM zmienna zajmuje jeden bajt. Jej lokalizację wskazujemy korzystając z funkcji l.
Podobnie jak przy odtwarzaniu zawartości plików VOC, wartość zmiennej statusowej używanej przez sterownik
informuje nas o działaniu procedur sterownika. Rezydentny driver SBFM modyfikuje ją w przypadku:
1. Resetu (ustawia na 0)
2. Rozpoczynając odtwarzanie bloku muzycznego pliku CMF (ustawia na FFh)
3. Kończąc odtwarzanie bloku muzycznego (ustawia na 0)
4. Natrafienia na pole Control Event w bloku muzycznym (ustawia wartość zmiennej statusowej zgodnie z
zawartością pola Control Data)
59
OBSŁUGA PLIKÓW CMF
Zmienna statusowa nie jest modyfikowana, gdy wywołamy funkcję chwilowego zatrzymania (nr 9) lub
kontynuacji (nr 10) odtwarzania muzyki.
OPIS FUNKCJI STEROWNIKA
Rezydentny sterownik SBFM dostarcza nam następujące funkcje:
Funkcja 0: Pobranie numeru wersja sterownika _____
Wejście: BX=0
Wyjście: AX - wersja SBFM
Opis: Funkcja zwraca bardziej znaczącą (AH) i mniej znaczącą (AL) część numeru wersji
zainstalowanego w pamięci sterownika.
Funkcja 1: Wskazanie bajtu statusowego
Wejście:BX=1
DX:AX== adres bajtu Wyjście: brak
Opis: Wskazanie sterownikowi położenia bajtu przeznaczonego na zmienną statusową. Funkcje tej
zmiennej omówiłem w części „Sposób korzystania z funkcji".
Funkcja 2: Wskazanie tabeli instrumentów
Wejście: BX=2
CX== ilość instrumentów
DX:AX= adres tabeli Wyjście: brak
Opis: Zanim rozpoczniemy odtwarzanie utworu muzycznego powinniśmy wskazać sterownikowi
położenie tabeli zawierającej definicje instrumentów (driver zawiera wprawdzie definicję 16
instrumentów, ale użyte w odtwarzanym utworze mogą się od nich różnić). Sterownik używa
jej do programowania układów syntezy FM. Należy pamiętać, że wielkość praekazywana w
rejestrze CX nie powinna być większa od 128.
ROZDZIAŁ 3
Funkcja 3: Ustawienie częstotliwości zegara systemowego Wejście:BX=3
AX= wartość odpowiadająca częstotliwości Wyjście: brak
Opis: Używając tej funkcji informujemy sterownik o częstotliwości, na jaką powinien ustawić Timer O po
zakończeniu odtwarzania. Welkość przekazywana w rejestrze AX wyliczyć można ze wzoru:
w = l i 931801 częstotliwość U/Hz l
Jeśli program nie wywoła tej funkcji lub wywoła z parametrem AX=FFFFh, Timer O pozostanie
ustawiony na częstotliwość około 18.2 Hz-
Funkcja 4: Ustawienie częstotliwości zegara SBFM
Wejście: BX=4
AX= wartość odpowiadająca częstotliwości Wyjście: brak
Opis: Działanie funkcji polega na ustawieniu częstotliwości, na jaką sterownik powinien przeprogramować
Timer O na czas odtwarzania dźwięku. Sposób wyliczania wartości przekazywanej w AX jest laki sam
jak dla funkcji poprzedniej:
w = H93I80/częstotliivość [1/Hzf
Częstotliwością domyślną jest 96 Hz. Właściwą dla danego utworu częstotliwość przechowuje
szesnastobito-we słowo o przesunięciu OCh względem początku pliku. Częstotliwość Timera O
decyduje o szybkości odtwarzania muzyki. Łatwo więc przez jej zmianę wpływać na tempo gry.
Funkcja 5: Transpozycja utworu
Wejście: BX=5
AX= parametr transpozycji Wyjście: brak
61
OBSŁUGA PLIKÓW CMF
Opis: Działanie funkcji polega na zmianie tonacji utworu. Parametr przekazywany w AX wyrażony jest w
półtonach.
Funkcja 6: Odtworzenie utworu Wejście:BX=G
DX:AX= adres bloku muzycznego
Wyjście: AX= wynik:
O - wykonanie bezbłędne l - błąd, inny utwór jest wciąż aktywny
Opis: Wywołanie funkcji rozpoczyna odtwarzanie utworu muzycznego opisanego w bloku muzycznym.
Para rejestrów DX:AX określa jego położenie. Wyliczyć j^ możemy korzystając z wartości
przechowywanej w nagłówku pliku CMF (przesunięcie 08h względem początku). W wyniku
działania funkcji sterownik ustawia wartość zmiennej statusowej na FFh. częstotliwość Timera
O na zdefiniowaną przy użyciu funkcji 4, przejmuje obsługę przerwania 8h i rozpoczyna grę.
Odbywa się ona „w tle".
Funkcja 7: Zakończenie odtwarzania muzyki
Wejście:BX=7
Wyjście: AX=0 - bezbłędnie
AX=1 - żaden utwór nie był odtwarzany
Opis: Funkcja kończy odtwarzanie utworu muzycznego, zeruje zmienną statusową i programuje
częstotliwość zegara Timer O na 18.2 Hz lub na ustawioną z użyciem funkcji 3.
Funkcja 8: Reset sterownika SBFM
Wejście: BX=8 Wyjście: AX=0 - bezbłędnie
AX=1 błąd, sterownik odtwarza muzykę
Opis: Po wywołaniu tej funkcji sterownik wyłącza układy FM i ustawia domyślną (wewnętrzną) tabelę
instrumentów. Jeśli sterownik odtwarza utwór muzyczny, należy
ROZDZIAŁ 3
wpierw wywołać funkcję 7. Wykonanie funkcji reinicjali-zacji sterownika jest konieczne przed
zakończeniem pracy naszego programu.
Funkcja 9: Chwilowe zatrzymanie odtwarzania Wejście:BX=9
Wyjście: AX= wynik
O - przebieg bezbłędny l - błąd, żaden utwór nie był odtwarzany
Opis: Zatrzymanie odtwarzania. Funkcja nie modyfikuje wartości zmiennej statusowej. Odtwarzanie muzyki jest
kontynuowane po wywołaniu funkcji l O i kończone w wyniku działania funkcji 7.
Funkcja 10: Kontynuacja odtwarzania
Wejście:
Wyjście:
Opis:
BX=10
AX=0 - bez błędów AX=1 - muzyka nie była zatrzymana
Funkcja służy do wznowienia odtwarzania utworu zatrzymanego funkcją 9.
Pułapki użytkownika dla Exclusive Commands
Wejście:
Wyjście:
Opis:
BX=11
DX:AX== adres procedury pułapki
brak
Używając tej funkcji wskazujemy procedurę, którą sterownik wywoła wykorzystując assemblerową komendę CALL
(międzysegmentową) w chwili, gdy w błoku muzycznym napotka na pole System Exclusive Command.
Zdefiniowana przez nas procedura musi się kończyć komendą RETF. Musi też zachowywać wartości wszystkich
rejestrów. Przekazywany do niej przez sterownik parametr to adres następnego po S.E.Command bajtu (w parze
rejestrów ES:DI). Wyłączenie pułapki użytkownika jest konieczne przed zakończeniem działania na-
63
OBSŁUGA PLfKOW CMF
szego programu. Dokonać tego możemy zerując przed wywołaniem lej funkcji rejestry AX i
DX.
ZASADY KORZYSTANIA Z FUNKCJI
Istnieje kilka zasad, których powinniśmy się trzymać programując z wykorzystaniem rezydentnego
sterownika SBFM. Najprościej będzie, gdy zaprezentuję uproszczony algorytm, wg którego działać powinien
program odtwarzający muzykę zapisaną w formacie CMF:
1. Odszukanie przerwania obsługiwanego przez sterownik. Podczas wykonywania tej procedury okazać się
może, że żadne z przerwań nie jest wykorzystane przez SBFM - wtedy nasz program powinien kończyć
działanie z odpowiednim komunikatem.
2. Otwarcie pliku do odtworzenia, sprawdzenie jego rozmiaru, al-lokacja niezbędnego obszaru pamięci
operacyjnej, wczytanie zawartości pliku i jego zamknięcie. Przed wczytaniem warto sprawdzić, czy
pierwsze 4 bajty pliku układają się w ciąg „CTMF" (gdy nie, plik nie jest zapisany w formacie CMF).
3. Wywołanie funkcji reinicjalizacji sterownika (nr 8).
4. Wskazanie położenia zmiennej statusowej (funkcja 1).
5. Odczytanie żądanej częstotliwości zegara systemowego na czas odtwarzania z odpowiedniego pola
nagłówka pliku i ustawienie jej z użyciem funkcji 4.
6. Wskazanie sterownikowi położenia tabeli zawierającej definicję instrumentów (jej lokalizację względem
początku pliku CMF odczytamy z nagłówka).
7. Obliczenie położenia początku bloku muzycznego (przesunięcie względem początku pliku odczytamy z
nagłówka).
8. Wywołanie funkcji odtwarzania muzyki (nr 6).
9. Oczekiwanie na zakończenie odtwarzania muzyki (sterownik wyzeruje wtedy zmienną statusową).
Podczas odtwarzania program może wykonywać inne czynności. Odtwarzanie możemy zatrzymywać i
wznawiać przy użyciu funkcji 9 i 10 oraz zakończyć używając funkcji nr 7.
10. Wywołanie funkcji reinicjalizacji sterownika oraz zwolnienie pamięci zajmowanej przez plik CMF.
ROZDZIAŁ 3
BIBLIOTEKA CMF.TPL
W rozdziale tym zaprezentuję tekst źródłowy gotowej do użycia biblioteki CMF. udostępniającej kilka podstawowych
procedur obsługi plików zapisanych w formacie Creative Musie File. Teksi biblioteki i kompilat znajduje się także na
dołączonej do książki dyskietce.
Podobnie jak we przedstawionej wcześniej bibliotece VOC.TPU, zacząłem od definicji typu wyliczeniowego
opisującego możliwe błę-dy.
untCMF;
interface
type CMoz!iweBledy=[COk,
CMaloPamieci,
CBIadZwalniama,
CNieInstalowany,
CBrakPIikuCMF,
CZłyNaglowek,
CZaDuzoInstr
CAkCywnyLJtwor,
CNieGral,
CNieByloPauzy);
Następnie zadeklarowałem kilka zmiennych: CMFSlatus, którą przeznaczyłem na bajt statusowy i którą wskażemy
sterownikowi, CMF_blad typu CMozliweBledy przechowującą wartość odpowiadającą błędowi oraz
CSBFMZainstalowany, której nadamy wartość True w przypadku, gdy w pamięci operacyjnej znajduje się kod
sterownika SBFM.
var
CMFStatus:byte;
CMF^blad:CMozliweBtedy;
CSBFMZainstalowany: boolesn;
Dalej następuje lista procedur i funkcji;
procedurę Cinic|alizu|SBFI\/1:
functian CNumerWersJfSBFM'wor'd;
procedurę CUstawBajtStatusowySBFM;
function CZaladujPlikCMF[spec:string3:pointer;
procedurę CLJstawlnst:rumenty[sC3rt:;painCer);
procedurę CNastawZegarSBFM[czest;wordJ;
procedurę CTranspozycjaUtworu(polt:word);
procedurę CZagr'ajCMF[g:pointeri;
procedurę CZakonczCMF;
65
OBSŁUGA PLIKÓW CMF
procedurę CReseOJ)SBFM, procedurę CPauzaCMF;
procedurę CWznowCMF;
procedurę CZwolnijPamiecCMFtg pointer);
function CTytulCMF[g:poinCer):st:nng;
funccion CKompozytorCMF[g:poinCert:st;nng:
function CKomentarzCMF[g:pointer].string:
function COpisBledu:stnng;
implementation uses dos;
W części implementacyjnej biblioteki umieściłem definicję typu rekordowego składającego się z pól
odpowiadających kolejnym polom nagłówka pliku zapisanego w formacie CMF. W zmiennej lnt_CMF
przechowamy numer przerwania, pod które „podczepił" się sterownik.
Cype Naglowek=record
ldenCyf]kator:arr8yt0..3] ofchar;
Wersja :ward;
PolozJnstr :word;
Połóż Muz :word;
Cwiercnuta :ward;
Czestotliwosc.word;
Połóż Tytułu :word;
Poloz_Kompoz :word;
Poloz_Koment :word;
Tab_kanalow :array[0.,15] of chan;
InsCrumentow :word;
Podst_Tempa :word;
end;
lnt_CMF'byte;
CStaraProcWyjscia;pointer;
funcCiori lstnieje[Plik:string]:boolean;
var
f:file;
begin
assign[f,Plik);
{$1}
reseCCf);
closeCf];
{$!+}
ROZDZIAŁ 3
end;
procedurę Zarezerwuj pamiectvar gdzie:poincer;ile:longint);
var
r:regisCers:
ilosc-word;
begin
ilosc:=(i)e+15]shr4;
rah:=$48:
rbx:=ilosc,
MsDosEr);
if tr,bx<>ilosc) then CMF_blad:=CI\/laloPamiecl
else begin
CMF_bl6d:=COk;
gdzie:=pt:r[r.ax,G) end end;
procedurę Zwolnij_pamiactgdziB:poinCer];
var rregisters;
begin
nah:=a49;
nes^segtgdzie^);
msdos(r);
if (nax=7)oKrax=9) then CMF_b!ad:=CBiadZwalniania end;
Procedura CInicjalizujSBFM spełnia kluczową rolę - odnajduje przerwanie, którego obsługę przejął sterownik i
reinicjalizuje go oraz modyfikuje wartości zmiennych CSBFMZainstalowany oraz CMF_blad.
procedurę ClnicjalizujSBFM;
function Jest_sygnatura[p:point:er):boolean;
typeSign=arrayt0..41 ofchar;
const Znak:Sign='FMDRV';
begin
Jest_sygnatura:=[Sign[p^)=Znald end,
var
begin
67
OBSŁUGA PLIKÓW CMF
CSBFMZainstalowany: =false;
prze rwanie: =$7F;
repeat
inctprzerwanie);
getintyectprze rwanie,wskaźniki;
wskaznik:==pC^'^segtwskaznil^
/\
),$103);
unci!
[Jest sygnatura[wskaznik]]or[przBrwanie=$CO),
if Jest^sygnaturaCwskaznikJ
then
l^t_CMF:
:;
=p^zerwanie else
CMF^blad:=CNielnstalowany;
if przerwanie^ICO then exit;
CSBFMZainstalowany: =t:rue;
rej.bx:=B;
intr[lnt_CMF,rei);
If rej. ax<>0 then begin
CMF_blad;==CAktywnyUtwor;
exit end
else CMF blad:=COk
end;
Dalej następują definicje: funkcji zwracającej daną typu Word opisującą numer wersji sterownika i
procedury CUstawBajtStatusowySB-FM wskazującej sterownikowi adres zmiennej CMFStatus.
function CNumerWersJiSBFM:word;
vap rej:register's;
begin
rej.bx:=0,
intrCInt^CMP.rej);
CNumerWersjiSBFM:=rei.ax end;
procedurę CUstawBaJtStatusowySBFM;
yar rej:register-s;
begin
re).bx:=1;
rel.dx:=seg[CMFSCatusl;
rej.ax:=ofs(CMFScatus):
incr[lnt_CMF,re|) end;
ROZDZIAŁ 3
Funkcja ładowania pliku allokuje odpowiedni obszar pamięci operacyjnej, sprawdza, czy nagłówek pliku
rozpoczyna się od ciągu „CTMF" oraz ładuje jego zawartość do zarezerwowanego obszaru i zwraca
wskazanie na jego początek.
function CZaladuJPIikCMF[spec,str'ing3:poinCer:
var
f:file, rozmiar^phku, bloków, wynik:word:
wsk,mie)sce:point:er, ident:stnng[4]:
begin
if not(lstme|e(5pec)] then begin
CMF_blad;=CBrakP!ikuCMF;
exit end;
assigntf.spec);
resECtf,
1
!];
idenria];=^4:
blockreadtf,ident[13,4):
seektf.O];
ifident<>'CTMF' Chen begin
closetfl;
CMF_Blad:=CZIyNaglowek;
exit end:
rozmiarJ3liku:=filesize(f);
Zarezerwuj_pamiecEwsk,rozmiar pliku);
ifCMF_blad<>COkthen begin
closetfł:
exit end, blokow:=0;
repeat miejsce: =Pt^[seg(w5k^)+blokow
<>
4a96,of5[wsk^)];
blockread(f,miejsce^,$FFFF,wynik]:
lnc(Blokow3 uncii wynik=0:
ciosek;
CZaladuJPIikCMF:=wsk;
CMF_blad:-COk end;
Procedura CUstawInstrumenty wymaga jednego parametru - wskazania na początek nagłówka pliku. Jej działanie
polega na spraw-
OBSŁUGA PLIKÓW CMF
69
dzeniu, czy ilość instrumentów zadeklarowana w bloku nagłówka pliku nie przekracza 128 i jeśli ten warunek
zostanie spełniony, wywołaniu funkcji 2 sterownika z odpowiednimi parametrami.
Z kolei procedura CNastawZegarSBFM służy do określania, jaką częstotliwość zegara Timer O ma ustalić na
czas odtwarzania muzyki sterownik. Im częstotliwość większa, tym większe tempo odtwarzania. Procedura
CTranspozycjaUtworu umożliwia zmianę tonacji utworu zgodnie z parametrem.
procedurę CUstawInsCrumentytsCartipoincer);
var
rej.registers;
begin
if Nag!owek[start^).lnst;rumentow>1 28
then begin
CMF_9lsd:=CZaDuzolnstr;
exic end;
rej.bx:=2:
rej. CK^NaglowekCstart;^), Instrumentów;
rej.dK^segCEtart^l;
rej. ax:=ofs(start
/\
)+ Naglowektstart '
\
3, PolozJnstr;
intr[lnt_CMF,rej) end;
procedurę CNastawZegarSBFM[czest:word);
var
rej:registers;
begin
r'ej.bx:=4;
rei.ax:=1ia31BQdiv czest;
intr[lnt_CMF,rejl end;
procedurę CTranspozycjaUtworutpolt;word);
var
rej':registers;
begin
ref.bx;=5;
re).bx:=polt:;
inCrEfnt_CMF,rej) end:
Procedura CZagrajCMF rozpoczyna odtwarzanie wskazywanego przez wartość parametru g pliku. Wpierw
informuje sterownik, na
ROZDZIAŁ 3
jaką częstotliwość ustawić powinien zegar systemowy, potem wskazuje mu tablicę instrumentów, na koniec
wywołuje funkcję odtwarzania (nr 6).
procedurę CZagr8|CMFCg:pointer);
var
rej:registers;
begin
CNastawZegarSBFM[IMaglowek(g^l. Częstotliwość);
CUstawhstrumentytg),
ifCMF_blad<>COkthen exit;
rej,bx;=6:
rej.d^segtg'"
1
);
rej. ax: =ofs[g
/1
] + Nagtowektg ^). Poloz_muz;
intr'tlnt_CMF,rej);
if rej,ax<>0 chen CMF_blad:=CAktywnyUtwor end;
Zdefiniowane dalej procedury CZakonczCMF, CResetujSBFM, CPau-zaCMF. CWznowCMF,
CZwolnijPamiecCMF służą do sterowania pracą sterownika oraz do zwalniania pamięci zajmowanej przez
plik.
procedurę CZakonczCMF:
var
rej:registers:
begin
rej.bx:=7;
intr(lnt_CMF,rej];
if rej.ax<>D Chen CMF_blad:=CNieGral end;
procedurę CResetujSBFM;
var
re|:regiscers;
begin
i re|'.bx:=B;
incrElnC_CMF,rej);
if re).ax<>0 then CMF_blad:=CAktywnyUtwor elseCMF blad:=COk
end:
procedurę CPauzaCMF;
v8r
rej:registers;
begin
reJ^^S;
mtr[lnC_CMF,pej);
ifrej.ax<>OchenCMF blad:=CNieGral
71
OBSŁUGA PLIKÓW CMF
elseCMF blad^COk
end;
procedurę CWznowCMF:
var
rej^registers;
begin
rej.bx:=10;
intrtlnt_CMF.re)];
if rej.ax<>0 then CMF_blad:=CNieGrai
efseCMF_blad:=COk end:
procedurę CZwolniJPamiecCMFtg:pointer];
begin
Zwolnij_pamiectg) end;
Budowa trzech zdefiniowanych poniżej funkcji jest podobna - działanie wszystkich polega na
odnajdowaniu (na podstawie wartości przechowywanych w bloku nagłówka pliku) danych
dotyczących tytutu i kompozytora utworu oraz uwag jego dotyczących.
function CTytulCMF[g'pointer):string;
var
rob:string;
iicz:byte:
pol_t_s,pol t a:word;
begin rob:=";
^fNaglowek[g
/\
).Po!oz_tytulu>0 Chen begin
po!_t_s;=segEg^];
po!_t_o:=ofstg
/^
);
poi t_o:=pol t o+Nagiowektg^l.PolozJiytulu;
liczbo;
repeat rób: ^rob+chKMemEpol^s:?^^^^-licz]];
inctlicz)
until
chr(Mem[pol_c_s:polJ_o+licz]]=#0 end;
CTytu!CMF;=rob
end;
funccion CKompozytorCMF[g:poincer):stnng;
var
rob:string;
ROZDZIAŁ 3
licz:byte;
pol_k_s,pol_k_o:word:
begin rob:=",
if Naglowektg^). Połóż kompoz>Q Chen begin
polJ^s^segCg"];
pol_k_o:=ofs[g^);
po^kJa^pol^o+Naglowektg^J.Poloz^kompoz;
iicz;=a;
repeat rób: = rób+chr[Mem[pol^k_s:pol_k_o+licz]);
incUicz] until
chr[Mem[pol k^s:pol_k_o+licz])=^0 end;
CKompazytorCMF:^r'ob end.
function CKomentarzCMF[g:pointer):string;
var
rob:string;
licz:byte;
pol_k_s,po!_k_o:wor'd;
begin rob:=";
if Naglowektg ^ l. Po!oz_koment>0 then begin
pol_k_s;=seg(g^];
pol_k_o:
=
ofs[g
/^
);
P^KJ^P
0
^^^^
0
^^^'^
0
!
0
^
0
^
1
^' licz:=0;
repeat rób; =rob+chr[Mem[pol_k_s:pol^o^ licz]];
incdicz] until
chriMemtpol k_s:pol_k_o+licz]]=^0 end;
CKomentarzCMF^^rob end;
Funkcja COpisBIedu zwraca ciąg znakowy opisujący błąd, jaki wy stąpił. Procedura_wyjscia_CMF to procedura,
którą „podczepiamy' pod łańcuch procedur wyjścia naszego programu.
funcCion COpi5BlEdu:string;
begin caseCMF_bladof
73
OBSŁUGA PLIKÓW CMF
COk
:CopisBledu:='Ok ;
CMaloPamieci
•CopisBledu:='Blad allokacji pamięci':
CBIadZwalniania
:CopisBledu;='Btad zwalniania pamięci', CNieInstalowany
.CopisBledu:='Brak sterownika SBFM':
CBrakPIikuCMF
:CopisBledu:='Brak wskazanego pliku';
CZłyNaglowek
•CopisBledu:='Zty nagłówek pliku';
CZaDuzoInstr
:CopisBledu.='Za dużo Irscrumentów';
CAktywnyLJtwor
:CopisB!edu:='SBFM odtwarza utwór', CNieGral
:CopisBledu:='Ucwór nie jest odtwarzany';
CNieByloPauzy
•CopisBledu:='Ucwór nie byt zatrzymany' end end,
{$F-} procedurę Procedur'a^wyiscia_CMF,
begin
if CSBFMZainstalowany Chen begin
CZakonczCMF;
CResetujSBFM end;
ExiCProc:=CStar'aProcWy!scia end;
{$F-}
begin
CStaraProcWyjscia:=ExitProc;
ExitProc:=@Procedura_wyjscia_CMF;
ClnicjalizuiSBFM;
CMFStatus:=0;
ifCMF_blad=COkthen
CUsCawBajtStaCusowySBFM end,
3.4 PRZYKŁADY
Na koniec chciałbym przedstawić przykładowy program wykorzystujący przedstawioną w poprzednim
rozdziale bibliotekę. Działanie
ROZDZIAŁ 3
programu polega na odtwarzaniu wskazanego przy wywołaniu pliku CMF. Podczas odtwarzania możliwe Jest
zatrzymanie/wznowienie gry. Program, przed rozpoczęciem odtwarzania, wyświetla na ekranie odczytane z pliku: tytuł utworu,
nazwisko kompozytora i komentarze. program GrajCMF:
{$M 15000,0,50000} uses cmf.crt;
procedurę Jesli_b!ad_to_koniec;
begin
ifCMFJiladoCOk then begin
writeCBLĄD: •i;
wriceIntCOpisBIedu);
halt end end;
var Muzyka:pointer;
Pauza:boolean;
ch:char:
begin
if paramcount<1 then begin
writeInCLJżycie: GRAJCMF plik'];
writelnC plik-plik w formacie CMF'];
hatt
end;
Jesli_blad_toJ(omec;
Muzyka:=C2aladuiPiikCMF(parBmstr(1l];
Jesli_blad_CoJ(oniec, Pauza: =false;
writeln['Tytuł : ',CTyt:ulCMF[Muzyka]]:
wntelnC Kompozytor: '.CKompozytorCMFtMuzyka)):
writeInCUwagi : '.CKomenCarzCMFCMuzyka]];
writein;
writeInfOdtwarzam...'];
writeInCSPACJA- Pauza/Kontynuacja ESC - Koniec');
white keypressed do ch:=readkey;
CZagrajCMF[Muzyka);
Jesli_blad_CG_koniec;
repeat ch:=#0;
75
OBSŁUGA PUKÓW CMF
i keypressed then ch: =readkey;
ifch=#32then
case Pauza of false begin
CPauzaCMF;
Pauza: =l;rue end;
Crue: begin
CWznowCMF;
i'auza:=false
end
end;
untii (CMFStatus=01ortch=#27);
if ch=#27 Chen CZakonczCMF;
CZwolnijPamiecCMFtMuzykal
end.
Drugi przykład to program odtwarzający muzykę z pliku włączonego do jego kodu na etapie konsolidacji.
Taka metoda „udźwiękowiania" swoich programów jest, jak się wydaje, dosyć wygodna - nie musimy
troszczyć się o obsługę błędów związanych z odczytem pliku i identyfikacją jego struktury. Ponadto, pliki
zapisane w formacie CMF mają z reguły niewielką objętość - nie będzie więc zbytnią rozrzutnością (pamięć
operacyjna O połączenie ich z kodem programu. program Muzyk;
use5cmf,crt;
{SLdoodle.obj} procedurę doodle; excernal;
var ch:char;
begin
ifCMF_bladoCOkthen begin
wriceln(COpisBledu);
halt end;
CZagrajCMF[@doodle);
repeat
untii [CMFStatus=u)or*tkeypressed):
if keypressed then ch;=readkey;
CZakonczCMF
end.
ROZDZIAŁ 3
Prawdziwe pole do popisu autorom gier i programów rozrywkowych daje jednak dopiero możliwość jednoczesnego
odtwarzania muzyki z plików CMF oraz próbek dźwiękowych zapisanych w formacie VOC. Poniżej przytaczam
przykład prostego programu odtwarzającego muzykę i, po wykryciu wciśnięcia klawisza spacji, zawartość pliku
STRZAL.VOC. program Mix;
{$M 15000.0,50000} uses voc,cmf,crt;
var
muzyka:poincer, { wskazanie na początek pliku CMF }
adglas:pointer: {wskazanie na VOC }
ch:char;
procedurę CzyBlad;
begir
ifVOC_blsd<>VClkchen
begin
wr(Celn[VOpisBledu);
halt
end;
ifCMF_blad<>COkthen
begin
writeIntCOpisBIedu],
halt
end end;
procedurę Wystrzał;
begin
VOdtworzVOC(Odgtos3:
repeaC untii \/OCStatus=0 end;
begin
CzyBlad;
VinicjujSterowniktO,0]: {wczytanie CT-VOICE } CzyBlad:
VOdczytajPlikVOC[Odglos,'STRZALVOC')i CzyBlad;
Muzyka:=CZaiadujPlikCMF('BADMAN.CMF'];
CzyBtad;
wricein;
wnteInCSPACJA- Wystrzał, ESC-Koniec');
OBSŁUGA PLIKÓW CMF
rozpoczęcie odtwarzania muzyki
wnteln.
CZagrajCMFtMuzyka): { repeat cn:=#0;
if keypressedthen ch:==readkey;
ifch=#32then Wystrzał
untii [CMFSCatus=0)orCch=#27]
if ch=#27 then CZakonczCMF:
CResetujSBFM;
VZwolnijPamtec[Odglos];
CZwolnijPamiecCMFtMuzyka]
end.
79
PROGRAMOWANIE OSP
ROZDZIAŁ 3
4. PROGRAMOWANIE DSP
Rozdział poświęcony Jest zagadnieniom związanym z
programowaniem układu DSP. Mimo że dostarczane z kartą
sterowniki zawierają procedury komunikacji z kartą, bezpośrednie
programowanie układu DSP daje nam znacznie większe
możliwości. Przede wszystkim jednak, sięgając „w głąb" karty nie
jesteśmy już zmuszeni do korzystania z formatu VOC przy
odtwarzaniu plików dźwiękowych oraz np. możemy
zaprogramować własną obsługę złącza MIDI. Zresztą
programowanie DSP nie jest wcale trudne - a o funkcjonalności tej
metody oprogramowywania efektów dźwiękowych świadczyć może
fakt, że relatywnie mało gier (czyt. prawie żadna) korzysta z
firmowych sterowników.
4.1 ZASADY OBSŁUGI DSP
Z układem DSP komunikujemy się za pomocą czterech portów
wejścia/wyjścia. Adres bazowy (względem którego liczymy adresy
każdego z nich) jest ustawiany za pomocą zworek na karcie (jako
220h lub 240h dla karty Sound Blaster 2.0 i jako 210h, 220h,
230h, 240h. 250h, 260h dla kart w wersji l.x). Domyślna wartość
tego adresu to 220h.
ROZDZIAŁ 4
Jeżeli x oznaczać będzie wartość wynikającą z wyboru użytkownika (2,4 lub 1,2,3,4,5,6), to adresy 4 portów DSP
wynoszą:
• port zerowania układu (wyjściowy): 2x6h
• port odczytu danych (wejściowy): 2xAh
port zapisu komendy DSP lub danej oraz odczytu statusu wejściowego (czy możliwy jest zapis) układu:
2xCh
• port gotowości danych (wejściowy): 2xEh Dodatkowo do pełnej komunikacji z kartą we wszystkich trybach
potrzebna jest znajomość numeru linii, na której zgłaszany jest koniec transmisji DMĄ oraz wykorzystywany na nią
kanał. Numer używanej przez Sound Blaster linii ustawiamy dokonując zwarcia (rozwarcia) odpowiednich zworek
na karcie. Domyślną wartością jest 7 (przerwanie IRQ7). Standardowo karla SB wykorzystuje do transmisji kanał l
DMĄ.
W zasadzie do pracy z kartą potrzebna Jest możliwość wykonania trzech podstawowych operacji: zerowania
układu, zapisu danej (lub rozkazu), odczytu danej.
Zerowanie DSP
Zerowanie DSP należy przeprowadzić jednorazowo przed rozpoczęciem programowania karty. Proces zerowania
polega na inicjaliza-cji układu oraz wprowadzeniu go w stan oczekiwania rozkazów. Oto algorytm, według
jakiego działać powinna procedura zerująca DSP:
1. Zapis bajlu o wartości l do portu zerowania (adres 2x6h).
2. Oczekiwanie przez ok. 3 ms.
3. Zapis bajlu o wartości O do portu zerowania (adres 2x6h).
4. Powtarzane cyklicznie ok. 100 razy odczyty z portu odczytu danych (2xAh) i oczekiwanie, aż odebrany bajt
będzie miał wartość OAAh.
Jeżeli po upływie pewnego czasu (ok. 100 ms) układ DSP nie wyśle w odpowiedzi bajtu o wartości OAAh,
zerowanie uznać można za nie udane.
Zapis do DSP
Możliwość wysłania danej lub komendy do układu DSP jest niezbędna przy jego programowaniu. Do zapisu jest
używany port 2xCh. Przed próbą wpisu musimy jednak sprawdzić, czy DSP jest gotów do odebrania danych - w tym
celu badamy stan najbardziej znaczą-
81
PROGRAMOWANIE DSP
cego bitu z bajtu odczytanego z tego samego portu. Jeśli będzie on wyzerowany, możemy wysłać komendę
(daną). Procedura wpisu powinna wyglądać następująco:
l- Odczyt bajtu statusowego z portu 2xCh.
2. Jeśli najbardziej znaczący bit odczytanego bajtu jest ustawiony, powrót do poprzedniego punktu.
3. Zapis danej lub komendy do portu 2xCh.
Odczyt z DSP
Odczyt bajtu z DSP realizujemy korzystając z portu 2xAh. Bezpośrednio przed odczytem należy sprawdzić,
czy jest ustawiony najstarszy bit bajlu odczytanego z portu gotowości danych (2xEh). Algorytm, wg którego
powinna działać procedura odczytu z DSP, wygląda następująco:
1. Odczyt bajtu z portu gotowości danych (2xEh).
2. Jeśli najstarszy bil odczytanego bajtu jest wyzerowany, powrót do poprzedniego punktu.
3. Odczyt danej z portu 2xAh.
Obsługa przerwania DSP
Układ DSP generuje przerwanie sprzętowe (numer ustawiamy przy instalacji karty, domyślnie IRQ 7) przy
realizacji:
• zapisu dźwięku z przetwornika A/C w trybie DMĄ
• odczytu dźwięku z przetwornika C/A w trybie DMĄ
• odczytu danych ze złącza MIDI w trybie przerwań Podczas tworzenia procedury obsługi tego przerwania
należy pamiętać o kilku rzeczach:
• Przyjęcie przerwania należy potwierdzić (tzn. poinformować DSP, że przejęliśmy jego obsługę).
Realizujemy to odczytując jednorazowo daną jednobajtową z portu gotowości danych (2xEh). Wartość
odczytanego bajtu nie jest istotna.
• Po potwierdzeniu przerwania, w przypadku, kiedy procedura powinna odebrać daną bajtową (odczyt
MIDI w trybie przerwań), odczytujemy ją z portu 2xAh.
• Procedura obsługi przerwania powinna kończyć się wysłaniem sygnału końca (End Of Interrupt) do
układu kontrolera przerwań 8259. Realizujemy to wysyłając bajt o wartości 20h do portu 20h.
ROZDZIAŁ 4
4.2 TRYB BEZPOŚREDNI
Wymiana danych z układem DSP może odbywać się w dwóch trybach: bezpośrednim i DMĄ. Programowanie
odtwarzania (zapisu) dźwięku w trybie bezpośrednim jest bardzo proste, ale nie pozbawione wad. Na czym
polega? Otóż w trybie bezpośrednim o odbiór i zapis wszystkich danych z i do układu DSP troszczyć się musi
nasz program. Oznacza to, że w obu przypadkach jesteśmy zmuszeni do ciągłego, cyklicznie i w równym tempie
wykonywanego wysyłania lub odbioru danych. Dobrym rozwiązaniem (jeśli chodzi o zachowanie równej na
różnych komputerach prędkości) jest zaprzęgnięcie do pracy obsługi przerwania zegarowego. Jakkolwiek byśmy
jednak nie postąpili, w trybie bezpośrednim ciągła komunikacja z kartą Sound Blaster oznaczać może
spowolnienie działania programu. Poza tym w trybie bezpośrednim nie jest możliwe odtwarzanie danych
skompresowanych.
Do komunikacji z DSP najlepiej przygotować sobie zestaw najbardziej podstawowych procedur. Poniżej
przedstawiam tekst biblioteki przygotowanej dla kompilatorów Turbo Pascal. Zawarte w niej funkcje/procedury
umożliwiają zerowanie DSP, wysłanie i odczyt danej z DSP, włączenie i wyłączenie układu DAĆ oraz odczyt i
zapis bajlu do konwertera DAĆ. Deklarowane w bibliotece zmienne globalne są modyfikowane w części
wykonawczej modułu. W części wykonawczej Czytelnik może też zauważyć pętlę Repeat-UntiI. Ta część kodu
biblioteki będzie odpowiedzialna za wykrycie obecności karty dźwiękowej i odpowienią modyfikację wartości
zmiennej BaseAddr. Wykrycie Sound Blasler'a jest tu realizowane przez powtarzaną, za każdym razem dla
innego adresu bazowego, próbę zerowania układu DSP. Dla adresu prawidłowego próba powinna się powieść i
można przyjąć obecność karty. W przypadku, jeśli badany adres przekroczy 260h uznajemy, że karta nie jest
zainstalowana w systemie i zmiennej SBInstalled nadajemy wartość False.
unit DSPDir;
{ biblioteka procedur/funkcji bezpośredniego dostępu } { do uktadu DSP kart SB -tryb Direct}
interface
vsr
BaseAddrword; { adres portu bazowego } ResetPort,ReadDataPort,WriteDataPort,
WriceStatusPorC.DataAYailPorfword;
PROGRAMOWANIE DSP
SBInsCalled:bodean, {czySB ;esc zainstalowany}
funccion aSPReset:boolean;
funccion DSPRead:byte;
procedurę DSPWnte[n:byte);
funccion ADCByte:byte;
procedurę DACByte(n:byte);
procedurę TumDACOn;
procedurę TumDACOff;
implementation {część implementacyjna}
{resec układu DSP} { odczyt ba|Cu z DSP } {zapis danej/rozkazu} {odczyt bajtu z ADC} { zapis do DAĆ } {włącznie DAĆ} {wyłączenie DAĆ}
funccion DSPReset:boole3n;
van:byte;
begin
{uwaga ; w procedura nie korzysta ze zmiennych } {opisujących adresy poszczególnych portów DSP,} { ponieważ nie mają one jeszcze
ustalonej wartości} porttBaseAddr+$5l:=1;
for i: =3 downco O do; { opóźnienie} porttBaseAddr+$61:=0;
repeat incCi] until(port[BaseAddr+$E]and12B = 12B3ar(i"100);
ifi=1DOthenDSPReset:=false
else DSPReset:=[portEBaseAddr+$A3=$AA) {funkcja zwraca wartość TRUE gdy zerowanie OSP} {przebiegło pomyślnie} end;
function DSPRead:byte;
begin
repeat
untii tport[DataAvailPort] and 128 = 128);
DSPRead: =port[ReadDataPort] end;
procedurę DSPWritetn;byte];
begin
repeat
untii (popttWriteStatusPort] and 128 = 03;
port[WriteDataPort]:=n end;
function ADCByte:byte;
begin
repeat
ROZDZIAŁ 4
PROGRAMOWANIE DSP
85
uncil [port[Wrn:eScatusPort] snd 128 = 0);
port[WnteDataPort]:=$20:
repeac:
unt-i! [port[DataAvailPort] and 128 = 128];
ADCByte: ^portIReadDataPortl
end,
procedurę DACByte[n:byte);
begin
repeat;
uncil tporttWnteStatusPort] and 128 = 0];
port[WriteDataPcrt]:=$10,
repeat
untii [pordWnteStatusPcrt] ard 128 = 0];
port[WnteDataPort];=n end;
procedurę TurnDACOn;
begin
repeat untii [porcEWnteSCatJsPort] and 128 = 03:
porctWriteDataPortl: =$01 end;
procedurę TurnDACOff;
begin
repeat
uncil (porttWriteStatusPortl and 126 = O],
port[Writ;eDataPortl;=$D3 end,
begin
{wpierw odszukamy SB próbując zerować DSP przez }
{porty 2x0h}
BaseAddr:=$20D;
repeaC
inc(BaseAddr,$103;
untii [Ba5eAdd^=$2B01o^EQSPI
:
leset:]:
if BaseAddr=$280 then SBInstalled: =false elseSBInstalled:=true;
{teraz następuje nadanie odpowiednich wartości}
{ kolejnym zmiennym }
ResetPort:=BaseAddr+$6;
ReadDataPort:=BaseAddr+$A;
WriteDataPort;=BaseAddr+$C;
WriteStatusPor't:=BaseAddr+$C;
DacaAvailPort:=BaseAddr+$E end, {koniec}
Wykorzystanie biblioteki jest bardzo proste. Poniżej przedstawiam przykładowy program pozwalający zorientować
się w zasadach używania zawartych w niej funkcji. Program jest bardzo prosty, ale ilustruje metodę uzyskiwania
obrazów fali podawanej na wejście mikrofonowe. Działanie programu jest zbliżone do działania oscyloskopu - na
ekranie obserwujemy przebieg fali w pewnym stałym okresie. Rysunek jest cyklicznie uaktualniany z szybkością
wynikającą z możliwości komputera i szybkości układu DSP (w chwili, gdy prędkość wykonywania poszczególnych
operacji jest odpowiedni wysoka, „wąskim gardłem" staje się tempo odczytu z DSP). Program działa w trybie
graficznym 13h kart VGA (320x200, bajt na punkt). program Oscyloskop;
uses DSPDir.crt:
const
var
ScreenBase;word=$AOOO;
x:word;
ch:char;
procedurę Set320x200Mode;
{ ustaw tryb ekranowy VGA 13h } assembler;
asm
end;
movax,$0013 int$10
procedurę DrawLine[x:word;n:byte);
{ narysowanie „słupka" ilustrującego chwilowy poziom } { sygnału podawanego z wejścia mikrofonowego } var y:byte;
begin
y:=100+t(n-127) div2]; { obliczmy współrzędna }
MemtScr-eenBase^D^y+Kl: =10 end,
procedurę Clear;
{wyczyszczenie roboczej części ekranu}
begin
FillChartMem[ScreenBase:11200],41600,03 end;
ROZDZIAŁ 4
begn
Direct:Video:=false,
{ znaki stawiamy korzystając z usfug systemowych }
ifnotSBInstałled then
begin
wnteInCBrak karty Sound Blaster');
haft end, TurnDACOff;
{wyłączenie DAĆ} Sec320x200Mode;
CexCcolorCLight:Red);
write['OSCYLOSKOP']:
gotoxy(1,24];
wriCeCEsc-koniec'];
x:-0;
repeat ifx<319then incbdelse
begin
clear:
x:=0
end;
DrawLine[x,ADCByte);
untii keypressed;
{ powtarzaj, dopóki ktoś nie wciśnie klawisza } if keypressed Chen ch:=readkey;
textmode(lsst:mode)
end.
Wspomniałem, że w celu zapewnienia równomiernej w czasie prędkości przesyłania danych, wykorzystać możemy
przerwanie zegarowe. Otóż w komputerach PC znajduje się układ 8253 lub 8254 o trzech kanałach wyjściowych:
• Kanał O - używany do zliczania czasu. Podczas startu komputera procedury zawarte w BIOS
programują układ zegarowy, tak by wysyłał tym kanałem sygnał 18.2 razy w ciągu każdej sekundy.
• Kanał l - używany przy odświeżaniu RAM,
• Kanał 2 - używany przy kontroli głośniczka komputera. Dla nas najistotniejszy jest kanał O, gdyż jest
on bezpośrednio sprzężony z wejściem kontrolera przerwań, który, każdorazowo po pojawieniu się
sygnału, wywołuje przerwanie 8h. Okazuje się. że częstotliwość, z jaką 8253(4) powoduje przerwanie,
można zmienić. Wystarczy bowiem zmodyfikować wartość 16-bitowego dzielnika czę-
87
PROGRAMOWANfE OSP
stotliwości układu dla kanału 0. Wartość, którą standardowo inicja-lizowany jest dzielnik, wynosi FFFFh.
Dlatego częstotliwość wyjściowa wynosi początkowo ok. 18 Hz (częst. wejściowa równa 1.19318 MHz
podzielona przez 65535 daje 18.207 Hz).
Do zaprogramowania generatora związanego z kanałem O potrzebne jest jeszcze kilka informacji. Myślę, że
najprościej będzie, gdy przedstawię schemat, wg jakiego powinna działać procedura zmieniająca procedurę
obsługi przerwania 8h i zmieniająca częstotliwość generatora 0:
1. Zapamiętujemy wektor przerwania 8h.
2. Zabraniamy wykonywania przerwania IRQO (ustawiamy bit O w bajcie odczytanym z portu 21h i tak
zmienioną wartość wysyłamy z powrotem przez port 21h do kontrolera przerwań).
3. Zmieniamy wektor 8h tak, by wskazywał na naszą procedurę.
4. Do portu o adresie 43h (rejestr sterujący) wysyłamy rozkaz o kodzie 36h. Dla pełnej jasności podam
znaczenie poszczególnych bitów rozkazu:
bity 7-6 - wybór kanału (dla kanału O oba bity wyzerowane) bity 5-4 - rodzaj operacji, jaką ma
wykonać układ (zapis lub odczyt obydwu bajtów dzielnika - oba bity ustawione)
bily 3-1 - tryb pracy (tu trzeci: bity Oli) bit O - sposób odliczania (dla zliczania w kodzie binarnym
od FFFFh do O bit powinien być wyzerowany).
5. Do portu 40h wysyłamy kolejno wpierw młodszy, później starszy bajt licznika. Wartość licznika wyliczyć
możemy korzystając z zależności:
L == 1193180 l częstotliwość
6. Zezwalamy na wykonywanie przerwania IRQO (zerujemy bit O bajtu odczytanego z portu 21h i tak
zmienioną wysyłamy z powrotem do kontrolera przerwań). Dla pełnej jasności przytoczę tekst źródłowy
programu odtwarzającego wskazany parametrem plik dźwiękowy wykorzystując przerwanie 8h. Program
jest bardzo prosty - nie rozpoznaje formatu odczytywanego pliku, a częstotliwość odtwarzania przyjęta
została jako 8000 Hz. Rozmiar pliku, którego zawartość ma być odtworzona, ograniczona jest wielkością
dostępnej pamięci operacyjnej.
program PlayBIN,
{SM 15000.0,50000}
uses DSPDindos.crt;
var
Spec:string, { specyfikacja pliku z danymi} F-file;
Segment,SegBuf,afsBuf,Blocks,Res:word:
Counc,Len:longint;
{licznik i zmienna przechowująca długość pliku } Old6h:painter;
{ wskazanie na dawna procedurę obsługi przerwania } ch:char;
{$F+}
procedurę SendDneByte; {wysyła bajt do DAĆ }
interrupt;
begin
ifCounC<=Lenthen
{jeśli jeszcze nie cały plik } begin ifOfsBuf=$10then begin IncCSegBuf);
OfsBuf:=0 end:
DACByte(MemESegBuf:OfsBuf]);
incECount);
incEOfsBuf) end;
port[$20]:=$20{EO!} end;
{$F-}
procedurę AllacateMem[parag:word);
{aibkacja zadanej parametrem liczby paragrafów}
assembler,
as m
movbx,parag
movah,$48
int$21
cmp bx,parag
je @koniec
xorax,ax @koniec: movSegBuf,ax
movOfsBuf,Q
ROZDZIAŁ 4
PROGRAMOWANIE OSP
end:
procedurę FreeBuf;
{ zwolnienie pamięci przydzielonej plikowi} assembler:
as m
movah,$49
mov es,Segment:
int21h end;
procedurę SecIntrRoutme:
{ zaprogramowanie Timer'a i ustawienie wektora 8h } begin
getinCvec[$a,01d6h3;
porHSSIh-port^l ] or $01;
setintvect$8,@SendOneByte),
port[$431i=$36;
porc[$40];=lot1193180divBOOO);
porc[$4ai:-hi[11931BOdivB0003;
port;l$21]:=port;[$21]and$FE end;
procedurę ScopPlaying;
{ przeprogramowanie Timer'a i przywrócenie } { pierwotnej wartości wektorowi
przerwania } begin
port[$21]:=port[$21] or $01;
portt$43]:=$36;
port^O^O;
port[$40];=0;
setintvect$6,QldBh);
por'c[$21l:=portt$21] and $FE end;
begin
ifnotSBInstaIlsdthen
begin
writeln['Sound Blaster nie zainstalowany!'];
halt end;
if paramcount^D then begin
writefPlik, który mann odtworzyć : '];
readIntSpec];
ifSpec="then halt end slse
Spec:=paramstr[1];
ROZDZIAŁ 4
355 ignIF; Spęd;
{$!-}
resettF),
{$!+}
iflOResultodthen
begin
writeirCBrak wskazanego pliku !'];
hale
end;
reset[F,1];
Len:=filesize[R;
AtlocateMemCtLen+15] shr4);
ifSegBuf=Ochen
begin
wriCeInCBtad allokacji pamięci!');
halt
end;
Segment::=SegBuf;
Blocks:=0;
repeat eiockReadEF,Mem[SegBuf+BlockEMD96;OfsBuf],$FFFF.Res];
inc(B!ocks3 untii Fles=0;
close(F);
TurnDacOn;
SeCinCrRoutine;
Count:=0;
writeInCOdtwarzam (częstotliwość 8 kHz)...');
repeat
untii [Count=Len]or(keypressed);
ifkeypressedthen ch:=readkey:
StopPlaying;
FreeBuf
end,
Na koniec przedstawię jeszcze jeden program. Jego zadanie to odtwarzanie zapisanego wcześniej dźwięku w
ustalanym przez użytkownika tempie. Program jest bardzo prosty - szybkość jego działania zależy od prędkości
komputera, na jakim go uruchomimy. Przy szybkiej maszynie może się więc okazać, że zakres zmian opóźnienia
przy odtwarzaniu jest zbyt mały. Komunikacja z kartą odbywa się w trybie bezpośrednim (w programie korzystam z
przedstawionej wcześniej biblioteki). Zasady zabawy są następujące: klawisze kursora - zmiana prędkości
odtwarzania dźwięku, klawisz ESC -zakończenie pracy. Zapisu dźwięku dokonujemy przy wciśniętym klawiszu
Shifl (w momencie zwolnienia klawisza program rozpocz-
91
PROGRAMOWANIE DSP
nie wysyłanie kolejnych bajtów próbki do przetwornika cyfrowo-analogowego). Program nie jest
bardzo użyteczny, ale jego samodzielna analiza z pewnością pomoże w zrozumieniu zasad
programowania operacji zapisu (odtwarzania) dźwięku w trybie bezpośrednim DSP.
{$tvn5oaG,o,5aoou}
program Zabawa;
uses
var
Councer,SegBuf,OfsBuf:Word;
i,Mernory:Longint;
j,Loop:Byte;
ch:char;
procedurę Allocat;eMem[parag:ward);
{ allokacja zadanej parmetrem liczby paragrafów } assembler;
as m
mov bx,parag
movah,$46
int$21
cmp bx,panag
je (©koniec
xor ax,ax <§>koniec: mov SegButax
mov OfsBuf.O end;
procedurę FreeBuf;
{ zwolnienie przydzielonej pamięci} assembler:
as m
movah,$49
moves,SegBuf
int21h
end;
funcCion ShifcPressed:Boolean;
{ wciśnięty klawisz Shift} begin
ShiftPressed:=[Mem[0;$417] and 3] o O end;
ROZDZIAŁ 4
begin
{ reset DSP - przy okazji sprawdzimy obecność SB } ifnotdspreset then
begin
wncetnCSB nie zainstalowany');
hale {kamee gdy błąd resetu }
end:
Memory:=600DG; { wielkość bufora na zapis } AllocateMemtMemory shr 4 + 1); {rezerwujemy pamięć } ifSegBuf=Ot;hen
begin
wntelnIZbyt mało pamięci operacyjnej'];
hale { błąd allokacji} end;
DirectVideo:=True;
cirscr:
Loop;=125; {zawożona wartość opóźnienia} gDtoxyt40,3);
write^27,^26,' - Szybkość odtwarzania ; '];
gotoxy[5,33;
write[");
gotaxyt6-[Loopdiv10),3];
writeE#2193;
gotaxy[70,3];
wntetLoop];
gotoxy[5,5];
writeCShift - zapis dźwięku ');
gotoxy(5,S];
writeCEsc -koniec zabawy');
repeac ifShiftPressedchen
begin
TurnDacOff; {wyłączenie DAĆ}
Counter:=0; {wskaźnik = O }
got;oxy[1,253;
TextAt;cr:=112;
wriCefZAPIS']:
repeac
Mem[SegBuf:Ofs3uf+CounCer]:=ADCByte;
{ pobranie bajtu z przetwornika } inctCounter] {inkrementacja wskaźnika }
untii ECounter'=Memory]or[not[ShiftPressed]);
gotoxy[1,253;
TextAttr:=7;
write['ODTWARZAM'];
i:=0.
TumDACOn;
repeat
93
PROGRAMOWANIE DSP
forj:=0 to Loopdo, { opóźniamy)
DACByte[Mem[SegBuf:OfsBuf+i]]; { wysłanie do DAĆ incU)
until l>Counter,
got;oxy[1,25];
wntet' ')
end:
ch:=#255;
if keypressed Chen ch' =readkey;
ifch=#0then ch:=readkey;
if [ch= #75)and(Loop>5] Chen dec[Loop,5];
if[ch=#77)and[Loop<245)chen inc[Loap,5):
if(cho#255]then
begin
gotoxy[5,33;
writet");
gotoxy[6+[Loopdiv 10),3);
write(#219];
gocoxy[70,3);
write(Loop:3]
end;
unt:ilch=#27;
TurnDacOff; { wyłącz DAĆ } FreeBuf {zwolnij pamięć przydzielona na bufor) end.
4.3 Tryb DMĄ
Odtwarzanie i zapis próbek dźwiękowych w trybie bezpośredniej komunikacji z układem DSP z wielu
względów jest niepraktyczne. Po pierwsze, transmisja danych w trybie bezpośrednim w znacznym stopniu
absorbuje procesor. Po drugie, bardzo trudno jest zapewnić równomierną prędkość przesyłania danych.
Dlatego najlepszą drogą jest korzystanie z możliwości transmisji w trybie DMĄ - nie zabiera ona czasu
procesorowi i nie ma problemów z kontrolą jej prędkości (zajmuje się tym układ DSP). Poza tym, w trybie
DMĄ możliwy jest zapis i odtwarzanie skompresowanych przez DSP według trzech dostępnych schematów:
4-bitowego (kompresja 2:1), 2.6-bitowego (kompresja 3:1) i 2-bitowego (4:1). W trybie bezpośrednim jest to
niemożliwe.
O żądanej szybkości transmisji informujemy układ DSP, ustawiając odpowiednią wartość
jednobajtowego parametru TIME_CONSTANT
ROZDZIAŁ 4
za pomocą rozkazu 40h (patrz opis komend DSP). Reguła, według której ustalamy wartość zmiennej, jest
następująca:
TIME_CO^'STAN7'=256-1'OOOOOO/'częstotliwość próbkowania
Drugim parametrem jest długość przesyłanego bloku danych, opisywana przez wartość dwubajtowego parametru
DATA_LENGTH. Jego wartość ustawiamy używając komendy ł4h. Należy pamiętać, że wartość DATA_LENGTH
powinna być mniejsza od ilości bajtów przeznaczonych do przesłania o l. Oznacza to więc, że dla przesyłu l bajta
wartość parametru powinna być równa 0. Ponadto istotny jest fakt, że jako pierwszy, po kodzie rozkazu ł4h,
powinien być wysłany do DSP młodszy bajt danej. Maksymalna długość bloku przeznaczonego do przesłania
wynosi 64 KB (dla DATA_LENGTH = FFFFh). Wynika to z charakterystyki kontrolera DMĄ, dla którego
ograniczeniem jest rozmiar fizycznej strony pamięci (64 KB). Nie oznacza to bynajmniej braku możliwości
transmisji większej ilości danych - blok bajtów składających się na próbkę dźwiękową należy podzielić na kilka
mniejszych, l tak próbkę rozpoczynającą się od adresu 7FOO-.0000 i kończoną bajtem znajdującym się pod
adresem 7FOO:2FFF podzielić musimy na dwa bloki: pierwszy - rozpoczynający się od adresu 7000:FOOO. drugi -
od adresu 8000:0000. Najlepiej będzie, jeżeli „stronicowanie" pamięci przedstawię w formie tabelki:
Strona Segment:0ffset
O 0000:0000-0000:FFFF
1 1000:0000-1000:FFFF
2 2000:0000-2000:FFFF
3 3000:0000-3000:FFFF
F FOOO:0000-FOOO:FFFF
Podczas programowania transmisji w trybie DMĄ nie wystarczy samo programowanie karty SB - na rozpoczęcie
transmisji należy też przygotować układ DMĄC. Co ważniejsze, układ DMĄC musi być zaprogramowany, jeszcze
zanim przystąpimy do programowania DSP karty Sound Blaster. Parametry, jakich wymaga DMĄC, są
następujące:
l. Numer strony - numer fizycznej strony pamięci, w której znajdują się dane do przesłania.
PHOGRAMOWANfE DSP
95
2. Adres bazowy - 2-bajtowa wartość określająca przesunięcie (offset) wewnątrzstronicowe początku danych
przeznaczonych do transferu. Numer strony i adres bazowy w sposób jednoznaczny opisują położenie
komórki pamięci w obszarze l MB. Składają się na 20-bitowy adres, którego wartość wyliczyć możemy
następująco:
ADR20 = I6*SEGMENT + OFFSET
Numer strony to wielkość 4-bitowa stanowiona przez najstarsze 4 bity 20-bilowego adresu, a adres
bazowy to młodsze 16 bitów adresu 20-bitowego.
3. Licznik - 2-bajtowa wielkość odpowiadająca parametrowi DA-TA_LENGTH (długość bloku danych w
bajtach pomniejszona o l).
4. Tryb transmisji - bajt określający kierunek przepływu danych (zapis danych do pamięci bądź ich pobranie).
I tak wartość 45H odpowiada zapisowi dźwięku (zapis do pamięci), a wartość 49H odtworzeniu (odczyt z
pamięci).
Samo programowanie układu DMĄC nie jest bardzo skomplikowane, ale na potrzeby tej książki ograniczę się
do opisu algorytmu. który możemy wykorzystać przy ustawianiu transmisji. Zakładam, że karta SB jest tak
skonfigurowana, że wykorzystuje pierwszy kanał DMĄ.
1. Zapis bajtu o wartości 5 do portu OAH. Informujemy w ten sposób sterownik DMĄC, że będziemy
programować kanał l.
2. Zapis bajtu o wartości O do portu OCH.
3. Zapis bajtu o wartości odpowiedniej dla trybu transmisji do portu OBH. Zapis wartości 49H spowoduje
więc ustawienie trybu odczytu z pamięci (odtworzenie dźwięku).
4. Zapis młodszego bajtu adresu bazowego (patrz wyżej) do portu 02H.
5. Zapis starszego bajtu adresu bazowego do portu 02H.
6. Zapis numeru strony do portu 83H.
7. Zapis do portu 03H młodszego bajtu licznika.
8. Zapis do portu 03H starszego bajtu licznika.
9. Zapis do portu OAH bajtu o wartości l (odblokowanie kanału l). Poniżej przedstawiam tekst źródłowy
przykładowego programu, w którym wykorzystana jest transmisja w trybie DMĄ. Program odtwarza próbkę
dźwiękową skonsolidowaną z kodem programu.
ROZDZIAŁ 4
ppogramDMABeep;
uses dos,dspdir,crt:
consc Czestotitwosc:word=130GD;
Dlugosc-word=4372;
var
Adres;loriginC; {tu przechowamy adres 20-bitowy} Przesuniecie:word; { przesunięcie wewnatrzstronicowe } Strona:byte; { numer scrony}
Old!RQHandler':pointer; { stary wektor przerwania 1RQ7 } Zakonczone:boo!ean; { czy transmisja zakończana }
{$!_ beepl.obj} { plik z danymi dźwiękowymi} procedurę Dbeep; external,
procedurę ProcIRO; interrupt:{ nasza procedura obsługi} begin { przerwania zgłaszanego na IRQ7 } Zakonczone:=true;
port[$20]:=$20 {EDI} end;
begin
if not SBInstalledthen { czy wykryto kartę } begin writeInCBrak karty Sound Blaster'!
1
];
haft end;
getintvec[15,OldlRQHandler): { zapamiętujemy stary wektor} setintvec[15,@ProclRQl; { „naginamy"}
Zakonczone:=false;
TurnDACOn; {włączenie głośnika }
port[S213:=port[$21]andnott1 shl7):
{ odblokowanie linii IR07 }
port[$OA]:=5; { ustawienie maski dla kanału DMĄ 1 } port[$OC]:=0;
port[$OB]:=$49; {transmisja 2 pamięci do karty}
Adres^lS^longint^egtDbeep^+ofstDbeep);
Strona: =byteCAdres div 65535);
97
PROGRAMOWANIE OSP
Przesuniecie.=word[Adnesand$FFFFl:
port[$02] =Przesuniecie and $FF: { LSB przesunięcia } po"t[$02]=Pr2esuniecieshr8, { MSB pr-zesunięcia }
pQ'-t[$B3]:=3trana:
portt$D31:= Długość and $FF; { młodszy bajt długości} port[$03]:=DlLjgosc shr6. { starszy bajt długości} port[$OA]: = 1;
{ aktywacja kanału DMĄ 1 }
{teraz podamy stała odpow- częstotliwości odtwarzania
1
DSPWnte[$40);
DSPWrite[256-1000000 div Częstotliwość],
{ poinformujemy o długości próbki i jazda i} DSPWntet$483:
DSPWriteLDIugosc and $FF];
DSPWrite[Dlugoscshr8);
OSPWrite[$14);
DSPWrite[Dlugosc and $FF3;
DSPWritetDlugoscshrB);
wntein;
whte['B');
repeat
write['e'];
delay[4Q]
unti) Zakończone; { oczekuj na koniec } wnteln['p!');
TurnDacOff; { wyłączenie DAĆ } SetlntVec[15,01dlRQHandler]; {stary wektor} port[$21]-port[$21]or(1 shl7)
end.
4.4 OBSŁUGA ZŁĄCZA MIDI
Karty serii Sound Blaster mają możliwość współpracy z instrumentami wyposażonymi w złącze typu MIDI
(Musical Instrument Digital Interface). Niestety - nie bezpośrednio - do karty dokupić należy tzw. SB MIDI
KIT (podłączamy go do złącza joystick'a). Standard MIDI określa sposób transmisji: szeregowo,
asynchronicznie, z prędkością 31250 bitów na sekundę przy ośmiobitowym słowie i bez kontroli parzystości.
ROZDZIAŁ 4
Komunikację ze złączem M1DI nadzoruje układ DSP. Realizować ją możemy korzystając z rozkazów 3xh.
Zasadniczo istnieją dwa tryby komunikacji z M1DI: tryb bezpośredni i tryb przerwań. Operacji wysiania danej
przez złącze M1DI dokonać można tylko w trybie bezpośrednim.
Tryb bezpośredni
W trybie tym komunikujemy się ze złączem obustronnie wykorzystując rozkazy układu DSP. Poniżej
przedstawiam tekst procedury MłDIWrite(what:byte), realizującej wysłanie zadanej parametrem jed-nobajtowej
danej złączem MłDI oraz funkcji MłDłRead:byte realizującej odczyt w trybie bezpośrednim danej jednobajtowej ze
złącza M1DI. Globalna zmienna MIDIReadErr typu Boołean przyjmuje po wywołaniu funkcji MlDIRead wartość
False w przypadku, gdy karta przyjęła daną oraz True w przypadku wystąpienia błędu (zbyt długi czas oczekiwania
na nadejście danej). Jeżeli chcemy włączyć którąś z procedur do programu, zadeklarować w nim musimy użycie
biblioteki DSPDir.
var
MIDIReadErr: Boołean:
procedurę MIDIWriteCwhafbyte];
begin
DSPWrite($38); { kod rozkazu zapisu do M1DI}
DSPWriteCwhat) { wystanie bajtu }
end;
funccion M!DIResd:byte;
var
Tinie:byte; {licznik pętli} begin
Time:=0;
DSPWrite[$30); { odczyt z MIDt w trybie Direct} repeat
incCTime) {zwiększ licznik} untii
tport[DataAvailPort] and 128 = 12B]ar(Time=100);
ifTime=100then
MIDIReadErr^True { upłynął czas na odpowiedź } else
begin
M!DIRead:=port[ReadDataPortl; { odczyt} MIOlReadErr=False {wszystko Ok} end end,
99
PROGRAMOWANIE DSP
Tryb przerwań
W trybie przerwań możliwy jest tylko odczyt nadchodzących na złącze MłDI sygnałów. W trybie tym nie
musimy cyklicznie „odpytywać" portu M1DI - układ DSP sam „zawiadomi nas" o nadejściu danych. Schemat
postępowania jest tutaj następujący:
1. „Nagiąć" wektor przerwania obsługującego transmisję w trybie DMĄ z kartą tak. by wskazywał naszą
procedurę.
2. Odblokować odpowiednią linię 1RQ zerując właściwy bit rejestru maskującego pisząc do portu 21 h.
3. Wysłać kod rozkazu 31 h do układu DSP, aby zainicjować odczyt ze złącza M1DI w trybie przerwań.
4. Realizować inne zadania. W razie pojawienia się danej na złączu MIDł na odpowiedniej linii IRQ pojawi
się sygnał i wywołana zostanie zainstalowana przez nas procedura. Jej działanie ograniczać się powinno
do potwierdzenia przyjęcia przerwania oraz odczytu danej z portu odczytu danych układu DSP.
5. Zatrzymać operację odczytu z MłDI możemy wysyłając ponownie do układu DSP kod rozkazu 31 h.
6. Zablokować odpowiednią linię IRQ (z kontrolerem przerwań 8259 komunikujemy się tu przez port 21 h).
7. Odtworzyć oryginalną (pierwotną) wartość wektora odpowiedniego przerwania.
4.5 KOMENDY DSP
W rozdziale tym przedstawię zestawienie komend DSP. Każda z nich jest związana z jednobajtowym kodem,
który musimy wysłać (patrz procedura zapisu) do układu DSP.
Rozkaz lxh
Komendy lxh dotyczą 8-bitowej konwersji cyfrowo-analogowej w trybach bezpośrednim i DMĄ oraz
konwersji 2-bitowej ADPCM w trybie DMĄ. Uwagę należy zwrócić na fakt, że podczas zainicjowanej
rozkazami lxh transmisji DMĄ możemy wysyłać dane do portu MłDI OUT.
lOh - Wysłanie tego rozkazu do DSP umożliwia bezpośrednie wysłanie do przetwornika cyfrowo-
analogowego pojedynczego bajtu.
ROZDZIAŁ 4
14h - Inicjacja transmisji danych 8-bitowych do przetwornika cyfro-wo-analogowego w trybie DMĄ. Jeżeli chcemy
wykorzystać len nasz rozkaz, fragment naszego programu odpowiedzialny za odtwarzanie dźwięku działać
powinien według poniższego schematu:
• umieścić dane przeznaczone do transmisji w pamięci operacyjnej,
zaprogramować układ 8237 (przygotować kontroler DMĄ do transmisji),
• ustalić stałą czasową TIME_CONSTANT dla transmisji z użyciem rozkazu 40h (odpowiednio dla
częstotliwości, z Jaką odtwarzany sygnał był próbkowany),
• wysłać do układu DSP rozkaz 14h,
wysłać do układu DSP wielkość szesnastobitową (DATA-JLENGTH) opisującą długość przeznaczonego do
transmisji bloku danych pomniejszoną o jeden. Należy zwrócić uwagę, aby Jako pierwszy wysłany został mniej
znaczący (młodszy) bajt wartości.
Uwaga: Transmisja zostanie rozpoczęta bezpośrednio po ostatniej z wymienionych czynności. Należy pamiętać o
podzieleniu bloków danych leżących na granicy 64 KB stron pamięci na mniejsze. Wysłanie każdego następnego z
nich inicjować może procedura obsługi przerwania końca transmisji DMĄ.
16h/17h - Inicjacja transmisji w trybie DMĄ danych i ich konwersji w trybie 2-bitowym ADPCM. Schemat
działania procedury wykorzystującej ten rozkaz jest następujący:
• umieścić dane przeznaczone do transmisji w pamięci operacyjnej,
• odpowiednio zaprogramować układ kontrolera DMĄ,
• ustalić stałą czasową (TIME_CONSTANT) odpowiednio do częstotliwości, z jaką sygnał był próbkowany,
wystać do układu DSP rozkaz 16h lub 17h (17h dotyczy transmisji danych do DAĆ z tzw. bajtem odniesienia),
• wysłać do DSP 2 bajty opisujące długość bloku przeznaczonego do transmisji (jako pierwszy wysyłamy młodszy
bajt). Jak widać, algorytm działania jest tu taki sam jak przy rozkazie 14h. Sposób, w jaki przygotować musimy
dane do transmisji, jest obłożony ograniczeniami wynikającymi z samej metody.
101
PROGRAMOWANIE DSP
Rozkaz 2xh
Komendy 2xh dotyczą transmisji z przetwornika analogowo-cyfro-wego danych 8-bitowych w trybach DMĄ i
bezpośrednim.
20h - Bezpośredni odczyt jednego bajtu z przetwornika. Po wysłaniu wartości 20h do układu DSP możemy
odczytać z niego pojedynczy bajt odpowiadający chwilowej wartości podanego na wejście mikrofonowe
sygnału. Schemat działania procedury odczytu ciągu bajtów z przetwornika wygląda następująco:
• wysłanie komendy 20h do układu DSP
• odczyt pojedynczego bajtu z DSP
• oczekiwanie (wtedy, gdy chcemy np. zapisywać próbki co określony czas) i powtórzenie pierwszych
dwóch operacji lub zakończenie odczytu danych.
24h - Inicjacja transmisji z przetwornika ADC w trybie DMĄ. Algorytm:
• wysłać kod komendy(24h) do układu DSP
• wysłać 2 bajty (pierwszy wysyłamy młodszy bajt !) opisujące
długość bloku danych, jaki chcemy przyjąć. Zasady, jakich powinniśmy przestrzegać przygotowując
samą transmisję wynikają z reguł programowania i działania DMĄC.
Rozkaz 3xh
Komendy umożliwiają komunikację z portami MIDI.
30h - odczyt z portu MIDI (tryb odpytywania). Po wysłaniu kodu tej komendy do układu DSP możemy
odczytać daną podaną na wejście MIDI z portu odczytu danych DSP (2xAh). Oczywiście pamiętać należy o
uprzednim testowaniu stanu bitu 7 (czy jest ustawiony na l) portu statusowego (2xEh). 31 h - odczyt z portu
MIDI w trybie przerwań. Odczyt danych z portu MIDI z wykorzystaniem przerwań jest bardziej wskazany.
Zasada jest tutaj prosta: układ DSP generuje sygnał przerwania na linii IRQ. Procedura obsługi przerwania,
instalowana przez nasz program, odczytywać powinna daną z portu MIDI. Odczyt wartości z portu
statusowego (2xEh) regeneruje sterownik przerwań. Powtórne wysłanie rozkazu 31h zatrzymuje cały proces.
38h - Zapis do portu MIDI. Jako pierwszy wysyłamy do układu DSP kod rozkazu 38h, a zaraz potem bajt,
który chcemy wysłać przez port MIDI.
ROZDZIAŁ 4
Rozkaz 40h
Rozkaz 40h służy do ustawiania stałej czasowej (TIME^CONSTANT) determinującej częstotliwość próbkowania
przy transmisji DMĄ. Jed-nobajtową wartość stałej czasowej wysyłamy do układu DSP zaraz po przestaniu kodu
rozkazu. Poniżej przedstawiam zależność, z której korzystamy przy obliczaniu wymaganej dla danej częstotliwości
wielkości TIME_CONSTANT;
TIME_CONSTANT=256-H)00000/częstotliu}ość
Dla przykładu dla częstotliwości 8 kHz wartość stałej czasowej powinna wynosić 131 (256-1000000/8000). Z
przedstawionej zależności wynika jednoznacznie minimalna częstotliwość próbkowania możliwa przy
transmisji DMĄ, równa około 3.9 kHz (gdy TiME_CON-STANT=0).
Rozkaz 7xh
Komendy 7xh umożliwiają ustawianie trybów pracy układu DSP.
74h - ustawienie trybu 4-bitowej konwersji cyfmwo-analogowej AD-PCM (transmisja DMĄ).
75h - ustawienie DSP w tryb 4-bitowej konwersji C/A ADPCM z bajtem odniesienia (DMĄ).
76h - ustawienie DSP w tryb 2.6-bilowej konwersji C/A ADPCM (DMĄ).
77h - ustawienie DSP w tryb 2.6-bitowej konwersji C/A ADPCM z bajtem odniesienia (DMĄ).
W zasadzie rozkazy 7xh przypominają (choć naturalnie dotyczą innych modów pracy) rozkazy lxh. Zasady
korzystania z nich są więc takie same. Nie należy jednak zapominać, że wszystkie rozkazy 7xh dotyczą transmisji
w trybie DMĄ.
Rozkaz Dxh
Komendy Dxh umożliwiają kontrolowanie transmisji DMĄ oraz włączanie i wyłączanie DAĆ.
Dlh - włączenie wzmocnienia sygnałów z układu DAC-
D3h - wyłączenie wzmocnienia sygnałów z układu DAĆ. Użycie lego rozkazu spowoduje, że sygnały pojawiające
się na wyjściu DAĆ nie będą przesyłane do wzmacniacza (nie będą wzmacniane i przesyłane na odpowiednie
gniazdo karty). Użycie rozkazu nie zakłóci
103
PROGRAMOWANIE DSP
odtwarzania syntezowanego przez układ FM dźwięku. Należy zwrócić uwagę, że użycie rozkazu D3h jest
wymagane przed rozpoczęciem konwersji analogowo-cyfrowej. Powody są tu jasne - próbkowany dźwięk jest
jednocześnie kierowany na wyjście układu DAĆ i bardzo łatwo o powstawianie sporych zakłóceń podczas
samplin-gu. Kierowany na wyjście DAĆ sygnał jest przy tym mocno zniekształcony - winy należy upatrywać
w prędkości działania samej karty. Dowodem na to może być fakt, że przetwarzaniu analogowo-cyfrowemu
przy włączonym wzmacnianiu DAĆ w trybie emulacji Sound Blaste^a na kartach Gravis Ultra Sound
towarzyszy dźwięk bardzo dobrej jakości. Rozkazu D3h możemy używać do chwilowego wyciszania
odtwarzanej próbki dźwiękowej.
D8h - testowanie włączenia układu wzmacniania sygnałów z DAĆ. Jeżeli do układu DSP wyślemy kod
rozkazu D8h, odczytana zaraz potem z DSP wartość będzie równa FFh, gdy wyjście układu DAĆ jest
połączone ze wzmacniaczem lub OOh, gdy tak nie jest. W praktyce rozkaz rzadko używany (powtórne
wysłanie do DSP komendy Dlh lub D3h nie powoduje przecież żadnego błędu).
DOh - zatrzymanie transmisji DMĄ. D4h - kontynuacja wstrzymanej rozkazem DOh transmisji DMĄ.
Rozkaz E l h
Rozkaz El h nie został opisany w dokumentacji firmowej, mimo że jest przyjmowany nawet przez starsze
układy. Wysyłając go do DSP sprawdzić możemy wersję karty. Pierwszy odebrany zaraz po wysłaniu kodu
komendy bajt to bardziej znaczący numer wersji karty, drugi bajt - mniej znaczący. Oto tekst źródłowy
programu wyświetlającego numer wersji zainstalowanej karty:
Program Wersja;
Uses
DSPDir;
begin ifnotDSPResetthen
begin
wnteInCBrak karty Sound Blaster');
halt
end;
DSPWrite[$E1], {wystanie kodu rozkazu } writefSound Blaster');
writeln(DSPRead,'.',OSPRead) end.
ROZDZIAŁ 4
4.6 BADANIE KONFIGURACJI SB
Elegancko napisany program powinien zwalniać użytkownika z obowiązku samodzielnego ustalania parametrów
pracy. W szczególności dotyczy to programów rozrywkowych. Programy obsługujące karty dźwiękowe powinny
więc automatycznie rozpoznawać ich konfigurację. W odniesieniu do kart serii Sound Blaster oznacza to
sprawdzenie numeru linii 1RQ, adresu bazowego i numeru kanału DMĄ używanych przez kartę. Sprawa badania
adresu bazowego jest dosyć prosta - wystarczy podejmować próby resetowania układu DSP, za każdym razem
zakładając inną wartość adresu. Poprawna (i odebrana w określonym czasie) odpowiedź układu oznaczać będzie,
że przyjęta wartość jest prawidłowa. Algorytm ten został zaim-plementowany w przedstawionej wcześniej
bibliotece DSPDir. Więcej problemów nastręcza jednak sprawdzanie numerów kanału DMĄ i linii IRQ- O ile
założymy, że komputer komunikuje się z kartą używając pierwszego kanału procedura odnajdywania numeru
przerwania IRQ przypisanego karcie działać powinna według schematu:
• Zainstalowanie własnych procedur obsługi przerwań IRQ 2, 3, 5, 7. Każda z procedur powinna modyfikować
wartość zadeklarowanej wcześniej zmiennej globalnej przypisując jej swój numer.
• Zainicjowanie transmisji przyjętym kanałem DMĄ. Zakończenie transmisji spowoduje wywołanie
ustawionego zworka-mi przerwania. Procedura jego obsługi nada odpowiednią wartość zmiennej, z której
następnie będziemy mogli odczytać numer linii IRQ, na jakiej pojawił się sygnał.
W przypadku, gdy nie znamy numeru kanału DMĄ używanego podczas transmisji, algorytm powtarzamy dla
kolejnych, prawdopodobnych kanałów. Poniżej prezentuję tekst źródłowy programu wyświetlającego informacje o
konfiguracji karty Sound Blaster (przy założeniu transmisji kanałem DMĄ l):
program SBIRGInfo;
uses dos.dspdir;
var
01dlRQHand2,01dlRQHand3,01dlRQHand5;pointer;
01dlRQHand7;pointer;
{stare wektory przerwań IRQ}
PROGRAMOWANIE OSP
Numberbyte;
OLD21 byte:
procedurę ProclRQ2; interrupt, { dla IRQ2 } begin
Number:=2;
portE$20]:=$2C { EOI} end;
procedurę ProclRQ3; inCerrupt; { dla IRQ3 } begin Number:=3;
port[$20]:=$20 {EO!} end:
procedurę PraclRQ5; mterrupt: { dla IRQ5 } begin
Number:=5;
port[$20]:=$20 {EOI} end;
procedurę Pr'oclRQ7; inCerrupt; { dla IRQ7 } begin
Number:=7;
port[$203:=$2Q {EOI} end;
begin
if noc SBInstalled Chen { czy wykryto kartę } begin
wntelnC'Brak karty Sound Blaster''];
halt end;
getintvec(8-2,aidlRQHand2); { zapamiętujemy stary wektor} setintvec(8+2,@ProclRQ2]; {„naginamy"}
getintvecES*3,OldlRQHand3); { zapamiętujemy stary wektor} 5etintvec(8+3,@ProclRQ3]; {„naginamy"}
getintvec[8-5,OldlRQHand51; { zapamiętujemy stary wektor} setintvec(S+5,@ProclRQ5]: {„naginamy"}
getintvec[8-7,OldlRQHand7); { zapamiętujemy stary wektor} setintvec(8+7,(o)ProclRQ7); {„naginamy"}
OLD21 :=port[$21];
p0(t[$21]:=porc[$213and89:
ROZDZIAŁ 4
{odblokowane l;nnlRa2,3.5,7}
port[$OA]'=5: { ustawienie maski dla kanafu OMA 1 } port[$OC]:=0;
portISOB): =$49; {transmisja z pamięci do karty} porC[$02]:=0;
port[$02]:=0;
{młodszy bajt długości} { starszy bajt długości}
{ aktywacja kanału DMĄ 1 }
DSPWritet$4D];
DSPWritet'131]; { wartość bez znaczenia: tu dla 8000 Hz }
DSPWrite($4B], DSPWhtem;
DSPWriteEO];
DSPWrite[$14];
DSPWrite[1);
DSPWriteCO)'
{scary wektor IRQ2} {scary wektor IRQ3} {stary wektor IRQ5} {starywektorlRQ7}
wriceln['Karcie przypisano linię IRQ',number] end,
Ponieważ maksymalna częstotliwość próbkowania udostępniana przez kartę jest determinowana wersją układu
DSP, przydatna jest możliwość sprawdzenia numeru wersji karty. Posłużyć się tu można rozkazem El h,
opisywanym przy okazji omawiania komend DSP. Podany tam leż został tekst przykładowego programu.
Warto zauważyć, że pomimo iż testowanie konfiguracji karty jest dość proste, wiele z programów zwraca się z
pytaniem o ustawienia do użytkownika (a przynajmniej jest możliwość wymuszenia przyjmowanych przez program
parametrów). Jeżeli już zdecydujemy się na takie podejście do problemu, przed zadaniem pytania o kanał DMĄ,
numer linii IRQ czy adres portu bazowego warto sprawdzić wartość zmiennej systemowej BLASTER. Przykład
proce-
107
PROGRAMOWANIE DSP
dur testujących podstawowe ustawienia karty przedstawiony został w rozdziale poświęconym obsłudze plików
zapisanych w formacie
VOC.
109
ROZDZIAŁ 4
PROGRAMOWANIE SYNTEZERA FM
5. PROGRAMOWANIE SYNTEZERA FM
Programowanie syntezera FM jest najbardziej naturalnym sposobem
zmuszenia karty Sound Blaster do zagrania choćby najprostszej
melodii. Opisywany w jednym z poprzednich rozdziałów sterownik
SBFM, korzystając z układu FM, udostępnia nam prosty sposób
udźwiękowienia swoich programów. Warto zdawać sobie sprawę, że do
wszystkich możliwości karty daje dostęp dopiero znajomość zasad jej
bezpośredniego programowania. W niniejszym rozdziale pragnę
przekazać podstawowe informacje na temat funkcjonowania układu
syntezy FM i zasad tworzenia wykorzystujących go programów.
5.1 FUNKCJONOWANIE SYNTEZERA FM
Syntezer FM, który znajdujemy na kartach Sound Blaster, oparty jest o
układ Yamaha oznaczany przez FM1312. Może pracować w dwóch
trybach: melodycznym (możliwość kształtowania brzmienia 9
instrumentów) oraz rytmicznym (definiujemy brzmienie 6
instrumentów i możemy korzystać ze zdefiniowanych 5 instrumentów
perkusyjnych:
bębna basowego, bębenka, werbla, talerza i ni hat).
Zanim przystąpimy do programowania układu syntezy FM, warto
przypomnieć sobie kilka podstawowych informacji na temat dźwię-
ROZDZIAŁ 5
ku w ogóle, a dźwięków generowanych przez naszego Sound Bla-stera w szczególności.
Najprostszym dźwiękiem jest ton, czyli drgania akustyczne o przebiegu sinusoidalnym (mówimy tak, ponieważ
wykres zmian natężenia dźwięku w funkcji czasu ma postać sinusoidy). Na przykład z dźwięku wydawanego przez
instrumenty strunowe wyizolować można sygnał o częstotliwości podstawowej oraz szereg sygnałów o
częstotliwościach wyższych niż podstawowa (tzw. harmonicznych). O barwie dźwięku decyduje tu liczba i
amplituda kolejnych składowych. Ciąg zmian amplitudy całkowitego sygnału akustycznego w funkcji czasu to
obwiednia dźwięku. Obwiednia charakteryzuje takie podstawowe parametry czasowe dźwięku, jak:
• Czas narastania, czyli czas, w jakim amplituda sygnału osiągnie wartość maksymalną.
• Czas opadania, czyli czas, w jakim amplituda sygnału osiąga (zmniejszając się) wartość związaną z fazą
ustaloną.
• Czas ustalania, czyli czas, w jakim amplituda osiągnie poziom, na jakim pozostanie do końca fazy ustalonej.
• Czas zanikania (wybrzmiewania) - czas, w jakim wartość względna amplitudy sygnału spadnie do poziomu
zerowego.
OdB
Poziom podtrzymania
96 dB
Narastanie Opadanie PodtaTymanie W/brzmiewenie (ARack) (Decay) (Sustsin) (Retase)
Rys.4 Obwiednia ADSR (AttackfDecay/Sustain/Relase)
Układ syntezera FM zawiera 18 operatorów. Każdy z nich składa się z oscylatora, generatora obwiedni i sterownika
głośności. Oscylator odpowiedzialny jest za generowanie fali o przebiegu opartym na sinusoidzie. Generator
obwiedni na podstawie ustalonych parametrów moduluje w czasie amplitudę sygnału wyjściowego. Parametry
pracy każdej z części operatora:
Oscylator:
• kształt bazowej fali (do wyboru jedna z czterech opcji)
111
PROGRAMOWANIE SYNTEZERA FM
• mnożnik częstotliwości (współczynnik, przez który mnożona jest częstotliwość generowanego sygnału)
• vibrato (ustawienie tego efektu powoduje niewielkie wahania częstotliwości dźwięku w funkcji czasu)
• intensywność sprzężenia zwrotnego FB (dla syntezy FM)
Generator obwiedni:
czas narastania (czas, po jakim amplituda sygnału osiągnie wartość maksymalną)
• czas opadania (czas, w jakim amplituda sygnału spadnie z poziomu maksymalnego do ustalonego) flaga
fazy ustalonej EG-TYP (flaga ustawiona oznacza występowanie w obwiedni fazy ustalonej)
• poziom amplitudy w fazie ustalonej
• czas zanikania (czas, po jakim amplituda sygnału spadnie z poziomu ustalonego do 0)
skala długości KSR (decyduje o tym, czy długość dźwięku ma być częściowo zależna od jego wysokości)
Sterownik głośności:
• głośność ostateczna (na wyjściu z operatora)
• wibracje amplitudy (decyduje o tym, czy amplituda sygnału ma ulegać niewielkim wahaniom w czasie)
• skala intensywności KSL (ustawienie powoduje uzależnienie głośności od wysokości dźwięku)
Każdy z 18 operatorów bierze udział w syntezie dźwięku. W trybie melodycznym dwa operatory przypadają
na każdy z dziewięciu instrumentów, a w trybie rytmicznym operatory 1-12 używane są przy syntezie
brzmień 6 instrumentów, a operatory 13-18 użyte są do syntezy brzmienia 5 instrumentów perkusyjnych. Dla
trybu rytmicznego pracy syntezera przyporządkowanie jest następujące:
• bęben basowy (bass drum) - operatory 13 i 16
• hi hat - operator 14
• bębenek (tom tom) - operator 15
werbel (snare drum) - operator 17
talerz (top cymbał) - operator 18 Podczas syntezy FM brzmienia jednego instrumentu pracują dwa
operatory. Jeden w funkcji modułu modulatora, drugi w funkcji
ROZDZIAŁ 5
modułu nośnika. Ideę dwu operatorowej syntezy FM przedstawia rysunek 5.
pę<o sprzężenia zwiokiego
•i
Operator 1
smusotd 1
Foła sinusoid. 2
Rys.5 Synteza divuopera torowa FM
Zależność między częstotliwością generowanego w ten sposób sy-nału a parametrami syntezy przedstawia się
następująco:
F(t) •== A sin((Ot-\-I sinuJt) gdzie:
A ~ amplituda wyjściowa / - mnożnik częstotliwości ą -
częstotliwość nośnika ą^ - częstotliwość modulatora
Ponieważ podczas syntezy FM mamy do dyspozycji 9 kanałów instrumentalnych, każdemu kanałowi przypisane
są 2 operatory (modulator i nośnik). Ich przyporządkowanie przedstawia się następująco:
Kanał l: operatory l i 4 (o adresach OOh i 03h) Kanał 2: operatory 2 i 5 (o adresach O l h i
04h) Kanał 3: operatory 3 i 6 (o adresach 02h i 05h) Kanał 4: operatory 7 i 10 (adresy 08h i
OBh) Kanał 5: operatory 8 i 11 (adresy OOh i OCh) Kanał 6: operatory 9 i 12 (adresy OAh i
ODh) Kanał 7: operatory 13 i 16 (adresy l On i 13h) Kanał 8: operatory 14 i 17 (adresy llh i
14h) Kanał 9: operatory 15 i 18 (adresy 12h i 15h)
5.2 ZASADY OBSŁUGI SYNTEZERA FM
Zasady obsługi syntezera FM są proste. Układowi syntezy przypisane są dwa porty. Na oryginalnej karcie AdLib
mają one adresy 388h i 389h. Na kartach Sound BIaster komunikacja z układem jest moż-
113
PHOGRAMOWANIE SYNTEZERA FM
liwa także przez porty 2x8h i 2x9h (x zastępujemy naturalnie wartością wynikającą z przyjętego adresu
bazowego). Ponieważ pisząc programy komunikujące się z kartą za pośrednictwem portów 388h i 389h
mamy pewność, że będą leż współpracowały z kartami SB i AdLib, we wszystkich podawanych niżej
przykładach będę używał wyłącznie tych adresów.
Oto algorytmy, według których działać powinny procedury komunikacji z układem syntezy:
Zapis danej do rejestru:
1. Zapis do portu indeksowego 388h numeru rejestru
2. Oczekiwanie ok. 3 mikrosekund
3. Odczyt wartości jednobajtowej z portu danych 389h
Uwaga: Przed ponownym zapisem do dowolnego rejestru należy
odczekać około 23,3 mikrosekundy.
Odczyt rejestru statusowego
Odczyt rejestru stanu realizujemy odczytując jeden bajt z portu indeksowego (388h). Rejestr statusowy nie ma
swojego adresu i nie można do niego zapisać żadnej wartości.
Pewną trudność wydaje się nastręczać konieczność stosowania czasowych zwłok. Wydaje się, że najprościej
będzie skorzystać z jednej z usług BIOS w wersji AT (usługa 86h przerwania 15h). Jeżeli chcemy, aby nasz
program poprawnie działał także na komputerach klasy XT, musimy postarać się skonstruować pętlę czasową
o ilości repetycji związanej z prędkością komputera.
Poniżej przedstawiam zestawienie rejestrów układu FM:
Rejestr statusowy
Rejestr jest 8-bitowy, ale znaczenie mają jedynie najstarsze 3 bity. Bit 7 ustawiany jest w sytuacji, w której w
którymś z rejestrów liczników (lub w obu naraz) wystąpi przepełnienie, a bity 6 i 5 sygnalizują wystąpienie
przepełnienia liczników odpowiednio l i 2.
Blh-Testowy
Przed rozpoczęciem programowania układu należy wpisać do niego bajt o wartości 0.
ROZDZIAŁ 5
B2h - Liczniki
Liczniki jest 8-bitowym licznikiem zliczającym od O do 255 okresy o długości 80 mikrosekund. Zasada korzystania
z niego jest prosta. Wprowadzamy do niego jakąś wartość początkową N. Od tej pory jest ona (co 80 mikrosekund)
zwiększana o l. W momencie, gdy zapisana w rejestrze wartość „przeskoczy" z 255 do O (nastąpi przepełnienie),
ustawiany jest bit 6 w rejestrze statusowym. Tak więc czas T, jaki odmierzy licznik, zanim nastąpi przepełnienie,
wyliczyć można z zależności:
r = ( 256- N ) * 0.08 fmsl
03h - Licznik2
Licznik2 pełni identyczną funkcję jak Liczniki, z tą różnicą, że zlicza okresy o długości 320 mikrosekund.
Przepełnienie sygnalizowane jest przez ustawienie bitu 5 rejestru statusowego. Zależność między wartością startową
N a czasem przepełnienia T jest więc w jego przypadku następująca:
r== (256 -N ) * 0.32 fmsl
04h - Rejestr kontroli liczników
Rejestr używany jest do uruchamiania i zatrzymywania liczników l i 2. Znaczenie poszczególnych bitów jest
następujące:
Bit O - ustawienie powoduje rozpoczęcie odliczania przez Liczniki, wartość O oznacza zatrzymanie pracy licznika,
Bit l - jak bit O, ale w odniesieniu do Licznika2.
Bit 5 - ustawienie tego bitu powoduje zerowanie bitu 5 rejestru statusowego (przepełnienie Licznika 2 nie jest
sygnalizowane). Bit 6 - analogicznie jak bit 5, ale w odniesieniu do bitu 6 rejestru statusowego (brak sygnalizacji
przepełnienia licznika l). Bit 7 - ustawiony powoduje zerowanie bitów 5,6,7 rejestru statusowego.
Dalej przedstawiam pięć grup rejestrów powiązanych z poszczególnymi operatorami. Adres rejestru w grupie
związanego z danym operatorem wyznaczyć można dodając do adresu pierwszego rejestru w grupie wartość
odpowiedniego przesunięcia:
115
PROGRAMOWANIE SYNTEZERA FM
Operator
Przesunięcie
l
OOh
2
Olh
3
02h
4
03h
5
04h
6
05h
7
08h
8
OOh
9
OAh
10
OBh
11
OCh
12
ODh
13
lOh
14
llh
15
12h
16
13h
17
14h
18
15h
20h-35h AM/Y1B/EG/KSR/MULTIPLE dla operatorów 1..18
Grupa 8-bitowych rejestrów. Znaczenie poszczególnych bitów każdego z nich:
Bit 7 - AM - ustawienie wahań natężenia dźwięku (tremolo). Dla wartości O bitu wahań nie ma, dla
wartości l wahania będą zachodzić z częstotliwością 3.7 Hz. Maksymalną „głębokość" zmian określa wartość
bitu 7 rejestru BDh (l lub 4.8 dB).
Bit 6 - VIB - ustawienie efektu vibrato (wahania częstotliwości dźwięku). Częstotliwość wahań jest równa
6.4 Hz. Stopień zmian częstotliwości w czasie określamy ustawiając bit G rejestru BDh (7% lub 14%).
Bit 5 - EG-TYP - typ obwiedni dźwięku. Wyzerowanie bitu oznacza wybranie typu l obwiedni, ustawienie -
typu 2.
ROZDZIAŁ 5
typ l
Fazo nofasionio
Fara opadon.a
TrP 2
Faza norastoniB
Feza obadania
_Paziom podtrzymani b
Wyb r? miewani y
Klawisz wciśnięty
/?ys.6' Dwa typy obimedni
Bit 4 - KSR - włączenie następuje, gdy bit ustawimy, wyłączenie, gdy wyzerujemy. Włączenie KSR umożliwia
podkreślenie efektu znanego z instrumentów strunowych - uzależnienia czasu trwania dźwięku od jego wysokości.
Bity 3..0 - MULTIPLE - mnożnik. Równanie syntezy FM uwzględniające wartość mnożnika wygląda następująco:
F(t)= A stn( a^-ą/ + f-5in(M^co^) ) gdzie:
A - amplituda wyjściowa,
l - amplituda modulatora,
ą- częstotliwość nośnej,
co^- częstotliwość modulatora,
M- mnożnik dla operatora nośnej,
M^- mnożnik dla operatora modulatora.
Wielkość MULTIPLE może przybierać wartości od O do 15 (4 bity). Dla wartości O mnożnik przyjmuje wartość
0,5. Dla wartości z przedziału Ih-Fh odpowiednio 1 do 15.
40h-55h KSL/Total Level
Zestaw rejestrów służących do kontroli poziomu sygnału operatora i definiowaniu stopnia spadku głośności dla
wyższych częstotliwości. Znaczenie bitów rejestrów:
Bity 0-5 - TOTAL LEVEL - 6 bitów opisujących poziom wyjściowy sygnału operatora związanego z rejestrem.
Zakres wartości: od O to 63. Znając wartość przechowywaną przez te 6 bitów, łatwo wyznaczymy poziom sygnału
wyrażony w dB: WARTOŚĆ*0,75 fdB).
Bity 6-7 - KSL - ustawiając bity 6 i 7 możemy regulować spadek natężenia dźwięku wraz ze wzrostem
częstotliwości. I tak, spadek ten w zależności od wartości przyjmowanych przez dwubitowe słowo (młodszy bit to
naturalnie bit 6) przedstawia się następująco:
117
PROGRAMOWANIE SYNTEZERA FM
KSL
Spadek [dB/oktawę]
0 l 2 3
0 3 1,5 6
60h-75h - Attack/DecayRatc
Używając tej grupa rejestrów można kształtować fazę narastania i opadania dźwięku. Wartość 8-
bajtowego rejestru należy podzielić na 2 4-bitowe słowa. Młodsze (bity 0-3 rejestru) z nich opisywać
będzie czas trwania fazy opadania, starsze (bity 4-7) - narastJ^a. Najogólniej biorąc, im wielkość
opisująca czas jest mniejsza, tym czas jest dłuższy. Dokładnie ilustruje to poniższa tabela (czasy
podane są w ms):
Wartość Czas narastania (10% do 90%)
Czas narastania (-96dBdo0dB)
Czas opadania (90% do 10%)
Czas opadania (0dB do -96dB»
63
0.00
0.00
0.51
2.40
62
0.00
0.00
0.51
2.40
61
0.00
0.00
0.51
2.40
60
0.00
0.00
0.51
2.40
59
0.11
0.20
0.58
2.74
58
0.11
0.24
0.63
3.20
57
0.14
0.30
0.81
3.84
56
0.19
0.38
1.01
4.80
55
0.22
0.42
1.15
5.48
54
0.26
0.46
1.35
6.40
53
0.31
0.56
1.62
7.68
52
0.37
0.70
2.02
9.60
51
0.43
0.80
2.32
10.96
50
0.49
0.92
2.68
12.80
49
0.61
1.12
3.22
15.36
48
0.73
1.40
4.02
19.20
47
0.85
1.56
4.62
21,92
46
0.97
1.84
5.38
25.56
45
1.13
2.20
6.42
30.68
44
1.45
2.76
8.02
38.36
43
1.70
3.12
9.24
43.84
ROZDZIAŁ 5
42
1.94
3.68
10.76
51,12
41
2.26
4.40
12.84
61.36
40
2.90
5.52
16.04
76.72
39
3.39
6.24
18.48
87.68
38
3.87
7.36
21.52
102.24
37
4.51
8.80
25.68
122.72
36
5.79
11.04
32.08
153.44
35
6.78
12.48
36.96
175.36
34
7.74
14.72
43.04
204.48
33
9.02
17.60
51.36
245.44
32
11.58
22.08
64.16
306.88
31
13.57
24.96
73.92
350.72
30
15.49
29.44
86.08
408.96
29
18.05
35.20
102.72
490.88
28
23.17
44.16
128.32
613.76
27
27.14
49.92
147.84
701.44
26
30.98
58.88
172.16
817.92
25
36.10
70.40
205.44
981.76
24
46.34
88.32
256.64
1227,52
23
54.27
99.84
295.68
1402.88
22
61.95
117.76
344.32
1635.84
21
72.19
140.80
410.88
1963.52
20
92.67
176.84
513.28
2455.04
19
108.54
199.68
591.36
2805.76
18
123.90
235.52
688.64
3271,68
17
144.38
281.60
821.76
3927.04
16
185.34
353.28
1026.56 4910.08
15
217.09
399.36
1182.72 5611.52
14
247.81
471.04
1377.28 6543.36
13
288.77
563.20
1643.52 7854.08
12
370.69
706.56
2053.12 9820.16
11
434.18
798.72
2365,44 11233.04
10
495.62
942.08
2754.56 13086.72
9
577.54
1126.40 3287.04 15708.16
8
741.38
1413.12 4106.24 19640.32
7
868.35
1597.44 4730.88 22446.08
6
991.23
1884.16 5509.12 26173.44
5
1155.07 2252.80 6574.08 31416.32
4
1482.75 2826.24 8212.48 39280.64
PROGRAMOWANIE SYNTEZERA FM
119
68h-95h -Sustain Level'Relase Ratę
I znów 8-bitowy rejestr podzielony na 2 4-bitowe słowa. Młodsze z nich (bity 0-3) opisuje czas wybrzmiewania
dźwięku. Starsze (bity 4-7) - odnoszą się do poziomu podtrzymania obwiedni dźwięku. Każdy bit 4-bitowego
słowa wyznaczającego poziom podtrzymania ma swoją wagę. Bit najmłodszy - 3 [dB], bit następny - 6 |dB|,
następny - 12 [dB], a najstarszy - 24 |dB]. Najwyższy poziom stanu podtrzymania wymusimy ustawiając
wszystkie bity na „l" (wtedy poziom = 93 d B).
Rejestry tej grupy służą do ustawiania częstotliwości dźwięku dla 9 głosów. W trybie melodycznym każdy
rejestr jest związany z jednym głosem. W trybie rytmicznym pierwszych sześć par rejestrów związanych jest z
6 głosami, a dalej przyporządkowanie jest następujące:
• bębenek - rejestry A8h i B8h,
• bęben basowy - A6h i B6h.
Dla reszty instrumentów perkusyjnych zmiana częstotliwości dźwięku jest niemożliwa.
Rejestry AOh-A8h odpowiadają młodszej części 10-bitowej wielkości F-NUMBER opisującej
częstotliwość generowanego dźwięku.
Znaczenie bitów rejestrów BOh-B8h jest zróżnicowane:
Bity 0-1 - przechowują najstarsze 2 bity F-NUMBER. Bity 2-4 - opisują oktawę, w której będzie
grany dźwięk.
Bit 5 - KEY - bit ma kluczowe znaczenie. Jego ustawienie powoduje rozpoczęcie generowania dźwięku (jak
przy wciśnięciu klawisza), jego wyzerowanie spowoduje wyłączenie głosu (jak przy zwolnieniu klawisza
klawiatury muzycznej).
Uwaga - częstotliwość generowanego dźwięku można dość prosto wyznaczyć korzystając z zależności:
F = 50000 * F-NUMBER » 2 ^(OKTAWA - 20)
Dla oktawy 4 wartości F-NUMBER odpowiadające kolejnym dźwiękom:
ROZDZIAŁ 5
Dźwięk Częstotliwość
/-NUMBER
C^
277,2
363
D
293,7
385
D#
311,1
408
E
329,6
432
F
349,2
458
F#
370
485
G
392
514
G#
415,3
544
A
440,0
577
A#
466,2
611
C
523,3
686
CBh-CBh -
• Feedback/Connection
Rejestry pozwalają ustalić współczynnik intensywności sprzężenia
zwrotnego oraz sposób torów.
połączenia dwóch współpracujących opera-
Bity 1-3 tworzą 3 bitowe słowo. W zależności od jego wartości
współczynnik jest równy:
FB
Współczynnik
0
0
l
p/16
2
P/8
3
P/4
4
p/2
5
P
6
2p
7
4p
Bit O określa, jak połączone są operatory. Z trybem syntezy FM mamy do czynienia, gdy bit jest wyzerowany,
z syntezą addytywną - gdy bit został ustawiony.
PROGRAMOWANIE SYNTEZERA FM
121
B<0(CON)
Schemat syntezy
0
1
^ ——
P1 —— ——.(.) ———
T
Op«tt*if 1
T
l P2
Operalor Z
W^śde
Operator l
P1 —— —1»)—)
T
(
ł
)——————————————————————————7
Wiście
Operator 2
Rys. 7 Synteza FM i syntezo addytywną
Pojedynczy rejestr, pozwalający nam kontrolować stopień wahań natężenia dźwięku dla efektu vibrato,
stopień zmian częstotliwości dźwięku dla efektu tremolo. Poza tym używając rejestru przełączamy układ w
tryb melodyczny lub rytmiczny.
Bity O - 4 - mają znaczenie w trybie rytmicznym. Pełnią rolę identyczną Jak bit KEY rejestrów BOh-B8h
(ustawienie rozpoczyna generowanie dźwięku, wyzerowanie - kończy). Bit 4 jest związany z bębnem
basowym, bit 3 - z werblem, bit 2 włącza/wyłącza bębenek, l - talerz, O - high hat. Należy pamiętać, że jeżeli
operujemy instrumentami perkusyjnymi z wykorzystaniem tego rejestru, bity KEY rejestrów B6h, B7h, B8h
muszą być wyzerowane- W trybie rytmicznym przyporządkowanie operatorów poszczególnym instrumentom
wygląda następująco:
Instrument
Operator(y)
bęben basowy
13,16
hi hat
14
bębenek 15
werbel
17
talerz
18
Bit 6 rejestru pozwala na ustalenie intensywności efektu vibrato, Ustawiony oznacza 14% wahania
częstotliwości, wyzerowany - 7%,
ROZDZIAŁ 5
Bit 7 - ustawianie maksymalnej zmiany natężenia dźwięku przy efekcie tremolo. Bit wyzerowany - l dB,
ustawiony - 4,8 dB.
E0h-F5h-WaveSelect
Rejestry umożliwiają ustalanie kształtu fali generowanej przez oscy-latory poszczególnych operatorów. Dwa
najmłodsze bity każdego rejestru kodują kształt jak na rysunku 8.
brt 1
bit O
Kształt generowanej fali
Rys.8 Kształt fali generowanej przez oscylator generatora
5.3 PRZYKŁADY
Po takiej dawce informacji na temat funkcjonowania układu FM czas na jakiś przykład. Pierwszym z
nich jest tekst źródłowy biblioteki implementującej dwie najprostsze procedury:
procedurę FMWriteCreg,value) - Zapis do rejestru wyspecyfikowanego parametrem reg wartości value.
Procedura uwzględnia zwłoki czasowe konieczne przy programowaniu układu (realizuje je korzystając z usług
BIOS-a w wersji AT).
function FMStatus:byte - Zwraca wartość rejestru statusowego układu.
Oprócz tego w części inicjacyjnej biblioteka testuje obecność układu FM karty Sound Blaster (AdLib) i nadaje
odpowiednią wartość zmiennej globalnej FMInstalIed. Wartość True tej zmiennej oznacza
123
PROGRAMOWANIE SYNTEZERA FM
jego obecność. Procedura FMCheck testująca kartę wykorzystuje w tym celu licznik pierwszy (80
mikrosekund).
unitFMDir;
interface var FMInstalted:boolean;
procedurę FMWriCe(reg,value'byte); { zapis do rejestru } function FMStatus:byte; { odczyt rejestru statusowego }
implementation uses dos:
{doahnumerfunkcji} {starsze stówo =0} {młodsze stówo} {wykonać!}
procedurę Waittmicros:word);
var
reg:registers;
begin
reg.ah:=$86;
reg.cx:=D;
reg.dx:=micros;
intr[$15,regl end,
{oczekiwanie 3.3us} port[$3891:==value: { zapis wartości} Wait(24] { oczekiwanie 24 us }
procedurę FMWrite[reg,value:byte);
begin
port[$388]:=reg; { numer rejestru } WaitC3);
end;
{odczyt statusu}
function FMStacus:byte:
begin
FMScatus:=port[$38B] end;
procedurę FMCheck;
var
A,B,i:byte;
begin
FMWriteCI .0); { zerujemy rejestr testowy}
FMWrit:e[4.$60);
FMWhce[4,$803; {rejestr kontrolny}
A-=FMStatus;
{ zapamiętanie stanu rejestru statusowego }
FMWrite[2,$FE); { odlicz BO mikrosekund }
ROZDZIAŁ 5
{wystartowanie licznika 1 { pętla opóźniająca }
FMWnte(4,$11),
for i=1 to 255 do,
B:=FMStatus,
{Jeśli byt ustawiany bit przepełnienia licznika 1 }
FMWrite[4,$603,
FMWnce[4.S80);
FMfnsta!led:=[[BxorA)=192J
FMCheck
end:
begin
f end,
Napiszmy teraz najprostszy program wykorzystujący naszą kartę dźwiękową do syntezy FM. Zaczynamy
naturalnie tak:
Program Bdziang:
uses
crt.FMDir:
begin
if noc FMInstalled then halt;
Teraz, po kolei, wypełniamy kolejne rejestry układu odpowiednimi wartościami. Najpierw wpisujemy O do rejestru
testowego:
FMWriCe($01,0);
Teraz decydujemy, że nasz program będzie przełączał układ FM w tryb melodyczny. Ustawiamy też dużą głębokość
efektu vibrato:
FMWrite($BD,128];
Następnie dobieramy mnożniki dla operatorów l i 2 i wybieramy typ obwiedni. Ustawimy też efekt vibrato.
Pamiętamy, że dla głosu l (wykorzysta go nasz programik) adresy względne dwóch operatorów wynoszą
odpowiednio O i 3.
FMWrite[$20,64+32+103;
FMWnte[$23,64+32+1);
Teraz określamy poziom wyjściowy sygnału na każdym z operatorów:
FMWrite($40,1);
FMWrit;e($43,1);
125
PROGRAMOWANIE SYNTEZERA FM
Pozostaje jeszcze dobrać czasy narastania, opadania i wybrzmiewa-nia dźwięku oraz poziom podtrzymania
oraz ustalić kształt generowanej fali, ustawić tryb syntezy FM;
FMWnt:e[$60,128-1), FMWnce[$63,128+1):
FMWnte($80,128T31:
FMWntet$83,128+3), FMWnCet$EQ,a);
FMWntet$E3,0);
FMWrite($CO,0);
No i na koniec wprowadzić do pary AO i BO kod odpowiadający częstotliwości dźwięku, jaki wydać ma nasz
program, ustalić oktawę i ustawić bit KEY:
FMWrite[$AO,255):
FMWrite[$BO,2+16+32];
Dalej następuje krótka zwłoka czasowa, zerujemy bit KEY odpowiedniego rejestru i kończymy
działanie:
delay(500);
FMWnte[$BO,1+16) end.
Przyszedł czas na nieco bardziej skomplikowany program. Jego zadaniem będzie umożliwienie nam gry na
wielogłosowych „cymbałkach".
program Cymbałki;
uses
dos.FMDir;
ConsC
Var
convert:array[0.,71 of byte
=[$10,$n,$12,$13,$14,$15,$16,$01);
{tu przechowamy scan-code'y kolejnych klawiszy}
{naszej klawiatury}
{ Dalej: parametry obwiedni dźwięku naszego }
{instrumentu. Każdy może przybrać wartości}
{ od O do 63 }
Narastanie ^yte^;
Opadanie ^yte^B;
Poziom :byte=2;
Wybrzmewarie:byCe=4;
8iaS_handler:pointer; { stary wektor przerwania 9h } ScanCode,Contrcl,counter:byte; { zmienne robocze }
ROZDZIAŁ 5
keys;arrayt0..6] of byte;
{ tutaj będziemy trzymali wartości odpowiadające } { wyłączonym głosom 0,1.2,3,4,5,6 } keyboard:arrayt0..7] of boolean;
{klawisze 0..6-nasza „muzyczna" klawiatura, } { klawisz? -kod Esc } pressed:array[O..B] of boolean;
{ czy kanał 0..6 )est włączony}
{$F+} procedurę MapKeyHandier; incerrupt:
{ procedurę, którą zastąpimy oryginalną procedurę } { obsługi 9h i która będzie wypełniać odpowiednimi} {wartościami tablicę keyboard!]} var
n:byte;
begin
ScanCode:=por't[$60); { pobranie kodu znaku }
CQntrol:=portt$61];
port[$61]:=Control or $90:
port[3i61]:=Control; { regeneracja sterownika }
for n: =0 Co 7 do Begin
if ScanCode=convert[n] then keyboardCnL^true;
if ScanCode'=converl:En] or $90 then keyboard[n];=fa)se end;
port[$20J:=$20{EOI} end;
{$F-}
procedurę tnstallMapProc:
var
i: byte;
begin
set!ntvecC$9,©MapKeyHandier]; { nastaw wektor}
for i: =0 to 7 do keyboard[i3:=false
{ na początku wszystkie klawisze są zwolnione } end;
procedurę UninstaUMapProc;
begin
seCintvec[$9,aiOS_handler)
{ przywróć oryginalny wektor} end;
procedurę Prepareinstruments:
{ przygotowanie brzmienia każdego głosu instrumentu } const
PROGRAMOWANIE SYNTEZERA FM
\^J
fnumb:arrayt0 .6] of word=t385,432,458.514,577,647,686),
{ stałe F-NUMBER dla kolejnych głosów } var
ofs.byte, { zmienna pomocnicza } begin
FMWrite[$BD,128);
{tryb metodyczny i duża głębokość vibrato } forofs:=$00to$05do
begin
{ ustawienie parametrów dla głosów 0-3 )
ifofs>2 then FMWrite($20+ofs,64+32+2)
else FMWrite[$20+ofs,64+32+1).
{vibrato, drugi typ obwiedni i mnożnik=2 }
FMWrite[$40+ofs,1);
{TotalLevel= 1 }
FMWrite[$60+ofs. Narastanie shl4 + Opadanie);
{czas trwania fazy narastania dźwięku}
{i fazy opadania}
FMWriteCSBO+ofs,Paziom shl 4 + Wybrzmiewanie)
{ poziom stanu ustalonego i czas wybrzmiewania }
end;
forofs:=$OBto$OOdo
begin
{ ustawienie parametrów dla głosów 4-B} ifofs>$ODthenFMWrite($20+ofs,64+32+2) else
FMWriceC$20+ofs,64+32+15:
FMWriteE$40+ofs,1];
FMWriteESBO+ofs,Narastanie shl 4 + Opadanie];
FMWriteE$80+ofs.Poziom shl 4 + Wybrzmiewanie)
end;
{ ustawienie parametrów dla głosu 6}
FMWrite($20+$10,64+32+1);
FMWrice($20+$13,64+32+2);
FMWrite($40+$10,1);
FMWrite($40+$13,1);
FMWrite($60+$10, Narastanie shl 4 + Opadanie);
FMWrite($60+$13, Narastanie shl 4 + Opadanie);
FMWrice($80+$10.Poziom shl 4 + Wybrzmiewanie);
FMWrite($80+$13,Poziom sh! 4 + Wybrzmiewanie];
forofs;=0to6do
begin
{wyznaczenie młodszej części F-NUMBER } ( dla każdego głosu } FMWnte[$AO+ofs,byte(fnumbEofs]
and $FF]];
keys[ofs]:=byte([fnumb[ofs]and$3FF]shr8)+1S;
{ najstarsze 2 bity F-NUMBER do $BD i 4 oktawa } FMWrice[$90+ofs,keys[ofs])
end
ROZDZIAŁ 5
end:
ifnotFMinstalled then begio
{jeżeli karcą nie jest zainstalowana } writeInCBrak karty SB lub AdLib,'), hale end;
geCincvec[$9,BIOS^handler]; { zapamiętanie wektora } FMWrtteE$01,0): { wyzerowanie rejestru testowego } Prepareinstruments; {
przygotowanie brzmień } forcounter:=0to G do
pressed[counter]:=false;
{ wszystkie głosy wyłączone } wnteCTerazgraj używając klawiszy Q,W,E,R,T,Y,U.'];
wnteln[' Koniec- Esc.'J;
InstallMapProc; { przejęcie obsługi przerwania 9h } repeat
for counter:=0 to 6 do { dla każdego głosu } begin
if Ckeyboar'd[counter]]and[nat pressedEcounter]] Chen begin { właśnie został wciśnięty}
FMWrite[$BD+countenkeys[counter] or 32);
pressed[counter]:=true;
end;
if [tnot keybaard[cQunter]]and[pressed[counter']]) then begin { właśnie został zwolniony}
FMWrite[$BO+counter,keys[counter]);
pressed[councer];=false;
end:
end,
unti) keyboard^]; { aż nie zastanie wciśnięty Esc } UninstallMapProc;
{ oddanie obsługi orygianiej procedurze } forcounter:=0to6 do FMWr-ite[$BO+counter,keys[counter])
{wyłączenie głosów}
end.
Korzystając z programu można, używając klawiszy Q, W, E, R, T, Y i U zagrać prostą melodię najprostszym
brzmieniem. Program nie jest bardzo skomplikowany, ale osoby chcące zrozumieć zasady programowania układu
syntezy FM powinny skupić się szczególnie na analizie procedury Prepareinstruments.
PROGRAMOWANIE SYNTEZERA FM
129
Tym, którzy nie bardzo rozumieją sposób, w jaki zapewniłem możliwość odczytu stanu jednocześnie
wciśniętych klawiszy (gra wielogłosowa), należy się słowo wyjaśnienia. W chwili, gdy wciskamy lub
zwalniamy któryś z klawiszy, klawiatura PC wysyła do komputera ciąg składający się z jednego iub kilku
bajtów. Ciąg ten, jednoznacznie określający pojedynczy klawisz, to tzw. scan code. Rotę odgrywa tu fakt, że
scan code wysyłany przy wciskaniu klawisza (nazywany dalej kodem wciśnięcia) jest różny od ciągu
wysyłanego przy zwalnianiu (kod zwolnienia) tego samego przycisku. W przypadku ciągu jednobajtowego
różnica polega na tym, że bit 7 kodu zwolnienia jest zawsze ustawiony. W chwili wciśnięcia/zwolnienia
jakiegokolwiek klawisza na linii IRQ1 pojawia się sygnał i wywołane zostaje przerwanie 9h. To właśnie
procedura jego obsługi jest odpowiedzialna za odbiór ciągów kodujących zmiany stanu klawiszy i
podejmowanie związanych z tym akcji (wypełnianie bufora klawiatury, modyfikacja bajtów statusowych w
obszarze zmiennych BiOS-u itd). Pomysł rozwiązania problemu odczytu stanu wciśniętych jednocześnie
klawiszy naszej „muzycznej klawiatur-ki" zasadza się właśnie na przejęciu obsługi tego przerwania i analizie
nadchodzących z klawiatury sygnałów.
131
ROZDZIAŁ 5 SYGNAŁY l ICH PRZETWARZANIE
6. SYGNAŁY I ICH PRZETWARZANIE
W rozdziale tym chciałbym wprowadzić Czytelnika w dziedzinę
przetwarzania sygnałów cyfrowych. Ponieważ omówienie
każdego z problemów to właściwie temat na oddzielną pracę,
nie chciałbym, aby ktokolwiek potraktował poniższy tekst
inaczej, jak tylko wprowadzenie w tematykę omawianych
zagadnień. Mam nadzieję, że lektura lego rozdziału skłoni
niektórych do samodzielnych eksperymentów i do pogłębienia
wiedzy na wybrane tematy.
6.1 Co to są sygnały i jak je dzielimy
Jeżeli założymy, że z pewnego źródła docierają do nas
informacje o zmianie jakiś wielkości Fizycznych (np. ciśnienia,
temperatury), to wielkość elektryczną bezpośrednio związaną z
pierwotną postacią tej informacji nazywamy sygnałem. Każdy
sygnał może być funkcją wielu zmiennych niezależnych.
Najczęściej taką zmienną jest czas (t) lub częstotliwość (0.
Zasadniczo sygnały podzielić można na deterministyczne
(jeżeli mierzoną wielkość fizyczną można opisać zależnościami
matematycznymi) oraz losowe (gdy nie jest możliwe
przewidzenie wartości sygnału). W przypadku sygnału
deterministycznego dwa zbiory danych opisujące sygnał
uzyskane w tych samych warunkach powin-
ROZDZIAŁ 6
ny być identyczne. Często zdarza się, że obok interesującego nas sygnału pojawił się szum, a sam sygnał uległ
zniekształceniom. Wyłowienie go stać się wtedy może nie lada problemem (wszelkie szumy nakładające się na
sygnał mogą mieć zarówno deterministyczny, jak i losowy charakter).
Zmiany sygnału deterministycznego opisać możemy zależnościami matematycznymi. Na sygnał taki składa się
powtarzający się przebieg (okresowy) lub przebieg zanikający po upływie czasu (przejściowy).
Można założyć, że sygnały okresowe składają się z jednego lub wielu przebiegów sinusoidalnych uzależnionych
od okresu powtarzania (przedziału czasu, po jakim sygnał powtórzy się). Najmniej skomplikowany jest sygnał
okresowy opisywany funkcją:
x(t)= A*sin(2nft+(pj
gdzie A to stała określająca amplitudę, f to częstotliwość w Hz, a <p to początkowy kąt fazowy. Sygnał taki
powtarza się co okres T równy l/f.
Uogólniając, sygnał okresowy można przedstawić za pomocą szeregu Fouriera (zakładamy, że sygnał okresowy
składa się z sinusoid harmonicznych):
x(t) ^A,sin(2nft-^-(p^ +A^in(2*2nft+^... ^-A^inCn *2nft-^^)
Występowanie w sygnale składowych o różnych częstotliwościach przedstawić można za pomocą wykresu
widmowego (jak na rysunku 9).
A a
Częstotliwość Rys.9 Widmo prążkowe
Sygnały przejściowe są sygnałami zanikającymi do zera w określonym (skończonym) czasie. Widmo takich
sygnałów ma charakter
133
SYGNAŁY l ICH PRZETWARZANIE
ciągły, ponieważ (teoretycznie) sygnał taki zawiera nieskończoną liczbę częstotliwości składowych.
Sygnały losowe analizujemy posługując się opisami propabilistycz-nymi i statystycznymi. Sygnały losowe
podzielić można na stacjonarne i niestacjonarne, O tym. czy sygnał uznać można za stacjonarny, decyduje to,
czy wyznaczone wg poniższego opisu xśr(t) i R(T) są stałe dla wszystkich wartości t, i T.
Załóżmy, że uzyskaliśmy N zapisów sygnału o lej samej długości. x^ będzie wtedy wartością średnią sygnału
w chwili t, po ilości zbiorów danych (np. dla 3 zbiorów opisujących sygnał mamy:
xJt,) - (xft^ 4-x/^ +x//^/^.
Funkcję autokorelacji R(T) wyznaczymy obliczając średnią ilo"7-. -nów dwóch próbek wziętych w dwóch
oddzielnych chwilach ^ i ^ \: Każdym zbiorze (z zachowaniem odległości T=r^r,), Sygnał niestacjonarny to
taki, dla którego wielkości x^ i R(T) nie zmieniają się z czasem.
Istotną sprawą przy obróbce i analizie sygnałów jest ich prezentacja. 2 uwagi na to, że mają one na ogół
charakter ciągły wśród form ich przedstawiania dominuje graficzna. W celu ułatwienia interpretacji
sygnałów stosujemy często Filtrację i wygładzanie. Wygładzanie przeprowadzić można stosując np. algorytm
Hanna:
y,= 0,25y^l + 0,5y, + 0,25y,+/
Naturalnie wygładzając w taki sposób ciąg danych eliminujemy z niego składowe o wyższych
częstotliwościach - jest to tożsame z filtracją dolnoprzepustową. Jeżeli Filtracja zachodzi w dziedzinie czasu,
mówimy o splocie. Okno splotu to określenie, którego używamy, gdy mówimy o oknie czasowym, spoza
którego sygnały zostaną wytłumione.
6.2 Przetwarzanie analogowo-cyfrowe
Przetworzenie sygnału ciągłego do postaci zdyskretyzowanej nosi nazwę przetwarzania analogowo-
cyfrowego. Sam proces podzielić można na dwa etapy - próbkowanie i kwantyzację. Każdy z nich spełnia
inną rolę i na każdym z nich pojawiają się błędy innej natury. Zakładając dwuetapowość procesu, sam
schemat przetwarzania przedstawić można jak na rysunku 10.
ROZDZIAŁ 6
Sygnał we^śoowy
Próbkowanie
Kwantyzacja
10.15.20.30.25.
Rys. 10 Przetwarzanie analogowo-cyfroioe
Jak widać, wynikiem przetworzenia sygnału ciągłego jest ciąg liczb opisujących wartości kolejnych próbek. Oba
elapy procesu zostały omówione poniżej.
Próbkowanie
Próbkowanie polega na pobieraniu próbek wejściowego sygnału w pewnych odstępach czasu (dla stałych odstępów
mówimy o próbkowaniu ze stalą częstotliwością). Wynikiem próbkowania jest szereg próbek, czyli wartości
odpowiadających uśrednionej w krótkim czasie amplitudzie- Okres, w którym sygnał wejściowy jest uśredniany, to
apertura. Dla jakości próbkowania istotne jest, aby czas aper-tury był mały w stosunku do okresu próbkowania
(czasu upływającego między pobraniem kolejnych próbek).
Jak wspomniałem, ważnym parametrem procesu jest częstotliwość, z Jaką pobierane są próbki. Zjawiskiem
mającym bardzo niekorzystny wpływ na jakość są wahania tej częstotliwości (jej chwilowe zmiany).
Nieokreśloność okresu próbkowania nosi nazwę fluktuacji impulsów próbkujących.
Największą trudnością tego etapu przetwarzania analogowo-cyfro-wego jest niejednoznaczność. Chodzi tutaj o to,
że ten sam zbiór próbek może opisywać sygnały o bardzo różnych przebiegach. Ilustruje to rysunek 11.
Rys.11 Efekt niejednoznaczności
W praktyce może więc dojść do tego, że gdy np. spróbkujemy z odpowiednio niską częstotliwością sygnał o
przebiegu sinusoidalnym i częstotliwości f, to otrzymane próbki opisywać mogą też sygnały sinusoidalne o
częstotliwościach niższych. Zjawisko to nosi nazwę aliasingu. Ilustruje je rysunek 12.
SYGNAŁY f fCH PRZETWARZANIE
135
Wartość próbek
Rys. 12 Aliasing
Jest ono bardzo niekorzystne. Zapobiega się mu stosując tzw. filtry antyaliasingowe (lub mówiąc inaczej,
odfiltrowując składowe o zbyt wysokich częstotliwościach).
Dosyć łatwo wykazać, że częstotliwość próbkowania powinna być co najmniej dwukrotnie większa od
częstotliwości sygnału, którego przebieg chcemy opisać próbkami. Tak więc dla częstotliwości próbkowania
2f maksymalna częstotliwość przetwarzanego sygnału wynosić powinna f. W odniesieniu do dziedziny czasu
twierdzenie przybiera postać kryterium Rayleigha:
r > o.5*f
gdzie T to okres próbkowania wyrażony w sekundach, a f to górna częstotliwość pasma, w jakim mieści się
sygnał wyrażona w Hz.
Naturalnie nie wolno zakładać, że na sygnał nie składają się fale o wyższych niż dopuszczalne
częstotliwościach. Aby zredukować efekty niejednoznaczności, sygnał przed próbkowaniem poddaje się
filtracji dolnoprzepustowej. Oczywiście charakterystyka zastosowanego filtra nigdy nie będzie prostokątna -
składowe o częstotliwościach tylko nieznacznie wyższych od założonej f będą tłumione słabo. Stąd wynika
konieczność próbkowania z wyższą niż 2f częstotliwością (w praktyce 4-60.
Kwantyzacja
Kwantyzacja jest procesem, który polega na przedstawieniu w postaci szeregu liczb dyskretnych ciągu
dyskretnych wartości próbek. Ponieważ sygnał analogowy może przyjąć praktycznie nieskończoną
ROZDZIAŁ 6
liczbę stanów, kwantyzację potraktować należy jako przybliżenie. Podziałem sygnału wejściowego na
ograniczoną liczbę poziomów zajmuje się kwantyzator.
' * Wy]śae
Rys.13 Przykładowa
charakterystyka kiDontyzatora
Proces kwantyzacji wprowadza pewien błąd związany ze skokiem kwantyzacji q. Błąd ten powoduje powstanie
szumu zwanego szumem kwantyzacji. W mierze logarytmicznej odstęp szumów kwantyzacji od sygnału
fonicznego przy kwantyzacji n-bitowej można oszacować jako:
L = 6*n + 1,8 IdBj
Łatwo więc wyliczyć, że odstęp szumu kwantyzacji dla słowa 8-bi-towego (jak w SB) wynosić będzie 49,8 dB.
Dla słowa dwukrotnie dłuższego (16 bitów) odstęp wyniesie już 97,9 dB.
6.3 Filtracja cyfrowa
Bardzo istotnym problemem z dziedziny cyfrowego przetwarzania sygnałów jest ich filtracja w dziedzinie
częstotliwości.
Załóżmy, że mamy sygnał, na który składa się wiele składowych o różnych częstotliwościach. Załóżmy teraz, że
zależy nam na wytłumieniu składowych o danej częstotliwości. Użyjemy wówczas nitru zaporowego. W
przypadku, gdy z sygnału chcemy „wyłowić" częstotliwości leżące w pewnym zakresie, użyć musimy filtru
przepustowego.
137
SYGNAŁY / ICH PRZETWARZANIE
f i
Rys. 14 Charakterystyki filtrów dolna- i środkowoprzepustowego
Rysunek 14 przedstawia przykładowe charakterystyki często spotykanych typów filtrów. Kształt każdej
charakterystyki zależy od parametrów filtru: jego dobroci Q, częstotliwości granicznych i wzmocnienia.
Dobroć Q określa „stromość" charakterystyki.
Rys.15 Wpływ dobroci no kształt charakterystyki filtru
Większa dobroć oznacza, że wykres charakterystyki jest bardziej stromy - wzrost wzmocnienia przy
przekraczaniu częstotliwości granicznej jest szybszy.
Wzmocnienie określa stosunek amplitudy sygnału wejściowego do amplitudy sygnału wyjściowego w
zakresie częstotliwości objętych działaniem filtru:
k = AJA^.
lub w skali logarytmicznej
k = 20log(AJAJ IdBj
Najogólniejsza posiać równania opisującego działanie najprostszego filtru cyfrowego to równanie, w którym
po lewej stronie stoi y, (wartość i-tej próbki sygnału wyjściowego), a po prawej suma wymna-żanych przez
stałe wartości poprzednich próbek sygnału wyjściowego oraz sygnału wejściowego x,. Wartość stałych
wyznaczyć można stosując odpowiednie algorytmy.
ROZDZIAŁ 6
Dużym problemem filtracji cyfrowej jest czasochłonność obliczeń. Filracja realizowana w czasie
rzeczywistym wymaga bardzo dużych mocy obliczeniowych.
A oto tekst procedury filtrującej środkowoprzepustowo wskazany obszar pamięci. Procedura wymaga następujących
parametrów:
Fsamp:word częstotliwość próbkowania wyrażona w Hz,
Fsr:word częstotliwość środkowa filtru,
Wzmocn:real wzmocnienie (musi być większe od jedności),
Dobrocrreal dobroć filtru (większa od 0.707).
Bl:potnter wskaźnik na bufor z danymi do przefilirowania,
B2:potnler wskaźnik na bufor, gdzie procedura ma umieścić przefiltrowane dane,
Liword ilość bajtów ciągu przeznaczonego do filtracji.
procedurę Filtruj [Fsamp,Fsr:word:Wzmocn,Dobroc:real;B1,B2:pointer:L:word);
type
T8b=arrayEO..$FFFE] of byte;
var
X,Y,Z,A,B,C,D,E:rea!:
Licz:word;
3in
ifW2mocn<1 then exit; {to nie filtr zaporowy} ifDobroc<0.707then exit;
{wpierw obliczamy stałe filtracji A,B,C,D,E } X:=1/[sin[Pl
ł
Fs^/FsampVcos[PI
<
Fsp/Fsamp));
Y:=Wzmocn/Dobroc;
Z:=1/Dobroc;
A^DW+Y^+D/OW+Z^+D;
B^+S^WO^+Z^+I);
C^DW-Y^+W^+Z^+I];
D:=B;
E: ^^-Z^1 l/K^łZ^1 ];
{teraz możemy przyscąpić do filtrowania } for licz: =2 to L do
TBb(B2^Klicz]:=trunct
CTabtBmiicz-S]
+B
ł
Tab[B1
;^
)[^^cz-1]
+A
ł
Tab(B1"3[licz]
-ETabtBS^iicz-S]
-D^TabtBS^nicz-l]);
end;
139
SYGNAŁY f ICH PRZETWARZANIE
6*4 Analiza widmowa sygnału
Analiza widmowa to pojęcie odnoszące się do analizy amplitudy chwilowej lub mocy chwilowej
sygnału w dziedzinie częstotliwości. Podstawowym jej zagadnieniem jest wyznaczenie funkcji
gęstości widmowej mocy określającej, jaką energię niosą składowe sygnału o różnych
częstotliwościach. Metodami pozwalającymi na określenie rozkładu mocy sygnału w funkcji
częstotliwości jego składowych są między innymi bezpośrednia metoda szybkiego przekształcenia
Fouriera i filtracja cyfrowa.
Pierwsza metoda, w najogólniejszym zarysie, polega na zastosowaniu algorytmu FFT (szybkiej transformaty
Fouriera) w celu wyznaczenia kolejnych współczynników szeregu Fouriera określających udział kolejnych
harmonicznych w sygnale.
Metoda druga polega na poddaniu sygnału wejściowego filtracji z użyciem filtrów przepustowych o
sąsiadujących charakterystykach, a następnie podniesieniu do kwadratu i uśrednieniu pojawiających się na
ich wyjściach wartości w celu wyznaczenia mocy „przepuszczanej" przez każdy z nich składowej.
Jak wspomniałem, najczęściej interesuje nas moc poszczególnych składowych sygnału. Co oznaczać jednak
może moc w odniesieniu do ciągu dyskretnych próbek? Otóż przez pojęcie mocy sygnału rozumieć będziemy
wartość średnią kwadratu amplitudy. Dla 4 próbek x(l), x(2), x(3) i x(4) moc wyrazimy więc następująco:
P= (x(l) *x(I)+x(2) *x(2) +x(3) ^x(3) +x(4) *x(4))/4
Pojęcie estymaty odnosi się do gęstości mocy, to znaczy określa, jaka moc przenoszona jest przez sygnały o
częstotliwościach zawierających się w przedziale l Hz (dlatego wyrażamy ją np. w W/Hz - wat na hertz).
Jeżeli więc teraz wyobrazimy sobie np. filtr pasmowy o częstotliwości środkowej f, o szerokości pasma B, z
którego otrzymaliśmy n próbek, to estymatę wyznaczyć możemy ze wzoru:
G(f)=P(n)/B
Obliczanie estymat dla częstotliwości „wyławianych" przez kolejne filtry o różnych częstotliwościach
środkowych pozwala na wyznaczenie widma prążkowego mocy. W powyższym wzorze znak równości
należałoby w zasadzie zastąpić znakiem przybliżenia, a to z uwagi na to. że w praktyce nie zrealizujemy
filtru o nieskończenie wąskim paśmie, a ilość uśrednianych wartości jest ograniczona. W większości
zastosowań nie ma to jednak większego znaczenia.
ROZDZIAŁ 6
6.5 Rozpoznawanie mowy ludzkiej
Rozpoznawanie mowy to dziedzina, w jakiej bez cyfrowego przetwarzania sygnałów trudno byłoby mówić o
jakichkolwiek wymiernych osiągnięciach. Tymczasem wydaje się, że znalezienie prostych schematów
rozpoznawania dźwięków mowy ludzkiej przenieść nas może w zupełnie nową erę komunikacji między
człowiekiem a maszyną. O ile dźwięk jako medium jest już wykorzystywany przy przekazywaniu informacji
przez maszynę człowiekowi („mówiące" zegarki, całe mnóstwo udźwiękowionych programów), o tyle ciągle
Jeszcze trudno jest mówić o dwukierunkowej komunikacji. O tym, że zbliżamy się jednak do chwili, w której
nowoczesne programy obsługiwać będziemy wypowiadając polecenia do mikrofonu, świadczyć może pojawienie
się np. specjalnych aplikacji dla systemu Windows, które możemy „nauczyć" brzmienia prostych rozkazów
wydawanych naszym głosem. W tej części rozdziału postaram się przekazać w zarysie podstawowe informacje
związane z zagadnieniem rozpoznawania mowy.
Złożoność dźwięków mowy jest pochodną skomplikowania procesu jego artykulacji. Jego brzmienie zależy od
bardzo wielu czynników; własności osobniczych, intonacji, akcentu. Sygnał mowy niesie olbrzymią ilość
informacji - mózg ludzki potrzebuje zaledwie małej części, aby dokonać prawidłowego rozpoznania.
Zasadniczo biorąc najprostsza jest analiza sygnału w dziedzinie czasu - badamy wtedy jego amplitudę i szybkość
jej zmian. W odniesieniu do amplitudy stosujemy miarę logarytmiczną. Jest ona bardziej naturalna, ponieważ dla
dźwięków o małym natężeniu odczuwamy minimalną ich zmianę, a wrażliwość naszego narządu słuchu na
zmienność sygnału dźwiękowego spada wraz ze wzrostem jego natężenia.
Jeżeli w sygnale zawiera się wiele częstotliwości składowych (a tak jest w przypadku sygnałów mowy), warto
skupić się nad zmianami widma sygnału w funkcji czasu. Załóżmy więc, że mamy szereg wykresów widmowych
obrazujący zmiany widma w dziedzinie czasu. Naturalnie porównywanie „na oko" wykresów widma nie ma
większego sensu. Dlatego należy wyróżnić kilka jego podstawowych parametrów.
Pierwszym jest średnia ważona amplitudy składowych w widmie. Wielkość tę rozumieć można jako środek
ciężkości wykresu widmowego. W amatorskich zastosowaniach aproksymuje się go uśre-
141
SYGNAŁY / ICH PHZETWARZANfE
dnioną częstotliwością sygnału w danym przedziale czasowym. Jej oszacowanie Jest bardzo proste -
wystarczy zliczyć ilość przejść przez zero (PPZ) sygnału. I tak - załóżmy, że mamy zapis dźwięku o czasie
trwania 10 ms (0,01 sekundy). Dźwięk próbkowaliśmy z częstotliwością 10 kHz. Mamy więc 100 próbek
(10000*0,01=100). Jeżeli teraz wystąpienie przejścia przez zero notować będziemy wtedy, gdy z dwóch
„sąsiadujących" próbek jedna będzie miała wartość poniżej pewnej pewnej ustalonej wartości, druga -
powyżej (będą miały przeciwne znaki), przy wystąpieniu n przejść przez zero powiemy, że uśredniona
częstotliwość sygnału równa jest około n/ (2*0,01) [l/s=Hz], W praktyce możliwe jest przekonanie się, że
parametr liczby przejść przez zero w zupełności wystarcza Judzkiemu mózgowi do rozpoznania dźwięku.
Łatwo przeprowadzić odpowiednie doświadczenie - wystarc/y graniczyć zakres zmian amplitudy do dwóch
wartości - jedynym zachowanym parametrem tak „okaleczonego" sygnału będzie właśnie liczba PPZ.
Rysunek 16 przedstawia dwa sygnały - w pierwszym zmiany amplitudy są ciągłe, w drugim nie - jej wartości
zostały ograniczone do dwóch poziomów.
Sygna-f- wejściowy
Sygnał po ograniczeniu zakresu zmian amplitudy
RysJ6 Ograniczenie zakresu zmian amplitudy
Dalej przedstawiam teksty źródłowe dwóch programów. Pierwszy z nich (RAW2PPZ) na podstawie
zawartości wskazanego parame-
]42
ROZDZIAŁ 6
trem pliku tworzy drugi, ośmiokrotnie krótszy. Każdy bit kolejnego bajtu nowego pliku koduje nam informację,
czy wartość kolejnej próbki pobrana z pliku wejściowego przekracza pewną wartość, czy też nie. Program
drugi, na podstawie pliku „wyprodukowanego" przez RAW2PPZ tworzy plik opisujący kolejne próbki, z tym
jednak, że amplituda (przez utratę informacji na poprzednim etapie) może przyjąć już tylko dwa stany. Oba
programy traktować można jako kompresor i dekompresor danych dźwiękowych. Mimo że jedyną informacją
zachowywaną po takiej „kompresji" jest liczba PPZ, „rożkom presowany" dźwięk nadal rozpoznajemy! program
RAW2PPZ;
uses dos;
var
F:file;
Ce):flleofbyte;
D:dirstr;
N:namestr;
E;extst;r;
!le_8:lonsinC;
Buf:array[Q..71 ofbyte;
q,Bajt:byte;
begin
ifparamcounc=0t:hen
begin {gdy brak parametrów }
wriceInCUżycie; RAW2PPZ pliki [plik2n;
halt end;
fsplii;[paramstr[1],D,N,E);
assignCF.paramscriI));
{$'-} reset[R1];
{$i+} ifioresuitoOthen
begin
writeInfBłąd otwarcia pliku!'];
hale
end;
HeJ:=filesize(F)div8;
If paramcount=1 then
assign[Cel,n+'.PPZ') { rozszerzenie ,PPZ } else
ass!gn[Cel,paramstr(2]];
rewritetCeR;
SYGNAŁY / ICH PRZETWARZANIE
repeaC
blockread[FBuf[0].83;
Ba|t:=0;
forq:=7downto O do
if BufE7-q]> 127 then Bajt: =Ba)t or t1 shl q];
wriceCCel.Belt],
dect!le_B] uncii ile_8=0;
BajC:=0;
fillchBrt6uf[Q),8,Q); {wyzerowanie bufora} blockread[F,Buf,filesize(F] mód 8); {reszta } forq:=7downto0do
if Buft7-q]> 127 then Bajt: =Bajt or [1 shl q);
write(Cel,Baft);
close(F);
closetCel] { zamykamy i po wszystkim} end.
tekst drugiego programu:
program PPZ2RAW;
uses dos;
vsr
F:fileofbyte;
CBhftle;
D:dirstr;
N:namestr;
E:extstr;
Rozmiar: longint:
Buf:arr8y[0..7]ofbyte:
q.Bajt:byte;
begin
if paramcount:=0 then
begin {brak parametrów}
wnteInfUżycie: PPZ2RAW pliki [plik21');
halt end;
fsplittparamstr(1),a,N,E);
assigntF.paramstKD);
{Si-} resettF]; { próba otwarcia pliku }
{$i+} ifiaresultoOthen begin
wrIteInCBląd otwarcia pliku !'3;
halt
ROZDZIAŁ 6
end, rozmiar. =fi!esizs[R, if paramcount=1 chen
assign(Ce! N-'.RAW') { do pliku z rozszerzeniem RAW } else
assigntCel,parametry]);
re^nte[Cel,1]; { utworzenie }
repeat
read[F,BajC); { odczyt pojedynczego bajCu }
fillchar[Buf[Q],Q,0]; {wyzerowanie bufora }
forq:=7downto O do
ifBajtandCl shiq) oOthen Buf[7-q]:=12B;
blockwnte[Cel,Buf[0],8); { zapis 8-miu bajtów }
dectr-ozmiari untii Rozmiar=G;
close[F);
closeCCeD { zamykamy oba pliki i już }
end.
Za drugi ważny parametr uznać można szerokość widma, której zmiany w czasie także niosą informacje o przebiegu
procesu artykulacji.
Oprócz tego przy analizowaniu dźwięków mowy zwraca się uwagę na tzw. formanty. Co to? Załóżmy, że mamy
dany wykres widmowy jak na rysunku 17.
fl f2 f3 f
Rys J 7 Przykładowy wykres widmowy
Widzimy na nim trzy maksima. Częstotliwości, dla których je obserwujemy (fl,f2,f3), to właśnie formanty. Ich
położenie i wielkość ulegają zmianie w czasie i wiele mówią o procesie emisji dźwięków. W mowie wyróżnić
można kilka formantów. Każdego z nich poszukujemy w innym przedziale częstotliwości. Analiza formantów jest
dość wygodna, bo zmieniają one swoje położenie i wielkość dosyć wolno. Pewnych trudności nastręcza głównie ich
odnalezienie. Wyobraźmy sobie, że dysponujemy widmem prążkowym (otrzymanym np. w wyniku zastosowania
szybkiej transformaty Fouriera) jak na rysunku 18.
SYGNAŁY f ICH PRZETWARZANIE
145
RysJ 8 Widmo prążkowe
Mimo że na pierwszy rzut oka trudno jest odnaleźć częstotliwość, której udział w badanym sygnale jest
największy, można postarać się aproksymować przebieg krzywej widmowej i założyć np. że częstotliwość
formantu równa jest 0,5(fl+f2).
prawdopodobne położenie maksimum
Rys. 19 Aproksymacja przebiegu wykresu widmowego W procesie wykrywania formantów często stosuje się
sieci neuronowe.
Wydzielenie parametrów ściśle powiązanych z procesem artykulacji jest kluczowym problemem w dziedzinie
rozpoznawania mowy. Gdy je wyznaczymy, pozostaje nam przyrównywanie otrzymanych wielkości do tych,
jakie wyznaczyliśmy w procesie uczenia. Naturalnie nie jest to proste. Jeżeli jednak zbiór parametrów
opisujących dokonane nagranie potraktujemy jako pewien obiekt, to odnalezienie klasy, do której on należy,
jest Już problemem innej natury. Najogólniej rzecz biorąc, identyfikacji dokonuje się najczęściej przyjmując
istnienie pewnej „przestrzeni cech", w której każdy wymiar opisuje inny parametr. Każdej klasie obiektów,
które mają podlegać identyfikacji, przypisujemy pewną przestrzeń, której granice wyznaczane są przez
wartości każdej ze współrzędnych-parametrów. Obiekt należy do klasy, jeśli punkt w przestrzeni cech
wyznaczany przez jego parametry mieści się w „objętości" tej klasy. Jeżeli parametry ulegają zmianom w
dziedzinie czasu, to naturalnie dokładamy jeszcze współrzędną czasu i zamiast punktu otrzymujemy krzywą.
I tak na przykład, gdy dźwięk rozpoznajemy tylko na podstawie zmienności liczby przejść przez zero, to
mamy do czynienia z prze-
ROZDZIAŁ 6
strzenią dwuwymiarową (płaszczyzną). Każdy punkt na tej płaszczyźnie wyznaczają współrzędna czasu i
liczby przejść przez zero. Jeżeli rozpoznaniu ma np. podlegać cały wyraz, to każde kolejne nagranie
pozostawi na tej płaszczyźnie ślad w postaci krzywej niosącej informacje o zachowaniu liczby PPZ w
funkcji czasu. „Ślady" wielu nagrań dokonywanych w procesie uczenia wyznaczą na naszej płaszczyźnie
cech obszar. Jeżeli teraz dokonujemy nowego nagrania, to „nakładamy" otrzymaną krzywą na taki
„wzorzec" i podejmujemy decyzję - albo wypowiedziane słowo zaliczamy do klasy (krzywa zmieściła się w
obszarze), albo nie. Naturalnie takie podejście do problemu ma pewne wady. Może okazać się, że
obszar jest tak „pojemny" (podczas uczenia brało udział wiele osób wypowiadających słowo z różnym
akcentem i intonacją), że krzywa zmieści się we wzorcu, mimo że opisuje zupełnie inny obiekt. Cóż.
można więc na przykład badać tendencje krzywej (do wzrostu, do spadku) - konieczne jest wówczas
różniczkowanie przebiegu PPZ(t) w pewnych przedziałach czasu.
Istotnym problemem, o jakim nie wolno nam zapominać, jest także normalizacja dokonywanych nagrań. Mówiąc
prosto, chodzi o „wyrównywanie" nagrań przed ich analizą. Każdy z ludzi wypowiada to samo słowo inaczej. Dla
przykładu; imię „Kasia" może być przez jedną osobę wypowiedziane jako „Kaasia", przez drugą: „Kassiia". l nie
wystarczy tutaj zwykłe przeskalowanie w dziedzinie czasu -różne są bowiem także proporcje między czasem
wypowiadania kolejnych fonemów (elementarna część dźwięku mowy - jak litera w alfabecie).
FORMAT WAV
147
7, FORMAT WAV
Format WAV (Microsoft Waveform Audio File) to format zapisu danych dźwiękowych używany
przez programy pracujące pod kontrolą systemu Microsoft Windows. Myślę, że jego znajomość
może się przydać np. przy tworzeniu oprogramowania dźwiękowego mogącego współpracować z
aplikacjami Windows.
Pliki zapisywane w formacie WAV spełniają założenia struktury RIFF
(Resource Interchange File Format).
Podstawowym elementem pliku jest pakiet o następującej budowie:
• Identyfikator pakietu - czleroznakowy ciąg „RIFF"
• Ilość danych w pakiecie (dana 4-bajtowa)
Pakiet danych o długości specyfikowanej w poprzedzającej go
części
Pakiet RIFF składać się może z podstruktur różnych formatów i przechowujących różne typy danych. Nas
interesują tylko dane dźwiękowe. I lak, „podpakiet" formatu WAVE ma następującą strukturę:
• Identyfikator (4-znakowy ciąg „WAYE")
Pakiet formatu (przechowuje parametry dotyczące danych)
• Pakiet danych
HOZDZIAŁ 7
Na pakiet formatu składają się kolejno:
1. Identyfikator pakietu formatu (4-znakowy ciąg „fmt ")
2. 4-bajlowe słowo przechowujące długość dalszej części pakietu
3. 2 bajty przechowujące wartość odpowiadającą rodzajowi formatu
4. 16-bitowe słowo przechowujące ilość kanałów (dla dźwięku mono ma wartość l, dla stereo - 2)
5. Czterobajtowe słowo określające częstotliwość próbkowania w Hz użyta przy zapisie danych
6. Dana czterobajtowa charakteryzująca prędkość przepływu danych (wyrażoną w bajtach na sekundę). Wielkość
uwzględnia liczbę kanałów. Na przykład dla monofonicznego dźwięku sprób-kowanego 8-bitowo z częstotliwością
10 kHz wartość słowa równa jest 10000 [bajtów/sęk]
7. Wielkość (2-bajtowa) określająca wyrównanie danych w pakiecie danych (w bajtach). Dla próbkowania 8-
bitowego równa jest ilości kanałów
8. Dwa bajty przeznaczone na inne parametry Pakiet danych formatu WAVE ma postać:
1. Identyfikator (ciąg „data" 4-znakowy)
2. 4-bajtowe słowo określające długość pakietu danych (bez uwzględnienia pierwszych 8 bajtów - na identyfikator i
długość)
3. Wartości kolejnych próbek dźwiękowych Poniżej przedstawiam krótki programik, którego działanie polega na
wyświetlaniu parametrów wskazanego przy wywołaniu pliku zapisanego w formacie WAV:
program ShowWAY;
type
Header=record
RIFFId:array[1..4]ofchar;
CLen:longint;
WAVEId:arTay[1.,4]ofcnar;
FMTId:arr'8yt1..4] ofchar:
FMTLen:longint;
FMTTag:word;
Channels:word;
Fpeq;longint:;
Transmis;bngirt;
B/ces:vwrd;
FORMAT WAV
Bts.word:
DATAId,array[1,,4] of char, DATALen;longint
end:
var
f:file:
Bu^painter;
begm
if paramcountol then begm
wnteInfUzycie, ShowWAV plik'),
halt end, assign(f,paramstr[1)]:
1$!-}
reset(f,1); { próba otwarcia pliku } {$!+} ifioresultoOthen begin
wnteInCBtad otwarcia pliku !');
halt { nie udało się } end;
getmem[Buf,sizeof[Header)]; { pamięć} blockreadtf.Buf^sizeoftHeaderIJ; { odczyt} ctosetfl; { zamykamy plik} with
HeadertBuf) do begin
wnteh:
whCefPlik : ');
writeln[paramstr[1)3:
writeETyp ; '3;
ifChanne!s=1 then writelnt'MONO'1 elsewnteln['STEREO'l;
writeInfCzęstotiiwość: ',Freql;
writeInCHość bajtów : 'iDATALen);
writeln('-> Czas Es]: ',DATALen/frcq:5:2) end
end.
ROZDZIAŁ?
LITERATURA
]5]
LITERATURA
[l ] K.G. Beauchamp „Przetwarzanie sygnałów metodami analogowymi
i cyfrowymi", WNT, 1978
|2| N. Kilen „Z Turbo Pascalem w głąb systemu", LYNX-SFT, 1994 [3)
P. Norton „The New Peter Norton Programmer^s guide to the IBM
PC & PS/2", Microsoft Press, 1988 [4] A. Stolz „Le grand Iwre de
la Sound Blaster", Micro Application.
1992
[5] R. Tadeusiewicz „Sygnał mowy", WKŁ, 1988 [6] A. Wojtkiewicz
„Elementy syntezy Filtrów cyfrowych". WNT, 1984 [7] „Sound Blaster
Deueloper Kit", Creative Labs Inc.. 1990