1. Część teoretyczna
1.1. Przegląd technik syntezy dzwięku
Niniejszy rozdział zawiera omówienie technik syntezy dzwięku ułożonych
w porządku chronologicznym. Ze względu na dostępność danych, niektóre techniki
zostały podane według specyfikacji konkretnych producentów syntezatorów.
Szczególnie dokładnie omówiono technikę modelowania falowodowego, która jest
tematem pracy.
Istnieje kilka kryteriów podziału torów syntezy dzwięku. Na poniższym
diagramie (Rys.2.1) usystematyzowano techniki syntezy według klasyfikacji
algorytmów prof. Czyżewskiego [6].
Techniki syntezy dzwięku
Przetwarzanie Metody Algorytmy Modelowanie Algorytmy
zapisu widmowe abstrakcyjne fizyczne genetyczne
Modelowanie
Synteza FM
matematyczne
Przekształca-nie
Modelowanie
Sampling Synteza addytywna Techniki w fazie
fali
falowodowe
Synteza tablicowa Synteza rozwoju
(waveshaping)
Metoda
(wavetable) subtraktywna
Metody oparte o
komórkowa
chaos determini-
styczny
Algorytmy hybrydowe
Rys. 2.1. Klasyfikacja technik syntezy dzwięku
Ponieważ klasyfikacja ta nie uwzględnia najnowszych osiągnięć w tej dziedzinie,
zdecydowano się ją uzupełnić o kategorię algorytmów genetycznych. Dodano również
metakategorię obejmującą algorytmy hybrydowe łączące elementy wszystkich
pozostałych. Uzupełnienia oznaczono na czerwono.
Analizując uważnie powyższy diagram można stwierdzić, że nie figurują tam
techniki występujące w ofercie producentów sprzętu, takie jak AWM (Advanced
Wavetable Memory) czy VA (Virtual Acoustic) u Yamahy, LA (Linear Arithmetic)
u Rolanda czy AI2 u Korga. Wyjaśnienie jest proste, wspomniane określenia są znakami
handlowymi (ang. trade mark, "!) opisującymi konkretny tor syntezy zastosowany
w danym produkcie, którego konstrukcja algorytmiczna jest logicznie tożsama
z odpowiednikiem u konkurencji. Dla przykładu, wykorzystując powyższe określenia
można stwierdzić, że w założeniach algorytmy AWM i LA są równoważne, ponieważ
oba są w istocie hybrydowymi torami syntezy dzwięku łączącymi metodę tablicową
oraz elementy metody addytywnej i FM.
W pozycji [6] podana powyżej klasyfikacja określona jest mianem kryterium
związane z algorytmem . Obok tego występują jeszcze dwa kryteria podziału: polifonii
(ang. polyphony) i wielobrzmieniowości (ang. multi-timbral). Zdaniem autora, obu tych
kryteriów nie można użyć jako wyznaczników rodzajów syntezy, ponieważ każdy tor
syntezy dzwięku jest homofoniczny i jednobrzmieniowy. Dopiero syntezator (syntezer,
syntetyzer), czyli urządzenie wykorzystujące określoną metodę syntezy w procesie
wytwarzania dzwięku może być polifoniczne i wielobrzmieniowe, ale własności te będą
wynikały wyłącznie z parametrów elektronicznych urządzenia (ilości generatorów
i interfejsu MIDI).
2
1.1.1.Synteza addytywna
Jest to historycznie jedna z najstarszych metod syntezy dzwięku. W swej idei
opiera się na twierdzeniu Fouriera mówiącym, że każdy sygnał złożony możne być
przedstawiony za pomocą elementarnych przebiegów sinusoidalnych. Algorytm składa
się zasadniczo z dwóch części. Najpierw dzwięki naturalnych instrumentów poddawane
są analizie widmowej, a następnie na bazie uzyskanych w ten sposób informacji
przeprowadzany jest proces resyntezy. Odbywa się to poprzez budowanie widma
dzwięku wyjściowego (czyli poszczególnych jego składowych) z podstawowych
przebiegów sinusoidalnych, z których każdy może być modulowany amplitudowo
i fazowo. Można zatem łatwo wywnioskować, że podstawowy blok syntezatora
addytywnego zbudowany jest z zespołu generatorów sinusoidalnych wraz
z modulatorami amplitudy (wzmacniaczami) i fazy (przesuwnikami fazowymi) oraz
z sumatora (Rys. 2.2.).
Generator G1
u1(t)
A1
Ś1
f1 Ć1 a1
Generator G2
u2(t)
A2
Ś2
Wyjście
Ł
f2 Ć2 a2
Generator Gn
un(t)
An
Śn
fn Ćn an
Rys.2.2. Schemat syntezy addytywnej
Zostały opracowane trzy główne metody syntezy addytywnej, które przedstawiono
poniżej.
3
1.1.1.1.Metoda wokodera fazowego (Phase Vocoder, PV)
Metoda ta opiera się na założeniu, że sygnał poddawany analizie a pózniej
resyntezie jest sygnałem okresowym. W procesie analizy dokonuje się ekstrakcji
składowych widmowych oraz obliczania częstotliwości poszczególnych harmonicznych
z użyciem metody dopasowania długości okna analizy do okresu analizowanego
sygnału (stąd metoda ta bywa czasem nazywana metodą strojonego okna czasowego ).
Następnie na bazie uzyskanych danych przeprowadza się resyntezę. Sygnał wyjściowy
opisuje wzór:
M
x(n) = Ak (n) " sin{nT[k + 2Ą Fk (n)]}
(2.1)
" 1
k = 1
gdzie: x(n) sygnał syntetyczny w chwili nT
T okres próbkowania
A (n) wartość amplitudy n-tej próbki k-tej składowej
k
pojawiającej się z okresem T
2ĄnTF (n) nieliniowa poprawka fazy
k
M liczba składowych
1 pulsacja składowej podstawowej
Można powiedzieć, że sposób analizy dzwięku w tej metodzie odpowiada sposobowi
działania M filtrów pasmowo przepustowych równolegle połączonych, z których każdy
= k "
nastrojony jest na częstotliwość , gdzie k=1,2,3...M.
k 1
Metoda PV posiada dwie zasadnicze wady:
1) nie umożliwia syntezy dzwięków nieharmonicznych
2) wymaga znajomości częstotliwości podstawowej analizowanego dzwięku.
4
1.1.1.2.Metoda McAulay a-Quatieri ego (MQ)
Metoda działa w oparciu o wyszukiwanie i interpolację lokalnych maksimów
widma ewolucyjnego. W procesie analizy wykorzystuje się szybką transformatę
Fouriera (FFT). Otrzymane w ten sposób widma chwilowe poddaje się procesowi
wyszukiwania lokalnych maksimów. Uzyskane w ten sposób dane są podstawą do
procesu resyntezy.
W metodzie MQ, w odróżnieniu od metody PV nie ma konieczności
dopasowania długości okna analizy do długości okresu sygnału. Również częstotliwości
odpowiadające maksimom lokalnym nie muszą spełniać warunku harmoniczności
= k "
co skutkuje możliwością syntezy dzwięków nieharmonicznych. Fakty te
k 1
stanowią o szerszym zakresie stosowalności metody MQ.
5
1.1.1.3.Metoda tablicowa (wavetable synthesis)
Metoda ta powstała w wyniku badań nad redukcją ilości obliczeń niezbędnych
do wygenerowania dzwięku w procesie syntezy addytywnej w swej zasadniczej postaci.
Istotna różnica polega na tym, że w klasycznej syntezie addytywnej dzwięk powstaje w
wyniku sumowania składowych sinusoidalnych w proporcjach określonych przez
chwilowe widma dzwięku analizowanego, natomiast w przypadku metody tablicowej te
chwilowe widma są próbkowane i zapisywane w pamięci. Można zatem powiedzieć, że
metoda tablicowa wykorzystuje zestaw tablic fal rozłożonych w czasie, z których każda
opisuje chwilowe widmo sygnału [10].
f1
W2(t) WN(t)
W1(t)
x(t)
Rys.2.3. Schemat blokowy syntezy tablicowej.
Powyższy schemat (Rys.2.3) obrazuje istotę algorytmu syntezy tablicowej. Jak widać,
zamiast zestawu generatorów mamy do dyspozycji tablice pamięci, w których
komórkach zgromadzone są obrazy poszczególnych składowych widma dzwięku
oryginalnego. Złożenie dzwięku wynikowego odbywać się może na dwa sposoby:
6
1) sygnały z N tablic sumowane są ze zmiennymi w czasie wagami W(t)
(wavetable matching)
2) sygnał wyjściowy obliczany jest w drodze interpolacji sygnałów z dwu
sąsiadujących ze sobą tablic (wavetable interpolation)
Metoda tablicowa, ze względu na wysoką efektywność, znalazła szerokie zastosowanie
praktyczne. Jedna z aplikacji została omówiona w następnym rozdziale.
7
1.1.1.4.Przykłady zastosowań praktycznych
Jakkolwiek synteza addytywna opisana w poprzednich rozdziałach nie jest
w swej czystej formie stosowana ze względu na efektywność i wymagania sprzętowe
(patrz rozdział o efektywności), to jej elementy były wykorzystane w pierwszych
syntezatorach analogowych i bywają używane we współczesnych syntezatorach
cyfrowych. Dlatego też zdecydowano się przybliżyć strukturę typowego syntezatora
analogowego oraz cyfrowego.
Syntezator analogowy (Rys.2.4) zbudowany jest z czterech głównych bloków:
1) zródeł dzwięku
2) układów kształtujących barwę dzwięku
3) układów kształtujących strukturę sygnału
4) układów sterujących
KSZTAATOWANIE KSZTAATOWANIE
yRÓDAA SYGNAAÓW
T
BARWY DyWIKU STRUKTURY DyWIKU
O
yródła
R
zewnętrzne
Y
Filtry
SYGNAA
stałe
S AUDIO
Generator Wzmacniacz
Y
G
szumu sterowany VCA
N
Filtry
A
A
Generator
regulowane VCF
Ó
VCO
W
Wysokość tonu, Regulacja Regulacja
STERO
WANIE
harmoniczne pasma wzmocnienia
Regulacja ręczna skokowa i ciągła
yRÓDAA NAPIĆ STERUJCYCH
Regulatory
Klawiatura Generator Generator
napięciowa Pedały modulujący LFO obwiedni
ręczne
Rys.2.4. Schemat funkcyjny syntezatora analogowego
Standardowymi zródłami dzwięku są:
generatory przebiegów zmiennych VCO sterowane napięciowo (Voltage
Controlled Oscillator) generujące podstawowe przebiegi zmienne : sinusoidę, piłę i
prostokąt
8
generatory szumu o określonym widmie
Układami kształtującymi barwę dzwięku są:
zespół filtrów stałych, dolno- i górnoprzepustowych
filtry przestrajane napięciem VCF (Voltage Controlled Filter) -
pasmowoprzepustowe o częstotliwości środkowej regulowanej napięciem służące
do kształtowania widma wytwarzanych przebiegów;
Układy kształtujące strukturę sygnału to zespół wzmacniaczy o wzmocnieniu
regulowanym napięciem VCA (Voltage Controlled Amplifier) umożliwiające zmianę
amplitudy sygnału i służące do kształtowania struktury czasowej (obwiedni) sygnału.
Kształt obwiedni ustala się za pomocą generatora obwiedni ADSR (Attack, Decay,
Sustain, Release) umożliwiającego regulację czasów: narastania , opadania , trwania
i wybrzmiewania dzwięku w zakresie od kilku do kilkudziesięciu milisekund (Rys.2.5).
Realizowane jest to poprzez nałożenie zmiennej w czasie krzywej na przebieg sygnału
akustycznego.
L [dB]
Attack Decay
Sustain
Release
Moment naciśnięcia
Moment zwolnienia
T [ms]
klawisza (key off)
klawisza (key on)
Rys.2.5. Ilustracja obwiedni dzwięku.
Ostatnim blokiem syntezatora analogowego jest blok układów sterujących pracą
wszystkich pozostałych. Chodzi tu przede wszystkim o klawiaturę napięciową, czyli
o analogiczną do fortepianowej klawiaturę sterującą generatorami VCO poprzez zmianę
napięcia sterującego i zarazem zmianę częstotliwości generowanego tonu. Ma ona
zazwyczaj zakres od 2 do 7 oktaw, w zależności od producenta i modelu. Dodatkowo
do dyspozycji użytkownika jest zespół potencjometrów i przełączników służących do
zmiany określonych parametrów - czasów generatora obwiedni, częstotliwości odcięcia
filtrów itp. Zazwyczaj w syntezatorach analogowych występuje generator LFO (Low
9
Frequency Oscillator) - generator przebiegów wolnozmiennych, wytwarzający dwa
rodzaje przebiegów - piłę i sinusoidę, o różnym współczynniku wypełnienia.
Generatorem tym można modulować pracę określonych bloków syntezatora.
Dodatkowo syntezator może być wyposażony w zespół efektów typu pogłos, delay itp.
Syntezatory wielogłosowe (polifoniczne) zawierały mikrokomputer sterujący pracą
syntezatora poprzez kontrolowanie stanu klawiatury, położenia regulatorów i
przełączników i na tej podstawie wysyłanie odpowiednich napięć sterujących
poszczególnymi blokami syntezatora. Zastosowanie mikrokomputera z pamięcią
umożliwiało przechowywanie ustawień regulatorów syntezatora, a co za tym idzie,
określonych brzmień. Przykładowymi syntezatorami analogowymi są wczesne
produkcje firmy MOOG, OBERHEIM, ARP, SEQUENTIAL CIRCUITS, KORG
PS3100, ROLAND J106
Przykładem cyfrowej realizacji syntezy addytywnej jest technologia AWM2
(Advanced Wave Memory) opracowana przez firmę Yamaha. Schemat (Rys.2.6)
przedstawia strukturę instrumentu klasy workstation o symbolu W5/W7.
Poziom głośności
PAN
brzmienia
Generator Filtr Wzmacniacz
PAN
MIX
Efekt INSERTION
PEG FEG AEG
PAN
Poziom sygnału dla
Strojenie f odcięcia filtru
PAN efektu SYSTEM
Transpozycja f rezonansu na Poziom
PMD FMD AMD
n
Sterowanie
C
siłą uderzenia
B
LFO
Sterowniki
A
Rys.2.6 Struktura syntezatora AWM2
Objaśnienie skrótów:
PEG Pitch Evenlope Generator generator obwiedni wysokości dzwięku
PMD Pitch Modulation modulacja wysokości dzwięku
FEG Filter Evenlope Generator generator obwiedni filtru
FMD Filter Modulation modulacja parametrów filtru
AEG Amplification Evenlope Generator generator obwiedni wzmacniacza
AMD Amplification Modulation modulacja parametrów wzmocnienia
10
Zastosowano tutaj koncepcję syntezy tablicowej. Bazuje ona na wysokiej jakości
próbkach (w przypadku AWM2 jest to 16bit/48kHz), przechowywanych w pamięci
ROM, z których poprzez odpowiednie przetwarzanie budowane są elementy składowe
dzwięku wyjściowego, tzw. waveforms (na rysunku A, B, C - n). W instrumentach
W5/W7 brzmienie składa się maksymalnie z czterech warstw (waveforms). Każda
warstwa składa się z trzech bloków:
a) generatora
b) filtru
c) wzmacniacza
W bloku generatora dokonują się wszystkie operacje dotyczące wysokości
dzwięku, przy czym należy zauważyć, że interpretacja wysokości poprzez numer
uderzonego klawisza jest tu najprostszą operacją. Oznacza to, że częstotliwość
generowanego dzwięku może się zmieniać również po uderzeniu klawisza. Sterowanie
odbywa się głównie za pomocą komunikatów MIDI poprzez:
siłę uderzenia w klawisz (Velocity)
funkcję docisku klawisza (Aftertouch)
pokrętło PitchBend
generator wolnych przebiegów (LFO) wywołujący efekt vibrato, przy czym
wielkość efektu może być również sterowana komunikatem MIDI.
W bloku filtru dokonywane są zmiany barwy dzwięku poprzez korekcję wybranych
częstotliwości. Za sposób filtracji odpowiada generator obwiedni czasowej filtru (FEG).
Modulację w czasie parametrów filtru można uzyskać poprzez sterowanie generatorem
LFO. Oba generatory mogą być bezpośrednio sterowane komunikatami MIDI.
W bloku wzmacniacza dokonywane są operacje dotyczące głośności brzmienia.
Występuje tutaj również generator obwiedni, tym razem wzmocnienia (AEG).
Modulację w czasie parametrów wzmocnienia można uzyskać, jak poprzednio, za
pomocą generatora wolnozmiennego LFO. Również i w tym bloku możliwe jest
bezpośrednie sterowanie za pomocą komunikatów MIDI.
11
1.1.2.Synteza subtraktywna
W przeciwieństwie do syntezy addytywnej, synteza subtraktywna (jak sugeruje
nazwa) polega na odejmowaniu od siebie sygnałów celem otrzymania żądanego
dzwięku. Sygnałem zródłowym musi więc być dzwięk o bogatym widmie, jak na
przykład szum. Brzmienie wyjściowe otrzymuje się poprzez poddanie wymuszenia
(sygnału wejściowego) odpowiedniej filtracji. Proces filtracji można opisać
następującym równaniem różnicowym [6] :
p q
x(n) = - ak x(n - k) + G bru(n - r)
" "
(2.2)
= 1 = 0
1k44244 1r4 3
3 4244
AR MA
gdzie: a i b - współczynniki filtru,
k r
u(n) - wymuszenie,
x(n) - n-ta próbka sygnału syntetycznego
G - wzmocnienie filtru
Równanie (2.2) określa model ARMA (AR autoregresja, MA ruchoma średnia, ang.
moving average) znajdujący szerokie zastosowanie w cyfrowym przetwarzaniu
dzwięku. Model ARMA należy do rodziny metod filtracyjnych wykorzystujących
predykcję liniową [16], [6].
Syntezator subtraktywny (Rys.2.7) składa się zazwyczaj z czterech głównych
bloków:
1) wymuszenia
2) miksera
3) filtru
4) wzmacniacza
12
LFO
Generator 1
Wzmac-
Wymuszenie
Filtr
Syntezator subtraktywny
niacz
Generator 2
Mikser
Generator
szumu
EG EG
LFO
Sterowanie (klawiatura)
Rys.2.7 Syntezator subtraktywny
Blok wymuszenia zbudowany jest najczęściej z dwóch generatorów
generujących podstawowe przebiegi (sinus, trójkąt, piła, prostokąt) oraz z generatora
szumu szerokopasmowego. Generatorami przebiegów zmiennych są, w zależności od
konstrukcji, generatory VCO w syntezatorach analogowych, lub generatory DCO
(Digitally Controlled Oscillator generator obejmujący tablicę liczb będących
reprezentacją spróbkowanego pojedynczego okresu sygnału zmiennego) w układach
hybrydowych analogowo-cyfrowych lub w układach wyłącznie cyfrowych. Do
generowania sygnału szerokopasmowego stosowane są generatory szumu białego lub
różowego. Celem uzyskania dodatkowych efektów (np. vibrato) stosuje się modulację
generatorów wolnymi przebiegami okresowymi z generatorów LFO.
Blok miksera, gdzie w odpowiednich proporcjach mieszane są sygnały
z generatorów, jest drogą pośrednią do najważniejszego z punktu widzenia zasady
syntezy elementu, a mianowicie bloku filtracji. Najczęściej jest on zbudowany z filtru
dolnoprzepustowego o określonych parametrach (częstotliwość odcięcia, rezonans,
nachylenie zbocza) które mogą być regulowane za pomocą generatora obwiedni..
Ostatnim elementem jest blok wzmacniacza nadający sygnałowi odpowiednią
charakterystykę amplitudową. Najczęściej jest to wzmacniacz VCA (lub DCA
w układach cyfrowych) sterowany generatorem obwiedni (EG).
13
1.1.3.Synteza FM
W 1973 roku John Chowning stwierdził, że charakter czasowych zmian
składowych widma ma decydujące znaczenie dla określania barwy dzwięku . Odkrył
on, że, powszechnie już wówczas znany i stosowany m.in. w radiokomunikacji, proces
modulacji częstotliwości nadaje się również do syntezowania dzwięków instrumentów
muzycznych [10]. Wprawdzie algorytm syntezy FM w żadnym stopniu nie
odzwierciedla ani fizycznych właściwości instrumentu, ani procesów zachodzących
w trakcie powstawania fali akustycznej, daje jednak zadowalające rezultaty dla
określonych kategorii instrumentów.
W najprostszym przypadku sygnał syntetyczny generowany jest według wzoru
(2.3):
x(n) = A(n)sin{2Ą fcnT + I(n)sin(2Ą fmnT )}
(2.3)
gdzie: A(n) - amplituda sygnału
I(n) - wskaznik modulacji równy stosunkowi dewiacji częstotliwości
nośnej do modulującej
f - częstotliwość nośna
c
f - częstotliwość modulująca
m
T - okres próbkowania
Z punktu widzenia syntezy dzwięku wykorzystywana jest tutaj pewna właściwość
modulacji częstotliwościowej dwóch sygnałów sinusoidalnych o częstotliwościach
z zakresu pasma akustycznego. Właściwość ta polega na tym, że szerokość widma
zmodulowanego sygnału zależy od wartości wskaznika modulacji. Istotne jest przy
tym, że przy zmiennej w czasie wartości wskaznika modulacji układ częstotliwości,
czyli wysokość dzwięku pozostaje bez zmian. Można zatem manipulować barwą
dzwięku za pomocą jednego tylko parametru.
Rozwijając wzór (2.3) widmo dzwięku generowanego metodą FM można przedstawić
za pomocą formuły (2.4):
14
"
(2.4)
x(n) = A{J0 (I)sin( nT ) + J (I)[sin( + )nT + (- 1)k sin( - )nT ]
c " k c m c m
k = 1
gdzie: , - pulsacje odpowiednio częstotliwości nośnej i modulującej
c m
J (I) - funkcje Bessela k-tego rzędu
k
Jak łatwo zauważyć, dla wartości I=0 mamy czystą sinusoidę. Jednak wraz ze wzrostem
wartości wskaznika modulacji I pojawiają się kolejne k-te składowe szeregu
występującego we wzorze (2.4), co skutkuje pojawianiem się kolejnych prążków
bocznych po obu stronach prążka głównego częstotliwości nośnej w odstępach równych
częstotliwości modulującej. Amplitudy tych kolejnych składowych widma
determinowane są przez funkcje Bessela k-tego rzędu. Według Janeczki [10] można
przyjąć, że liczba istotnych składowych widma sygnału syntezowanego metodą FM
wynosi K H" I + 1.Dodatkowo występuje zjawisko przejmowania energii prążka
głównego przez prążki boczne. Przedstawia to rysunek (Rys.2.8).
m m m
A
c
A
f
c-m c+m
c
A
f
A
f
A
f
f
Rys.2.8 Zmiany szerokości widma w syntezie FM
15
Jak zatem wynika z powyższych rozważań, gdy zarówno częstotliwość nośna
jak i modulująca leżą w paśmie akustycznym, możliwe jest wygenerowanie szerokiej
gamy różnorodnych dzwięków.
W rozwiązaniach sprzętowych syntezatorów FM ukształtowało się pojęcie
operatora, który stał się podstawowym elementem konstrukcyjnym urządzeń tego typu.
Pojedynczy operator zbudowany jest z następujących podzespołów:
1) generatora
2) wzmacniacza
3) generatora obwiedni (EG)
W najprostszym przypadku (Rys.2.9) syntezator FM składa się z dwóch operatorów,
z których jeden pełni funkcję generatora nośnej, a drugi jest modulatorem.
Generator nośnej
Modulato
r
W W
WE f WE f
~ ~
Y Y
WE WE
WE EG WE EG
FM FM
Rys.2.9 Schemat syntezatora FM w konfiguracji dwuoperatorowej.
W tym najprostszym przypadku otrzymać można jedynie prosty zmodulowany
przebieg. Zwielokrotniając liczbę operatorów uzyskujemy ogromną liczbę możliwych
kombinacji modulator-generator nośnej, a co za tym idzie bogatego widma dzwięku
wynikowego.
W praktyce idea syntezy FM była wielokrotnie modyfikowana.
Eksperymentowano głównie z ilością operatorów i sposobami ich wzajemnego łączenia.
Nie sposób pominąć w tym momencie faktu, iż odniosła ona niewątpliwy sukces
komercyjny za sprawą legendarnego już syntezatora Yamaha DX-7. Zastosowano tu aż
sześć niezależnych operatorów, które można było dowolnie łączyć ze sobą.
16
Zasadniczą wadą modulacji FM jest to, że w jej wyniku otrzymuje się sygnał
o składowych harmonicznych i widmie symetrycznym, podczas, gdy większość
dzwięków naturalnych ma widmo niesymetryczne zawierające składowe
nieharmoniczne. Dodatkowo widma otrzymywane na drodze syntezy FM są
nieograniczone, co przy operacjach wykonywanych w domenie cyfrowej stwarza to
ryzyko powstania zjawiska aliasingu. Problemy te częściowo rozwiązała powstała
pózniej metoda dyskretnych wzorów sumacyjnych. Zastosowano tu wzory
wyprowadzone ze skończonych lub też nieskończonych sum szeregów
trygonometrycznych co pozwalało na generację m.in. sygnałów o widmach
niesymetrycznych i nieharmonicznych. Przykładem jest wzór (2.5):
N + 1
N
siną - a sin(ą - ) - a [sin(ą + (N + 1) ) - a sin(ą + N )]
ak sin(ą + k ) =
(2.5.)
"
1+ a2 - 2a cos
k = 0
gdzie: ą = t
c
= t
m
a stosunek amplitud składowej n+1-szej do n-tej
N liczba składowych w widmie
Zastosowanie tej metody pociągnęło za sobą kilka problemów. Wprawdzie do
dyspozycji postawiona została dowolnie dobierana liczba dowolnych składowych, lecz
stało się to kosztem zwiększonej wymaganej zdolności obliczeniowej. Kolejnym
negatywnym aspektem jest konieczność korekty amplitudy przy generacji widm
dynamicznych ze względu na jej zależność od parametru a. Problem ten można jednak
skorygować przez wprowadzenie wartości stablicowanych.
17
1.1.4.Kształtowanie fali (waveshaping)
Ten rodzaj syntezy dzwięku należy także do klasy algorytmów abstrakcyjnych.
Koncepcja ta opiera się na nieliniowym kształtowaniu sygnału i ma zastosowanie w
syntezie dzwięków instrumentów muzycznych w stanie quasi-stacjonarnym.
yródłem sygnału jest generator wytwarzający sygnał opisany funkcją (2.6):
x(t) = cos( t)
(2.6)
Dla wartości chwilowej sygnału x(t) oblicza się wartość pewnej funkcji (2.7):
y = f(x) (2.7)
Funkcję tą określa się mianem funkcji kształtującej (ang. shaping function), ponieważ
wpływa ona bezpośrednio na kształt generowanego przebiegu określonego wzorem
(2.6). Jak wiadomo, dzwięki występujące w naturze charakteryzują się tym, że ich
widmo jest dynamiczne, zmienia się w czasie. Matematycznym odzwierciedleniem tego
faktu będzie uzupełnienie wzoru (2.7) o zmienny w czasie współczynnik
proporcjonalności a:
y = f(ax) (2.8)
Wynikowy sygnał można zatem zapisać w postaci formuły (2.9):
y(t) = f (a cos( t))
(2.9)
Jak można wywnioskować, proces syntezy składa się z dwóch etapów:
1) obliczenia funkcji kształtującej
2) obliczenia sygnału wyjściowego
Funkcję kształtującą wyznacza się wykorzystując dane o proporcjach pomiędzy
poszczególnymi składowymi widma zebranymi w procesie analizy. W obliczeniach
samej wartości funkcji wykorzystuje się wielomiany Czebyszewa określone
następująco:
18
T0 (x) = 0
T1(x) = x
T2 (x) = 2x2 - 1
(2.10)
T3(x) = 4x3 - 3x
T4 (x) = 8x4 - 8x2 + 1
Tn (x) = 2xTn- 1(x) - Tn- 2 (x)
Okazuje się, że wielomiany te mają bardzo użyteczną własność (2.11):
T [cos(t)] = cos(nt) (2.11)
n
Z powyższej zależności wynika, że jeżeli funkcja kształtująca będzie tożsama
z wielomianem Czebyszewa I rzędu, to na wyjściu otrzymamy jedynie pierwszą
harmoniczną o amplitudzie jednostkowej. Jeżeli funkcja kształtująca będzie
wielomianem II rzędu to otrzyma się drugą harmoniczną również o amplitudzie
jednostkowej, itd. Jak widać, uzyskanie dzwięku o żądanym widmie złożonym z n
składowych wymaga wykonania n operacji kombinacji liniowych wielomianów
Czebyszewa.
Synteza metodą kształtowania fali jest bardzo wydajna i mało wymagająca
obliczeniowo. Ma jednak dwie zasadnicze wady, który poważnie ograniczają jej
stosowalność. Po pierwsze, nie umożliwia bezpośredniej syntezy składowych
nieharmonicznych, co można wywnioskować ze struktury obliczeń. A, jak już
wspomniano powyżej, widmo dzwięków naturalnych zawiera składowe nieharmoniczne
i podharmoniczne. Po drugie, nie jest również możliwe syntezowanie stanów
nieustalonych dzwięku, co wyklucza generację brzmień określonych grup, np.
instrumentów dętych.
19
1.1.5.Metody oparte o chaos deterministyczny
Na pierwszy rzut oka wydawać się może, że zjawisko chaosu ma niewiele
wspólnego z syntezą dzwięków. Okazuje się jednak, że jest wręcz przeciwnie.
W wyniku licznych prowadzonych eksperymentów wykazano, że zjawiska chaosu
doskonale nadają się do generacji dzwięków niemuzycznych, takich jak np. szum
wiatru. Z punktu widzenia niniejszej pracy można by także wykorzystać tą własność do
zamodelowania turbulentnego przepływu powietrza w instrumentach dętych.
Generatory chaotyczne dają dobre efekty również przy syntezie dzwięków
instrumentów strunowych. Wymagają jednak stosunkowo dużej mocy obliczeniowej, co
stawia pod znakiem zapytania praktyczny aspekt ich zastosowania. Przykładem takiego
systemu jest jeden z najprostszych, a zarazem najlepiej zbadanych układ Chua [10].
Schemat generatora Chua przedstawiony jest na rysunku poniżej (Rys.2.10.).
Zbudowany jest on z liniowej indukcyjności L połączonej szeregowo z rezystorem R ,
0
liniowego rezystora R, dwóch kondensatorów C i C oraz nieliniowego rezystora
1 2
sterowanego napięciem N zwanego diodą Chua.
R
v2 v1
R = 1/G
R0
C2 C1
NR
L
i3
Rys.2.10. Schemat układu Chua
Układ opisują następujące równania stanu:
dv1 1
= [G(v2 - v1) - f (v1)]
(2.12)
dt C1
dv2 1
= [G(v1 - v2 ) + i3]
(2.13)
dt C2
20
di3 1
= (v2 + R0i3) (2.14)
dt L
W zależności od doboru wartości poszczególnych elementów układ generuje szerokie
spektrum przebiegów o charakterze stochastycznym bądz okresowym.
Układ Chua posiada następujące właściwości:
a) łatwość sterowania sygnałem odbywa się ono za pomocą parametrów
elektrycznych elementów obwodu, jednak związek tych parametrów z cechami
dzwięku jest bardzo złożony
b) łatwość sterowania obwiednią sygnału układ Chua może generować sygnały
o złożonej obwiedni, jednak jest to ograniczone do pewnych zakresów
parametrów
c) możliwość otrzymywania złożonych widm należy jednak zaznaczyć, że
praktycznie niemożliwe jest uzyskanie z góry założonych widm
Jak zatem widać, stosowalność tego typu rozwiązań jest na razie ograniczona i wymaga
dalszych badań.
21
1.1.6.Modelowanie fizyczne
Synteza modelowania fizycznego stanowi odzwierciedlenie zupełnie innej
koncepcji syntezy dzwięku. U podstaw jej istoty leżą nie własności widma sygnału lecz
właściwości fizyczne instrumentu, a ściślej rzecz ujmując, procesy fizyczne zachodzące
w instrumencie przy powstawaniu i przez cały czas generacji dzwięku. Takie podejście
pozwala, przynajmniej teoretycznie, uzyskać pełną kontrolę nad dzwiękiem. Pozwala
również na tworzenie wirtualnych instrumentów, które w rzeczywistości byłyby trudne,
lub wręcz niemożliwe do wykonania, np. korpus instrumentu strunowego pobudzany
podwójnym stroikiem instrumentu dętego.
W obrębie syntezy modelowania fizycznego wyróżnia się, ze względu na sposób
konstruowania modelu, trzy metody:
1) komórkowa
2) matematyczna
3) falowodowa
Jakkolwiek wszystkie trzy były tematem badań, to jedynie metoda falowodowa znalazła
bardzo szerokie zastosowanie praktyczne, głównie za sprawą stosunkowo niskiej
złożoności obliczeniowej odniesionej do rewelacyjnych efektów brzmieniowych.
1.1.6.1.Synteza komórkowa (cellular sound synthesis)
Zarówno w literaturze, jak i w Internecie informacje na temat tej metody są
bardzo skąpe. Metoda polega na tym, że obiekt drgający, będący zródłem dzwięku
modeluje się w postaci elementarnych cząstek masy, tzw. komórek. Każda komórka
powiązana jest z sąsiednią przy pomocy wiązań sprężystych. Do obliczeń stosowana
jest, szeroko stosowana w projektowaniu urządzeń głośnikowych, metoda elementów
skończonych (FEM). Pobudzenie do drgań jednej z komórek wywołuje w ośrodku falę
będącą zródłem dzwięku syntetycznego. Zasadniczą zaletą jest możliwość
zamodelowania dowolnego kształtu zbudowanego z dowolnego materiału. Niestety
wymaga to stosowania bardzo wydajnych procesorów sygnałowych.
22
1.1.6.2.Modelowanie matematyczne
Innym rodzajem podejścia do modelowania fizycznego jest metoda polegająca
na wykorzystaniu równania falowego opisującego drgania w rozpatrywanym ośrodku.
Funkcja będąca rozwiązaniem tego równania stanowi przebieg czasowy dzwięku
syntetycznego. Sam proces syntezy polega na numerycznym rozwiązaniu równania
opisującego układ drgający przy zadanych parametrach wejściowych. Ponieważ
zazwyczaj jest to dosyć skomplikowany model, co będzie pokazane w dalszych
rozdziałach pracy, wykonanie wszystkich operacji w czasie rzeczywistym wymaga
wielkich mocy obliczeniowych co w zasadzie wyklucza metodę z zastosowań
w komercyjnych syntezatorach. Modelowanie matematyczne nadaje się jednak
doskonale do testowania modeli fizycznych instrumentów i określania stopnia ich
poprawności i wiarygodności, gdzie nie jest już wymagane, aby obliczenia były
wykonywane w czasie rzeczywistym.
23
1.1.6.3.Modelowanie falowodowe (waveguide synthesis)
Chronologicznie najmłodszą jest metoda zaproponowana na początku lat 90-
tych XX w. przez Juliusa Smitha z Uniwersytetu Stanford [18], [19]. Stwierdził on, że
do poprawnego zamodelowania układu drgającego wystarczy znajomość parametrów
propagacji fal bieżących składających się na falę stojącą w danym instrumencie. Zatem
tworzony jest model falowodu cyfrowego, będący w istocie zestawieniem linii
opózniających i filtrów, co będzie pokazane pózniej.
Składowe fali stojącej powstającej w instrumencie mają charakter sinusoidalnie
zmiennych a drgania rozchodzą się wzdłuż jednego wymiaru. Zatem najprościej jest
pokazać ideę omawianego typu syntezy na przykładzie nieskończenie długiej idealnej
struny1(Rys.2.11.). Ruch pobudzonej struny tego typu można opisać równaniem
falowym, które dla kartezjańskiego układu współrzędnych przyjmie postać:
2 2
" y " y
K = (2.15)
2
" x2 " t
gdzie: K współczynnik naprężenia struny (siła naciągu)
y wychylenie struny
x odległość w osi struny
m
=
liniowa gęstość struny, (m-masa, l-długość)
l
t czas
y
K
0
x
Rys. 2.11. Idealna drgająca struna.
1
Struna idealna ma następujące właściwości: jest idealnie giętka, sprężysta i bezstratna.
24
Biorąc pod uwagę zależność wiążącą prędkość dzwięku c z naprężeniem K i gęstością
K
c = (2.16)
można przepisać równanie (2.15) w postaci
2 2
" y 1 " y
- = 0 (2.17)
2
" x2 c2 " t
Jest to klasyczne jednowymiarowe równanie falowe drgań swobodnych [7].
Faktem jest, że wielkość przemieszczenia y w każdym punkcie czasu t>0 jest złożeniem
przemieszczeń składowych. Ilustruje to Rys.2.12.
Kształt struny
Kształt struny
w chwili t0
w chwili t0+
Składowe fale bieżące
Rys.2.12. Podział struny i przemieszczanie się składowych
W chwili t , a więc w momencie pobudzenia, odkształcenie jest maksymalne, ponieważ
0
dwie składowe nie są względem siebie przesunięte. Zaraz po pobudzeniu (opisano to na
rysunku jako t )rozpoczyna się separacja składowych, które zaczynają się rozchodzić w
0+
obu kierunkach symetrycznie względem punktu pobudzenia z prędkością c. Biorąc to
pod uwagę, rozwiązanie ogólne równania (2.17) może być przedstawione jako
superpozycja dwóch fal bieżących opisanych równaniem:
25
x x
y(t, x) = yp (t - ) + yl (t + )
(2.18)
c c
gdzie: y , y - fale bieżące rozchodzące się odpowiednio w prawo i w lewo
p l
Zakładając dalej, że fale bieżące y i y mają ograniczone widmo i można je
p l
spróbkować, dokonuje się przejścia w domenę dyskretną:
x x = mX (2.19)
m
t t = nT (2.20)
n
gdzie: X przestrzenny interwał próbkowania
T okres próbkowania
Podstawiając te zmienne do (2.18) otrzymuje się:
xm xm
y(tn , xm ) = yp (tn - ) + yl (tn + ) =
c c
mX mX
(2.21)
= yp (nT - ) + yl (nt + ) =
c c
= yp[(n - m)T ] + yl [(n + m)T ]
Zapis można jeszcze uprościć definiując dwie funkcje pomocnicze:
def
(2.22)
y+ (n) = y (nT )
p
def
(2.23)
y- (n) = yl (nT )
Ostatecznie otrzymujemy równanie różnicowe:
y(tn , xm ) = y+ (n - m) + y- (n + m)
(2.24)
26
Jak wiadomo z literatury [16], równanie różnicowe jest punktem wyjścia do konstrukcji
grafu przepływowego. W przypadku (2.24) graf (Rys.2.13.) posiada dwie gałęzie
obrazujące obie składowe fale bieżące.
y+(n)
y+(n-3)
z-1 y+(n-1) z-1 y+(n-2) z-1
+ y(nT,0) +
y(nT,3X)
y-(n)
y-(n+3)
z-1 y-(n+1) z-1 y-(n+2) z-1
x=0 x=cT x=2cT x=3cT
Rys.2.13. Graf przepływowy z punktami obserwacji w x = 0 oraz x = 3cT
Wyrażenie y+(n-m) interpretuje się jako bieżącą wartość próbki na linii opózniającej
o m próbek, do wejścia której doprowadzono sygnał y+(n). Analogicznie można
powiedzieć o drugim członie równania (2.24), y-(n+1). Zatem, jak pokazano powyżej,
fale bieżące mogą być symulowane za pomocą pary cyfrowych linii opózniających
nazywanych falowodem cyfrowym (ang. digital waveguide). Chwilowa wartość
przemieszczenia struny w dowolnym punkcie x falowodu obliczana jest poprzez
zsumowanie odpowiadających mu wartości poszczególnych fal bieżących. Model
z Rys. 2.13. można uprościć zastępując kaskadę opóznień jednostkowych parą linii
opózniających z odczepami (Rys.2.14).
27
y+(n)
y+(n-M)
opóznienie o M próbek
+ y(nT,0) +
y(nT,)
y-(n)
y-(n+M)
opóznienie o M próbek
x=0 x= x=McT
Rys.2.14. Model uproszczonego falowodu cyfrowego
Przedstawiona wyżej analiza dotyczy sytuacji wyidealizowanej.
W rzeczywistych układach drgających występują różnego rodzaju straty energii
związane z np. tarciem wewnętrznym, oporem powietrza. Zjawiska te, bez wnikania
w ich istotę, można modelować za pomocą tzw. elementów skalujących, czyli
mnożników o współczynnikach ułamkowych. Elementy skalujące g w zasadzie należy
implementować po każdym okresie próbkowania (Rys.2.15.). Aby jednak zredukować
liczbę obliczeń straty grupuje się w obrębie kilku okresów próbkowania lub nawet
w obrębie całego falowodu.
28
g g
g
y+(n)
y+(n-3)
z-1 z-1 z-1
+ y(nT,0) +
y(nT,3X)
g g
g
y-(n)
y-(n+3)
z-1 z-1 z-1
Rys.2.15. Falowód cyfrowy stratny
Jak wspomniano wyżej, elementy skalujące można wykorzystać jedynie jako
współczynnik proporcjonalności. Ponieważ jednak większość strat rzeczywistych
posiada swój charakter spektralny, często dynamiczny, do ich zamodelowania stosuje
się filtry cyfrowe. Wykorzystuje się głównie filtry o skończonej odpowiedzi impulsowej
(SOI, FIR) ze względu na ich liniową charakterystykę fazową. Za pomocą wyżej
wymienionych elementów modeluje się również takie własności układu rzeczywistego
jak jego fizyczne wymiary oraz warunki brzegowe wzbudzenia drgań.
29
Wyszukiwarka
Podobne podstrony:
03 Synteza dzwieku i oberazu SYNTEZA METODĄ modulacji czestotliwosci FM07 Synteza dźwięku i obrazu MIDI w syntezie dzwiekuTechnik dźwiękutechnikiplan nauczania technik informatyk wersja 1Wyświetlacz MMI z 6 kanałowym procesorem dźwięku (9VD)Debugowanie NET Zaawansowane techniki diagnostyczne?bnetTechniczne Urząd Dozoru TechnicznegoDSL Modulation TechniquesMechanika Techniczna I Opracowanie 06Specyfikacje techniczne wykonania i odbioru robótMetody i techniki stosowane w biologii molekularnejUrzadzenie technicznewięcej podobnych podstron