Moje
wywody na temat obróbki dźwięku
przy pomocy komputerowych
edytorów
Obróbka
dźwięku
|
|
Wstęp |
|
Podstawy pracy z edytorami audio |
Podstawy pracy z edytorami audio - część 1 Podstawy pracy z edytorami audio - część 2 Podstawy pracy z edytorami audio - część 3 Podstawy pracy z edytorami audio - część 4 Podstawy pracy z edytorami audio - część 5 Podstawy pracy z edytorami audio - część 6 Podstawy pracy z edytorami audio - część 7
|
Podstawy korekcji nagrań dźwiękowych i obróbki dźwięku |
|
Usuwanie wokalu z nagrania |
|
Analogów czar |
|
Jak wykryć MP3? |
|
|
|
Symulacja przestrzeni w systemie stereo |
|
Kompensacja poziomu dźwięku |
|
|
© Bartłomiej Gliniecki 1999-2004. All rights reserved |
Obróbka
dźwięku
|
|
Podstawy pracy z edytorami audio - część 1 |
|
|
© Bartłomiej Gliniecki 1999-2004. All rights reserved |
dźwięku
|
|
Podstawy pracy z edytorami audio - część 2 |
|
|
© Bartłomiej Gliniecki 1999-2004. All rights reserved |
Podstawy
pracy z edytorami audio - część 3
Gdy
już wiadomo jak należy rozumieć widmo sygnału dźwiękowego, pora
przejść do kolejnego etapu pracy z edytorem audio. Partie sygnału
dźwiękowego możemy, podobnie jak tekst, wycinać, kopiować i
wklejać. Operacje te są bardzo proste do wykonania i wykonuje się
je podobnie jak w przypadku tekstu.
Aby skopiować lub
wyciąć jakiś fragment, musimy go przedtem zaznaczyć.
Zaznaczanie odbywa się tak samo jak w edytorach tekstu - należy
wcisnąć lewy klawisz myszy w momencie, gdy kursor jest nad widmem
lewego lub prawego kanału, i przeciągnąć myszą trzymając
wciśnięty klawisz. W żądanym momencie należy klawisz zwolnić.
Zaznaczony fragment zostanie podświetlony. Aby dokładnie zaznaczyć
pożądany fragment, można powiększyć obraz widma (przyciski z
lupą).
Istnieje
możliwość zaznaczenia sygnału tylko z lewego lub tylko z prawego
kanału. W Cool Edit Pro należy w tym celu dla lewego kanału
umieścić kursor "na górze" górnego widma i zaznaczyć
albo dla kanału prawego - "na dole" dolnego widma i
zaznaczyć.
Teraz możemy zaznaczony fragment np. wyciąć
lub skopiować i wkleić. Aby go wyciąć,
należy wybrać z menu Edit
polecenie Cut
albo wcisnąć przycisk przedstawiający nożyczki. Zaznaczony
fragment zostanie usunięty, a część sygnału znajdująca się za
wycinanym fragmentem zostanie automatycznie przesunięta na jego
miejsce. Jeżeli zdecydujemy się na skopiowanie
fragmentu, powinniśmy z menu Edit
wybrać polecenie Copy.
Teraz, kiedy fragment został skopiowany do schowka, możemy go
wkleić w inne miejsce tego samego pliku lub wkleić do innego pliku.
Aby wkleić
go w inne miejsce w tym samym pliku, ustawiamy w żądanym miejscu
kursor (klikamy raz lewym klawiszem myszy w dowolne miejsce na widmie
fali) i z menu Edit
wybieramy pozycję Paste.
Możemy też wstawić fragment do nowego pliku wybierając polecenie
Paste
to New.
Jeżeli mamy otwartych kilka plików istnieje również możliwość
kopiowania fragmentów między plikami (zmieniamy wtedy okno z menu
Window).
Jeżeli chcemy usunąć
zaznaczony fragment, wciskamy klawisz Delete
na klawiaturze.
Pora teraz na zapoznanie się z
pierwszymi efektami oferowanymi przez edytor, przy pomocy których
będziemy mogli modyfikować sygnał dźwiękowy. Przed stosowaniem
na próbę omawianych efektów dobrze jest zaznaczyć kilkusekundowy
fragment pliku i na nim dokonywać zmian. Nie ma sensu na razie
poddawać obróbce cały plik, gdyż będzie to czasochłonne i nie
pozwoli uchwycić różnicy między sygnałem oryginalnym a
zmodyfikowanym.
Zaznaczmy dowolny fragment pliku i użyjmy
polecenia Reverse
z menu Effects
w Cool Edit Pro. Zaznaczony fragment zostanie "odwrócony"
w taki sposób, że uzyskamy efekt odtwarzania od tyłu. Jakie jest
tego praktyczne zastosowanie? Wbrew pozorom całkiem spore. Jeżeli
dysponujemy próbką talerza hit-hat (pojedyncze uderzenie) i ją w
taki sposób odwrócimy, to otrzymamy próbkę, która w zapętleniu
jest bardzo często używana w muzyce klubowej. Innym przykładem
zastosowania tego efektu jest maskowanie inwektyw występujących w
śpiewanym tekście poprzez "odwracanie" obraźliwych słów
lub ich końcowych sylab.
Jeżeli wybierzemy polecenie
Silence,
zaznaczony fragment zostanie zamieniony w ciszę. Nie jest to to samo
co wycinanie, gdyż w tym przypadku długość pliku się nie
zmienia.
Zmiany poziomu
głośności sygnału
możemy dokonać poprzez wywołanie okna z menu Effects
| Amplitude | Amplify...
. Przy pomocy suwaka decydujemy o zmianie dotychczasowego poziomu
głośności wyrażonej w decybelach (skala dBFS) lub procentach.
Zmiany można wprowadzać niezależnie dla prawego i lewego kanału
albo równolegle dla obu na raz (Lock
Left/Right).
Przy okazji możemy również poprawić zniekształcenie fali
polegające na jej przesunięciu w górę lub w dół względem osi 0
dB (DC
Bias Adjust).
Jeżeli zwiększamy głośność, łatwo jest doprowadzić do
niepożądanego efektu zwanego przesterowaniem. Aby jemu zapobiec i
jednocześnie zwiększyć głośność do maksymalnego możliwego
poziomu, w pole Peak
level
wpisujemy wartość 0 dB i wciskamy przycisk Calculate
Now.
Wzmocnienie zostanie automatycznie ustawione na maksymalną
dopuszczalną wartość.
W
tym momencie pora na małe, ale przydatne objaśnienia. Warto je
zapamiętać, gdyż będą one użyteczne we wszystkich oknach
edytora Cool Edit Pro. Przyjrzyjmy się oknu Amplify
na obrazku powyżej. Zawiera ono okienko z predefiniowanymi
ustawieniami (Presets),
dzięki którym wiele czynności można wykonać bez żmudnego
ustawiania parametrów efektu. Wciśnięcie przycisku OK
powoduje zamknięcie okna i wykonanie nałożenia efektu zgodnie z
podanymi parametrami. Wybranie przycisku Close
zapisuje wprowadzone w oknie efektu zmiany, ale nie powoduje
modyfikacji pliku. Aby anulować wprowadzone w oknie zmiany i nie
modyfikować pliku, należy wybrać przycisk Cancel.
Zawsze możemy przesłuchać jak będzie brzmieć fragment po
modyfikacjach, wciskając przycisk Preview.
Aby szybko przełączać się między sygnałem oryginalnym i
zmodyfikowanym w trakcie odtwarzania z użyciem przycisku Preview,
należy zaznaczyć i odznaczyć pole Bypass.
To
samo okno (Amplify)
posłuży nam do nałożenia efektu płynnego zwiększenia (fade-in)
lub zmniejszenia (fade-out)
głośności. Efektów tych używa się najczęściej na początku
lub na końcu próbki. Zamykamy okno i zaznaczamy ten fragment
początku lub końca widma sygnału, który chcemy poddać takiej
obróbce. Następnie ponownie wywołujemy okno Amplify,
ale wybieramy w nim zakładkę Fade
i ręcznie ustawiamy wartości początkowego i końcowego wzmocnienia
albo korzystamy z wbudowanego ustawienia (Presets).
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 4
Poznaliśmy
już pierwsze efekty dotyczące zmiany wzmocnienia dźwięku, czyli
po prostu głośności. Teraz omówię kolejne efekty, które
mieszczą się w menu Effects
| Amplitude
w edytorze Cool Edit Pro.
Dosyć podobnym do opisanego
wcześniej efektu Amplify
jest powszechnie znana normalizacja
(Effects
| Amplitude | Normalize).
Narzędzie to podnosi poziom najgłośniejszego sampla w sygnale do
zadanej w procentach czy decybelach wartości. Oczywiście wraz z
najgłośniejszym samplem, który jest tutaj tylko punktem
odniesienia, podnoszona jest również głośność reszty sygnału z
zachowaniem proporcji w samym sygnale. Gdy ustawimy poziom
normalizacji na 100% lub 0 dB, dźwięk zostanie wzmocniony do
najgłośniejszego poziomu bez przesterowania. Zaznaczenie pozycji
Normalize
L/R Equally
spowoduje, że poszukiwanie najgłośniejszego sampla będzie się
odbywało w obu kanałach stereo na raz, a nie osobno. Dzięki temu
zostanie zachowana proporcja głośności między kanałami. Możemy
również skorzystać z opcji korekcji fali sygnału przesuniętej
względem osi 0 dB. Warto jest wykorzystywać normalizację na samym
końcu łańcucha efektów, aby znormalizować zmodyfikowany sygnał
do poziomu 100%.
Narzędzie,
które z kolei przypomina efekt fade-in/fade-out, możemy wywołać z
menu Effects
| Amplitude | Envelope.
Służy ono do zmiany poziomu wzmocnienia sygnału w czasie, jednak
jest bardziej elastyczne niż zwykły efekt fade-in/fade-out. Przy
pomocy wykresu możemy nakreślić przebieg obwiedni sygnału
określając jego zmieniające się w czasie wzmocnienie. Aby
wyczyścić wykres, należy wcisnąć przycisk Flat.
Zaznaczenie pola Spline
curves
spowoduje, że obwiednia będzie miała łagodniejszy
przebieg.
Gdy
wybierzemy z menu Effects
| Amplitude
polecenie Channel
Mixer...,
wywołamy efekt, za pomocą którego będziemy mogli wymieszać
między sobą sygnał z obu kanałów stereo. Może to być przydatne
np. przy wyrównywaniu różnic w sygnale obu kanałów wynikających
z zapisu stereofonicznego czy przeniesieniu sygnału z prawego kanału
na lewy i odwrotnie. W tym poleceniu znajdziemy również popularne
ustawienie próbujące usunąć z nagrania ludzki głos (preset Vocal
Cut).
Bardzo
ważnym zagadnieniem w edycji dźwięku jest obróbka dynamiki
sygnału.
Dokonuje się jej przy pomocy kompresorów, limiterów, expanderów i
bramek. Dotychczas mieliśmy możliwość zmiany wzmocnienia sygnału
(głośności) w stosunku do np. określonego poziomu (0 dB lub 100%
albo innej wartości). Proporcje w obrębie samego sygnału
pozostawały takie same (np. stosunek najgłośniejszego sampla do
pozostałych). Można tę sytuację przyrównać do możliwości
zmiany wielkości obrazka o rozmiarach 300 x 200 pikseli do wielkości
600 x 400 - podczas zmiany zachowane zostały proporcje długości i
szerokości obrazka. Jak jednak przeprowadzić taką modyfikację
sygnału, aby zmienić proporcje fragmentów głośnych i cichych
względem siebie? Czyli, odwołując się do przykładu z obrazkiem,
jak zmienić wielkość naszego obrazka z wymiarów 300 x 200 pikseli
na np. 600 x 600? Przeanalizujmy takie oto widmo sygnału.
Jak
na pierwszy rzut oka widać, sygnał charakteryzuje się znaczną
różnicą między fragmentami głośnymi, a cichymi. Co więcej,
znakomita większość sygnału jest stosunkowo cicha (poniżej -15
dB), a sygnał głośniejszy od -9 dB występuje jedynie w 2-3
miejscach. Taka sytuacja czasami jest naturalna i pożądana, ale w
niektórych przypadkach trzeba jej zaradzić. Tak duża rozpiętość
dynamiki sygnału powoduje, że ok. 90% dźwięku jest słabo
słyszalna. Nie możemy sygnału tak poprostu wzmocnić, gdyż zaraz
doprowadziłoby to do przesterowania tych 2 czy 3 głośniejszych
fragmentów. W takim wypadku pomoże nam kompresor.
Wybierzmy
narzędzie z menu Effects
| Amplitude | Dynamics processing....
Na początek skorzystamy z wbudowanych ustawień: na przykład 3:1,
-18, +3dB, Drums.
Pod
okienkiem z "presetami" pojawi się opis działania
wybranego ustawienia: wybrane przez nas kompresuje sygnał powyżej
progu -18 dB w stosunku 3:1, natomiast sygnał poniżej -18 dB
pozostawia nietknięty. Dzięki temu te dwa, wyraźnie głośniejsze
miejsca na naszym widmie (u góry) zostaną niejako "przycięte".
Zauważmy, że kompresor posiada tzw. próg
(ang. threshold)
który determinuje działanie kompresora. Gdy sygnał przekroczy
określony próg, kompresor zaczyna działanie. W naszym przypadku
sygnał jest kompresowany w stosunku 3:1. Teraz widmo sygnału
wygląda tak.
Gdy
sygnał znormalizujemy do poziomu 0 dB, to będzie on wyglądać w
ten sposób. Widać wyraźnie, że widmo jest bardziej wyrównane;
nie ma tak dużych różnic między nagłośniejszymi fragmentami i
resztą sygnału.
Kompresory
wykorzystuje się w wielu sytuacjach: przy nagrywaniu głosu i
instrumentów, w późniejszej obróbce poszczególnych śladów w
nagraniu oraz całego nagrania. Jest to jedno z najczęściej
wykorzystywanych narzędzi. W kolejnych zakładkach okna Dynamic
Range Processing
możemy doprecyzować ustawienia kompresora. W zakładce Traditional
możemy ustawić kompresor wpisując ustawienia, a nie przy pomocy
wykresu. Kolejna zakładka, Attack/Release,
zawiera ważne ustawienia dotyczące "szybkości" działania
kompresora. W części "Gain Processor" tej zakładki
definiujemy wartości "Attack Time" oraz "Release
Time". Określają one jak szybko po przekroczeniu
zdefiniowanego progu kompresor ma zacząć działać oraz jak szybko
ma się wyłączyć, gdy sygnał spadnie poniżej progu. Na przykład,
gdy zdefiniujemy "Attack Time" na 30 ms, kompresor w ciągu
30 ms po przekroczeniu przez sygnał określonego wcześniej progu
zacznie stopniowo działać. Podobnie będzie w przypadku "Release
Time" - w ciągu zdefiniowanego czasu kompresor wyłączy się
stopniowo, gdy sygnał spadnie poniżej progu. Odpowiednie ustawienie
tych czasów zależy od wielu czynników i jest ważne, gdyż złe
ustawienia mogą spowodować, że działanie kompresora będzie
wyraźnie słyszalne.
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 5
Poznaliśmy
już podstawowe narzędzie do obróbki dynamiki sygnału - kompresor.
Po krótce przypomnijmy zasadę jego działania: definiujemy próg
działania kompresora, stopień kompresji sygnału, czasy ataku
(attack) i zwolnienia (release). Gdy sygnał przekroczy zadany próg,
kompresor się włączy i skompresuje sygnał znajdujący się
powyżej progu w stopniu, który wcześniej określiliśmy. Na
przykład, jeżeli ustawimy próg działania kompresora na -9 dB,
skompresowany zostanie sygnał znajdujący się w czerwonym polu na
obrazku poniżej. Reszta sygnału nie zostanie
zmodyfikowana.
Szczególnym
rodzajem kompresora są de-essery. Używa się ich przeważnie do
przyciszania zgłosek syczących w wokalu ("ś", "ć",
"sz", "cz"). Technicznie rzecz biorąc, de-esser
jest kompresorem, którego działanie zostało ograniczone do
specyficznego pasma sygnału, w którym najczęściej występują
"syczące" składowe. Wybierzmy ustawienie np. De-Esser
Medium
i przejdźmy do zakładki Band
Limiting.
Widać tutaj, że kompresor będzie działał tylko w podanym paśmie
sygnału (4000-12000 Hz). Tradycyjne kompresory operują na pełnym
paśmie (w Cool Edit Pro 0-24000 Hz).
Narzędziem
wywodzącym się z kompresora jest również limiter. Jest to
kompresor z bardzo dużym stopniem kompresji (przyjmuje się
zazwyczaj, że powyżej 50:1). Jego zadaniem jest maksymalizacja
głośności sygnału bez doprowadzania do przesterowania. Dzięki
bardzo dużemu współczynnikowi kompresji limiter potrafi
praktycznie zawsze ograniczyć sygnał, który przy tradycyjnym
wzmocnieniu byłby przesterowany. Wybierzmy ustawienie limit
hard -6dB
i w zakładce Traditional
w polu Output
Compensation (gain)
wpiszmy wartość 10 dB. Po wciśnięciu OK
sygnał zostanie poddany obróbce. Gdy następnie odtworzymy dźwięk,
będzie on wyraźnie głośniejszy, chociaż nie będzie
przesterowany. Limiterów używa się przeważnie w odniesieniu do
gotowego już miksu, a nie do pojedynczych ścieżek. Ich zadaniem
jest nadanie utworowi "soczystego", głośnego brzmienia
poprzez zmniejszenie rozpiętości dynamicznej sygnału.
Kolejnymi
narzędziami służącymi do obróbki dynamiki sygnału są bramki. Z
kolei podtypem bramek są bramki szumów. Bramki służą do
"wycinania" sygnałów, które nie przekroczyły pewnego
progu. Na przykład, gdy ustalimy próg na -40dB, to bramka przepuści
część sygnału powyżej tej wartości, natomiast część sygnału
poniżej -40 dB zostanie wyciszona. Bramek można używać do
usuwania szumów z sygnału szczególnie wtedy, kiedy szum jest na
stałym poziomie, a sygnał, który chcemy pozostawić jest wyraźnie
głośniejszy. Przy pomocy tej metody nie usuniemy szumu znajdującego
się w tle sygnału, który chcemy pozostawić. Dla pewnych celów
(bynajmniej nie redukcji szumów) bramek używa się również przy
obróbce sygnału poszczególnych instrumentów, np. werbli, talerzy
itd. W Cool Edit Pro mamy do wyboru dwie bramki szumów (Noise
Gate)
oraz kilka bramek dla instrumentów.
Następną
grupą efektów, którą omówię, będą efekty opóźnienia sygnału
(menu Effects
| Delay Effects).
Efekt Chorus
powoduje, że dźwięk sprawia wrażenie jakby był emitowany przez
kilka instrumentów lub kilku wokalistów, chociaż w rzeczywistości
tak nie jest. Kolejne "głosy" nakładane na oryginalny
sygnał są m.in. lekko opóźniane i modulowane, przez co osiąga
się efekt większej ilości wokalistów niż ich faktycznie zostało
nagranych. Opisywanie poszczególnych ustawień tego efektu nie ma
sensu, bo w różnych edytorach jest ich różna ilość i mają
często inne nazwy - warto jest się tutaj zdać na "presety".
Wyjątek stanowić mogą tutaj ustawienia Wet
Out
i Dry
Out.
Jest to ustawienie określające stosunek sygnału zmodyfikowanego
przez chorus (Wet)
do sygnału oryginalnego (Dry)
w sygnale wynikowym.
Efekt
Delay
do sygnału oryginalnego wprowadza jego kopię opóźnioną o
określony czas względem oryginału oraz ewentualnie opóźnioną
również między kanałami. Definiujemy tutaj opóźnienie sygnału
w prawym i lewym kanale względem sygnału oryginalnego i
jednocześnie możemy określić opóźnienie sygnału w obu kanałach
względem siebie (ustawiając np. opóźnienie 30 ms na lewym i 50 ms
na prawym kanale). Różnice opóźnienia między kanałami mniej
więcej do 30 ms sprawią, że dźwięk stanie się bardziej
przestrzenny. Większe opóźnienia spowodują, że ucho zacznie
wychwytywać wyraźne opóźnienie między prawym i lewym kanałem.
Możemy też określić w jakim stopniu sygnał opóźniony zostanie
domiksowany do oryginalnego.
Dosyć
podobnym do opóźnienia efektem jest Echo.
Jednak w przeciwieństwie do opóźnienia nie wprowadza pojedynczej,
opóźnionej kopii oryginalnego sygnału, lecz kilka kopii
opóźnionych, różniących się m.in. siłą wzmocnienia. Również
i tutaj można definiować opóźnienie kolejnych kopii sygnału
oryginalnego, stopień tłumienia kolejnych fal echa (o ile mają być
przyciszone w stosunku do poprzedniej fali), a w Cool Edit Pro można
także określić jakie częstotliwości mają występować w
echu.
Kolejnym
efektem, podobnych do poprzednich dwu, jest Reverb.
Efekt ten dodaje do dźwięku odpowiednie składowe, dzięki czemu
brzmi on jakby źródło dźwięku (np. instrument czy wokalista)
było zlokalizowane w konkretnym pomieszczeniu czy przestrzeni.
Dzięki specyficznej kombinacji echa o zmiennym opóźnieniu i odbić
Reverb
symuluje przestrzeń o zróżnicowanej kubaturze: od łazienki
(krótkie i metaliczne odbicia) do wielkiej sali koncertowej (długie
echo, rozproszone odbicia). W Cool Edit Pro podobne funkcje spełnia
jeszcze efekt Full
Reverb
- jest bardziej rozbudowaną wersją zwykłego Reverb.
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 6
Teraz
przyszła kolej na zaznajomienie się z filtrami
częstotliwości
dostępnymi w edytorach audio. Zagadnienie to jest jednym z
kluczowych podczas omawiania procesu obróbki dźwięku, dlatego
należy poświęcić mu szczególną uwagę i "ćwiczenia
praktyczne" poprzedzić odpowiednim wstępem
teoretycznym.
Każdy dźwięk w naturze ma określoną
częstotliwość. Wszystko co słyszymy składa się z dźwięków o
wielu różnych częstotliwościach. Częstotliwości te wyrażane są
w Herzach (Hz). Człowiek w zasadzie słyszy częstotliwości w
przedziale od 20 do 20000 Hz. Niektórzy ludzie twierdzą, że słyszą
częstotliwości wyższe niż 20000 Hz, ale jest to sprawa
indywidualna i dyskusyjna i sprowadza się zapewne bardziej do
"wyczuwania" tak wysokich dźwięków niż faktycznie ich
fizycznej percepcji.
Podział pasma odbieranego przez
ludzi można przedstawić następująco. Najniższe częstotliwości
to tzw. basy. Ich pasmo kształtuje się w granicach 20-150 Hz. Gdy
słyszymy dudnienie, rytm w utworach - to są właśnie te
częstotliwości. Z racji tego, że fale dźwięków o tych
częstotliwościach są najdłuższe (z fizyki pamiętam, że
najniższe częstotliwości mają okres fali o długości ok. 20
metrów), dobrze przenikają przez przeszkody, np. ściany. Dlatego
jak słyszymy, że sąsiad słucha muzyki, to słyszymy zazwyczaj
samo rytmiczne dudnienie, a nie głos wokalisty, gdyż ten operuje na
wyższych pasmach częstotliwości. Częstotliwości średnie
(oczywiście w nich też wyróżnia się dół i górę tego pasma)
mieszczą się w przedziale od mniej więcej 250 do 6000 Hz. To tutaj
najwięcej swych częstotliwości ma większość instrumentów oraz
głos ludzki. W przedziale 6000-20000 Hz dzieje się już niewiele,
ale nie znaczy to, że jest ono mało istotne. Znajdziemy w nim
głównie głoski syczące, talerze i szumy. Pasmo to odpowiada
również za tzw. klarowność dźwięku.
Teraz będziemy
już wiedzieć jak rozumieć trzeci z podstawowych parametrów
dźwięku - jego pasmo częstotliwości. Zazwyczaj do opisu
parametrów dźwięku używa się trzech kryteriów: ilości kanałów
(mono, stereo, 5.1 itd.), rozdzielczości bitowej (8, 16, 24, 32-bit
itd.; patrz fragment o analizie widma fali) oraz pasma
częstotliwości. Prawdopodobnie najczęściej będziemy mieli do
czynienia z dźwiękiem, którego pasmo będzie miało 44100 Hz (np.
płyta CD). Musimy tę wartość podzielić przez dwa (dwa kanały
stereo), aby otrzymać wartość szerokości pasma częstotliwości
dla pojedynczego kanału (22050 Hz). Jak widzimy, szerokość ta w
zupełności wystarczy by zawrzeć w niej wszystkie częstotliwości
odbierane przez człowieka.
Dlaczego zagadnienie pasm
częstotliwości jest takie ważne? Z wielu względów. Dzięki
odpowiedniej korekcji możemy wydzielić dla każdego instrumentu
pasmo, w którym dany instrument będzie dominującym. Jest to
potrzebne dla przejrzystości całego miksu, gdyż zapobiegnie
"zlewaniu" się np. perkusji, basu i jakichś efektów.
Właściwie operując korekcją wytniemy tę część pasma jakiegoś
instrumentu, które nie jest dla niego aż tak istotne, a powoduje
złe współbrzmienie z resztą miksu. Ponadto, nagrane instrumenty
oryginalnie nie zawsze brzmią tak jak byśmy chcieli - za sprawą
korekcji możemy ukierunkować to brzmienie wedle naszych
upodobań.
Na początku zapoznajmy się z korektorem
graficznym.
W Cool Edit Pro znajduje się on w menu Effects
| Filters | Graphic Equalizer.
W oknie korektora za pomocą suwaków możemy podbijać lub ucinać
poszczególne częstotliwości. Korektor ten wyglądem przypomina
nieco korektory stosowane w wieżach stereo. Korektor w Cool Edit Pro
może być 10-, 20- lub 30-pasmowy. Ilość "presetów"
jest imponująca. Warto jest użyć kilku z nich, np. podbijających
lub ucinających bas czy tony wysokie (ang. treble),
aby zobaczyć w praktyce jakie częstotliwości są zmieniane.
Dwie
uwagi praktyczne. Stara zasada mówi, że lepiej jest ucinać
częstotliwości niż je podbijać. W praktyce wygląda to tak, że
gdy np. źle słychać gitarę na tle innych instrumentów w miksie,
to lepiej jest obciąć pasmo "niegitarowe" czyli górę i
bas, aniżeli podbijać pasmo gitary. Druga uwaga: zauważmy, że
każda częstotliwość jest podbijana o pewną ilość decybeli. Gdy
nie zachowamy umiaru, może dojść do przesterowania, nawet z powodu
podbicia wąskiego pasma częstotliwości. Dlatego przy drastycznych
korekcjach warto jest obniżyć poziom całego sygnału z poziomu
korektora (pole Master
Gain)
lub poprzez uprzednią normalizację (np. do poziomu
70%).
Korekcji
pasm częstotliwości można także dokonać za pomocą filtra
FFT
(menu Effects
| Filters | FFT Filter).
Pasma częstotliwości podbijamy lub obcinamy odpowiednio kształtując
linię w oknie filtra. Oś pozioma reprezentuje skalę
częstotliwości, oś pionowa - wzmocnienie wyrażone w procentach
(tryb Passive)
lub decybelach (tryb Logarithmic).
Ważną jest w tym filtrze wartość FFT
Size.
Wpływa ona na precyzję przebiegu operacji, a więc powinna być
zawsze jak najwyższa. Zdefiniowane ustawienia zawierają ciekawe
efekty, np. efekt dźwięku ze słuchawki telefonicznej. W tym
miejscu warto wytłumaczyć działanie często spotykanych ustawień
filtrów. Filtry typu Notch
wycinają bardzo wąskie pasmo częstotliwości i są przydatne, gdy
zależy nam na chirurgicznej ingerencji w jakąś częstotliwość.
Filtry typu Low
Pass
(dolnoprzepustowe) wycinają pasmo powyżej określonej
częstotliwości. Na przykład filtr Low
Pass 11025 Hz
pozostawia te poniżej 11025 Hz, a resztę wycina. Filtry typu High
Pass
(górnoprzepustowe) działają odwrotnie - przepuszczają jedynie
częstotliwości powyżej zdefiniowane progu.
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 7
Ciekawym
zagadnieniem dotyczącym korektorów pasm częstotliwości są
korektory dynamiczne. Ich działanie polega na tym, że działanie
korektora i modyfikowane pasma zmieniają się w czasie. Na przykład,
na początku sygnał może mieć nałożony filtr dolnoprzepustowy, a
na końcu może nie być żadnego filtra. Ustawienia filtra będą
się cały czas zmieniać i w rezultacie otrzymamy płynne przejście
od filtra dolnoprzepustowego na początku do przepuszczenia całego
pasma na końcu utworu. W Cool Edit Pro powinniśmy wywołać okno z
menu Effects
| Filters | Dynamic EQ.
Wybierzmy np. ustawienie LowMid-->Hi
(slowsweep).
Spowoduje ono takie ustawienie filtra jak opisałem przed chwilą.
Zakładka Frequency
pozwala sterować filtrem częstotliwości w czasie. Gdy wybierzemy
filtr Low
Pass
przepuszczone zostanie pasmo poniżej linii na wykresie, przy filtrze
High
Pass
przepuszczone zostanie pasmo powyżej linii. W zakładce Gain
sterujemy wzmocnieniem w czasie. W zakładce Q
(bandwidth)
precyzujemy szerokość pozostawionego pasma (działa tylko w trybie
Band
Pass
filtra).
Jednym
z podstawowych celów, do których wykorzystywane są komputerowe
edytory audio, jest redukcja
szumów i zniekształceń
w materiale dźwiękowym. Najczęściej zostaje on uprzednio zgrany z
nośników analogowych np. kasety magnetofonowej czy płyty
winylowej. Przedstawię teraz zasady obsługi filtrów redukujących
szumy i zniekształcenia dźwięku.
Jakie są typowe
rodzaje szumów i zniekształceń dźwięku? Wyróżniamy szum
charakterystyczny dla np. kasety magnetofonowej (ang. Hiss).
Charakteryzuje się on m.in. mniej więcej stałym poziomem,
podobnymi składowymi częstotliwościowymi i występuje w ciągu
całego czasu trwania materiału. Clicks
& Pops
to niepożądane "cyknięcia" i "pyknięcia"
wstępujące przeważnie w dźwięku zgrywanym z płyt
winylowych.
Przystępując do redukcji szumów musimy
sobie zdać z jednego sprawę: cudów nie będzie. Jeżeli dźwięk
jest znacznie zaszumiony, to nagranie z kasety sprzed dwudziestu lat
nie będzie po naszym zabiegu brzmieć tak klarownie jak z płyty CD.
Jest to tylko redukcja
szumów i zupełne ich wyeliminowanie może być niemożliwe. Jako,
że drastyczna redukcja może doprowadzić do zniekształcenia
oryginalnego dźwięku (możliwe są efekty np. "przytłumienia",
"bulgotania" czy "mechanicznego" dźwięku),
podczas tego procesu będziemy postawieni przed wyborem między
pozostawieniem niewielkiego szumu czy prawie zupełnym jego
usunięciem, ale za cenę nienaturalnego brzmienia dźwięku.
Generalnie lepiej jest zawsze pozostawić trochę szumu, niż
doprowadzić do nienaturalnego brzmienia.
Proces redukcji
szumów możemy podzielić na dwa etapy: zbieranie charakterystyki
szumu i redukcję szumów według tej charakterystyki. Aby pobrać
charakterystykę szumu, musimy zaznaczyć ten fragment dźwięku,
gdzie występuje sam szum np. przerwa między utworami, cisza na
początku lub końcu utworu. Nie musi to być długi kawałek -
wystarczy kilka sekund. Po zaznaczeniu tego miejsca, wywołujemy okna
narzędzia do odszumiania - w Cool Edit Pro z menu Effects
| Noise Reduction | Hiss Reduction.
Następnie w tym oknie wciskamy przycisk Get
Noise Floor.
Edytor zrobi "zdjęcie" czystego szumu. Teraz będzie
wiedział co traktować jako szum i co próbować usunąć z sygnału.
Przed pobraniem charakterystyki szumu warto jest ustawić poziom
"drag
points"
na ok. 25. Dzięki temu charakterystyka częstotliwościowa szumu
będzie dokładniejsza.
Mamy
już charakterystykę szumu, a więc możemy przystąpić do redukcji
szumów w dźwięku. W tym celu zamykamy okno Hiss
Reduction
przy pomocy przycisku Close
(ważne!). Następnie zaznaczamy ten fragment dźwięku, który
chcemy poddać operacji redukcji szumów. Ponownie wywołujemy okno
Hiss
Reduction
- powinno nas przywitać zapamiętanym wykresem charakterystyki
szumu. Możemy, dostosowując poszczególne parametry dostępne dla
tego narzędzia, sterować intensywnością redukcji szumów.
Praktycznie wszystkie parametry wpływają z jednej strony na stopień
redukcji szumów, a z drugiej - na deformację oryginalnego sygnału.
Dlatego nie ma sensu opisywać tutaj proponowanych ustawień, gdyż
zależą one od stopnia zaszumienia dźwięku i pożądanego
rezultatu. Pomoc edytora zawiera opis wszystkich parametrów wraz z
wyjaśnieniem na co wpływają. Na koniec mała uwaga praktyczna:
lepsze efekty osiągnie się poprzez użycie małej redukcji szumów,
ale powtórzonej wielokrotnie (pobranie charakterystyki, redukcja,
pobranie charakterystyki, redukcja itd.), niż w przypadku
pojedynczej, silnej redukcji.
Zasady postępowania z
efektem do redukcji trzasków są nieco inne niż w przypadku
narzędzia do redukcji szumów. Nie pobieramy tutaj żadnej
charakterystyki. Narzędzie to "wygładza" nagłe skoki
amplitudy w sygnale, które objawiają się jako trzaski. Co się
tyczy redukcji trzasków, polecam używanie tego efektu chirurgicznie
- jedynie w krótkich fragmentach, w których trzaski są słyszalne,
a nie "hurtowo" na całe kilkuminutowe fragmenty
dźwięku.
W Cool Edit Pro wybieramy narzędzie z menu
Effects
| Noise Reduction | Click/Pop Eliminator.
Gdy mamy zaznaczony fragment z trzaskiem (możliwie jak najmniejszy
fragment), wciskamy przycisk Auto
Find All Levels.
Filtr sam zdefiniuje parametry na podstawie danego fragmentu sygnału.
Potem pozostaje nam tylko wcisnąć OK
i sprawdzić rezultaty.
Cool
Edit Pro, oprócz narzędzi do redukcji szumów i trzasków, zawiera
również narzędzie do ratowania przesterowanego sygnału (Effects
| Noise Reduction | Clip Restoration).
Zaznaczamy całą porcję sygnału, który jest przesterowany
(najczęściej całą zawartość pliku), wybieramy odpowiednie
ustawienie, zależnie od stopnia przesterowania i wciskamy przycisk
Gather
Statistics Now.
Narzędzie pobierze informacje o ilości procentowej przesterowanych
sampli. Po wciśnięciu OK
skutki przesterowania zostaną złagodzone.
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 8
Kolejną
grupą efektów, którą omówię, będą te dotyczące zmiany tempa
i wysokości dźwięku.
Cool Edit Pro oferuje trzy takie narzędzia, które znajdują się w
menu Effects
| Time/Pitch.
Na
początek przyjrzyjmy się efektowi Stretch.
Przy jego pomocy możemy zmienić tempo dźwięku zachowując jego
wysokość (tryb Time
Stretch),
zmienić wysokość zachowując tempo (tryb Pitch
Stretch)
oraz zmienić wysokość i szybkość jednocześnie (tryb Resample).
Ustawmy od razu precyzję na High
Precision
i zaznaczmy pole Choose
appropriate defaults
- później ewentualnie będzie można zmienić te ustawienia. Gdy
wybierzemy odpowiedni tryb działania dla tego efektu (zmiana tempa,
wysokości czy jednego i drugiego), możemy suwakiem regulować
stopień zmiany oryginalnego dźwięku. Wartość 100 w polu Ratio
oznacza, że dźwięk nie będzie zmieniony. Wartości niższe będą
obniżać tempo, podnosić wysokość lub "ściskać"
sygnał (w trybie Resample).
Wartości wyższe od 100 spowodują podwyższenie tempa, obniżenie
wysokości lub "rozciągnięcie" sygnału. Wraz z
manipulacją suwakiem w trybach Time
Stretch
oraz Resample
zmieniać się będzie również czas trwania próbki (pole Lenght).
Wpisując w to pole odpowiednią wartość możemy dostosować tempo
próbki do czasu, przez który ma trwać. Możemy także zmienić
tonację dźwięku korzystając z listy Transpose.
Gdy przejdziemy do zakładki Gliding
Stretch
będziemy mogli określić początkowe i końcowe parametry tempa
oraz wysokości dźwięku. Parametry efektu będą zmieniane liniowo
w czasie, podobnie jak to miało miejsce w przypadku narzędzia
Amplify.
Prawdopodobnie,
ze względu na swą charakterystykę, narzędzie do zmiany tempa i
wysokości dźwięku będzie używane najczęściej do modyfikacji
głosu ludzkiego. Należy przy tym pamiętać, że zbyt radykalne
zmniejszanie tempa może wprowadzić niepożądane zniekształcenia,
np. dźwięk stanie się metaliczny lub wzbogacony echem. Jeżeli
operujemy na wartościach tempa BPM (Beats Per Minute), to aby
dostosować tempo do określonej wartości BPM, musimy rozwiązać
proste równanie: x = (100 * y) / z , gdzie y - pożądane tempo, z -
obecne tempo. Wynik zmiennej "x" wpisujemy w pole
Ratio.
Drugim
narzędziem do zmiany wysokości i tempa dźwięku oferowanym przez
Cool Edit Pro jest Pitch
Bender.
Efekt ten nieco przypomina ten omawiany poprzednio. Jednak w
porównaniu z Time/Pitch
cechuje go inna zasada działania. Pitch
Bender
jest pomyślany przede wszystkim jako narzędzie do płynnej zmiany
wysokości i tempa dźwięku. Poprzez wykres możemy kształtować te
zmiany w czasie. Oś pozioma na wykresie przedstawia czas, natomiast
pionowa - wysokość dźwięku podaną w półtonach lub BPM (wybór
skali następuje po zaznaczeniu odpowiedniego pola w pozycji Range).
Dzięki dynamicznie zmieniającej się wysokości dźwięku można
osiągnąć np. efekt zwalniającej płyty winylowej (preset
Turntable
Losing Power).
Cool
Edit Pro zawiera również ciekawy efekt, który symuluje efekt
Dopplera (Doppler
Shifter).
Efekt Dopplera to zjawisko, które występuje np. gdy stoimy przy
ulicy i obok przejeżdża samochód, karetka na sygnale czy
przelatuje nad nami samolot. Mamy wtedy wrażenie, że wraz ze
zbliżaniem się źródła dźwięku (którym w tym przypadku jest
silnik) oprócz głośności zmienia się również jego wysokość -
od wysokiego, gdy samochód się zbliża, do niskiego, gdy się
oddala. Narzędzie zawarte w Cool Edit Pro posiada sporo ustawień i
chyba nie ma sensu budować własnych, wpisując samemu parametry
efektu. W odróżnieniu od innych efektów opisywanego edytora,
wykresu dla efektu Dopplera nie można zmieniać. Pokazuje on jedynie
jak działanie efektu będzie wyglądać z obecnymi parametrami. Ze
względu na swą charakterystykę, to narzędzie będzie dawać
najlepsze efekty na sygnale nie zmieniającym swej wysokości ani
głośności, np. stały dźwięk, akord lub pętla.
Podczas
całego procesu obróbki dźwięku i stosowania poszczególnych
efektów zależy nam na tym, aby nie popsuć dźwięku. W muzyce
jednak nie ma zasad i niekiedy takie zepsucie brzmienia może być
potrzebne do uzyskania odpowiedniego efektu. W jaki sposób można
stylowo zepsuć brzmienie? Na przykład wprowadzając do dźwięku
efekt podobny do tego jaki występuje przy przesterowaniu. W Cool
Edit Pro w menu Effects
| Special | Distortion
znajdziemy odpowiednie do tego celu narzędzie. Jego wykres
przypomina ten, który występował w efektach do obróbki dynamiki
(np. kompresor). Na osi poziomej prezentowany jest poziom sygnału
wejściowego, na pionowej - poziom sygnału wyjściowego. Im większe
odchylenia linii na wykresie od linii będącej przekątną tego
kwadratu, którym jest wykres, tym intensywniejszy będzie efekt, a
sygnał wyjściowy będzie miał wtedy wyższą lub niższą
głośność. Jeżeli potrzebujemy jeszcze subtelniejszego
dopasowania efektu do naszych potrzeb, możemy odznaczyć pole
Symmetric
i określić przy pomocy wykresów sposób działania efektu osobno
dla dodatnich (zakładka Positive)
i ujemnych (zakładka Negative)
wartości sampli. Oczywiście nie trzeba samemu rysować wykresu -
możemy wykorzystać jedno z kilkunastu dostępnych ustawień.
Opisywany efekt można z powodzeniem wykorzystać w różnych
gatunkach muzyki do symulowania np. przesterowanego wzmacniacza
gitary.
© Bartłomiej Gliniecki 1999-2004. All rights reserved
Podstawy
pracy z edytorami audio - część 9
Zapewne
najczęściej pracować będziemy na sygnale o parametrach 44100 Hz,
16-bit, stereo. Jest to obecnie chyba najczęściej spotykany format
sygnału, odpowiadający np. dźwiękowi z płyt CD. Nic nie stoi
jednak na przeszkodzie, by zmienić któryś z tych parametrów, np.
w celu uzyskania zgodności z innymi standardami zapisu dźwięku. Do
zmiany
parametrów sygnału
służy w Cool Edit Pro okno Convert
Sample Type
z menu Edit.
Możemy w nim określić nowe pasmo częstotliwości: możemy je
zawęzić lub rozszerzyć. W przypadku rozszerzenia pasma
częstotliwości np. z 44100 Hz do 48000 Hz dźwięk nie zyska nowych
składowych częstotliwościowych (mając pasmo rzędu 22050 Hz nie
zyska składowych powyżej wartości 22050 Hz), ale gdy zechcemy
nagrać coś do tego pliku, sygnał zostanie zapisany w paśmie 48000
Hz. Przy konwersji do pasma niższego niż oryginalne pasmo sygnału,
warto jest wybrać jak najwyższy współczynnik jakości
przeprowadzanej operacji (suwak poniżej) oraz zaznaczyć pole
Pre/Post
Filter.
Dzięki temu operacja zawężania pasma będzie wykonana z najwyższą
precyzją i uchroni dźwięk przed dodatkowym pogorszeniem jego
jakości (już samo zawężenie pasma spowoduje spadek jakości
dźwięku). Oczywiście należy pamiętać, że nie wszystkie karty
dźwiękowe obsługują odtwarzanie i nagrywanie dźwięku w pasmach
częstotliwości większych niż 44100 Hz.
Możemy w
opisywanym oknie zmienić także ilość kanałów dźwięku np.
konwertując sygnał stereo do mono (nowy kanał sygnału mono będzie
składał się z sygnału obu kanałów stereo w określonych
proporcjach) lub odwrotnie (oba kanały sygnału stereo będą
zawierały ten sam sygnał mono). Zmiana rozdzielczości bitowej
sygnału też nie jest trudna. Mamy do wyboru konwersję do sygnału
8-bit, 16-bit i 32-bit. Zwiększanie rozdzielczości sygnału do
32-bitów jest wskazane przed praktycznie wszystkimi operacjami
dokonywanymi na sygnale, gdyż zwiększa precyzję przeprowadzanych
obliczeń (sygnał w jednej chwili może przybrać zamiast jednej z
216,
jedną z 232
wartości). Podczas konwersji do rozdzielczości niższej niż
oryginalna rozdzielczość sygnału (np. z 16-bit do 8-bit) uaktywni
się część okna Dither.
Służy ona do określenia opcji ditheringu. Dithering, w przypadku
konwersji rozdzielczości "w dół", dodaje do sygnału
odrobinę szumu. Chociaż dodawany jest szum, jest on na bardzo
niskim, praktycznie niesłyszalnym poziomie. Ogólny efekt jest
zdecydowanie lepszy przy użyciu ditheringu, niż bez niego. Jako
wartość p.d.f.
warto ustawić np. pozycję Triangular,
a rodzaj Noise
Shaping
powinno się dostosować do pasma częstotliwości sygnału
(ustawienia Noise
Shaping A
do E2
są odpowiednie dla sygnału 44100 Hz lub 48000 Hz; kolejne
ustawienia nadają się do sygnału odpowiednio 44100, 48000 i 96000
Hz).
Narzędziem
dostarczającym sporo ważnych informacji jest statystyka sygnału
(menu Analyze
| Statistics).
Okno podzielone jest na dwie zakładki: General
z wartościami liczbowymi i Histogram
z histogramem amplitudy sygnału. Dane tutaj prezentowane mogą
dotyczyć całego sygnału w pliku lub jego fragmentu. W zakładce
General
widzimy dwie kolumny z liczbami. Każda pokazuje dane z prawego lub
lewego kanału. Po wciśnięciu strzałki -> kursor w oknie edycji
zostanie ustawiony obok miejsca, w którym występuje dana wartość.
Pozycje Minimum
i Maximum
Sample Value
podają najniższe i najwyższe wartości sampli występujące w
sygnale. Peak
Amplitude
to szczytowa wartość sygnału (wartości powyżej 0 dB oznaczają
przesterowanie). Pole Possibly
Clipped Samples
pokazuje w ilu miejscach sygnał osiąga szczytową wartość 0 dB.
Nie musi to być równoznaczne z przesterowaniem. Gdy użyjemy
limitera, prawdopodobnie otrzymamy sporo takich miejsc. Pola RMS
Power
pokazują minimalną, maksymalną i średnią wartość sygnału
mierzoną w dB.
Zakładka Histogram
pokazuje procentową "ilość" sygnału o danej amplitudzie
w całym sygnale. Na osi poziomej znajdują się wartości w dB, a na
pionowej - wartości procentowe. Dane zawarte w obu opisywanych
zakładkach są pomocne przy doborze parametrów wzmocnienia lub
kompresora.
Cool
Edit Pro zawiera również narzędzie do analizy częstotliwościowej
sygnału (menu Analyze
| Show Frequency Analysis).
Wykres pokazuje jak głośne są poszczególne częstotliwości w
danym miejscu sygnału. Gdy zaznaczymy fragment sygnału i wciśniemy
przycisk Scan
pokazany zostanie wykres średnich wartości w danym fragmencie. Po
wciśnięciu przycisku Advanced
możemy ustawić wartość FFT (im wyższe wartości, tym
dokładniejszy wykres). Gdy ustawimy wartość FFT na równą bądź
niższą od 4096, to po wciśnięciu przycisku odtwarzania (bez
zamykania okna analizy częstotliwości) wykres będzie dynamiczny.
Przy pomocy analizy częstotliwościowej możemy np. zidentyfikować
czy nagrana na płytę CD-R muzyka pochodzi z plików MP3 czy też
nie. Większość kompresorów MP3 usuwa częstotliwości powyżej
16000 Hz - na wykresie będzie to wyraźnie widać.
Na
koniec drobna uwaga na temat zapisywania plików. Edytory audio
pozwalają na zapisanie dźwięku do wielu formatów plików
dźwiękowych, w tym do formatu MP3. Najczęściej jednak zapisywane
przez edytory audio pliki MP3 są nienajlepszej jakości. Dlatego
warto jest zapisać plik najpierw do formatu WAV, a potem dopiero
skompresować go do formatu MP3 przy użyciu dobrego kodeka, np.
LAME.
© Bartłomiej Gliniecki 1999-2004. All rights reserved