UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 1
ĆWICZENIE 3_4 – TEORIA
Karty dźwiękowe
Analogowy zapis dźwięku
Co oznacza termin "technika analogowa"? Mówiąc najprościej, obróbkę
sygnałów w ich podstawowej niezmienionej (naturalnej), ciągłej postaci,
czyli w ich naturalnym widmie częstotliwościowym. Ciągła postać
oznacza w praktyce, że jeśli zakres zmienności sygnału wynosi na
przykład od 0 V do 10 V, to jego wartość (amplituda) może w dowolnej
chwili przyjąć dowolną wartość z tego przedziału i jest określona w całym
okresie trwania sygnału.
Dokładność określenia chwilowej wartości sygnału jest ograniczona
w zasadzie jedynie dokładnością stosowanych przyrządów pomiarowych
i warunkami pomiaru.
Zapis analogowy oznacza, że sygnał jest rejestrowany na nośniku
właśnie w naturalnej, ciągłej postaci. Jedyny zabieg, jakiemu sygnał jest
poddany, do ewentualnie modulacja, umożliwiająca trwały zapis.
Klasyczny przypadek zapisu w technice analogowej to np.: zapis
dźwięku na taśmie magnetofonowej Compact Casette, lub obrazu na
taśmie magnetowidu VHS.
Taśma magnetyczna przesuwa się przed głowicą zapisującą. Głowica
wytwarza zmienne pole magnetyczne, dokładnie odwzorowujące
przebieg zapisywanego sygnału. Dzięki oddziaływaniu pola na taśmę,
sygnał analogowy zostaje w niej odwzorowany w postaci tzw.
pozostałości magnetycznej, czyli lokalnych zmian namagnesowania
nośnika.
Zarejestrowany w ten sposób sygnał ma przebieg dokładnie
odzwierciedlający przebieg źródła, jednak jest obciążony poważnymi
problemami jakościowymi:
• wszelkie szumy, przydźwięki i zakłócenia, jakie powstają w
układach elektronicznych toru zapisu oraz w połączeniach
kablowych sumują się z sygnałem użytecznym, zniekształcając
jego przebieg i obniżając jakość późniejszego odtwarzania
UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 2
• wraz z kolejnymi cyklami odczytu, wskutek bezpośredniego
kontaktu głowicy z nośnikiem, stopniowemu zniszczeniu ulega
warstwa ferromagnetyczna przechowująca pozostałość
magnetyczną, a tym samym spada wierność nagrania, zanikają
jego szczegóły
Technikę analogową można podsumować następująco:
• olbrzymią zaletą (niemożliwą do uzyskania w technikach
cyfrowych) jest ciągłe odwzorowanie sygnału, przetwarzanie go w
naturalnej postaci
• zasadniczą wadą jest trudność w eliminacji zakłóceń i szumów,
której skutkiem jest słaba dynamika sygnału oraz niska wartość
stosunku sygnał/szum.
Cyfrowy zapis dźwięku
W technice cyfrowej sygnał przetwarzany jest z postaci naturalnej,
ciągłej, do reprezentacji numerycznej, czyli ciągu dyskretnych wartości
liczbowych.
Przetwarzanie analogowo-cyfrowe (A/C) składa się z czterech
podstawowych procesów:
1. Próbkowania
2. Kwantyzacji
3. Kodowania
4. Zapisywania
1. Próbkowanie
Polega na określeniu wartości sygnału ciągłego w określonych
odstępach czasu. "Chwile próbkowania" są określone przez
częstotliwość próbkowania, jeden z podstawowych parametrów
przetwarzania A/C – Rysunek 1.
Rysunek 1 Próbkowanie.
UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 3
Wskutek tego procesu, zamiast przebiegu ciągłego (analogowego),
określonego w całym przedziale czasowym, uzyskujemy zbiór
dyskretnych wartości, które można przedstawić jako tzw. przebieg
schodkowy, ponieważ w okresach czasu dzielących pobranie kolejnych
próbek jego wartość jest stała.
Oczywiste jest, że w miarę wzrostu częstotliwości próbkowania,
wynikowy przebieg schodkowy coraz wierniej przybliża kształt przebiegu
analogowego. Zgodnie z teorią przetwarzania sygnałów, minimalna
częstotliwość próbkowania musi być dwukrotnie wyższa od granicznej
częstotliwości przetwarzanego sygnału – patrz twierdzenie Kotielnikowa-
Shannona.
Twierdzenie Kotielnikowa-Shannona
Sygnał ciągły może być ponownie wiernie odtworzony z sygnału dyskretnego, jeśli był
próbkowany z częstotliwością co najmniej dwa razy większą od granicznej częstotliwości swego widma.
Tę częstotliwość graniczną nazywa się częstotliwością Nyquista.
2. Kwantyzacja
W tym kroku, wartości sygnału uzyskane drogą próbkowania (należące
nadal do całego zakresu zmienności sygnału) zostają "zaokrąglane" w
taki sposób, by można je było przedstawić przy pomocy skończonej
liczby wartości, wynikającej z tzw. rozdzielczości przetwarzania. Mówiąc
w dużym uproszczeniu, np.: wartości z przedziału 0-0,1 zostają
określone jako 0,1, 0,1 -0,2 jako 0,2 itd. – rysunek 2.
Rysunek 2. Kwantyzacja.
Na tym etapie powstaje tzw. błąd kwantyzacji, wynikający z tego, że
reprezentując ciągły zakres zmienności sygnału przy pomocy kilku
wartości dyskretnych, tracimy bezpowrotnie informację o małych
zmianach w obrębie przedziałów pomiędzy sąsiednimi wartościami. Błąd
ten jest tym większy im mniejsza jest liczba przedziałów kwantyzacji
(mniejsza rozdzielczość).
UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 4
3. Kodowanie
Na tym etapie liczbowe kody dyskretnych wartości, do jakich został
sprowadzony sygnał źródłowy, zostają zapisane w postaci liczbowej,
czyli w przypadku binarnej techniki cyfrowej, w formie liczb zapisanych w
systemie dwójkowym, ciągu zer i jedynek. – Rysunek 3.
Rysunek 3 Kodowanie.
(Przetwarzanie cyfrowo-analogowe, z którym mamy do czynienia przy
odtwarzaniu sygnału, polega, mówiąc w skrócie, na przetworzeniu ciągu
liczb na przebieg schodkowy, a następnie na filtracji wygładzającej tak,
by przybliżał początkowy sygnał analogowy.)
4. Zapisywanie
Uzyskany w ten sposób sygnał cyfrowy jest zapisywany na nośniku.
Zamiast sygnału analogowego, urządzenia rejestrują ciąg 0 i 1. Zamiast
nieskończonej liczby amplitud sygnału analogowego, uzyskujemy dwie
dyskretne wartości. – Rysunek 4.
Rysunek 4 Zapisywanie.
Dzięki temu, że zapisujemy, a następnie odczytujemy jedynie dwa stany
logiczne (1/0, wysoki/niski, H/L, prawda/fałsz), możliwe jest skuteczne
zabezpieczenie się przed wpływem zakłóceń i zniekształceń. Jeśli
przyjmiemy, że np.: 0 logiczne zapisujemy jako amplitudę -0,5V, a 1 jako
+0,5V, łatwo możemy sobie wyobrazić, iż szumy i zakłócenia, nawet na
poziomie 0,1V (czyli 10%) nie wpłyną na prawidłowość dekodowania tak
znacznie odbiegających od siebie poziomów.
UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 5
Podobnie, zużycie lub częściowe rozmagnesowanie taśmy, na której
sygnał został zapisany, sprawi, że zamiast +/-0,5V zostaną odczytane
poziomy +/-0,3V, ale nadal prawidłowo będzie zdekodowany ciąg 0 i 1,
czyli prawidłowa postać sygnału.
W celu dalszej eliminacji zakłóceń, w zapisie cyfrowym są stosowane
przeróżne mechanizmy zabezpieczeń, takie jak suma kontrolna,
przeplot, kodowanie blokowe i kanałowe, umożliwiające nawet
rekonstrukcję zniekształconych danych.
Problemy zapisu cyfrowego
Zapis cyfrowy wiąże się również z pewnymi problemami:
• bardzo ważna jest prawidłowa synchronizacja zapisu, a następnie
odtworzenie przebiegu synchronizującego w trakcie odczytu,
będące zasadniczym warunkiem prawidłowego przetworzenia C/A
• w procesie kwantyzacji tracimy część szczegółów przebiegu
sygnału (tzw. błąd kwantyzacji), sygnał analogowy uzyskany
następnie w wyniku przetwarzania C/A odbiega więc od
pierwotnego sygnału analogowego.
Istnieją sprawdzone metody minimalizacji wymienionych powyżej
niekorzystnych efektów przetwarzania sygnałów analogowych do postaci
cyfrowej.
Aby uzyskać dokładniejsze odwzorowanie cyfrowe sygnału
analogowego, można zwiększyć częstotliwość próbkowania - uzyskany
w ten sposób przebieg schodkowy będzie bardziej zagęszczony.
Podobnie, aby zmniejszyć błąd kwantyzacji ( "zaokrąglania" wartości
poszczególnych schodków), czyli zwiększyć odstęp Sygnał/Szum,
można zwiększyć rozdzielczość przetwarzania, czyli liczbę bitów, przy
pomocy których kodujemy wartość sygnału.
Obydwie metody prowadzą jednak do radykalnego zwiększenia ilości
danych powstających w wyniku przetwarzania.
Określenie optymalnych parametrów przetwarzania wymaga dokładnej
analizy, stosuje się różne kroki pośrednie, m. in. nadpróbkowanie
(oversampling), często połączone ze zmniejszaniem rozdzielczości
przetwarzania, decymację, czyli selekcję wybranych próbek sygnału.
UTK – III SERIA ĆWICZEŃ – Nr 04 – Badanie karty dźwiękowej – Str. 6
Kolejnym zagadnieniem związanym z cyfrowym przetwarzaniem
sygnałów analogowych jest kompresja cyfrowych danych uzyskanych w
wyniku przetwarzania. Ogromne ilości danych (rzędu setek GB) można
wydajnie, przy zastosowaniu wyszukanych algorytmów, skompresować -
tak, by było możliwe zapisanie materiału cyfrowego na dostępnych
nośnikach.