Visual Analyser 2011 – Analiza Dźwięku
Wydział Mechaniczny Politechniki Krakowskiej
Rok Akademicki 2011/2012, Grupa 13K3
Rafał Polak
Celem ćwiczenia jest podstawowe zapoznanie się z analizą dźwięku i wszelkimi pojęciami z tym zagadnieniem związanymi. Przede wszystkim dużą rolę postawiliśmy na system kompresji dźwięku, a także na metody wygładzania, odbieranie kanałów dźwiękowych itp.
Do analizy dźwięku używamy programu Visual Analyser 2011 w celu zdiagnozowania wykorzystania poszczególnych częstotliwości, a także umiejętne ich odczytanie na wykresie liniowym lub logarytmicznym. Program ten ma bardzo szerokie pole możliwości, a ponieważ jest dostępny na licencji freeware czyni go bardzo atrakcyjnym narzędziem pracy.
Analyser może zastąpić nam oscyloskop, wyznacza nam w czasie rzeczywistym całe spectrum z amplitudy, a wynik przedstawia na diagramie w postaci logarytmicznej, liniowej, lub z podziałem na oktawy. A ponadto miernik częstotliwości, filtrowanie, wsparcie dla 8 – 16 – 24 bitowej karty dźwiękowej i wiele więcej.
Drugą częścią ćwiczenia było zapoznanie się z utworem w pięciu różnych metodach kompresji danych i po ponownym odsłuchu losowym dopasowanie do odpowiedniej wartości. Celem tego ćwiczenia było zbadanie wrażliwości ludzkiego słuchu i wyszukanie idealnej kompresji przy której człowiek nie miał wrażenia utraty jakości dźwięku.
Program Visual Analyser posiada dwa główne okna kolejno od góry odpowiadające za pomiar urządzenia wejściowego tzn.: mikrofonu, natomiast drugie okno służy do wyświetlania spektrum fal.
Każdą zakładkę możemy dostosować do swoich wymagań zmieniając parametry wyświetlania, parametry spektrum fal, konfigurację mikrofonu, skale, lub nakładać filtry i wyodrębniać tylko wymagane przez nas informacje.
Uchwycone dane z programu dotyczące zmiany widma w czasie:
Uchwycone dane z programu dotyczące widma częstotliwości oraz fazy widma:
Ćwiczenie polegało na rozróżnieniu kolejności puszczania różnie skompresowanego fragmentu utworu. Przedstawione zostały w kolejności rosnącej kbps 5 utworów, a następnie w losowej kolejności. Należało podać jak został zapisany podany fragment piosenki. Przedstawiam poniżej tabelę moich typów w kolejności podanej na ćwiczeniach. Popełniłem dwa błędne typowania na poziomie 192kbps oraz 320kbps.
Kbps | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
32 | X | ||||
64 | X | ||||
128 | X | ||||
192 | O | X | |||
320 | X | O |
Poniżej podaję typowania całego zespołu liczącego 22 osoby. W każdej kolumnie i wierszu aby kolumna zachowała sens ilość głosów musi być równa 22. Poprawne odpowiedzi zaznaczyłem na kolor czerwony. W przypadku złej odpowiedzi oznaczyłem „O” jej poprawną wartość.
Kpbs | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
32 | 22 | ||||
64 | 21 | ||||
128 | 12 | 7 | 3 | ||
192 | 7 | 10 | 4 | 1 | |
320 | 2 | 5 | 15 |
Tabela ta przedstawia różnorodność głosów zaczynających się od 128kbps wzwyż. Jak widać większość osób słuch miała bardzo dobry i głosowała za poprawnymi wynikami.
Program Visual Analyser 2011 jest programem w pełni darmowym i jednym z najbardziej rozbudowanych na rynku. Posiada bardzo duży zakres funkcjonalności z dziedziny badania dźwięku i jego analizowaniu.
Idealny program dla osób fizycznych jak i przedsiębiorstw zajmujących się dźwiękiem i jego analizą.
Podsumowując drugą część ćwiczenia można w łatwy sposób dostrzec, iż przy prędkościach takich jak 128kbps, 192kbps oraz 320kbps ludzki słuch już zawodzi i rozróżnienie poprawnego zapisu staje się loterią. Dlatego właśnie rezygnuje się z zapisywania dźwięku w lepszych prędkościach ścieżki dźwiękowej ponieważ ludzki zmysł nie zauważa wielkiej różnicy. Szczególnie ważną rolę odgrywa to w audycjach radiowych, plikach muzycznych, oraz TV, gdzie przesył danych musi być spójny, szybki i niewielki.
Tak więc najczęściej wykorzystuje się 128kbps, ponieważ jest najlżejszy z wyższej jakościowo półki. Prędkości 32 i 64 nie są brane pod uwagę, ponieważ ich jakość jest bardzo niska oraz bardzo dobrze rozpoznawalna przez ludzki słuch.