sprawozdanie multimedia 2, AGH

Sprawozdanie nr.2

Adamski Damian, Bosak Katarzyna. WIMiIP, IS, gr.1, rok I

Konwersja danych - zmiana jednej formy danych komputerowych w inną formę - zamiana informacji

Kompresja plików audio.

Z pomocą potrzebom przesyłania muzyki przez Internet przychodzi kompresja, czyli "pakowanie" danych dźwiękowych. Są dwa rodzaje kompresji: kompresja bezstratna i kompresja stratna

Kompresja bezstratna

Kompresja bezstratna zachowuje pełną informację o przebiegu sygnału dźwiękowego. Polega ona na sprytnej zmianie sposobu zapisu danych, dzięki czemu zapis jest oszczędniejszy. Możliwość stosowania tego rodzaju kompresji wynika z faktu, że standardowe sposoby zapisu dźwięku (np. pliki wav) są dość "rozrzutne" pod względem wykorzystania pamięci. Np. bez względu na to, czy w danym momencie dźwięk ma dużą amplitudę i skomplikowany przebieg, czy panuje absolutna cisza, dane w formacie stereo zajmują około 170 kB na każdą sekundę. Dlatego zmieniając sposób zapisu da się sporo danych "upakować". Zwykle kompresja bezstratna pozwala przeciętnie w np. w jednym bajcie danych skompresowanych zapisać więcej niż 1 bajt danych wyjściowych. Możliwe do zastosowanie metody to m.in. dlatego że:

- można np. oznaczać obszary ciszy i zapisywać je oszczędniej niż w 16 bitach na kanał i na jedną próbkę sygnału (w końcu większość rozpiętości przedziału od 0 do 32 768 dla cichych dźwięków się "marnuje")

- dla muzyki w której różnice między kanałami stereo są nieznaczne można zapisywać dokładnie zsumowany sygnał (mono), a różnice (które będą niewielkie) kodować oszczędniejszym sposobem.

Formaty kompresji bezstratnej są różne. Przykładem może być tu np.

monkey's audio, LPAC,RKAU, FLAC, WavPack,

Niestety, kompresja bezstratna zazwyczaj nie daje dużych możliwości zmniejszenia rozmiaru plików - zysk na pojemności pamięci oscyluje w okolicy 2 razy (w najlepszych warunkach 3-4). Dlatego stosuje się nieco gorszą jeśli chodzi o wierność zapisu, ale znacznie wydajniejszą - kompresję stratną.

Kompresja stratna

Kompresja stratna wykorzystuje kilka uzupełniających się efektów i technik:

po pierwsze - ten typ kompresji może wykorzystać prawie wszystkie metody kompresji bezstratnej

po drugie - ponieważ ludzki narząd słuchu nie jest stuprocentowo dokładny, to wiele dźwięków jest przezeń "gubionych" i można ich po prostu nie zapisywać, oszczędzając przy tym pasmo pamięci.

Ta druga metoda - wykorzystanie niedokładności słuchu jest właśnie kluczem do wydajności kompresji stratnej. W jej ramach sygnał dźwiękowy jest analizowany pod kątem owych niedostrzeganych słuchem elementów - np. maskowanie dźwięków cichych przez głośne, lub maskowanie gorzej słyszalnych dźwięków (patrz wykres czułości słuchu).

Dzięki kompresji stratnej daje się (bez wyraźnego pogorszenia jakości dźwięku) upakować dane audio 10-cio, a nawet 20-to krotnie. W rezultacie typowe nagranie zajmuje nie kilkadziesiąt, a kilka megabajtów pamięci.

Kompresję stratną stosuje się w następujących formatach zapisu dźwięku:

mp3 (także mp3 pro - twórca Instytut Fraunhoffera),wma, asf (MICROSOFT),mpeg, ogg (Vorbis - projekt open source), atrac (SONY), aac, ac3 (APPLE), vqf (YAMAHA)

Audacity jest darmowym edytorem plików dźwiękowych, stanowiącym bezpłatną alternatywę dla takich programów jak Cool Edit Pro i WaveLab. Jego główne zadania to nagrywanie i odtwarzanie dźwięków, importowanie i eksportowanie plików w formatach MP3, WAV, AIFF, Ogg Vorbis i innych.

Audacity umożliwia edycję ścieżek dźwiękowych z wykorzystaniem wycinania, kopiowania i wklejania (z możliwością dowolnego cofania wykonanych operacji), miksowania ścieżek oraz dodawanie efektów (echo, usuwanie szumu, normalizacja itp.) a także umożliwia korzystanie z wtyczek efektowych VST i LADSPA. Program posiada także wbudowany edytor obwiedni/amplitudy, regulowany moduł do wyświetlania spektrogramów i analizy częstotliwościowej dla programów do analizy audio.

GoldWave to proste w obsłudze i niezwykle rozbudowane, jak na swoje niewielkie rozmiary narzędzie do odtwarzania, nagrywania, edycji oraz konwersji dźwięku.

Program oferuje wbudowany odtwarzacz plików audio, który zintegrowany został z narzędziem do nagrywania dźwięku z dowolnego źródła. Przy jego użyciu użyciu odsłuchamy ulubione piosenki, dostosujemy ich podstawowe parametry odtwarzania jak głośność, balans czy też szybkość, a także zapiszemy na dysku komputera dźwięk z mikrofonu, starych kaset magnetofonowych, płyt gramofonowych itp. Nie zabrakło również zestawu przydatnych filtrów i efektów, z pomocą których usuniemy szumy i wszelakie zakłócenia z naszych plików dźwiękowych, usuniemy wokal z piosenek, zmienimy ton głosu wykonawcy oraz wiele, wiele więcej.

GoldWave pozwala także na edycję plików dźwiękowych, wycinanie wybranych fragmentów, łączenie kilku plików dźwiękowych w jeden, przeprowadzanie normalizacji dźwięku, stosowanie różnego rodzaju wzrostu głośności i wyciszania odpowiednio na początku lub końcu utworu, wyłączanie wybranych kanałów itp. Narzędzie nie potrafi jednak obsłużyć więcej niż jednej ścieżki dźwiękowej, a zapis audio możliwy jest do takich formatów jak WAV, MP3, XAC, AIFF, AIFFC, IFF, AU, VOC, SND, SDS, SMP, VOX, MAT, M4A, FLAC, OGG i WMA. Kolejną zaletą GoldWave jest wsparcie dla pluginów, które poszerzyć mogą możliwości programu o nowe funkcje i efekty.

0x01 graphic

Pierwszym krokiem naszego ćwiczenia była kompresja próbek do konkretnych formatów:

Tabela przedstawia czasy poszczególnych kompresji. Jak widać dla niektórych kompresji są one podobne a dla innych zróżnicowane.

	Film (49,7KB)		Muzyka (2621 KB)	Rozmowa(806KB)
OGG (0,2q)	1s (73KB)		8s (224 KB)	3s (90 KB)
(0,5q)	1s (87KB)		7s (278 KB)	4s (101KB)
(0,9q)	1s (150 KB)		9s (472KB)	6s
MP3 (48kbps)	1s (150KB)		3s (179 KB)	1,5s (152KB)
MP3(112kbps)	1s (348KB)		5s (417KB)	3s (354KB)
MP3(256KBPS)	1s (796KB)		4s (952KB)	3s (809KB)
FLAC low/fast	<1s (545KB)		2s (2606 KB)	1s (356KB)
FLAC hight	<1s (551KB)		1s (2860 KB)	1s (369KB)
FLAC maximum	<1s (543KB)		2s (2580 KB)	1s (364KB)
WMA 20kbps	3s (78KB)		2s (91KB)	4s (77KB)
WMA32 kbps	3s (114KB)		1,5s(135KB)	3s (114KB)
WMA 48 kbps		3s (167KB)	2,5s(198 KB)		3s (165KB)

Po otrzymaniu tych próbek zaczęliśmy używać filtrów:

Po normalizacji pliku dźwiękowego głos stał się głośniejszy, lecz szumy z tła także były lepiej słyszalne.

Po usunięciu szumów nagranie stało się bardziej wyraźne, nie było słychać już szumów i trzasków.

Po użyciu kompresora dźwięk stał się mocniejszy, ciche dźwięki stały się lepiej słyszalne (bardziej wyeksponowane). Ogólne brzmienie rozmowy stało się lepsze.

Po użyciu filtra „wzmocnienie” muzyka stała się głośniejsza, stało się to przez zwiększenie amplitudy dźwięku.

Low-pass przepuszcza tylko częstotliwości sygnału poniżej ustalonej częstotliwości

High-pas przepuszcza tylko częstotliwości sygnału powyżej ustalonej częstotliwości

Korektor graficzny pozwala na podbijanie, bądź tłumienie określonych pasm częstotliwości i w zależności od ustawienia suwaków oddziałuje na konkretne pasma.

Hard-limiter w naszym przypadku w próbce dźwiękowej ściszył wokal i ogólnie pogorszył jakoś utworu.

0x01 graphic

Porównując obydwa programy, stwierdziliśmy, iż Gold Wave stwarza o wiele więcej możliwości
„obróbki” dźwięku. Dzięki niemu możemy kompresować dźwięk do bardzo dużej ilości formatów. Możemy dowolnie „pracować” nad plikiem dźwiękowym odpowiednio przycinając go i edytując według własnego uznania. Audacity niestety nie jest aż tak rozbudowany, jednak dobrze sobie radzi w „podstawowych” zadaniach edycji muzyki.

Wyszukiwarka