25/06/08 |
Raport z realizacji zadania badawczego: A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jako- |
PBZ |
ści sygnałów audio i wideo |
• przeskalowanie poziomu natężenia.
Pierwsza z operacji jest realizowana za pomocą ramkowania sygnału oknem Hanninga o czasie trwania 32 ms (N=256 próbek w przypadku częstotliwości próbkowania 8 kHz albo N=512 próbek przy częstotliwości próbkowania 16 kHz) , a następnie obliczenia N-punktowej krótkookresowej dyskretnej transformaty Fouriera, i na jej podstawie obliczeniu krótkookresowej mocy sygnału.
Druga z operacji ma na celu zrealizowanie filtracji za pomocą tzw. filtrów barkowych. Różnica częstotliwości środkowych i szerokości pasm dwóch sąsiednich filtrów barkowych zwiększa się z częstotliwością, co wraz z maskowaniem przez szum odzwierciedla właściwości percepcyjne ucha. Do sygnału dodawany jest szum Hoth’a modelujący zakłócanie sygnału szumami otoczenia docierającymi do słuchawki telefonu.
Przeskalowanie poziomu natężenia w decybelach na poziom głośności wyrażany w fonach, a następnie jego wyrażenie w skali sortowej ma na celu uwzględnienie faktu, że subiektywne odczucie głośności nie zależy liniowo od poziomu natężenia sygnału (przejście ze skali decybelowej na fortową), oraz że subiektywne wrażenie zwiększenia głośności zmienia się nieliniowo wraz ze zmianą głośności (przejście ze skali fortowej na sortową). Maskowanie jest uwzględniane w modelu w prosty sposób. Efekt maskowania jest brany pod uwagę tylko wówczas, gdy dwie składowe pojawiają się w tym samym czasie i mają identyczne częstotliwości.
Opisane pokrótce przekształcenie z wykorzystaniem modelu percepcyjnego obejmuje zarówno sygnał oryginalny jak i sygnał przetworzony, którego jakość ma być określona. Uproszczony algorytm metody PSQM przedstawiono na rys.2-4. Reprezentacje wewnętrzne obu sygnałów są porównywane, a obliczona odległość między nimi (tzw. wskaźnik PSQM) jest bezpośrednio związana z jakością testowanej mowy. Ostatnim krokiem w metodzie PSQM jest odwzorowanie skali obiektywnej na subiektywną. Nie jest to konieczne, jeżeli metoda jest stosowana np. do porównywania różnych typów koderów.
Metoda PSQM choć stosunkowo prosta realizacyjnie napotyka na szereg trudności. Dotyczą one przede wszystkim obliczenia widma w skali barkowej. Próbki widma obliczone za pomocą dyskretnej transformaty Fouriera „nie trafiają” w próbki widma barkowego, co zmusza do stosowania interpolacji do określania ich wartości.
Rysunek 2-4: Uproszczony schemat algorytmu badania jakości mowy metodą PSQM
14