25/06/08 |
Raport z realizacji zadania badawczego: A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jako- |
PBZ |
ści sygnałów audio i wideo |
Cechą charakterystyczną obiektywnych metod oceny jakości mowy jest wyznaczanie odległości - według przyjętej miary - pomiędzy wybranym lub wybranymi parametrami sygnału mowy oryginalnej i sygnału przetworzonego (przesłanego), a następnie na podstawie krzywej odwzorowania, określenie oceny w mierze subiektywnej. Na rysunku 2-3 pokazano ogólny schemat metody obiektywnej badania jakości mowy na podstawie analizy parametrów sygnału.
dygnai odniesienia
&
PnrA\ imania | ||
psycho- akustyczny |
-> |
parametrów |
Ocena | |
jakości mt |
Rysunek 2-3: Schemat blokowy obiektywnej metody oceny jakości mowy opartej na analizie parametrów sygnałów
Uwzględniony na rys.2-3 sygnał odniesienia występuje jedynie w metodach intruzyjnych. W przypadku metod nieintruzyjnych jakość oceniana jest w oparciu o charakterystyczne zniekształcenia pojawiające się w transmisji, np. szumy i nieciągłości przebiegu czasowego (skutek przerw w transmisji).
W pierwszej połowie lat dziewięćdziesiątych ITU prowadziło intensywne prace zmierzające do opracowania obiektywnej metody badania jakości mowy kodowanej. Ich efektem było opracowanie kilku metod (PAMS, PARCEWAL, PSQM, PAQM, z których w wyniku weryfikacji stwierdzono, że metodą dającą najlepsze wyniki dla koderów telefonicznych wąskopasmowych, tzn. najlepiej estymującą wyniki badań subiektywnych, niezależnie od języka, mówcy i kodera jest metoda nazywana PSQM (Perceptual Speech Quality Measure). Opisuje ją zalecenie P.861 [PSQM], W przypadku koderów szerokopasmowych zdecydowano się na model PEAQ (zalecenie ITU-R, BS.1387 [PEAQ]).
Istota metody PSQM sprowadza się do określenia odległości pomiędzy rzeczywistym sygnałem mowy, a sygnałem otrzymanym w wyniku jej przetworzenia (głównie kodowania). Przy czym, zanim porównanie zostanie dokonane obydwa sygnały podlegają transformacji z postaci fizycznej na postać psychofizyczną - odzwierciedlającą przetwarzanie akustycznego sygnału mowy przez ucho człowieka. Jak wcześniej wspomniano percepcja sygnału mowy jest zróżnicowana w zależności od jego częstotliwości i mocy. Inaczej odbierane są różnice między poziomami głośności. Na operację transformacji sygnału z postaci fizycznej na postać psychofizyczną składa się:
• odwzorowanie czasowo-częstotliwościowe;
• przeskalowanie częstotliwości;