25/06/08 |
Raport z realizacji zadania badawczego: A.5 Tytuł raportu: Analiza i ocena metod subiektywnych i obiektywnych badania jako- |
PBZ |
ści sygnałów audio i wideo |
dzy MOS a PSQM może być różna dla różnych języków. Stosując metodę PSQM należy więc uwzględnić specyfikę danego języka.
Wadą metody PSQM jest brak korelacji otrzymywanych wyników z subiektywnymi ocenami w przypadku telefonii internetowej. Przyczyną występowania takich rozbieżności są zaburzenia w dziedzinie czasu (bulk delays) występujące podczas transmisji sygnału mowy w sieciach pakietowych przeznaczonych pierwotnie do transmisji danych. Rozwiązaniem okazał się mariaż modułu synchronizacji czasowej zaczerpniętego z metody PAMS ze standardem PSQM. Nowo opracowaną metodę pomiaru znacznie udoskonalono i nazwano PESQ (Perceptual Eva/uation of Speech Quali-ty). W 2001 ITU-T zaaprobowało PESQ jako nowy standard P.862 [PESQ], który zastąpił wcześniej stosowaną metodę PSQM.
Idea pomiaru PESQ opiera się podobnie jak w przypadku PSQM, na tzw. reprezentacji wewnętrznej będącej teoretyczną postacią sygnału mowy w umyśle człowieka. Sygnałem wzorcowym (oryginalnym) jest nagrany sygnał mowy naturalnej - najlepiej po jednym zdaniu dla głosu męskiego i żeńskiego. Tak przygotowany sygnał oryginalny przesyłany jest badanym kanałem telekomunikacyjnym tworząc na wyjściu systemu sygnał „zdegradowany”. Oba sygnały stanowią dalej podstawę oceny. W pierwszym etapie oceniane jest opóźnienie między próbkami i ewentualnie wprowadzana jest odpowiednia korekcja. Następnie oba sygnały zostają poddane szeregowi transformacji modelujących poszczególne etapy przetwarzania dźwięku w ludzkim układzie słuchowym, włączając w to przede wszystkim: specyficzną analizę w częstotliwości i nieliniowość przetwarzania intensywności dźwięku. Ewentualne przesunięcia próbek w czasie są uwzględniane w dalszych etapach obróbki sygnału. Na końcu zaimplementowano tak zwany model kognitywny, którego zadaniem jest wydanie ostatecznej oceny na podstawie porównania reprezentacji wewnętrznych obu sygnałów.
2.3.2 Metoda MNB
Metoda PSQM, choć zalecana do badania jakości mowy kodowanej nie daje najlepszych rezultatów , gdy mowa jest transmitowana. Dlatego wciąż trwają prace mające na celu opracowanie właściwej w takich przypadkach metody badania jakości mowy. Jedną z propozycji jest metoda MNB (Measuring Normalizing Blockś). Jej przydatność - tak jak wielu innych metod - wymaga jeszcze badań, szczególnie w kontekście zastosowania do badania sieci pakietowych i sieci
0 zmiennym opóźnieniu.
Opracowując metodę MNB uwzględniono fakt, że człowiek różnie odbiera zniekształcenia częstotliwościowe i czasowe sygnału mowy w różnych ich zakresach. W zastosowaniach, gdzie es-tymowana ma być jakość mowy, konieczne jest więc określenie tych przedziałów na skali czasu
1 częstotliwości, w których zniekształcenia są najbardziej odczuwalne i w nich badać różnice pomiędzy sygnałem odniesienia a sygnałem testowanym. Wymaga to jednak przeprowadzania analizy w wielu różnych skalach. Zauważono ponadto, że przejście ze skali o większej liczbie przedziałów na skalę o mniejszej liczbie przedziałów dobrze odzwierciedla właściwości słuchu z punktu widzenia adaptacji i zachowania w przypadku zniekształcania widma częstotliwościowego. Z tych powodów algorytm w metodzie MNB ma strukturę hierarchiczną. Schemat blokowy algorytmu metody MNB przedstawiono na rys.2-5.
Sygnały: testowany t(t) i odniesienia r(t) podlegają najpierw wstępnej procedurze normalizacyjnej, której celem jest ich zsynchronizowanie (eliminacja wpływu opóźnienia), unormowanie mocy sygnałów i eliminacja składowych stałych. Kolejną operacją jest wyznaczenie widm sygnałów. W tym celu sygnały są najpierw ramkowane za pomocą okna Hamminga (128 próbek dla czę-
16