korelacji skrośnej). Ponadto, uzyskane w ten sposób wyniki pozwolą na wytyczenie dalszych kierunków rozwoju i opty malizacji opracowanego algory tmu.
2. Opracowanie nowych metod kodowania szerokopasmowego sygnału mowy - etap 3
Opracowana wcześniej metoda estymacji stopnia tonalności komponentów widmowych została zintegrowana z modelem psychoakustycznym w celu wykazania jej przewagi nad metodą zalecaną w standardzie MPEG. Zaimplementowana metoda estymacji stopnia tonalności komponentów widmowych przy porządkowuje wysoką wartości tonalności jedynie do maksimów lokalnych widma mających charakter tonalny . Metoda standardowa bazuje na mierze nieprzewidywalności. Ze względu na przecieki widma metoda ta przyporządkowuje wysoki stopień tonalności nie tylko maksimom lokalnym widma ale również próbkom widma bezpośrednio z nim sąsiadującym. Z tego względu przed integracją opracowanej metody z modelem psychoakustycznym konieczne było przeprowadzenie badań mających na celu zamodelowanie procesu rozmywania tonalności występującego w przypadku miary nieprzewidywalności.
Procedurę strojenia opracowanej metody do metody standardowej przeprowadzono dla komponentów tonalnych o stałej częstotliwości, gdyż dla takich komponentów sygnału miara nieprzewidywalności funkcjonuje najefektywniej. W pierwszej kolejności zamodelowano odzwierciedlenie miary zwracanej przez opracowany algorytm w miarę nieprzewidywalności dla maksimów lokalnych widma. W następnym kroku zamodelowano proces rozmywania tonalności bazując na wartości przesunięcia prążka widma (ang. Bin offset) zwracanego przez estymator częstotliwości chwilowej wykorzy stujący interpolacje paraboliczną maksimum lokalnego widma i prążków go otaczających.
Przeprowadzono weryfikację poprawności integracji opracowanego algorytmu estymacji tonalności komponentów widmowych z modelem psychoakustycznym. W tym celu zgromadzono dwie bazy próbek dźwiękowych. Pierwsza grupa próbek składała się z próbek zawierający ch głównie komponenty tonalne o stałej lub wolno zmiennej częstotliwości chwilowej. Druga grupa próbek zawierała natomiast fragmenty nagrań (w tym również mowę) posiadających silnie modulowane komponenty tonalne. W celu zbadania wiarygodności progów' słyszenia estymowanych z wykorzy staniem modelu psychoakustycznego wykorzystującego standardowy oraz opracowany moduł estymacji tonalności zaimplementowano rdzeń systemu kodowania AAC (Advanced Audio Coding). Szum kwantyzacji wprowadzany przez kodek pozostawał na poziomie wskazanym przez model psychoakustcznym, co było równoznaczne z utrzymaniem szumu kwantyzacji na progu słyszenia. Dla każdej z próbek dźwiękowych należących do obu wspomnianych wyżej grup, dokonano ich kwantyzacji zgodnie z krzywą maskowania wygenerowaną przez model psychoakustycznym wykorzystujący standardową oraz opracowaną metodę estymacji tonalności. Wygenerowane próbki dźwiękowe poddane ocenie z wy korzystaniem metody obiektywnej PEAQ (Perceptual Evaluation of Audio Qualitv). Wyniki porównawcze wskazują, że w przypadku gdy kodowaniu podlegają próbki
18