Streszczenie: Przedstawiono charakterystyką prac związanych z połączeniem autorskiego algorytmu estymacji stopnia tonalności komponentów widmowych z modelem psychoakustycznym. Opisano proces „strojenia" niezbędny dla zastosowania opracowanej metody w miejsce algorytmu standardowego wykorzystywanego w modelu MPEG. Przedstawiono proces weryfikacji poprawności opracowanego rozwiązania bazujący na zmodyfikowanym algorytmie AAC. Opisano wyniki testów porównawczych, sugerujących wyższość opracowanej metody nad standardowym modelem psychoakustycznym MPEG.
Opisano testy przeprowadzone z opracowanym algorytmem detekcji mowy równoczesnej, których celem było zbadanie wpływu fluktuacji opóźnienia na działanie algorytmu DTD. Przedstawiono procedurą testową i referencyjne, opisane w literaturze algorytmy DTD.
1. Wprowadzenie
Niniejszy raport stanowi sprawozdanie 3-eg etapu badań nad nowymi metodami kodowania i poprawy jakości głosu w systemach telefonii opartych na transmisji pakietowej, w szczególności zaś zastosowaniach VolP. Zagadnienia będące tematem badań zostały przedstawione we wcześniej szych sprawozdaniach z 1. i 2. etapu, dlatego w obecnym raporcie autorzy ograniczają się jedynie do przedstawienia konkretnych wyników w kontekście zaproponowanego harmonogramu.
W minionym okresie prace związane z metodą szerokopasmowego kodowania sygnałów fonicznych koncentrowały się na połączeniu opracowanego algorytmu do estymacji stopnia tonalności komponentów widmowych z modelem psychoakustycznym. Ze względu na różnice w reprezentacji komponentów tonalnych stosowane przez esty mator standardowy i opracowany konieczne było przeprowadzenie szeregu badan pozwalających na uzy skanie wiarygodnych estymat progu słyszenia zarówno dla stacjonarnych i modulowanych komponentów tonalnyeh.
Prace związane z algorytmem detekcji mowy równoczesnej były związane przede wszystkim z testowaniem algorytmu opisanego we wcześniejszym raporcie. Badania te mają na celu porównanie efektywności opracowanego rozwiązania z tradycyjnie stosowanymi algorytmami (np. opartymi na
17