365605372

365605372



tzw. funkcja kosztu szacująca, która kombinacja rekordów z bazy pozwoli osiągnąć najlepszy efekt [9].

Działanie tej funkcji polega w praktyce na oszacowaniu kilku możliwych wariantów połączeń difonów (lub trifonów) występujących w korpusie i porównaniu ich efektywności. Efektem działania funkcji jest wybór odpowiednich jednostek akustycznych z korpusu[5]. System syntezy mowy łączy je ze sobą, tworząc w tej sposób możliwie najlepszą jakościowo wypowiedź.

1.2.4. Systemy syntezy mowy oparte na ukrytych modelach Markowa

Najnowocześniejsza i jednocześnie najbardziej obiecująca metoda tworzenia systemów syntezy opiera się na ukrytych modelach Markowa (Hidden Markov Model (HMM)). Wraz z|^|ednio opisaną metodą Unit Selection, metoda HMM wchodzi w skład tzw. technik trzeciej generacji w tworzeniu systemów TTS[9]. HMM jest koncepcją w pełni matematyczną, należy do metod statystycznych[5]. Wiele prac nad mechanizmami TTS sprowadzało się do prób wykorzystania metod statystycznych do udoskonalania jakości generowanych wypowiedzi. Praktyka jednak pokazała, że najefektywniejszym sposobem jest wykorzystanie ukrytych modeli Markowa[9].

W metodzie tej system syntezy mowy opiera się na modelu, który nie jest znany od samego początku, lecz tworzony jest wraz z działaniem syntezatora mowy. Działanie, które ma na celu tworzenie odpowiedniego modelu, zwane jest treningiem syntezatora mowy. Do treningu wykorzystywane są ukryte modele Markowa, które są statystyczną metodą klasyfikowania sekwencji zdarzeń, w tym przypadku łączenia się jednostek akustycznych[5].

Trening polega na podawaniu syntezatorowi mowy kolejnych wypowiedzi uczących z bazy, która ma nauczyć mechanizm TTj(^j)jik prawidłowo konstruować wypowiedzi. Do przeprowadzenia treningu niezbędne są odpowiednio skonstruowane słowniki oraz ukryte modele Markowa, które w efektywny sposób poz\jC^| na kategoryzowanie jednostek akustycznej z bazy treningowej. W późniejszym etapie opracowywane są teksjC^jtóre mają na celu weryfikację teg|C^|y trening przeprowadzony na mechanizmie był efektywny.

W efekcie, syntezatory stworzone z wykorzystaniem HMM charakteryzują się bardzo wysoką jakością. Wypowiedzi generowane przez te mechanizmy często przypominają głos ludzki. Najważniejszym etapem tworzenia tych systemów jest odpowiednie przygotowanie modeli i przeprowadzenie treningów, za pomocą odpowiednich algorytmów, które pozwolą na stworzenie efektywnego modelu służącego do budowania wypowiedz|C-^|

7



Wyszukiwarka

Podobne podstrony:
img157 157 tości otrzymujemy 157 = Ha - nA =V " V (9la) Jeet to tzw* niwelacja w przód (z końca
126 Normalizacja i standardy Przykł. 2. Rekord bazy Druki XVI—XVIII w. Katalog mikrofilmów tworzony
Materiały 127 Przykł. 4. Rekord bazy Katalog Mikrofilmów Starych Druków Wydanych Głównie na Obszarac
132 Normalizacja i standardy Przykł. 9. Losowo wybrany rekord bazy Katalog Starych Druków Biblioteki
Rys. 8.5. Rekord z bazy normatywów Moduł Spawalność Moduł Spawalność umożliwia: ■ rysowanie
W mojej pracy interesuje mnie funkcjonał kosztu w postaci zagadnienia Mayera, czyli zadany wzorem V
Ważnym elementem opieki nad pacjentem po transplantacji jest ocena jego funkcji układu odpornościowe
Przedsiębiorca: 1.    Funkcja ekonomiczna - osoba, która specjalizuje się w
CCI20121218013 wyników oraz subiektywną funkcj ę użyteczności wyniku, która j est dla niego charakt
Eoadriflri: Dla dane] funkcji kosztu całkowitego: TC = QJ-4Q2-10Q+75 funkcja kosztu przeciętnego AC
Wstęp 9 znakomicie przypomnianej przez Annę Marię Krajewską1, tzw. literatury chwili dziejowej, któr
Zdefiniujmy tzw. funkcję ograniczającą z góry „ozn. w” {kres górny) określoną na rodzinie 2°
Funkcja minimalnych wydatków - popyt Hicksa Rozważmy także tzw. funkcję minimalnych wydatkowe : R ix
SPM?043 Klasyfikacja DSM - IVpodstawą klasyfikacji DSM-IV jest tzw diagnostyka wieloosiowa, na którą
Ćwiczenie 4. Matlab - funkcje, wielomiany, obliczenia symboliczneObliczenia z wykorzystaniem tzw. fu

więcej podobnych podstron