8508893177

8508893177



3. Generowanie i test baz GMM dla systemu rozpoznawania mowy SARMATA

Jednym z zadań przeprowadzonych w ramach tej pracy magisterskiej była pomoc w obliczeniach złożonych modeli Gaussa dla systemu SARMATA. Trening mlf prowadzący do wygenerowania baz GMM wykonano na plikach mlf powstałych w projekcie inżynierskim Rozwinięcie korpusu polskich rozmów telefonicznych LUNA.

3.1.    Trening mlf systemu rozpoznawania mowy SARMATA

3.1.1.    Trening mlf oraz wyliczenie modeli GMM

Wykonano trening mlf systemu SARMATA i w ten sposób wygenerowano pliki * _pat-terns.dat oraz *_pattems_CUMULATED.dat zawierające parametry KNN dla fonemów występujących w nagraniach. Trening mlf wykonywano na 404 nagraniach pochodzących z korpusu polskich rozmów telefonicznych LUNA (więcej w rozdziale 2.2.1). Następnie dzięki powstałym plikom wyliczono parametry modelu GMM dla każdego fonemu dla różnej ilości komponentów (2, 3,4, 5, 6, 8, 10, 12, 15, 18, 20). Powstałe w ten sposób pliki zawierały parametry /g, Yli oraz wagę modeli i posłużyły do stworzenia baz wzorców GMM dla odpowiedniej ilości komponentów. Każda z baz składała się z modeli GMM dla każdego z 37 fonemów występującego w języku polskim 3.1.

3.1.2.    Przygotowanie danych testowych

Następnie aby wykonać testy wygenerowanych modeli należało stworzyć foldery zawierające nagrania testowe. W tym celu stworzono 20 zestawów, po 10 dla nagrań pochodzących z plików:

1. Na których wykonano trening;

18



Wyszukiwarka

Podobne podstrony:
3.1. Trening mlf systemu rozpoznawania mowy SARMATA 19 2. Na których nie wykonywano treningu. W każd
3.1. Trening mlf systemu rozpoznawania mowy SARMATA 20 “ 1 _2007-03-13_ 12_58_32_05. wav“ 30000 8520
2. Rozpoznawanie mowy W tym rozdziale opisano elementy systemów rozpoznawania mowy, którymi zajmowan
2.3. Segmentacja 152.3. Segmentacja System rozpoznawania mowy musi z sygnału uzyskać i przetworzyć w
2_ Poradnik dla nauczycieli technologii informacyjnej1.    Wprowadzenie Jednym z zada
LaboratoriumKomputerowych Systemów Rozpoznawania Projekt 2. Lingwistyczne podsumowania baz danychRob
Generator G1 Rysunek 1.3: Generowanie kodów C/A dla systemu NAVSTAR-GPS [Tsu05, strona 76], się
dokładnego rozpoznania wymagań dla systemów informatycznych K2 Potrafi pracować w zespole realizują
11377151?6185403142413i79072661146257445 n INSTALACJE BUDOWLANE - TEST 1S Ł ^kazać    
Temporalne systemy baz danych Temporalny system baz danych - dla każdej danej przechowuje jej czas w
skanuj0017 (284) 28 PHP i MySQL dla każdego dla systemu Linux i: include path = :c:phpincludes"
Współczynniki pracy dla systemu „Klarton” — firmy Klangiilm przy użyciu taśmy dźwiękowej
skanuj0049 przeprowadzania dla ustalenia rozpoznania. Jeżeli biegły poi dejdzie do tego zagadnienia
img044 44 4. Metody inininialnoodległościowe Przykład. W badaniach nad rozpoznawaniem mowy polskiej
kompaktowe (o średnicy 8 cm) dla systemu Data Discman DD-1EX firmy Sony: niewielkie rozmiary odtwarz

więcej podobnych podstron