PRZEDMIOT: Systemy dialogowe ĆWICZENIE nr 3
Urządzenie automatycznego rozpoznawania sygnału mowy metodą rozpoznawania wzorców (projekt dla małego słownika) ZADANIE
1) Założenia:
- mały słownik wyrazów rozpoznawanych: 10 słów,
- jednostka fonetyczna: całe słowo.
2) Przygotować dane:
- sformułować słownik wyrazów rozpoznawanych;
- dokonać rejestracji wszystkich słów (każde słowo 15-krotnie, w oddzielnym pliku .wav);
- do rejestracji przyjąć: fs = 22050 Hz, 16 bitów/próbka, kodowanie PCM, mono;
3) Zdefiniować wzór testowy (współrzędne wektora obserwacji, np.: energia, długość – liczba próbek, liczba przejść przez zero, współczynniki FFT, współczynniki LPC, itp.)
4) Opracować procedurę uczenia - utworzyć wzorce słów:
- zdefiniować wzorzec,
- określić ciąg uczący,
- dokonać estymacji parametrów wzorców 5) Opracować procedurę rozpoznawania 6) Dokonać weryfikacji i testowania urządzenia:
- określić ciąg testowy
- wyznaczyć statystyki rozpoznawania (estymatory prawdopodobieństwa poprawnego rozpoznania, analiza błędów rozpoznawania)
- zaproponować kierunki zmian w celu poprawienia jakości zbudowanego urządzenia ARM
Dokonać implementacji urządzenia w środowisku MATLAB.
1
Struktura systemu automatycznego rozpoznawania sygnału mowy metodą rozpoznawania wzorców PROCEDURA
UCZENIA
WZORCE
rozpoznana
UKŁAD
UKŁAD
PORÓWNANIA
DECYZYJNY
mowa
tryb rozpoznawania
tryb uczenia
OBSERWA-
CJA
ANALIZA
SYGNAŁU
sygnał
mowy
Dla sygnału o długości N:
• liczba przejść przez zero PPZ
N
1
PPZ =
∑
[
sign z(n)]−
[
sign z(n − )
1 ]
2 n=2
gdzie:
[
sign z(n)] = 1 dla
z(n) ≥ 0
[
sign z(n)] = −1 dla
z(n) < 0
• energia sygnału
N
E = ∑ z( )2
n
n=1
2