1484605313

1484605313



emocji jednocześnie, za zwycięską uznaje się tę klasę, którą wskazywały grupy cech uznane za najefektywniejsze według selekcji grupowej (tabela ??).

Minimalizacja cech osobniczych mówcy

Oczywistym jest fakt, że rozpoznawanie emocji uzależnione od mówcy daje dużo lepsze rezultaty niż rozpoznawanie niezależne. Aczkolwiek system, który miałby działać w naturalnych warunkach, powinien być uniwersalny, omijając cechy osobnicze głosu w klasyfikacji emocji. Dlatego też budując tego typu systemy dąży się do ich minimalizacji.

Powszechnie uważa się, że kobiety lepiej niż mężczyźni rozpoznają emocje w tonie głosu, a przekonanie to potwierdzono badaniami. Samo okazywanie emocji również jest odmienne dla obu płci. Ponadto częstotliwość drgań fałdów głosowych, a zatem częstotliwość krtaniowa (podstawowa), zależy od masy, długości i napięcia tych fałdów. Ponieważ u mężczyzn długość fałdów wynosi około 15-20 mm, zaś u kobiet 8-12 mm, głos kobiecy jest około oktawę wyższy od męskiego [6]. Widoczny jest zatem wpływ płci na mowę, co może przekładać się również na proces rozpoznawania.

Widoczny jest również wpływ wieku na głos mówcy. Mowa młodych chłopców charakteryzuje się znacznie wyższą częstotliwością podstawową, niż dorosłych mężczyzn. Tej różnicy nie widać w sposób tak istotny jak w przypadku kobiet. Można także zauważyć, że z wiekiem głos staje się coraz bardziej zachrypnięty, a mowa spowolniona.

Ponieważ elementy społeczno-demograficzne ciężko określić na podstawie klasyfikacji opartej o mowę, toteż sama konstrukcja korpusu powinna zakładać prawidłowy rozkład tych parametrów. Przykładowo, w zbiorze treningowym powinny znajdować się próbki mowy osób wywodzących się z różnych części Polski, a ich rozkład powinien być proporcjonalny. W ten sposób, bazując na odpowiednich przykładach, klasyfikator jest w stanie rozpoznać odpowiednią próbkę.

Pomimo, iż w korpusie zapewniono prawidłowy rozkład płci i wieku mówców, zdecydowano się na wprowadzenie dodatkowego elementu. Zbiór treningowy podzielono na dwie grupy: męską i żeńską, a do klasyfikatora dodano moduł rozpoznawania płci. Węzeł odpowiedzialny za rozpoznawanie płci umieszczono tuż nad algorytmem PAKEmo. W zależności od płci badanego mówcy, zbiór treningowy PAKEmo stanowi teraz odpowiednio zbiór wypowiedzi kobiet bądź mężczyzn. Rozpoznawanie płci dokonano na podstawie wartości średniej częstotliwości podstawowej F0.

Klasyfikacja w wykorzystaniem wag

Mając na uwadze nierównomierny wpływ deskryptorów mowy na rozpoznawanie stanów emocjonalnych, zdecydowano się na zastąpienie metody głosowania równoprawnego głosowaniem ważonym. W takim przypadku decyzja podejmowana jest również na zasadzie

15



Wyszukiwarka

Podobne podstrony:
Wzrost a rozwój gospodarczy Jako ważny wyznacznik poziomu rozwoju, uznaje się jakość życia, którą mo
współmierności uznaje się za koszty danego okresu sprawozdawczego te koszty, które są związane z
współmierności uznaje się za koszty danego okresu sprawozdawczego te koszty, które są związane z
współmierności uznaje się za koszty danego okresu sprawozdawczego te koszty, które są związane z
Mandalę uznaje się za ilustrację modelu holistycznego i jednocześnie dynamicznego, gdyż wskazuje ona
współmierności uznaje się za koszty danego okresu sprawozdawczego te koszty, które są związane z
współmierności uznaje się za koszty danego okresu sprawozdawczego te koszty, które są związane z
skanuj0013 NATURALNE WODY MINERALNE ŹRÓDLANE I WODY STOŁOWE Za naturalną wodę mineralną uznaje się w
slajd1 Ocena wzajemnej
SNC01558 Niepłodność małżeńska W praktyce klinicznej. za niepłodni) uznaje się parę, u której nie do
Strona 2 (13) Wałki o średnicach mniejszych od dolnej granicy uznaje się za złom, wałki o średnicach
IMG62 134 II. Podstawy ekonomii dobrobytu tycznego progu; osoby będące w takim położeniu uznaje się
Nowy 15 (8) -    Próbę uznaje się za pozytywną, jeśli w pierwszej fazie występuje ból

więcej podobnych podstron