img122

img122



122


10.1. Rozpoznawanie wybranego zbioru wyrazów

ilością elementów widma częstotliwościowego sygnału mowy 660 elementów, na warstwę wyjściową składało się ich 7 (ponieważ sieć miała rozpoznawać 7 rozkazów). Warstwa ukryta (środkowa) liczyła 200 elementów, ponieważ na tyle pozwalała rozszerzona do 4 Mb pamięć używanego do symulacji komputera (AT 386/387/33 Młlz).

Zgodnie z zasadami rządzącymi doborem rodzaju sieci do tak skomplikowanego problemu uczenia wybrano sieć typu back-propagation z elementami podstawowymi typu sig-moidalnego. Kolejne warstwy łączono ze sobą metodą ,,każdy z każdym”, warstwy ukrytą i wyjściową połączono dodatkowo z elementem typu ,,stała 1” (bias). Jak łatwo policzyć w sumie powstało

(nl + l)-«2 + (»2 + ł)*»3 = 133 607

połączeń, gdzie nl, n2 i »3 oznaczają odpowiednio ilości elementów w poszczególnych warstwach (1, 2 i 3). Przed rozpoczęciem procesu uczenia wagom tych połączeń zostały przyporządkowane wartości pseudopr/ypadkowe z przedziału [-0.1, 0.1].

10.1.3    Uczenie sieci

Głównym problemem, z jakimi borykają się wszyscy eksperymentatorzy, zajmujący się stosowaniem sieci neuronowych do konkretnych zadań jest odpowiednie poprowadzenie procesu uczenia. Dane literaturowe, ogólnie bardzo bogate na ten konkretny temat są niezwykle skąpe, a czasem także sprzeczne ze sobą. Ogólnie można tu wskazać na występowanie następujących problemów:

1.    Dobór odpowiedniej wielkości zbioru uczącego, a następnie opracowanie metody mieszania danych podczas procesu uczenia.

2.    Określenie wielkości współczynników uczenia 1 (learning ratę) i »/2 (momentum) por. rozdz. 4. oraz podjęcie decyzji o ich ewentualnej zmianie w trakcie procesu uczenia.

3.    Zdefiniowanie czasu uczenia (w ilościach prezentacji wypowiedzi), a tym samym wypracowanie kryteriów pozwalających na ocenę procesu uczenia.

Podczas eksperymentów z siecią neuronową dopracowano się pewnych rozwiązań trzech powyższych grup problemowych, przy czym należy wyraźnie podkreślić, że rozwiązania te zależą bardzo ściśle od wielkości i struktury modelowanej sieci i nie mogą być bezkrytycznie przenoszone na inne, różne od prezentowanej, struktury. Równocześnie okazuje się, że przedstawiony wyżej podział jest podziałem formalnym, a w rzeczywistości wszystkie trzy problemy są ze sobą ściśle sprzężone.

10.1.4    Zbiory uczące i zbiór testujący

Początkowo optymistycznie przyjęto, że do uczenia sieci wystarczy jeden zbiór uczący, w którym zapisano 70 wypowiedzi, czyli każda komenda dla robota została wypowiedziana 10 razy. Do testowania użyto zbioru składającego się z 21 elementów: siedmiu rozkazów wypowiedzianych po 3 razy. Obydwa zbiory zostały zarejestrowane przez tego samego mówcę. Czynnikiem utrudniającym naukę i rozpoznawanie by! fakt, że nagrania zbiorów nastąpiły w różnym czasie i z różnym poziomem szumów nakładających się na sygnał mowy.

Po 200 prezentacjach zbioru uczącego (14 000 cykli uczenia) test wykazał, że sieć nauczyła się rozpoznawania zbioru uczącego (100%), natomiast zbiór testowy rozpoznawała jedynie


Wyszukiwarka

Podobne podstrony:
img122 122 10.1. Rozpoznawanie wybranego zbioru wyrazów ilością elementów widma częstotliwościowego
Sieci CP str122 122 10.1. Rozpoznawanie wybranego zhioru wyrazów ilością elementów widma częstotliwo
Sieci CP str124 124 10.i. Rozpoznawanie wybranego zbioru wyrazów mniejsze, lecz o podobnych proporcj
Sieci CP str124 124 10.i. Rozpoznawanie wybranego zbioru wyrazów mniejsze, lecz o podobnych proporcj
img124 124 10.1. Ratpotnawanie wybranego zbioru wyrazów mniejsze, lecz o podobnych proporcjach wzglę
img124 124 10.1. Ratpotnawanie wybranego zbioru wyrazów mniejsze, lecz o podobnych proporcjach wzglę
IMG122 122 10.4.2. Pomiary w równoległym układzie połączeń cewki Indukcyjnej kondensatora 1 opornika
IMG122 122 10.4.2. Pomiary w równoległym układzie połączeń cewki Indukcyjnej kondensatora 1 opornika
img122 122 10.4.2. Pomiary w równoległym układzie połączeń cewki Indukcyjnej kondensatora 1 opornika
JODLOWSKI 1 {FONETYKA} III 38 II. Wybrane klasyfikacje wyrazów na części mowy 10.    
Zdjęcie0168 (3) * *    ——-- 1 5. Rozpoznawanie zdań lub wyrazów jednakowych w zbiorze
img122 122 3est więc g(a) « d(a,f(a)) » O czyli a «» f(a). Pokażemy, że odwzorowanie f nie może mieć
statystyka (10) ,x: W sytuacji braku danych o cenach i ilościach, ale znając wartość produktów w okr
img003 3 10-1.3 Uczenie sieci .............................................................. 122 10-
img122 122 Przy obliczeniu kąta «p ze wzoru (60) stosujemy analogiczna zasady co i przy obliczeniu a
img122 122 4.    Middleton D.: An Introduction to Stśtistical Communication Theory. M

więcej podobnych podstron