Zajęcia 4
01.04.2011
Temat: Koncepcje rozpoznawania obiektu
top-down (góra dół)
dopasowanie wzorca
dopasowanie do prototypu (prototype matching) - jest to odpowiedź na koncepcję dopasowania do wzorca, która jest niedoskonała. Prototyp - najlepsza reprezentacja obiektu; idealny albo najczęściej spotykany model, zawierający najważniejsze cechy tego obiektu. Chodzi o podobieństwo: obiekt zawiera część zapamiętanych przez nas cech, ale nie wszystkie. Obiekt nie musi zawierać wszystkich cech prototypu - można określić, jak blisko mu do prototypu. Pozwala to rozpoznać nietypowe egzemplarze, np. widziane z niekanonicznej perspektywy - jest to zaleta tej koncepcji.
Perspektywa kanoniczna - widok, który jako pierwszy przychodzi do głowy, czyli prototyp. Perspektywa niekanoniczna odbiega od prototypu.
Doświadczenie Posnera, Goldsmitha i Weltona z 1967 roku:
3 obiekty prototypowe, każdy z nich złożony z 9 kropek. Trzymamy je w ukryciu nie pokazujemy badanemu. Następnie przekształcamy układ tych kropek, czyli każdy z prototypów daje początek innym „figurom” z kropek. Badanemu pokazuję tylko przekształcenie, a badany musi klasyfikować te obiekty do 5 kategorii (robi to w ciemno). Na podstawie naszej informacji zwrotnej badany uczy się, który obiekt do której kategorii należy zakwalifikować. W 2 fazie znowu pokazujemy przekształcenia, które badany ma klasyfikować, ale pokazujemy mu również nowe przekształcenia, a dopiero na końcu prototypy.
Wynik:
- ćwiczone przekształcenia: 87% trafności
- nowe przekształcenia: 50% trafności
- prototypy (wcześniej nie widziane): ok. 87% trafności.
Wniosek z tego taki, że można nigdy nie spotkać prototypu, ale mieć o nim pewną wiedzę!. Jest to pseudopamięć o prototypach.
Zaletą tej koncepcji jest to, że teoria prototypów jest intuicyjna.
Dlaczego nie mylimy O i Q? - teoria prototypów nie potrafi tego wyjaśnić (jest to wada tej koncepcji). Teoria prototypów nie uwzględnia kontekstu, więc nie jest to argument na obronę. Teoria template matching - dopasowanie wzorca - zdecydowanie lepiej wyjaśnia nie mylenie O i Q. Być może każdy z omawianych mechanizmów odgrywa rolę na innym etapie lub wobec innych obiektów.
Feature analysis - analiza cech
Etap 1: rozłożenie na najprostsze elementy składowe: Arrow: / - \ ^
Etap 2: szukanie w głowie, jaki obiekt ma takie cechy; dopasowanie do cech obiektów, jakie są nam znane. Nie wszystkie cechy muszą być analizowane. Jednak zakłada się w tej teorii skomplikowaną i długą analizę na początku przetwarzania. Co przemawia na rzecz tej teorii? 1) doświadczenia Hubela i Wiesela z reakcjami komórek V1 (pierwszorzędowa kora wzrokowa) - kodowanie bardzo prostych cech; 2) analiza ruchów oczu: zbieramy cząstkowe informacje i na tej podstawie budujemy obraz świata (doświadczenie Yarbusa).
Recognition by components - rozpoznanie przez elementy. Nawiązuje ono do teorii analizy cech; twórca: Irving Biederman. Teoria ta zakłada, że każdy obiekt składa się z geonów (geometrycznych jonów). Istnieją 24 genomy trójwymiarowe. Czy 24 geony wystarczą? - tak, ponieważ mogą być połączone ze sobą na wiele sposobów. Rózne kombinacje dwóch geonów dają 10 milionów dwugeonowych obiektów. Wg. Biedermana posługujemy się zaledwie ok. 30 tys. Kombinacji geonów, a nazwy mamy tylko dla 3 tys. Na rzecz teorii geonów przemawia: 1) w danej części płata skroniowego są neurony aktywowane przez widok obiektu, niezależnie od perspektywy (np. rower rozpoznajemy w każdej pozycji, czy leży, czy jest odwrócony do góry nogami; 2) rozpoznanie obiektu, z którego usunęliśmy część konturów będzie znacznie utrudnione, jeśli brakuje informacji o połączeniach geonów i ich charakterze. Co przemawia przeciw tej teorii? 1) ta teoria nie potrafi wyjaśnić, w jaki sposób odróżniamy poszczególne egzemplarze w jednej kategorii (np. w jaki sposób odróżniają swój piórnik w kształcie walce od pozostałych piórników w kształcie walca. Geony trudniej odszukać w istotach żywych. Geony w sztuce: kubizm („Chłopka” Picasso; „Bombardowanie Guernici” Picasso, 1937).
Jak rozpoznajemy obiekty?
top-down lub bottom-up
od części do całości (asocjacjonizm)
przez całość do części (Gestalt)
percepcja pośrednia / bezpośrednia.
Przykład: jak rozpoznajemy krzesło według 4 teorii?
template matching (dopasowanie wzorca) pamiętamy kolejność neuronów;
prototype matching (dopasowanie do prototypu) pewne cechy kluczowe krzesła;
feature analysis (analiza cech) rozkładamy na elementy i dopasowujemy do obiektu najbardziej podobnego;
recognition by components (rozpoznanie przez elementy; teoria Geonów) patrzę na geony i jak są one ze sobą połączone.
Nazwa
|
Template matching
|
Prototype matching |
Feature analysis |
Recognition by components |
Rozpoznanie polega na
|
Dopasowanie Wzorzec aktywacji - wzorzec w mózgu |
Znalezienie kategorii podobnego obiektu |
Rozłożenie na bardziej podstawowe elementy |
Rozłożenie na geony |
Przesłanka czy zaleta
|
Rozpoznanie musi polegać na znalezieniu w umyśle wcześniej istniejącego odpowiednika |
Pozwala rozpoznać nietypowe egzemplarze, jest szybkie |
Komórki V 1 kodują bardzo proste cechy, ruchu oczu |
Rozpoznanie rodzaju geonu i połączenia daje rozpoznanie obiektu 3D |
Trudność lub wada
|
Posiadanie niezliczonej ilości template'ów, długie rozpoznanie |
Nie mylimy obiektów różniących się detalem |
Bardzo skomplikowane procesy na początku przetwarzania, odróżnienie np. X od V |
Geony u istot żywych, odróżnianie egzemplarzy kategorii |
Rozpoznawanie twarzy i konfiguracji
szybsze i trafniejsze niż innych obiektów
mimo, że różnią się detalami
nawet po 35 latach od skończenia szkoły średniej rozpoznawane jest 90% twarzy kolegów
dlaczego twarze są dla nas takie ważne?
- bo pokazują emocje
- rozpoznawanie siebie
Niemowlęta
preferują kontrastowy schemat twarzy:
odróżnianie twarzy matki od 3 miesiąca życia, a może i kilka dni po urodzeniu
4 miesiąc życia: inna reakcja na twarze obce i znane
Prozopagnozja
Zaburzenie, które polega na nieumiejętności rozpoznawania twarzy. Jest t o kontinuum - czyli różny jest poziom tej umiejętności, dopiero skrajne nierozpoznawalnie to prozopagnozja. Prozopagnozja jest skutkiem uszkodzenia tylno - dolnej części płata skroniowego. Odruch skórno - galwaniczny, gdy twarz jest znajoma (czy się pocimy bardziej, czy mniej).
Podstawowe Procesy Poznawcze: wykłady
Dr Blandyna Żurawska vel Grajewska
Semestr 2
- 3 -