TEMAT: Opisz zasady uczenia się w modelu warunkowania.
W definicji podanej przez Andersona uczenie się jest procesem, poprzez który na skutek doświadczenia zachodzą względnie trwałe zmiany w potencjale zachowaniowym. Z tej definicji wynika, że uczenie się prowadzi do zmiany, która jest kluczowa dla uczenia się. Jeśli rzeczywiście się czegoś nauczymy, jesteśmy po tym chociaż trochę inni, niż byliśmy przedtem. Zawarte w definicji określenie „potencjału zachowaniowego” oznacza, że nie musimy od razu stosować tego, czego się nauczyliśmy. Liczy się, że możemy tą zdobytą wiedzę wykorzystać w tedy, gdy sami tego chcemy. Natomiast „względna trwałość zmian” oznacza, że nie można traktować jako uczenia się przemijających zmian w naszym zachowaniu, które mogą być wywołane np. zmęczeniem.
Przytoczona wyżej definicja wiąże uczenie się z zachowaniami. Koncentracja na zachowaniach ma swoje początki w nurcie zwanym behawioryzmem, który zakładał, że nie ma sensu próbować zrozumieć co dzieje się w mózgach, a zatem i w umysłach organizmów podczas uczenia się, skoro nie ma do tego bezpośredniego dostępu. Behawioryści uważali, że należy skupić się na tym, co daje się zaobserwować i badać według naukowych rygorów, czyli na zachowaniach, a konkretniej na zmianach zachowań. Czyniąc to, behawioryści koncentrowali się głównie na dwóch mechanizmach: warunkowaniu klasycznym oraz warunkowaniu instrumentalnym.
WARUNKOWANIE KLASYCZNE
Pojęcie warunkowania klasycznego zostało ukształtowane m.in. pod wpływem badań rosyjskiego fizjologa, Iwana Pawłowa, dlatego określa je się czasem warunkowaniem pawłowowskim. Jest to proces, w którym początkowo obojętny bodziec nabiera właściwości wywoływania reakcji przez skojarzenie z bodźcem, który wywołuje już podobną reakcję.
Najbardziej znanym i podstawowym przykładem warunkowania klasycznego jest wykonany przez Pawłowa eksperyment dotyczący ślinienia się psów.
Stwierdził on, że podanie psu pokarmu do pyska wywołuje u niego wydzielanie śliny. Reakcję tę Pawłow nazwał odruchem lub reakcją bezwarunkową, ponieważ występuje ona bez uczenia się, w sposób utrwalony dziedzicznie. Pokarm zaś jest bezwarunkowym bodźcem dla tej reakcji. Jeśli bezpośrednio przed podaniem psu pokarmu zadzwoni dzwonek, to po kilku próbach na sam dźwięk dzwonka pies zaczyna wydzielać ślinę. Przed eksperymentem dzwonek nigdy nie wywoływał u psa reakcji ślinienia, a więc nauczył się on, że bodziec, który zawsze pojawia się przed jedzeniem, jest sygnałem karmienia. Tego typu bodziec Pawłow nazwał bodźcem warunkowym, a efekt wywołany przez niego, czyli w tym wypadku ślinienie, reakcją warunkową lub odruchem warunkowym. Dzięki warunkowaniu klasycznemu można uzyskać reakcję wydzielania śliny na dowolny sygnał obojętny, wystarczy tylko regularnie go powtarzać w towarzystwie bodźca bezwarunkowego.
1.
POKARM REAKCJA (ślinienie się)
Bodziec bezwarunkowy (bb) Reakcja bezwarunkowa (rb)
wywołuje reakcję wywołana przez bodziec
bezwarunkową bez bez uczenia się
uczenia się
2.
DŹWIĘK DZWONKA + POKARM
Bodziec warunkowy, który zaczyna bodziec bezwarunkowy
wywoływać reakcję warunkową po
skojarzeniu z bodźcem bezwarunkowym
REAKCJA (ślinienie się)
Reakcja warunkowa (rw) wywołana przez
bodziec warunkowy, która pojawia się po skojarzeniu bodźca warunkowego z bodźcem bezwarunkowym
Innym przykładem może być strachliwa reakcja, np. krzyk, na huk wybuchu. Taka osoba na odgłos wybuchy (czyli bodziec bezwarunkowy) reaguje krzykiem (jest to reakcja bezwarunkowa). W momencie, gdy jednocześnie będzie się zapalało światło (czyli w tym przypadku bodziec warunkowy) i słychać będzie ten dźwięk, również wystąpi strachliwa reakcja. Po pewnym czasie taka osoba na samo zapalenie się światła będzie reagowała krzykiem, więc nastąpi reakcja warunkowa.
WARUNKOWANIE INSTRUMENTALNE
Zasadniczy wkład do badań nad warunkowaniem instrumentalnym wniósł Burrhus F. Skinner. Odkrył on, że organizm uczy się wykonywania lub powstrzymywania się od wykonania danej reakcji w zależności od tego, jakie pojawiają się wraz z wykonaniem reakcji konsekwencje. Konsekwencje mogą być atrakcyjne lub awersyjne.
Podstawą warunkowania instrumentalnego jest założenie, że zachowania nagradzane są podejmowane chętniej i szybciej niż te, które nie są nagradzane. Z kolei zachowania częściej przejawiane, w miarę ich powtarzania, są coraz sprawniejsze, lepiej wyuczone, zatem, aby nauczyć organizm jakiejś umiejętności, należy obserwować jego działania i nagradzać te, które idą w pożądanym kierunku, gdyż warunkowanie instrumentalne wymaga od badanego organizmu wykonania określonej reakcji lub powstrzymania się od niej (reakcje te zwane są reakcjami instrumentalnymi lub sprawczymi). Warunkowanie instrumentalne jest dobrym wytłumaczeniem w jaki sposób zachodzi proces uczenia się. Tworzy ono ścisły związek pomiędzy zachowaniem i jego skutkami.
Przykładem warunkowania instrumentalnego jest np. tzw. skrzynka Skinnera, w której zamyka się zwierzę. Gdy chce ono otrzymać pokarm, musi nacisnąć dźwignię. Początkowo odbywa się to na zasadzie prób i błędów, jednak po pewnym czasie zwierze automatycznie naciska dźwignię, gdy jest głodne.
ZACHOWANIE X (próba zdobycia pokarmu)
EFEKT Y (po X)
Nie zdobycie pokarmu
Y WYWOŁUJE ZMIANĘ W X mimo jego bliskości
Zmiana metody zdobycia pokarmu, co w
końcowym efekcie prowadzi do naciśnięcia
dźwigni
GENERALIZACJA BODŹCA
W warunkowaniu instrumentalnym, podobnie jak w klasycznym, następuje generalizacja bodźca. Jest to zjawisko uogólnienia lub wywoływania reakcji nie tylko przez bodziec, który ją wywołał, lecz także przez inne bodźce do niego podobne. Np. gołąb, który nauczył się uderzać dziobem w narysowane kółko, może reagować także na narysowany owal, ponieważ są to podobne figury. Jeżeli nie reaguje na owalną figurę znaczy, że wzmocnione zostało dziobanie koła. W takim wypadku wcześniej nastąpiło różnicowanie bodźców. Gołąb dostawał tylko pokarm za dziobanie w koło, więc nauczył się, że dziobanie w inne elementy nie przynosi korzyści.
WZMOCNIENIE
W warunkowaniu klasycznym wzmocnienie jest jednoznaczne z bodźcem bezwarunkowym. Pies będzie się ślinił na dźwięku dzwonka, pod warunkiem, że wcześniej przez pewien czas (długość tego okresu jest cechą indywidualną) będzie otrzymywał pokarm zaraz po jego usłyszeniu. Aby ślinienie z czasem nie zanikło, przynajmniej od czasu do czasu, musi być wzmacniane faktycznym podaniem pokarmu.
W warunkowaniu instrumentalnym wzmocnienie (np. podawany pokarm) podtrzymuje i utrwala reakcję pozwalającą uzyskać efekt oczekiwany przez organizm. W warunkach eksperymentalnych wzmocnienie zwykle podtrzymuje nawyk naciskania dźwigni w klatce Skinnera przez umieszczone w niej zwierze.
Można wyróżnić dwa typy wzmocnienia:
- wzmocnienie pozytywne, którego efektem jest powstanie i podtrzymanie wyuczonej reakcji w odpowiedzi na bodźce warunkowe, rzadziej jej intensyfikacja.
- wzmocnienie negatywne, które oznacza sytuację w której po bodźcu warunkowym nie pojawia się stosowane dotychczas wzmocnienie pozytywne (zwane po prostu wzmocnieniem). Najczęściej służy do wytworzenia odruchu negatywnego, powstrzymującego organizm od reakcji na wcześniej utrwalony bodziec warunkowy. Wzmocnienie negatywne bywa stosowane w procesie wygaszania dla porównania jego właściwości z warunkowaniem albo w procesie różnicowania. W środowisku naturalnym warunkowanie negatywne pozwala zwierzęciu uczyć się metodą prób i błędów i zmniejszać stopień generalizacji elementów otoczenia.
Wzmocnienie w warunkowaniu od kary różni się tym, że wzmaga tylko zachowania pożądane, a te niepożądane po prostu „ignoruje”. Po pewnym czasie przestają one się pojawiać, ponieważ nie są opłacalne z punktu widzenia organizmu. Natomiast kara jest bodźcem wywołującym ból lub inne nieprzyjemne odczucia, które w efekcie mają spowodować to, że karany organizm dostosuje się do wymogów i zależnie od sytuacji przestanie wykonywać niepożądane czynności.