Uczenie się we właściwym sensie tego słowa odnosi się do tych form zachowania, które są zaprogramowane w wyniku uczenia się. Prototypem elementarnego uczenia się, które jeszcze w znacznym stopniu wykorzystuje reakcje wrodzone, jest warunkowanie klasyczne, tzw. pawłowowskie. Najprostszą formą uczenia się nowych reakcji jest warunkowanie instrumentalne. Bardziej złożone formy uczenia się, jak nabywanie różnych umiejętności, uczenie się znajdowania drogi w labiryncie, orientacji przestrzennej itp., oparte są zarówno na prawidłowościach warunkowania klasycznego, jak i warunkowania instrumentalnego. Odrębnym rodzajem jest uczenie się przez rozwiązywanie problemów, tzw. poznawcze. Występuje ono w różnych formach, od uczenia się przez próby i błędy, do uczenia się metodą wglądu i wyboru odpowiednich metod czy strategii rozwiązania. U człowieka uczenie się poznawcze w sposób decydujący dominuje nad innymi bardziej elementarnymi rodzajami uczenia się. Może ono przybierać formę świadomego, zamierzonego uczenia się.
Warunkowanie klasyczne
Eksperymenty nad warunkowaniem przeprowadził jako pierwszy l. P. Pawłow. Stwierdził on, że podanie psu pokarmu do pyska wywołuje u niego wydzielanie śliny. Reakcję tę Pawłow nazwał odruchem lub reakcją bezwarunkową, ponieważ występuje ona bez uczenia się, w sposób niezmienny, utrwalony dziedzicznie; pokarm zaś jest bezwarunkowym bodźcem dla tej reakcji.
Następnie zaobserwował, że jeśli bezpośrednio przed podaniem psu pokarmu zadzwoni dzwonek, to po kilku próbach na sam dźwięk dzwonka pies zaczyna wydzielać ślinę. Przed eksperymentem dzwonek nigdy nie wywoływał reakcji ślinienia u psa, a więc nauczył się on, że bodziec, który zawsze pojawia się przed jedzeniem, jest jego sygnałem. Tego typu bodziec Pawłow nazwał bodźcem warunkowym, a wydzielanie śliny na dzwonek — reakcją warunkową lub odruchem warunkowym. Odruch taki wytwarza się dzięki wielokrotnemu łączeniu się dźwięku dzwonka z pokarmem, co Pawłow określił jako wzmocnienie bodźca warunkowego (poprzednio obojętnego) przez bodziec bezwarunkowy.
Reakcja warunkowa nie jest tożsama z reakcją bezwarunkową, jakkolwiek najczęściej stanowi jej komponent — wydzielanie śliny jest częścią całej złożonej reakcji jedzenia. Może ona wytworzyć się i utrwalić tylko wtedy, gdy zostaną spełnione następujące podstawowe warunki.
Styczność w czasie bodźca warunkowego i bodźca bezwarunkowego.
Bodziec warunkowy zwykle wyprzedza nieco bodziec bezwarunkowy. Chodzi tu o to, aby początek zadziałania bodźca warunkowego następował przed pojawieniem się bodźca bezwarunkowego. Optymalny przedział czasowy wynosi tu ok.0,5 sek. (Kimble, 1968). Bodźce te mogą występować razem lub też jeszcze przed pojawieniem się bodźca bezwarunkowego przestaje działać bodziec warunkowy. Ta ostatnia procedura nazywa się warunkowaniem na śladach bodźca warunkowego.
Powtarzanie sytuacji, w której występują oba bodźce.
Nieraz dla utrwalenia się odruchu wystarczy jedno lub kilka powtórzeń, czasem trzeba ich aż kilkaset. Ponadto szybkość wystąpienia reakcji warunkowej, jej siła i trwałość zależą od takich czynników, jak:
— siła reakcji bezwarunkowej. Decyduje ona o szybkości powstania odruchu. Siła ta może być traktowana jako odbicie stanu napięcia motywacyjnego czy popędowego organizmu, np. zwierzę najedzone nie uczy się warunkowych odruchów pokarmowych;
— siła bodźca obojętnego, który staje się warunkowym. Jeżeli jest on słabym na granicy progu, warunkowanie może okazać się nawet niemożliwe;
— obecność innych bodźców obojętnych, na tle których przebiega warunkowanie.
Czasem reakcja warunkowa wytwarza się na zespół bodźców; jeśli jednak działają one na różne narządy zmysłowe, mogą powodować wzajemne hamowanie reakcji związanych z tymi bodźcami i osłabienie już istniejącej reakcji warunkowej. Pawłow nazwał to zjawisko hamowaniem zewnętrznym. Dlatego do eksperymentów nad warunkowaniem buduje się pomieszczenia dźwiękoszczelne oraz izolujące od działania innych bodźców.
Do odruchów bezwarunkowych Pawłow zaliczał: pokarmowy, obronny, orientacyjny, płciowy; na ich podłożu mogą powstawać różne odruchy warunkowe. W naturalnych warunkach życia zwierząt odruchy warunkowe pełnią ważne funkcje przystosowawcze do warunków środowiska. Reakcje warunkowe występują oczywiście nie tylko u zwierząt, lecz również u ludzi. Mamy wiele odruchów warunkowych związanych z jedzeniem (i innymi naszymi reakcjami bezwarunkowymi), jak uwarunkowanie na porę posiłku, na widok jedzenia, a nawet pomieszczenia, w jakim zwykle spożywa się posiłki itp. Jednakże u człowieka dominujące stają się bardziej złożone rodzaje uczenia się.
Typowe eksperymenty nad warunkowaniem przeprowadza się wykorzystując odruch pokarmowy i obronny bądź też szereg reakcji fizjologicznych, będących komponentami różnych form zachowania (np. reakcja skórno--galwaniczna, odruch mrugania, zmiany naczyniowe, różne reakcje wydzielnicze związane z regulacją temperatury ciała czy metabolizmem). Wszelkie reakcje fizjologiczne regulowane przez podkorowe ośrodki nerwowe (głównie układu wegetatywnego) dadzą się warunkować i to zarówno u zwierząt, jak i u ludzi (por. badania Bykowa, 1951). Bodźcami warunkowymi dla tych reakcji mogą być zarówno bodźce zewnętrzne, jak i bodźce pochodzące z wnętrza organizmu (interoceptywne i proprioceptywne).
Warunkowanie
instrumentalne
Dzięki procesom warunkowania klasycznego nowe, dotychczas obojętne bodźce stają się sygnałami bodźców bezwarunkowych, a tym samym sygnałami dla pojawienia się reakcji bezwarunkowej.
W toku warunkowania instrumentalnego organizm uczy się tego, że osiągnięcie (lub uniknięcie) bodźca bezwarunkowego jest możliwe dopiero po wykonaniu pewnej określonej reakcji, niezależnej od reakcji bezwarunkowej.
Badania nad tym drugim rodzajem warunkowania wywodzą się z dwu laboratoriów: polskich fizjologów J. Konorskiego i S. Millera oraz psychologa amerykańskiego B. F. Skinn era. Omówimy pokrótce eksperyment Skinnera: głodnego szczura umieszcza się w zamkniętej skrzynce, w której z jednej z wewnętrznych ścianek wystaje dźwigienka. Szczur obwąchuje skrzynkę i wykonuje szereg przypadkowych ruchów. Jednym z nich naciska dźwigienkę, która jest połączona z mechanizmem wprowadzającym do wnętrza skrzynki zasobnik z pokarmem. Po wielu próbach szczur uczy się, że naciśnięcie dźwigienki powoduje pojawienie się pokarmu, i gdy znajdzie się w skrzynce głodny, wykonuje ten ruch tyle razy, aż uzyska dostateczną ilość pokarmu.
Reakcja instrumentalna wykonywana jest z reguły w jakiejś sytuacji bodźcowej. Można więc powiedzieć, że zawsze występują bodźce warunkowe (choćby widok dźwigni) i że, logicznie biorąc, warunkowanie instrumentalne pociąga za sobą wystąpienie warunkowania klasycznego. Reakcjami instrumentalnymi danego organizmu mogą być tylko te, które istnieją w jego repertuarze ruchowym. Skinner (1938) wyróżnia zachowania spontaniczne i zachowania reaktywne. Zachowania reaktywne są wywoływane przez określony bodziec, są to właśnie pawłowowskie reakcje bezwarunkowe: wydzielanie śliny na pobawienie się pokarmu w jamie ustnej, cofanie ręki przy zetknięciu z gorącym przedmiotem itp. Zachowaniami spontanicznie emitowanymi, a więc nie wywoływanymi przez jakiś bodziec specyficzny. mogą być tylko ruchy mięśni prążkowanych kończyn (reakcje ruchowe) i narządów mowy (reakcje werbalne). Mogą one stać się reakcjami instrumentalnymi, jeśli ich pojawienie się powoduje wystąpienie stanu pozytywnego, korzystnego dla organizmu (np. pokarm) lub usunięcie stanu negatywnego, szkodliwego (np. szok elektryczny). Manipulowanie tymi reakcjami za pomocą kar i nagród od dawna było znane treserom zwierząt.
Porównanie obu rodzajów warunkowania
\/\/ obu opisanych rodzajach warunkowania: klasycznym i instrumentalnym, wytwarzają się nowe związki między bodźcami i reakcjami, czyli dokonuje się modyfikacja zachowania. Jakie są zasadnicze różnice między tymi dwoma rodzajami warunkowania?
1. W warunkowaniu klasycznym reakcja warunkowa jest związana z reakcją bezwarunkową. Po prostu pewne komponenty właściwej reakcji na jakiś bodziec bezwarunkowy (pokarm, prąd elektryczny) pojawiają się wcześniej, w związku z innymi bodźcami, czyli zanim nastąpi wzmocnienie. Reakcja warunkowa nigdy nie jest równa pod względem siły czy wielkości reakcji bezwarunkowej, ale jest tego samego rodzaju. Natomiast reakcja instrumentalna, jest różna od reakcji bezwarunkowej, z którą zostaje połączona. Naciskanie dźwigni nie jest składnikiem jedzenia pokarmu.
2. Reakcje instrumentalne (ruchowe, jak również werbalne) mają charakter somatyczny, są zależne od ośrodkowego układu nerwowego, czyli są to tzw. ruchy dowolne. Natomiast reakcje warunkowe (tak jak bezwarunkowe) mogą być zarówno somatyczne (np. obronna reakcja cofania ręki), jak i autonomiczne, zależne od wegetatywnego układu nerwowego (np. ślinienie, skurcz naczyń krwionośnych itp.).
3. Pojawienie się wzmocnienia przy warunkowaniu klasycznym jest niezależne od tego, co czyni organizm. W warunkowaniu instrumentalnym wzmocnienie jest wynikiem określonej reakcji organizmu, a więc jest od tegoż organizmu zależne.
Prawidłowości wykryte w badaniach nad warunkowaniem
Pawłow ustalił szereg prawidłowości rządzących tworzeniem się i przejawianiem odruchów warunkowych. Najważniejsze z nich to: wzmacnianie, powtarzanie (czyli ćwiczenie), wygasanie, generalizacja i różnicowanie. Prawidłowości te stosują się także do warunkowania instrumentalnego.
Wzmocnienie.
Przez wzmocnienie Pawłow rozumiał utrwalenie związku między bodźcem warunkowym a reakcją warunkową przez pojawienie się bodźca bezwarunkowego. Pojęcie to okazało się podstawowe w różnych koncepcjach wyjaśniających proces warunkowania.
Powtarzanie, czyli ćwiczenie.
Przez wielu autorów uważane jest za warunek konieczny wytworzenia się reakcji warunkowej czy instrumentalnej. Pawłow sądził, że powtarzanie wzmocnień po bodźcu warunkowym jest tym, co utrwala związek, jaki wytwarza się między bodźcem warunkowym a reakcją warunkową. są jednak teoretycy, którzy głoszą, że uczenie się, a ściślej związek między bodźcem i reakcją, powstaje w jednej próbie. W wielu poglądach na temat roli powtarzania dominuje przekonanie, że ułatwia ono utrwalenie się danego śladu pamięciowego, a ściślej przejście danego elementu z pamięci krótkotrwałej do pamięci długotrwałej
Wygasanie.
Kiedy po wytworzeniu się odruchu przestanie się go wzmacniać, nastąpi proces wygasania reakcji warunkowej, interpretowany przez Pawłowa jako proces hamowania, który rozwija się w następstwie długotrwałego pobudzenia i powoduje, że reakcja warunkowa na bodziec warunkowy zmniejsza się, pojawia się coraz rzadziej, aż w ogóle zanika. Im wolniejsze i trudniejsze było wytworzenie się odruchu warunkowego, tym szybciej postępuje proces wygasania. Im silniejszy był wytworzony odruch, im częściej się powtarzał, tym powolniejsze będzie jego wygasanie. Nie znaczy to jednak, że reakcja zanika całkowicie lub że bodziec warunkowy staje się z powrotem bodźcem obojętnym. Stwierdzono, że po pewnym czasie zastosowanie tego bodźca może znowu wywołać reakcję bez żadnego uprzedniego ćwiczenia. Zjawisko to Pawłow nazwał samoistnym odnawianiem się odruchu. Jest ono dowodem, że wygasanie nie jest procesem destrukcyjnym, niszczącym wytworzone związki, lecz procesem hamowania, który może ustąpić przy ponownym pobudzeniu.
Generalizacja bodźca i reakcji.
Generalizacja bodźca polega na tym, że reakcję warunkową może wywołać nie tylko określony bodziec stosowany w toku jej wytwarzania, lecz również różne inne bodźce, podobne do niego pod względem sensorycznym. Jeśli np. wytworzymy reakcję warunkową na dzwonek, to różne brzęczyki czy nawet inne dźwięki będą ją także wywoływały Jednakże będzie ona tym słabsza, im mniej bodźce te będą podobne do pierwotnie stosowanego bodźca.
Analogicznie reakcja instrumentalna, jeśli jest zależna od jakiegoś sygnału, wystąpi także na bodźce podobne do niego. Stwierdzono tu jednak jeszcze inną prawidłowość. Otóż sama reakcja instrumentalna zmienia się w toku powtarzania, może się np. przenosić na drugą kończynę (szczególnie gdy właściwa jest skrępowana), może być słabsza lub silniejsza. Tę prawidłowość nazwano generalizacją reakcji.
Istota generalizacji polega na tym, że bodźce nie wzmacniane wywołują ten sam efekt, co bodźce wzmacniane, jeżeli są do nich podobne. Umożliwia to rozszerzenie zakresu wyników uczenia się. Ma to poważne konsekwencje biologiczne, gdyż w naturalnych warunkach organizm rzadko ma do czynienia z identycznymi sytuacjami i wyniki uczenia się nie mogą być w sztywny sposób zależne od jakiejś ściśle określonej sytuacji.
Różnicowanie.
Ten szeroki efekt uczenia się można jednak ograniczyć stosując specjalne zabiegi. Otóż, jeśli nie będziemy wzmacniać bodźców podobnych, czyniąc to tylko w odniesieniu do bodźca właściwego, to reakcje zgeneralizowane zostaną zahamowane, wygaszone. Taki proces hamowania został przez Pawłowa nazwany różnicowaniem. Granice tego różnicowania są wyznaczone przez zmysłowe progi różnicy. Innymi słowy, może ono obejmować tylko zakres bodźców odróżnianych przez dany organizm. Subtelne różnicowanie jest potrzebne w sytuacjach, gdy podobne bodźce wiążą się z odmiennymi reakcjami.