Spotkania 7 i 8 (wykłady 19-24) [17.11.2007]
Procesy uczenia się w sensie psychologicznym
1. Uczenie się w rozumieniu potocznym a psychologiczne ujęcie uczenia się
2. Warunkowanie klasyczne (pawłowowskie) i zjawiska z nim związane
2.1. Generalizacja bodźca
2.2. Wygasanie i wygaszanie reakcji warunkowej
2.3. Różnicowanie bodźców
2.4. Warunkowanie „drugiego rzędu”
2.5. Inne zjawiska związane z warunkowaniem klasycznym
3. Warunkowanie instrumentalne (sprawcze)
3.1. Zjawiska związane z warunkowaniem instrumentalnym
3.2. „Analiza zachowania” jako współczesna kontynuacja badań nad warunkowaniem instru-
mentalnym
3.3. Czynniki kształtujące zachowania instrumentalne
3.3.1. Wzmacnianie pozytywne
3.3.2. Wzmacnianie negatywne
3.3.3. Karanie pozytywne
3.3.4. Karanie negatywne
3.4. Uwagi o terminologii stosowanej w ramach „analizy zachowania”
3.5. „Wzmocnienia pierwotne” a „wzmocnienia wtórne”
3.6. Zasada Premacka
4. Uczenie się przez eksplorację i obserwację i zjawiska z nimi związane
1. Uczenie się w rozumieniu potocznym a psychologiczne ujęcie uczenia się
Oto kilka przykładów tego, co potocznie nazywa się „uczeniem się”.
- Uczenie się słów na pamięć (przyswajanie sobie obcych słówek, zapamiętywanie wiersza, itd.),
- Przyswajanie dużych porcji wiadomości (uczenie się przepisów drogowych, uczenie się do egzaminu z Wprowadzenia do psychologii, itd.),
- Uczenie się dobrego wykonywania jakiejś czynności (bezbłędnego zagrania melodii, wiązania krawata, wykonania tańca, zmiany biegów w samochodzie, itd.),
- Uczenie się złożonych umiejętności (przyswajanie sobie zasad pisania wypracowań, zasad kierowania zespołem, itd.).
Ogólnie mówiąc, w potocznym rozumieniu „uczenie się” jest najczęściej rozumiane jako zamierzone nabywanie wiadomości lub umiejętności związane najczęściej z ćwiczeniem prowadzącym do uzyskania zamierzonego rezultatu.
W psychologii „uczenie się” rozumie się znacznie szerzej.
Po pierwsze, przyjmuje się, że uczą się także zwierzęta. Zwierzętom zwykle nie przypisujemy zamiaru opanowania jakiejś czynności, choć zgadzamy się z tym, że ludzie uczą zwierzęta różnych umiejętności (ludzie tresują zwierzęta).
Po drugie, psycholodzy dostrzegają istotne podobieństwo między „uczeniem się” a „oduczaniem się” . „Oduczanie się”, np. odzwyczajanie się od palenia papierosów także uważa się za przejaw uczenia się. Również zanik pewnych reakcji (np. zanik tremy przed występem, zanik wstydu związanego z rozebraniem się, itd.) traktowany jest w psychologii jako wynik „uczenia się”.
Psycholodzy przez „uczenie się” rozumieją każdą względnie trwałą zmianę w reagowaniu, działaniu, zasobie posiadanych informacji, zasobie umiejętności, o ile jest to zmiana odwracalna i można ją uznać za spowodowaną aktywnością osobnika bądź jakimiś czynnikami środowiskowymi.
Od zmian zachowania i zmian psychiki będących wynikiem uczenia się odróżnia się trwałe zmiany spowodowane dojrzewaniem (np. chłopiec zaczął mówić męskim głosem po „mutacji”) oraz wywołane czynnikami uszkadzającymi (np., ktoś stracił zdolność śpiewania wskutek choroby strun głosowych), a także nietrwałe zmiany zachowania i psychiki spowodowane chwilowym działaniem czynników sytuacyjnych (np. ktoś upił się i używał wulgarnych słów, choć wcześniej ani później tego nie robił).
2. Warunkowanie klasyczne (pawłowowskie) i zjawiska z nim związane
Nazwa „warunkowanie” ma związek z pojęciami „odruch warunkowy” i „reakcja warunkowa”. Za odkrywcę odruchów warunkowych uważa się rosyjskiego fizjologa Iwana Piotrowicza PAWŁOWA (1849 - 1936). Pawłow dokonał swego odkrycia w roku 1901. Sam Pawłow nie używał słowa „warunkowanie”, mówił o „wytwarzaniu odruchów warunkowych” (zob. Ukazatieli…, 1954). Słowo warunkowanie było używane przez behawiorystów, a potem zostało ogólnie przyjęte. Ponieważ Pawłow był pierwszym autorem, który pisał o odruchach warunkowych, przyjęto nazywać opisane przez niego procesy wytwarzania odruchów warunkowych „warunkowaniem klasycznym”, albo „warunkowaniem pawłowowskim”. W roku 1904 Pawłow dostał Nagrodę Nobla, ale nie za odkrycie odruchów warunkowych, lecz za wcześniejsze swe prace z zakresu fizjologii trawienia.
Przyjmijmy w nawiązaniu do sformułowań, jakie można znaleźć w tekście Zimbardo (1999, s. 315, 324), następujące określenia podstawowych terminów:
„Bodziec bezwarunkowy” (Sb, litera S pochodzi od słowa stimulus; używa się też symboli UCS lub US, od unconditioned stimulus) - bodziec biologicznie ważny, tzn. z natury zdolny sam wywoływać odruchową reakcję bez kojarzenia go z jakimkolwiek innym bodźcem.
„Bodziec warunkowy” (Sw, używa się też symbolu CS, od conditioned stimulus) - bodziec pierwotnie obojętny (neutralny), który zaczął wywołać reakcję typową dla bodźca bezwarunkowego, ponieważ występował (był stosowany) wraz z bodźcem bezwarunkowym.
„Reakcja bezwarunkowa” (Rb, litera R pochodzi od słowa response; używa się też symboli UCR lub UR, od unconditioned response) - odruchowa reakcja przystosowawcza na bodziec bezwarunkowy.
„Reakcja warunkowa” (Rw, używa się też symbolu CR, od conditioned response) - odruchowa reakcja przystosowawcza, pojawiająca się w odpowiedzi na bodziec warunkowy, podobna do analogicznej reakcji bezwarunkowej.
W podręczniku Zimbardo (1999, s.315, s.349) występują nie spotykane w innych pracach angielskie przymiotniki jako odpowiedniki polskiego określenia „(bez)warunkowy/a”. Zamiast (un)conditioned w tekście Zimbardo jest (un)conditional. Błąd ten poprawiono w nowszym wydaniu (Gerrig i Zimbardo, 2006, s. 171, 201), niestety również tam pojawiły się oczywiste błędy „literowe”, np. conditionned [s. 171] albo conditined [s. 172] zamiast conditioned.
„Warunkowanie klasyczne czyli pawłowowskie” to podawanie bodźca obojętnego w sposób jednoczesny lub bliski w czasie z bodźcem biologicznie ważnym (bezwarunkowym); w wyniku powtarzania tego typu sytuacji bodziec obojętny zaczyna wywoływać reakcję podobną do tej, jaką wywoływał bodziec biologicznie ważny (w ten sposób bodziec obojętny staje się bodźcem warunkowym).
W terminologii Pawłowa pojawianie się reakcji warunkowej na bodziec warunkowy nazywane jest „odruchem warunkowym” (lub „związkiem warunkowym” ew. „związkiem czasowym”). Termin „odruch warunkowy” to dogodne określenie; pozwala krótko ująć rezultat skutecznego procesu warunkowania.
Przykłady bodźców bezwarunkowych i reakcji bezwarunkowych, stosowanych w badaniach nad warunkowaniem:
1) obecność pokarmu w jamie ustnej (Sb ), wydzielanie śliny (Rb)
2) skierowanie strumienia powietrza w oko (Sb ), zamknięcie powieki (Rb)
3) ukłucie, np. palca (Sb ), cofnięcie palca (Rb)
4) podrażnienie słabym prądem (Sb ), odsunięcie części ciała od źródła prądu (Rb)
Z biegiem czasu w badaniach nad warunkowaniem klasycznym zaczęto rejestrować także pewną reakcję trudną do zaobserwowania „gołym okiem”. Mam na myśli reakcję o nazwie „reakcja skórno-galwaniczna”. Polega ona na zmniejszeniu oporu elektrycznego skóry (a co za tym idzie na wzroście przewodnictwa elektrycznego skóry). Reakcja ta ma miejsce wtedy, gdy skóra pokrywa się drobnymi kropelkami potu. Drobne kropelki potu trudno jest zauważyć „nieuzbrojonym” okiem. Zmniejszenie oporu elektrycznego skóry związane z obecnością potu można natomiast zarejestrować przy pomocy galwanometru - aparatu mierzącego małe natężenia prądu elektrycznego. Dlatego zmiany przewodnictwa (i oporu) elektrycznego skóry nazwano „reakcją skórno-galwaniczną” (galvanic skin response - GSR; inne nazwy to: reakcja psychogalwaniczna, reakcja elektrodermalna).
Dotychczas myślałem o reakcji skórno-galwanicznej (jeśli jest ona odpowiedzią na bodziec bólowy) jako o reakcji bezwarunkowej. Niedawne rozmyślanie nad tą sprawą (styczeń 2007 r.) sprawiło, że przeżyłem pewne wahanie. Wiąże się ono z refleksją, że reakcje bezwarunkowe mają sens przystosowawczy (jedzenie pokarmu jest źródłem niezbędnej energii, odsuwanie się od źródła bólu, chroni ciało przed uszkodzeniem itd.). Tymczasem wzrost przewodnictwa elektrycznego skóry bywa nieprzystosowawczy. Jest nieprzystosowawczy właśnie wtedy, gdy na skórę działa prąd elektryczny z zewnętrznego źródła, a tak właśnie często było w badaniach psychofizjologicznych. Nieprzystosowawczość tej reakcji wynika z osłabienia ochrony przed bodźcem potencjalnie szkodliwym (zmniejszenie oporu skóry nasila przepływ prądu). Sensowne rozwiązanie problemu jest być może takie: reakcją bezwarunkową jest wzrost wydzielania potu. Jest to reakcja przystosowująca ciało do skutków działania bodźca bezwarunkowego w postaci nadmiernego podniesienia ciepłoty ciała. Podniesienie ciepłoty ciała może wynikać ze wzrostu temperatury otoczenia, ale może też być skutkiem emocjonalnej mobilizacji organizmu (skutkiem wzrostu poziomu adrenaliny, szybszego krążenia krwi, uwalniania energii zmagazynowanej w zapasach pokarmowych, itd.). Pocenie się pozwala zmniejszyć temperaturę ciała, jest więc reakcją przystosowawczą. Tzw. reakcja skórno-galwaniczna jest ubocznym skutkiem - przystosowawczej w większości przypadków - bezwarunkowej reakcji wydzielania potu. Ten uboczny skutek jest nie tyle sam w sobie reakcją bezwarunkową, co fizyczną stroną reakcji bezwarunkowej.
Słowo „reakcja” będące składnikiem nazwy „reakcja skórno-galwaniczna” wydaje mi się obecnie mylące. Trzeba by chyba brać to słowo w dodatkowy cudzysłów („<reakcja> skórno-galwaniczna”). Jest to zjawisko fizyczne będące składnikiem (czy aspektem) fizjologicznej reakcji bezwarunkowej polegającej na zwilżaniu skóry potem. Jako zjawisko fizyczne dające się względnie dokładnie i obiektywnie mierzyć, jest wykorzystywane w badaniach nad warunkowaniem klasycznym. Badania wskazują, że pocenie się można stosunkowo łatwo uczynić reakcją warunkową pojawiającą się na wiele różnorodnych bodźców. Możliwość zarejestrowania „<reakcji> skórno-galwanicznej” po zadziałaniu bodźców najpierw obojętnych i nie wywołujących pocenia się, a potem wywołujących owo pocenie się (widoczne w „<reakcji> skórno-galwanicznej”, pozwala udokumentować proces warunkowania zachodzący w czasie eksperymentu. Przykładem badań tego typu są eksperymenty Richarda LAZARUSA wspomniane w Materiałach do Spotkania 5 (na str. 8).
Zestawienie odruchów bezwarunkowych można znaleźć np. w pracy Szewczuka (1962, s. 88-89). Listę typowych bodźców bezwarunkowych i reakcji bezwarunkowych wykorzystywanych w badaniach eksperymentalnych podają Hilgard i Marquis (1968, s. 62).
Zimbardo (1999, s. 317) omówił różne relacje między czasem pojawienia się i działania bodźca warunkowego (Sw) i bezwarunkowego (Sb ).W zależności od tego, jaka relacja wchodzi w grę, mówi się o warunkowaniu następczym, śladowym, równoczesnym lub wstecznym. Zasadniczym i najskuteczniejszym sposobem wytwarzania odruchu warunkowego jest podawanie Sb w chwilę po zadziałaniu bodźca, który ma się stać Sw.. Przez moment Sb i Sw powinny działać razem. Nazywa się to forward conditioning (dosłownie „warunkowanie do przodu”; tłumacz książki Zimbardo użył określenia „warunkowanie następcze”, podobnie jak tłumacz książki Hilgarda i Marquisa (1968, s. 58). Paweł Ostaszewski (2000, s. 100) używa określenia „warunkowanie opóźniające”.
Warunkowanie następcze daje najlepsze rezultaty. Przyjmuje się, że zazwyczaj optymalne opóźnienie Sb w stosunku do Sw powinno wynosić „sekundę lub krócej” (Zimbardo 1999, s.317; Dworetzky, 1988, s. 196 podaje, że „około pół sekundy”).
Aby wytworzył się „odruch warunkowy” na ogół potrzeba wielu „połączeń” bodźca warunkowego z bezwarunkowym, ale są przypadki, że wystarczy jedno połączenie.
2.1. Generalizacja bodźca
W warunkowaniu klasycznym zachodzi zjawisko generalizacji bodźca (stimulus generalization). Polega ono na tym, że po wytworzeniu odruchu warunkowego reakcję warunkową wywołuje nie tylko bodziec warunkowy, ale również bodźce podobne do niego. „Gradientem generalizacji” nazywa się wykres pokazujący zależność między siłą reakcji warunkowej a podobieństwem bodźca wywołującego tę reakcję do wytworzonego bodźca warunkowego (tego, na który wytworzono odruch warunkowy). Wykres taki ma postać linii krzywej, która może być bardziej „płaska” lub bardziej „stroma”. Wykres jest bardziej płaski wtedy, gdy podawane bodźce są bardzo podobne do wytworzonego bodźca warunkowego, bardziej stromy gradient występuje wtedy, gdy oprócz bodźców podobnych (wywołujących silną reakcję wynikającą z generalizacji bodźca) podaje się bodźce mało podobne (wywołujące słabą reakcję wynikającą z generalizacji bodźca). Rysunek 9.4 B w podręczniku Zimbardo (1999, s. 318) jest niedobry: paski po lewej stronie barwy oznaczonej liczbą 5 powinny być jaśniejsze od paska 1 na rysunku 9.4.A, zaś paski po prawej stronie barwy 5 (na rysunku 9.4.B powinny być ciemniejsze od paska 9 na rysunku 9.4.A.
Zjawisko generalizacji bodźca ilustruje słynne doświadczenie Johna WATSONA i Rosalii RAYNOR z 9-miesięcznym chłopcem („małym Albertem”) opisane w ich artykule z 1920 r. (krótką charakterystykę tego badania przedstawiłem w Materiałach do Spotkania 2 na str.5-6, tam też wyjaśniłem, że większość źródeł błędnie podaje nazwisko „Rayner” zamiast prawidłowego „Raynor”). Kiedy „mały Albert” zaczął bać się szczura, okazało się, że boi się też szeregu bodźców, które najwidoczniej przypominają mu szczura (królik, biały futrzany płaszcz, kłębek bawełny, siwa głowa Watsona i maska św. Mikołaja). Podobieństwo pewnych cech tych bodźców, (biały lub zbliżony do białego kolor; „włochatość” przypominająca sierść szczura) do cech bodźca warunkowego wywołującego strach (biały szczur), pozwala uznać, że u Alberta wystąpiła generalizacja bodźca.
Zjawiskiem generalizacji bodźca zajmował się m.in. Stanisław Mika (prof. zw. dr hab., Dziekan Wydziału Psychologii WSFiZ) w swej pracy magisterskiej wykonanej pod kierunkiem prof. Mieczysława Kreutza. Zainteresowani mogą przeczytać sprawozdanie z tych badań w czasopiśmie „Przegląd Psychologiczny” (Mika, 1959). Żartobliwe streszczenie najważniejszego wyniku tej pracy przedstawił prof. Mika w swym szkicu autobiograficznym (Mika, 2000, s. 159).
2.2. Wygasanie i wygaszanie reakcji warunkowej
Dla utrzymania się odruchu warunkowego niezbędne jest, aby po bodźcu warunkowym nadal występował bodziec bezwarunkowy. Jeżeli bodziec bezwarunkowy przestaje się pojawiać po bodźcu warunkowym, reakcja warunkowa słabnie, a następnie zanika. Zjawisko to określa się jako „wygasanie” (Szewczuk, 1962, s. 87; Kurcz, 1992, s.111) lub „wygaszanie”. W podręczniku Zimbardo nie ma rozróżnienia pojęć „wygasanie” / „wygaszanie”; podobnie nie ma go w rozdziale Ostaszewskiego (2000), w obu tych tekstach mówi się tylko o „wygaszaniu”. Jest sens rozróżniać proces naturalnego zanikania odruchu warunkowego zachodzący bez ingerencji człowieka („wygasanie”) oraz działania człowieka, który stara się doprowadzić do wygaśnięcia odruchu warunkowego (takie postępowanie człowieka można określić jako „wygaszanie”). W języku angielskim zarówno „wygasanie” jako zjawisko zachodzące w sposób naturalny, jak i „wygaszanie” jako celowe działanie człowieka, w celu wywołania wygasania, określa się takim samym słowem (extinction).
Zjawisko wygasania wykorzystała współpracownica Watsona, Mary JONES [Czytaj: Dżons] Na przykładzie 3 letniego chłopca wykazała, że można doprowadzić do tego, że przestanie on reagować strachem na widok królika i innych bodźców, których bał się (szczur, futro, pióra, bawełna).
Opis tego doświadczenia znajduje się w Materiałach do Spotkania 2 na str. 6.
Jones pokazywała królika najpierw z dużej odległości, a potem stopniowo z coraz mniejszej, ale zawsze z takiej, by u dziecka nie rozwinęła się reakcja strachu. W ten sposób widok królika, który był na początku bodźcem warunkowym wywołującym strach, tracił swą zdolność wywoływania strachu. Reakcja strachu na widok królika wygasała w przypadku każdego z coraz mniejszych dystansów,w jakich umieszczano królika. Przyczyną wygasania było to, że w przypadku każdej odległości, z jakiej chłopiec oglądał królika, widzeniu królika nie towarzyszył żaden bodziec bezwarunkowy wywołujący strach.
Jednocześnie miało miejsce tworzenie warunkowych odruchów pokarmowych. Ponieważ w czasie pokazywania królika dawano chłopcu słodycze, widok królika stawał się w coraz większym stopniu bodźcem warunkowym reakcji pokarmowych i takich emocji pozytywnych, jakie towarzyszą jedzeniu.
2.3. Różnicowanie bodźców
Procesem „odwracającym” skutki generalizacji bodźca jest „różnicowanie bodźców” (stimulus discrimination). Jeżeli po bodźcach podobnych do warunkowego nie następuje bodziec bezwarunkowy (Sb), to reakcja warunkowa na bodźce podobne wygasa, a pojawia się tylko na właściwy bodziec warunkowy, po którym pojawia się Sb.
Różnicowanie bodźców ma swoje granice.
Pewne procesy różnicowania (wymuszone przez badaczy) okazywały się dla psów Pawłowa skrajnie trudne, zwierzęta popadały w stany nerwicowe (później, kiedy zaczęto je specjalnie badać nazwano je „nerwicami eksperymentalnymi”. Słynne doświadczenie dotyczące skrajnie trudnego różnicowania przeprowadziła badaczka SZENGER-KRESTOWNIKOWA. Wytwarzała ona u psa odruch warunkowy ślinienia się na widok obrazu koła. Gdy obraz koła stał się bodźcem warunkowym i nastąpiła generalizacja bodźca, tak że również obraz elipsy wywoływał ślinienie, badaczka „wymuszała” różnicowanie koła (podawała pokarm) od elipsy (nie podawała pokarmu). Gdy różnice między wyglądem koła i elipsy były duże, zwierzę przejawiało zdolność różnicowania: śliniło się widząc koło i nie śliniło się widząc elipsę. Gdy pokazywane potem koło i elipsa stały się zbyt podobne (stosunek osi elipsy wynosił 8 do 9), zwierzę zaczynało przejawiać reakcje nerwicowe: wyrywało się, wyło, nie chciało jeść mimo głodu itd. Opis tego doświadczenia można znaleźć w polskim tłumaczeniu pracy Iwana PAWŁOWA (1955, s. 97, 206-207). Przedstawia je także Elżbieta FONBERG (1971 s. 14-19).
2.4. Warunkowanie „drugiego rzędu” i wyższych rzędów
„Warunkowaniem drugiego rzędu” nazywa się takie postępowanie, w którym dla wytworzenia nowego bodźca warunkowego używa się - zamiast bodźca bezwarunkowego - bodźca który w pierwszym warunkowaniu stał się bodźcem warunkowym. Gdy pies ślini się już na dźwięk dzwonka, można nowy bodziec obojętny (np. zapalenie lampki) uczynić bodźcem warunkowym, zapalając lampkę (bodziec obojętny) i dzwoniąc dzwonkiem (bodziec warunkowy pierwszego rzędu). Po odpowiedniej liczbie połączeń obu bodźców pies zacznie ślinić się na zapalenie lampki. Lampka stanie się bodźcem warunkowym drugiego rzędu (por. Szewczuk, 1962, s. 91)
U zwierząt możliwe są teoretycznie warunkowania wyższych rzędów, niż warunkowanie drugiego rzędu, ale dają one coraz słabsze wyniki. W „warunkowaniu n-tego rzędu” rolę bodźca bezwarunkowego pełniłby bodziec warunkowy rzędu „n-1”.
Warunkowania wyższych rzędów są prawdopodobnym mechanizmem wytwarzania warunkowych odruchów emocjonalnych u ludzi, a to dzięki językowi, który skutecznie „przenosi” znaczenia emocjonalne z jednych bodźców na inne. Małe dziecko, które słyszy od mamy słowo „be” i odczuwa ból z powodu klapsa (wywołującego ból i strach), szybko zaczyna doświadczać tych samych odczuć na samo słowo „be”. Można interpretować to zjawisko jako warunkowanie pierwszego rzędu, w którym klaps jest bodźcem bezwarunkowym a słowo „be” staje się bodźcem warunkowym. W dalszych procesach warunkowania słowo „be” kojarzone jest z innymi słowami („brzydko”, „no, no !”, „nie wolno” itd.) i „przenosi” odczucia, które zaczęło wywoływać, na te nowe słowa.
2.5. Inne zjawiska związane z warunkowaniem klasycznym
Gdy w regularnych odstępach czasu pojawia się tylko sam bodziec bezwarunkowy (Sb), bez jakiegokolwiek wyraźnego bodźca poprzedzającego, który mógłby być uznany za warunkowy, po pewnym czasie w tych samych odstępach czasu pojawia się reakcja typowa dla stosowanego Sb. Mówimy wtedy o „warunkowaniu na czas”, najwidoczniej bodźce wewnętrzne związane z upływem określonego odcinka czasu stają się bodźcem warunkowym, zaś reakcja z powodu nieobecności Sb może być nazwana warunkową. Pawłow stwierdził, że reakcja warunkowa na upływ czasu u psów może wystąpić nawet przy zastosowaniu odcinków 30 minutowych (Hilgard i Marquis,1968, s.59). Ostaszewski (2000, s.100) używa mniej udanego terminu „warunkowanie czasowe”.
Szereg badaczy zajmujących się warunkowaniem u zwierząt próbowało dociec, co jest najważniejsze dla tworzenia się odruchów warunkowych.
Robert RESCORLA wykazał, że dla skutecznego warunkowania ważna jest nie sama styczność (bliskość) w czasie bodźca warunkowego i bezwarunkowego, ale stopień, w jakim występuje rzeczywista zależność (contingency) pojawienia się bodźca bezwarunkowego od uprzedniego wystąpienia bodźca warunkowego. Zależność ta jest całkowita, gdy po bodźcu warunkowym zawsze występuje bodziec bezwarunkowy, a bez bodźca warunkowego bodziec bezwarunkowy nie występuje nigdy. Zależność taka może nie być całkowita, lecz zachodzić z pewnym prawdopodobieństwem. Tłumacze podręcznika Zimbardo przetłumaczyli słowo „contingency” jako „zbieżność” (Zimbardo, s.321, 323, 324); Paweł Ostaszewski (2002, s. 101) używa określenia „zależność”, wydaje mi się, że słowo „zależność” lepiej oddaje istotę sprawy. Z badań Rescorli wynika, że sama styczność bodźca warunkowego z bezwarunkowym nie wystarcza do wytworzenia się reakcji warunkowej.
Leon KAMIN ustalił prawidłowości, które bywają określane mianem „efektu zacieniania” (overshadowing) oraz „efektu blokowania” (blocking). Oba zjawiska związane są ze stosowaniem dwu bodźców warunkowych jednocześnie.
„Zacienianie” polega na tym, że jeśli bodziec bezwarunkowy poprzedzany jest przez dwa bodźce warunkowe jednocześnie działające, to jeden z nich, bardziej wyrazisty - czyli łatwiejszy do zauważenia - staje się bodźcem warunkowym (zaczyna wywoływać reakcję), a drugi nie staje się bodźcem warunkowym ( ten drugi jak gdyby znalazł się „w cieniu”, został „zacieniony” czy „przysłonięty” przez bodziec bardzo wyrazisty).
„Blokowanie” jest zjawiskiem, które ma miejsce już po wytworzeniu reakcji warunkowej. na pojedynczy bodziec warunkowy. Dodanie drugiego bodźca nie uczyni go warunkowym, chyba że od momentu dodania bodziec warunkowy stanie się słabszy. Wtedy ten drugi, dodany bodziec stanie się zdolny hamować, lub, inaczej mówiąc, „blokować” reakcję warunkową (Ostaszewski, 2000, s. 103).
Współcześnie uważa się, że proces warunkowania klasycznego może być drogą, na której kształtuje się olbrzymia liczba reakcji emocjonalnych człowieka, a więc reakcji, które są przyczyną wielu naszych upodobań i awersji w tym także lęków. Używając innego terminu można powiedzieć, że warunkowanie klasyczne ma olbrzymi wpływ na postawy ludzi. Dobrze oddaje ten pogląd ciekawa wypowiedź Zimbardo na str. 321 („Niemal każdy bodziec….”).
3. Warunkowanie instrumentalne (sprawcze)
Większość autorów używa zamiennie terminów : „warunkowanie instrumentalne” (instrumental conditioning) i „warunkowanie sprawcze” (operant conditioning). Inny pogląd ma profesor Maria Materska (2001, s.100 -106), która sugeruje, że terminu „warunkowanie instrumentalne” powinno się używać w odniesieniu do takich procesów, jak te, którymi zajmował się Edward THORNDIKE, który około 1910 r. sformułował tzw. „prawo efektu”, które można tez nazwać prawem skutku (Law of Effect). Zgodnie z tym prawem reakcje ujawniane w danej sytuacji umacniają się, jeżeli po nich następuje przyjemność, a osłabiają się, jeżeli po nich następuje przykrość. Thorndike jest znany jako autor badań nad szybkością wydostawania się przez koty ze skrzynek-„łamigłówek” (puzzle-box), zwanych też „skrzynkami Thorndike'a”. Materska zwraca uwagę na fakt, że Thorndike badał, jak zwierzęta uczą się nowych reakcji, które dzięki pozytywnym skutkom stają się instrumentem czyli narzędziem pozwalającym uzyskać pożądany rezultat.
Zdaniem Materskiej termin „warunkowanie sprawcze” ma zastosowanie do procesów, jakie badał Frederick B. SKINNER. Zwierzęta badane przez Skinnera (gołębie i szczury) nie były uczone nowych reakcji / działań. Musiały tylko odkryć, jak sprawić, aby proste znane im działania (dziobanie, naciskanie na dźwignię) przynosiły im pożądane skutki (otrzymanie jedzenia). Zwierzę miało odkryć, w jakie miejsce uderzać dziobem, w jakim tempie to czynić itd., aby uzyskać pokarm. Zwierzęta w badaniach Skinnera musiały być aktywne, oddziałujące operatywne, dlatego ich zachowanie określał Skinner jako „sprawcze” (operant behavior) zaś cały proces dochodzenia przez zwierzę do tego, co sprawia, że do klatki wpada pokarm, nazywał „warunkowaniem sprawczym”. Nazwisko Skinnera stało się eponimem (określeniem pochodzącym od nazwiska) klatek, w których Skinner trzymał i badał zwierzęta („skrzynki Skinnera”, w książce Zimbardo zostały nazwane „komorami sprawczymi”).
Inni autorzy nie zwracają uwagi na powyższe różnice podkreślane przez Materską, lecz zauważają podobieństwo sytuacji Thorndike'owskiego kota i Skinnerowskiego gołębia czy szczura: każde z badanych zwierząt uczy się uwzględniać pozytywne i negatywne skutki swych działań / reakcji, uczy się wykonywać to, co przynosi pozytywne skutki, a powstrzymywać się od działań, które przynoszą negatywne skutki.
Tak więc przyjmiemy, że warunkowanie instrumentalne (= warunkowanie sprawcze) to proces, w którym następuje uczenie się związków między aktywnymi działaniami a ich pozytywnymi lub negatywnymi konsekwencjami. Działanie staje się (sprawczym) instrumentem służącym zapewnieniu sobie pozytywnych skutków; działanie może stać się także (sprawczym) instrumentem służącym uniknięciu negatywnych skutków.
3.1. Zjawiska związane z warunkowaniem instrumentalnym
W sytuacjach warunkowania instrumentalnego występują również prawidłowości związane z wygasaniem, generalizacją, różnicowaniem i wygasaniem. W tym przypadku owe zjawiska dotyczą nie właściwości bodźców lecz właściwości reakcji.
„Generalizacja reakcji” polega na tym, że oprócz czynności (szeregów reakcji), które przyniosły dobre skutki zwierzę zaczyna wykonywać działania podobne do tych, które okazały się korzystne.
U zwierząt trenowanych przez Skinnera następowało potem „różnicowanie reakcji”. Uczyły się bowiem odróżniać reakcje „właściwe” (nagradzane pokarmem) od reakcji podobnych do nich (lecz nie nagradzanych)
Zwierzęta uczyły się też zauważać, czym różnią się sytuacje, w których dane zachowanie przynosiło im dobre skutki od sytuacji, w których takie samo zachowanie nie przynosiło im dobrych skutków albo przynosiło im złe skutki. Cechy różniące owe korzystne i niekorzystne sytuacje Skinner nazywał „bodźcami dyskryminacyjnymi” czyli pozwalającymi na różnicowanie ( por. Zimbardo, s. 330). Tłumaczka książki Mietzela (2003, s. 170) użyła trafnego, ale mało rozpowszechnionego określenia „bodźce różnicowe”.
Skinner poświęcił wiele uwagi różnym regułom, zgodnie z którymi można stosować nagrody pokarmowe. Reguły stosowania owych nagród nazywał „rozkładami wzmacniania” (schedules of reinforcement).
Są cztery zasadnicze rozkłady wzmacniania:
a) „stała proporcja” (fixed ratio, w skrócie FR)) - wzmacniana jest każda n-ta reakcja, np. „co trzecia” albo „co dziesiąta” (symbole tych rozkładów to: FR-3 i FR-10)
b) „zmienna proporcja” (variable ratio, w skrócie VR) - wzmocnienia są stosowane nieregularnie, przypadkowo, przy zachowaniu pewnej ich przeciętnej liczby. W rozkładzie VR-3 wzmacniana jest przeciętnie co trzecia reakcja, co może oznaczać, że w pierwszej serii piętnastu reakcji wzmocnienia wystąpią po reakcjach numer 2, 5, 10, 11 i 14, w następnych 15 reakcjach wzmocnienia mogą wystapić po reakcji 3, 5, 6, 7 i 12, itd. Za każdym razem na 15 reakcji 5 jest wzmacnianych, ale uczące się zwierzę nie może dokładnie przewidzieć, kiedy wystąpi wzmocnienie.
c) „stały odstęp czasowy” (fixed-interval, w skrócie FI). Czas ten może być wyrażony w sekundach, wtedy rozkład o symbolu FI-15 oznacza, że między kolejnymi wzmocnieniami musi upłynąć 15 sekund.
d) „zmienny odstęp czasowy” (variable-interval, w skrócie VI). Zachowuje się pewną wielkość przeciętną odstępu czasowego, np. średnio co 10 sekund, ale wzmocnienia mogą następować w pierwszej minucie po 4, 13, 19, 35, 49 i 56 sekundzie (6 wzmocnień na minutę, czyli średnio jedno wzmocnienie na dziesięć sekund).
Ostaszewski (2000, s. 112) do wymienionych wyżej rozkładów wzmocnień dodaje jako typowy rozkład jeszcze jeden: tzw. „rozkład ciągły” (continous reinforcement, w skrócie - CRF), w którym wzmacniana jest każda prawidłowa reakcja.
Stwierdzono, że nieregularne wzmocnienia pozytywne wprawdzie zwalniają tempo uczenia się, ale sprawiają, że zachowanie długo utrzymuje się nawet przy braku wzmocnień pozytywnych Mówi się w związku z tym, że zachowania wzmacniane pozytywnie w sposób nieregularny są bardzo „oporne na wygaszanie”. Zjawisko to nosi także nazwę „efektu wzmacniania częściowego” (Zimbardo, s. 335). W podręczniku Mietzela (2003, s. 170) użyty jest termin „wzmocnienie sporadyczne”. Pewien gołąb, którego wzmacniano według rozkładu „zmienny odstęp czasowy” po wykonaniu 18 000 dziobnięć w ciągu 4 godzin, potrzebował 168 godzin, w czasie których dziobał bez wzmocnień, aby jego zachowanie wygasło (Zimbardo, s. 336)
3.2. „Analiza zachowania” jako współczesna kontynuacja badań
nad warunkowaniem instrumentalnym
Psycholodzy nawiązujący współcześnie do podejścia Skinnera określają dziedzinę, którą zajmują się, jako tzw.„analizę zachowania”(behavior analysis) lub „analizę behawioralną” (zob. Ostaszewski, 2001). Nurt badań podstawowych w tej dziedzinie nazywa się „eksperymentalną analizę zachowania”. Celem badań w ramach tego nurtu jest ustalanie w drodze eksperymentów na zwierzętach i ludziach uniwersalnych praw rządzących zmianami zachowania organizmów pod wpływem zmian sytuacji. Wykorzystywanie owych praw w realnym życiu społecznym jest przedmiotem zainteresowania osób zajmujących się „stosowaną analizą behawioralną”.
Istnieją stowarzyszenia naukowe poświęcone tej problematyce. Od roku 2000 działa Polskie Towarzystwo Analizy Behawioralnej (PTAB). Jego przewodniczącym jest dr Jacek KOZŁOWSKI z Uniwersytetu Gdańskiego a sekretarzem profesor Uniwersytetu Warszawskiego dr hab. Paweł OSTASZEWSKI. Strona internetowa PTAB ma adres: http://www.ptab.univ.gda.pl/ (sprawdziłem 12.11.2007).
Przykładami czasopism zajmujących się analizą zachowania są: Journal of the Experimental Analysis of Behavior (w skrócie: JEAB) [Czasopismo poświęcone eksperymentalnej analizie zachowania]; Journal of Applied Behavior Analysis (w skrócie: JABA) [Czasopismo poświęcone stosowanej analizie zachowania]; The Behavior Analyst [Analityk zachowania].
Autorzy zajmujący się „analizą zachowania” rozróżniają dwa typy bodźców, na które wrażliwe są zwierzęta i ludzie: „bodźce apetytywne” (appetitive stimuli) czyli bodźce pożądane, pozytywne, do których dąży się oraz „bodźce awersyjne” (aversive stimuli) czyli bodźce wzbudzające niechęć, których unika się lub od których ucieka się.
Dla analizy zachowania charakterystyczne jest rozpatrywanie jego zmian w czasie: jakieś zachowanie może stawać się ono w danych warunkach częstsze (bardziej prawdopodobne) lub rzadsze (mniej prawdopodobne).
Jeżeli zachowanie stało się częstsze, przyjmuje się, że skutkiem tego zachowania był jakiś czynnik wzmacniający (reinforcer).
Jeżeli zachowanie stało się rzadsze, przyjmuje się, że skutkiem tego zachowania był jakiś czynnik karzący (punisher).
Wyróżnia się cztery typy skutków zachowania (cztery typy konsekwencji), jakie mogą wystąpić po danym zachowaniu: wzmocnienie pozytywne, wzmocnienie negatywne, kara pozytywna i kara negatywna. Użyłem tu terminów, jakie można znaleźć w słowniku psychologicznym pod red. Jerzego SIUTY z Uniwersytetu Jagiellońskiego (Siuta, 2005, s.120 i 316). W najnowszym polskim wydaniu podręcznika Zimbardo (Gerrig i Zimbardo, 2006, s. 181 - 185) są analogiczne terminy odnoszące się do czynności osób, które wywołują te skutki zachowania. Mam na myśli terminy: wzmacnianie pozytywne, wzmacnianie negatywne, karanie pozytywne i karanie negatywne. W poprzednim polskim wydaniu podręcznika Zimbardo (Zimbardo 1999/2002, s. 328-330) nie było rozróżnienia dwóch rodzajów karania.
3.3. Czynniki kształtujące zachowania instrumentalne
3.3.1. Wzmacnianie pozytywne
Wzmacnianie pozytywne (jako czynność osoby, która chce spowodować wystąpienie jakiegoś zachowania zwierzęcia lub człowieka bądź wzrost jego częstości) to podawanie po tym zachowaniu bodźca apetytywnego.
Przykłady: Matka chce, żeby dziecko częściej starannie pisało. Ilekroć dziecko napisze swój tekst ładnie, matka chwali je; Dziewczyna chce, aby jej chłopak częściej skupiał się na tym, co ona do niego mówi. Ilekroć chłopak jej uważnie słucha, dziewczyna patrzy mu przyjaźnie w oczy; Pracodawca chce, żeby pracownik częściej grzecznie zwracał się do podwładnych. Ilekroć pracownik zrobi tak w obecności pracodawcy, pracodawca uśmiecha się do niego.
W „analizie zachowania” poszukuje się wzmocnień pozytywnych danego zachowania, jeśli jego częstość zwiększyła się (wzrosło prawdopodobieństwo jego pojawienia się). Wzmocnień pozytywnych poszukuje się wśród bodźców apetytywnych, które pojawiały się jako skutek tego zachowania.
Jeśli dziecko zaczęło częściej ładnie pisać i nie wiemy, co spowodowało tę zmianę, można postawić sobie pytanie, jakie bodźce apetytywne pojawiały się jako skutek ładnego pisania. Analiza sytuacji może doprowadzić do zauważenia następujących faktów: matka zaczęła chwalić dziecko po ładnym napisaniu pracy domowej; w tychże sytuacjach babcia zaczęła dawać wnuczkowi słodycze; ojciec mówił mu, że kupi mu rower. Pojawianie się tych bodźców apetytywnych (chwalenie, dawanie słodyczy, obiecywanie roweru) jako konsekwencji ładnego pisania odegrało rolę wzmocnień pozytywnych.
3.3.2. Wzmacnianie negatywne
Wzmacnianie negatywne (jako czynność osoby, która chce spowodować wystąpienie jakiegoś zachowania zwierzęcia lub człowieka bądź wzrost jego częstości) to usuwanie po tym zachowaniu działającego bodźca awersyjnego.
Przykłady: Matka chce, żeby dziecko starannie pisało. Ilekroć dziecko zacznie pisać swój tekst ładnie, matka przestaje gderać; Dziewczyna chce, aby jej chłopak częściej skupiał się na tym, co ona do niego mówi. Ilekroć chłopak jej uważnie słucha, dziewczyna przestaje mu robić docinki; Pracodawca chce, żeby pracownik grzecznie zwracał się do podwładnych. Ilekroć pracownik zrobi tak w obecności pracodawcy, pracodawca przestaje niego groźnie patrzeć.
W „analizie zachowania” poszukuje się wzmocnień negatywnych danego zachowania, o ile jego częstość zwiększyła się (wzrosło prawdopodobieństwo jego pojawienia się). Wzmocnień negatywnych poszukuje się wśród bodźców awersyjnych, które znikały jako skutek tego zachowania.
Jeśli dziecko zaczęło częściej ładnie pisać i nie wiemy, co spowodowało tę zmianę, można postawić sobie pytanie, jakie bodźce awersyjne znikały wskutek ładnego pisania Analiza sytuacji może doprowadzić do zauważenia, że po ładnym napisaniu pracy domowej matka przestawała narzekać na dziecko, oraz że nie musiało ono dłużej siedzieć nad lekcjami. Znikanie tych bodźców awersyjnych (zaprzestawanie gderania przez matkę, ustawanie konieczności siedzenia przy biurku) odegrało rolę wzmocnień negatywnych.
Wzmocnieniem negatywnym dla czynności zażywania lekarstwa jest zniknięcie (bądź zmniejszenie się) bólu.
Wzmocnieniami negatywnymi dla czynności mówienia „przepraszam” może być odstąpienie przez osobę przepraszaną od wymierzenia kary lub osłabienie reprymendy z jej strony.
3.3.3. Karanie pozytywne
Karanie pozytywne (jako czynność osoby, która chce wyeliminować jakieś zachowanie zwierzęcia lub człowieka bądź spowodować zmniejszenie jego częstości) to podawanie po tym zachowaniu bodźca awersyjnego.
Jeśli mały chłopczyk uderza swą siostrę, rodzic może kazać mu wyjść do drugiego pokoju i pozostawać tam, dajmy na to, przez pięć minut. Jeżeli dzieci przyzwyczaiły się w czasie spaceru oddalać od ojca i nie reagować na jego wezwania do powrotu, ojciec, chcąc zaradzić temu, może postanowić, że ilekroć znowu tak zrobią, będą musiały iść razem z nim trzymane przez niego za ręce (ten przykład wziąłem z oglądanego przed chwilą programu „Superniania” [6.01.2007, TVN]).
W „analizie zachowania” poszukuje się kar pozytywnych w stosunku do danego zachowania, o ile jego częstość zmniejszyła się (zmalało prawdopodobieństwo jego pojawienia się). Kar pozytywnych poszukuje się wśród bodźców awersyjnych, które pojawiły się jako skutek tego zachowania.
Znajomi nałogowego kieszonkowca mogą zastanawiać się, dlaczego przestał on brać udział w swym złodziejskim procederze w tramwajach i autobusach. Analiza może doprowadzić do ustalenia, że doświadczył on serii nieprzyjemnych konsekwencji kradzieży: jakiś poszkodowany uderzył go, inny oddał w ręce policji, sąd grodzki ukarał go grzywną, itd.
Kary nie muszą być wymierzane przez ludzi, niektóre są naturalnymi skutkami zachowania, np. ktoś wypije dużo alkoholu a potem ma nieprzyjemne doznania (kara); dziecko bawi się nożem i przetnie sobie skórę (ból jest karą).
3.3.4. Karanie negatywne
Karanie negatywne (jako czynność osoby, która chce wyeliminować jakieś zachowanie zwierzęcia lub człowieka bądź spowodować zmniejszenie jego częstości) to usuwanie po tym zachowaniu działającego bodźca apetytywnego.
Jeśli mały chłopczyk uderza swą siostrę, rodzic może przestać się do niego uśmiechać. Jeżeli dzieci w czasie zabawy za bardzo „szaleją”, rodzic może wyłączyć muzykę, która lubią.
W „analizie zachowania” poszukuje się kar negatywnych w stosunku do danego zachowania, o ile jego częstość zmniejszyła się (zmalało prawdopodobieństwo jego pojawienia się). Kar negatywnych poszukuje się wśród bodźców apetytywnych, które zniknęły bądź osłabły jako skutek tego zachowania.
Jeżeli pewien chłopak ograniczył przeklinanie, to analiza wydarzeń z ostatniego okresu życia może doprowadzić do ustalenia, że bywało szereg razy tak, iż kiedy zaklął, jego dziewczyna przestawała na pewien czas rozmawiać z nim. Takie zachowanie dziewczyny miało charakter kary negatywnej.
3.4. Uwagi o terminologii stosowanej w ramach „analizy zachowania”
„Pozytywność” wzmocnienia i karania ma związek z obecnością bodźca apetytywnego bądź awersyjnego (z jego pojawieniem się bądź nasileniem). Obecność, występowanie czegoś lub nasilanie się czegoś można symbolicznie oznaczyć znakiem „plus”, znakiem pozytywności. W medycynie określa się dany objaw jako pozytywny (dodatni), jeżeli wynik badania wskazuje na jego występowanie. Na przykład za pozytywne objawy schizofrenii uważa się pojawienie się urojeń, halucynacji itd. „Negatywność” wzmocnienia i karania wiąże się z „zanegowaniem” bodźca apetytywnego lub awersyjnego (bodziec taki nie pojawia się, znika lub słabnie). Nieobecność, znikanie lub słabnięcie czegoś można symbolicznie oznaczyć znakiem „minus”, znakiem negatywności.
Ułatwieniem w przyswojeniu sobie predstawionej terminologii będzie następujący rysunek (Rys.1) oparty na rycinie z podręcznika Gerriga i Zimbardo (2006)
Rys.1 Nieco zmodyfikowana reprodukcja ryciny 6.11 z podręcznika Gerriga i Zimbardo (2006, s. 183).
Aby ułatwić zapamiętanie znaczenia poszczególnych pól, zaznaczyłem pola odnoszące się do bodźca apetytywnego - kolorem zielonym („zielone światło” może być symbolem „wolnej drogi”, „zachęty do podążania w danym kierunku”), pola odnoszące się do bodźca awersyjnego - kolorem czerwonym („czerwone światło” może być symbolem „stop”), pola związane z informacją „podaj” - kratką (kratka „zawiera” w sobie dużo „plusów”, znak „plus” może być symbolem wystąpienia czegoś), pola związane z informacją „usuń” - liniami przerywanymi (linie przerywane „składają się” z „minusów”, znak minus może być symbolem nieobecności czegoś).
Przymiotniki „pozytywne” i „negatywne” określające dany rodzaj wzmocnienia, nie odnoszą się do emocji, jakie to wzmocnienie wywołuje. Wprawdzie jest tak, że wzmocnienie pozytywne wywołuje emocje pozytywne i karanie negatywne wywołuje emocje negatywne, ale na tym zgodność się kończy. Wzmocnienie negatywne wywołuje emocje pozytywne a karanie pozytywne wywołuje emocje negatywne.
Trzeba tu dodać, że w dawniejszych pracach psychologicznych, pedagogicznych itp. pojęcie „wzmocnienienia pozytywnego” było traktowane jako synonim nagrody a pojęcie „wzmocnienia negatywnego” występowało jako synonim kary. Jednakże w tym miejscu rozważane są znaczenia pojęć, jakimi posługują się teoretycy i badacze z kręgu zwolenników „analizy zachowania”. Niestety terminologia stosowana przez nich a także sposób definiowania przez nich poszczególnych pojęć nie są jednolite. Np. Ostaszewski (2000, s. 105) rozróżnia „cztery podstawowe rodzaje relacji funkcjonalnych, zachodzących między zachowaniem a jego konsekwencjami”. Wymienia wśród nich: wzmocnienie pozytywne, karę, wzmocnienie negatywne i tzw. „pomijanie” (które definiuje niezbyt jasno, choć prawdopodobnie można uznać to pojęcie za synonim kary negatywnej). Wzmocnienie pozytywne Ostaszewski definiuje bez wskazania na rodzaj bodźca będącego konsekwencją zachowania, podkreśla jedynie w swej definicji, że musi to być konsekwencja zwiększająca prawdopodobieństwo tego zachowania. W ten sposób zaciera definicyjną granicę między tym, co powayżej zostało nazwane wzmocnieniem pozytywnym i wzmocnieniem negatywnym. Prawie całkowicie niespójna z przedstawioną Państwu terminologią jest nomenklatura, jaką posługują się autorki amerykańskie Tavris i Wade (1999, s.191, Tab.5.1). W związku z tym nie dziwię się ich refleksji, którą wyraziły słowami:
„Wiele pokoleń studentów męczy się podczas prób rozróżniania wzmocnień pozytywnych i negatywnych. Możemy jedynie zapewnić czytelnika, że usłyszawszy owe terminy po raz pierwszy, miałyśmy ochotę głośno jęknąć” (Tavris i Wade, 1999, s 191)
3.5. „Wzmocnienia pierwotne” a „wzmocnienia wtórne”
„Wzmocnienie pozytywne pierwotne” to podanie apetytywnego bodźca bezwarunkowego (pokarm, głaskanie). Analogicznie można przyjąć, że „kara pierwotna” to podanie awersyjnego bodźca bezwarunkowego (ból, wstrętny zapach). Wzmocnienie negatywne pierwotne to ustanie lub osłabienie działania awersyjnego bodźca bezwarunkowego (ustanie lub zmniejszenie bólu).
„Wzmocnienie pozytywne wtórne” to każdy bodziec apetytywny, który nie był nim ze swej natury, lecz nabrał apetytywnego znaczenia w toku wcześniejszych procesów uczenia się. Przykładami „wzmocnień pozytywnych wtórnych” są: pokazanie uśmiechu, danie pochwały, danie nagrody pieniężnej, uzyskanie sukcesu itd., itp. „Kara wtórna” to każdy bodziec awersyjny, który nie był nim ze swej natury, lecz nabrał awersyjnego znaczenia w toku wcześniejszych procesów uczenia się. Przykładami „kar wtórnych” są okazanie gniewu, udzielenie nagany, poniesienie straty finansowej, poniesienie porażki. „Wzmocnieniem negatywnym wtórnym” jest uniknięcie „kar wtórnych”.
Wykazano, że małpy wykonują różne czynności, jeżeli otrzymują za to żetony, które mogą wymieniać na przysmaki do jedzenia. Owe żetony są przykładem wtórnych wzmocnień apetytywnych. Wykorzystywanie systemu takich symbolicznych wzmocnień nazywa się w anglojęzycznej literaturze token economy (co można przetłumaczyć jako „gospodarowanie żetonami”, w podręczniku Zimbardo jest mowa o „ekonomii żetonowej”, por. s. 332).
3.6. Zasada Premacka
David PREMACK [czyt. Premak], amerykański badacz zachowań zwierząt, pierwszy zwrócił uwagę, że jako wzmocnienie pozytywne dobrze działa umożliwienie wykonania ulubionej czynności. Ta prawidłowość znana jest pod nazwą „zasady Premacka”. Ściśle biorąc jest to jedna z trzech zasad, jakie on sformułował. W bardziej precyzyjnym sformułowaniu wspomniana zasada brzmi następująco: Zachowanie o większym prawdopodobieństwie wystąpienia może pełnić rolę wzmocnienia pozytywnego dla zachowania o niższym prawdopodobieństwie wystąpienia, o ile stworzy się możliwość, by po zachowaniu mniej prawdopodobnym miało miejsce zachowanie bardziej prawdopodobne.
Zasadę tę ilustruje następujący znany dobrze fakt: dla dzieci nie lubiących odrabiać lekcji a lubiących biegać po podwórku, możliwość wychodzenia na podwórko po odrobieniu lekcji może sprawić, że odrabianie lekcji będzie łatwiej i chętniej podejmowane.
Pozostałe dwie zasady Premacka można znaleźć w rozdziale Ostaszewskiego (2000, s. 111).
W tresurze zwierząt wykorzystuje się procedurę wzmacniania najpierw zachowań choćby trochę podobnych do zachowania, którego zwierzę ma się nauczyć. Potem stopniowo wygasza się te formy działań, które są niewłaściwe, a wzmacnia się te, które stanowią kolejne przybliżenia do czynności, która ma być opanowana. Mówi się w tym przypadku o „metodzie kolejnych przybliżeń”.
Gdy ktoś traci wpływ na skutki swych działań, może stać się apatyczny, smutny, stracić chęć i zdolność analizy sytuacji. Zjawisko to zostało opisane pod koniec lat sześćdziesiątych przez Martina SELIGMANA i Stevena MAIERA jako „wyuczona bezradność”. Stwierdzili oni, że w opisany sposób reagowały psy, które bez względu na to, co robiły, otrzymywały szoki elektryczne. Inni autorzy stwierdzili, że podobnie działa stosowanie w następstwie wszelkich rodzajów działań bodźców apetytywnych. Uczeń dostający zawsze dobre oceny, bez względu na jakość swych prac, również może popaść w wyuczoną bezradność.
4. Uczenie się przez eksplorację i obserwację i zjawiska z nimi związane
Edward TOLMAN prowadząc doświadczenia na szczurach, którym stwarzał przeszkody w labiryncie, zagradzając różne korytarze, że szczury radzą sobie z odnajdowaniem nowej drogi . Tolman doszedł do wniosku, że szczury, pokonując drogę w labiryncie, nie uczą się serii kolejnych ruchów, lecz tworzą sobie „mapy poznawcze”, którymi kierują się wybierając najlepszą drogę w labiryncie. Artykuł Tolmana pt. „Mapy poznawcze u szczurów i u ludzi” opublikowany został w roku 1948. W roku 1995 wydano po polsku książkę Tolmana z roku 1932.
W latach pierwszej wojny światowej niemiecki psycholog Wolfgang KÖHLER [przybliżona wymowa: Keler] obserwował na wyspie Teneryfie młode szympanse, jak radzą sobie z sytuacjami, kiedy nie mogą dosięgnąć owocu. Okazywało się, że zwierzę po pewnym czasie, w którym jakby analizowało sytuację, nagle przystępowało do działania, np. konstruując podstawkę ze skrzynek, po której mogło wspiąć się do owocu, albo przyciągając owoc kijem. To zjawisko nagłego „zrozumienia”, czego potrzeba do skutecznego działania, Köhler nazwał „wglądem” (niem. Einsicht, ang. insight ). Uznał, że jest to zasadniczo inna forma uczenia się , niż działanie na zasadzie „prób i błędów”, jakie obserwował Thorndike u kotów, które zamykał w klatkach.
W latach sześćdziesiątych XX wieku zaczęto opisywać wyniki badań dokumentujących naśladowanie przez dzieci i inne osoby zachowania innych ludzi. Zjawisko było znane ludziom od dawna, ale wtedy zaczęto je badać eksperymentalnie. Słynnym badaczem w tej dziedzinie był Kanadyjczyk ( którego matka pochodziła z Ukrainy a ojciec z Krakowa) Albert BANDURA. Bandura udowodnił, że dla dzieci w wieku przedszkolnym kontakt z osobą zachowującą się agresywnie jest „zaraźliwy”. Dzieci takie same przejawiają agresję, mimo że nie czują się rozzłoszczone czy rozżalone.
Film pokazujący przebieg eksperymentu Bandury można zobaczyć w Internecie pod adresem: http://pl.youtube.com/watch?v=pDtBz_1dkuk (sprawdziłem 14.11.2007).
Amerykanin Urie BRONFENBRENNER (1970 a, 1970 b) opisał w artykule przetłumaczonym na język polski szereg eksperymentów pokazujących wpływ obserwowanych zachowań na obserwatorów. Naśladowane są zarówno zachowania negatywne jak i pozytywne (pomaganie, itd.). Zachowanie naśladujące nazywa się „modelowaniem”, żeby podkreślić, że nie zawsze wchodzi w grę tylko czyste naśladownictwo, lecz również zdarza się „twórcze” wzbogacanie tego, co się widzi u obserwowanej osoby (określanej jako „model”). Niekiedy naśladowanie jest „odroczone”, nie następuje od razu.
Bronfenbrenner uważa, że zarażająca siła przykładu zależy od następujących czynników:
1) od tego, jak ważna jest osoba naśladowana dla obserwującej (osoby ważne są bardziej naśladowane),
2) od tego, jakie jest podobieństwo między osobą naśladującą a naśladowaną (osoby podobne są bardziej naśladowane);
3) od liczby osób przejawiających dane zachowanie (im więcej, tym silniejsze naśladownictwo).
4) Modelowanie jest silniejsze, jeżeli obserwowana osoba jest nagradzana za to, co robi, a mniejsze, gdy model jest karany. Wzmocnienie, jakie otrzymuje osoba obserwowana, nazywa się „wzmocnieniem zastępczym”
Lauret nagrody Nobla Konrad LORENZ opisał zachowania, które pojawiają się u zwierząt wkrótce po urodzeniu. Gdy mają one kontakt z matką uczą się podążać za nią, gdy jest to człowiek, podążają za człowiekiem. Zjawisko to zostało nazwane imprinting. Polskie nazwy to „wdrukowanie” (Zimbardo, s.180) lub „reakcja piętna” (Kurcz, s. 102-104).
Nabywanie „map poznawczych”; reakcje „wglądu”; modelowanie i wdrukowanie są argumentami na to, że nie wszystkie formy zachowania, które są skutkiem życiowych doświadczeń, są formami warunkowania klasycznego lub instrumentalnego. Wymienione tu formy uczenia się (tworzenie map poznawczych, modelowanie, imprinting) można określić jako uczenie się przez eksplorację lub obserwację. Nie można jednak zaprzeczyć, że emocjonalne następstwa doznawanych bodźców (warunkowanie klasyczne) i emocjonalne następstwa wykonywanych działań (warunkowanie instrumentalne) są czynnikami bardzo silnie wpływającymi na reakcje i zachowania istot żywych.
Bibliografia
Bronfenbrenner, U. (1970a). Czynniki społeczne w rozwoju osobowości. Część I. Psychologia Wychowawcza, 1, 1-19.
Bronfenbrenner, U.(1970 b). Czynniki społeczne w rozwoju osobowości. Część II. Psychologia Wychowawcza, 2, 141-155.
Fonberg, E. (1971). Nerwice. Przesądy a nauka. Warszawa: Wiedza Powszechna (Biblioteka
Wiedzy Współczesnej - Omega).
Gerrig, R.J., Zimbardo P.G. (2006). Psychologia i życie. Warszawa: Wydawnictwo Naukowe PWN.
Hilgard, E.R., Marquis, D.G. (1961 - wyd. polskie 1968). Procesy warunkowania i uczenia się.
Warszawa: Państwowe Wydawnictwo Naukowe.
Hock, R.R. (2002 - polskie wydanie 2003). Czterdzieści prac badawczych, które zmieniły oblicze psychologii. Fascynująca podróż w krainę nauki. Gdańsk: Gdańskie Wydawnictwo Psychologiczne.
Kurcz, I. (1992). Uczenie się. (s. 98- 170), W: T. Tomaszewski (red.). Psychologia ogólna. Warszawa: Wydawnictwo Naukowe PWN.
Materska, M. (2001). Wstęp do psychologii z elementami historii psychologii. Warszawa: Wydawnictwo Naukowe SCHOLAR.
Mika, S. (1959). Generalizacja reakcji słownych na bodźce słowne. Przegląd Psychologiczny, 3, 89 -109.
Mika, S. (2000). Psychologiem - przez przypadek ? W: T. Rzepa (red.). Historia psychologii w autobiografiach. Część IV (s. 99 - 193). Szczecin: Uniwersytet Szczeciński.
Mietzel, G. (2003). Wprowadzenie do psychologii. Podstawowe zagadnienia. Gdańsk: Gdańskie Wydawnictwo Psychologiczne.
Ostaszewski, P. (2001). ABC analizy behawioralnej. Charaktery, 3 (50). Tekst ten można też uzyskać ze strony: http://www.ptab.univ.gda.pl/abc_analizy_behawioralnej.htm (dostępność sprawdzona w dniu 12.11.2007).
Ostaszewski, P. (2000). Procesy warunkowania. W: J. Strelau (red.), Psychologia. Podręcznik akademicki (t. 2, s. 97-116). Gdańsk: Gdańskie Wydawnictwo Psychologiczne.
Pawłow, I.P. (1935, polskie wydanie -1955). Wykłady o czynności mózgu. Warszawa: Państwowy Zakład Wydawnictw Lekarskich.
Siuta, J. (red.) (2005). Słownik psychologii. Kraków: Wydawnictwo Zielona Sowa.
Szewczuk, W. (1962). Psychologia. Zarys podręcznikowy. T.1. Warszawa: Państwowy Zakład
Wydawnictw Szkolnych.
Szewczuk, W. (1966). Psychologia. Zarys podręcznikowy. T.2. Warszawa: Państwowy Zakład Wydawnictw Szkolnych.
Tolman, E. (1932 - wyd. polskie 1995). Zachowanie celowe u zwierząt i ludzi. Warszawa: Wydawnictwo Naukowe PWN.
Ukazatieli k połnomu sobraniju soczinienij I. P. Pawłowa (1954). Moskwa-Leningrad: Izdatielstwo Akadiemii Nauk SSSR.
Watson, J.B.; Rayner, R. (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3(1), 1-14. [tekst ten można znaleźć w Internecie pod adresem: http://psychclassics.yorku.ca/Watson/emotion.htm - dostępność sprawdziłem dnia 12.11.2007. O sprawie pisowni nazwiska podanego wyżej jako Rayner pisałem w MI 3-4 na str. 6-7. Moim zdaniem prawidłowa forma brzmi Raynor].
Zimbardo, P. (1999 - 2 wyd. polskie). Psychologia i życie. Warszawa: Wyd.Naukowe PWN.
Komentarz bibliograficzny
W książce R.R. Hocka (zob. Bibliografia) można znaleźć m.in. następujące rozdziały:
„Nie tylko o śliniących się psach”, s. 93 - 101 [tekst o badaniach Pawłowa]
„Emocje małego Alberta”, s. 101- 107 [tekst o badaniach Watsona i Raynor]
„Odpukać w niemalowane drewno”, s. 108 - 116 [tekst o badaniach Skinnera]
„Agresja - patrz i ucz się”, s. 116 - 124 [tekst o badaniach Bandury]
1
Dr hab. A.Gołąb, prof. WSFiZ e-mail: andrzejgolab@aster.pl Materiały informacyjne do wykładu: Wprowadzenie do psychologii
studia zaoczne, rok akadem. 2007 / 2008 Wyższa Szkoła Finansów i Zarządzania w Warszawie
Spotkania 7 i 8 Wykłady 19-24 17.11.2007 Procesy uczenia się w sensie psychologicznym Strona 1 z 16