6276

Metody i programy wychowania inspirowane behawioryzmem

źródła:

K. Konarzewski (1982) Podstawy teorii oddziaływań wychowawczych, Warszawa, PWN.

J. Dollard, N. E. Miller (1969) Osobowość i psychoterapia, Warszawa, PWN.

C. Tavris, C. Wade (1999) Psychologia. Podejścia oraz koncepcje, Warszawa, Zysk i S-ka.

A. E. Kazdin (1977) The Token Economy. A Review and Evaluation, Plenum Press, New York.

B. D. Lazarus (1990) A Cooperative Home-School Token Economy, Preventing School Failur, Vol. 34, Issue 4, p. 37.

B. F. Skinner (1960) Teaching Machines. W: A. A. Lumsdaine, R. Glaser (ed.) Teaching Machines and Programmed Learning, Washington.

P. R. Buckland (1968) The Ordering of Frames in Linear Program, „Programmed Learning and Educational Technology”, 3, vol. 5 (na podstawie: K. Kruszewski (1973) Nowe tendencje w dydaktyce, Ossolineum).

B. F. Skinner (1978) Poza wolnością i godnością, Warszawa, PIW.

D. Fontana (1986) Classroom control, London and New York.

E. D. Berlyne (1969) Struktura i kierunek myślenia, Warszawa, PWN.

J. Szacki (1981) Historia myśli socjologicznej, Warszawa, PWN.

W. Stewart Agras (ed.) (1978) Behavior Modification: Principles and Clinical Application, Boston, Little, Brown and Company

H. & M. Eysenck (1998) Podpatrywanie umysłu, Gdańsk, GWP

Behawioryzm ma podobną pozycję w polskiej myśli pedagogicznej, jak liberalizm ekonomiczny w polskim życiu politycznym: niewiele o nim wiemy, ale w czambuł krytykujemy i traktujemy jak chłopca do bicia. Nie jest to dobra sytuacja, ponieważ nie da się uprawiać i rozumieć współczesnej pedagogiki bez głębokiej znajomości behawiorystycznej tradycji.

Geneza i rozwój behawioryzmu

Korzenie filozoficzne: pragmatyzm

Filozofia społeczna Ameryki przełomu XIX i XX wieku była zdominowana przez poglądy Spencera. Spenceryzm prowadził do wizji człowieka, jako biernego przedmiotu działania praw społecznych. Pogląd ten dobrze korespondował z wiarą w samoczynny postęp i w siłę sprawczą laissez-faire - podstawowej zasady liberalnego indywidualizmu. W. James, jeden z prekursorów pragmatyzmu, pisał:

„Potrzebujecie systematu, który by łączył w sobie właściwą uczonym lojalność względem faktów (...) i duch przystosowania i akomodacji z dawnym zaufaniem do wartości ludzkich i wynikającą stąd samorzutnością typu religijnego lub romantycznego.”

Badacz myśli społecznej Hofstadter pisze (za . J. Szacki):

„Najdonioślejszym wkładem pragmatyzmu do rozwoju myśli społecznej było rozbudzenie wiary w skuteczność idei i możliwość nowości. Podczas gdy Spencer był za determinizmem i kontrolą człowieka przez środowisko, pragmatyści byli za wolnością i kontrolą środowiska przez człowieka.”

Pragmatyzm wyznaczył nową relację między nauką a jej użytkownikami: nauka miały być użyteczna, ale użytkownicy mieli być na tę użyteczność otwarci.

Korzenie psychologiczne: J. Watsona polemika z psychologią klasyczną

Gdybyśmy chcieli oddać intencję Johna Watsona powinniśmy nazywać zapoczątkowany przez niego kierunek nauką o zachowaniu. Behawioryzm to spolszczenie angielskiego terminu behaviourism, ukutego z kolei od behaviour - zachowanie się.

Jak to zwykle bywa w historii rozwoju ludzkiej wiedzy, nowe koncepcje powstają w opozycji do uprzednio panujących teorii, niejako na ich gruzach. Ojcowie nowej teorii podkreślają różnice i przemilczają kontynuację. Tak też jest w wypadku behawioryzmu. Powstał on w opozycji do psychologii introspekcyjnej. Ta pierwsza wyraźnie wyodrębniona z filozofii forma wiedzy psychologicznej kształtowała się głównie w Europie. Dominował w niej model nauki kontemplacyjnej, nauki odkrywającej tajemnice ludzkiej duszy. Koncentracja na zjawiskach świadomości wymuszała korzystanie z metody introspekcyjnej. Psycholog-badacz często występował w podwójnej roli: zarówno badacza jak i przedmiotu badań. Doskonalono metody wglądu i opisu przeżyć człowieka, ale stosowane metody były z definicji skazane na subiektywizm.

Behawioryzm wyrasta z pragmatycznego aktywizmu oraz coraz powszechniejszego w psychologii przełomu XIX i XX wieku sceptycyzmu wobec introspekcji jako metody badawczej. W koncepcji Watsona odpowiednio można wyróżnić dwa główne wątki:

- przesunięcie uwagi z ludzkiej świadomości na obserwowalne zachowanie - ludzkie działania w materialnym i społecznym kontekście,

- rezygnacja z metod introspekcyjnych i nacisk na definiowanie problemów badawczych w kategoriach obserwowalnych zachowań.

Przesunięcie uwagi z fenomenów świadomości na świat ludzkich działań wiąże się z zastąpieniem kontemplacyjnej, biernej postawy badacza-odkrywcy tajemnic ludzkiej duszy, przez aktywną postawę badacza-inżyniera, badacza, który ma przewidywać i kontrolować zdarzenia. Choć Watson posunął się w swych tekstach do tezy, że świadomość w ogóle nie istnieje, to należy raczej traktować to jako figurę retoryczną. Dla behawiorystów świadomość nie jest atrakcyjnym naukowo przedmiotem badań, ponieważ, co zresztą przyznają sami fenomenaliści, jest światem absolutnie zamkniętym w sobie i niedostępnym dla innych, czyli niedostępnym dla obiektywnych metod badawczych.

Na uwagę zasługuje rozumienie przez behawiorystów terminu obserwowalne zachowania. Obejmuje ona zarówno takie zachowania jak ślinienie się, gesty, mowa jak i zachowania organizmu niewidzialne "nieuzbrojonym okiem”, ale mierzalne za pomocą specjalnej aparatury, np. reakcja skórno-galwaniczna, czynność elektryczna mózgu. Wydaje się, że podstawowy behawiorystyczny postulat metodologiczny lepiej oddaje termin "mierzalności". Zgodnie z postulatem „obserwowalności”, w twierdzeniach psychologicznych powinny występować pojęcia mierzalne lub pojęcia dające się zdefiniować w mierzalnych kategoriach.

Warto w tym miejscu zauważyć, że behawioryzm psychologiczny nie jest jedyną koncepcją w naukach społecznych posługującą się tą nazwą. Behawioryzmem społecznym określał swoją koncepcję ojciec interakcjonizmu symbolicznego, George Herbert Mead. Paradoksalnie, interakcjonizm symboliczny jest przez wielu historyków myśli społecznej słusznie traktowany jako intelektualna opozycja wobec podejścia zapoczątkowanego przez Watsona.

Rozwój behawioryzmu

Rozwój koncepcji behawiorystycznej w największym skrócie można opisać poprzez wskazanie na kluczowe dokonania najważniejszych dla tego nurtu badaczy. Oddając palmę pierwszeństwa Watsonowi, na drugim miejscu musimy umieścić wyniki badań rosyjskiego fizjologa I. P. Pawłowa nad warunkowaniem klasycznym. Choć sam Pawłow nigdy nie utożsamiał się z behawioryzmem to z pewnością jego odkrycia miały kluczowe znaczenia dla formowania się teorii. Kolejna ważna postać to E. L. Thorndike. Badania tego amerykańskiego psychologa nad zachowaniem się inteligentnym zwierząt dały podstawy teorii drugiego typu warunkowania- warunkowania instrumentalnego. Opisy badań z użyciem skrzynki problemowej znajdziemy w każdym podręczniku psychologii. Temu właśnie badaczowi zawdzięczamy sformułowanie Prawa Efektu.

Postać szczególna w tradycji behawiorystycznej to B. F. Skinner. Ponieważ jest to najważniejsza a równocześnie budząca największe emocje postać, poświęcimy jej w dalszej części wykładów oddzielne miejsce. Na razie powiedzmy lapidarnie, że jest on twórcą rozbudowanej teorii warunkowania instrumentalnego i odkrywcą efektów wzmacniania sporadycznego.

Kolejna postać to E. C. Tolman. Choć zwolennicy psychologii poznawczej chętnie anektowali by jego dorobek do swojej tradycji, to jednak jest on z pewnością nieodrodnym, choć oryginalnym dzieckiem behawioryzmu. Psychologia zawdzięcza mu koncepcje zmiennych pośredniczących i odkrycie uczenia się utajonego.

Szczyt wyrafinowania formalnego uzyskuje behawioryzm w systemie teoretycznym Clarka L. Halla. Rozwija on ideę zmiennych pośredniczących a teorii psychologicznej stara się nadać postać sformalizowanego sytemu dedukcyjnego. Wybrane elementy jego sytemu wykorzystamy w dalszej części wykładu.

Ostatnia już postać, to A. Bandura. Jest on autorem niezwykle ważnych badań nad genezą zachowań agresywnych i twórcą teorii uczenia się społecznego.

Oczywiście ten krótki przegląd ważnych dla behawioryzmu postaci nie wyczerpuje listy. Pełna zawierałaby przynajmniej kilkadziesiąt nazwisk.

Na czym według behawioryzmu polega rozwój?

Analizę każdej z czterech koncepcji psychologicznej zaczynać będziemy od pytania, jak w obrębie danej tradycji rozumie się rozwój psychiczny i jak się go wyjaśnia.

W obrębie tradycji behawiorystycznej rozwój ujmuje się jako proces przystosowania jednostki do środowiska. Mechanizmy przystosowania, które nazywa się procesami uczniem się, są uniwersalne dla wszystkich istot żywych. Człowieka jako gatunek wyróżniają dwie ważne cechy. Po pierwsze, człowieka wyróżnia tempo uczenia się. Człowiek uczy się znacznie szybciej od innych organizmów. Skinner mówi, że człowiek jest jedynym zwierzęciem, które uczy się w jednej próbie. To sprawia, że zdolności przystosowawcze człowieka są niezwykłe, ale z drugiej strony, proces uczenia staje się narażony na ryzyko licznych błędów. Wrażliwość na zmienne okoliczności sprawia, że modyfikacja zachowania jest często zbyt "pochopna". Większa bezwładność zachowania prostszych organizmów, uodparnia na błędne alarmy, czyli rozpoznanie pozornej zmiany środowiska, ale za to zmniejsza szanse na przystosowanie w warunkach gwałtowanych zmian środowiska.

Po drugie, człowieka wyróżnia charakter środowiska. W wyniku rozwoju cywilizacyjnego środowisko człowieka jest głównie jego wytworem. Innymi słowy światem człowieka jest świat kultury a nie natury. Świat kultury jest znacznie bardziej zmienny w czasie niż świat natury, a to wymaga większych zdolności przystosowawczych. Przystosowanie biologiczne oparte na doborze naturalnym i selekcji jest wystarczająco sprawnym mechanizmem, gdy warunki dyktuje względnie niezmienna natura. Ewolucyjne mechanizmy zawodzą, gdy środowisko szybko zmienia się w czasie. Wtedy niezbędne stają się wrażliwe na szybkie zmiany mechanizmy uczenia się osobniczego. Ukoronowaniem rozwoju tych mechanizmów są zdolności w tym zakresie człowieka.

Twierdzi się, że behawiorystyczny mechanizm rozwoju jest egzogenny, czyli determinowany przez czynniki zewnętrzne. Skinner za Glilbertem Seldesem pisze: Człowiek jest tworem okoliczności. Jeżeli trzydziestu małych Hotentotów i trzydzieścioro dzieci angielskiej arystokracji wymieniłoby swoje środowiska, to arystokraci staliby się Hotentotami, Hotentoci zaś konserwatystami. To prawda, ale należy pamiętać - pisze Skinner -, że człowiek jako jednostka przystosowuje się do środowiska kulturowego, które jest dziełem człowieka jako gatunku, czy raczej należałoby powiedzieć - dziełem człowieka kolektywnego, czyli społeczeństwa. Innymi słowy, człowiek jest mniej lub bardziej udaną "odpowiedzią" na wyzwania środowiska kulturowego, ale jest też twórcą - w wymiarze kolektywnym -lub współtwórcą - w wymiarze jednostkowym -tego środowiska. Więc de facto pierwszą przyczyną jest człowiek a nie środowisko. To jeden z bardziej frapujących paradoksów behawiorystycznej doktryny.

Na czym polega przystosowanie? Przystosowanie polega na tworzeniu się nowych nawyków, utrwalaniu istniejących i wygaszaniu lub blokowaniu nawyków nieadaptacyjnych. Nawyk jest swoistym spoiwem łączącym organizm i środowisko, jest wyuczoną odpowiedzią na dane wymaganie środowiska.

Po czym organizm poznaje, że dana odpowiedź (zwana w behawioryzmie reakcją) na określone wymaganie środowiska (zwane bodźcem) jest właściwa? Jeżeli reakcja jest wrodzona, to decyduje filogenetyczny mechanizm selekcji biologicznej: jedynym kryterium jest zdolność do przeżycia i rozmnażania się. Ale w wymiarze ontogenetycznym jest to odpowiedź niewystarczająca. Behawioryzm wprowadza w tym momencie pojęcie wzmocnienia. O powstaniu nawyku decyduje wystąpienie wzmocnienia. Reakcje wzmacniane utrwalają się tworząc nawyk. Schemat wygląda następująco:
wymaganie środowiska (bodziec)  odpowiedź organizmu (reakcja)  wzmocnienie  nawyk

Co wynika z behawiorystycznej koncepcji rozwoju dla pedagogiki? Teoria wychowania powinny być nastawione na manipulowanie środowiskiem wychowanka a nie samym wychowankiem. Chcąc zmodyfikować zachowanie jednostki trzeba poznać czynniki tkwiące w środowisku odpowiedzialne za powstanie i utrzymywanie się danego nawyku. Dopiero skuteczne wyeliminowanie lub neutralizacja wzmocnień podtrzymujących dane zachowanie tworzy warunki dla kształtowania nawyku alternatywnego.

Główne mechanizmy uczeniem się

W behawioryzmie wyróżniamy trzy główne typy nawyków: odruchy bezwarunkowe, odruchy warunkowe i odruchy instrumentalne.

Odruchy bezwarunkowe to niewyuczone, przeważnie wrodzone, proste lub złożone reakcje wywoływane przez określone bodźce. Bodźce wywołujące mogą płynąć z zewnątrz lub z wewnątrz organizmu. Naciśnięcie drążkiem lub palcem dłoni noworodka wywołuje odruch chwytny - palce noworodka zasikają się na przedmiocie; chwyt jest na tyle mocny, że przez kilka sekund wytrzymuje ciężar dziecka. Z kolei kolka wywołuje płacz. Repertuar odruchów bezwarunkowych jest w wypadku człowieka dość skromny. Co więcej wiele z nich zanika w pierwszych miesiącach życia. Z punktu widzenia przystosowania można podzielić odruchy na cztery grupy:

1. Odruchy, które mają charakter przypadkowych korelacji neurofizjologicznych, np. odruch kolanowy.

2. Odruchy atawistyczne, np. odruch chwytny (prawdopodobnie).

3. Odruchy mające aktualnie duże znaczenie przystosowawcze, np. odruch ssania.

4. Odruch, które ułatwiają rozwój bardziej złożonych form zachowania, np.- odruch toniczno szyjny zwany też odruchem szermierza toruję drogę dla koordynacji wzrokowo-ruchowej rąk.

Dla wyjaśnienia zdolności przystosowawczych człowieka odruchy bezwarunkowe mają niewielkie znaczenie. Wydaje się, że jedynie niektóre z nawyków mogą być znaczące dla dalszego rozwoju i to raczej nie bezpośrednio, ale pośrednio: stając się mianowicie podstawą kształtowania odruchów warunkowych i instrumentalnych. Dla odruchów instrumentalnych szczególnie znaczenie wydaje się mięć fakt, że dość szeroka gama bodźców wywołuje określone reakcje emocjonalne: strach lub zadowalanie. Głośne dźwięki, silne błyski, utrata równowagi - to przykłady bodźców wywołujących strach. Z drugiej strony, słodki smak, zaspokojenie głodu wywołują pozytywne emocje. Te właśnie emocje mogą pełnić funkcję wzmocnień pierwotnych. Reakcje prowadzące do redukcji strachu będą wzmacniane negatywnie, reakcje prowadzące do zadowolenia będą wzmacniane pozytywnie.

Czasami można spotkać się z sądem, że behawioryzm twierdzi, że człowiek jest reaktywnym automatem. Zarzut ten byłby prawdziwy, gdyby doktryna to opisywała zdolności przystosowawcze człowieka jedynie w kategoriach odruchów bezwarunkowych. Faktycznie, człowiek-wiązka odruchów bezwarunkowych podobny byłby szafie grającej. Naciskamy A-1 (a kto jeszcze pamięta szafy grające?) i słyszymy Love me tender boskiego Elvisa! Jednak twierdzenie, że behawioryzm taką wizję człowieka tworzy jest zwykłym nieporozumieniem.

Drugi typ nawyków to odruchy warunkowe, zwane też pawłowowskimi. Dla zdolności przystosowawczych człowieka ten typ nawyków ma duże znaczenie. Dzięki warunkowaniu klasycznemu powstaje bogaty zbiór wzmocnień wtórnych. Bodźce pierwotnie neutralne nabierają znaczenia poprzez skojarzenie z bodźcami bezwarunkowymi.

Jedną z łatwiej warunkujących się rekcji warunkowych jest strach. Ewolucyjnie ma to swoje uzasadnienie. Warto zapłacić cenę fałszywych alarmów, czyli reagowania strachem i ucieczką w sytuacji gdy nie ma obiektywnego zagrożenia, po to by uniknąć okaleczenia lub śmierci w tych mniej licznych, faktycznie niebezpiecznych sytuacjach. Współcześnie, łatwość warunkowania reakcji strachu może być balastem, choć pamiętajmy, że granica między reakcją nerwicową a społecznie pożądaną spolegliwością nie jest ostra. Reagowanie strachem na wszelkie oznaki kierowanej ku nam agresji, może uniemożliwiać realizację ważnych życiowo celów, stając się reakcją nerwicową, ale może też być podstawą pożądanych społecznie zachowań tonizujących agresję pożytecznych, ale agresywnych członków grupy.

Trzeci, najważniejszy dla przystosowania człowieka typ nawyków to odruchy instrumentalne. Zwykle opisuje się je formułą R=f(S). Oznacza ona, że reakcja R jest funkcją bodźca S. Jak wygląda ta funkcja przekształcająca sytuację bodźcową w reakcję? Odpowiedzieć na to pytanie, to tyle co wyłożyć całą teorię uczenia się. Cały wysiłek badawczy behawiorystów zmierzał właśnie do odkrycia kształtu tej funkcji. Ostatecznego rozwiązania nie znaleziono. Wiele jednak o cechach tej funkcji wiemy. Zanim przejdziemy do prezentacji niektórych ustaleń, zdefiniujmy pojęcie wzmocnienia.

Rozważania nad definicją wzmocnienia warto rozpocząć od przypomnienia fundamentalnego dla teorii uczenia się prawa efektu.

Zachowanie, które w danej sytuacji doprowadziło do gratyfikujących konsekwencji, będzie z większym prawdopodobieństwem ponawiane, gdy jednostka znajdzie się ponownie w tej samej lub podobnej sytuacji. Natomiast spadać będzie prawdopodobieństwo wystąpienia zachowania, które w danej sytuacji doprowadziło do niekorzystnych konsekwencji.

Po raz pierwszy sformułował je E. L. Thorndike na podstawie badań nad uczeniem się zwierząt. Prawo efektu było uzupełnieniem wcześniej sformułowanego prawa styczności, które rządziło zjawiskami warunkowania klasycznego i - ogólniej - uczenia się asocjacyjnego. Skinner wprowadzając pojęcie warunkowania instrumentalnego kontynuuje podejście Thorndike. Pojęcie gratyfikujących konsekwencji zostaje zastąpione pojęciem wzmocnienia.

Zwykle definiuje się wzmocnienie następująco:

Wzmocnienie jest zdarzeniem, które powoduje, że zwiększa się prawdopodobieństwo pojawiania się w przyszłości reakcji, po którym nastąpiło. Oznacza to, że gdy jednostka znajdzie się ponownie w analogicznej sytuacji, z większym prawdopodobieństwem wystąpi dana reakcja.

Pytanie, które zdarzenia mają zdolność wzmacniającą ma charakter empiryczny. Poza wąską klasą wzmocnień pierwotnych o tym, że coś jest wzmocnieniem, można wnioskować jedynie post factum.

0x08 graphic
Z powyższej definicji wynika, że odruch instrumentalny ma probabilistyczną a nie deterministyczną naturę. Związki S-R można opisywać za pomocą następującej formuły:

r₁, p₁

r₂, p₂

S → r₃, p₃

r₄, p₄

r₅, p₅

S symbolizuje sytuację bodźcową, r1... r5 - reakcje znajdujące się w osobniczym repertuarze odpowiedzi na daną sytuację, p1 ... p5 - prawdopodobieństwa wystąpienia tych reakcji. Oczywiście prawdopodobieństwa sumują się do jedności. Jeżeli uporządkujemy reakcje zgodnie z prawdopodobieństwami otrzymamy hierarchię reakcji. Kolejne wzmocnienia będą tę hierarchię modyfikować. Na przykład, gdy jednostka zareaguje r1 i pojawi się wzmocnienie, prawdopodobieństwo p1 wzrośnie, pozostałe - spadną.

Wzmocnienie może mieć dwojaką postać. Jeżeli efekt wzmacniający uzyskujemy dzięki wycofaniu bodźca, mówimy o wzmocnieniu negatywnym. Gdy efekt wzmacniający uzyskujemy dzięki wprowadzeniu po reakcji bodźca, mówimy o wzmocnieniu pozytywnym. Ale pamiętajmy i w jednym i w drugim przypadku chodzi o zwiększenie prawdopodobieństwa danej reakcji.

Analogicznie do wzmocnienia możemy zdefiniować karę. O ile wzmocnienie podwyższa prawdopodobieństwo, kara obniża je. Tak jak mówimy o wzmocnieniu pozytywnym i negatywnym, tak przez analogię można mówić o karze pozytywnej i negatywnej. Jeżeli efektem wprowadzenia bodźca jest obniżenie prawdopodobieństwa reakcji- mówimy o karze pozytywnej. Jeżeli efektem usunięcia bodźca jest obniżenie prawdopodobieństwa reakcji- mówimy o karze negatywnej.

Definiowanie kary poprzez prawdopodobieństwo jest eleganckie dzięki pełnej symetrii ze wzmacnianiem. Ma jednak bardzo poważną wadę. Zgodnie z nią za karę musimy też uznać brak wzmocnienia, czyli wygaszanie (zwane też czasami wygasaniem). Ten kłopot skłania wielu psychologów do definiowania wzmocnień i kar w kategoriach atrakcyjności i awersyjności bodźców (patrz: Konarzewski 1982).

Czy odruchy instrumentalne kształtują się tylko wtedy, gdy jednostka sama doświadcza skutków swojego działania? Co dzieje się, gdy obserwujemy innego, który boryka się z jakimś wyzwaniem środowiska? Jeżeli do uczenia niezbędne jest doświadczenie wzmocnienia, to należałyby uznać, że w tej sytuacji do uczenia się nie dochodzi. Potoczne doświadczenie podpowiada, że to nietrafne przewidywanie. Faktycznie, liczne badania dowiodły bezspornie, że w takiej sytuacji dochodzi do warunkowania zastępczego, zwanego najczęściej uczeniem się społecznym lub modelowaniem. Teoria uczenia się społecznego znalazła szerokie zastosowanie w badaniach nad agresją (Bandura), kształtowaniem się tożsamości płciowej i wielu innych.

Ostatni typ uczenia, który chciałbym przypomnieć, to odkryte i opisane przez Tolmana uczenie się utajone. Czy, gdy najedzony szczur spaceruje bez celu po labiryncie, uczy się czegoś? Dotąd zakładano, że by zaszło uczenie się niezbędne jest wzbudzenie popędu oraz obecność wzmocnień. W opisanej sytuacji brakuje i jednego i drugiego. Bezinteresowne spacery po labiryncie nie powinny więc wywoływać żadnych trwałych zmian w zachowaniu. Wbrew tym oczekiwaniom Tolman w swoich badaniach uzyskał wyniki świadczące, że coś się jednak zmienia w repertuarze reakcji zwierzęcia. Okazało się, że szczur, który uprzednio bezinteresownie przechadzał się po labiryncie, gdy ponownie znalazł się w labiryncie - ale tym razem już głodny - potrzebował mniej prób, by bezbłędnie opanować drogę do skrzynki pokarmowej. Czego uczyło się zwierze podczas spacerów? Tolman uznał, ze zachodziło tu uczenie typu S-S, czyli tworzyły się skojarzenia składające się na coś, co nazwał mapą poznawczą.

Dobrym podsumowaniem dotychczasowych rozważań o różnych typach i mechanizmach powstawania nawyków może być przeanalizowanie ich ze względu na dwie funkcje: kształtowania reakcji i selekcji reakcji. Warunkowanie klasyczne kształtuje reakcje - reakcje warunkowe. Są one niejako wymuszane przez bodźce bezwarunkowe i następnie, zgodnie z prawem styczności, wiązane z nowym bodźcem, pierwotnie neutralnym. Można powiedzieć, że w tym sensie warunkowane klasyczne pełni funkcję kształtowania zachowania. Inaczej jest w warunkowaniu instrumentalnym. W tym wypadku warunkowanie pełni jedynie post factum funkcję selekcjonowania zachowań . Zgodnie z prawem efektu jedne reakcje są wzmacnianie, prawdopodobieństwo innych spada. Reakcja nie może zostać wzmocniona dopóty, dopóki nie pojawi się spontanicznie. Warunkowanie instrumentalne nie może wymusić pojawienia się reakcji. Z kolei uczenie społeczne pełni zarówno funkcję kształtującą jak selekcyjną. Imitacja obserwowanych zachowań wzbogaca repertuar reakcji, obserwowane konsekwencje zgodnie z prawem efektu zmieniają prawdopodobieństwa reakcji. Najtrudniej zaklasyfikować skutki uczenia się utajonego. Pojęcie mapy poznawcze wymaka się z klasyfikacji. Czy mapa poznawcza wzbogaca repertuar reakcji, czy też zmienia ich prawdopodobieństwa? Wydaje się zmiany będące owocem uczenia się utajonego bliższe są funkcji selekcyjne.

Jak powiedzieliśmy wcześniej podstawowym zadaniem teorii uczenia się jest rekonstrukcja funkcji przekształcającej sytuację bodźcową w reakcję: R=f(S). Najbardziej kompleksowej rekonstrukcji tej funkcji dokonał Hull. Poniższe wykresy w uproszczony sposób przedstawia podstawowe zależności opisane w tej teorii.

0x08 graphic

Opis pierwszego schematu zacznijmy od podziału na dwie główne kategorie: _SH_{R ,} D oraz _SE_Rto konstrukty teoretyczne (zmienne pośredniczące)_,pozostałe to zmienne obserwowalne.

Zmienne pośredniczące:

_SH_R- siła nawyku,

D - siła popędu,

_SE_R- potencjał reakcji lub inaczej siła tendencji do zachowania

Zmienne obserwowalne:

Siła nawyku jest funkcją czterech zmiennych obserwowalnych:

S - siła (wydatność) bodźca,

R - rodzaj reakcji,

G - typ (rozkład) wzmocnień,

N - liczba wzmocnień.

Potencjał reakcji przekłada się na:

_SA_R- intensywność reakcji,

SⁿR- trwałość nawyku (liczba prób potrzebnych do pełnego wygaszenia),

_SP_R- prawdopodobieństwo reakcji.

Uzupełnieniem powyższego schematu jest formuła łącząca trzy zmienne pośredniczące:

_SE_R = D* _SH_R

Formułę tę należy rozumieć następująco. Potencjał reakcji, czyli zaangażowanie z jakim jednostka podejmuje działanie, zależy od dwóch czynników: energetycznego - siły popędu, oraz ukierunkowującego - nawyku. Znak mnożenia oznacza, że nie dojdzie do działania, czyli potencjał reakcji będzie zerowy, gdy przynajmniej jeden z czynników przybierze wartość zerową.

Jak mimo działania prawa efektu dochodzi do powstawania nieadaptacyjnych nawyków, czyli przestrogi teorii uczenia się dla technologów zachowania

Jeżeli Prawo Efektu działałoby niezawodnie, efekty uczenia się powinny być, przynajmniej z perspektywy jednostki, zawsze przystosowawcze. Mechanizm selekcji reakcji powinien niezawodnie prowadzić do sytuacji, w której nawyki pozwalają na adekwatną odpowiedź na wymagania środowiska. Jak zatem powstają zachowania nieprzystosowawcze, zachowania nerwicowe? Wspominaliśmy wcześniej, że być może przyczyną niedoskonałości mechanizmów uczenia się w wypadku człowieka jest niezwykła ich czułość oraz łatwość warunkowania reakcji lękowych. Spróbujemy teraz zrobić bardziej wyczerpujący przegląd czynników, które mogą być odpowiedzialne za „błędy” w uczeniu się.

Gwałtowna zmiana środowiska

Najbardziej oczywistym czynnikiem odpowiedzialnym za nieprzystosowanie może być gwałtowna zmiana środowiska. Choć szybkość uczenia się - czyli adaptacji do zmian środowiska - jest w wypadku człowieka niezwykła, to w pewnych ekstremalnych przypadkach mechanizm może jednak nie nadążać. Szczególnie w wypadku zmian społecznych o charakterze rewolucyjnym lub zmiany miejsca pobytu. Liczba zachowań nieprzystosowawczych w oczywisty sposób wzrasta, gdy dokonują się gwałtowne zmiany społeczna. Również migracje międzykulturowe, to sytuacje, które mogą doprowadzać do czasami zabawnych, ale znacznie częściej niepożądanych lub wręcz tragicznych konsekwencji (por. Hall, Ukryty wymiar).

Zewnętrzne i wewnętrzne źródła wzmocnień i kar

Mechanizm uczenia się jest wrażliwy na wszelkie zmiany w sytuacji podmiotu. Nasza uwaga zwykle koncentruje się na zewnętrznych czynnikach, ale należy pomięta, że ważną kategorię stanowią wrodzone lub wyuczone reakcje lękowe. Jeżeli jakiś element sytuacji bodźcowej wywołuje reakcję strachu, to jeżeli nasza instrumentalna reakcja na tę sytuację doprowadza do redukcji tej emocji, to zostaje negatywnie wzmocniona. Oczywiście nasza reakcja może poza redukcją strachu wywoływać cały szereg innych konsekwencji, które również będą modyfikowały nawyk. Ale w wielu wypadkach redukcja lęku może być na tyle silnym wzmocnieniem, że powstanie nawyk w swoisty sposób „ślepy” na inne, pozalękowe wzmocnienia. To w oczywisty sposób może prowadzić do zachowań nerwicowych. Na przykład, jeżeli publiczne wystąpienia wywołują w nas silny strach (tzw lęk społeczny), to może utrwalić się cały syndrom zachowań nastawionych na redukcję tego strachu bez względu na to, jak duże straty ponosimy w wyniku tych obronnych działań.

Gradient opóźnienia wzmocnienia

Jednym z mechanizmów odpowiedzialnych za powstawanie nieprzystosowawczych nawyków może być gradient opóźnienia wzmocnienia. Jak już wiemy (patrz: Konarzewski 1982) poza atrakcyjnością wzmocnienia o sile efektu wzmacniającego decyduje czynnik opóźnienia. Oznacza to, że jeżeli mamy dwie konkurencyjne reakcje, to przy pewnej konfiguracji tych dwóch czynników, silniejszy efekt wzmacniający możemy obserwować w wypadku mniej atrakcyjnej nagrody, ale za to natychmiastowej, niż w wypadku bardziej atrakcyjnego wzmocnienia, ale za to odroczonego w czasie. Podobne zjawisko możemy obserwować, gdy dane zachowanie prowadzi zarówno do pozytywnych konsekwencji jak i do negatywnych. Gdy te pierwsze szybciej następują po reakcji, a awersyjne skutki są odroczone w czasie, to silniejszy może się okazać efekt wzmacniający. Na przykład, jeżeli chorobę alkoholową analizować jako wiązkę nawyków, to w ten właśnie sposób można wyjaśnić, dlaczego działanie wzmacniające natychmiastowych gratyfikacji (alkohol redukuje poziom strachu, dochodzi zatem do silnego wzmocnienia negatywnego) bierze górę nad efektem karzącym wywoływanym przez nieraz dramatyczne, ale bardziej odległe w czasie skutki awersyjne.

Trening unikania i jego skutki

Szczególnie interesujące z punktu widzenia naszego pytania o mechanizmy powstawania nawyków nieprzystosowawczych są wynika badań nad skutkami treningu unikania z użyciem tzw. shuttelbox. Shuttelbox to rodzaj klatki z dwoma pomieszczeniami. Oznaczmy je umownie A i B. Między nimi znajduje się przejście, coś na kształt bramki-szlabanu. Dodatkowo klatka wyposażona jest w lampkę. Pełni ona funkcję bodźca różnicującego. Do podłogi klatki, niezależnie dla części A i B, podłączone są elektrody pozwalające dawkować zwierzęciu eksperymentalnemu szoki elektryczne. Rolę zwierzęcia odgrywają w tym badaniu psy (ze względów technicznych - brak gotowego rysunku psa - na ilustracji umieściłem królika; miłośników słodkich króliczków - przepraszam!).

Badanie przebiega następująco. W pierwszym etapie wytwarzamy nawyk instrumentalny polegający na przeskakiwaniu do sąsiedniej części klatki. Procedura polega na wielokrotnym (aż do wyuczenia nawyku) powtórzeniu następującej sekwencji: (1) zapala się czerwone światełko - bodziec różnicujący, (2) w dwie-trzy sekundy później do podłogi tej części klatki, w której znajduje się zwierzę eksperymentalne, podłączamy prąd - bodziec awersyjny, (3) zwierzę próbując uniknąć przykrego szoku elektrycznego, odkrywa, że przeskoczenie do sąsiedniej części klatki - reakcja instrumentalna - pozwala wyzwolić się z opresji - wzmocnienie negatywne. Zwykle wystarcza kilka prób, by zwierzę wyuczyło się nawyku i wystarczy samo zapalenie się żaróweczki, by pies przeskakiwał do sąsiedniej części klatki. W tym miejscu zaczyna się drugi etap badania: zmieniamy zasadę wzmacniania! Od teraz, bodziec różnicowy sygnalizuje podłączenie prądu do tej części klatki, w której aktualnie nie znajduje się zwierzę. Należałoby oczekiwać, że po kilku próbach pies opanuje nowy nawyk i przystosuje się do kapryśnego środowiska. Badania wykazują, że tak się jednak nie dzieje. Zwierzę kompulsywnie trwa przy uprzednio wyuczonym nawyku. Mimu wyraźnych oznak silnego stresu - piszczenie, kręcenie się w kółko - zwierzę nie poszukuje nowej reakcji, trwa przy raz wyuczonym nawyku. Próby zmiany nawyka okazują się nieskuteczne.

0x08 graphic

Okazuje się jednak, że istnieje skuteczna procedura. Polega ona na ty, że podwyższając przegrodę między komorami klatki, uniemożliwiamy zwierzęciu wykonanie wyuczonej reakcji. Niemożność przeskoczenia sprawia, że pies znów znajduje się w silnym stresie: szczeka, wyje, warczy, dziko miota się po klatce eksperymentalnej, w niekontrolowany sposób oddaje mocz. Po chwili intensywność reakcji spada. Po kilkukrotnym powtórzeniu całej operacji, pies zostaje uleczony: pojawienie się bodźca nie prowadzi do kompulsywnych prób przeskoczenia barierki.

Wyniki eksperymentów z użyciem shuttelbox wykazują, że efekty treningu z użyciem wzmocnień negatywnych mogą być niezwykle trwałe. Wzmocnienie negatywne w postaci redukcji strachu w pewnych warunkach prowadzi do powstawania nawyków nieprzystosowawczych. Badacze dostrzegli pewną analogię między zachowaniem zwierzęcia a objawami charakterystycznymi dla nerwicy natręctw. Badania nad treningiem unikania zainspirowały powstanie nowej techniki psychoterapeutycznej zwanej metodą zapobiegania reakcji. Metoda ta zostanie przedstawiona w dalszej części wykładu.

Teoria dynamiki konfliktu sformułowana przez N. E. Millera

Ostatni mechanizm powstawania nieadaptacyjnych nawyków, który opiszemy, to konflikt behawioralny. Ciekawą teorię takich właśnie konfliktów stworzył Neal E. Miller. Opisuje ona i wyjaśnia kilka typów konfliktów, my skupimy się na konflikcie dążenie-unikanie.

Podstawowe założenia teorii Millera brzmią następująco.

- Tendencja do zbliżania się do celu jest tym silniejsza, im bliżej celu znajduje się podmiot. Zjawisko to nazywamy gradientem dążenia.

- Tendencja do unikania bodźca wywołującego strach jest tym silniejsza, im bliżej bodźca znajduje się podmiot. Nazywamy to gradientem unikania.

- Siła tendencji do unikania wzrasta szybciej w miarę zbliżania się, niż siła dążenia. Czyli gradient unikania jest bardziej stromy, niż gradient dążenia.

Dwa pierwsze twierdzenia są dość oczywiste, najbardziej brzemienne w teoretyczne skutki jest natomiast twierdzenie trzecie. Znaczenie tych twierdzeń przeanalizujmy na przykładzie konfliktu dążenie - unikanie. Poniższy wykres przedstawia graficzną interpretację takiego właśnie konfliktu.

0x08 graphic

Wykres ma oczywiście charakter idealizacyjny. Najważniejsze uproszczenie, to przyjęcie, że związek między odległością do celu a siłą tendencji ma charakter liniowy.

Objaśnijmy poszczególne elementy wykresu. Na osi 0X odkładamy jakąś miarę psychologicznego dystansu. Może to być:

spostrzegana odległość od celu („Ten wstrętny pająk jest na szczęście bardzo daleko!”, „Uf, do Częstochowy zostało już tylko 2 kilometry!”),
spostrzegany dystans czasowy od celu („Psia krew, już jutro mam wizytę u dentysty!”, „Już za 10 minut będę z nim!”),
spostrzegane podobieństwo do obiektu (gradient podobieństwa, np. w klasycznym eksperymencie Watsona reakcja strachu zgeneralizowała się na obiekty podobne do szczura).

Na osi OY odkładamy wartość zmiennej, którą Miller nazywa siłą tendencji. Pojęcie siła tendencji odpowiada znanemu nam już terminowi potencjał reakcji. W sytuacji odpowiadającej powyższemu wykresowi mamy do czynienia z dwoma przeciwstawnymi tendencjami. Dany cel/obiekt wywołuje równocześnie tendencję dążenia do jak i tendencję unikania. Jeżeli w całym zakresie dystansu jedna z tendencji jest silniejsza od drugiej, do konfliktu nie dochodzi. Konflikt behawioralny powstaje, gdy w pobliżu celu/obiektu przeważa tendencja unikana, a w pewnym oddaleniu od celu/obiektu przeważa tendencja dążenia. Innymi słowy gradient dążenia przecina się z gradientem unikania. Zachowanie w przypadku konfliktu ma postać "wahadłową" - oscyluje wokół punktu przecięcia. Taki właśnie wzorzec zachowań obserwujemy w wypadku zachowań nerwicowych. Ludzie będący w takim konflikcie nie potrafią pójść naprzód dość daleko, aby osiągnąć swój cel/obiekt, ani oddalić się od niego na taką odległość, by móc o nim zapomnieć. W nerwicach często obserwujemy konflikt między dążeniem motywowanym seksualnie a unikaniem napędzanym lękiem.

Teoria konfliktu pozwala wyjaśnić jedno z ciekawszych zjawisk zaobserwowanych w psychoterapii, tzw. paradoksalny efekt terapeutyczny. Można wyróżnić dwie strategie terapeutyczne. W pierwszej zmierzamy do zwiększania motywacji dążenia, w drugiej do zmniejszenia siły tendencji unikania. Okazuje się, że zarówno w wypadku jednej i jak i drugiej strategii w pierwszym etapie terapii obserwujemy nasilenie symptomów nerwicowych, wzrost cierpienia a czasami porzucenie terapii. Jak to wyjaśnić? Rozpatrzmy najpierw skutki pierwszej terapii. Wzmacnianie motywacji dążenia do celu podwyższa gradient dążenia. A ile terapeuta ma w ręku dostatecznie skuteczne narzędzia wypływu, gradient podnosi się na tyle, że w całym zakresie dystansu siła dążenia przewyższa siłę unikania i podmiot osiąga cel. To prowadzi do znaczącego przełomu w leczeniu i otwiera drogę do wyzdrowienia. Zwykle jednak terapeuta może tylko w niewielkim zakresie podnieść siłę dążenia. W tym wypadku gradient dążenia podnosi się, ale w dalszym ciągu przecina z gradientem unikania. Konflikt zostaje przeniesiony na wyższy poziom i temu właśnie przesunięciu towarzyszy nasilenie cierpienia i symptomów nerwicowych.

Czego natomiast należy oczekiwać w wypadku drugiej strategii? Okazuje się, że i te sposób postępowania może prowadzić do eskalacji konfliktu. Jeżeli nieznacznie obniżymy gradient unikania, to zobaczmy, że punkt przecięcia się gradientów również przesuwa się w górę, czyli możemy przewidywać nasilenie symptomów.

Podsumowując, teoria dynamiki konfliktu dostarcza kolejnego wyjaśnienia jak może dochodzić do powstania nieprzystosowawczych nawyków.

Wybrane metody i programy wychowawcze inspirowane behawioryzmem

Pora na przedstawienie kilku wybranych metod i programów wychowawczych inspirowanych behawioryzmem. Zaczniemy od przykładowych metod psychoterapeutycznych. Choć oczywiście metod psychoterapeutycznych nie można (bez dodatkowych warunków) włączyć w dziedzinę metod wychowawczych, to dzięki ich opisowi zobaczymy elementarne cechy wszystkich metod behawioralnych.

Przykładowe metody terapii behawioralnej

Odczulanie (desensytyzacja)

Odczulanie to metoda zaburzeń nerwicowych zwanych fobiami. Z behawiorystycznego punktu widzenia w fobii możemy wyróżnić dwa kluczowe elementy: lęk i zespół nieprzystosowawczych nawyków wzmacnianych redukcją lęku. Na przykład, fobia egzaminacyjna to nie tylko silna obawa przed egzaminami, ale również, a właściwie przede wszystkim, zespół nieracjonalnych zachowań nastawionych na redukcję tego lęku. Nieracjonalność zachowań polega na tym, że zamiast zwiększać szansę na pomyślne zadnie egzaminu, szanse te zmniejszają. Rzucanie się w wir domowych obowiązków, wynajdywanie różnych niezwykle ważnych zadań - to typowe zachowania obronne pozwalające w krótkiej perspektywie zredukować lęk, lecz w dłuższym czasie prowadzące oczywiście do niepowodzenia i zaostrzenia lęku.

Jak leczyć fobie? Metoda odczulania wykorzystuje proste zjawisko psychologiczne polegające na tym, że nie możemy przez dłuższy czas przeżywać równocześnie dwóch emocji o przeciwnych znakach. Wyobraźmy sobie, że jemy nasze ulubione ciastko i ktoś, z kim właśnie rozmawiamy, bardzo nas zirytował. Niemożliwe będzie przeżywanie w tej sytuacji równocześnie przyjemności i irytacji. Jedna z tych emocji weźmie górę.

Metodę odczulania zilustrujemy na przykładzie leczenia fobii egzaminacyjnej. W trakcie sesji terapeutycznych pacjent najpierw wyuczany jest, jak osiągać stan całkowitej relaksacji. Następnie prosi się go o wyobrażenie sobie scen związanych ze szkołą i egzaminami, które zwykle wywołują w nim silny lęk. Wyobrażenia wywołują lęk, ale na tyle słaby, że przyjemne doznania związane ze stanem relaksacji biorą górę. Terapeuta krok po kroku prowadzi pacjenta przez coraz bardziej lękotwórcze sytuacje, dbając o to, by siła negatywnych emocji nie wzięła górę nad przyjemnością wywołaną relaksacją. Pacjent zostaje stopniowo odczulony. Lęk przez egzaminem słabnie na tyle, że uczeń jest już zdolny do zastąpienia zachowań obronnych - tę przedegzaminacyjną "krzątaninę zastępczą" - zachowaniami racjonalnymi. Oczywiście ostatnim i najważniejszym momentem będzie pomyślne zdanie kilku kolejnych egzaminów.

Odczulanie w wypadku fobii egzaminacyjnej prowadzi do prawie pewnego wyleczenia. Na razie terapia fobii egzaminacyjnej to domena psychoterapeutów. Być może nauczyciele po odpowiednim przygotowaniu również mogliby stosować tę technikę.

Terapia awersyjna

Terapia awersyjna jest stosowana w terapii zachowań dewiacyjnych - np. pedofilii - i terapii uzależnień - np. w narkomanii, alkoholizmie. Terapia wykorzystuje mechanizm warunkowania klasycznego lub karania. W wypadku wykorzystywania schematu warunkowania klasycznego, z bodźcem wywołującym zachowania niepożądane - np. widok, zapach i smak używki - zostaje skojarzona reakcja związana z silnymi, negatywnymi emocjami, np. reakcja wymiotna. W tym wypadku jako bodźca bezwarunkowego używa się substancji farmakologicznych wywołujących wymioty. W wypadku użycia schematu karania, po wystąpieniu zachowania niepożądanego (wystąpienie tego zachowania jest prowokowane, np podajemy pacjentowi szklaneczkę alkoholu) następuje silna, dotkliwa kara. W tym wypadku najczęściej stosuje się bolesne, lecz nieprowadzące do konwulsji, szoki elektryczne. O ile w wypadku warunkowania klasycznego tworzy się odruch warunkowy ( np. alkohol  wymioty), to w wypadku karania tworzy się schemat unikania lękowego.

Badania pokazują, że trapie awersyjne są dość skuteczne. Na przykład w wypadku uzależnienia od alkoholu skuteczność tej terapii mierzona po roku sięga 60 %, po 13 latach - ok. 50%. Współcześnie stosuje się jednak terapię awersyjną łącznie z formami terapii poznawczej i społecznej. Uczy się mianowicie alternatywnych zachowań społecznych, które są nie do pogodzenia z używką, oraz zmienia się warunki życia pacjenta tak, by ułatwiać mu przyjmowanie sprzyjającego abstynencji stylu życia.

Metoda zapobieganie reakcji

Metoda zapobiegania reakcji (ZR) jest stosowana w terapii nerwicy natręctw. Powstała pod wpływem wyników badań na efektami treningu unikania u zwierząt.

Rozważymy zastosowanie ZR w wypadku kompulsji czystości. Pacjenci cierpiący na to zaburzenie przeznaczają większość czasu na utrzymywanie swojego ciała w czystości (np. kilkanaście razy w ciągu godziny myją ręce) i ochronie przed zabrudzeniem lub zakażeniem. Kompulsje te uniemożliwiają prowadzenie normalnego życia. Typowa terapia ZR przebiega następująco. Po wyrażeniu zgody na terapię, pacjent zostaje wprowadzony do pokoju, w którym znajduje się pojemnik zawierający jakąś ohydną substancję. Terapeuta wkłada do niej ręce i namawia do tego samego pacjenta. Gdy pacjent zrobi to, terapeuta musi sprawić, by nie poszedł natychmiast do łazienki umyć ręce. Pacjent musi siedzieć w pokoju i znosić bardzo silne emocje. Normalna droga redukcji lęku zostaje zablokowana. "Zalanie" emocjami jest bardzo przykrym doświadczeniem, ale lęk stopniowo słabnie i po mniej więcej półgodzinie chory jest w stanie znosić swoją sytuację ze spokojem, który uprzednio byłby nie do pomyślenia. Zwykle wystarcza 20 do 30 sesji, by doszło do wyleczenia.

Skuteczność terapii ZR jest wysoka i sięga 90% przypadków. Choć krytycy, głównie o orientacji psychoanalitycznej, twierdzą, że tego typu leczenie to tylko usuwanie symptomów bez wyeliminowania prawdziwych przyczyn (bolesne doświadczenia z dzieciństwa, nierozwiązane kompleksy itp), to śledzenie losów pacjentów nie potwierdza tych obaw. Nie dochodzi do wznowienia symptomów, nie obserwujemy przysunięcia symptomów na inne obszary funkcjonowania jednostki.

Przykładowe metody wychowawcze

Przyjdźmy to metod wychowawczych sensu stricte. Zdecydowana większość z nich wykorzystuje mechanizm warunkowania instrumentalnego. Tym samym metody te pełnią głównie funkcję selekcyjną, czyli nie wytwarzają nowych form zachowania, a tylko zmieniają prawdopodobieństwa już istniejących w repertuarze jednostki reakcji. Wyjątkiem od tej reguły są dwie metody, lub raczej ogólne heurystyki postępowania, zwane metodą kolejnych przybliżeń i metodą tworzenia łańcuchów. Nie będziemy się nimi zajmować, ponieważ zostały opisane w znanej nam książce K. Konarzewskiego.

Zanim przejdziemy do opisu wybranych metod, opiszemy ogólne reguły charakterystyczne dla wszystkich behawiorystycznych metod modyfikacji zachowania wywodzących się z warunkowaniu instrumentalnego. Można wskazać na trzy główne zasady:

1. Sformułowanie operacyjnej definicji zachowania pożądanego

Punktem wyjścia musi być jasna, sformułowana w języku obserwacyjnym definicja zachowania, które chcemy modyfikować. Z definicja tej muszą bezpośrednio wynikać sposoby pomiaru tego zachowania.

2. Zdefiniowanie wzmocnień i kar oraz operowanie nimi zgodnie z ustalonym rozkładem

Analogicznie jak w wypadku zachowania, musimy równie starannie opisać planowane wzmocnienia lub kary oraz ich rozkład.

3. Kontrola skuteczności procedury

Nie ma behawioralnych metod bez quasi naukowej procedury obserwacji wyników stosownych zabiegów wychowawczych (na ten aspekt zwraca się szczególnie uwagę w znanym z ćwiczeń programie Responsive Teaching).

Gospodarka żetonowa (Token Economy)

Gospodarka żetonowa (GŻ) jest z powodzeniem stosowana w różnych instytucjach wychowawczych np. szkołach, internatach, domach dziecka, również w rodzinie. Bywa też stosowana w resocjalizacji i psychoterapii (depresje szpitalne).

GŻ polega na tworzeniu kompleksowego, zintegrowanego środowiska motywacyjnego poprzez ustanowienie:

- jasnych definicji zachowań pożądanych i karanych,

- powszechnie znanych reguł wzmacniania,

- wewnętrznego pieniądza (żetony, punkty) jako wzmocnienia wtórnego,

- rynku dóbr (wzmocnienia właściwe).

Żetony mogą mieć charakter materialny (jakaś forma wewnątrzinstytucjonalnego pieniądza) lub symboliczny (np. punkty gromadzone w odpowiednim dzienniczku).

Kluczowe znaczenie dla skuteczności GŻ ma rynek dóbr. Ponieważ metody ta ma rozwiązywać problem atrakcyjności/awersyjności wzmocnień/kar, rynek musi być na tyle bogaty, by każdy wychowanek mógł wymieniać żetony na pożądane przez niego dobra. Dobra powinny być zróżnicowane zarówno pod względem asortymentu jak i ceny. Dobra te mogą mieć charakter powszechny (np. sklepik szkolny ze słodyczami, drobnymi zabawkami przyborami szkolnymi) lub swoisty dla instytucji (np. różnego typu przywileje). Ważna jest też dostępność dóbr poza instytucją wychowawczą. Jeżeli np. dziecko może zaopatrywać się w słodycze tylko w sklepiku szkolnym, to atrakcyjność żetonów dla łasuchów jest niekwestionowana. W wypadku instytucji totalnych, np. wiezienia, szkoły z internatem, taką kontrolę nad rynkiem dóbr łatwiej sprawować. W zwykłej szkole można próbować do GŻ wciągać rodziców. Badania wskazują, że to niezwykle zwiększa skuteczność systemu.

Dla skuteczności GŻ ważna jest też kontrola dystrybucji żetonów. System pozwala skutecznie kontrolować zachowania tylko tych, którzy żetony zdobywają. Dłuższe okresy "zerowego konta" sprawiają, że dani wychowankowie wymakają się z systemu: żetony są godne zachodu, gdy są atrakcyjne (patrz: rynek dóbr) ale i prawdopodobieństwo ich zdobycia musi być dostatecznie wysokie. Zgodnie ze znaną z psychologii formułą:

motywacja = wartość x prawdopodobieństwo

bardzo nawet ponętne nagrody nie będą wywoływały silnej motywacji, jeżeli prawdopodobieństwo ich uzyskania jest bliskie zeru.

Poza problemem atrakcyjności wzmocnień GŻ ułatwia też rozwiązywanie problemu opóźnienia nagrody. Żetony lub punkty bardo łatwo serwować bezpośrednio po pożądanym zachowaniu, dodatkowo nie zakłócając np. przebiegu lekcji.

Interesujący przykład zastosowania ekonomii żetonowej znajdujemy w eksperymencie resocjalizacyjnym przeprowadzonym w Kansas (Phillips 1968, za: Kazdin 1977). W domach poprawczych nazywanych Achievement Place (Miejsca Osiągnięć) przebywali młodociani przestępcy w wieku do 16 lat. W pojedynczym domu przybywało kilku chłopców i para małżeńska pełniąca funkcje opiekunów. Chłopcy zbierali punkty na specjalnych kartach rejestracyjnych. Punkty można było zarówno zyskiwać jak i tracić. Tabela 1 pokazuje, za jakie zachowania można było zyskiwać, a za jakie tracić punkty.

Tabela 1. Cennik zachowań w eksperymencie Achievement Place

zachowania nagradzane:	liczba punktów
1. oglądanie wiadomości w TV lub czytanie gazet 2. sprzątanie i dbanie o swój pokój 3. dbanie o higienę osobistą 4. czytanie książek 5. pomoc opiekunom w obowiązkach domowych 6. zmywanie 7. bycie odpowiednio ubranym podczas obiadu 8. odrobienie pracy domowej 9. otrzymanie dobrych ocen w szkole 10. wyłączenie światła, gdy nie jest potrzebne	300 dziennie 500 dziennie 500 dziennie 5 do 10 za stronę 20 do 1000 za zadanie 500 do 1000 za posiłek 100 do 500 za posiłek 500 dziennie 500 do 1000 za ocenę 25 za każde wyłączenie
zachowania karane	liczba punktów
1. złe oceny w szkole 2. agresywne, niegrzeczne odzywanie się 3. zapomnienie o umyciu rąk przed posiłkiem 4. kłótnie 5. nieposłuszeństwo 6. spóźnienia 7. okazywanie złych manier 8. okazywanie niechęci 9. używanie slangu 10. kradzież	500 do 1000 za ocenę 20 do 50 za każdy przypadek 100 do 300 za posiłek 300 za każdą 100 do 1000 za każde 10 za minutę 50 do 100 za każdy przyp. 50 do 100 za każdy przyp. 20 do 50 za każdy przyp. 10 000 za każdą

Tabela 2 określa rynek dóbr. W tym wypadku większość z nich ma charakter przywilejów.

Tabela 2. Cennik przywilejów

przywilej

liczba punktów

1. tygodniowe kieszonkowe

2. używanie roweru

3. oglądanie TV

4. gry

5. narzędzia do majsterkowania

6. dodatkowe przekąski

7. przepustka do miasta

8. pozwolenie na późniejsze położenie się spać

9. pozwolenie na późniejszy powrót ze szkoły

1000

500

1000

Program okazał się dość skuteczny. Stwierdzono zarówno wysoki poziom przystosowania do zasad życia placówki jak i, co oczywiście znacznie ważniejsze, znaczące efekty resocjalizacyjne.

Kolejny przykład zastosowania ekonomii żetonowej dotyczy realiów szkolnych. W programie McLaughlin i Malaby (1972, za: Kazdin 1977) używano ekonomii w K5 i K6 (odpowiednik III i IV klasy w Polsce). Tak jak w poprzednim programie żetony można było zarówno zyskiwać jak i tracić. Tabela 3 ukazuje listę zachowań pożądanych i karanych.

Tabela 3. Cennik zachowań w eksperymencie McLaughlin i Malaby

zachowania nagradzane:	liczba punktów
1 poprawne wykonanie zadania z karty pracy 2. przyniesienie jedzenia dla klasowych zwierząt 3. przyniesienie trocin dla zwierząt 4. staranne prace na plastyce 5. uważne słuchanie podczas lekcji 6. schludność ubioru 7. wykonanie domowych zadań 8. robienie notatek 9. ciche zachowanie podczas obiadu 10. ciche zachowanie w barku 11. właściwe zachowanie w czasie południowej, godzinnej przerwy	6 do 12 1 do 10 1 do 10 1 do 4 1 do 2 za lekcję 1 do 2 5 1 do 3 2 2 3
zachowania karane	liczba punktów
1. niewykonane obowiązki 2. żucie gumy lub cukierków 3. niewłaściwe odzywanie się (verbal behavior) 4. niewłaściwe zachowanie (motor behavior) 5. bójka 6. oszukiwanie	liczba obow. do kwadratu 100 15 15 100 100

Tabela 4 opisuje rynek dóbr. I w tym wypadku mają one charakter wewnątrzinstytucjonalnych przywilejów.

Tabela 4. Cennik przywilejów

przywilej

liczba punktów

w K6 w K5

1. ostrzenie ołówków

2. przyglądanie się zwierzakom

3. wynoszenie piłek

4. gry sportowe

5. pisanie na tablicy (poza lekcją)

6. udział w komitecie organizacyjnym

7. parce specjalne

8. gry

9. słuchanie płyt

10. przychodzenie wcześniej do klasy

11. oglądanie dziennika z ocenami

12. specjalne projekty

W tym wypadku głównym celem programu było przystosowanie uczniów do wymagań szkoły. Badania wykazały w tym doraźnym wymiarze wysoką skuteczność programu.

Na koniec chciałbym wskazać na dwa niepowiązane bezpośrednio ze schematem warunkowania instrumentalnego mechanizmy działania GŻ:

- dowartościowanie kontaktów z dorosłym (dorosły jako gratyfikator staje się bardziej atrakcyjny),

- efekt sprzężenia zwrotnego (skuteczność GŻ jest nagradzająca dla dorosłego).

Wydaje się też, że GŻ może być skutecznym treningiem odraczania wzmocnienia, a zdolność ta jest ważną miarą dojrzałości społecznej.

Nauczanie programowane B. F. Skinner

Kolejny przykład metody behawioralnej pochodzi z dziedziny kształcenia. Jest nim nauczanie programowane wynalezione w latach 50. XX wieku przez B. F. Skinnera. Na podstawie obserwacji nauczania w szkole swoich córek doszedł do wniosku, że główne wady szkolnego nauczania to:

1. Uczniowie zwykle są stawiani w dwóch skrajnie różnych sytuacjach: albo w dość bezmyślny sposób kopiują wzorce działania dostarczone przez nauczyciela lub są " wrzucani na głęboką wodę" i bez sprzężeń zwrotnych ze strony nauczyciela borykają się z nowymi dla nich i trudnymi zadaniami.

2. Informacje zwrotne są dostarczane uczniom zbyt rzadko i z dużym opóźnieniem. Uczeń zwykle dowiaduje się, jak poradził sobie z zadaniem z tak dużym opóźnieniem, że nie bardzo już pamięta swój tok myślenia, a i emocje już dawno wyparowały.

3. Uczniowie muszą pracować w jednym, narzuconym przez nauczyciela tempie. Jedni są wiecznie spóźnieni, inni ciągle się nudzą.

Wymyślona przez Skinnera idea nauczania programowanego (NP) mała być antidotum na te wady. Podstawowe zasady NP to:

- rozbicie wiedzy, którą należy przyswoić, na “elementarne sytuacje edukacyjne” kształtowane zgodnie ze schematem warunkowania instrumentalnego,

- natychmiastowe dostarczanie informacji zwrotnej, która mała pełnić funkcję wzmacniania właściwej reakcji lub wygaszania niepoprawnej.

Technicznym sposobem realizacji idei NP miały być wyśmiewane przez wielu krytyków maszyny uczące. Współcześnie, gdy upowszechniają się PC-ty, idee NP znajdują swe technologiczne rozwiązanie. Czy stoimy w obliczu renesansu NP?

Interesujące i częściowo krytyczne światło na NP rzucają wyniki eksperymentu P. R. Bucklanda (1968). Osoby badane uczyły się z wykorzystaniem tekstu programowanego (jedna z możliwych realizacji idei NP). W grupie pierwszej materiał był w pełni uporządkowany. W drugiej grupie wprowadzono do materiału pewien, choć niezbyt wielki, chaos. W grupie trzeciej poziom chaosu w materiale kształcenia był już znaczny. Zgodnie z prostą zasadą, że efektywność kształcenia jest funkcją dobrego uporządkowania materiału kształcenia, należałoby się spodziewać, że wyniki mierzone testem dydaktycznym będą najwyższe w grupie I, najniższe w grupie III.

Tabela 5. Średni wynik testu dydaktycznego przeprowadzonego po procedurze uczenia się

Program zwykły

Program z przemieszanymi sekwencjami kroków w obrębie ramki

Program z przemieszanymi ramkami

Uczniowie zdolni

10,2

11,5

7,2

Uczniowie mniej zdolni

9,3

6,1

4,5

I tak faktycznie dzieje się w grupie uczniów mniej zdolnych (wyniki poniżej średniej w teście uzdolnień). Natomiast interesujące - bo odmienne od przewidywań - wyniki obserwujemy w grupie uczniów zdolnych. Widzimy, że niewielki poziom poznawczego chaosu służy tej grupie. Być może jest to wynikiem wyższej aktywizacji poznawczej sprowokowanej bałaganem w tekście.

Puentując, ponieważ jestem pewny, że wszyscy moi Szanowni Słuchacze i Czytelnicy znajdują się w grupie zdolnych, nie będę zapinał treści wykładów na ostatni guzik!

Krytyka behawioryzmu

Na koniec bloku behawiorystycznego chciałbym zachęcić Państwa do krytycznej refleksji nad behawioryzmem. Refleksji bez uprzedzeń, bez uproszczeń. Poniżej prezentuję listę najczęściej formułowanych zarzutów. Ocenę ich trafności pozostawiam Państwu.

Najbardziej ogólnym, rzec można filozoficznym, jest zarzut dotyczący deterministycznej, mechanistycznej wizji człowieka zawartej w behawiorystycznej koncepcji. Inne zarzuty są już bardziej konkretne i przedstawiam je pogrupowane w 3 zestawy.

Argumenty teoretyczne

1. Niejasność pojęć bodźca i reakcji.

2. Nawyk jest strukturą zbyt sztywną, by wyjaśnić zdolność adaptacji do szybko zmieniającego się środowiska.

3. Bodźce nie są biernie rejestrowane, ale aktywnie selekcjonowane i interpretowane.

4. Pojęcia łuku odruchowego, fizjologicznego korelatu nawyku, jest naukowo archaiczne.

5. Nieadekwatność modelu „czarnej skrzynki”.

6. Opis i wyjaśnianie zachowań złożonych ma zwykle charakter spekulatywnych wyjaśnień ex post, ponieważ nie potrafimy rekonstruować indywidualnych biografii uczenia się.

Argumenty ideologiczne

1. Behawioralne techniki kontroli zachowania są nieetyczne, ponieważ stosuje się je po to, by manipulować ludźmi wbrew ich woli.

2. Behawioralne techniki kontroli zachowania zagrażają więzi między wychowankami a wychowawcą.

Argumenty praktyczne

1. Behawioralne techniki kontroli zachowania mogą być nieskuteczne, ponieważ wychowankowie domyślając się intencji wychowawcy mogą bądź symulować oczekiwane zachowanie, bądź sabotować próby wzmacniania.

2. Behawioralne techniki kontroli zachowania są dobre w teorii, ale w praktyce nie dają się stosować, bo są zbyt pracochłonne lub zalecane działania trudne do wykonania (np. ignorowanie złego zachowania).

3. Behawioralne techniki kontroli zachowania wymagają współpracy całego personelu danej instytucji.

_SH_R

czas deprywycji potrzeby

S R G N

unikanie

dążenie

Blisko psychologiczna odległość od celu Daleko

Siła tendencji

0x01 graphic

_SE_R

_SA_R

SⁿR

_SP_R

Wyszukiwarka

Podobne podstrony:
6276
6276
6276
6276
6276
6276

więcej podobnych podstron