Procesy warunkowania

PROCESY WARUNKOWANIA

Uczenie się - proces powstawania, poprzez doświadczenie, względnie trwałych zmian w zachowaniu się jednostki.

Podstawowe rodzaje uczenia się:

Bodźce:

WARUNKOWANIE KLASYCZNE:

Iwan Pawłow – prekursor badań nad warunkowaniem klasycznym.

Przebieg badań:

Biologiczne znaczenie warunkowania klasycznego:

Związki powstające podczas warunkowania klasycznego: czego organizm uczy się podczas warunkowania klasycznego?

konkluzja płynąca z tych badań: w przebiegu procesu warunkowania wytwarzają się związki między bodźcami warunkowymi i reakcjami warunkowymi (S-R).

Relacje czasowe w warunkowaniu klasycznym:

Przestrzeń warunkowania klasycznego:

WARUNKOWANIE INSTRUMENTALNE:

Typy relacji między zachowaniem a jego konsekwencjami:

Przestrzeń zależności instrumentalnych:

Wpływ warunkowania klasycznego na reakcje instrumentalne:

Przedstawione interakcje między warunkowaniem klasycznym i instrumentalnym pokazują, jak różnorodne sygnały płynące ze środowiska mogą wpływać na niezwiązane z nimi zachowania. Nie może więc dziwić fakt, że bodźce bezpośrednio związane z reakcjami instrumentalnymi są niezwykle skuteczną drogą do modyfikacji i kontroli zachowania.

Bodziec, który kontroluje zachowanie, czyli tak zwany bodziec kontrolujący, zmienia prawdopodobieństwo wystąpienia reakcji instrumentalnej. Częstość występowania reakcji sprawczej

w obecności tego bodźca może być większa lub mniejsza niż w wypadku braku bodźca kontrolującego

w środowisku.

Adaptacyjna rola bodźców kontrolujących polega na umożliwieniu jednostce przewidzenia konsekwencji jej działań w określonych warunkach. Wyróżnia się dwa typy bodźców kontrolujących:

Bodźce dyskryminacyjne informują jednostkę, że po wykonaniu reakcji będzie dostępne określone wzmocnienie lub pojawi się kara, sygnalizują więc, kiedy „warto” wykonać lub powstrzymać się od wykonania reakcji instrumentalnej. Bodźce wygaszeniowe oznaczają brak dostępności wzmocnień.

W ich obecności reakcja instrumentalna nie zostanie wzmocniona. Uczenie dyskryminacji sprawia, że kiedy prezentowany jest bodziec dyskryminacyjny, prawdopodobieństwo wystąpienia danego zachowania rośnie. Kiedy zaś w środowisku pojawia się bodziec wygaszeniowy, prawdopodobieństwo wystąpienia tego zachowania spada.

Na przykład, szczur zamknięty w klatce doświadczalnej wyposażonej w dźwignię, której naciśnięcie powoduje podanie pokarmu, ale tylko wtedy, gdy nad dźwignią pali się lampka, początkowo naciska na dźwignię przez cały okres pobytu w klatce, z czasem jednak zaczyna naciskać na nią jedynie w obecności palącej się lampki (bodźca dyskryminacyjnego), bo tylko wtedy działanie to przynosi efekty, a zwierzę nie marnuje energii na nieprzynoszące efektu zachowania.

Jeśli zmienimy znaczenie palącej się lampki i teraz oznaczać ona będzie brak dostępności pokarmu, to szczur stopniowo zmniejszy częstość reakcji wykonywanych w jej obecności, stanie się ona bowiem bodźcem wygaszeniowym.

Do tej pory analizowaliśmy głównie sytuacje, w których reakcje instrumentalne służyły zdobywaniu nagród (wzmocnień pozytywnych). Zachowania sprawcze mogą jednak pociągać za sobą także negatywne konsekwencje.

Awersyjna kontrola zachowania. Relacje między zachowaniem a nieprzyjemnymi, awersyjnymi wydarzeniami środowiskowymi nie są jednorodne. Wyróżnia się ich trzy główne typy:

W wypadku stosowania kar jako konsekwencji wykonania niepożądanych reakcji instrumentalnych oraz w wypadku wykonywania reakcji ucieczki od bodźca awersyjnego dość łatwo można ustalić występujące tam zależności instrumentalne (określić, co jest czynnikiem wzmacniającym).

W wypadku reakcji unikania sytuacja nieco się komplikuje: wzmocnieniem jest brak wystąpienia bodźca awersnego. W typowej sytuacji eksperymentalnej zwierzę uczy się wykonywać pożądaną reakcję po zaobserwowaniu bodźca (bodźca dyskryminacyjnego), sygnalizującego, że za kilka sekund pojawi się bodziec awersyjny (na przykład szok elektryczny).

Dzięki temu może go uniknąć. W początkowej fazie treningu zwierzę wykonuje daną reakcję zbyt późno — dopiero po pojawieniu się bodźca. W tym wypadku reakcja ta jest reakcją ucieczki. W dalszej części eksperymentu, wykonując poprawnie reakcję unikania, zwierzę nigdy już nie doświadcza działania bodźca awersyjnego.

Jak to się dzieje, że brak bodźca awersyjnego może być wzmocnieniem? Aby wyjaśnić to zjawisko, najczęściej przytacza się tak zwaną teorię dwuczynnikową (Rescorla i Solomon, 1967), opartą na POŁĄCZONYM DZIAŁANIU WARUNKOWANIA KLASYCZNEGO I INSTRUMENTALNEGO (tytułowych dwóch czynników).

Teoria ta utrzymuje, że organizm początkowo uczy się reakcji ucieczki przed bodźcem awersyjnym (na przykład przed szokiem). Warunkowanie klasyczne powoduje, że bodziec dyskryminacyjny, podawany przed szokiem, staje się bodźcem warunkowym, zapowiadającym bodziec bezwarunkowy, czyli szok elektryczny.

Po kilku próbach bodziec warunkowy zaczyna wywoływać reakcję warunkową: lęk. Zwierzę zaczyna wykonywać reakcję instrumentalną już przy prezentacji bodźca dyskryminacyjnego, a reakcja ta jest reakcją ucieczki przed lękiem wywołanym prezentacją tego bodźca.

Z drugiej strony ta sama reakcja prowadzi do uniknięcia bodźca bezwarunkowego (szoku). Teoria dwuczynnikowa mówi więc, że reakcja unikania to specyficzna forma reakcji ucieczki: ucieczka przed lękiem wywołanym bodźcem warunkowym (bodźcem dyskryminacyjnym).

Analizowaliśmy mechanizm wzmacniania reakcji unikania, nie wydawał się on bowiem oczywisty. Ale czym w ogóle są wzmocnienia? Sposób rozumienia tego kluczowego dla warunkowania instrumentalnego pojęcia zmieniał się kilkakrotnie od momentu przedstawienia przez Thorndike’a prawa efektu.

Ewolucja definicji pojęcia wzmocnienia

Odpowiedzi na pytanie o mechanizm działania wzmocnień można udzielić, opierając się na teorii redukcji popędu (Hull, 1943).

Zgodnie z tą teorią, wzmocnienie powoduje powrót organizmu do uprzednio zachwianego poziomu homeostazy, a reakcja, która to umożliwia, zostaje wzmocniona, gdyż redukuje awersyjne odczucia towarzyszące popędom.

Ta teoria jednak wyjaśnia jedynie wzmacniający efekt takich bodźców, jak na przykład pokarm i woda, stosowanych wobec głodnych i spragnionych zwierząt. Nie wyjaśnia natomiast, stwierdzanych w licznych eksperymentach, wzmacniających właściwości na przykład włączania światła czy umożliwiania biegania.

Tradycyjne behawioralne definicje wzmocnień, oparte na prawie efektu, mówiły, że wzmocnieniem jest bodziec, który — podany po wykonaniu przez jednostkę określonej reakcji — zwiększa prawdopodobieństwo wykonania tej reakcji w podobnych warunkach w przyszłości.

Definicja ta może być zastosowana w dowolnej sytuacji, jest jednak definicją o charakterze post hoc, ponieważ o tym, że jakiś czynnik jest wzmocnieniem, dowiadujemy się dopiero po jego zadziałaniu. Przedtem nie możemy przewidzieć, jakie wywoła on zachowanie.

Aby poradzić sobie z tym problemem, Meehl (1950) zaproponował transsytuacyjną definicję wzmocnienia. Zgodnie z nią, wzmocnieniem jest bodziec, którego zastosowanie zwiększa prawdopodobieństwo wystąpienia wzmacnianej reakcji w więcej niż jednym wypadku.

Efekt wzmacniający jest zatem pewną cechą charakterystyczną określonej klasy bodźców Jednakże badania Premacka (1962) dowiodły, że nie wszystkie bodźce, które uznawano za wzmocnienia, zawsze spełniają swoją funkcję. Ponadto czasem mogą być wzmocnieniem pozytywnym, a czasem karą.

PREMACK (1965) zaproponował własną teorię wzmocnień, radykalnie zmieniając sposób definiowania pojęcia wzmocnienia. Zamiast analizować wzmacniające możliwości różnorodnych bodźców, zwraca on uwagę na wzmacniający efekt jednych zachowań w relacji do innych zachowań.

Punktem wyjścia Premacka było spostrzeżenie, że reakcje towarzyszące typowym wzmocnieniom (takie jak czynność jedzenia i picia) są bardzo chętnie wykonywane przez jednostki. Organizmy poświęcają tym czynnościom wiele czasu.

Z kolei reakcje instrumentalne, których uczą się zwierzęta (na przykład naciskanie na dźwignię), są reakcjami o niskim prawdopodobieństwie spontanicznego pojawiania się.

Premack twierdził, że to właśnie ta różnica w prawdopodobieństwie spontanicznego zaangażowania się w jakieś czynności (w prawdopodobieństwie wystąpienia określonych reakcji) jest odpowiedzialna za efekt wzmacniający. Przedstawiają to następujące trzy zasady Premacka:

Efekt wzmocnienia wynika z narzucenia organizmowi pewnych ograniczeń:

  1. aby wykonywać reakcję bardziej prawdopodobną, trzeba najpierw wykonać reakcję mniej prawdopodobną (będzie to prowadziło do wzrostu częstości wykonywania reakcji mniej prawdopodobnej;

  2. w konsekwencji wykonania reakcji bardziej prawdopodobnej należy wykonać reakcję mniej prawdopodobną (będzie to prowadziło do spadku częstości wykonywania reakcji hardziej prawdopodobnej).

Idea uzależnienia możliwości wykonania jakiejś czynności od wykonania innej czynności została rozwinięta w kilku teoriach, określanych wspólnym mianem teorii równowagi. Teorie równowagi wyjaśniają i przewidują wystąpienie efektu wzmocnienia z najlepszą, jak dotąd, dokładnością w najszerszym zakresie sytuacji.

Ich przykładem jest teoria deprywacji zachowania (response deprivation; Timberlake i Allison, 1974). Zakłada ona, że efekt wzmocnienia wywodzi się z narzuconych jednostce ograniczeń, które zaburzają podstawowe, spontaniczne relacje między różnymi, wykonywanymi przez nią zachowaniami.

Jeśli pozostawi się jednostce całkowitą swobodę w rozporządzaniu własną aktywnością, to rozdzieli ona czas poświęcany na różne zachowania w sposób dla niej optymalny, najprzyjemniejszy.

Przy braku ograniczeń obserwowane relacje między jakimiś dwoma zachowaniami utworzą pewien zrównoważony układ, który może być przedstawiony w postaci punktu równowagi na wykresie obrazującym czas poświęcany każdej z czynności (ryc. 7).

Widoczny na tej rycinie punkt B to tak zwany punkt zadowolenia łub błogostanu (Miss point). W różnych warunkach środowiskowych punkt ten może zmieniać swojepołożenie, ale przy zachowaniu podobnych warunków będzie zawsze tak samo umiejscowiony.

Kiedy w środowisko zostają wprowadzone ograniczenia zaburzające równowagę między zachowaniami jednostki, wówczas obserwujemy regulacyjne zmiany w jej aktywności, wynikające z dążenia do przywrócenia równowagi oraz do powrotu relacji między czynnościami do punktu zadowolenia.

Jeśli narzucone ograniczenie powoduje, że preferowane w warunkach swobody natężenie reakcji zależnej nie pozwala na wykonywanie preferowanej częstości reakcji niezależnej, wówczas jednostka oddala się od punktu zadowolenia.

Wywołuje to w efekcie taki wzrost natężenia reakcji zależnej, aby jednostka możliwie najbardziej zbliżyła się do utraconego punktu błogostanu. W ten sposób osiągnięty zostaje efekt wzmocnienia pozytywnego.

Jeśli natomiast ograniczenie powoduje, że preferowane w warunkach swobody natężenie reakcji zależnej zmusza jednostkę do zwiększenia natężenia reakcji niezależnej, wówczas jednostka oddała się od punktu zadowolenia. Wywołuje to taki spadek natężenia reakcji zależnej, by jednostka mogła zbliżyć się do utraconego punktu zadowolenia — występuje więc efekt kary.

W teorii deprywacji zachowania efekt wzmocnienia pozytywnego i efekt kary wynikają z ograniczeń zaburzających równowagę, występującą w warunkach spontanicznych między różnymi rodzajami aktywności, i przynoszą takie dynamiczne zmiany w nasileniu zachowań, które pomogą zbliżyć się do utraconego punktu zadowolenia.

Z tej perspektywy teoretycznej każde zachowanie może służyć jako wzmocnienie lub kara, warunkiem zaś jest włączenie go w specyficzny system ograniczeń, przynoszący niedobór lub nadmiar określonej aktywności poniżej jej poziomu podstawowego lub ponad nim.

Reakcje instrumentalne oraz ich wzmocnienia różnią się tylko przypisaną im, za pomocą narzuconych ograniczeń (zależności instrumentalnych), rolą. Typowym przykładem takich zależności instrumentalnych są rozkłady wzmocnień.

Rozkłady wzmocnień

Rozkłady wzmocnień Są zasadami precyzującymi, jak często i pod jakimi warunkami zachowanie jednostki będzie wzmocnione.

Stanowią zatem ograniczenie dostępności zachowań i bodźców będących wzmocnieniami, ponieważ ich uzyskanie jest uzależnione od odpowiedniego wykonania innych czynności (reakcji instrumentalnych).

Wyróżnia się pięć podstawowych rozkładów wzmocnień:

  1. rozkład ciągły (continuous reinforcement schedule, CRF), w którym wzmacniana jest każda poprawnie wykonana przez organizm reakcja;

  2. rozkład o stałych odstępach czasowych (fixed-interval schedule, FJ), w którym wzmacniana jest pierwsza poprawnie wykonana reakcja po upływie wyznaczonego czasu od otrzymania poprzedniego wzmocnienia;

  3. rozkład o zmiennych odstępach czasowych (variable-interval schedule, VI), w którym wzmacniana jest pierwsza reakcja wykonana po upływie wyznaczonego czasu od otrzymania poprzedniego wzmocnienia, przy czym czas ten imienia się z próby na próbę, ale w przebiegu całego eksperymentu waha się wokół dowolnie przyjętej wartości średniej;

  4. rozkład o stałych proporcjach (fixed-ratio schedule, FR), w którym wzmocnienie podaje się po wykonaniu przez organizm pewnej stałej liczby reakcji;

  5. rozkład o zmiennych proporcjach (variable-ratio schedule, VR), w którym wzmocnienie podaje się po wykonaniu przez jednostkę zmiennej liczby reakcji, liczba ta jednak podczas trwania całego eksperymentu oscyluje wokół określonej wartości średniej.

Rozkłady o stałych i zmiennych proporcjach (FR i VR) powodują utrzymywanie się wysokiego tempa wykonywania reakcji sprawczej. Z kolei rozkład o zmiennych odstępach czasowych (VI) wywołuje umiarkowane tempo reagowania.

Rozkład o stałych odstępach czasowych (FI) także wyzwala umiarkowane tempo reagowania, przy czym przynosi także okresowe przyrosty tempa wykonywania reakcji — gdy zbliża się moment podania wzmocnienia — oraz spadek tempa reagowania — w chwilę po otrzymaniu nagrody.

Stwierdzono ponadto, że do wygaszenia reakcji instrumentalnych wzmacnianych w nieregularny sposób (VR i VI) potrzeba znacznie większej liczby prób wygaszeniowych niż w wypadku reakcji wzmacnianych w sposób regularny (FR i FI), a zwłaszcza wzmacnianych w sposób ciągły (CRF).

Oprócz tych podstawowych rozkładów wzmocnień wprowadzono jeszcze kilka innych, dzięki którym uzyskiwana jest duża regularność pojawiających się reakcji.

Są to tak zwane rozkłady wyrówrnujące tempo reakcji (differential-rate schedules). Określają one trzy zasadnicze typy działań:

  1. wzmacnianie wysokiej częstości reakcji (differential reinforcetnent of high rates, DRH), polegające na tym, że reakcja jest wzmacniana, jeśli pojawi się przed upływem określonego czasu od poprzednio uzyskanego wzmocnienia; jak wskazuje nazwa tego rozkładu, efektem jego stosowania jest stabilne, wysokie tempo reakcji jednostki.

  2. Wzmacnianie niskiej częstości reakcji (differential reinforcement of lowrates, DRL), w której to procedurze reakcja jest nagradzana, jeśli pojawi się po upływie określonego czasu od poprzednio otrzymanego wzmocnienia, przy czym jeśli reakcja pojawi się wcześniej, niż wyznacza to ten rozkład, wówczas odliczanie czasu rozpoczyna się od zera; efektem tego rozkładu wzmocnień jest utrzymujące się niskie tempo reakcji.

  3. Wzmacnianie innych reakcji (differential reinforcement of other behaviors, DRO),

w którego wypadku wzmocnienie podawane jest tylko wtedy, gdy jednostka powstrzyma się od wykonywania określonej reakcji (relacja pomijania); w związku z tym nagradzane są wszystkie, różne od wybranej, reakcje.

Różne rozkłady wzmocnień mogą być łączone w łańcuchy, w których dopiero dopełnienie wymagań ostatniego ogniwa (ostatniego rozkładu wzmocnień) powoduje podanie wzmocnienia (tak zwane rozkłady łańcuchowe, chained schedules, lub rozkłady drugiego rzędu, second-order schedules).

Badanie takich łańcuchów to eksperymentalna analiza sekwencji występujących w zachowaniu. Jedną ze stwierdzonych prawidłowości jest fakt, że sekwencje rozkładów wzmocnień mogą podtrzymywać wykonywanie określonych reakcji tylko pod warunkiem, iż zakończenie każdego z etapów pośrednich łączy się z podaniem sygnału informującego, że organizm zbliża się do celu, czyli do otrzymania wzmocnienia.

Inną typową procedurą, stosowaną w badaniach nad rozkładami wzmocnień, jest procedura konkurencyjnych rozkładów wzmocnień (concurrent schedules of reinforcement).

Polega ona na tym, że w tym samym czasie organizm ma do wyboru dwa (lub więcej) sposoby uzyskiwania wzmocnień — każdy według innego rozkładu wzmocnień (na przykład, szczur umieszczony w kamerze doświadczalnej, w której aby otrzymać pokarm, trzeba nacisnąć dźwignię, ma do wyboru dwie dźwignie, związane z różnymi rozkładami).

Oznacza to, że w kręgu zainteresowań badaczy zajmujących się warunkowaniem sprawczym znalazła się czynność dokonywania wyboru (choice behavior).

Dokonywanie wyboru

Tradycyjne teorie wzmocnień (HuIl, 1943; Skinner, 1995/1938) koncentrowały się na wpływie pojedynczych wzmocnień na pojedyncze reakcje. Niewiele uwagi zwracano na inne wzmocnienia i inne reakcje występujące w danej sytuacji.

Później jednak stwierdzono, że efekt wzmocnienia w dużym stopniu zależy od jego relatywnej wartości w stosunku do innych, dostępnych w danym środowisku wzmocnień. Jako pierwszy opisał to zjawisko w 1961 roku uczeń Skinnera, Richard Hernstein, formułując prawo dopasowania.

Badania dowiodły (Herrnstein, 1961), że reakcje organizmu zachodzące w środowisku, w którym działają konkurencyjne rozkłady wzmocnień o stałych lub zmiennych odstępach czasowych, rozdzielają się pomiędzy te rozkłady wzmocnień proporcjonalnie do częstości uzyskiwania w ich wyniku wzmocnień. Prawo dopasowania wyraża się następującą formułą:

Równanie to mówi, że relatywna częstość reakcji dopasowana jest do relatywnej częstości wzmocnień uzyskiwanych w wyniku tych reakcji.

Stwierdzono, że zgodnie z tym prawem zachowują się różne gatunki zwierząt (od ryb, przez gołębie, szczury, chomiki, aż po człowieka), wybierające między różnymi wzmocnieniami (od pokarmowych po społeczne) (zob. de Villiers, 1977).

Dowodzi to niezwykłej uniwersalności prawa dopasowania. Ale prawo dopasowania jedynie opisuje pewną prawidłowość występującą w zachowaniu ludzi i zwierząt.

Uwaga badaczy skupiona jest teraz na poszukiwaniu mechanizmu tej prawidłowości. Zaproponowano dotychczas kilka teorii próbujących wyjaśnić zjawisko dopasowania. Ogólnie dzielą się one na dwie klasy; teorie:

Teorie molarne analizują wyniki działania organizmu w dłuższej perspektywie czasowej. Przykładem takiej teorii jest molarna teoria maksymalizacji (maximization), zaproponowana przez Rachlina, Battalio, Kagela i Greena (1981).

Zgodnie z nią, rozłożenie aktywności proporcjonalnie do częstości uzyskiwanych wzmocnień prowadzi do zmaksymalizowania użyteczności otrzymanych nagród.

Teorie molekularne wyjaśniają zjawisko dopasowania na podstawie wyników rozkładu aktywności zwierząt w krótkich odcinkach czasowych.

Skupiają się na analizie czynników kierujących dystrybucją zachowań z chwili na chwilę. Należy do nich teoria ulepszania (melioration), której autorami są Herrnstein i Vaughan (1980).

Zgodnie z jej założeniami, zwierzęta przenoszą swoją aktywność z zachowania związanego z rozkładem wzmocnień A na zachowanie związane z rozkładem B, po to by ulepszyć miejscową (czyli związaną z konkretnym rozkładem; A lub B) częstość wzmocnień (liczba wzmocnień w jednostce czasu), które otrzymują.

Ulepszanie ma na celu zrównanie miejscowej częstości wzmocnień otrzymywanych z rozkładów A i B. W momencie gdy to zrównanie zostanie osiągnięte, okaże się, że rozłożenie aktywności zwierzęcia jest perfekcyjnie dopasowane częstości uzyskiwanych wzmocnień. W ten sposób mechanizm ulepszania prowadzi do efektu dopasowania.


Wyszukiwarka

Podobne podstrony:
002 Prowadzenie procesu w warunkach sterylnych
Strelau Procesy warunkowania (rozdział)
Strelau Procesy warunkowania (rozdział)
002 Prowadzenie procesu w warunkach sterylnych
16 Globalny cykl hydrologiczny i procesy warunkujące jego funkcjonowanie
Pojęcie zdrowia i charakterystyka procesów warunkujących zdrowie
ROLA PIELĘGNIARKI W POSTEPOWANIU Z CHORYM WE WSTRZĄSIE W WARUNKACH SZPITALNYCH, pielęgniarstwo proce
Rodzaje i warunki dotyczące pism procesowych
Istota,?l, zasady stosowania i warunki skuteczności kar w procesie resocjalizacji
Wykad 4 biotechnologia lekw, I procesow enzymatycznych i proceesow metabolicznych które warunkuja pr
Warunki zaliczenia - poznawcza - ćwiczenia, PSYCHOLOGIA, I ROK, semestr II, psychologia procesów poz
OGÓLNE WARUNKI BHP DZIAŁ IV PROCESY PRACY
inne, Pamięć2, WARUNKOWANIE INSTRUMENTALNE (sprawcze): proces, w którym reakcja staje się mniej lub
Istota,?l, zasady stosowania i warunki skuteczności nagród w procesie resocjalizacji
Procesy adaptacyjne w warunkach izolacji, Resocjalizacja
Procesy krasowienia w różnych warunkach klimatycznych
Warunkowanie instrumentalne, Psychologia Ogólna B Złożone Procesy Poznawcze

więcej podobnych podstron