Warunkowanie instrumentalne, Psychologia Ogólna B Złożone Procesy Poznawcze


WARUNKOWANIE INSTRUMENTALNE - PAMIĘĆ ĆW. 3

WARUNKOWANIE INSTRUMENTALNE (sprawcze): proces, w którym reakcja staje się mniej lub bardziej prawdopodobna w zależności od konsekwencji (prawdopodobieństwo określonego zachowania zależy od jego konsekwencji - tak już twierdził Throndike). Zachowanie stanowi tu instrument - narzędzie pozwalające coś uzyskać. Dzięki niemu zwierzęta uczą się jakie są następstwa rozmaitych zachowań.

Określa je: prawdopodobieństwo pojawienia się nagrody (kary) po wykonaniu określonej reakcji oraz prawdopodobieństwo pojawienia się nagrody (kary) bez uprzedniego wykonania reakcji.

Optymalne warunki do uczenia się reakcji instrumentalnych wyznacza perfekcyjna zależność między zachowaniem a jego konsekwencjami (jak w warunkowaniu klasycznym)

Warunkowanie klasyczne różni się od instrumentalnego typem wywoływanych reakcji (w klasycznym jest to odruch, odpowiedź automatyczna na bodziec ze środowiska, np. ślinienie się, a w instrumentalnym reakcja nie jest odruchowa, ale bardziej złożona i obejmuje cały organizm, np. pisanie listu) i tym, że prawdopodobieństwo pojawienia się nagrody (kary) bez uprzedniego wykonania reakcji może być równe prawdopodobieństwu pojawienia się nagrody (kary) po wykonaniu określonej reakcji, a mimo to dojdzie do warunkowania instrumentalnego (klasycznego w takim przypadku nie!!!).

Prawo efektu Throndike'a: zdolność bodźca do wywoływania reakcji rośnie, gdy po reakcji następuje nagroda, a spada, gdy nagroda nie następuje (zachowania jest kontrolowane przez jego konsekwencje).

Bodziec, który kontroluje zachowanie (tzw. bodziec kontrolujący) zmienia prawdopodobieństwo wystąpienia reakcji instrumentalnej. Częstość występowania reakcji sprawczej w obecności tego bodźca może być większa lub mniejsza niż w wypadku braku bodźca kontrolującego ze środowiska. 2 typy bodźców kontrolujących :

W Polsce warunkowanie instrumentalne badał Jerzy Kontorski, który nazwał je odruchami warunkowymi II typu (odruch I typu to odruchy klasyczne).

Pawłow sądził, że kluczowe znaczenie w warunkowaniu klasycznym ma styczność w czasie BW i BB. Throndike doszedł do tego, że styczność w czasie reakcji i jej konsekwencji jest jedynym warunkiem utrwalenia się reakcji instrumentalnej. Teraz już wiemy, że to za mało - potrzebna jest relacja zależności między reakcją analizie jej następstwami

W analizie Skinnerowskiej (w warunkowaniu instrumentalnym po prostu) reakcja może prowadzić do jednej z 3 typów konsekwencji:

  1. obojętnego wobec przyszłych zachowań: nie wpływa na zwiększenie lub zmniejszenie prawdopodobieństwa pojawienia się określonego zachowania;

  2. wzmocnienia - czynnik wzmacniający (bodziec lub zdarzenie) nasila daną reakcję lub zwiększa prawdopodobieństwo jej wystąpienia;

  3. karania - każda konsekwencja zachowania, która zmniejsza prawdopodobieństwo pojawienia się tego zachowania w podobnych warunkach w przyszłości Czynnikami karzącymi mogą być wszystkie przykre bodźce lub zdarzenia.

Są 3 typy awersyjnej kontroli zachowania:

  1. karanie - wykonanie reakcji powoduje wystąpienie bodźca awersyjnego.

  2. ucieczka - gdy wykonanie reakcji powoduje eliminację aktualnie działającego bodźca awersyjnego (tu chyba chodzi o warunkowanie negatywne)

  3. unikanie - gdy wykonanie reakcji zapobiega pojawieniu się bodźca awersyjnego (to też mi się kojarzy z warunkowaniem negatywnym) - wzmocnieniem jest brak wystąpienia bodźca awersyjnego. W jaki sposób jest to możliwe? Wyjaśnia to teoria dwuczynnikowa (Rescorola i Solomon) - oparta na połączonym działaniu warunkowania klasycznego i instrumentalnego; mówi, że organizm początkowo uczy się reakcji ucieczki przed bodźcem awersyjnym (np.: przed szokiem). Warunkowanie klasyczne sprawia, że bodziec dyskryminacyjny (BD; przekazujący inf, że po określonej reakcji pojawi się dane wzmocnienie) podawany przed szokiem, staje się bodźcem warunkowym, zapowiadającym BB, czyli szok elektryczny. Po paru próbach BW zaczyna wywoływać RW (lęk). Zwierzę zaczyna wykonywać R instrumentalną już przy prezentacji BD - czyli ucieka przed lękiem. Z drugiej strony ta sama reakcja prowadzi do uniknięcia BB (szoku). Teoria dwuczynnikowa mówi, więc, że reakcja unikania to specyficzna forma reakcji ucieczki: ucieczka przed lękiem wywołanym BW (BD).

Warunkowanie instrumentalne można też traktować jako rodzaj selekcji naturalnej w sferze ciągle zmieniających się zachowań jednostki (to od Darwina - działania jednostki są „selekcjonowane” poprzez ich konsekwencje i w ten sposób jedne pojawiają się częściej, a inne zanikają).

Wzmocnienie pozytywne: każda konsekwencja zachowania, która powoduje zwiększenie się prawdopodobieństwa powtórzenia się tego typu zachowania w przyszłości; (a innymi słowami: procedura wzmacniania, w której po reakcji pojawia się lub intensyfikuje bodziec wzmacniający, wskutek czego reakcja się nasila lub zwiększa się jej częstotliwość) Coś dodajemy, zyskujemy. Np.: Pani z rozwojówki pochwaliła Cię za dobrą odpowiedź (wzmocnienie), więc chętniej będziesz czytała wykłady (nasilenie reakcji).

Wzmocnienie negatywne: takie wykonanie reakcji, które pozwala uniknąć przykrych, awersyjnych konsekwencji, co powoduje zwiększenie się prawdopodobieństwa powtórzenia tej reakcji w przyszłości (innymi słowami: procedura wzmacniania, w której po reakcji bodziec nieprzyjemny zostaje usunięty, zanika lub słabnie, wskutek czego reakcja się nasila lub zwiększa się jej częstotliwość. Czegoś unikamy, pozbywamy się czegoś nieprzyjemnego. Np.: Omijamy gabinet doktora Szymury, aby go nie spotkać, dzięki czemu mamy spokojniejsze sny .

Na stronie 191 jest taka tabelka, na którą sobie zerknijcie.

Karanie a wzmocnienie: karanie zmniejsza prawdopodobieństwo wystąpienia reakcji, a wzmocnienie (pozytywne i negatywne) to prawdopodobieństwo zwiększa.

Pierwotny czynnik wzmacniający: bodziec o naturalnym działaniu wzmacniającym zaspokajający głównie potrzeby fizjologiczne, np.: pożywienie, woda, głaskanie, optymalna temperatura powietrza. Ale… organizm może na przykład nie być spragniony, więc szklanka wody nie podziała wtedy jako pierwotny czynnik wzmacniający (organizm może być w stanie nasycenia, które nie pozwala bodźcowi zadziałać jako pierwotny czynnik wzmacniający).

Pierwotny czynnik karzący: bodziec o naturalnym działaniu karzącym, np. wstrząs elektryczny, skrajne gorąco lub zimno, itp.

Wtórny czynnik wzmacniający: bodziec, który nabiera właściwości wzmacniających przez skojarzenie z innymi czynnikami wzmacniającymi, np.: pieniądze, pochwała, sława.

Pierwotny czynnik karzący - bodziec o naturalnym działaniu karzącym, np.: wstrząs elektryczny.

Wtórny czynnik karzący: bodziec, który nabiera właściwości karzących przez skojarzenie z innymi czynnikami karzącymi, np.: nagana, krytyka, karcenie.

Wtórne czynniki są wyuczone, ale mogą być równie skuteczne (i równie silne) w sterowaniu zachowaniem jak czynniki pierwotne. Behawioryści twierdzą, że mają one zdolność oddziaływania na zachowanie przez połączenie z czynnikami pierwotnymi. Inaczej nazywa się je warunkowymi.

Metody warunkowania instrumentalnego:

Bodziec różnicujący: bodziec sygnalizujący, kiedy po określonej reakcji prawdopodobny (a nie przymusowy jak w warunkowaniu klasycznym) jest pewien rodzaj konsekwencji (mówi, czy reakcja będzie „opłacalna”). Brak właściwego rozróżnienia powoduje wypadki i pomyłki. Gdy wchodzimy do pokoju i już nie pamiętamy po co właściwie tam poszliśmy to według behawiorystów jest to spowodowane tym, że nie działają już bodźce różnicujące.

Kontrola bodźcowa: kontrolowanie pojawienia się reakcji przez bodziec różnicujący.

Rozkłady o stałych i zmiennych proporcjach powodują utrzymywanie się wysokiego tempa wykonywania reakcji instrumentalnej.

Rozkłady wzmocnień zmiennych i stałych odstępach czasowych wywołują umiarkowane tempo reagowania.

Rozkłady wzmocnień - są zasadami precyzującymi jak często i pod jakimi warunkami zachowanie jednostki będzie wzmocnione. Stanowią więc ograniczenie dostępności zachowań i bodźców będących wzmocnieniami, ponieważ ich uzyskanie jest uzależnione od odpowiedniego wykonania innych czynności (reakcji instrumentalnych).

Krzywe uczenia się: odzwierciedlają łączny rezultat wzmacniania - im większa częstotliwość reakcji, tym bardziej stroma krzywa (jeśli chcecie to na str. 198 jest wykresik).

Oprócz powyższych rozkładów wyróżnia się jeszcze kilka innych - są to tzw. rozkłady wyrównujące tempo reakcji (dzięki nim uzyskiwana jest duża regularność pojawiających się reakcji). Są to:

Eksperymentalna analiza sekwencji występujących w zachowaniu - badanie łańcuchów rozkładów (rozkłady łączymy w łańcuchy, w których dopiero wypełnienie wymagań ostatniego ogniwa jest wzmacniane - tzw. rozkłady łańcuchowe/rozkłady drugiego rzędu). Takie łańcuchy działają tylko wtedy, gdy po zakończeniu każdego etapu organizm dostaje jakiś sygnał mówiący, że zbliża się do celu, czyli do wzmocnienia.

Procedura konkurencyjnych rozkładów wzmocnień - w tym samym czasie podajemy jednostce 2 (lub więcej) sposoby uzyskania wzmocnień - każdy według innego rozkładu wzmocnień (badamy dokonywanie wyborów).

Prawo dopasowania Richarda Herrnesteina - reakcje organizmu zachodzące w środowisku, w którym działają konkurencyjne rozkłady wzmocnień o stałych lub zmiennych odstępach czasowych, rozdzielają się pomiędzy te rozkłady wzmocnień proporcjonalnie do częstości uzyskania w ich wyniku wzmocnień (i tu jest ten cudowny wzór, którego mam nadzieję nie musimy znać - Ostaszewski str. 114). Innymi słowy: relatywna częstość reakcji dopasowana jest do relatywnej częstości wzmocnień uzyskiwanych w wyniku tych reakcji. Teorie próbujące wyjaśnić uniwersalne (występuje u ludzi i u wszystkich zwierząt) zjawisko dopasowania dzielą się na:

Humphreys stwierdził, że liczba prób ze wzmocnieniem potrzebnych do wytworzenia się oczekiwanego zachowania (czyli reakcji instrumentalnej) jest taka sama dla warunkowania regularnym jak i nieregularnego. Regularne stosowanie wzmocnienia nie przyspiesza zatem uczenia się nowych reakcji (myślę, że to całkiem dobre pytanie na egzamin by było).

C.d. Metod warunkowania instrumentalnego:

Stopniowe przybliżania: w warunkowaniu instrumentalnym procedura kształtowania zachowań uszeregowanych według wzrastającego podobieństwa lub zbliżania do reakcji zgodnej z oczekiwaniami.

Kształtowanie wykorzystuje się w treserze psów przewodników i małpek kapucynek, które pomagają osobom sparaliżowanym.

Warunkowe tłumienie (CER) - przejawia się w zahamowaniu wykonywanej reakcji instrumentalnej podczas prezentacji bodźca warunkowego skojarzonego uprzednio z bezwarunkowym bodźcem awersyjnym.

Bodziec warunkowy wywoła nasilenie wykonywania reakcji instrumentalnej jeśli obie zależności (Pawłowska i instrumentalna) będą apetytywne lub awersyjne. Jeśli zaś stany motywacyjne są różne, bodziec warunkowy obniży tempo (nasilenie) wykonywanej reakcji instrumentalnej.

Warunkowanie instrumentalne w realnym życiu: