Tadeusz Tyszka
PSYCHOLOGICZNE
PUŁAPKI
oceniania i podejmowania decyzji
SERIA PSYCH OLOG l l SPOŁECZNEJ
GWP
GDAŃSKIE WYDAWNICTWO PSYCHOLOGICZNE
Gdańsk, 2000
Copyright (c)1999 by Tadeusz Tyszka oraz Gdańskie Wydawnictwo Psychologiczne, Gdańsk 1999
Wszystkie prawa zastrzeżone.
Książka ani jej część nie może być przedrukowywana ani w żaden inny sposób reprodukowana lub odczytywana w środkach masowego przekazu bez pisemnej zgody Gdańskiego Wydawnictwa Psychologicznego.
Wydanie pierwsze
Redakcja: Agnieszka Golębiewska
Korekta: Andrzej Karmoliński
Skład: Kamila K-wiek
Opracowanie graficzne: Dominika Gzowska
ISBN 83-85416-95-1
Druk: "Stella Maris" ul. Rzeźnicka 54/56, 80-822 Gdańsk
Gdańskie Wydawnictwo Psychologiczne
ul. Bema 4/la, 81-753 Sopot, tel./fax 058/551-61-04
e-mail: gwp@gwp.gda.pl
http://www. gwp. gda.pl
PRZEDMOWA ....................................
PODZIĘKOWANIA .................................
l. ROZBIEŻNOŚCI W OCENIANIU ...................
1.1. Niekonsekwentna opinia publiczna ...................
1.2. Niezgodność opinii ogólnych i szczegółowych .............
1.3. Rozbieżności w ocenach szkolnych ....................
1.4. Oceny sędziów bokserskich .........................
1.5. Nietrafne oceny kliniczne ..........................
1.6 Rozbieżne werdykty sądowe ........................
1.7. Zawodne oceny inżynierskie ........................
1.8. Zwodnicze zalecenia dietetyków ......................
1.9. Zróżnicowane oceny ryzyka .........................
1.10. Konkluzje ....................................
2. PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU ....
2.1. Trzymanie się środka skali (tendencja centralna) ..........
2.2. Efekt kontrastu ................................
2.3. Efekty pierwszeństwa i świeżości .....................
2.4. Przenoszenie ocen z jednych zadań na inne: efekt "aureoli" . . . -
2.4.1. Wpływ nazwiska autora na ocenę wytworu ...............
2.4.2. Wpływ miejsca wykonania na ocenę wytworu .............
3. OCENY I UCZUCIA ............................
3.1. Widzenie przez różowe i czarne okulary .................
3.2. Dlaczego nastrój wpływa na ocenianie? .................
3.3. Znaczenie emocjonalnego stosunku wobec ocenianych obiektów .
3.4. Zabiegi mające na celu utrzymanie wysokiego mniemania o sobie
3.5. Marketingowe uwiedzenie .........................
4. SPOŁECZNY KONTEKST OCENIANIA ..............
I. KONFORMIZM ...........:....................
4.1. Konformizm ..................................
fOYUt-lULUGICZNE PUł-APM UUfcNIANIA l PODEJMOWANIA DECYZJI
. 56 . 57 . 58 . 60 . 61
. 62 . 63
65
, 65 . 68
70
73
74 7$
75
75
76 76
81
81
82
83
84 86 86 90
93
93
96 96 98 100 104
106 108 110
Znaczenie mniejszości ...............................
Jak unikać nacisku społecznego? ........................
MYŚLENIE GRUPOWE ........................... '. '.'.
Symptomy grupowego myślenia .........................
Co doprowadza do myślenia grupowego? ...................
Konsekwencje grupowego myślenia: w jaki sposób dochodzi do fiaska podejmowanych decyzji? ..............................
Jak chronić się przed myśleniem grupowym? ................
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY: MOŻLIWOŚCI MANIPULOWANIA OCENAMI LUDZI ...............
Jak przyjęta perspektywa zmienia nasze decyzje? ..........
Inne pieniądze, inna odwaga ........................
Co bardziej przykre: wiele małych strat czy jedna strata duża? Co przyjemniejsze: wiele małych zysków czy jeden zysk duży? . . Ubezpieczanie się ...............................
Wartość czasu i wysiłku ...........................
Manipulowanie ocenami poprzez narzucanie perspektywy .....
Skutki dla pomiaru opinii społecznej ..................
Manipulowanie perspektywą w sferze społeczno-politycznej . . . Wykorzystywanie w marketingu .....................
Jak kontrolować przyjmowaną perspektywę? .............
ZNACZENIE KONTEKSTU ...........................
Wpływ kolejności pytań na odpowiedzi w badaniach ankietowych ....
Ocena serii bodźców: wpływ bodźców poprzedzających ...........
Implikacje i wnioski dla badań ankietowych ..................
Efekty kontekstu w badaniach marketingowych ...............
Wpływ kontekstu na wybory ...........................
Asymetryczna dominacja ..............................
Unikanie opcji skrajnych ..............................
ZNACZENIE WCZEŚNIEJSZYCH OPINII: POSZUKIWANIE POTWIERDZENIA WŁASNYCH MNIEMAŃ i^. .........
Argumenty neutralne przemawiające na korzyść wcześniejszego przekonania ...................................
Ludzie przejawiający uporczywe trwanie
przy raz ustalonych ocenach .........................
Uprzedzenia ...................................
Utrzymywanie się mitów i bezpodstawnych mniemań ........
Czy można "zatrzeć" raz otrzymaną informację? ............
Wybór i stronniczość ocen ..........................
Stronniczość ocen w werdyktach sportowych
i w werdyktach politycznych .........................
Stronniczość ocen przy wyborach konsumenckich ...........
Przywiązanie konsumenta do marki towaru ..............
8.
8.1.
8.2.
8.3.
8.3.1.
8.3.2.
8.4.
8.5.
8.6.
8.7.
9.
9.1.
9.2.
9.3.
9.4.
9.5.
9.6.
9.7.
9.8. 10.
10.1.
10.2.
10.3.
10.4.
10.5.
10.6.
10.7.
11.
I.
11.1.
11.2.
11.3.
11.4.
II.
11.5.
11.6.
OCENY GLOBALNE CZY CZĄSTKOWE ...............
Dwie procedury formułowania ocen ....................
Trafność obu rodzajów procedur przy tworzeniu złożonych ocen . Porównanie trafności procedur przy stawianiu diagnoz i prognoz , Diagnozy i prognozy oparte na zewnętrznej procedurze wykorzystującej wagi statystyczne .....................
Wagi oparte na intuicjach ekspertów ....................
Dlaczego nie wykorzystuje się oceniania opartego na zewnętrznej procedurze? ..................................
Nieinteligentnie zaprojektowany system ocen pracowników ....
Parlamentarna utopia .............................
Wybór amunicji do karabinów policyjnych ................
ZŁUDZENIA W OCENIANIU SZANS - WYOLBRZYMIANIE I NIEDOCENIANIE SZANS .........................
Zasada reprezentatywności ............................
Zasada reprezentatywności w kasynach gry - złudzenie gracza . . . Ignorowanie ogólnych prawidłowości ....................
Nieuwzględnianie regresji w przewidywaniach ..............
Błąd koniunkcji ..................................
Zasada zakotwiczenia ..............................
Złudzenie w ocenianiu zdarzeń łącznych (koniunkcji) i rozłącznych (dysjunkcji) .....................................
Zasada dostępności psychicznej ........................
OCENY ZALEŻNOŚCI - KŁOPOTY Z WYKORZYSTANIEM DOŚWIADCZENIA ....... ^ ......................
Współwystępowanie i korelacja .......................
Pozorne korelacje ................................
Oceny oparte na obserwacji i oceny oparte na mniemaniach ....
Iluzja kontroli ..................................
Niezauważane przypadki ...........................
Dlaczego nie uczymy się z doświadczenia: brakująca informacja . . Jak korzystać z doświadczenia: potrzeba eksperymentowania . . .
BŁĘDY W OCENIE WŁASNEJ WIEDZY .................
NADMIERNA PEWNOŚĆ SIEBIE .......................
Test nieuzasadnionej pewności siebie .....................
Powszechność zjawiska nieuzasadnionej pewności siebie ........
Gdy rośnie pewność bez poprawy trafności stawianych diagnoz ....
Czy można poprawić oceny pewności (zmniejszyć nadmierną pewność siebie)? .........................................
"WIEDZIAŁEM, ŻE TO SIĘ ZDARZY" ....................
Złudzenie pod nazwą "wiedziałem, że to się zdarzy" ............
Złudzenie "wiedziałem, że to się zdarzy" i przewody sądowe ......
l V ^YLil-lULUUlUZNb HULANKI UUbNIANIA l PODEJMOWANIA DECYZJI
11.7. Złudzenie "wiedziałem, że to się zdarzy" i nadmierna surowość
w ocenie nieudanych decyzji ............................. 181
11.8. Przekleństwo wiedzy .................................. 182
12. PRAGNIENIA I PRZEKONANIA ........................ 184
I. ZNIEKSZTAŁCANIE PRZEKONAŃ PRZEZ PRAGNIENIA ........ 184
12.1. Czy nasz kandydat ma szansę w wyborach prezydenckich? ......... 184
12.2. Myślenie życzeniowe .................................. 186
12.3. Samooszukiwanie się .................................. 189
12.4. Redukowanie dysonansu poznawczego ...................... 191
II. PRZYSTOSOWYWANIE PRAGNIEŃ DO PRZEKONAŃ .......... 195
12.5. Efekt kwaśnych winogron .............................. 195
12.6. Świadoma kontrola pragnień: samozobowiązania ............... 196
12.7. Manipulowanie informacją ............................'.. 198
12.8. Kształtowanie charakteru ............................... 199
12.9. Manipulowanie własnym wewnętrznym systemem .............. 201
13. KIEDY OCENY WPŁYWAJĄ NA FAKTY:
SAMOSPEŁNIAJACE SIĘ PROROCTWA ................. 203
13.1. Niezwykły przyrost inteligencji ........................... 203
13.2. Przewidywanie urody nieznanej rozmówczyni ................. 204
13.3. Czy dyskryminacja rasowa ma podstawy? ..................... 205
13.4. Samospełniające się proroctwa w szkole ..................... 206
13.5. Samospełniające się oczekiwania ekonomiczne: jak można doprowadzić do
upadku banku, bessy na giełdzie, wzrostu inflacji? ............... 208
13.6. Bajka na temat kariery ................................. 210
14. DODATEK DLA STUDENTÓW: SKALE I TECHNIKI
SKALOWANIA ..................................... 214
14.1. Skale rangowe ...................................... 214
14.2. Porównywanie parami ................................. 216
14.3. Skale ocen ......................................... 220
14.4. Skalowanie bez liczb .................................. 222
14.5. Bezpośrednia ocena wielkości ............................ 223
BIBLIOGRAFIA .................................... 227
Przedmowa
W badaniach konsumenckich, w badaniach opinii publicznej, ale także w( wszelkiego rodzaju konkursach prosi się ludzi (konsumentów, obywateli, członków jury) o ocenę atrakcyjności: produktów, kandydatów czy rozmaitych wy tworów ludzkich. Czasami chodzi o ogólną ocenę atrakcyjności (jak bardzc podoba się nam dany produkt czy dany kandydat). Kiedy indziej prosi się o ocenę różnych "przedmiotów" ze względu na jakieś ich poszczególne cechy: ksztaH (robotów kuchennych), wiarygodność (kandydatów na prezydenta) itp.
Ocenianie polega na przypisywaniu odpowiednich liczb ocenianym przed miotom (osobom czy ich wytworom) lub zdarzeniom (zachowaniom osób cz;
funkcjonowaniu ich wytworów). Wyrażamy w ten sposób na odpowiednie skali natężenia ocenianych jakości (np. atrakcyjności, wiarygodności itp.).
Oprócz oceniania w tym ścisłym sensie, w niniejszej książce badane si także sytuacje podobne do oceniania, choć właściwszą dla nich nazwą jesi "decydowanie". Są to diagnozy - kiedy np. lekarz stwierdza, która z możli wych chorób występuje w danym przypadku, prognozy - kiedy meteorolog stwierdza, jaka pogoda wystąpi jutro, werdykty - kiedy jury wskazuje zwy cięzcę w konkursie. W książce także tego rodzaju przypadki będę nazywa ocenami (w szerokim sensie). Usprawiedliwia to fakt, że sytuacje te wyma gają zwykle dokonania jakiejś wcześniejszej oceny. Zęby na przykład wyda( werdykt, któremu z walczących bokserów przyznać zwycięstwo, sędziowit bokserscy oceniają wcześniej, który z zawodników zadał więcej celnych cio sów. Po drugie, samo decydowanie można również traktować jako przypisy wanie liczb ze zredukowanej skali: 0-1, gdzie O odpowiada negatywnej decy zji, a l - decyzji pozytywnej.
Książka koncentruje się na błędach oceniania, na jego niedoskonałościach Jej lektura musi prowadzić do wniosku, że jakość naszych ocen nie jest nad zwyczajna, że przy ich formułowaniu wpadamy w rozmaite pułapki. Co wie cej, niektóre z opisywanych w książce słabości są tak powszechne i tak silne że skłaniają do wniosku, iż słabości te są zgoła nieuleczalne. Brzmi to cokół wiek radykalnie1, a nadto nasuwa domniemanie, że niniejsza praca musi by<
Na tyle radykalnie, że skłania do refleksji, czy aby psycholodzy (w tym autor obecnej książki) nie nazbyt pochopnii osądzają te różne tendencje jako błędy. Kilka uwag do pierwszego rozdziału obecnej książki, przekazanych mi prze prof. Witolda Marciszewskiego, sugeruje, że ocena tego, co jest błędem w wielu analizowanych przypadkach, nie je:
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
stronnicza. Przypuszczam, że taka opinia czytelnika może być uzasadniona. Bez wątpienia moja książka jest stronnicza w doborze przypadków. Można bez trudu napisać tej samej objętości książkę skoncentrowaną na przypadkach ocen ludzkich o zdumiewającej trafności. (Jest jednak powód, żeby zająć się przypadkami gorszymi, gdyż te wymagają ewentualnych korekt). Uważny czytelnik może też dopatrzyć się stronniczości w interpretacji niektórych opisywanych przypadków. Zapewne nie wszystkie opisywane tendencje muszą być traktowane jako błędy, niektóre wydają się mieć "swoją logikę" (pokazywałem ją tam, gdzie udawało mi sieją dostrzec).
Wynika stąd także przestroga dla Czytelnika: Autor nie oczekuje, że Czytelnik weźmie zbyt dosłownie wszystkie przestrogi cytowane i formułowane w książce, a szczególnie - te bardziej radykalne (Nie sądźcie, a nie będziecie sądzeni).
Podziękowania
Studentom Szkoły Nauk Społecznych przy IFiS PAN, którym wykładałem większość przedstawionego w książce materiału i których "inteligentne" słuchanie oraz uwagi bardzo mi pomogły;
Piotrowi Matyi, który czytał kolejne jej wersje i systematycznie je oceniał i poprawiał;
Elżbiecie Łęckiej - za mnóstwo "technicznej" pomocy;
Profesorom: Maciejowi Dymkowskiemu i Bogdanowi Wojciszke, którzy książkę recenzowali i także wnieśli wiele cennych poprawek. Podziękowanie za wsparcie finansowe składam Fundacji Nauki Polskiej.
bynajmniej tak jednoznaczna, jak to przyjmowałem (i jak to się przyjmuje powszechnie wśród psychologów). Analizując sformułowania zadań stawianych przed badanymi osobami oraz ich odpowiedzi, prof. Marciszewski, jako logik, gotów jest bronić racjonalności przynajmniej niektórych z tych zachowań, które "zdroworozsądkowe" wydają się nieracjonalne. Charakter niniejszej książki, a także brak odpowiedniego przygotowania nie pozwala mi podjąć tej niewątpliwie intrygującej dyskusji. Czytelnik przywiązany do idei racjonalności człowieka znajdzie też pewne wsparcie dla owego przywiązania w książce W. Lewickiej (1993).
1.
Rozbieżności w ocenianiu
Nie sądźcie, a nie będziecie sądzeni (Łk. 6,37)
We wszystkich dziedzinach działalności ludzkiej wydawane są werdykty, przedstawiane są diagnozy, prognozy i innego rodzaju oceny. Kiedy wypowiadamy opinię, że dziecko nasze jest inteligentne, a sąsiad głupi, formułujemy pewne oceny. Podobnie kiedy formułujemy opinie w sprawach ekonomicznych, społecznych czy politycznych. Nauczanie szkolne jest nierozerwalnie związane z wystawianiem uczniom ocen. Podobnie w sporcie ocenia się osiągnięcia zawodników i formułuje werdykty o zwycięstwie. W sądzie wydaje się werdykty o winie bądź braku winy oskarżonego, a także podejmuje się decyzje o wysokości wyroków, w medycynie stawia się diagnozy dotyczące choroby, a także formułuje prognozy w odniesieniu do skuteczności zastosowania danej terapii. We wszystkich tych, a także w wielu innych dziedzinach mamy do czynienia z procesem psychicznym - tworzeniem ocen.
Jaka jest jakość tworzonych przez nas ocen? W rozdziale tym pokażemy kilka przykładów, które nadzwyczaj dobitnie ilustrują niedoskonałości naszego oceniania.
1.1. Niekonsekwentna opinia publiczna
Zacznijmy ten przegląd "dziwnych" efektów tzw. opinii publicznej, która w demokracji stała się jedną z najczęściej przywoływanych postaci oceniania. Znane jest tam zjawisko pseudoopinii. Plous (1993) przytacza starą publikację z magazynu "Tide", w którym zamieszczono rozkład odpowiedzi grupy respondentów amerykańskich pytanych o opinię w sprawie Ustawy o Metalicznych Metalach. Zadano im pytanie: J
Która z poniższych odpowiedzi najlepiej wyraża Twoją opinię w sprawie Ustawy o Metalicznych Metalach ?
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
(a) byłoby to słuszne posunięcie ze strony amerykańskiej;
(b) jest to przedsięwzięcie słuszne, ale powinno być pozostawione do decyzji poszczególnych stanów;
(c) jest to przedsięwzięcie właściwe, gdy chodzi o inne kraje, ale niekonieczne dla Ameryki;
(d) jest zdecydowanie nieużyteczne.
45-i-40--35--30--25--20--15--10--5-
a b c d brak odpowiedzi
Rys.1.1.
Rozkład odpowiedzi w sprawie nieistniejącej Ustawy o Metalicznych Metalach.
Jak pokazuje rys. 1.1., w odpowiedzi na to pytanie 41% respondentów opowiedziało się za (b), 15% - za (a), 11% - za (c) i 3% - za (d). Trzydzieści procent nie udzieliło żadnej odpowiedzi. Tylko ci ostatni zachowali się odpowiednio, gdyż żadnej Ustawy o Metalicznych Metalach w ogóle nie było.
Nie jest to przykład odosobniony; nie ma tak absurdalnego pytania, które postawione w badaniu opinii publicznej nie doprowadzi do uzyskania pseu-doopinii od znacznej grupy respondentów. Jest to niewątpliwie efekt kłopotliwy dla zwolenników demokratycznych reguł decydowania społecznego.
Nic dziwnego, że badacze opinii publicznej zaczęli używać tzw. filtrów, przy których pomocy starają się eliminować respondentów niemających żadnej opinii w badanej sprawie. Jest to realizowane poprzez wprowadzenie kategorii odpowiedzi: "brak zdania" albo "nie wiem". Okazuje się, ze dodanie takich kategorii odpowiedzi ogranicza liczbę pseudoopinii, jednakże me eliminuje ich całkowicie. Pewna liczba takich opinii pozostaje zawsze.
ROZBIEŻNOŚCI W OCENIANIU
1.2. Niezgodność opinii ogólnych i szczegółowych
W ogólnopolskich badaniach ankietowych w okresie przejścia między gospo darką kierowaną centralnie a gospodarką wolnorynkową analizowaliśmy zgodność preferencji ogólnych i szczegółowych w takich samych kwestiacł (Tyszka, Sokołowska, 1991). Pytano na przykład o państwową kontrolę na( cenami. Badani odpowiadali na sześć pytań: jedno ogólne - o potrzebę koń troli cen przez państwo - i pięć szczegółowych - o potrzebę kontrolowani;
cen energii, żywności, kosztów leczenia i nauczania oraz ceny dolara. Oka zało się, że badani byli większymi przeciwnikami kontroli cen (w mniejszyn stopniu akceptowali kontrolę cen), odpowiadając na pytanie ogólne niż od powiadając na pytania szczegółowe.
Podobnie badani odpowiadali na pięć pytań: jedno ogólne - o potrzeb( ulg podatkowych dla niektórych dziedzin gospodarki - i cztery szczegółowi - o ulgi podatkowe dla rolnictwa, budownictwa mieszkaniowego, służby zdro wia i oświaty. I znowu, tak jak w poprzednim przypadku, badani byli mniej szymi zwolennikami stosowania ulg podatkowych w ogólności niż w odnie sieniu do konkretnie wymienianych dziedzin gospodarki.
W różnych tego rodzaju kwestiach stwierdzano, że tylko od 45% do 70% badanych udzielało identycznych odpowiedzi na pytania ogólne i szczególe we. Respondenci w większym stopniu akceptowali zasady gospodarki wolno rynkowej na poziomie ogólnym niż w konkretnych przypadkach.
Podobny wynik uzyskali Prothro i Grigg (1960), kiedy badali akceptacji w społeczeństwie amerykańskim popularnych zasad demokratycznych - w rodzaju: Wszyscy obywatele powinni mieć równe szansę wpływania ni politykę rządową; Mniejszość powinna mieć prawo do krytyki decyzji wiek szóści.
Okazało się, że ogromna większość społeczeństwa amerykańskiego po piera te zasady. Prothro i Grigg skonstruowali wtedy pewną liczbę bardzie szczegółowych stwierdzeń, bądź to zgodnych, bądź sprzecznych z owymi za sadami ogólnymi. Były tam m. in. takie stwierdzenia: Gdyby jakiś komuni sta chciał w tym mieście wygłosić przemówienie zachwalające komunizm, ti powinien mieć takie prawo; Tylko ludzie dobrze poinformowani o sprawie która ma być przesądzona, powinni mieć prawo głosu w referendum miej skim.
Ankieta z tymi stwierdzeniami została przedstawiona w kilku miejscowo ściach amerykańskich. Okazało się, że opinie respondentów w tak szczegóło wo sformułowanych kwestiach były w ogromnym stopniu niezgodne z po wszechnic akceptowanymi ogólnymi zasadami demokracji. Na przykład 51% respondentów poparło "antydemokratyczne" stwierdzenie, że tylko dobrz< poinformowani powinni mieć prawo głosu w referendum. Także zaledwi<
10 PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
44% respondentów uznało, że komunista ma prawo wygłosić przemówienie zachwalające komunizm.
1.3. Rozbieżności w ocenach szkolnych
Materska (1992, 1994), która prowadzi intensywne badania nad ocenianiem szkolnym, przytacza mnóstwo danych wskazujących na ogromną rozbieżność ocen za te same prace. Systematyczne badania na ten temat prowadzone we Francji przez Pierona, a następnie przez Noizeta ze współpracownikami (za Materska, 1992, oraz za Noizetem i Cavernim, 1988) nie pozostawiają tu żadnych wątpliwości.
Obserwowano rozbieżności w ocenach wystawianych przez różne komisje egzaminacyjne. Jeżeli przyjąć, że do komisji tych trafiali podobni uczniowie, oznacza to, iż na wynik egzaminu ma wpływ nie tylko uczeń, lecz również egzaminator. Stwierdzano wprawdzie, że istnieją okoliczności sprzyjające mniejszemu zróżnicowaniu ocen między komisjami egzaminacyjnymi, ale okoliczności te bynajmniej nie eliminują rozbieżności w ogóle. Na przykład wielkość rozbieżności między ocenami zależała od takich okoliczności, jak: (a) forma egzaminu - odpowiedzi ustne były oceniane w sposób bardziej zróżnicowany niż odpowiedzi pisemne; (b) przedmiot egzaminu - np. rozbieżności w ocenach z matematyki i fizyki były mniejsze niż rozbieżności w ocenach z filozofii itd. Generalnie jednak w każdych warunkach stwierdzano znaczne rozbieżności w ocenach wystawianych przez różne komisje.
Podobne rozbieżności obserwowano przy porównywaniu ocen wystawianych temu samemu uczniowi przez kilku nauczycieli. Laugier i Weinberg (za Noizetem i Cavernim, 1988) dawali te same wypracowania z języka angielskiego do niezależnej oceny sześciu różnym nauczycielom. Porównanie wypadło "wstrząsająco". Na 20-stopniowej skali ocen skrajne zróżnicowanie wynosiło aż 13 punktów. Ponadto żadne z wypracowań nie otrzymało takiej samej oceny od wszystkich oceniających. Materska (1992, 1994) przytacza podobne wyniki z badań polskich, gdzie spośród 39 wypracowań ocenianych według polskiej 4-stopniowej skali przez sześciu nauczycieli otrzymano wyniki następujące: jedno (tylko jedno!) wypracowanie otrzymało tę samą notę od wszystkich nauczycieli; 11 wypracowań otrzymało dwie różne noty; 26 wypracowań otrzymało trzy różne noty; i wreszcie jedno wypracowanie otrzymało wszystkie cztery możliwe noty.
Materska (1994) przytacza wypowiedź Pierona, który po latach badań nad ocenianiem szkolnym miał powiedzieć, że "aby przewidzieć stopień otrzymany przez ucznia na egzaminie, bardziej celowe jest poznanie egzaminato-
l
ROZBIEZNOSCI W OCENIANIU
ra niż samego ucznia". Trudno powiedzieć, ile jest w tym przesady, ale Materska kontrastuje tę wypowiedź z faktem, że nawet oceny tego samego nauczyciela podlegają zmianom w czasie. Po upływie kilku miesięcy oceny tej samej pracy przez tego samego nauczyciela zmieniają się.
1.4. Oceny sędziów bokserskich
Tyszka i Wielochowski (1991) przeprowadzili analizę statystyczną ocen 126 walk bokserskich z Mistrzostw Polski 1986. W wyniku tej analizy dało się ustalić następujące prawidłowości:
Po pierwsze, w prawie połowie przypadków wygrywający zawodnik miał przewagę we wszystkich trzech rundach, a prawie wszystkie zwycięstwa miały postać "przynajmniej dwie rundy wygrane". Warto także dodać, że nawet w walkach wygranych niejednogłośnie, gdy różni sędziowie przyznawali wygraną różnym zawodnikom, aż 15,5% zwycięstw miało postać "wszystkie trzy rundy wygrane", a 34,3% - "wygrana bez żadnej przegranej rundy".
Po drugie, stwierdziliśmy, że oceny kolejnych rund nie były od siebie niezależne: oceny rund wcześniejszych wpływały na oceny rund następujących po nich.
Po trzecie, okazało się, że typową przewagą stwierdzaną przez sędziego w rundzie pierwszej był jeden punkt. W rundzie tej niezwykle rzadko odstępowano od przewagi wyrażonej jednym punktem. W drugiej rundzie częściej pojawiały się oceny zarówno remisowe, jak i oceny przewagi większej od jednego punktu. Obie te tendencje wyraźnie nasiliły się w rundzie trzeciej. Generalnie średnia przewaga zwycięzcy wzrasta w kolejnych rundach. Interesujących danych dostarcza również analiza przewag punktowych zarówno zwycięzcy, jak i pokonanego w poszczególnych rundach. Okazało się, że kiedy zwycięzca wygrywał pierwszą rundę, jego przewaga wynosiła jeden punkt. Taki sam jeden punkt przewagi zyskiwał późniejszy pokonany, jeżeli wygra] pierwszą rundę. W dalszych jednak rundach średnie wygrane zwycięzcy pojedynku stawały się coraz wyższe, podczas gdy przegrywający ciągle zyskiwał przewagę tylko jednopunktową, niezależnie od tego, która runda została przez niego wygrana.
Wreszcie różnice między sędziami okazały się najmniejsze w rundzie pierwszej, a największe w rundzie trzeciej.
W jakim stopniu zaobserwowane regularności należy przypisać zachowaniom zawodników, a w jakim zachowaniom sędziów? Zęby rozstrzygnąć wątpliwości w tej sprawie, przygotowano i przeprowadzono badanie eksperymentalne.
10 PSYCHOLOGICZNE PUŁAPKI OCENIANIA! PODEJMOWANIA DECYZJI
Wykorzystano do tego celu zapis wideo z pojedynku sędziowanego przez pięciu profesjonalnych arbitrów, którzy wytypowali zwycięstwo jednego z zawodników stosunkiem głosów 3:2. Pojedynek ten został dokładnie przeanalizowany przez naszego eksperta, który zbadał wszystkie akcje zawodników i stwierdził, że ogłoszony werdykt był słuszny. Z jego oceny wynikało ponadto, że zawodnik wygrywający - zawodnik N - wygrał nieznacznie pierwszą i drugą rundę oraz wyraźnie przegrał trzecią rundę. W eksperymencie zmieniano kolejność prezentowania rund różnym grupom sędziów. Skoncentrowano się głównie na zmianie momentu prezentacji rundy trzeciej, jako przegranej przez zwycięzcę dwóch wcześniejszych rund. Tak więc różne grupy oceniały tę samą walkę w trzech różnych ustawieniach rund:
ustawienie l: (l, 2, 3) - pierwszy wariant (oryginalny), ustawienie 2: (2, 3, l) - drugi wariant eksperymentalny, ustawienie 3: (3, 2, l) - trzeci wariant eksperymentalny. Eksperyment dowiódł, że tendencja do przyznania jednemu z zawodników przygniatającego zwycięstwa, tj. zwycięstwa przy wszystkich rundach wygranych lub przynajmniej przy żadnej nieprzegranej, jest w rzeczywistości wywołana zachowaniem sędziego i stosunkowo niezależna od samego przebiegu walki. Około 1/3 profesjonalnych sędziów i połowa badanych studentów oceniła walkę jako "nieprzegraną" w żadnej rundzie przez zwycięskiego zawodnika.
(3,2,1)
2,5-r-
2--
^
k
1,5-1-0,5-0--0,5-
} /
. ^s;.. i;^^ ;\ l;-;;;
^' gg
(1,2,3) (2,3,1)
Rys. 1.2.
Średnia przewaga punktowa zawodnika N przy trzech wariantach prezentacji rund.
ROZBIEŻNOŚCI W OCENIANIU
Jak to pokazuje rys. 1.2., im wcześniej runda przegrana przez zawodnik;
N została przedstawiona sędziemu, tym (przeciętnie) niższa była ocena teg( zawodnika. Obserwowano wyraźny efekt pierwszeństwa: zawodnik, któr;
dobrze się zaprezentował w rundzie pierwszej, miał większe szansę na wy granie całej walki.
Ów wpływ oceny rundy poprzedzającej na ocenę rundy następnej stwier dzono zresztą w ocenianiu wszystkich rund: ocena tej samej rundy zależał;
od tego, czy poprzednia runda (lub rundy) została wygrana lub przegrani przez danego zawodnika. Sędziowie skłaniali się ku temu, by w kolejnycł rundach zawodnika wygrywającego poprzednie rundy oceniać pozytywniej a w wypadku zawodnika przegrywającego poprzednie rundy oceniać bardzie negatywnie.
Wreszcie eksperyment pokazał, że takie "ustawienie" rund, w których oce na z pierwszej rundy zostaje podana w wątpliwość w drugiej rundzie (ustawie nią 2 i 3 w porównaniu do ustawienia l), prowadzi do znacznego zwiększeni;
zróżnicowania ocen. Niektórzy z sędziów trzymali się swych poprzednich de cyzji, podczas gdy inni zmieniali potencjalnego zwycięzcę. Prowadziło to d< znacznego zróżnicowania ocen między sędziami, co pokazuje rys. 1.3.
Uzyskane wyniki nadzwyczaj mocno sugerują następującą strategię po stepowania sędziów w procesie oceniania walki bokserskiej:
4,5-, 4-3,5-3-2,5-
-
• sędziowie B studenci
| ;<
;; ^ ••'' ;
'• ••-ww•'° "
2--
1,5-
1-0,5-n-
,,
-:-
\l
(1,2,3)
(3,2,1)
(2,3,1) USTAWIENIE RUND
Rys. 1.3.
Zróżnicowanie (wariancja) ocen przy trzech wariantach prezentacji rund.
-w ro T ^nuLU^IOZ-INt I^UHAI^IM UUtNIANIA l I^UUbJMUWANIA DECYZJI
-aSffesiSiSKsiift^^s^piifti^ ' .' ' ' " ^ ^ ^ ' " .
(1) Sędzia próbuje od samego początku podjąć wstępną decyzję o tym, który z zawodników zostanie zwycięzcą walki.
(2) Na podstawie kolejnych obserwacji sędzia oszacowuje aktualne przewagi obu walczących i modyfikuje je - zwiększa lub zmniejsza - w zależności od oceny kolejnych akcji.
(3) Powiększenie lub zmniejszenie szacowanej przewagi boksera po kolejnej akcji nie jest bezstronne. Wręcz przeciwnie, sędzia faworyzuje zawodnika, który aktualnie ma przewagę, czyli jest przewidywany na zwycięzcę walki.
Nic dziwnego, że w ostatnich latach działacze związku bokserskiego zdecydowali się zmienić regulamin oceniania walk bokserskich. Wprowadzona zmiana wydaje się bardzo korzystna - wrócimy do tej sprawy w rozdziale 8.
1.5. Nietrafne oceny kliniczne
W pewnym badaniu sprawdzano trafność prognoz psychiatrów, dotyczących ponownych przyjęć pacjentów do szpitala. Prognozy psychiatrów "wystawiono jednak na próbę". Porównano trafność owych prognoz z trafnością prognoz opartych na wadze (!) teczek zawierających dokumentację pacjentów (Lasky, Hover, Smith, Bostian, Duffendack, Nord, 1959). Dlaczego? Waga teczki była po prostu pewnym "grubym" wskaźnikiem tego, jak często pacjent poprzednio był już hospitalizowany (im częściej, tym jego teczka stawała się grubsza i cięższa). Okazało się, że psychiatrzy nie przewidywali lepiej od wagi teczek pacjentów (współczynnik korelacji ponownych przyjęć z wagą teczek wynosił 0,62, a z predykcją psychiatrów 0,61).
Jednak nie tylko trafność prognoz psychiatrycznych dotyczących ponownych przyjęć pacjentów do szpitala okazała się mało imponująca. W innym badaniu (Goldberg, 1959) sprawdzano trafność diagnoz dotyczących zaburzeń neurotycznych i psychotycznych na podstawie znanego testu psychologicznego MMPI. Kiedy porównano trafność diagnoz doświadczonych psychologów klinicznych oraz ich sekretarek, okazało się, że diagnozy ekspertów nie były wcale lepsze od diagnoz stawianych przez ich sekretarki!
Nie należy przytoczonych wyników traktować jako dowodu szczególnej słabości diagnoz psychiatrycznych. Równie łatwo można by dostarczyć dowody na słabość innych diagnoz medycznych - i nie tylko medycznych zresztą. Wszyscy doświadczamy zawodności prognoz meteorologicznych, ekonomicznych, nie mówiąc już o społecznych. (Jaki przedstawiciel nauk społecznych przewidział upadek systemu komunistycznego w końcu lat osiemdziesiątych?!) Psychiatrzy byli po prostu wystarczająco otwarci, by poddać się tego rodzaju badaniom.
ROZBIEŻNOŚCI W OCENIANIU
1.6. Rozbieżne werdykty sądowe
Partridge i Eidridge (za: Saks i Hestie, 1986) prosili pięćdziesięciu amery kańskich sędziów federalnych o orzeczenie kary w dwudziestu różnych spra wach sądowych, dotyczących przestępstw rozmaitego kalibru. Poniższa ta bela pokazuje rozpiętość orzekanych kar w siedmiu z tych spraw.
Tabela 1.1.
Rozpiętość kar orzekanych w siedmiu sprawach sądowych.
Rodzaj sprawy
Wyroki
najsurowszy
średni
najłagodniejszy
oszukańcza transakcja kredytowa; oszustwo podatkowe
20 l. więzienia 65 000 dół.
101. więzienia '> 50 000 dół.
3 l. więzienia
napad na bank
18 [.więzienia 5 000 dół.
101. więzienia
51. więzienia
sprzedaż heroiny
101. więzienia 51. zawiesz.
51. więzienia 3 l. zawiesz.
1 r. więzienia 1 r. zawiesz.
kradzież i posiadanie rzeczy skradzionych
7,5 r. więzienia
31. więzienia
4 l. zawiesz.
prowadzenie nielegalnego domu gry
1 r. więzienia 3000 dół.
31. zawiesz. 10 000 dół.
1 r. zawiesz. 1000 dół.
kradzież przesyłki pocztowej
6 m. więzienia 18 m. zawiesz.
3 l. zawiesz.
1 r. zawiesz.
krzywoprzysięstwo
1 r. więzienia 1000 dół.
21. zawiesz. 500 dół.
1000 dół.
Jak podkreślają autorzy, brak zgody między sędziami był raczej regułą niż wyjątkiem. Szczególnie w wypadku najbardziej dotkliwej kary - pozbawienia wolności - w szesnastu spośród dwudziestu spraw zdania sędziów były podzielone. Tam gdzie jedni orzekali taką karę, inni zadowalali się mniej dotkliwą.
1.7. Zawodne oceny inżynierskie
Subiektywne oceny i towarzyszące im błędy nie są bynajmniej zastrzeżone dla dziedzin społecznych. Równie często występują w dziedzinie technicznej i w działaniach inżynierskich. Ich skutki przejawiają się w awariach różnych urządzeń technicznych: mostów, samolotów, statków kosmicznych czy (dawniej) kotłów parowych.
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Pouczająca jest tu historia zapobiegania pladze wybuchania kotłów parowych, z którą zmagano się przez cały wiek XIX. Jak pokazał to Ferguson (1987), problem ten miał zarówno aspekt techniczny, z którym zmagali się inżynierowie, jak i aspekt społeczny, z którym na przykład w Stanach Zjednoczonych borykali się kongresmeni. Problem inżynierski polegał na tym, że dopiero z perspektywy czasu widać jasno, jakie były przyczyny wybuchania kotłów parowych. Należały do nich: nieodpowiednie projektowanie - nieprzystosowane do ciśnień, jakie panowały w kotłach, nieodpowiednie wykonanie, niewystarczająco jednorodna struktura używanej stali i nieodpowiednia obsługa kotłów. Jednak w początkach XIX wieku żadna z tych przyczyn nie wydawała się oczywista. Na temat przyczyn wybuchania kotłów formułowano rozmaite teorie inżynierskie - niektóre całkiem fantastyczne. Na przykład, ponieważ wybuchy czasami następowały wtedy, gdy do gorącego kotła wpompowywano zimną wodę, powstała teoria, że wybuchy są wynikiem następującego procesu:
gdy zimna woda wchodzi w kontakt z przegrzaną stalową ścianą kotła, następuje wydzielanie wodoru, który potem eksploduje.
Ferguson pokazuje także, że nawet wtedy, gdy już udało się odkryć właściwą teorię dotyczącą wybuchania kotłów i gdy w konsekwencji można było określić zasady na temat materiału, projektowania, konstrukcji i obsługi kotłów (wszystkie te ustalenia zawierał raport wydany w 1836 roku), to kotły ciągle wybuchały. Wybuchały tak często, że w dziesięcioleciu od 1841 do 1851 ponad tysiąc osób straciło życie w wyniku eksplozji. Dlaczego? W tym okresie już nie z powodu słabości technicznych ocen inżynierskich, a z powodu słabości społecznych ocen kongresmenów amerykańskich, którzy przez wiele lat wahali się wydać ustawę o kontroli budowy i obsługi kotłów na statkach parowych. (Wahali się w imię respektowania świętego prawa własności!) Kiedy już wreszcie po wielu latach wydano taką ustawę dotyczącą kotłów instalowanych na parowcach, trzeba było czekać wiele dalszych lat na takie samo uregulowanie dla kotłów instalowanych stacjonarnie.
1.8. Zwodnicze zalecenia dietetyków
Kilkanaście lat temu w społeczeństwach bardzo wrażliwych na profilaktykę zdrowotną (przede wszystkim w Stanach Zjednoczonych) zapanowała moda żywieniowa polegająca na maksymalnym ograniczaniu spożywania tłuszczów zwierzęcych (kotletów schabowych) oraz produktów mlecznych (mleka i masła). Chodziło w niej o zmniejszone dostarczanie organizmowi cholesterolu, którego obfitość zawierają wymienione produkty.
Cały ten ruch pojawił się na skutek badań medycznych, w których ustalono, że osoby o wysokim poziomie cholesterolu we krwi w większym stopniu
ROZBIEŻNOŚCI W OCENIANIU
niż inne są podatne na choroby krążenia (miażdżyca tętnic), w tym groźne zawały. Zauważmy, że samo stwierdzenie tej prawidłowości "nie zabrania" jeszcze zjadania (smacznych) produktów zawierających cholesterol. Nie jest bowiem oczywiste, że poziom cholesterolu we krwi musi zależeć od tego;
czy zjadamy go więcej, czy mniej w pokarmach. Zależność taka musiałaby zostać niezależnie udowodniona. (Ostatecznie, zjadając dużo wątroby zwierzęcej, nie powiększamy tym samym naszej wątroby). Znacznie więcej cholesterolu od tego zjadanego wytwarza nasza wątroba. Lekarze wysunęli jednak hipotezę, że im więcej cholesterolu spożywamy, tym wyższy jegc poziom we krwi i w efekcie tym większe prawdopodobieństwo, że ulegniemy zawałowi.
Dopiero potwierdzenie takiej hipotezy nadawałoby sens uciążliwej praktyce ograniczania spożywania kotletów schabowych i masła (a także picia mleka). Ale idzie o to, że hipoteza ta nie była nigdy przekonująco potwierdzona. Korelacje stwierdzane między spożywaniem owych "groźnych" produktów i uleganiu zawałom nie wykluczały udziału innych czynników ("zdrowego" bądź "niezdrowego" trybu życia).
1.9. Zróżnicowane oceny ryzyka
Slovic wraz ze współpracownikami (Fischhoff, Slovic, Lichtenstein, 1980) przeprowadził badanie nad tym, jak ludzie oceniają ryzykowność rozmaitych zdarzeń i działań. Prosił mianowicie różne grupy osób o ocenę ryzykowności 30 rozmaitych działań i technologii. Wśród badanych znalazły się różne grupy niespecjalistów oraz jedna grupa ekspertów - osób zajmujących się profesjonalnie ryzykiem związanym z owymi działaniami. Tabela 1.2. pokazuje, jak w tych różnych grupach oceniano poszczególne zagrożenia.
Jak widać, niektóre oceny różniły się raczej drastycznie. Eksperci wyraźnie niżej niż laicy oceniali ryzyko związane z'energią jądrową, z pracą w policji, z pracą strażaka, z polowaniem czy ze wspinaczką górską, a zarazem wyżej niż laicy oceniali ryzyko związane z operacją chirurgiczną, energią elektryczną czy z promieniami Roentgena. Z tych wszystkich najbardziej różniły się oceny ryzykowności energii jądrowej.
Skąd pochodziło to zróżnicowanie? Ustalono, że oceny ryzykowności dokonywane przez ekspertów były na ogół zgodne ze statystyką śmiertelnych wypadków związanych z tymi różnymi działaniami. Eksperci mieli zatem skłonność do oceniania ryzykowności różnych działań i technologii według częstości śmiertelnych wypadków powodowanych przez owe działania i technologie. Jednocześnie okazało się, że nieeksperci, nawet kiedy są dobrze poinformowani o statystyce wypadków, nie są skłonni sprowadzać swojej oce-
h-SYCMOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Tabela 1.2.
Oceny ryzyka różnych działań i technologii w trzech grupach badanych. (Oceny stanowią średnie geometryczne w poszczególnych grupach; niższa wartość rangi oznacza ocenę, że ryzyko jest wyższe.)
Działanie
Nieeksperci
Eksperci
Energia atomowa
1 1
20
Pojazdy motorowe
2 5
1
Broń palna
3 2
4
Palenie papierosów
4 3
2
Motocykle
5 6
6
Napoje alkoholowe
6 7
3
Lotnictwo pasażerskie
7 15
12
Praca policji
8 8
17
Pestycydy
9 4
8
Chirurgia
10 11
5
Gaszenie pożarów
11 10
18
Wielkie budowy
12 14
13
Polowanie
13 18
23
Aerozole
14 13
26
Wspinaczka górska
15 22
29
Rowery
16 24
15
Lotnictwo towarowe
17 16
16
Energia elektryczna (nie atomowa)
18 19
9
Pływanie
19 30
10
Środki antykoncepcyjne
20 9
11
Narciarstwo
21 25-
30
Promieniowanie rentgenowskie
22 17
7
Pitka nożna w szkołach średnich i wyższych
23 26
27
Koleje
24 23
19
Konserwanty żywności
25 12
14
Barwniki do żywności
26 20
21
Elektryczne kosiarki do trawy
27 28
28
Przepisywane antybiotyki
28 21
24
Urządzenia gospodarstwa domwego
29 27
22
Szczepionki
30 29
25
ROZBIEŻNOŚCI W OCENIANIU
ny ryzykowności do tego jednego czynnika. Ich ocena ryzykowności zależah od całego szeregu innych czynników. Oto niektóre z nich:
Natychmiastowość - odroczenie negatywnych skutków działania: kied^ negatywne skutki działania (dla życia, dla zdrowia) pojawiają się dopiero p( dłuższym czasie (na przykład po wielu latach), to działanie takie wydaje si( ludziom mniej ryzykowne niż działanie, którego negatywne skutki są na tychmiastowe.
Czasowa komasacja negatywnych konsekwencji - chociaż codzienne wy padki pochłaniają ogółem zdecydowanie więcej ofiar niż katastrofy, to dzia łania związane z tymi pierwszymi wydają nam się mniej ryzykowne ni;
działania związane z wypadkami katastroficznymi (z polskich danych sta tystycznych wynika, że w wypadkach samochodowych ginie w ciągu roki znacznie więcej ludzi niż na przykład w katastrofach lotniczych).
Dobrowolność - przymus narażania się na ryzyko: ludzie przeceniaj;
ryzyko działań przymusowych, a nie doceniają ryzyka działań dobrowolnych
Łatwość wyobrażenia sobie przyczyn i negatywnych skutków zdarzeń - działania, których scenariusze są łatwe do wyobrażenia, wydają nam się bar dziej ryzykowne.
Stopień nowości - obycie z zagrożeniem: boimy się niebezpieczeństw no wych, podczas gdy stare uważamy za mało groźne.
Możliwość kontrolowania negatywnych następstw zdarzeń - to, co pozo staje (albo wydaje się, że pozostaje) pod naszą kontrolą, wydaje nam się za razem mniej ryzykowne.
To tego rodzaju czynniki sprawiają, że wielu członków społeczeństw;
uważa energię jądrową za zbyt ryzykowną i sprzeciwia się jej wprowadza niu. Postawy takie doprowadziły w wielu krajach, w tym także i w Polsce, d< zaniechania budowy elektrowni atomowych.
Można się zastanawiać, czy oceny i postawy nieekspertów w tej sprawił powinny być uznane za bezwartościowe i decydujące powinny być tu opinii ekspertów. Slovic (1987), który badaniom nad ocenianiem ryzyka poświęci wiele uwagi, zauważa, że zarówno oceny i postawy nieekspertów, jak i ocen;
i postawy ekspertów są w tej sferze niewystarczające - choć z różnych po wodów. Oceny nieekspertów są w znacznej mierze oparte na bezpodstaw nych uprzedzeniach - pochodzących na przykład z opisów i obrazów "nie wyobrażalnych katastrof nuklearnych", przekazywanych przez różnego ro dzaju media: prasę, telewizję, filmy itp. Ale także opinie ekspertów nie maji dobrych podstaw. Nie ma przecież żadnego uzasadnienia dla twierdzenia które bywa w tej grupie bezkrytycznie powtarzane, że to właśnie statystyki śmiertelnych wypadków związanych z różnymi działaniami powinna być je dynym czynnikiem decydującym o ich akceptacji bądź odrzuceniu. W grupii tej wygłasza się na przykład absurdalne twierdzenia, że ktoś, kto pali papie
-u
KHYCHOLOGICZNE PUŁAPKI UUbNIAlMIA l PUUfcJMOWANIA DECYZJI
rosy i wystawia się w ten sposób na określone ryzyko, powinien akceptować dowolne inne zagrożenia, które nie przekraczają ryzyka związanego z paleniem papierosów. Jednostki, a także społeczeństwa mają pełne prawo zaakceptować jedne i odrzucić inne działania im zagrażające.
1.10. Konkluzje
Jak widać, błędy nie omijają żadnej dziedziny, w której mamy do czynienia z formułowaniem sądów i ocen. Popełniają je zwykli ludzie, kiedy ulegają manipulacji i niekonsekwentnie głosują za różnymi programami ekonomicznymi, społecznymi czy politycznymi. Podlegają im nauczyciele i sędziowie sportowi, kiedy ulegają wcześniejszym opiniom przy wystawianiu ocen szkolnych czy sportowych. Podlegają im sędziowie wydający wyroki, lekarze stawiający diagnozy, inżynierowie tworzący "bezpieczne" budowle i naturalnie klimatolodzy oraz meteorolodzy, których prognozy wszyscy mamy okazję testować.
Błędy te są bardzo różnorodne. Pojawiają się niezgodności w ocenach tego samego zjawiska czy wyniku przez różnych oceniających - i to również wtedy, gdy oceniającymi są eksperci (nauczyciele, sędziowie itp.). Nawet ten sam oceniający zmienia swoje oceny, kiedy powtórnie dokonuje oceny tego samego zjawiska czy wytworu. Jak zobaczymy to w dalszych rozdziałach, zestaw błędów popełnianych zarówno przez laików, jak i specjalistów jest doprawdy imponujący. Oceny bywają zależne od stanu emocjonalnego oceniającego, od otoczenia społecznego, w jakim dokonuje się ocenianie, od sposobu nazwania zjawiska, od kontekstu itp. Na domiar złego - jak będzie to pokazane później - przypominając sobie dawne błędne oceny, zachowujemy dobre samopoczucie, sądząc, że były one bardziej trafne, niż rzeczywiście były.
Wszystko to czyni ostrzeżenie Biblii Nie sądźcie, a nie będziecie sądzeni więcej niż uzasadnionym. Nie ma powodów, by mieć zbyt duże zaufanie czy to do własnych ocen, czy też do ocen naszych bliźnich. Paradoksalnie, jak się przekonamy później, nawet w owej kwestii zaufania do własnych ocen popełniamy poważne błędy (patrz rozdział 11.).
W wypadku ocen wydawanych przez inne osoby umiar i sceptycyzm jest wskazany nawet bardziej niż w wypadku ocen własnych. Niektóre praktyki społeczne są pod tym względem wręcz absurdalne. Oto atrakcyjna i utalentowana aktorka wyraża opinię w sprawie polityki gospodarczej państwa i spora część społeczeństwa bierze to poważnie, jakby kompetencje aktorskie przenosiły się jakoś na kompetencje w polityce gospodarczej. Równie absurdalne -jak zauważa to Ojciec Józef Bocheński (1992) - są pretensje dziennikarzy, artystów czy innych osób mieniących się intelektualista-
ROZBIEZNOSCI W OCENIANIU
H^-S ' - ^
mi do ferowania obowiązujących ocen etycznych, światopoglądowych czy politycznych.
Poważniejszy problem dotyczy ocen wydawanych w obrębie własnej profesji eksperta: kiedy artysta wyraża opinię w sprawie sztuki, lekarz - w sprawie leczenia choroby itp. Okazuje się, że nawet wtedy nie ma żadnej gwarancji, czy wydawane oceny będą wartościowe. Bycie ekspertem w określonej dziedzinie wcale nie gwarantuje wydawania w niej trafnych ocen, Powodów jest wiele. Będą one prezentowane w kolejnych rozdziałach tej książki.
2. ,
Podstawowe zniekształcenia w ocenianiu
2.1. Trzymanie się środka skali (tendencja centralna)
Jednym z najbardziej popularnych błędów związanych ze stosowaniem skali ocen (takich na przykład, jak skale szkolne) jest niewykorzystywanie krańcowych ocen na skali, a tym samym przesuwanie się wszystkich ocen w kierunku jej środka. Jeśli na przykład nauczyciel dysponuje skalą ocen od l do 6, to unika wystawiania jedynki i szóstki, a najczęściej wykorzystuje trójkę i czwórkę. Błąd ten nazywany jest błędem tendencji centralnej. Wydaje się, że tendencja ta bierze się z pewnej ostrożności oceniającego. Rezygnując z ocen skrajnych, -zabezpiecza się on niejako przed popełnieniem zbyt dużego błędu.
Nie zawsze da się tu rozstrzygnąć, czy nadmiar ocen środkowych jest skutkiem owej tendencji centralnej, czy też przejawem rzeczywistego rozkładu cechy w populacji. Wiadomo, że wiele zjawisk i cech fizycznych - na przykład wzrost czy waga, ale także inteligencja i inne cechy psychiczne - ma w rzeczywistości rozkład normalny (por. rys. 2.1.). Nic przeto dziwnego, że znajduje to swoje odbicie w ocenach. Jednak niezależnie od tego oceniający wydają się również mieć swój wkład w owo "centralizowanie" ocen.
W celu wyeliminowania tendencji centralnej próbowano poszerzać skale. Niewiele to jednak dawało. Materska i Caverni (za Materską, 1992) badali zakresy wykorzystywanych skal oraz trafność oceniania szkolnego na węższych i szerszych skalach wśród nauczycieli francuskich i polskich. Okazało się, że jest to przede wszystkim kwestia nawyku: polscy nauczyciele lepiej radzili sobie ze skalą czterostopniową (2-5), a francuscy - ze skalą dziesię-ciostopniową, czyli z takimi, do jakich byli akurat przyzwyczajeni. Zmiana skali nie eliminowała jednak tendencji centralnej.
Nie zawsze w ocenianiu ujawnia się tendencja centralna. Peterson i Wil-^n (1992) "przebadali" oceny konsumentów dotyczące ich satysfakcji z róż-
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU
^.y
^ww^^tiK^m^fwy^KSfSSKssiimKswwss^^^t^s^^f. ' '
nego rodzaju produktów i usług. Okazało się, że zadziwiająco wielu konsumentów wyrażało stan wysokiego usatysfakcjonowania, a tylko bardzo niewielu - stan braku usatysfakcjonowania. Typowym oszacowaniem była ocena: "bardzo usatysfakcjonowany", a rozkłady satysfakcji były "anormalnie" skośne w kierunku wysokiej satysfakcji - pokazuje to rys. 2.2.
Można by się zastanawiać, czy wolnorynkowa gospodarka rzeczywiście dostarcza konsumentom tak wysoce satysfakcjonujących produktów, czy raczej jest to wynik słabości metody badania usatysfakcjonowania konsumentów. Jak pokazują badania, w odpowiedziach na pytania kwestionariuszowe ludzie przejawiają skłonność do udzielania odpowiedzi pozytywnych. Okazuje się, że wystarczy przekształcić pytanie: "Jak bardzo jesteś usatysfakcjonowany (czymś)", na pytanie: "Jak bardzo jesteś nieusatysfakcjonowany
wysokie nasilenie cechy
niskie nasilenie cechy
Rys. 2.1.
Rozkład normalny.
wysoki poziom zadowolenia
niski poziom zadowolenia
Rys. 2.2.
Typowy rozkład satysfakcji konsumentów.
PaYUMULUUlL^NE PUŁAPKI UCEIMIANIA l PODEJMOWANIA DECYZJI
«JU
;A - , ^:--^(r)«&i»&-fa
(czymś)", by pokaźnie zmniejszyć "usatysfakcjonowanie" ludzi. Być może także ów "nadmiar usatysfakcjonowania" wiąże się ze zbytnią ogólnością pytania o usatysfakcjonowanie - ogólność ta może sprawiać, że wypowiadane oceny nie są zbyt rzetelne.
2.2. Efekt kontrastu
Każdy zapewne miał okazję zauważyć, że kiedy dziennikarz sportowy prowadzi wywiad z koszykarzami, to wydaje się bardzo niski. Ten sam dziennikarz, kiedy rozmawia z dżokejami na wyścigach konnych, wydaje się bardzo wysoki. Ocena wzrostu dziennikarza jest kształtowana przez kontrast z osobą, na której tle ów dziennikarz występuje. Coren i Miller (1974) zauważyli przy tym interesującą rzecz, że dziennikarz wcale nie wydaje się niski, jeżeli znajduje się na tle wysokiego konia wyścigowego. A więc kontrast działa tylko wtedy, gdy kontrastowe obiekty są podobne. Coren i Miller (1974) pokazali tę prawidłowość w eksperymencie, w którym wykorzystali znane złudzenie wzrokowe opisane przez Ebbinghausa. Złudzenie Ebbinghausa, jak to ilustruje lewa górna część rysunku 2.3., polega na tym, że jeżeli figurę (na rysunku kółko) o danej wielkości otoczyć takimi samymi figurami, raz większymi, a raz mniejszymi, to w pierwszym wypadku wydaje się ona mniejsza, a w drugim większa. Jak można się jednak przekonać na podstawie dolnej części rysunku 2.3., złudzenie Ebbinghausa zachodzi tylko wtedy, gdy figura jest otoczona takimi samymi, a nie innymi od niej figurami (tak samo jak dziennikarz na tle sportowców, ale nie na tle konia!).
Efekt kontrastu pokazał także Feldman (1992), kiedy badał szacunkowe ceny przypisywane przez konsumentów różnym samochodom. Jeżeli samochód występował w towarzystwie samochodów droższych, to otrzymywał cenę niższą niż wtedy, kiedy występował w towarzystwie samochodów skromniejszych. Tak więc samochody wypadają "lepiej", kiedy są oceniane na tle "gorszych" od siebie. Zupełnie tak samo dzieje się z ocenami ludzi. Mężczyźni, którym najpierw pokazywano w ilustrowanym magazynie piękne modelki, poproszeni o ocenę urody swoich żon (partnerek) formułowali niższe oceny niż mężczyźni, którzy wcześniej nie oglądali modelek. (Morał dla marketingu samochodów: pokazywać swoje produkty w otoczeniu mniej atrakcyjnych produktów. Morał dla żon: lepiej nie przechowywać w mieszkaniu magazynów z pięknymi modelkami, a byłoby jeszcze lepiej, gdyby udało się zdobyć jakieś ilustracje mało urodziwych kobiet).
Efekt kontrastu działa nie tylko przy ocenianiu fizycznych cech osób czy przedmiotów. Efekt taki przy wystawianiu ocen szkolnych pokazał w specjalnym badaniu eksperymentalnym Noizet (za Materską, 1992, oraz za No-
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU
izetem i Cavernim, 1975). Przygotował on specjalne serie wypracowań szkol nych, które dawał nauczycielom do oceny w określonym porządku. Raz p( serii bardzo dobrych wypracowań dawał wypracowanie przeciętne, innyn razem wypracowanie to dawał po serii słabych wypracowań. Jak przewidy wał, oceny pracy przeciętnej były wyższe, gdy następowała ona po serii pra» słabych, a niższe, gdy następowała ona po serii prac dobrych. Ogólnie: wy twory (wypowiedzi, prace, wyniki) otrzymują noty zawyżone, jeśli występu ją po wytworach bardzo słabych, a zaniżone, jeśli poprzedzały je wytwór bardzo dobre.
Rys. 2.3.
Efekt kontrastu.
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Po kim zabierać głos? Przeczytajmy kilka wypowiedzi na temat skutków wprowadzenia przez Sejm wysokich podatków i oceńmy na skali, w jakim stopniu każda z tych wypowiedzi zawiera ciekawe (interesujące) spostrzeżenie.
Poniższa wypowiedź zawiera spostrzeżenie:
l-----2-----3-----4-----5-----6-----7
całkowicie nieinteresujące
bardzo interesujące
Wysokie podatki od dochodów uwzględniają interesy grup społecznych o różnych dochodach 1-2-3-4-5-6-7;
Wysokie podatki od dochodów przyczyniają się
do rozłożenia ciężarów społecznych w pewien sposób 1-2-3-4-5-6-7;
Wysokie podatki od dochodów dotykają
różne grupy ludności i rodziny o różnych dochodach 1-2-3-4-5-6-7;
Wysokie podatki od dochodów
odbijają się na różnych dziedzinach 1-2-3-4-5-6-7;
Wysokie podatki od dochodów uderzają zarówno w podatników
mniej zarabiających, jak i więcej zarabiających 1-2-3-4-5-6-7;
Wysokie podatki od dochodów uderzają w pracujących
w trudnych i niebezpiecznych warunkach 1-2-3-4-5-6-7;
Wysokie podatki od dochodów przyczyniają się do zmniejszenia tempa wzrostu realnych dochodów obywateli 1-2-3-4-5-6-7;
A teraz przeczytajmy kilka wypowiedzi na temat skutków wprowadzenia przez Sejm kilku nowych ustaw i oceńmy na skali, w jakim stopniu każda z tych wypowiedzi zawiera ciekawe (interesujące) spostrzeżenie.
Poniższa wypowiedź zawiera spostrzeżenie:
l ----- 2-----3-----4-----5
6-----7 bardzo interesujące
całkowicie nieinteresuj ące
Wysokie zasiłki dla bezrobotnych prowadzą nieuchronnie do nakładania wyższych podatków na obywateli Wysokie podatki od dochodów zachęcają ludzi do podejmowania pracy "na czarno" Wysoka inflacja zniechęca ludzi do oszczędzania Wysokie zasiłki dla bezrobotnych zniechęcają ludzi • do poszukiwania pracy Wysoka progresja podatkowa prowadzi do spadku produkcji
1-2-3-4-5-6-7;
1-2-3-4-5-6-7;
1-2-3-4-5-6-7;
1-2-3-4-5-6-7;
1-2-3-4-5-6-7:
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU OJ
Odpłatność za nauczanie sprawia,
że studenci pilniej się uczą
1-2-3-4-5-6-7,
Wysokie podatki od dochodów przyczyniają się do
zmniejszenia tempa wzrostu realnych dochodów obywateli 1-2-3-4-5-6-7,
Wypowiedź Wysokie podatki od dochodów przyczyniają się do zmniejszenie tempa wzrostu realnych dochodów obywateli pojawiła się w obu zestawach Czytelnik, który przypadkiem tego nie zauważył, mógł jednak ocenić ją pozytywniej w zestawie pierwszym niż w zestawie drugim. Dlaczego? Dlatego, ż( zestaw pierwszy zawiera bądź to stwierdzenia wysoce niejasne, bądź też stwierdzenia banalne. (Są to nieznaczne zniekształcenia wypowiedzi sejmowych) Pojawiająca się po nich wypowiedź Wysokie podatki od dochodów przyczyniają się do zmniejszenia tempa wzrostu realnych dochodów obywateli może sic, wydawać raczej interesująca. Z kolei zestaw drugi zawiera wypowiedzi raczę dobrze określone i w jakimś stopniu interesujące. (Są to nieznacznie zmienione twierdzenia podręcznikowe). Pojawiająca się po nich wypowiedź Wysokie podatki od dochodów przyczyniają się do zmniejszenia tempa wzrostu realnych dochodów obywateli może się wydawać raczej banalna.
Uzyskujemy tu efekt podobny do następującego wrażenia: przysłuchujemy się debacie sejmowej na interesujący nas temat i słyszymy, jak kilku mówców z rzędu "giędzi" długo i bez sensu. Nagle pojawia się mówca, który wygłasza kilka "dorzecznych", acz wcale "nieodkrywczych" zdań w danej kwestii. Jesteśmy skłonni uznać jego wypowiedź za bardzo znaczącą a samego autora za bystrego i znającego się na rzeczy. Gdyby się jednak zdarzyło, że ta sama wypowiedź nastąpiła po serii bardzo rzeczowych i "wnikliwych" wypowiedzi innych mówców, to moglibyśmy ją uznać za nieznaczącą a samego autora za niezbyt bystrego i mało znającego się na rzeczy. Morai dla mówców (na przykład sejmowych) jest jasny: dobrze jest, w miarę możliwości, zająć kolejkę po mówcach kiepskich, a unikać jak ognia występowanie po mówcach znakomitych!
2.3. Efekty pierwszeństwa i świeżości
Jeszcze w roku 1946 Asch zaprezentował serię eksperymentów nad tzw. tworzeniem się wrażenia (impression formation). Typowe badanie polegało ns podaniu osobie listy przymiotników opisujących jakąś jednostkę i na żądaniu, by badany podał wrażenie, jakie wytworzył sobie o tej jednostce. Na przykład podawano badanemu opis: Jan jest zazdrosny, zacięty, krytyczny, impulsywny, pilny i inteligentny, i pytano: Jak myślisz, czy Jan jest, ogólnie rzecz biorąc, emocjonalny? Zakreśl jedną z wartości poniższej skali.
34 PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
m--. i,'^saisiassaasaaasa%f^ - -. -^ - -i-. - •• ••i::-••• •• ""-•• ' ' •• ' - , ->
4
całkowicie nieemocjonalny
krańcowo emocjonalny
Okazywało się, że nie bez znaczenia dla oceny ogólnej emocjonalności hipotetycznej jednostki była kolejność, w jakiej umieszczano opisujące je przymiotniki. Szczególne znaczenie miało, czy emocjonalnie nasycone przymiotniki "zazdrosny" i "zacięty" były umieszczone na początku, czy na końcu listy. Jednostka była oceniana jako bardziej emocjonalna, kiedy owe emocjonalnie nasycone przymiotniki umieszczono zaraz na początku list, niż wtedy, kiedy podawano je dopiero na ich końcu. Zjawisko to nazwano efektem pierwszeństwa - a polega ono, mówiąc ogólnie, na przecenianiu pierwszych informacji (pierwszego wrażenia).
Należy podkreślić ogromną powszechność występowania efektu pierwszeństwa. Oto jeszcze jeden przykład, który ilustruje naturę tego zjawiska.
Peterson i DuCharm (1967) pokazywali badanym osobom urny o różnej proporcji kulek różnych kolorów. Jak pokazuje rys. 2.4., urna I zawierała 3 kule czerwone, 2 niebieskie, 2 żółte, l zieloną i 2 białe. Urna II zawierała 2 kule czerwone, 3 niebieskie, l żółtą, 2 zielone i 2 białe. Losowano kolejno kule z jednej z tych urn, a zadaniem badanego było po obejrzeniu wylosowanej kuli oceniać szansę, że losuje się z urny I bądź z urny II. Badacze zawczasu przygotowali serię wylosowywanych kuł (tak że losowanie było tylko pozorowane). Seria pierwszych 30 losowań dawała przewagę urnie I. Następnie druga trzydziestka losowań dawała przewagę urnie II w tym samym stopniu, co poprzednia - urnie I. Oznacza to, że po obejrzeniu 60 losowań badany miał dokładnie tyle samo argumentów za urną I, co za urną II. Okazało się jednak, że liczyła się kolejność, w jakiej pokazywano dwie trzydziestki. Badani, którym pokazy-
URNAI
URNA II
2.4.
losowania kulek.
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU
wano najpierw serię losowań dającą przewagę urnie I, a później serię losowar dającą przewagę urnie II, byli na końcu bardziej przekonani, że losowano z ur ny I. Natomiast badani, którym pokazywano najpierw serię losowań dająca przewagę urnie II, a później serię losowań dającą przewagę urnie I, byli nE końcu bardziej przekonani, że losowano z urny II.
W kontekście szkolnym oznacza to na przykład, że surowiej oceniane st błędy, kiedy pojawiają się na początku, a nie na końcu wypracowania. Rżę czywiście, w badaniu Caverniego (za: Noizet, Caverni, 1975) rozmieszczane celowo kilka rzucających się w oczy błędów raz w pierwszej, a innym rażeń w drugiej połowie wypracowania. Okazało się, że surowiej oceniane były wy pracowania z błędami na początku niż te, w których błędy pojawiały się m końcu tekstu. W debatach różnego rodzaju (parlamentarnych, sądowych itp. efekt pierwszeństwa przejawia się w tym, że argumenty mówcy przemawia jącego jako pierwszy wywierają większy wpływ na słuchaczy niż argumenty dalszych mówców.
Inną - przeciwną do efektu pierwszeństwa - tendencją jest efekt świe żości, polegający na przecenianiu ostatnich danych i końcowego fragmenti informacji. Efekt ten stwierdza się rzadziej niż efekt pierwszeństwa, ale byws on zauważalny, zwłaszcza tam, gdzie dla oceny ważna jest pamięć, czyli za pamiętanie informacji. (Na przykład w reklamie, gdzie zarówno początko wa, jak i końcowa część przekazu jest łatwiej zapamiętywana i wywiera wiek szy wpływ niż część środkowa.) Wiedzą o tym fachowcy od reklamy, którzy pożądane z punktu widzenia nadawcy części przekazu (atrakcyjne strona oferty) umieszczają na początku i na końcu reklamy. Z kolei cenę i wszelkit aspekty mniej przyjemne umieszczają w środku.
Kiedy wystąpi jeden, a kiedy drugi z tych efektów? Miller i Campbell (1959) wykonali w związku z tym pytaniem interesujące badanie. Posłużył się materiałem z rozprawy sądowej dotyczącej strat poniesionych na skute! wadliwego funkcjonowania odparowywacza. Autorzy jednak specjalnie po segregowali materiał: osobno materiał wnoszony przez powoda, a więc argu mentacjęjego własną, jego świadków itp., a osobno materiał obrony, tj. argu mentację obrony, zeznania jej świadków. Tak przygotowany materiał zosta nagrany na taśmę magnetofonową, gdzie poszczególne role (powoda, obroń cy, świadków) były czytane przez różne osoby. Całość trwała ok. 45 minut.
Materiał ten był prezentowany różnym grupom badanych w inny sposób Stworzono aż osiem różnych prezentacji (p. tabela 2.1.).
Miller i Campbell nie stwierdzili wyraźnego wpływu kolejności na ocen] przy układach (l), (2), (7) i (8), tzn. gdy wszystko było albo skumulowani w czasie, albo oddalone w czasie. Stwierdzili natomiast efekt pierwszeństws
2 W opisie eksperymentu skorzystałem ze zgrabnego przedstawienia go w książce Plousa (1993).
PaYCMULUUICZNE PUŁAPKI UUbNIANIA l PODEJMOWANIA DECYZJI
dla układów (3) i (4), kiedy argumentacja przeciwna występowała natychmiast, a ocena następowała z tygodniowym opóźnieniem. Stwierdzili również efekt świeżości dla układów (5) i (6), kiedy argumentacja przeciwna występowała z tygodniowym opóźnieniem, a ocena następowała zaraz po drugiej argumentacji. Opierając się na tym ustaleniu, Plous (1993) sugeruje, że mając do wyboru przemawianie jako pierwszy lub drugi w debacie nad jakąś kontrowersyjną sprawą, należy ustalić, jak blisko siebie będą przemówienia i kiedy ma się odbyć głosowanie. Gdy argumentacja przeciwna będzie następowała natychmiast, a głosowanie będzie oddalone w czasie, lepiej wystąpić jako pierwszy mówca. Gdy argumentacja przeciwna będzie oddalona w czasie, a głosowanie nastąpi natychmiast po drugim wystąpieniu, lepiej wystąpić jako drugi mówca.
Tabela. 2.1.
Osiem sposobów prezentacji materiału sądowego. UWAGA: rubyka niewypełniona oznacza przerwę.
NUMER
KROK1
KROK 2
KROK 3
KROK 4
KROK 5
(1)
mat. za
mat. przeciw
ocena
(2)
mat. przeciw
mat. za
ocena
(3)
mat. za
mat. przeciw
ocena
(4)
mat. przeciw
mat. za
ocena
(5)
mat. za
mat. przeciw
ocena
(6)
mat. przeciw
mat. za
ocena
(7)
mat. za
mat. przeciw
ocena
(8)
mat. przeciw
mat. za
ocena
2.4. Przenoszenie ocen z jednych zadań na inne: efekt "aureoli"
Kiedy się słucha (lub czyta) opinii jednych ludzi o innych, to opinie te z reguły zawierają albo same pozytywne, albo same negatywne oceny. W sposób systematyczny przestudiował to jeszcze w latach dwudziestych znakomity amerykański psycholog Edward Thorndike (za: Plous, 1993), gdy badał oceny przypisywane oficerom przez ich przełożonych. Okazywało się na przykład, że jeżeli oficer był oceniany jako inteligentny, to zarazem wysoko oceniano jego charakter. Ponieważ nie ma takiej prawidłowości, że wyższej inteligencji towarzyscy większa doskonałość moralna, więc owo powiązanie (korelacja) charakteryzowało raczej sposób tworzenia ocen niż stan faktyczny.
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU
;;a
Thorndike stwierdził zresztą, że także oceny dokonywane przez oficeró\ wobec szkolących ich przełożonych zawierały charakterystyczne powiązanie czasami całkiem zaskakujące. Występowała na przykład zależność między pc zytywną oceną głosu nauczyciela a przypisywaną nauczycielowi inteligencją.
Jak ilustruje ta obserwacja, jednym z typowych zniekształceń dokonywa nych przy ocenianiu jest przenoszenie ocen z jednych cech czy zadań alb' aspektów na inne. Tendencja ta jest znana pod nazwą efektu "aureoli". Po lega ona na tym, że jeśli jakaś jedna cecha ocenianej osoby albo wytwon została oceniona pozytywnie, to mamy skłonność do przypisywania tej oso bie również i innych cech pozytywnych. W eksperymencie Dion, Berscheti i Walster (1972) pokazywano ludziom fotografie trzech osób: jedna była atrak cyjna pod względem fizycznym, druga - przeciętna, a trzecia - nieatrak cyjna. Badanych proszono, aby każdą z tych osób oceniły pod względem 2' różnych cech osobowości i o przewidywanie, czy w przyszłości osoby te będ, szczęśliwe. Okazało się, że osobie fizycznie atrakcyjnej przypisano znaczni bardziej pożądane cechy niż osobie średnio i mało atrakcyjnej. Uważano po nadto, że osoby atrakcyjne mają większe szansę na osiągnięcie szczęścia.
Badania pokazują (patrz Eagły i in., 1990; Wojciszke, 1991), że atrakcyj ny wygląd wpływa na całą masę rozmaitych ocen dotyczących ludzi. Z ba dań wynika, że rzeczywiście mamy skłonność do przypisywania ludzion ładnym wielu różnych pozytywnych cech - m. in. serdeczność, towarzy skość, wrażliwość, uczciwość, inteligencję. Okazuje się przy tym, że wcał nie zdajemy sobie sprawy z tej naszej tendencyjności, myślimy, że owe ce chy rzeczywiście zaobserwowaliśmy.
Okazuje się również, że atrakcyjny wygląd fizyczny bywa w wielu sytu acjach wielce przydatny. Na przykład, jak to wynika z badania Efran i Pat terson (za: Cialdini, 1993), jest przydatny dla kandydatów w wyborach par lamentarnych. Przystojni kandydaci na posłów mają zdecydowanie większ' szansę od nieprzystojnych na dostanie się do parlamentu. Podobnie atrak cyjność fizyczna pomaga w ubieganiu się o zatrudnienie (Mack i Rainey, za Cialdini, 1993). A nawet - pomaga w uzyskaniu niższego wyroku w proce się sądowym. Pokazał to Stewart (1980), który wysyłał do sądu swoich współ pracowników, by oceniali fizyczną atrakcyjność oskarżonych (mężczyzn) Kiedy później sprawdzano, jakie wyroki otrzymali ci sami oskarżeni, okażą ło się, że przystojni otrzymali, średnio biorąc, niższe wyroki niż oskarżeń mniej przystojni. Różnica nie była ogromna (tak że nawet osoba przystojni nie powinna ryzykować przestępstwa), ale jednak była.
Także kiedy zapytywano o ocenę moralną niemoralnych czynów, okazy wało się, że fizyczna atrakcyjność sprawcy "łagodziła" tę ocenę. W tej ostat niej sprawie stwierdzono wszakże charakterystyczny wyjątek. W ekspery mencie przeprowadzonym przez Sigalla i Ostrove (1975) pokazywani
00 PSYCHOLOGICZNh PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
badanym fotografię ładnej albo nieatrakcyjnej młodej kobiety mówiąc, że dopuściła się ona pewnego przestępstwa. Przestępstwo polegało albo na dokonaniu włamania i kradzieży 2200 dolarów, albo - w innej wersji - na wyłudzeniu 2200 dolarów od samotnego mężczyzny. Okazało się, że atrakcyjność "łagodziła" ocenę moralną, ale tylko dla wersji włamania połączonego z kradzieżą, w wypadku wyłudzenia pieniędzy od samotnego mężczyzny zaś - ocena atrakcyjnej sprawczyni była nawet bardziej surowa. (Niech będzie to przestrogą dla atrakcyjnych, wyłudzających pieniądze od samotnych mężczyzn!) Wedle interpretacji autorów, stało się tak zapewne dlatego, że w tym drugim wypadku uroda stanowiła "narzędzie" przestępstwa.
Oczywiście istnieją liczne przypadki, gdy między różnymi cechami istnieje rzeczywista, a nie tylko spostrzegana współzależność. Na rynku istnieje na ogół związek między ceną i jakością produktu - są to cechy pozytywnie skorelowane. Jest wtedy zrozumiałe i sensowne, że na podstawie wysokiej ceny produktu, którego jakość nie jest znana, konsument wnosi, iż jakość owa jest wysoka, a gdy cena jakiegoś produktu o nieznanej jakości jest niska, to konsument wnosi, iż jego jakość jest także niska.
2.4.1. Wpływ nazwiska autora na ocenę wytworu
W wielu sytuacjach oceniania wytworów (w sporcie, w sztuce, w nauce) pojawia się niepożądany wpływ nazwiska autora na ocenę wytworu. Dzieła znanych i uznanych autorów, nawet jeżeli są słabsze, bywają przeceniane, wytwory nowicjuszy muszą się "przebijać". Ilustruje to historia popularności dzieł wielkich pisarzy, malarzy czy muzyków. Typowa jest sytuacja, gdy wczesne dzieła autora są "niezauważone", po czym jakieś kolejne dzieło zyskuje rozgłos i wtedy wraca zainteresowanie i uznanie także dla dzieł wcześniejszych (m. in. Ibsen jest dobrą ilustracją takiego właśnie przebiegu uznania). Oczywiście jakość owych wcześniejszych dzieł się nie zmieniła, to ich ocena uległa zmianie pod wpływem znajomości autora.
W malarstwie znana (i wielce zyskowna) jest praktyka tworzenia falsyfikatów, czyli "podpisywania" świeżo tworzonych obrazów nazwiskami znanych dawnych lub nawet współczesnych malarzy. To, że nabywcy "dają się nabierać", jest najlepszym dowodem na twierdzenie, iż wartość dzieła ocenia się nie na podstawie wartości jego samego, lecz na podstawie oceny autora.
W sporcie z kolei można obserwować tendencję tego typu, że jeżeli zawodnicy pewnego kraju otrzymują w danej dziedzinie tradycyjnie wysokie noty, to gdy na stadionie pojawia się przedstawiciel tego kraju, sędziowie z góry, niezależnie od jego walorów, mają skłonność do przyznawania mu wysokich not.
We wszystkich tych wypadkach mamy do czynienia z efektem podobnym do efektu pierwszeństwa. Oceny pozostają pod wpływem wcześniejszej
PODSTAWOWE ZNIEKSZTAŁCENIA W OCENIANIU
Ki- "
opinii. W kontekście oceniania szkolnego efekt ten pokazali Caverni, Fabr< i Noizet (za: Noizet i Caverni, 1988). Autorzy ci jako materiału do badanie użyli sporządzonych przez uczniów tłumaczeń z języka angielskiego na fran cuski (będący ojczystym językiem uczniów). Wybrano 6 bardzo dobrych i (:
bardzo słabych wypracowań z pewnej'klasy. Eksperyment składał się z dwóci-etapów: w pierwszym przesłano te prace do oceny dwunastu nauczycielom W drugim etapie, po dwóch miesiącach, ci sami nauczyciele otrzymali dwa naście innych prac, na wyrównanym przeciętnym poziomie. Sześć z tyci nowych prac przypisano uczniom, którzy zostali poprzednio ocenieni wyso ko, a sześć uczniom, którzy poprzednio otrzymali niskie oceny. Tak więc podczas gdy nowe prace reprezentowały ten sam poziom, na niektórych z nicł zaznaczono wysoką, a na innych niską ocenę, jaką rzekomo otrzymał dań} uczeń przed dwoma miesiącami. Ponieważ w rzeczywistości nie była to na wet praca tego samego ucznia, związek między pracą a napisanym na nie stopniem był przypadkowy. Otrzymane przez badaczy wyniki były zupełnie jednoznaczne: jeśli oceny wcześniejsze były wysokie, to średnia ocena w dru giej części eksperymentu była o dwa punkty wyższa niż w wypadku poprzed nich ocen niskich. Wynik ten rzeczywiście pokazuje, jak znajomość wcze śniejszych ocen (albo uzyskana wcześniej opinia "ucznia dobrego" alb( "ucznia złego") wpływa na kolejne oceny szkolne.
Niekiedy zresztą wpływ na ocenę może wywierać nie tylko znajomoś( wcześniejszych wyników autora. W innym eksperymencie szkolnym, Ami guesa, Bonniola i Caverniego (za: Noizet i Caverni, 1988), badano wpływ informacji o pochodzeniu etnicznym ucznia na ocenę jego pracy. W ekspe rymencie zmieniano po prostu brzmienie nazwiska ucznia (na brzmienie bardziej swojskie albo na bardziej obce pod względem etnicznym). Ocenit poddany został ten sam zestaw prac, a nauczyciele otrzymali zróżnicowa ne informacje dotyczące nazwisk autorów. Poszczególne prace zostały przy pisane albo uczniowi, którego nazwisko było rdzennie francuskie, alb( uczniowi, którego nazwisko brzmiało obco. Okazało się, że nauczyciele którzy sami nosili nazwisko francuskie, wyżej oceniali prace uczniów obce go pochodzenia. Odwrotnie było w wypadku nauczycieli obcego pochodzę nią - ci wyżej oceniali prace przypisane uczniom o nazwiskach rdzenni( francuskich.
Tak czy owak, korzystna dla "bezstronnej" oceny wytworów byłaby czę sto anonimowość autora ocenianego wytworu, żeby oceniający nie wiedział kogo ocenia. Praktyka taka jest niekiedy rzeczywiście stosowana przy oce nie wytworów naukowych. Recenzenci oceniają wtedy prace naukowe be;
znajomości nazwiska autora tych prac. Chwyt tego rodzaju bywa równie;
niekiedy stosowany przy ocenie rozmaitych prac konkursowych. Autor zo staje wówczas oznaczony jakimś symbolem, który jest przypisany do jeg(
l
-ru ^&YUi-iULUUl<-^lMt: funA^M UUhNIAlMIA l PODEJMOWANIA DECYZJI
nazwiska i niedostępny oceniającym. Niewątpliwie zabiegi te chronią przed wpływem nazwiska autora na ocenę jego wytworu.
Nie zawsze jednak zabieg anonimowości jest możliwy i nie zawsze zresztą jest pożądany. Trudno sobie wyobrazić, by na zawodach sportowych zawodnicy występowali w maskach czy w inny sposób zmieniali swój wygląd, tak by nie byli "rozpoznawalni" dla sędziów. W tej dziedzinie można by raczej "chronić" sędziów sportowych przed nadmiarem wiedzy o zawodniku, który ma być przez nich oceniany. Pożądane byłoby także unikanie -jeśli to możliwe - sędziów, którzy zbyt dobrze znają ocenianych zawodników.
Nie zawsze też zabieg anonimowości jest pożądany. Kiedy na przykład Komitet Badań Naukowych "rozdziela" pieniądze między różne projekty badawcze, to słuszne wydaje się, że oprócz samych projektów ocenie podlegają także dotychczasowe dokonania ich autorów. W idealnych warunkach byłoby wprawdzie lepiej, żeby "konkurencja" dokonywała się między samymi projektami (tak by projekt początkującego asystenta mógł "wygrać" z projektem jego profesora), ale na nieszczęście nie ma dobrej metody oceny i prognozy wartości projektu naukowego. Co wyjdzie z obiecującego projektu badawczego, trudno powiedzieć. W tej sytuacji sensowne jest założenie, że projekt autora, który uzyskiwał do tej pory powodzenie w pracy badawczej, lepiej rokuje niż projekt kogoś, kto do tej pory nie uzyskiwał wyników.
2.4.2. Wpływ miejsca wykonania na ocenę wytworu
Podobnie jak nazwisko autora, tak i nazwa instytucji (miejsca), z której pochodzi wytwór, wpływa na ocenę owego wytworu. W Polsce przez pewien czas po otwarciu rynku na towary zagraniczne panowało "bezgraniczne" zaufanie do zagranicznych produktów. Konsumenci nie badali ich jakości, lecz przyjmowali, że zagraniczne pochodzenie jest równoznaczne z wysoką jakością. W wielu wypadkach opinia, że towary zagraniczne są lepszej jakości od krajowych, była niewątpliwie (niestety!) uzasadniona. Ale zakres utrzymującego się przez długi czas przekonania był zdecydowanie przesadzony, zwłaszcza że z jednej strony zagraniczna konkurencja zaczęła wymuszać na krajowych producentach lepszą jakość, z drugiej strony zaś niektórzy producenci zagraniczni zaczęli obniżać jakość przysyłanych towarów, licząc na pozytywną opinię polskich konsumentów.
Wiele instytucji korzysta z owej "podwyższonej" opinii o swoich wytworach. W środowisku lekarskim pojawiła się następująca anegdota: matka z poważnie chorym dzieckiem została skierowana do lekarza specjalisty w rejonowej przychodni specjalistycznej w celu potwierdzenia rozpoznania i ustalenia sposobu leczenia. Tam, po wykonaniu koniecznych badań, wyjaśniono, na czym polega choroba dziecka i jakiego leczenia wymaga. Jed-
ROZBIEŻNOŚCI W OCENIANIU
nak po rozmowach z rodziną i sąsiadami matka nabrała wątpliwości, czy rejonowa przychodnia jest na pewno wystarczająco kompetentna w wydawaniu tego typu diagnoz. Matka po wielu trudach uzyskała termin konsultacji w stołecznym centrum specjalistycznym. Nie bacząc na długą, uciążliwą podróż i koszty dojazdu, przyjechała do stolicy, by uzyskać pewniejszą diagnozę. Jakież było jej zdziwienie, gdy po wejściu do gabinetu spotkała tę samą panią doktor, która postawiła diagnozę w przychodni rejonowej (i która właśnie przyjechała na staż do centrum specjalistycznego).
Kierowanie się w ocenie wytworu nazwą instytucji jest zwykle znacznie mniej uzasadnione niż kierowanie się nazwiskiem autora. W przeciwieństwie do zasłużonej na ogół reputacji przypisywanej wybitnym jednostkom, reputacja instytucji bierze się nierzadko dosłownie z "byle czego". Prestiż instytucji pochodzi niekiedy na przykład wyłącznie z odpowiednio dobranej nazwy. Takie przymiotniki, jak "główny", "centralny", "stołeczny", "europejski", "światowy", "międzynarodowy", "specjalistyczny", same z siebie sugerują ludziom wysoką jakość wytworów pochodzących z danej instytucji. Oto przypadkowo wykonany test pokazujący, jak bardzo tego rodzaju domniemania mogą być złudne. Na początku lat dziewięćdziesiątych, w okresie transformowania gospodarki polskiej, pojawiła się słuszna idea "zasilenia" krajowych organizatorów produkcji fachową wiedzą zagraniczną. Powstał specjalny program "importowania" do Polski zagranicznych fachowców, którzy współpracując przez pewien czas z polskimi firmami lub instytucjami, przekażą im stosowną wiedzę. To właśnie w tym okresie zacząłem spotykać w Warszawie różnych dawno niewidzianych kolegów ze studiów albo moich byłych studentów, którzy wyjechali (niekiedy całkiem niedawno) za granicę, podjęli tam skromną pracę, a w wielu wypadkach pozostali bezrobotni, po czym w ramach akcji "importowania" zagranicznych fachowców zaczęli przyjeżdżać uczyć w Polsce smali businessu, marketingu i innych pożytecznych rzeczy, o których jednak niewiele wiedzieli.
y" w s
Oceny i uczucia
3.1. Widzenie przez różowe i czarne okulary
Od dawna wiadomo, że uczucia i nastrój mocno wpływają na ludzkie oceny. Wyrażają to powiedzenia o widzeniu świata przez różowe bądź przeciwnie - przez czarne okulary. W bardziej systematycznych badaniach psychologicznych ustalono, że uczucia i nastrój mocno wpływają na ocenę nas samych, na oceny innych osób oraz na oceny różnorodnych zdarzeń.
Schwarz i Clore (1983) prosili ludzi o ocenę własnej ogólnej satysfakcji z życia. Nieprzypadkowo jednak wybierali dni, w które zadawali ludziom owo pytanie. W jednych wypadkach były to dni słoneczne, a w innych - deszczowe. Okazało się, że pogoda w dniu badania miała istotny wpływ na ocenę ogólnej satysfakcji z życia. Pytani w dzień słoneczny oceniali swoją satysfakcję z życia wyraźnie wyżej niż pytani w dzień deszczowy.
W innych badaniach ustalono, że uczucia i nastrój wpływają na oceny innych osób oraz na oceny różnych zdarzeń. Wpływają w ten sposób, że wzbudzenie pozytywnego nastroju sprawia, iż ludzie oceniają innych bardziej pozytywnie niż wtedy, kiedy pozostają w nastroju neutralnym lub negatywnym. Okazało się przy tym, że bardzo łatwo daje się wprowadzić ludzi w dobry nastrój. Można to osiągnąć poprzez: poinformowanie o odniesieniu sukcesu w jakimś zadaniu, danie osobie drobnego prezentu (wystarczy na przykład zwykły breloczek), pokazanie jej komedii filmowej, wprowadzenie relaksującej muzyki, a nawet udzielenie sugestii hipnotycznej, aby pozostawała w dobrym nastroju po przebudzeniu.
Forgas i Bower (1987)3 wprowadzali badane osoby w lepszy bądź gorszy nastrój za pomocą informacji o dobrym lub złym wyniku uzyskanym w uprzednio wykonanym "teście osobowości" (naprawdę była to jednak manipulacja i osoby badane losowo przydzielano do grupy z dobrze albo źle
W opisie eksperymentu skorzystałem z przedstawienia go w książce Wojdszke (1991).
OCENY l UCZUCIA
wykonanym testem osobowości). Tak "przygotowanym" badanym prezentowano opis pewnej osoby zawierający w połowie pozytywne, a w połowie negatywne cechy. Po zapoznaniu się z opisem badani oceniali rozmaite "domniemane" cechy tej opisywanej osoby. Potem na pewien czas zajmowano uwagę badanych czym innym, a następnie ponownie przypominano uzyskany wynik w "teście osobowości" (żeby ponownie "przywołać odpowiedni nastrój) i proszono o przypomnienie sobie prezentowanych uprzednio opisów owej osoby.
Badacze stwierdzili, że osoby w dobrym nastroju: (l) poświęcały więcej czasu czytaniu pozytywnych niż negatywnych opisów spostrzeganej osoby (rejestrował to komputer według długości pozostawania na ekranie monitora każdego z opisów); (2) formułowały więcej ocen pozytywnych niż negatywnych o spostrzeganej osobie; (3) przypominały sobie więcej informacji pozytywnych niż negatywnych o spostrzeganej osobie. Dokładnie na odwrót było w wypadku badanych w złym nastroju: (l) poświęcali oni więcej czasu czytaniu negatywnych niż pozytywnych opisów spostrzeganej osoby; (2) formułowali więcej ocen negatywnych niż pozytywnych o spostrzeganej osobie (3) przypominali sobie więcej informacji negatywnych niż pozytywnych o spostrzeganej osobie.
Tak więc eksperyment pokazał, że ludzie w dobrym nastroju lepiej oceniają innych niż ludzie w złym nastroju. Przyczyną owego zróżnicowania wydaje się fakt, iż ludzie w dobrym nastroju zwracają większą uwagę na informacje pozytywne, a ludzie w złym nastroju - na informacje negatywne.
Forgas i Moylan (1988) wprowadzali badane osoby w lepszy bądź gorsza nastrój za pomocą innej niż poprzednio manipulacji. Wytypowano trzy grupy filmów: (l) filmy pogodne, (2) filmy smutne i (3) filmy agresywne. Następnie ludzi wychodzących z kina po obejrzeniu tych filmów proszono o ocenę bardzo różnych kwestii:
(a) politycznych - m. in. dwóch znanych polityków (premiera i przywódcy opozycji);
(b) przewidywania przyszłych zdarzeń - na przykład stanu gospodarki własnego powodzenia itd.;
(c) odpowiedzialności i kary za rozmaite wykroczenia -jazdę po pijanemu, rozprowadzanie heroiny itp.;
(d) satysfakcji z własnego życia.
Wyniki były znowu jednoznaczne: Ludzie w pozytywnym nastroju wywo. łanym obejrzeniem pogodnego filmu dokonywali wyraźnie wyższych ocer we wszystkich kwestiach niż ludzie, którzy obejrzeli film smutny bądź agre sywny. A więc bardziej pozytywnie oceniali polityków, mieli bardziej optymi styczne przewidywania w odniesieniu do stanu gospodarki i własnego powo dzenia, byli łagodniejsi w proponowanym karaniu za jazdę po pijanemu cz;
-TT ^SYUMULULalU^Nt ^UŁAHKI OCENIANIA l PODEJMOWANIA DECYZJI
; as^^-s^s^^w^w^ ^ ". ^ ~ »*/-u^l/-\ L^l_^ I Ł-"1
za rozprowadzanie heroiny, byli bardziej usatysfakcjonowani z własnego życia. Interesujące, że nastrój negatywny (obejrzenie filmu smutnego) nie zmieniał tak bardzo ocen w stosunku do stanu neutralnego (osoby badane przed obejrzeniem filmu).
3.2. Dlaczego nastrój wpływa na ocenianie?
Isen, która wykonała ogromną serię badań nad wpływem nastroju na ocenianie, utrzymuje (Isen, Shaiker, Ciark i Karp, 1978), że osoba pozostająca w określonym nastroju łatwiej aktywizuje i wydobywa z pamięci te informacje, które są zgodne z jej nastrojem. Jeżeli osoba jest w nastroju pozytywnym, to ma ułatwiony dostęp do informacji pozytywnych, a gdy jest w nastroju negatywnym, to ma ułatwiony dostęp do informacji negatywnych w swojej pamięci. Isen i jej współpracownicy wspierają tę interpretację wynikami badań, pokazującymi, że nastrój wpływa nie tylko na ocenę aktualnie obserwowanych rzeczy, ale także znanych rzeczy ocenianych z pamięci.
Isen, Shaiker, Ciark i Karp (1978) wprowadzali ludzi dokonujących zakupów w dobry nastrój, ofiarowując im drobny (a nawet bardzo drobny!) upominek, a następnie prosili o oszacowanie na odpowiednich skalach, w jakim stopniu są zadowoleni z funkcjonowania swojego samochodu i telewizora. Okazało się, że oceny obdarowanych były zdecydowanie wyższe od ocen osób, którym nie wręczono upominku. Bardziej bezpośredni argument na rzecz twierdzenia, że nastrój aktywizuje odpowiednie informacje w pamięci osoby, uzyskano, prosząc osoby, by przypominały sobie listę słów, których się wcześniej uczyły. W badaniu okazało się, że nastrój pozytywny powodował, iż osoby przypominały sobie więcej słów przyjemnych niż nieprzyjemnych.
Inny możliwy mechanizm oddziaływania nastroju na oceny może polegać po prostu na wykorzystywaniu ocen doznawanego nastroju na ocenę danej kwestii. Wojciszke tłumaczy to za Schwartzem i Clore (1983) następująco:
"Kiedy człowiek zostanie zapytany, jak ocenia jakąś osobę (czy cokolwiek innego, na przykład poziom satysfakcji z własnego życia), może nie wdawać się w pracowite i systematyczne przeszukiwanie własnej pamięci na okoliczność posiadanych informacji na temat tej osoby, a następnie w żmudny proces indukcyjnego formułowania jej globalnej oceny [...] Może po prostu odwołać się do własnych aktualnych odczuć, czyli zastosować heurystykę «jak to czuję?»[...] i jeżeli aktualne uczucia są przyjemne - wydać pozytywną ocenę danej osoby czy sprawy, a jeżeli aktualne uczucia są nieprzyjemne - ocenę negatywną". Wyjaśnienie takie wyraźnie sugeruje cytowane wcześniej badanie, w którym ocena satysfakcji z życia pozostawała pod silnym wpływem pogody, tak jakby pytani w dzień słoneczny wnioskowali o wysokiej satysfak-
OCENY l UCZUCIA
%:;» ^
cji z aktualnie dobrego samopoczucia, a pytani w dzień deszczowy wnioskowali o niskiej satysfakcji z aktualnie złego samopoczucia.
Jakikolwiek jest mechanizm oddziaływania nastroju na oceny, samo istnienie i znaczący rozmiar owego wpływu jest niewątpliwy. Można w związku z tym sformułować rozmaite postulaty praktyczne. Na przykład św. Ignacy Loyola (1996) w swoich ćwiczeniach duchowych formułuje następującą konkluzję dotyczącą nastroju przy podejmowaniu decyzji: Podczas strapienia nie wprowadzać żadnych zmian, lecz trwać w postanowieniach i decyzjach podjętych w dniu poprzedzającym takie strapienie albo w decyzjach, które podjęto podczas poprzedniej pociechy. Symetrycznie można dodać, że warto również zachować ostrożność wobec postanowień podejmowanych w zbyt dobrym nastroju. Ileż to nierozważnych związków i zobowiązań powstało, kiedy ludzie byli w zbyt dobrym nastroju. Najbardziej pożądany przy podejmowaniu ważnych decyzji byłby stan neutralny.
Dawanie podarunków. Ludzie od dawna wiedzieli, że dawanie (wymiana) podarunków pomaga w załatwianiu spraw. Kiedy czytamy opisy wizyt i różnego rodzaju kontaktów (ekonomicznych, dyplomatycznych i innych), stale spotykamy się ze wzajemnym obdarowywaniem się podarkami. Oto przykład z Japonii, pochodzący z książki Michała Derenicza (1977):
Działo się to w malej wiosce rybackiej Kanagawa (Yokohama) w końcu marca 1854 roku po uroczystości zawarcia traktatu, kładącego kres izolacji Japonii od świata. Amerykanie, spodziewając się pomyślnego zakończenia rokowań z Japończykami, przywieźli dla shoguna i innych dygnitarzy różnego rodzaju prezenty: dwa wielkie tomy dziel znakomitego ornitologa amerykańskiego Johna J. Audubona, "Birds ofAmerica" i "Quadrupeds ofAme-rica" (miały one świadczyć w oczach Japończyków, że Amerykanie nie są bynajmniej "barbarzyńcami"), kosze szampana, beczkę whisky, butelki ma-dery, skrzynkę broni marki słynnej fabryki Colta z Hartfordu, a dla pań lustra i francuskie perfumy. Ponadto przywieźli narzędzia rolnicze, zegary, piece, dagerotyp, wreszcie - co sprawiło największą sensację i zachwyt - pociąg i aparat telegraficzny.
Steven Burrough (za Pisarkiem, 1971) w opisie spotkania z kapitanem innego statku u brzegów wyspy Nowa Ziemia zaznacza: ...Wysiałem naszą łódź na ten statek. Jego załoga zaznajomiła się z naszymi ludźmi, a ich dowódca przybył do nas na swojej łodzi i powiedział, że ląd ten nazywa sn Nowa Ziemia. Objaśnił mnie, w jaki sposób dostać się do ujścia rzeki Ob, ale bardzo się spieszył odpłynąć, gdyż dawno minęła już polowa roku. Podarowałem mu stalowe zwierciadło, dwie cynowe łyżki i parę noży w pochwach krytych aksamitem. Na to on zgodził się jeszcze trochę z nami zostać, by udzielić nam, na ile potrafi, wszelkich wiadomości, jakie mogły mieć dla nas wartość. On też dal mi prezent w postaci 17 sztuk dzikich gęsi...
f&Y^i-iULm.ilUZ.Nt l-'UŁAl-'KI UChNIANIA l PODEJMOWANIA DECYZJI
Niewątpliwie obyczaj obdarowywania się przez strony podarkami sprzyja wytworzeniu się u partnerów pozytywnego nastroju, co z kolei prowadzi do bardziej pozytywnych wzajemnych ocen i relacji, a w konsekwencji także do bardziej pozytywnych ocen i reakcji na składane przez strony oferty: handlowe, dyplomatyczne itp. Zdawał sobie z tego sprawę Krzysztof Kolumb, który tak oto pisze o obdarowywaniu Indian w czasie pierwszej swojej podróży (za Pisarkiem, 1971): ...Rozdawałem tysiące pięknych, dobrych rzeczy, które przywiozłem, aby wzbudzić przyjazne uczucia, co więcej - aby stali się chrześcijanami i byli skłonni miłować i służyć Ich Wysokościom i całej ka-stylskiej nacji tudzież by starali się nam pomagać i dawać nam to wszystko, co mają w obfitości, a nam jest potrzebne...
3.3. Znaczenie emocjonalnego stosunku wobec ocenianych obiektów
Od najdawniejszych czasów wiadomo, że nie można być bezstronnym sędzią we własnej sprawie albo w sprawie osoby, z którą oceniający jest blisko związany. Przytoczymy tu jeden z pierwszych eksperymentów pokazujących, że emocjonalny związek ze spostrzeganą osobą zmniejsza trafność i rzetelność oceny tej osoby. Hastorfi Cantrii (1954) wykorzystali sytuację naturalną- mecz piłki nożnej rozgrywany przez zawodników jednej z lig amerykańskich. Spotkanie rozgrywały między sobą drużyny Uniwersytetu w Princeton i Uniwersytetu w Dartmouth. Zawodnicy obu drużyn grali bardzo brutalnie. Autorzy eksperymentu sfilmowali mecz i w jakiś czas potem pokazali go studentom z obu uniwersytetów. Studentom polecono, aby starali się obiektywnie ocenić każde naruszenie reguł gry, sytuację wskazującą, jak do tego doszło oraz kto i za co był odpowiedzialny. Okazało się, że różnica w spostrzeganiu tego samego meczu przez studentów obu uniwersytetów była ogromna. Studenci jako sprawców aktów brutalnych widzieli zawodników z drużyny przeciwnej. Studenci z Princeton zauważyli przeszło dwa razy więcej wykroczeń u zawodników z Dartmouth niż studenci z Dartmouth. Tak więc związek z własną uczelnią, z kolegami, spowodował wyraźne zmniejszenie trafności spostrzegania i brak obiektywizmu.
Vallone, Ross, Lepper (1985) doszli do wniosku, że owa wybiórczość spostrzegania prowadzi zapewne do skrzywionej percepcji mass mediów przez zwolenników różnych opcji politycznych. Postanowili to sprawdzić przy okazji wyborów prezydenckich w 1980 roku, kiedy kandydatami byli Jimmy Carter i Ronald Reagan. Na trzy dni przed wyborami poprosili 160 zarejestrowanych wyborców, by ocenili, czy uwaga poświęcona obu kandydatom
OCENY l UCZUCIA
w mediach jest równo rozłożona, czy też któryś z kandydatów jest przez media faworyzowany. Okazało się, że mniej więcej jedna trzecia pytanych uważała, iż media są stronnicze, i to na niekorzyść ich kandydata.
Ci sami badacze (Vallone, Ross i Lepper, 1985) przeprowadzili badanie ze studentami, którzy oglądali zestaw wiadomości telewizyjnych na temat masakry w Bejrucie. (Chodziło o masakrę cywilnej ludności arabskiej w obozach w Libanie, dokonaną przez Żydów jako odwet w ramach wojny żydow-sko-palestyńskiej). Obserwatorami pokazu była grupa studentów "proizra-elskich", grupa "proarabska" i grupa neutralna. Jak przewidywano, każda z emocjonalnie zainteresowanych grup spostrzegała wiadomości telewizyjne jako stronnicze w innym kierunku. Studenci proarabscy widzieli je jako tendencyjne na korzyść Izraela, studenci proizraelscy - jako tendencyjne antyżydowsko. Ponadto studenci proarabscy odczytywali je jako usprawiedliwiające Izrael, a studenci proizraelscy - jako oskarżające Izrael.
Oba badania pokazują, że zwolennicy określonego stanowiska (tj. osoby emocjonalnie zaangażowane) mają skłonność widzieć media jako stronnicze i nieprzychylnie relacjonujące reprezentowane przez nich stanowisko. Przejawem tego złudzenia jest również powszechne narzekanie polityków na stronniczość niezależnych mediów. Co więcej, politycy w dobrej wierze mają stale chęć "naprawiać" tak "skrzywione" media. Ale właśnie dlatego niezależność mediów jest tak ważną sprawą.
I jeszcze jedno pouczające badanie. Pratkanis (1988) zebrał wiele pozytywnych i negatywnych informacji o życiu i wypowiedziach kilkunastu publicznych osobistości w Stanach Zjednoczonych (takich jak Martin Luther King, Reagan i inni). Badane osoby miały ocenić, czy informacje te są prawdziwe, czy fałszywe. Jak nietrudno zgadnąć, im bardziej pozytywna była postawa badanego wobec danej osoby, tym bardziej był on skłonny wierzyć w prawdziwość pozytywnej informacji o tej osobie, a tym mniej skłonny wierzyć w prawdziwość informacji negatywnej. (W rzeczywistości wszystkie informacje były prawdziwe).
W świetle przytoczonych ustaleń słuszna jest ostrożność, z jaką traktujemy wypowiedzi na czyjś temat, kiedy pochodzą one od osoby, o której wiemy że lubi tę osobę (albo jej nie lubi). Trafne są też uwagi poczynione prze2 Witwickiego (1959, str. 75-76) na temat dobierania i traktowania sędziów ...łatwo zauważyć, że silne dyspozycje uczuciowe o charakterze osobistym nie dopuszczają w wielu wypadkach do głosu naszego poczucia moralnego i paraliżują nasze zasady etyczne, podobnie jak umieją znosić tendencję logiczną naszych przestanek potencjalnych poza dziedziną dobra i zła. Stąd prastara zasada: nikt nie może być sędzią we własnej sprawie. Nie może, ponieważ istnieje uzasadniona obawa, że żywe odczucie własnego interesu ograniczy lub zdławi w zupełności glos poczucia moralnego, sprzeczny może w danym
rsYUl-lULUUlU.ćNt (-'UŁAMKI UUbNIANIA l PODEJMOWANIA DECYZJI
wypadku z jakimś interesem osobistym. Podobnie może działać strach, chciwość, miłość, nienawiść, zazdrość, a nie mniej cześć. Dlatego staramy się o sędziów niezależnych moralnie i materialnie i niezainteresowanych osobiście ani w sprawie ocenianej, ani niezwiązanych węzłem miłości lub przyjaźni z żadną ze stron podsądnych. W grupach urządzonych hierarchicznie jak wojsko sędzia nie może być niższy rangą od podsądnego, aby go w sądzeniu nie zaślepiała cześć lub zemsta za poniżenia związane z przymusowym objawianiem czci przed rozprawą i po rozprawie. Zawsze stawia się sędziów na pewnym podwyższeniu i wstaje się, gdy wchodzą; stwarza się przez to pewną sugestię czci dla sądzących, a zdejmuje się z nich sugestię czci dla podsądnych. Obowiązani są tylko do pewnego szacunku dla tych, których czyny mają oceniać.
Zasada wykluczania ze sprawy sędziów mających określony interes albo stosunek emocjonalny do osądzanej sprawy jest na tyle oczywista, że jest prawie powszechnie przyjęta. Na przykład w sporcie sędzia nie ocenia zawodników z własnego kraju czy klubu. Bodaj jedynym miejscem, gdzie ta oczywista zasada nie dociera, jest sfera polityki. Tylko w polityce utrzymuje się praktyka, że o postawieniu w stan oskarżenia posła podejrzanego o popełnienie przestępstwa (choćby o jazdę po pijanemu) decyduje nie niezależny sąd, ale inni posłowie, w tym jego klubowi koledzy - poprzez wyrażenie albo odmówienie zgody na uchylenie immunitetu. (Ciekawe, jak by zareagowali posłowie, gdyby inne grupy społeczne, choćby piekarze, zażądali podobnego prawa). Praktyka pokazuje, że do takiego uchylenia dochodzi niezmiernie rzadko. Podobnie tylko Sejm przyznał sobie prawo, że w wypadku uznania przez niezależny trybunał jego ustawy za niezgodną z konstytucją, tenże Sejm może unieważnić werdykt trybunału. (I jak tu lubić polityków!)
3.4. Zabiegi mające na celu utrzymanie wysokiego mniemania o sobie
Interesujące, że istnieją przypadki, kiedy "bliskość" emocjonalna powoduje nie zawyżanie, a przeciwnie - zaniżanie ocen. Pokazano to w eksperymencie Tesser i Campbell (1982). Zapraszano w nim do badania pary przyjaciółek, którym towarzyszyła dodatkowo jeszcze jedna (trzecia) uczestniczka - będąca nieznajomą. Osoby zaproszone do eksperymentu wykonywały zadanie związane z dokonywaniem oceniania albo w zakresie estetyki, albo tzw. wrażliwości społecznej. W pewnym momencie proszono je o przewidywanie (a więc ocenę), jak dobrze radzą sobie z tym zadaniem dwie pozostałe towa-
OCENY l UCZUCIA
rzyszki badania (tj. przyjaciółka i nieznajoma). Okazało się, że badane nie zawsze faworyzowały przyjaciółkę. Czyniły tak, tj. wyżej oceniały osiągnięcia przyjaciółki niż nieznajomej, w zadaniach odnoszących się do dziedziny, którą uznawały za mniej dla siebie ważną. Gdy dziedzina była dla danej osoby ważna, wtedy oceny osiągnięć przyjaciółki były zaniżane w stosunku do osiągnięć nieznajomej.
Skąd taka tendencja? Tesser tłumaczy ją następująco: Jeżeli dziedzina, której dotyczą oceny, nie jest dla nas specjalnie ważna - w sensie, że wyznacza naszą samoocenę, czyli wysokie mniemanie o sobie - to mamy naturalną skłonność do podwyższania w tej dziedzinie osiągnięć osób bliskich w porównaniu z osobami dalszymi. Inaczej jest wtedy, gdy dziedzina, której dotyczą oceny, jest ważna dla naszej własnej samooceny. Przewaga w takiej dziedzinie osoby bliskiej zagraża nam. W tej sytuacji mamy skłonność do zaniżania osiągnięć w tej dziedzinie osób bliskich - właśnie po to, by utrzymać wysoką własną samoocenę.
Wydaje się, że obserwacja potwierdza opisane zjawisko. Można je zauważyć na przykład wśród wysokiej klasy specjalistów, którzy rzadko doceniają swych równie wybitnych kolegów. Chętnie w swoich opiniach przedkładają nad nich mniej wybitnych profesjonalistów, po to właśnie, by chronić czy podtrzymywać wysoką własną samoocenę. Być może w tym tkwi częściowe wytłumaczenie znanego faktu, że wybitni uczeni, przywódcy itd. niezwykle rzadko mają wybitnych uczniów czy współpracowników. (Mniej wybitnym zdarza się to jakby częściej - ale może to tylko złudzenie, do którego wrócimy w rozdziale 9.).
3.5. Marketingowe uwiedzenie ^
Deighton i Grayson (1995) opisują niezwykły przypadek "uwiedzenia" ogromnej masy klientów w sprawie znanej jako Chonda-Za lub Szkoła Miłości (College ofLove). Uwodzenie dokonywało się przez wiele lat, sprawa działa się w latach 1966-1986 w USA, w stanie Illinois. Przedsięwzięcie, według szacunków, przyniosło ponad 4 miliony dolarów dochodu, wpłaty pochodziły od około 31 tysięcy klientów.
Właściciel przedsięwzięcia, Lowery, komunikował się z klientami przeważnie listownie. Jego "Szkoła Miłości" przedstawiała się jako schronisko czy ośrodek rehabilitacji dla grzesznych światowych kobiet. Kobiety miały pozostawać pod nadzorem niejakiej Matki Marii Simony Mirales. Według samoprezentacji instytucji, Matka Maria pragnęła zgromadzić wystarczającą sumę pieniędzy, żeby założyć "rajską dolinę", w której owe młode kobiety żyłyby bez lęku i odrzucenia - domyślnie - wraz ze swymi dobroczyńcami.
PSYCI-IULUUIC^NE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
W listach Matka Maria występowała jako Archanioł, opiekujący się grupą 13 kobiet - aniołów miłości. Pozyskiwanych klientów - patronów - skłaniano, by przystąpili do Międzynarodowego Zakonu Rycerskiego "Chonda-
-Za". Rycerze, w miarę rozwijania swojej aktywności, mogli awansować na kolejne poziomy hierarchii. Oczywiście powinni wpłacać pieniądze na rozwój przedsięwzięcia. W ramach ogólnej akcji powstawało szereg wątków indywidualnych, rozwijanych między poszczególnymi aniołami a patronami
- rycerzami.
Klientów rekrutowano z list zdobywanych z klubów samotnych serc i różnych magazynów. Zwykle zaczynano się od ogólnego listu, oferującego przystąpienie do Szkoły Miłości. Dalej przychodziły ręcznie pisane listy od poszczególnych aniołów, z prośbą o odpowiedź. Listy były wielowątkowe: osobiste, emocjonalne, "uwodzicielskie" i naturalnie zawierające prośby o finansowe wsparcie. Wszystko w odpowiedniej proporcji.
Oto fragment jednego z listów: Dzisiejszego dnia, 31 maja 1984 roku, ja, Yanessa Heather Couington, deklaruję oto moją miłość do Ciebie, Jerry M..., z Durango, Colorado... Przez cale moje życie potrzebowałam kogoś, komu mogłabym oddać moją miłość. Wybrałam Ciebie, Jerry M..., ponieważ pokazałeś mi, że zależy Ci na mnie. Obdarzasz mnie uczuciem. Jesteś prawdziwym mężczyzną, romantycznym, wrażliwym i delikatnym. Ty jesteś moim rycerzem w jasnej zbroi... Jutro będzie należało do nas. Jutro będziemy razem kroczyć tajemniczą ścieżką do raju. I w dolinie tej będziemy żyli na zawsze.
Lowery nie zaprzeczał w sądzie, że cała sprawa - łącznie z ręcznie pisanymi listami aniołów miłości - była fikcją. Utrzymywał jednak, że dokładał wszelkich starań, by zawarte w listach fantazje w żaden sposób nie szkodziły klientom. Na przykład, kiedy klienci skarżyli się, że czują się niekomfortowo, iż muszą płacić za listy miłosne od swoich aniołów, to Lowery "wychodził naprzeciw" owej wrażliwości i podawał w listach "przekonujące" powody próśb o wsparcie - zakup maszyny do szycia, piecyka do ogrzania mieszkania itp. Utrzymywał, że działał według założenia, iż dla wielu jego klientów iluzja romansu była lepsza od braku romansu w ogóle.
Istotnie. Reakcje "nabranych" były bardzo różnorodne. Wielu było naturalnie zagniewanych, że dało się nabrać, ale wielu było po prostu rozczarowanych, że tak atrakcyjna sprawa okazała się fikcją. Najbardziej jednak zdumiewające było to, że 12 "nabranych" patronów przybyło na rozprawę sądową, by świadczyć na korzyść Lowery'ego. Przywieźli ze sobą zdjęcia swoich aniołów, listy miłosne, zaświadczenia o mistycznym ślubie. Twierdzili, że Szkoła Miłości wyrwała ich z samotności, czasami z pijaństwa, czasami odwiodła od myśli samobójczych. Jeden, który wpłacił w sumie na przedsięwzięcie 25 tysięcy dolarów, powiedział reporterowi z "Chicago Tribune": Nigdy nie należałem do żadnej innej grupy, w której otrzymałbym więcej za swoje pieniądze.
y";!.. •"T,-\-T?|
Społeczny kontekst oceniania
l. KONFORMIZM
Wpływ publiczności i otoczenia społecznego na przebieg procesu oceniania ukazują dobitnie zjawiska znane z zawodów sportowych. Wyraźnie występuje tam na przykład tzw. fenomen gospodarza meczu. Oto zespół bokserów z klubu w Bydgoszczy wyjeżdża do Katowic i przegrywa z tamtejszymi bokserami spotkanie w stosunku 4:16. W jakiś czas potem klub z Bydgoszczy przyjmuje bokserów z Katowic i wygrywa spotkanie w stosunku, powiedzmy, 16:4. Dlaczego tak się dzieje?
Zwykle wiąże się to z zachowaniem zawodników. U siebie znają lepiej fizyczne warunki startu. Psychicznie zaś "mają za sobą publiczność". Narzuca się jednak przypuszczenie, że lepsze wyniki uzyskiwane "na swoim boisku" wiążą się nie tylko z zachowaniem zawodników. Istnieją powody, by przypuszczać, że swój wkład ma tu także zachowanie sędziów. Sędziowie obawiają się osobistych kłopotów, na jakie mogliby się narazić, gdyby nie stało się zadość życzeniom licznie zgromadzonych kibiców danej drużyny. Jest to całkiem prawdopodobne, gdy przypomnimy sobie wydarzenia na meczach piłkarskich, kiedy dochodziło nawet do pobicia sędziów. Mielibyśmy tu zatem do czynienia z motywacyjnym uwarunkowaniem wypaczania ocen. Okazuje się jednak, że nie wyczerpuje to wpływów sytuacji społecznej na procesy oceniania. Działa tu wiele czynników sprawiających, że pod wpływem nacisku widowni sędziowie popełniają w swoich ocenach błędy.
4.1. Konformizm
Obejrzeliśmy wieczorem w telewizji film, który dość się nam podobał. Następnego dnia rano jesteśmy świadkami dyskusji grona kolegów w pracy na temat tego filmu. Wszyscy są zgodni w jednym, oceniają film jako bezna-
PbY^I-lULUUIC^Nh PUŁAPKI OChNIANIA l PODEJMOWANIA DECYZJI
dziejny. Czy zabierzemy głos i powiemy, że film nam się podobał? Co zrobimy, gdy zostaniemy wprost zapytani o naszą ocenę filmu?
Klasyczny eksperyment na ten temat pochodzi od Ascha (1951). Osoby badane miały w nim za zadanie porównywać po prostu długości odcinków, tak jak pokazuje to poniższy rysunek.
Wzorcowy
A B C Odcinki porównawcze
Rys. 4.1.
Odcinki wykorzystane w eksperymencie Ascha (1951).
Osoby badane proszono o wskazanie, który z odcinków porównawczych był tej samej długości, co odcinek wzorcowy. Porównywany odcinek zawsze odpowiadał jednemu z trzech odcinków wzorcowych. Oceny były dokonywane w grupach 8-osobowych. W rzeczywistości tylko jeden z uczestników, ten, który odpowiadał jako ostatni lub przedostatni, był właściwą osobą badaną. Pozostałe osoby, o czym badany nie wiedział, były współpracownikami eksperymentatora. Współpracownikom polecono, aby w pewnych próbach dokonywali jednogłośnie błędnych identyfikacji odcinków odpowiadających wzorcowi. Popełniane błędy były bardzo wyraźne: zamiast zidentyfikować odcinek C jako odpowiadający wzorcowi, osoby podstawione podawały odcinek A.
Asch stwierdził, że badani ulegali presji grupy: 37% ocen podanych przez badanych było błędnych i były to błędy, jakie wprowadzali współpracownicy eksperymentatora. Trzy czwarte badanych uległo presji w co najmniej jednej próbie, a jedna trzecia badanych ulegała w więcej niż połowie prób. Innymi słowy, okazało się, że większość ludzi ulega w swoich ocenach presji grupowej i czyni to nawet w sytuacji, gdy presja ta przeczy w sposób jaskrawy ich zmysłowym spostrzeżeniom.
SPOŁECZNY KONTEKST OCENIANIA
Po zakończeniu badania przeprowadzono wywiady z osobami, które podawały błędne oceny. Spośród nich wyróżnił Asch dwie grupy: jedna to te osoby, które nie spostrzegały żadnej rozbieżności między rzeczywistą długością odcinków a długością sugerowaną przez większość. Wpływ grupy był więc tak silny, że wywoływał poważne zniekształcenia w spostrzeganiu bardzo wyrazistych bodźców. Druga grupa to osoby, które wprawdzie spostrzegały długości odcinków prawidłowo, lecz zostały przekonane, że ich spostrzeżenia są błędne i dlatego przyłączały się do opinii większości. W tym wypadku grupa nie oddziaływała na spostrzeżenia, lecz na procesy myślowe osoby badanej.
W dalszych eksperymentach Asch i jego następcy badali różne czynniki osłabiające konformizm. Podstawowym czynnikiem okazał się tu warunek jednomyślności. Jeżeli sytuację aranżowano w ten sposób, że jedna z podstawionych osób dawała ocenę poprawną, to konformizm był wydatnie zredukowany - utrzymało się tylko ok. V4 poprzednich konformistycznych odpowiedzi. Tak więc jednomyślność jest warunkiem szerokiego ulegania presji grupowej. Ciekawe, że konformizm jest redukowany przez jakiekolwiek naruszenie jednomyślności. Na przykład w eksperymencie Ascha dla wydatnego zredukowania konformizmu wystarczyło, że któryś z członków grupy podawał również odpowiedź błędną, ale niezgodną z opinią większości. Tak więc z perspektywy dysydenta ważne jest istnienie innych (choćby jednego innego) dysydentów, przy czym bez znaczenia jest, czy "inność" ta jest taka sama, czy różna od danej.
Rozmiar zjawiska konformizmu w ocenianiu jest zależny od jeszcze innych okoliczności. Jak potwierdziło to wiele późniejszych badań, jest on jeszcze większy, gdy oceny nie dotyczą tak "narzucających się" danych, jak spostrzeżenia zmysłowe. Jest on tym większy, im trudniej wymierne są oceniane wielkości. Wyobraźmy sobie ocenianie wartości filmu, dzieła sztuki, czyjejś osobowości, talentu, programu partii politycznej.
Rzecz jasna, łatwiej ulegamy konformizmowi w sprawach, w których nie czujemy się kompetentni, niż w sprawach, na których się dobrze znamy. Trudniej skłonić do zmiany opinii na temat wartości estetycznej dzieła sztuki znawcę niż przygodnego klienta sklepu. Łatwiej wmówić cudowne działanie leku pacjentowi niż lekarzowi. (Jakiż ładny stąd morał dla młodzieży:
warto się uczyć, by być ekspertem, by inni nami nie manipulowali!)
Kolejnym czynnikiem mającym wpływ na rozmiar konformizmu jest jakość grupy, która wygłasza opinie niezgodne z naszymi. Im bardziej jest to grupa znacząca dla nas, tj. bliska w sensie emocjonalnym albo też znacząca w sensie autorytetu, jakim ją obdarzamy, tym łatwiej popadamy w konformizm. Zjawisko to jest chętnie wykorzystywane zarówno w marketingu produktów i usług, jak i w marketingu politycznym. Dla pozyskania przychyl-
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
nej oceny produktów czy grupy politycznej zwykło się pokazywać, że produkty owe lub politycy są pozytywnie oceniani przez powszechnie szanowane albo lubiane osoby.
Jednomyślność w sejmie. Jednomyślność była wielce cenionym przymiotem głosowań w parlamentach komunistycznych, w tym w sejmie PRL. Wkładano wiele wysiłku w uzyskanie owej jednomyślności, zwłaszcza w sprawach ważnych. Jednomyślność w sejmie miała unaoczniać jeszcze szerszą jednomyślność - w całym społeczeństwie, określaną jako "społeczno-poli-tyczna jedność narodu". Jak trudno było przeciwstawić się tak "szerokiej jednomyślności", relacjonował były poseł w sejmie PRL, prof. Stanisław Stom-ma, który w roku 1976 zdecydował się jednoosobowo głosować inaczej niż wszyscy pozostali posłowie. Głosowanie dotyczyło zmian w konstytucji PRL. Proponowana zmiana budziła niezadowolenie i protesty w społeczeństwie, gdyż (l) określała status Polski jako niezmiennego sprzymierzeńca ZSRR i (2) formalnie zapisywała kierowniczą rolę PZPR w systemie państwowym. W sejmie jednak, który był naturalnie zdominowany przez partię komunistyczną (PZPR), wywierano ogromną presję na jednomyślne przyjęcie zmian. Rzeczywiście, kiedy przyszło do głosowania, tylko jeden opozycyjny poseł, właśnie prof. Stanisław Stomma, wytrzymał presję jednomyślności i odważył się wstrzymać od głosu. Mówiąc po latach o tym wydarzeniu, Stomma (1991) relacjonuje wątpliwości, jakie go wtedy nachodziły. Pisze:
Wyjątkowo jasno odczuwałem dramat kolizji dwóch polskich realizmów, które nie mają ze sobą styku. Ludzie zamknięci pod kopułą sali sejmowej - i ci wychodzący na mównicę dla odczytania z kartki sztampowego entuzjazmu, i ci słuchający tej bezdusznej aklamacji - czuli tylko rzeczywistość świata zamykającego się pod tą kopułą. A przecież poza murami gmachu sejmowego byla rzeczywista Polska, byl rzeczywisty naród, jakże inaczej myślący niż tutaj ci mówcy i ci kaszlący. A właśnie ten naród, na sali nieuwzględnio-ny, byl w istocie rzeczy siłą dziej otwórczą.
Z drugiej zaś strony ów polski ruch masowy i oddolny, mający w sobie mądrość historyczną, działał, jak działają ruchy tektoniczne, nieświadome i nieukierunkowane. Ileż to razy wysłuchiwałem długich wywodów inteligentów i półinteligentów, którzy nie rozumieli i nie starali się zrozumieć mechanizmów panujących nad polską współczesnością. A przecież życie nasze musiało nieuchronnie być przez te zależności determinowane. A jednak obiektywnie istnieją możliwości oddziaływania na te mechanizmy, kleszcze obiektywnych zależności mogą się zaciskać i mogą też być rozluźniane. Toteż potrzebna jest mądrość polityczna. Nad tym nie zastanawiają się ludzie uznający tylko ruchy tektoniczne.
Tu, w tej sali, w oparach drętwej dyskusji, dominuje po prostu bierna bezmyślność. Ale przecież i tu są ludzie myślący. Oni rozumieją realizm gry
SPOŁECZNY KONTEKST OCENIANIA
politycznej i może jego kunszt posiedli, pochłania ich jednak tylko mały re alizm gry. (Stomma, 1991, str. 161-162).
Podział "mafijnych" pieniędzy. Oto znany oszukańczy chwyt wykorzy stujący zjawisko grupowego konformizmu: Przechodzień znajduje torebkę z za wartością znacznej kwoty pieniędzy. Zastanawia się właśnie, co z nią zrobić gdy mija go inny przechodzień, który zauważa pieniądze i rozterkę pierwszego Pyta, co się stało, i znalazca dosyć spontanicznie wyjaśnia mu całą przygodę Zaczynają zastanawiać się obaj, co z tym zrobić, gdy pojawia się jeszcze j edei przechodzień i znalazca znowu wyjaśnia mu sytuację. Ten powiada, że takż nie wie, co zrobić, ale ma zaprzyjaźnionego prawnika, do którego mógłby za dzwonić i zapytać o radę. W tej samej chwili znalazca zauważa, że w portmo netce znajduje się jakaś kartka, wyjmuje ją i czyta. Z kartki wynika, że pienią dze należą prawdopodobnie do mafii handlarzy narkotyków. Sprawa staje si jeszcze bardziej niejednoznaczna. Ostatni przybysz udaje się do najbliższej budk telefonicznej, dzwoni i po powrocie informuje pozostałych, że jego prawnik ni widzi sensu w zwracaniu pieniędzy mafii, natomiast radzi zachować datek posuniętą ostrożność, gdyż wiadomo, że ludzie ci nie przebierają w środkach Zwraca się do znalazcy z pytaniem, czy godzi się w tej sytuacji na podział pie niędzy między wszystkich trzech uczestników. Znalazca wyraża zgodę, kieru jacy pytanie sam także jest za podziałem, w tej sytuacji również pierwsz przybysz wyraża zainteresowanie podziałem pieniędzy. Teraz ostatni przyby s powtarza, że muszą się jakoś ubezpieczyć, tak by żaden nie zaczai wydawa tych niepewnych pieniędzy przez pewien czas -powiedzmy, przez pół roku (nit bezpieczeństwo rozpoznania ich przez mafię). Proponuje, by się wzajemnie ubei pieczyć w następujący sposób: powinni zaraz udać się każdy do swojego banki i podjąć po 1000 dolarów ze swoich kont, tak by przez najbliższe pól roku pc slugiwać się tylko tą gotówką (oczywiście czeki, karty kredytowe itp. są prze cały czas dopuszczalne). Znalazca natychmiast wyraża zgodę, ostatni przechc dzień też i pierwszy przybysz także. Natychmiast udają się do banku - tak si jakoś złożyło, że wszyscy trzymają pieniądze w tym samym banku. Podejmuj po tysiąc dolarów, (w ustronnym miejscu) każdy pokazuje pozostałym swć tysiąc dolarów i wreszcie dzielą między siebie znalezione pieniądze. W kilk dni po całej akcji ten, który jako pierwszy spotkał znalazcę "mafijnych" pienia dzy, przekonuje się, że wszystkie posiadane przez niego pieniądze, łącznie z ty siącem dolarów, który podjął w banku, są fałszywe.
Pierwszy przechodzień padł ofiarą pary oszustów ("znalazcy" i "trzecie go z uczestników"), którzy całą przygodę zaaranżowali. Oszuści wykorz} stali w swoim scenariuszu m. in. efekt konformizmu grupowego: najpier jednomyślnie podejmując decyzję o podziale znalezionych pieniędzy, a m stępnie decyzję o wzajemnym ubezpieczeniu się (wtedy dokonali podmian prawdziwego tysiąca dolarów z banku na pieniądze fałszywe).
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
4.2. Znaczenie mniejszości
Moscovici, Lagę i Naffrechoux (1969) zainteresowali się, jaki wpływ na oceny grupy może mieć "dobrze zorganizowana" mniejszość. W eksperymencie, w którym uczestniczyły kilkuosobowe grupy, eksperymentatorzy wprowadzali dwie osoby, umówione, żeby wygłaszały pewną niezgodną z rzeczywistością ocenę. Pokazywano mianowicie osobom badanym slajdy w niebieskim kolorze o różnej intensywności i proszono o ocenę ich koloru i intensywności. Osoby "wprowadzone" w pewnych z góry ustalonych momentach twierdziły niezgodnie z rzeczywistością, że slajdy są koloru zielonego. Zauważmy, że w przeciwieństwie do eksperymentu Ascha, gdzie nieprawdziwą opinię wygłaszała jednomyślna większość, tu opinię taką wprowadzała "zorganizowana" mniejszość. Czy taka mniejszość ma szansę być skuteczna? Okazało się, że tak:
32% badanych osób co najmniej raz uległo opinii "zorganizowanej" mniejszości i potwierdzało, że slajd był koloru zielonego. Badanie pokazało ponadto, że skuteczność wpływu "zorganizowanej" mniejszości jest bardzo czuła na zgodność wewnątrz mniejszości. Gdy mniejszość nie zgadzała się i wprowadzone osoby w różnych momentach twierdziły, że widzą kolor zielony, to takie zachowanie nie wpływało na oceny osób badanych. Zatem mniejszość, żeby być skuteczna, musi stanowić zwartą grupę.
Marketing oparty na tworzeniu przywódców opinii. Ważną rzeczą przy wprowadzaniu nowego produktu na rynek jest uzyskanie jego akceptacji przez coraz większą część społeczeństwa. Ogromną rolę w tym procesie odgrywają tzw. liderzy (przywódcy) opinii. Są to osoby cieszące się autorytetem w danej dziedzinie (komputerowej, samochodowej, mody itd.). Częściej niż inni czytują specjalistyczne czasopisma i oglądają programy przeznaczone dla ekspertów w danej dziedzinie. Są zwykle dobrze poinformowane o danej kategorii produktu. Są to ludzie, do których inni zwracają się z pytaniami i prośbą o radę w decyzjach o zakupie. Stąd dla specjalistów od rynku sprawę dużej wagi stanowi dotarcie do nich z reklamą. Niekiedy reklama jest kierowana wprost do liderów opinii: wybiera się ich jako docelowe audytorium, a reklamę umieszcza się w preferowanych przez nich mediach (czasopisma specjalistyczne, programy telewizyjne przeznaczone dla hobbystów). Kiedy indziej działania reklamowe są przeznaczone dla wszystkich konsumentów, ale charakter i sposób opracowania materiałów reklamowych bierze pod uwagę sposób myślenia liderów opinii, tak by ich oceny mogły zostać przekazane innym konsumentom.
Gdy jednak z jakichś powodów niełatwo dotrzeć do "naturalnych" przywódców opinii (trudno ich zidentyfikować albo wykorzystać), firmy tworzą takich przywódców. Wybierają dogodne osoby - na przykład osoby zajmujące centralnie położone mieszkania albo zajmujące jakieś centralne miejsce
SPOŁECZNY KONTEKST OCENIANIA
w danej społeczności lokalnej - i namawiają je do zakupu produktu po bardzo niskiej cenie. Wybrańcy muszą się jednak zgodzić na demonstrowanie produktu w swoim otoczeniu (wśród sąsiadów, w pracy itp.). Tak zorganizowana mniejszość może rzeczywiście doprowadzić do zaakceptowania nowego produktu przez całe szerokie otoczenie.
Spektakularnym przykładem wykreowania liderów i wylansowania produktu jest opisane przez Loudon i Delia Bitta (1993) wypromowanie płyty z nową muzyką pop. Podjęto się mianowicie zrobienia hitu z zupełnie nieznanej piosenki, nagranej przez zupełnie nieznanego śpiewaka. W tym celu wybrano pewną liczbę liceów rozlokowanych w różnych miejscach w kilku miastach, a w tych liceach wybrano przywódców klasowych, sportowych i przywódców różnych grup zabawowych. Do uczniów tych zwrócono się listownie z prośbą, by wzięli udział w spotkaniu, na którym będzie się oceniać pewną nową płytę. (Wybrani nie byli bynajmniej "ekspertami" muzycznymi - raczej zrobiono z nich owych ekspertów). Na spotkaniu zachęcono ich, b^ wzięli (za darmo) ową płytę i odbyli dyskusje na jej temat z kolegami. Ter prosty (i niekosztowny) zabieg przyniósł nadspodziewane wyniki: w miastach, gdzie wykonano zabieg, płyta znalazła się w pierwszej dziesiątce, choć w innych miastach, gdzie nie wykonano zabiegu, nie została ona zauważona
4.3. Jak unikać nacisku społecznego?
Zjawisko ulegania naciskom społecznym jest wszechobecne. Mówią o tyir wprost przysłowia ludowe, w rodzaju: Jeśli wszedłeś między wrony, musisz krakać jak i one. Konformizm wyraża się w ogromnym ujednoliceniu poglą dów w rozmaitych grupach zawodowych i towarzyskich. Obejmuje on wszyst kie tematy: od polityki zaczynając, a na modzie kończąc. Bardzo rzadko po jawiają się jednostki w rodzaju Stefana Kisielewskiego, który pisał: [...] Na suwa się pytanie, czy można i trzeba mieć inne poglądy. Inne niż jakie - zapyta ktoś. Inne niż te powszechnie przyjęte jako aksjomat. Krążą bowierr takie poglądy w konserwie, których kwestionowanie jest po prostu w zlyrr tonie [...]. Spróbujcie mieć coś własnego dopowiedzenia na temat dekoloniza cji lub reform w Kościele, lub wielu jeszcze innych rzeczy [...]. Spróbujcie, po wtarzam, mieć coś własnego do powiedzenia, a chór taki czy siaki, marksi stowski czy katolicki, zakrzyczy was do imentu, waląc przy tym po łbie ma czugą stów-fety szów. (Kisielewski, 1989, str. 387-389).
Elementarnym warunkiem sprzyjającym bezstronnemu ocenianiu jes zapewnienie oceniającemu bezpieczeństwa. Chodzi najpierw o bezpieczeń stwo fizyczne. Rzecz jasna, że sędzia czy jakakolwiek osoba wydająca oceni lub werdykt nie będzie skłonna do bezstronności wtedy, gdy za ową bez
^SYLil-IULULalUZIMb h-UŁAh-M UUtNIANIA l PODEJMOWANIA DECYZJI
stronność może być pobita albo ukarana w inny sposób. Stąd ogromnie ważne jest zapewnienie tego rodzaju bezpieczeństwa oceniającym. Istotnie, kiedy na przykład świadek przestępstwa ma zidentyfikować przestępcę, zapewnia mu się bezpieczeństwo poprzez umieszczenie go za jednostronną szybą.
Ważne jest też uwalnianie oceniającego od opinii i nacisków społecznych. Najprostszym i zarazem najskuteczniejszym sposobem dokonania tego jest zapewnienie anonimowości oceniającemu. Pokazano to w eksperymentach wykonanych według tego samego schematu, co eksperyment Ascha, tj. prosząc badane osoby o ocenę (długości odcinka, wartości estetycznej dzieła sztuki) po wcześniejszym wysłuchaniu ocen innych osób. Okazało się, że konformizm badanych wyraźnie się zmniejszał wtedy, gdy podawali oni swoje oceny anonimowo, tj. bez ich publicznego ujawniania. Zgodnie z tym wynikiem w wielu sytuacjach zapewnia się oceniającym anonimowość. Tak na przykład przy ocenianiu prac naukowych recenzenci prac zgłaszanych do czasopism i wydawnictw pozostają często anonimowi. Oceniany otrzymuje opinię (zwykle więcej niż jedną) i wie, że pochodzi ona od fachowca w danej dziedzinie, ale nie wie, od kogo konkretnie. Postępowanie to uwalnia oceniającego m. in. od obawy narażenia się swojemu koledze czy zwierzchnikowi.
Ciekawe, że przy głosowaniach parlamentarnych panuje tendencja wręcz przeciwna. Bardzo często wprowadza się dyscyplinę klubową, żeby poszczególni posłowie nie mogli się wyłamać z jednomyślności. Czasami idzie się jeszcze dalej i wprowadza się głosowanie imienne, żeby już nikt nie miał wątpliwości, jak dany poseł głosował w danej sprawie. Nie po raz pierwszy widzimy tu odmienność w obyczajach polityków w porównaniu z innymi grupami społecznymi (a także ze zdrowym rozsądkiem!).
II. MYŚLENIE GRUPOWE
Przykład: amerykańska inwazja w Zatoce Świń. 17 kwietnia 1961 roku około 1400 kubańskich uchodźców wspomaganych przez amerykańską flotę, lotnictwo i CIA wylądowało na bagiennym wybrzeżu Kuby w Zatoce Świń. Celem ich było wywołanie buntu i ewentualne obalenie reżimu Fidela Castro. Operacja okazała się dla Amerykanów kompletnym fiaskiem. Żaden z czterech okrętów zawierających zapasy amunicji i żywności dla atakujących nie zdołał wylądować na Kubie. Dwa zostały zatopione przez samoloty kubańskie, dwa inne wycofały się w popłochu. W drugim dniu cała grupa inwazyjna została otoczona przez dwadzieścia tysięcy dobrze uzbrojonych żołnierzy Castro. W trzecim dniu prawie wszyscy, którzy nie zginęli w walce (ok. 1200 żołnierzy) zostali pojmani i osadzeni w więzieniu.
SPOŁECZNY KONTEKST OCENIANIA
Cała ta operacja została zaplanowana przez znakomity zespół polityków i wojskowych amerykańskich (także kierownictwo CIA) z bardzo inteligentnym prezydentem Johnem Kennedym na czele. Dlaczego tak wybitna grupę podjęła tak fatalną decyzję?
Janis (1982), który poddał ten przypadek starannej analizie, pokazuje, że planujący operację w Zatoce Świń popełnili w swoich przewidywaniach ogromną liczbę poważnych błędów. Przede wszystkim przyjęli szereg bezpodstawnych i, jak się okazało, błędnych założeń. Należały do nich:
1. Założenie, że uda się ukryć, iż za operacją, która formalnie była prowadzona przez antykomunistycznych kubańskich uchodźców, stały Stan^ Zjednoczone. Przyjmowano, że ludzie uwierzą w historyjkę wymyślone przez CIA, iż inicjatorami i realizatorami całej operacji są kubańscy przeciwnicy Fidela Castro. Grupa planująca trwała przy tym założeniu wbrew licznym dowodom zaprzeczającym tej historii - m. in. doniesieniom prasy o zaangażowaniu Stanów Zjednoczonych w szkolenie uchodźców kubańskich i inne działania przygotowujące inwazję.
2. Założenie, że kubańskie lotnictwo jest tak niesprawne, iż przed rozpoczęciem inwazji łatwo zostanie wyeliminowane z akcji poprzez zbombardowanie baz. Również to założenie okazało się bezpodstawne. Atak amerykańskich bombowców na bazy lotnictwa kubańskiego spowodował tylkc niewielkie straty i nie zapobiegł skutecznemu atakowi samolotów kubańskich na okręty amerykańskie przewożące zapasy amunicji i żywność:
atakującym Kubę.
3. Założenie, że żołnierze Kubańskiej Brygady (1400 osób) mają tak wysokie morale, iż skłonni są ryzykować życie i dokonać inwazji bez udziału Amerykanów. Tymczasem żołnierzy Kubańskiej Brygady poinformowano, że otrzymają istotne wsparcie w inwazji ze strony armii amerykańskiej, bez czego mogliby nie chcieć ryzykować całego przedsięwzięcia.
4. Założenie, że armia Fidela Castro jest tak słaba i tak źle wyposażona, ii żołnierze Kubańskiej Brygady będą w stanie utrzymać założony po wylądowaniu przyczółek na plaży. I znowu założenie to utrzymywano mimc zdecydowanie odmiennych opinii ekspertów, których raporty mówiła o znacznej sile armii Fidela Castro.
5. Założenie, że inwazja Kubańskiej Brygady spowoduje wybuch powstania na Kubie i doprowadzi do obalenia reżimu Castro. Założenie to było istotne dla decyzji o interwencji, gdyż tylko taka perspektywa czyniła całe przedsięwzięcie sensownym. Równocześnie przyjmowano je bez żadnych wyraźnych dowodów, że społeczeństwo Kuby jest skłonne i gotowe do powstania.
6. Założenie, że jeżeli Kubańskiej Brygadzie nie uda się utrzymać przyczółka, to jej żołnierze będą w stanie dołączyć do partyzantki działającej na
-••«» . ^> . ^. I^I-.-^I^.C.INC rui-fti-rM ^^ci\łiAl\lA l l-'UUhJMOWANIA DFfYZJI
--»,A-,i<W»s*«»i«(tm)»MX..S»*» -»,"-,. .••,..,-. ,, , . . , -'"•-"""^"""-Mlirt UC^ T^-UI
Kubie, w górach Escambray. I to założenie było kompletnie nierealne, Brygada nie miała żadnych możliwości przebicia się w góry.
Tak więc wszystkie istotne założenia, na których opierano plany inwazji, okazały się całkowicie fałszywe. Grupa planująca uległa gigantycznemu złudzeniu, co Janis (1982) nazwał - i nazwa ta się przyjęła - fenomenem grupowego myślenia.
4.4. Symptomy grupowego myślenia
Oto zestaw symptomów myślenia grupowego. Wyrażają się one w następujących złudzeniach:
Złudzenie bezpieczeństwa, które skłania grupę do akceptowania ryzykownych działań przy całkowitym zaniechaniu troski o możliwe negatywne skutki owych działań. Jest to złudzenie podobne do tego, jakiemu ulega gracz, który stawia znaczną część swojego majątku w grze, nie dopuszczając do siebie myśli, że może przegrać i wtedy znajdzie się w nędzy. W wypadku inwazji w Zatoce Świń grupa planująca należała do świeżo zwycięskiej ekipy w wyborach prezydenckich. Przypuszczalnie owo niedawne zwycięstwo wprawiło członków tej ekipy w poczucie wszechmocy własnej i charyzmatycznego przywódcy, jakim był John Kennedy Złudzenie bezpieczeństwa prowadziło do nadmiernego optymizmu w ocenie wielu niepewnych zdarzeń: wiarygodności "historyjki" CIA o tym, że jedynymi inicjatorami i realizatorami całej operacji są kubańscy przeciwnicy Fidela Castro, o słabości lotnictwa Castro, o słabość jego armii itd.
Błędna stereotypizacja ludzi spoza grupy, która skłania do jednostronnego oceniania przeciwnika i osób spoza grupy. Może to być na przykład spostrzeganie przeciwnika jako "ucieleśnienie" zła, który nie ma żadnych pozytywnych cech, z którym wobec tego nie warto negocjować. Często w ten sposób myśli się o przeciwniku politycznym. Może to być stereotypizacja przeciwnika jako słabego czy głupiego, którego łatwo da się wyprowadzić w pole. Często istnieje pokusa, by w ten sposób myśleć o konkurencie ekonomicznym czy o przeciwniku w bitwie. Jak bardzo złudne bywają takie przekonania, doświadczamy, gdy grupa polityczna "ucieleśniająca" zło wygrywa wybory (widocznie wyborcy dostrzegają w niej jakieś pozytywne strony) albo gdy "słaby i głupi" przeciwnik wygrywa z nami konkurencję.
Samocenzurowanie się członków grupy, którzy unikają wypowiadania opinii niezgodnych z większością czy to ze strachu przed ośmieszeniem się, czy też żeby nie marnować cennego czasu. Choćby na zasadzie opisanego wyżej konformizmu - będąc w mniejszości, mamy silną skłonność do
SPOŁECZNY KONTEKST OCENIANIA
- ^#^ww^a^iw?<^^«as^^ia^^
niewyjawiania opinii przeciwnych czy przynajmniej wątpliwości wobec opinii większości. Janis (1982) cytuje, że Arthur Schlesinger - członek grupy planującej inwazję w Zatoce Świń - wyznaje w swoich pamiętnikach, iż na początku uważał całe przedsięwzięcie za niemoralne, ale nie śmiał o tym mówić na spotkaniach z prezydentem.
Złudzenie jednomyślności, które skłania grupę do przeświadczenia, że daną opinię czy ocenę podziela nie tylko większość, ale zgoła wszyscy członkowie grupy. Złudzenie to może łatwo powstawać, gdy opinie niezgodne z większością nie są po prostu wypowiadane. Wówczas milczenie uważa się za zgodę,
Bezpośrednia presja na członków grupy, którzy wyrażają opinię nie zgodną z większością. Zapewne każdy z nas doświadczył sytuacji, kiedy członkowie rodziny, klubu czy innej grupy albo wprost, albo tylko przy pomocy odpowiednich gestów usiłowali przywołać do porządku myślącego inaczej. Schlesinger (wg Janisa, 1982) wspomina, że kiedy wyraził wątpliwość w sprawie inwazji w Zatoce Świń, Robert Kennedy, ówczesny prokurator generalny i brał prezydenta, powiedział mu: "Może masz rację, a może nie masz, ale tak cz^ owak, prezydent już się zdecydował. Więc nie wracaj już do tej sprawy".
4.5. Co doprowadza do myślenia grupowego?
Jako najbardziej typowy zestaw okoliczności sprzyjających powstawaniu fenomenu grupowego myślenia wymienia się następujące elementy:
Spoistość grupy. Przykład planowania inwazji w Zatoce Świń pokazuje że jedną z istotnych okoliczności prowadzących do grupowego myślenia jes1 charakter grupy. Zjawisko to ma tendencję do powstawania w grupie, które;
członkowie znają się wzajemnie, szanują i lubią się oraz chcieliby zachować w grupie zgodę i harmonię. Okazuje się więc, że owe pożądane cechy spajające grupę kryją w sobie istotne niebezpieczeństwo.
Izolacja grupy. Grupy, które popełniały widowiskowe błędy grupowego myślenia, często podejmowały swoje decyzje w głębokiej tajemnicy i w izolacji od zewnętrznego otoczenia. Izolacja zaś nie dopuszcza do ujawnienia si( opinii przeciwnych, a także pozbawia grupę okazji do przedyskutowania własnych opinii ze światem zewnętrznym.
Silny stres. Łatwiej dochodzi do grupowego myślenia wtedy, gdy grupę pozostaje pod wpływem stresu, czyli wówczas gdy: (a) podejmowana decyzje jest dużej wagi (przy decyzjach mniejszej wagi grupa nie stara się aż tal bardzo o jednomyślne przeświadczenie o słuszności wyboru), (b) decyzja jes1 złożona (istnieją wtedy większe możliwości manipulowania znaczeniem róż maitych faktów), (c) krótki jest czas decyzji (przy dłuższym czasie istnieje większe szansę na pojawienie się niezgodnych informacji czy opinii).
PSYCHOLUUICZNfc PUŁAPKI UCbNIANIA l PUUhJMUWANIA DECYZJI
Silne dyrektywne kierownictwo. Grupy, które ulegały błędom grupowego myślenia, często posiadały silnego charyzmatycznego szefa. Szef taki wyraźnie i stanowczo określał preferowane przez siebie rozwiązanie. Zrozumiałe, że jest to okazja sprzyjająca powstawaniu konformizmu i jednomyślności.
4.6. Konsekwencje grupowego myślenia: w jaki sposób dochodzi do fiaska podejmowanych decyzji?
Zjawisko grupowego myślenia prowadzi do wielu niekorzystnych zjawisk. Do najważniejszych z nich należą następujące:
Niekompletne badanie alternatywnych możliwości. Kiedy stajemy przed dowolną sytuacją decyzyjną, mamy na ogół co najmniej kilka możliwości wyboru. Kiedy myślimy o studiach, mamy przed sobą wiele różnych kierunków studiowania. Kiedy szukamy mieszkania, to mamy także wiele możliwości do wyboru. Nawet kiedy zachorujemy, mamy różne możliwości leczenia się (albo i nieleczenia). Rozsądne w takiej sytuacji jest rozważenie tych możliwości i wybranie najlepszej. Janis (1982) pokazuje, że w każdym wypadku wielkiego fiaska związanego z grupowym myśleniem grupa decydująca była od samego początku tak zdeterminowana do podjęcia określonej decyzji, że nie rozważała poważnie żadnej - wobec niej przeciwnej - opcji. Na przykład przy planowaniu inwazji w Zatoce Świń nie rozważano żadnych innych opcji postępowania. Nie trzeba dowodzić, że jest to błąd. Postępując w ten sposób, narażamy się na przegapienie rozwiązań lepszych od tego, które rozpatrujemy.
Niekompletna analiza celów. Oprócz zawężania badanych alternatyw, w myśleniu grupowym zawęża się także analizę celów rozważanego działania. Kiedy w zwykłych warunkach decydujemy się na jakieś działanie, zastanawiamy się nad różnymi celami, jakie to działanie realizuje. Kiedy na przykład wybieramy mieszkanie, myślimy o takich sprawach jak: jego komfort (czy wygodnie będzie się nam w nim żyło), jego walory zdrowotne, estetyczne, jego odległość od miejsca pracy. Poszukujemy mieszkania, które jest atrakcyjne z tych różnych punktów widzenia. Tymczasem w sytuacji myślenia grupowego mamy skłonność do analizowania problemu tylko z jednego punktu widzenia, ze względu na jeden tylko cel, który przytłumia wszystkie inne cele. W przypadku amerykańskiej inwazji w Zatoce Świń owym dominującym celem była pomoc wygnańcom kubańskim w odzyskaniu ojczyzny. Inne cele, takie na przykład jak reputacja Stanów Zjednoczonych na forum międzynarodowym i możliwe straty, były całkowicie ignorowane.
SPOŁECZNY KONTEKST OCENIANIA
Selektywne badanie i przyjmowanie informacji. Kolejnym nieko rzystnym zjawiskiem występującym przy myśleniu grupowym jest selektywne przyjmowanie informacji. Napływająca informacja jest ignorowana albo nie trafnie interpretowana tak, by zgadzała się z przyjętą wcześniej hipotezą Jako skrajny przykład wybiórczego traktowania informacji przytacza Janii (1982) przypadek nieprzygotowania Amerykanów na atak Japończyków m Peari Harbor w roku 1941. Zaskoczenie było tak pełne, że w czasie ataki. większość oficerów przebywała na przepustce (niedziela 8 rano), a obronę była kompletnie nieprzygotowana i Japończycy mogli bez trudu zbombardo wać wszystkie okręty amerykańskie, powodując ogromne zniszczenia. To peł ne zaskoczenie Amerykanów było tym dziwniejsze, że na kilka miesięcy przeć owym atakiem Amerykanom udało się przełamać szyfry japońskie, co dawa ło im prawie nieograniczony dostęp do tajnych informacji. W konsekwencj Amerykanie mieli mnóstwo przecieków o planowanym przez Japończyków ataku. Co z tego, skoro dowództwo marynarki na Hawajach i tak konse kwentnie nie wierzyło i nie przyjmowało do wiadomości, że należy się liczyć z takim atakiem. Kiedy dowództwo to otrzymało meldunki z Waszyngtonu że negocjacje z Japończykami zostały zerwane i że w najbliższych dniacir można się spodziewać agresywnego ruchu ze strony Japończyków, nie przy jęło do wiadomości, że ten ogólny meldunek miałby się odnosić do Hawajów
Pomijanie ryzyka związanego z wybieraną opcją. Jak była już o tyn mowa przy opisie symptomów myślenia grupowego, jedną z cech tego fenomenu jest brak troski o możliwe negatywne skutki planowanego działania Jest to znowu pominięcie bardzo ważnej części analizy sytuacji wyboru. Po dojmując działanie z ryzykiem, czyli takie, że wynik jego nie jest pewny, powinniśmy rozważyć opłacalność podejmowanego ryzyka. Pewnie wielu uzna łoby, że mając wysokie szansę wygrania stu złotych, warto postawić jeder złoty, natomiast mając niskie szansę wygrania stu złotych, nie warto postawić pięćdziesięciu złotych. Ryzyko trzeba kalkulować. Otóż, wbrew tej rozsądnej zasadzie, przy myśleniu grupowym analiza ryzyka jest pomijana. NE przykład przy planowaniu inwazji w Zatoce Świń optymistycznie zakładano że nikt się nie dowie, iż za operacją kubańskich uchodźców stoją Stany Zjednoczone, że ludzie uwierzą w "historyjkę" wymyśloną przez CIA, że kubańskie lotnictwo jest niesprawne itd. Nie oceniono wielkości ryzyka związanego z każdym z tych założeń.
4.7. Jak chronić się przed myśleniem grupowym?
Mówiąc ogólnie, ochrona przed myśleniem grupowym polega na unikami;
okoliczności, które do tego zjawiska prowadzą. Tak więc jednym ze sposo-
64
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
bów jest zdecydowane i wyraźne zachęcanie członków grupy do kwestionowania i krytyki dominującej w grupie opinii - w tym krytyki stanowiska kierownictwa. Propozycję tę łatwo jest sformułować, ale znacznie trudniej zrealizować. Opory powstają z obu stron, zarówno ze strony kierownictwa, jak i ze strony potencjalnych "krytykantów". Ostatecznie nikt z nas nie lubi, gdy się go krytykuje. Ponieważ wszyscy o tym dobrze wiemy, to, poza nielicznymi wyjątkami, nie mamy też ochoty występować w nieprzyjemnej roli "kry-tykanta". Wiele obserwacji wskazuje na to, że niezgadzanie się i krytyka - zwłaszcza w obrębie własnej grupy - są szczególnie niepopularne w Polsce. Moje osobiste doświadczenie dotyczące środowiska naukowego mówi, że za granicą krytyka prac naukowych jest znacznie surowsza niż w Polsce.
Pewnym sposobem ośmielania podwładnych do ujawniania własnych opinii w sprawie jest nieujawnianie na początku dyskusji przez przywódców czy kierownictwo własnych opinii i preferencji. Russo i Schoemaker (1989) zauważyli, że jest to praktyka przyjęta w niektórych firmach japońskich:
jako pierwsi zabierają tam głos pracownicy najniżsi rangą, potem coraz wyżsi, aż do naczelnego szefa. W ten sposób najniżsi rangą nie mają okazji sugerować się opiniami osób postawionych wyżej w hierarchii.
Kolejnym zabiegiem chroniącym przed myśleniem grupowym jest tworzenie konkurencyjnych grup w celu rozwiązania tego samego problemu. Powierzając rozwiązanie zadania różnym zespołom (choćby dwóm), tworzymy szansę powstania różnych punktów widzenia.
Wreszcie postuluje się, by grupy rozwiązujące ważny problem zapraszały na swoje spotkania ekspertów z zewnątrz, w miarę możliwości z innym doświadczeniem, a może także z innej specjalności. Chodzi o to, by mogły się ujawnić opinie niezgodne z autorytetami lokalnymi.
Szczególnej uwagi wymaga też inny aspekt doboru członków do grupy rozwiązującej określony problem. Ważna jest osobowościowa charakterystyka owych ludzi. Nie jest rzeczą dobrą wybierać do takiej grupy wyłącznie osoby miłe, grzeczne, sympatyczne. Pożądane jest, by znalazły się w niej także osoby mniej miłe i sympatyczne, albo nawet zupełnie niemiłe i niesympatyczne. "Straty moralne" związane z obecnością owych niemiłych osób bywają często kompensowane zyskami merytorycznymi w postaci nowych, oryginalnych pomysłów. Stąd warto niekiedy zastosować specjalną ochronę wobec osób zajmujących z natury pozycję tzw. advocatus diauoli, niezgadza-jących się z prawie żadną powszechnie przyjmowaną opinią. Dojrzałe organizacje (na przykład w kościelnych procesach kanonizacyjnych) utrzymują niekiedy specjalną funkcję, którą obejmuje osoba prezentująca taką właściwie postawę.
Znaczenie przyjętej perspektywy:
możliwości manipulowania ocenami ludzi
5.1. Jak przyjęta perspektywa zmienia nasze decyzje?
Ratowanie czy zamykanie zakładu pracy? Zastanówmy się nad wyjściem z następującej sytuacji (opisanej przez Bazermana, 1983):
Producent dużej fabryki samochodów przeżył ostatnio poważne ekonomiczne trudności i znalazł się w sytuacji, w której rozważa możliwość zamknięcia trzech swoich zakładów, w których zatrudnia łącznie 6000 pracowników. Zastępca szefa produkcji przebadał możliwości wyjścia z kryzysowej sytuacji i stwierdził, że możliwe są dwa plany:
Jeśli przyjmie się PLAN A, to zostanie uratowany jeden z trzech zakładów i 2000 miejsc pracy z nim związanych.
Jeśli przyjmie się PLAN B, mamy szansę równą 1/3, że da się uratować wszystkie trzy zakłady i wszystkie 6000 miejsc pracy, ale mamy też szansę równą 2/3, że nie da się uratować żadnego zakładu i żadnego miejsca pracy.
Który plan pan(i) by wybral(a)?
A teraz rozważmy inny wybór:
Jeśli przyjmie się PLAN C, zostaną zamknięte dwa z trzech zakładów i utraci się 4000 miejsc pracy.
Jeśli przyjmie się PLAN D, to mamy szansę równą 2/3, że zamknie się wszystkie trzy zakłady i utraci się wszystkie 6000 miejsc pracy, ale mamy też szansę równą 1/3, że nie zamknie się żadnego zakładu i nie utraci się żadnego miejsca pracy.
Który plan pan(i) by wybral(a) ?
Wykonano specjalny eksperyment, w którym jedna grupa badanych miała przedstawiony wybór między (a) i (b), a inna grupa badanych miała przedstawiony wybór między (c) i (d). Wyniki były zaskakujące: w pierwszej grupie wyraźna większość badanych osób opowiadała się za opcją (a), a w dru-
roT^ni^i-uual^z-i^t f-UŁA^i uutiMiAlllA l 1-'UU1=JMOWANIA DECYZJI
giej grupie wyraźna większość badanych osób opowiadała się za opcją (d). Co w tym dziwnego? To, że wybór (c) jest innym sformułowaniem wyboru (a). Plan (c), który daje pewność, że zamknie się dwa z trzech zakładów i utraci się 4000 miejsc pracy, jest tym samym, co plan (a),że uratuje się jeden z trzech zakładów i 2000 miejsc pracy. Podobnie też plany (d) i (b) są różnymi sformułowaniami tego samego; jeden w kategoriach uratowania, a drugi - zamykania zakładów. Tak więc dwa opisy tych samych wyborów skłaniały badanych do całkowicie różnych wyborów.
Ratowanie czy poświęcanie życia? Tversky i Kahneman (1981) prezentowali grupie studentów następujące zadanie:
Oto w pewnej miejscowości pojawiła się nowagroźna odmiana grypy i przypuszcza się, że spowoduje ona śmierć 600 osób. Wadze tej miejscowości mają dwie możliwości przeciwdziałania: mogą przyjąć PROGRAM l albo PROGRAM 2. Przypuśćmy, że oszacowania ekspertów mówią, że:
Jeśli przyjmie się PROGRAM l, to zostanie watowanych 200 spośród 600 zagrożonych osób.
Jeśli przyjmie się PROGRAM 2, mamy szansa równą 1/3, że uda się uratować wszystkie 600 osób i szansę równą 2/3, żenię uda się uratować nikogo.
Badani studenci mieli zdecydować, za którą możliwością by się opowiedzieli. Większość pytanych wybierała pierwszą opcję-pewnego uratowania 200 osób.
Drugiej grupie studentów opowiadano tę samą historyjkę, ale wybór był następujący:
Jeśli przyjmie się PROGRAM l, to zginie 400 spośród 600 zagrożonych osób.
Jeśli przyjmie się PROGRAM 2, to mamy szansę równą 1/3, że nikt nie zginie i szansę równą 2/3, że zginie wszystkie 600 zagrożonych osób.
W tej grupie większość pytanych opowiadała się za akcją 2. Nietrudno jednak zauważyć, że oba wybory opisują te same opcje i różnią się jedynie sposobem powiedzenia tego samego: uratować 200 spośród 600 osób to przecież to samo, co dopuścić, że 400 pozostałych osób zginie; podobnie przyjąć szansę 1/3, że uratuje się 600 osób, i szansę 2/3, ze nie uratuje się nikogo, to tyle samo, co przyjąć szansę 1/3, że nikt nie zginie, i szansę 2/3, że zginie 600 osób. A zatem znowu wybór zdecydowanie odwraca się w zależności od tego, czy coś zinterpretujemy jako zysk (tu: uratowanie życia), czy jako stratę (tu:
stratę życia). Oto jeszcze jeden przykład.
Zysk czy strata? Przypuśćmy, że spotyka nas następująca oferta: ktoś daje nam 200 złotych i dodatkowo wybór między następującymi dwiema opcjami:
Opcja l. Dostać dodatkowe 100 złotych.
Opcja 2. Rzucić monetą i, w zależności od tego, co wypadnie, dostać dodatkowo 200 złotych albo nic; przyjmijmy - gdy wypadnie orzeł, dostajemy dodatkowo 200 złotych, a gdy wypadnie reszka, nic już nie dostajemy.
Mamy wybrać między tymi dwiema opcjami.
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
Załóżmy teraz pewną modyfikację tej sytuacji: Ktoś daje nam 400 złotych, ale dodatkowo musimy wybrać między następującymi dwiema nieprzyjemnymi opcjami:
Opcja l. Musimy zwrócić 100 złotych.
Opcja 2. Rzucamy monetą i w zależności od tego, co wypadnie, zwracamy 200 złotych albo nic; przyjmijmy - gdy wypadnie orzeł, zwracamy 200 złotych, a gdy wypadnie reszka, nic nie zwracamy.
Znowu mamy dokonać wyboru między dwiema opcjami.
Okazuje się, że w pierwszej sytuacji ludzie zwykle wybierają opcję l., a w drugiej - opcję 2. Nietrudno jednak zauważyć, że obie sytuacje są nie tylko podobne, ale wręcz identyczne, gdy chodzi o podstawowy wybór. Jest to mianowicie za każdym razem wybór między opcjami:
Opcja l. Otrzymać ostatecznie 300 złotych na pewno;
Opcja 2. W zależności od wyniku rzutu monetą otrzymać ostatecznie albo 400 złotych, albo 200 złotych.
Dlaczego przy różnych sformułowaniach tego samego problemu zmieniają się wybory? Tversky i Kahneman (1981), którzy pierwsi zauważyli opisywane zjawisko, sformułowali następujące ogólne wyjaśnienie: ludzie inaczej zachowują się wobec możliwej straty, a inaczej wobec możliwego zysku.
Wyobraźmy sobie sytuację, że ktoś (wspaniałomyślnie) zaproponował nam następujący wybór:
(a) otrzymać 50 zł na pewno;
(b) wziąć udział w loterii, w której wygrywa się 100 zł, kiedy po rzuceniu monetą uzyskamy orła, albo nie wygrywa się nic, kiedy po rzuceniu monetą uzyskamy reszkę.
Jeżeli, Czytelniku, jesteś podobny do większości ludzi, to wolisz (a), czyli raczej coś pewnego niż loterię (b). W wypadku zysków ludzie zwykle unikają ryzyka.
A teraz wyobraźmy sobie nieprzyjemną sytuację, że z jakichś powodów musimy zapłacić karę, przy czym otrzymujemy następujący wybór:
(c) zapłacić 50 zł na pewno;
(d) wziąć udział w loterii, w której traci się 100 zł, kiedy po rzuceniu monetą uzyskamy orla, albo nie traci się nic, kiedy po rzuceniu monetą uzyskamy reszkę.
I znowu, jeżeli Czytelniku jesteś podobny do większości ludzi, to wolisz (d), czyli loterię, w której możesz wprawdzie stracić więcej, ale możesz też nic nie stracić, niż pewną stratę. Gdy w grę wchodzi możliwość straty, ludzie zwykle przejawiają skłonność do ryzyka.
Analogicznie wygląda sprawa w prezentowanych wyżej sytuacjach wyboru. Przy decyzji o zamykaniu zakładów pracy: w pierwszym sformułowaniu mamy wybór między uratowaniem pewnej liczby zakładów i miejsc
68
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
pracy, a w drugim sformułowaniu wybór między utratą (zamknięciem) pewnej liczby zakładów i miejsc pracy. Przy sformułowaniu dotyczącym uratowania pewnych zakładów i miejsc straty naturalnym punktem odniesienia jest zagrażający stan obecny, zamknięcia wszystkich trzech zakładów. Przy sformułowaniu na temat utraty pewnych zakładów i miejsc pracy naturalnym punktem odniesienia jest stan obecny - otwarte obecnie trzy zakłady.
Pierwsze sformułowanie narzuca zatem perspektywę "zysku", problem jest oceniany z perspektywy pozytywnej, a drugie sformułowanie narzuca perspektywę "straty", problem jest oceniany z perspektywy negatywnej. W rezultacie, podobnie jak przy wyborze pewnego zysku pieniężnego i ryzykownej straty pieniężnej, tak i tutaj wolimy (a) niż (b) i zarazem wolimy (d) niż (c). Perspektywa zmienia nasz stosunek do ryzyka.
Tak samo w problemie ratowania - poświęcania życia, badani woleli akcję l., która daje pewność, że uda się uratować 200 osób (pewny zysk), od akcji 2., która daje tylko szansę (równą 1/3), że uda się uratować wszystkie 600 osób. Zarazem badani studenci woleli akcję D, która dopuszczała, że zginie 600 osób, ale też dawała szansę, że nikt nie zginie (strata), niż akcję C, która z pewnością doprowadzi do tego, że zginie 400 osób (pewna strata).
Wreszcie w sytuacji wyboru między: (l) otrzymać 300 złotych na pewno i (2) w zależności od wyniku rzutu monetą otrzymać albo 400 złotych, albo 200 złotych wprowadzono dwa sformułowania narzucające albo perspektywę zysku - gdy dostajemy 200 złotych i możemy jeszcze dodatkowo coś zyskać (pierwsze sformułowanie) - albo perspektywę straty - gdy dostajemy z góry 400 złotych i możemy coś stracić. Nic dziwnego, że zgodnie z powszechną tendencją w tym pierwszym sformułowaniu badani unikali ryzyka, a w tym drugim - poszukiwali ryzyka.
5.2. Inne pieniądze, Inna odwaga
Ile pieniędzy wydamy na rozrywkę? Wyobraźmy sobie, że jesteśmy na urlopie i mamy chęć (i pieniądze), by zagrać w ruletkę czy inną grę hazardową. Jako osoby ostrożne wyznaczamy sobie z góry pewną sumę przeznaczoną na tę zabawę - na przykład kwotę 50 zł i przyjmujemy stanowczą zasadę, że gdy przegramy tę sumę, to absolutnie kończymy grę, gdyż nie stać nas na dalsze straty (trzeba jakoś wrócić do domu). Ale oto spotyka nas niesłychane szczęście. Gra idzie tak dobrze, że nasza wyjściowa kwota potroiła się - mamy w ręku 150 zł. Zastanawiamy się ponownie, co robić. Jesteśmy teraz bogatsi o 100 zł, ale czy jesteśmy aż tak bogaci, żeby w tym momencie przeznaczyć na hazard całe 150 zł? Czy może raczej powinniśmy w dalszym ciągu przyjąć kwotę 50 zł (może powiększoną o 5-10 zł) jako
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
pieniądze "na przepuszczenie", a wygrane 100 zł potraktować jako nieoczekiwany zysk?
Wydaje się, że decyzja będzie zależała od tego, co przyjmiemy jako punki odniesienia: (a) wyjściowy stan naszych pieniędzy i rezerwa 50 zł "na przepuszczenie", która obecnie powiększyła się do 150 zł, czy (b) aktualny star pieniędzy i nowa rezerwa "na przepuszczenie", którą dopiero należy określić. Można się spodziewać, że ten drugi punkt odniesienia byłby łatwiejsza do przyjęcia, gdyby owe dodatkowe 100 zł "przytrafiło się" nam w jakiś inn} sposób (znaleźliśmy je przed wejściem do kasyna). Moglibyśmy wtedy uznać za szaleństwo przeznaczanie tak znacznej części już posiadanych pieniędzy na hazard. Jeżeli tak właśnie czujemy, to znaczy, że różnie traktujemy pieniądze zdobyte w różny sposób.
Zgubiony bilet - zgubione pieniądze. Rozważmy następującą sytuację
Sytuacja A: Wyobraź sobie, że zdecydowałeś się obejrzeć pewien film i w tym celu kupiłeś bilet za 10 zl. Wchodzisz do kina i stwierdzasz, że zgubiłeś ten bilet. Czy wydasz następne 10 zl (zakładając, że posiadasz taką kwotę w kieszeni) na zakup nowego biletu, czy zrezygnujesz raczej z obejrzenia filmu?
A teraz rozważmy nieco inną sytuację:
Sytuacja B: Wyobraź sobie, że zdecydowałeś się obejrzeć pewien film, przy czym biletu jeszcze nie kupiłeś. Wchodzisz do kina i stwierdzasz, że zgubiiet 10 zł. Czy wydasz następne 10 zl (zakładając, że posiadasz taką kwotę w kieszeni) na zakup nowego biletu, czy zrezygnujesz raczej z obejrzenia filmu?
Badania pokazują, że znacznie więcej ludzi deklaruje gotowość zapłacenia dziesięciu złotych w sytuacji B (kiedy zgubili pieniądze), niż w sytuacj A (kiedy zgubili bilet). Jest to o tyle dziwne, że w obu wypadkach ponieśliśmy tę samą stratę, zatem z punktu widzenia zamożności nie powinniśmy zmieniać zachowania w obu sytuacjach. A jednak ludzie zachowują się odmiennie. Jak to wytłumaczyć?
Kiedy straciliśmy bilet, to zakup nowego jest odczuwany, jakbyśmy płacił. za bilet podwójnie. Kiedy straciliśmy pieniądze, to zakupując bilet, nie mam} poczucia ponownego płacenia za bilet. Są to więc dwie różne perspektywy.
A oto inna hazardowa sytuacja, w której ważny jest przyjęty punkt odniesienia (pochodzi od Tversky'ego i Kahnemana, 1981):
Kiedy obstawiamy słabego konia? Graliśmy przez kilka godzin nc wyścigach konnych i nie poszło nam najlepiej: jesteśmy przegrani na 90 zł Jest jeszcze ostatnia gonitwa, w której startuje koń, na którego prawie niki nie stawia. Jego szansę są znikome. Ale dlatego właśnie, gdyby wygrał, te wyplata będzie wynosić 10:1. Czy postawimy na tego konia 10 zł, żeby ewentualnie odrobić sobie poniesione straty?
Podobno ostatnie gonitwy dnia rzeczywiście zawierają większą proporcja takich odważnych zakładów. Gracze, którzy nie postawiliby na taki zakład
70
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
zaczynając grę, decydują się nań wtedy, gdy jako punkt odniesienia przyjmują całkowity dzienny (negatywny) wynik gry na wyścigach. Poniesione już straty stwarzają wówczas sytuację ratowania się przed stratą i czynią graczy bardziej skłonnymi do hazardu.
Na giełdzie (za Bazermanem, 1994). Wyobraźmy sobie następującą sytuację na giełdzie:
Inwestor zakupił kiedyś 100 akcji firmy XYZ po cenie 20 zł. Nie byla to udana inwestycja -po kilku miesiącach cena akcji spadła i ich bieżąca cena wynosi 10 zl za akcję. Firma prowadzi obecnie poszukiwania ropy naftowej, co może się zakończyć albo dużym sukcesem, albo całkowitą klęską. Oceny ekspertów są takie, że jeżeli poszukiwania ropy naftowej zakończą się sukcesem, to cena akcji XYZ wróci do 20 zł za akcję, natomiast jeżeli zakończą się "klapą", to cena akcji spadnie do O zl. Inwestor stoi przed dylematem, czy sprzedać swoje akcje po obecnej cenie 10 zł, czy trzymać je, licząc na ich wzrost do 20 zł za akcję.
O tym, co zrobi inwestor, może przesądzić przyjęty przezeń punkt odniesienia. Gdy jako punkt odniesienia przyjmie on najgorszy możliwy wynik - O zł za akcję, problem obecnej ich sprzedaży staje się wyborem między mniejszym pewnym zyskiem - 10 zł za akcję - i loterią - 20 zł za akcję, gdy poszukiwanie ropy naftowej zakończy się sukcesem, albo O za akcję, gdy poszukiwanie ropy naftowej zakończy się fiaskiem. W sytuacji takiej ludzie, jak wiemy, unikają ryzyka, zatem nasz inwestor przypuszczalnie sprzeda akcje po 10 zł. Ale jest inny możliwy (i chyba bardziej narzucający się) punkt odniesienia: pierwotna cena zakupu akcji, tj. 20 zł za akcję. Gdy inwestor jako punkt odniesienia przyjmie ten wynik, wówczas problem obecnej sprzedaży akcji staje się wyborem między mniejszą pewną stratą - 10 zł za akcję - i loterią - O zł za akcję, gdy poszukiwanie ropy naftowej zakończy się sukcesem, albo 20 zł za akcję, gdy poszukiwanie ropy naftowej zakończy się fiaskiem. W sytuacji takiej ludzie, jak wiemy, poszukują ryzyka, zatem nasz inwestor przypuszczalnie nie sprzeda akcji po 10 zł.
5.3. Co bardziej przykre: wiele małych strat czy jedna strata duża? Co przyjemniejsze: wiele małych zysków czy jeden zysk duży?
Strata. Porównajmy stan naszego ducha w sytuacjach (a) i (b), opisanych (za Thalerem, 1985) poniżej:
(a) Otrzymujemy list z urzędu finansowego z informacją, że w nasze zeznania podatkowe wkradł się pewien błąd i że bez żadnych dodatkowych
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
Wf&wf.': wwwfK^ww :..:•• :,.:,,,.,,:,,,,,,.,<,,...:.^^.,:.:^;::.•.?:•:::a::^B;•aaiał::::•::::ss.;:.:^?;•i:::::::::^^
konsekwencji urząd prosi o dopłacenie przez nas 50 zł. Równocześnie otrzymaliśmy inny list, z którego wynika, że w wyniku sprawdzenie naszych należności wobec spółdzielni mieszkaniowej powinniśmy dopłacić spółdzielni 50 zl.
(b) Otrzymujemy list z urzędu finansowego z informacją, że w nasze zeznania podatkowe wkradł się pewien bląd i że bez żadnych dodatkowych konsekwencji urząd prosi o dopłacenie przez nas 100 zł.
Co jest bardziej nieprzyjemne? Ludzie zwykle bardziej przeżywają dwit (lub więcej) strat małych niż od razu jedną, ale większą stratę. Większa przykrość wynikająca ze strat "rozłożonych" bierze się stąd, że przeżywamy nie proporcjonalnie dużą dyssatysfakcję z drobnych strat. Pokazuje to dolna częś( rysunku 5.1. Istotnie, dyssatysfakcja związana z stratą 50 zł, u(-50 zł), jes1 tam nieproporcjonalnie duża w porównaniu z dyssatysfakcja związaną z stra tą dwukrotnie większej kwoty 100 zł, u(-100 zł). Tak duża, że dwie wartość u(-50 zł) są subiektywnie znacznie większe niż jedna wartość związana z< stratą 100 zł, u(-100zł).
2 x u(-50 zł) > u(-100zł) ^
użyteczność
u (50 zł) u (100 zł)
-tOOzł -60 Zł
50 zł 100 zł
u (-50 zł) U (-100 zł)
Rys. 5.1.
Hipotetyczna funkcja wartości zysków i strat (zaczerpnięta z: Tversky i Kahneman, 1981)
l L. PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Thaler sądzi, że jedną z atrakcyjniejszych stron kart kredytowych jest sumowanie naszych licznych drobnych wydatków w jeden większy wydatek. W ten sposób wydawanie pieniędzy zdaje się nam mniej bolesne.
Zysk. Rozważmy teraz przyjemniejszą stronę życia: Pewnego dnia otrzymujemy dwie przesyłki pocztowe, zawierające przekazy pieniężne - każda w wysokości 50 zł. Jak bardzo to nas ucieszy ? Pytanie: bardziej czy mniej niż otrzymanie jednej przesyłki zawierającej jeden przekaz na 100 zł?
Zgodnie z tym, co pokazuje górna część rysunku 5.1., mniejszy zysk 50 zł, u(50 zł) przynosi nam nieproporcjonalnie dużą satysfakcję (przyjemność) w porównaniu z satysfakcją związaną z otrzymaniem dwukrotnie większej kwoty 100 zł, u(100 zł). Satysfakcja z zysku 50 zł jest tak duża, że dwie wartości u(50 zł) znacznie przewyższałyby jedną satysfakcję związaną z zyskiem 100 zł, u(100zł).
2 x u(50 zł) > u(100zł)
Wynika stąd pewna pożyteczna praktyczna dyrektywa: kupując żonie kwiaty, lepiej przynosić częściej po jednym kwiatku niż rzadziej - po siedem. Podobnie zresztą ma się sprawa z dawaniem wszelkich prezentów:
lepiej rozkładać je na raty niż jednorazowo dawać wielki prezent. Odnosi się to także do wynagrodzeń i wszelkich nagród w miejscu pracy: pracownicy będą w efekcie bardziej usatysfakcjonowani z wielu drobnych podwyżek lub drobnych nagród niż z jednej dużej podwyżki lub jednej dużej nagrody
Inna dyrektywa praktyczna odnosi się do strategii w negocjacjach: bardziej oddziałuje na kontrahenta seria drobnych ustępstw z naszej strony niż jedno duże ustępstwo.
O efektach "sumowania" przykrości i przyjemności wiedział Machiavelli (1993), który radził księciu: [...J Złego należy wyciągnąć wniosek, że zdobywca, opanowawszy rządy, powinien przygotować i popełniać naraz wszystkie nieodzowne okrucieństwa, aby nie wracając do nich codziennie i nie powtarzając ich, mógł dodać ludziom otuchy i pozyskać ich dobrodziejstwami. Kto czyni inaczej, czy to przez tchórzostwo, czy złą radę, jest zmuszony trzymać ciągle nóż w ręku i nie może nigdy spuścić się na swych poddanych, którzy wskutek ustawicznych i świeżych krzywd nie mogą nabrać do niego zaufania. Albowiem krzywdy powinno się wyrządzać wszystkie naraz, aby krócej doznawane, mniej tym samym krzywdziły, natomiast dobrodziejstwa świadczyć trzeba po trosze, aby lepiej smakowały.
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
5.4. Ubezpieczanie się
Hazard czy ubezpieczenie. Mamy do wyboru:
(A) stracić na pewno 50 złotych;
(B) wylosować kulę z poniższej urny i kiedy wyciągnięta kula okaże si<, biała, nic nie stracić, natomiast kiedy wyciągnięta kula okaże się czar na, stracić 200 złotych.
Rys. 5.2.
Urna zjedna kulą czarną i trzema kulami białymi. ^
Większość ludzi skonfrontowanych z tym wyborem wybiera raczej udzia w loterii niż pewną stratę 50 złotych (Slovic, Fischhoffi Lichtenstein, 1982) Wolą więc wziąć udział w loterii, w której można stracić 200 złotych z praw dopodobieństwem 0,25 albo też nic nie stracić z prawdopodobieństwem 0,7i niż na pewno stracić 50 złotych.
A teraz wyobraźmy sobie, że posiadamy cenną rzecz wartości 200 zło tych. Cóż, kiedy znajduje się ona w takim miejscu, że jest duże niebezpie czeństwo, iż mogą nam ją ukraść. Da się ono wyliczyć i wynosi dokładna 25%. Ciągle jeszcze większa jest jednak szansa, że nam jej nie ukradną - szansa na to jest 75%. Agencja ubezpieczeniowa oferuje nam jednak ubez pieczenie: za 50 złotych bierze odpowiedzialność za stratę i w wypadku kra dzieży zwraca tę stratę. Czy ubezpieczymy naszą zagrożoną rzecz? Wiek szość ludzi skonfrontowanych z tym wyborem wybiera ubezpieczenie.
Nietrudno zauważyć, że obie sytuacje - wybór pewnej straty lub udzia w loterii i zapłacenie ubezpieczenia lub narażenie się na ryzyko - stawiajs identyczny w istocie wybór. A jednak ludzie inaczej na nie reagują. O zmia nie wyboru decyduje więc sama zmiana interpretacji czy po prostu nazw^ sytuacji. Dlaczego?
Jesteśmy przyzwyczajeni do tego, że warto się ubezpieczać. Warto dlate go, że myśląc o posiadaniu czegokolwiek wartościowego (mieszkania, samo
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
chodu) w posiadanie to od razu wliczamy stawkę ubezpieczenia - jest to w pewnym sensie naturalny koszt owej rzeczy. Kiedy natomiast myślimy o nieprzyjemnym wyborze między stratą 50 złotych i loterią zawierającą inną stratę, to naszym naturalnym punktem odniesienia jest aktualna sytuacja braku jakiejkolwiek straty.
Bazerman (1994) ilustruje, jak tę naturalną tendencję ludzi do ubezpieczania się wykorzystują firmy. Przy kupnie nowego samochodu klientom oferuje się zakup dodatkowego ubezpieczenia: "za niewiele więcej dolarów miesięcznie nigdy nie będzie pan(i) miał(a) żadnych problemów z naprawami". Według Bazermana mniej więcej połowa Amerykanów kupujących nowe auta zakupuje takie dodatkowe ubezpieczenia. Kto tu robi dobry interes? Bazerman przytacza analizę dokumentacji firmy Nissan. Okazało się, że typowy koszt takiego ubezpieczenia samochodu dla klientów wynosił 795 dolarów. Przeciętne koszty związane z naprawami wynosiły 131 dolarów. 109 dolarów pokrywało koszty administracyjne Nissana. Pozostałe 555 dolarów stanowiły czysty zysk Nissana.
5.5. Wartość czasu i wysiłku
Za ile złotych warto przejść się do dalszego sklepu? Wyobraźmy sobie następującą sytuację:
Sytuacja A: Znajduje się Pan(i) w sklepie i zamierza Pan(i) właśnie nabyć budzik za 20 zł. Czeka Pan(i) na sprzedawcę, żeby zapłacić, gdy wchodzi znajomy i powiada, że identyczny budzik można kupić dwie przecznice dalej za 10 zł. Czy pójdzie Pan(i) te dwie przecznice dalej, żeby oszczędzić 10 zł?
A teraz nieco inna sytuacja:
Sytuacja B: Znajduje się Pan(i) w sklepie i zamierza Pan(i) właśnie nabyć kamerę za 500 zł. Czeka Pan(i) na sprzedawcę, żeby zapłacić, gdy wchodzi znajomy i powiada, że identyczną kamerę można kupić dwie przecznice dalej za 490 zł. Czy pójdzie Pan(i) te dwie przecznice dalej, żeby oszczędzić 10 zł?
Znowu badania pokazują, że znacznie więcej ludzi deklaruje gotowość przejścia do drugiego sklepu w sytuacji A, tj. kiedy kupują zegarek, niż w sytuacji B, czyli kiedy kupują kamerę. Czynią tak mimo braku istotnej różnicy między dwiema sytuacjami: w obu decyzja dotyczy tego, czy chce mi się pokonać opisany dystans, by zaoszczędzić 10 złotych. Jak to wytłumaczyć?
Zróżnicowanie w zachowaniu wynika z nawyku myślenia o kosztach i oszczędnościach raczej w procentach niż w wielkościach absolutnych.
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
5.6. Manipulowanie ocenami poprzez narzucanie perspektywy
Wniosek ogólny, płynący z przytoczonych wyżej (i z wielu innych) badań, jest taki, że opinie i preferencje ludzi pozostają pod ogromnym wpływem sformułowania problemu. Ponieważ jednak często jest sprawą całkiem umowną, jakie sformułowanie przyjmiemy, na przykład czy coś nazwiemy zyskiem, czy stratą, to powstają ogromne możliwości manipulowania ocenami ludzkimi.
5.6.1. Skutki dla pomiaru opinii społecznej
Schuman i Presser (1981) powtórzyli wcześniejsze badanie Rugga i potwierdzili taką oto prawidłowość w badaniach opinii publicznej: zapytano respondentów na dwa sposoby o opinię w sprawie dopuszczalności w Stanach Zjednoczonych publicznych wystąpień przeciwko demokracji. Sformułowania były następujące:
Czy uważasz, że w Stanach Zjednoczonych powinno się pozwolić na publiczne wystąpienia przeciwko demokracji?
Czy uważasz, że w Stanach Zjednoczonych powinno się zabronić publicznych wystąpień przeciwko demokracji?
Około 20% respondentów więcej odpowiedziało "nie" na pierwsze pytanie niż "tak" na drugie pytanie, a więc choć oznaczało to dokładnie to samo, respondentom trudniej było zgodzić się z zakazem niż z pozwoleniem.
5.6.2. Manipulowanie perspektywą w sferze społeczno-politycznej
Oto dla skłonienia kogoś do głosowania za pewną opcją starannie dobiera sif, nazwy dla tych wyborów. "Nazwy się liczą" i wywołują skutki. Na przykłać przeciwnicy aborcji akt ten nazywają zabójstwem, natomiast zwolennicy - prawem do wolności kobiety. Zasiłki dla bezrobotnych można nazywać opieką nad biednymi albo obniżaniem motywacji do pracy itp.
Wzrost bezrobocia czy obniżenie zatrudnienia. Grupie studentów opisywano dwa programy gospodarcze, które różniły się między sobą tym że prowadziły do różnych skutków: (a) do bezrobocia, (b) wzrostu inflacji Przedstawiano studentom następujące skutki każdego z dwóch programów PROGRAM l: prowadzi do 10% BEZROBOCIA i 12% INFLACJI, PROGRAM 2: prowadzi do 5% BEZROBOCIA i 17% INFLACJI. Jak widać, wybór zawiera konflikt między dwiema niepożądanymi rzeczami: wzrostem bezrobocia i wzrostem inflacji. Badani studenci byli proszeni o dokonanie wyboru jednego z tych programów, tego, który uznalib;
za lepszy dla społeczeństwa. Okazało się, że w większość badanych (64%^ wybrała program 2., powodujący niższe bezrobocie.
76
PSYCHOLOGICZNE PUŁAPKI OCENIANIA! PODEJMOWANIA DECYZJI
Innej grupie studentów sformułowano problem w taki oto sposób:
PROGRAM l: prowadzi do 90% ZATRUDNIENIA i 12% INFLACJI, PROGRAM 2: prowadzi do 95% ZATRUDNIENIA i 17% INFLACJI. I znowu badanych proszono o dokonanie wyboru jednego z tych programów, tego, który uznaliby za lepszy dla społeczeństwa. W grupie tej większość badanych (54%) wybrała program l., obiecujący niższą stopę inflacji.
Zauważmy jednak, że w obu grupach prezentowano te same dwa programy: 90% zatrudnienie to przecież to samo, co 10% bezrobocie, a 95% zatrudnienie - to 5% bezrobocie. Tak więc różnica między dwoma sformułowaniami sprowadzała się do tego, że w jednej grupie użyto terminu "bezrobocie" a w drugiej grupie użyto terminu "zatrudnienie". Okazało się jednak, że owa w istocie "bez znaczenia" różnica powoduje całkiem znaczące skutki: większość badanych wybiera albo jeden, albo drugi program.
5.6.3. Wykorzystywanie w marketingu
A oto eksperyment pokazujący możliwość manipulowania wyborami konsumentów:
Mięso w 75% chude czy w 25% tłuste? Levin, Johnson, Russo i Deldin (1985) prosili swoich respondentów, by określili odczuwany poziom satysfakcji związanej z zakupem wołowiny. Opisywali różne kombinacje ceny mięsa i jego jakości. W dwóch grupach badanych używali dwóch różnych sposobów określania jakości wołowiny: w jednej grupie podawali procent "chudości" mięsa, a w drugiej grupie - procent tłuszczu. W jednej grupie mówiono, że mięso jest w 75% chude, a w drugiej, że jest w 25% tłuste. Okazało się, że pierwsza grupa była wyraźnie bardziej usatysfakcjonowana przedstawianymi kawałkami mięsa niż druga.
Thaler (1980) zauważa, że ludzie, którzy nie zdecydowaliby się kupić karty kredytowej, gdyby firma żądała za nią trzyprocentowej opłaty od transakcji, nie mają żadnych oporów przed nabyciem karty, gdy mówi się, że kupując na kartę płaci się normalną cenę, a kupując za gotówkę otrzymuje się trzyprocentową zniżkę. Jest oczywiste, że drugie sformułowanie stanowi inny sposób wypowiedzenia tej samej zasady, o której mówi pierwsze sformułowanie: kupując na kartę płaci się o 3% drożej.
5.7. Jak kontrolować przyjmowaną perspektywę?
Czy można jakoś kontrolować przyjmowaną perspektywę, tak by decyzje nasze mniej zależały od przypadkowego sformułowania pytania, przypadkowego "ustawienia" punktu odniesienia?
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
Świadomość różnych perspektyw. Pierwszym warunkiem kontrol przyjmowanej perspektywy jest świadomość tego, że formułując w pewier sposób dany problem, przyjmujemy jedną z wielu możliwych, a nie jedyne możliwą perspektywę.
Wróćmy do sytuacji nieoczekiwanego zysku 100 zł w kasynie i wybori;
punktu odniesienia dla decyzji, czy "zaszaleć" za 50 zł, czy za 150 zł. Narzucająca się graczowi perspektywa, że oto powiększył sobie rezerwę "na przepuszczenie", nie jest z pewnością jedyna. Uruchamiając wyobraźnię, możne sobie pomyśleć, że pieniądze te znaleźliśmy przed wejściem do kasyna, otrzymaliśmy od bogatego wujka itd. Warto decyzję o dalszej grze odnieść do tyci różnych perspektyw i sprawdzić, czy decyzja nasza przy każdej z nich ulegałaby zmianie. Przypuszczalnie, gdybyśmy wyobrazili sobie na przykład, ż( owe 100 zł stanowi zapłatę za wykonaną niedawno bardzo ciężką pracę, te nie wydalibyśmy tych pieniędzy na dalszy hazard.
Podobnie rozsądne będzie rozważenie różnych perspektyw przez inwestora giełdowego, kiedy zastanawia się, czy sprzedać, czy zachować niepewne akcje. Jeżeli już poniósł stratę na pewnych akcjach, to lepiej zrobi zmieniając "naturalną" perspektywę poniesionej straty na nową perspektywę utrzymywania (czy wręcz zakupu) niepewnych akcji. Uporczywe trzymanie się takiej jedynej perspektywy może bowiem łatwo prowadzić do powiększania straty. Dobrze ilustruje to badanie przeprowadzone przez Mencwels (1996) z inwestorami giełdowymi w Polsce. Dawał on grupie inwestorów na stepujące zadanie:
Inwestor zakupił za sumę 500 zl prawa poboru do nabycia akcji nowej emisji firmy X. W momencie gdy nadszedł czas zapisów, cena akcji X na giełdzie spadla poniżej ceny emisyjnej. Inwestor ma do wyboru:
(1) zrezygnować z zapisania się na akcje nowej emisji,
(2) zapisać się na akcje nowej emisji, wykorzystując zakupione prawa poboru,
(3) kupić akcje X na giełdzie.
Ponad połowa badanych osób zdecydowała się na wykorzystanie prawE poboru (wybór 2), czyli na zakup akcji po wyższej cenie, choć mogli je kupie po cenie niższej. Powodem tego dziwnego zachowania była naturalnie niechęć do zmarnowania wydanych 500 złotych.
Uświadomienie sobie wielości perspektyw jest godne polecenia w wieli:
sytuacjach życiowych. Oczywiście, nie jest to bynajmniej sprawa prosta Zwykle, stykając się z pewną sytuacją, mamy skłonność widzieć ją w pewier sposób i nie zauważamy, że nasze postrzeganie jest tylko jednym z możliwych. Oto pouczający przykład dotyczący kłopotliwego dla firm probierni. skarg konsumentów. Firmy tradycyjnie widziały ten problem jako utrapie nie, z którym trzeba coś zrobić. Trzeba było tworzyć specjalne komórki dc
f O h-bYUMULm-alOZ-IMt fUC-Mr-IM ^UCIlIrtl^lM l ruUtJMUWANIA DECYZJI
przyjmowania skarżących się klientów. Trzeba było tworzyć jakąś politykę traktowania takich klientów. Trzeba było ponosić określone koszty finansowe. Nie przychodziło nikomu do głowy, że problem ten może być postawiony inaczej. Ostatnio jednak Japończycy, a za nimi Amerykanie zauważyli, że problem ten zawiera bardzo atrakcyjny dla firm aspekt. Oto muszą wydawać (i wydają) ogromne pieniądze na badanie upodobań klientów. Organizują stosowne placówki badawcze, które zbierają odnośne dane, itd. A przecież skarżący się klienci sami przychodzą i "za darmo" udzielają potrzebnych informacji. Skargi klientów dostarczają więc bezpłatnej informacji o potrzebach i upodobaniach klientów. Informacja taka jest dla firm bardzo cenna. Zaczęły w tej sytuacji zachęcać i ułatwiać klientom zgłaszanie skarg. Morał ogólny: istniało alternatywne sformułowanie problemu skargi klientów, tylko trudno je było dostrzec.
I jeszcze jeden anegdotyczny przykład (za Plousem, 1993): Żył sobie w pewnym miasteczku krawiec żydowski, któremu dokuczała miejscowa grupa nastolatków. Mieli oni zwyczaj zbierać się przed warsztatem krawieckim i wykrzykiwać: "Żyd", "Żyd"... Naturalnie złościło to krawca, który w końcu obmyślił następujący plan: pewnego dnia wyszedł do nastolatków i ogłosił, że nie chce, żeby wznosili swoje okrzyki za darmo. Od tej pory będzie więc płacił 10 centów za każdy okrzyk: "Żyd", i wręczył 10-centówki nastolatkom. Oferta bardzo się nastolatkom podobała i następnego dnia zaczęli tym chętniej wykrzykiwać "Żyd". Krawiec ponownie wypłacił należności, ale zapowiedział, że od następnego dnia będzie płacił tylko po pięć centów, gdyż nie stać go na więcej. Nastolatkowie byli nieco mniej usatysfakcjonowani niż dnia poprzedniego, ale ostatecznie uznali, że piątka też jest dobra, więc trzeciego dnia znowu zjawili się, wołając "Żyd". Krawiec znowu zapłacił, ale zapowiedział, że nie jest w stanie płacić nawet po piątce i że będzie dalej płacił tylko po jednym cencie. Członkowie gangu zaczęli protestować, że nie będą sobie zdzierać gardei za jednego centa, ale krawiec był nieustępliwy i stanowczo oświadczył, że nie da więcej niż po jednym cencie. Wtedy członkowie gangu oświadczyli, że się nie zgadzają i nie będą kontynuować krzyków za tak marną kwotę.
Krawiec przekształcił wobec nastolatków nieprzyjemną dla siebie sytuację: zamiast wyjściowej motywacji antysemickiej "podsunął" nastolatkom motywację finansową. O ile ta pierwsza wystarczająco motywowała ich do okrzyków, to druga po redukcji wypłat okazała się niewystarczająca dla kontynuacji zachowania.
Wyszukiwanie różnych perspektyw. Świadomość tego, że stając przed określonym problemem, mamy wybór między różnymi sposobami jego sformułowania, narzuca pytanie o to, jak dokonywać tego wyboru. Oznacza to przede wszystkim potrzebę poszukiwania rozmaitych możliwych perspek-
ZNACZENIE PRZYJĘTEJ PERSPEKTYWY
tyw dla danego problemu. W jaki sposób można to osiągnąć? Istnieją różni techniki przydatne do tego celu:
1. Warto wytworzyć w sobie postawę kwestionowania dotychczasowych spo sobów postępowania. Jeżeli stale kupujemy tę samą gazetę, w ten sam spo sób reagujemy na pojawienie się potrzeby (osobistej albo firmy), to warti podjąć wysiłek zastanowienia się, dlaczego tak postępujemy, jaki cel reali żujemy w danym działaniu, czy nie warto spróbować innych sposobów.
2. Korzystanie z "adwokata diabła", by ocenił i skrytykował nasze podej ście. Kłopot z wykorzystaniem takiej osoby polega na tym, że zwykle ni' lubimy osób, które potrafią pełnić tę rolę. Jest naturalne, choć z tej per spektywy niekorzystne, że nie przyjaźnimy się, a nawet nie kontaktuje my się z ludźmi, którzy mają diametralnie inny punkt widzenia niż m w wielu kwestiach.
W sytuacjach konkurencji czy negocjacji godne polecenia jest rozpatrzę nią problemu z punktu widzenia przeciwnika czy konkurenta w biznesie
3. Włączanie ludzi o różnym doświadczeniu i sposobach myślenia do zespo łu zajmującego się danym zagadnieniem. Technika burzy mózgów jes szczególnie przydatna do wydobywania owych różnych perspektyw. Człon kom grupy zadaje się problem i prosi, aby wymyślali wszelkie możliw jego sformułowania. Zachęca się ich, aby pozbyli się wszelkich zahamc wań i zgłaszali wszystkie pomysły, jakie przychodzą im do głowy. Narzuć się przy tym sztywną zasadę, że nie wolno w tej fazie wprowadzać zad nych ocen: chwalić albo ganić zgłaszane pomysły. Dla względów praktyc2 nych, przy jednorazowym wystąpieniu wolno zgłosić tylko jeden pomys. Wolno i należy zgłaszać modyfikacje zgłoszonych wcześniej pomysłów. P tej fazie generowania pomysłów następuje faza ewaluacji, w której sta rannie dokonuje się oceny każdego pomysłu.
Wybór racjonalnej perspektywy i punktu odniesienia. Nie maje kiejś prostej reguły, jak wybierać najbardziej racjonalną perspektywę dziale nią. Wybór jest zależny od dziedziny, a poniekąd też od upodobań wybieraje cego. Na ogół nie jest trudno odgadnąć, jak formułować opinię, by uzyska zamierzone cele. Rozsądek podpowiada, że przekazując sprawozdanie z wy konanej działalności, formułujemy je raczej w kategoriach pozytywnych (c wykonaliśmy) niż negatywnych (czego nie zrobiliśmy). Przeciwnie, kied składamy wnioski o dofinansowanie, będziemy raczej mieli tendencję do poć kreślania braków dotychczasowego wykonania, czyli pokazywania tego, c nie zostało (a powinno zostać) zrobione.
Oczywiście tego rodzaju manipulacja ma swoje granice. Mało przekonuje co brzmiało wyjaśnienie pana Zagłoby, po tym, jak został wzięty ze swon oddziałem przez Bohuna do niewoli (i potem uwolniony przez Wołodyjow
o u
h'bYUMULUUI(^Z:Nfc h'Uł-AI-'KI UUblMIANIAl l--UUbJMUWAIMIA UtUYZLJI
skiego), że był najlepszym dowódcą oddziału, gdyż stracił najmniejszą liczbę żołnierzy.
Przykład pożytecznego przeformułowania problemu w negocjacjach. Tradycyjnie większość negocjacji ujmuje się w kategoriach "zwycię-stwa-straty". Im więcej uda się wytargować jednej stronie, tym więcej traci strona przeciwna. W nowym podejściu, określanym niekiedy jako integracyjne negocjowanie, wychodzi się z założenia, że postępowanie uczestników negocjacji powinno być nastawione na wyszukiwanie obustronnie korzystnych możliwości.
Staranna analiza preferencji uczestników negocjacji pozwala czasami odkryć, że ich cele nie są tak ściśle konkurencyjne, jak to się początkowo wydawało (są w niewielkim tylko stopniu antagonistyczne) i że dla obu można znaleźć rozwiązanie stron lepsze, niż to wynikało z mniej wnikliwej analizy.
Bazerman przytacza za Mary Parker Follet anegdotę, jak to dwie siostry spierały się o jedną pomarańczę, gdyż każda ją chciała mieć. Naturalny kompromis, żeby każda z sióstr otrzymała połowę pomarańczy, spełniał w połowie pragnienia każdej z nich. Kiedy jednak staranniej zbadano preferencje obu sióstr, okazało się, że jedna z nich jest zainteresowana tylko skórką pomarańczy (na konfitury do ciasta), a druga tylko środkiem (na sok). W tej sytuacji podział pomarańczy na skórkę i na resztę okazał się lepszym rozwiązaniem dla obu niż wyjściowy podział po połowie i każda z sióstr mogła zrealizować swój cel w całości.
Naturalnie, nie zawsze jest tak dobrze, żeby obie strony mogły zrealizować swoje cele w całości. Częściej negocjacja dotyczy sytuacji, w której istnieje rzeczywisty konflikt interesów i nie da się zaspokoić w całości pragnień obu stron. Nierzadko jednak staranna analiza preferencji uczestników negocjacji pozwala poszerzyć wielkość puli do podziału, tak by każdy z nich otrzymał więcej tego, na czym mu bardziej zależy.
Znaczenie kontekstu
6.1. Wpływ kolejności pytań na odpowiedzi w badaniach ankietowych
Badania opinii publicznej, a także badania nad postawami, ujawniają zni czenie skutków kontekstu, w tym kolejności zadawania pytań. Kiedy na prz:
kład zadawano Amerykanom jako jedyne pytanie, czy komunistyczni dziei nikarze powinni być wpuszczani do Stanów Zjednoczonych, tylko 55% re pendentów było za. Kiedy jednak pytanie to było poprzedzone pytaniem, c;
amerykańscy reporterzy powinni być wpuszczani do Związku Radzieckieg procent akceptujących wpuszczanie komunistycznych reporterów do Am ryki wzrósł do 75% (Schuman, 1992). Tak więc postawa zajęta przez respo denta wobec danej kwestii zależała od tego, czy została uaktywniona pew:
norma - w danym wypadku norma wzajemności - czy nie.
Tourangeau (1992) przytacza badania nad postawami, w których respc denci udzielali odpowiedzi o swoim stosunku do takich kwestii jak: aborc wydatki socjalne, zbrojenia nuklearne itp. Zanim jednak otrzymali odpowit nie pytania, najpierw odpowiadali na pytania w innych, specjalnie dób:
nych kwestiach. Na przykład, zanim otrzymali pytanie o wydatki socjaŁ musieli odpowiedzieć: jedna grupa na pytania o zobowiązania rządu wól ubogich, a druga grupa - na pytania o znaczeniu indywidualizmu w ekoi mii. Okazało się, że osoby, które wcześniej odpowiadały na pytania o zo wiązania rządu wobec ubogich, znacząco mniej popierały redukcję wyd ków socjalnych, niż to czynili respondenci, którzy najpierw odpowiadali pytania o ekonomiczny indywidualizm (Tourangeau, 1992). Tak więc pos wa zajęta przez respondenta wobec danej kwestii zależała od tego, jaki k tekst został uaktywniony (zobowiązania rządu wobec ubogich bądź eko
miczny indywidualizm).
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
6.2. Ocena serii bodźców: wpływ bodźców poprzedzających
Innym efektem kontekstu jest zależność oceny od jakości bodźców poprzedzających. W rozdziale drugim przedstawiono efekt kontrastu w ocenianiu. Pokazywano, że występuje on przy ocenianiu fizycznych cech osób i przedmiotów, a także rozmaitych wytworów. Uzupełnijmy to jeszcze jednym badaniem.
Daamen i de Bie (1992) przeprowadzili eksperyment dotyczący oceniania prawdopodobieństwa rozmaitych zdarzeń. Znalazły się tam takie zdarzenia, jak:
Jaka jest szansa, że przy losowaniu spośród mieszkańców Holandii (badanie tam się właśnie odbywało) pierwszą wylosowaną osobą będzie kobieta?
Gdyby Holandii zdecydowała się produkować znaczną część swojej energii elektrycznej z węgla (zależmy, że 30-40% całego zużycia), to jaka jest szansa, że spowodowałoby to opady tzw. kwaśnego deszczu?
Jaka jest szansa, że przypadkowo wylosowany Holender mieszka we własnym domu ?
Jaka jest szansa, że przy wydłużeniu godzin nadawania programu telewizyjnego zwiększy się liczba dzieci uzależnionych od telewizji?
Najpierw, w badaniu wstępnym, poproszono trzech ekspertów o ocenę szans każdego z takich zdarzeń. Następnie, w eksperymencie właściwym, różnym grupom badanych osób prezentowano albo więcej bodźców, które w fazie wstępnej uzyskiwały niskie oceny prawdopodobieństwa, albo więcej bodźców, które w fazie wstępnej uzyskiwały wysokie oceny prawdopodobieństwa. Zmieniano także dla różnych grup liczbę kategorii, według których należało oceniać prawdopodobieństwo zdarzeń: wprowadzano albo 5, albo 9 kategorii odpowiedzi.
Poszczególne zdarzenia były prezentowane na odrębnych kartkach, a badana osoba miała każdemu z tych zdarzeń przypisać prawdopodobieństwo. W przypadku skali 5-punktowej kategorie możliwych odpowiedzi obejmowały następujący zestaw: prawdopodobieństwo wysokie, raczej wysokie, średnie, raczej niskie, niskie. W wypadku skali 9-punktowej dodano jeszcze cztery kategorie odpowiedzi - na początku skali pojawiały się kategorie: "z pewnością to się zdarzy" i "prawdopodobieństwo bardzo wysokie", a na końcu: "prawdopodobieństwo bardzo niskie" i "zdarzenie to nie ma żadnych szans."
Oto główny wynik badania: oceny prawdopodobieństwa tych samych zdarzeń były wyższe wtedy, gdy zdarzenia te zostały poprzedzone serią zdarzeń ocenianych we wstępnym badaniu jako mało prawdopodobne, niż wtedy, gdy zdarzenia te były poprzedzone serią zdarzeń ocenianych we wstępnym badaniu jako bardzo prawdopodobne. Różnica w ocenach prawdopodobieństwa dochodziła nawet do 15%.
ZNACZENIE KONTEKSTU
Na przykład przeciętna ocena na 5-punktowej skali zdarzenia, że prz^ losowaniu spośród mieszkańców Holandii pierwszą wylosowaną osobą bę dzie kobieta, wynosiła 4,00 - gdy zdarzenie to było poprzedzane przez serii mało prawdopodobnych zdarzeń - i 3,68 - gdy zdarzenie to było poprze dzane przez serię wysoce prawdopodobnych zdarzeń.
Podobnie przeciętna ocena zdarzenia, że przypadkowo wylosowana Holender mieszka we własnym domu, wynosiła 3,75 - gdy zdarzenie t( było poprzedzane przez serię mało prawdopodobnych zdarzeń - i 3,11 - gdy zdarzenie to było poprzedzane przez serię wysoce prawdopodobnyci zdarzeń.
6.3. Implikacje i wnioski dla badań ankietowych
W związku z oboma opisanymi efektami jednym z naturalnych starań w ba daniach ankietowych jest "rozrywanie" kontekstu. Dla uniknięcia wpływi serii bodźców poprzedzających na ocenę bodźców następnych próbuje sil rozkładać podobne bodźce w różnych miejscach kwestionariusza. Rozwiążą nie to jednak nie jest doskonałe, gdyż przypadkowe rozrzucenie podobnyci pytań w różnych miejscach kwestionariusza może powodować "zagubienie' i rozdrażnienie respondenta. (Nie jest to pożądane, bo respondent może za cząć odpowiadać na pytania niedbale).
Gdy w badaniu ankietowym chcemy śledzić zmianę pewnego trendu w cza się (na przykład zmianę opinii społecznej w kwestii aborcji), to podstawowi sprawą staje się zachowanie w kolejnych powtórzeniach badania tego same go kontekstu pytania. Sam efekt kontekstu nie przeszkadza, o ile w kolej nych badaniach jest on utrzymany w tym samym kształcie. Jeżeli zaten chcemy śledzić zmiany opinii społecznej w jakichś sprawach, to nie możem;
zapominać, że nie można tego robić powtarzając wyrwane z kontekstu pyta nią; zmuszeni jesteśmy powtarzać cały ciąg poprzedzający interesujące na, pytania.
Problem zmienności odpowiedzi ze względu na kontekst nasuwa równie;
bardziej fundamentalne pytanie: jeżeli odpowiedzi ludzi na te same pytani;
są tak uzależnione od kontekstu, to jak wydobyć ich "prawdziwe" opinie A nawet jeszcze bardziej zasadnicze pytanie: czy ludzie w ogóle posiadaj;
owe "prawdziwe" - niezależne od kontekstu - opinie. Wydaje się, że w wieh kwestiach owe "prawdziwe" opinie zgoła nie istnieją. Oto badacze opinii spo łecznej zadają pytania w rodzaju:
Czy uważa Pan(i), że dopuszczalne jest nieznaczne naruszenie (nagięcie prawa przez prezydenta po to, aby chronić jakąś ważną wartość społeczną lul narodową?
Ot l-'bYL;l-IULU>-lHJ2-Nb l-'UŁAh-K.I UOtlMIAIMIA l fUUtJMUWAlMIA DECYZJI
. ' ' ' ^iBfcS^a^fo^^ ^ ^ ' •• . . '
4
w pełni dopuszczalne
Proszę zaznaczyć swoją opinię na skali:
l-----2-----3
całkowicie niedopuszczalne
Znając polityczną polaryzację społeczeństwa polskiego, bez żadnych specjalnych badań można łatwo przewidzieć, że odpowiedzi tych samych osób będą się znacznie różnić, gdy w pytaniu sprecyzujemy na dwa sposoby nazwisko prezydenta:
Czy uważa Pan(i), że dopuszczalne jest nieznaczne naruszenie (nagięcie) prawa przez prezydenta Wałęsę po to, aby chronić jakąś ważną wartość społeczną lub narodową?
Czy uważa Pan(i), że dopuszczalne jest nieznaczne naruszenie (nagięcie) prawa przez prezydenta Kwaśniewskiego po to, aby chronić jakąś ważną wartość społeczną lub narodową?
Oczywiście, można krytykować taką niekonsekwencję. Ale można też przyjąć, że w kwestiach, takich jak ta, ludzie po prostu nie mają opinii abstrakcyjnych, a jedynie "opinie kontekstowe". Można nawet bronić sensowności takich opinii: wszak dobrze wiadomo, że dla różnych polityków inaczej będzie się kształtowało pojęcie wartości społecznej lub narodowej.
6.4. Efekty kontekstu w badaniach marketingowych
Wpływ kolejności pytań ma też swoje nieprzyjemne skutki dla badań konsumenckich. W badaniach tych dokonuje się często pomiaru, jak konsumenci oceniają produkt lub usługę - zarówno w całości, jak też ze względu na jej poszczególne cechy. Kiedy firma wchodzi na rynek z nowym produktem, to najpierw stara się zebrać oceny potencjalnych konsumentów o rozmaitych cechach tego produktu oraz ich ogólną opinię o nim. Jest to podstawowa sprawa, która decyduje o tym, czy produkt warto czy nie warto wprowadzać, ewentualnie, jak go ulepszyć lub w jakiej postaci go wprowadzać itp.
Oto przykład ilustrujący kapryśność ocen konsumenckich (Gross, 1964). Uczestnikom eksperymentu prezentowano nowy produkt, będący kombinacją pióra i ołówka. Główne pytanie dotyczące zakupu tego produktu poprzedzono czterema sytuacjami: (a) brak pytania poprzedzającego, (b) pytanie poprzedzające o zalety produktu, (c) pytanie poprzedzające o wady produktu, (d) pytanie poprzedzające o zalety i o wady produktu. Rys. 6.1. przedstawia procent respondentów "bardzo zainteresowanych" zakupem nowego produktu w czterech sytuacjach.
ZNACZENIE KONTEKSTU
W> •fl
18-r-16--14--12--10--
8--
6"
4--
pytanie poprzedzające o wady produktu
brak pytanie poprzedzające pytania poprzedzającego o zalety produktu
Rys. 6.1.
Procent respondentów bardzo zainteresowanych zakupem nowego produktu w czte rech sytuacjach w eksperymencie Grossa (1964).
W badaniach tych pojawia się kwestia, czy pomiar rozpoczynać od ocer szczegółowych, dotyczących specyficznych cech produktu, a potem pytać o oce nę ogólną, czy wręcz przeciwnie: rozpocząć od pytania ogólnego, a następnu pytać o oceny szczegółowe. Kwestia ta dotyczy zresztą także innych badar ankietowych: czy pomiar opinii rozpoczynać od pytań szczegółowych (nt przykład o akceptację państwowej kontroli cen w różnych dziedzinach), a na stępnie pytać o opinię ogólną (o akceptację państwowej kontroli cen w ogó łe), czy przeciwnie - zaczynać o opinii ogólnej, a później pytać o opinie szcze gółowe. Zwykle zalecany jest porządek od pytań szczegółowych do ogólnyci" - uważa się, że w ten sposób unikamy efektu "aureoli", gdy osoba podając najpierw pozytywną albo negatywną ocenę ogólną dopasowuje do tej opini oceny szczegółowe. Jednakże możliwy też jest wpływ w drugą stronę: doko nanie oceny serii przypadkowo wybranych szczegółowych kwestii może m zasadzie "dostępności" psychicznej wpływać zniekształcaj ąco na ocenę ogól na. Kiedy na przykład pytano grupę ludzi o ich ogólną satysfakcję z życia, te podawane oceny nie korelowały zbytnio z odpowiedziami na szczegółowe py tanie o ich satysfakcję z kontaktów intymnych. Wystarczyło jednak tylko od wrócić kolejność tych pytań, by pojawiła się wyraźna korelacja między obiems kwestiami (im większa satysfakcja z kontaktów intymnych, tym większa ogólns satysfakcja z życia). Dokonanie oceny szczegółowej wyraźnie udostępniało wy korzystanie tej sfery przy ocenianiu kwestii ogólnej (satysfakcji z życia).
^ ^ . ^ , ^, .^i.^^.^^-iNc I-UŁMI-IM UL/CIMIAIMIA l h-UUEJMOWANIA DECYZJI
Bickart (1992), który badał wpływ kolejności pytań na konsumenckie oceny produktów, pokazał, że wpływ ten zależy od poziomu wiedzy badanych. Prowadził on wywiady telefoniczne w sprawie butów sportowych. Dzwonił do dwóch grup ludzi: (a) do członków klubów biegaczy i (b) do ludzi z książki telefonicznej. Pytania obejmowały sprawy dotyczące biegania (na przykład jak dużo ktoś biega), a dalej szczegółowe i ogólne pytania dotyczące butów sportowych, chęci zakupu i wreszcie pytania o wiedzę na temat butów sportowych.
Stwierdzono, że wcześniejsze zadanie szczegółowych pytań o buty sportowe powodowało zmiany w odpowiedziach na pytanie o ogólną ocenę butów. Wpływ ten wyrażał się we wzroście korelacji między ocenami szczegółowymi i ogólnymi. Okazało się jednak, że zależność ta występowała przede wszystkim w grupie respondentów nieobeznanych z produktem. Oceny ekspertów (biegaczy) były względnie niewrażliwe na porządek pytań.
Wynik ten można zinterpretować następująco: przypuszczalnie wiedza o produkcie posiadana przez doświadczonych konsumentów pozwalała im wydobywać pewną informację z pamięci. Mając tę zdolność, mogli oni uniezależnić się w ocenie globalnej produktu (butów) od dostarczanej im przez kontekst (przez szczegółowe pytania) informacji szczegółowej. Z drugiej strony, osoby nieobeznane z produktem, nie były w stanie wydobywać z pamięci żadnej dodatkowej informacji o produkcie i musiały uzależnić się w ocenie globalnej od dostarczanej im przez kontekst (przez szczegółowe pytania) informacji szczegółowej.
Wpływ kolejności pytań na wyniki uzyskiwane w badaniach marketingowych jest sprawą wielkiej wagi. Jeżeli bowiem wykonany pomiar jest nierzetelny, to oparte na nim decyzje mogą się okazać fatalnymi pomyłkami. Można na przykład nietrafnie odczytać, jakie cechy produktu są dla konsumenta najważniejsze, jakie są mniej ważne itd. W rezultacie firma może błędnie inwestować w ulepszanie produktu w takim kierunku, który w oczach konsumenta nie poprawia jego wizerunku.
6.5. Wpływ kontekstu na wybory
6.5.1. Asymetryczna dominacja
Przypuśćmy, że uczestniczymy w wyborach samorządowych i toczy się walka między trzema kandydatami A, B, C. Przyjmijmy, że to, co wiadomo o rozmaitych cechach kandydatów, sprowadza się do porównania ich ze względu na dwa podstawowe kryteria: (I) ogólna bystrość (inteligencja), (II) przyzwoitość moralna (obejmująca takie zalety, jak odporność na przekupstwo,
ZNACZENIE KONTEKSl U
nieuleganie naciskom, punktualność). Rysunek 6.2.a przedstawia porówr nie trzech kandydatów ze względu na dwie wymienione cechy.
najlepszy pośredni najgorszy
A ,C
B
inteligencja
Rys. 6.2.a
Porównanie trzech kandydatów ze względu na ich inteligencję i przyzwoitość morali
Jak widać, ze względu na ogólną bystrość kandydat A jest najlepszy, kg dydat C jest drugi, kandydat B jest najsłabszy; z kolei ze względu na pr;
mioty moralne najlepszy jest kandydat B, kandydat A jest drugi, kandydat jest najgorszy. Którego kandydata wybierzemy?
Załóżmy teraz, że w jakimś innym porównaniu natknęliśmy się na zesi wienie trzech innych kandydatów: A, B, D. Rysunek 6.2.b przedstawia i równanie tych trzech kandydatów ze względu na dwie wymienione cechy
najlepszy pośredni najgorszy
A B D inteligencja
Rys. 6.2.b
Porównanie trzech kandydatów ze względu na ich inteligencję i przyzwoitość morali
Którego z tych kandydatów wybierzemy? Badania pokazują (Tyszka, 19! Payne, 1982), że ludzie mają skłonność w pierwszym wypadku wybierać ks dydata A, w drugim wypadku zaś - kandydata B. Powód tych wyborów ji następujący: kandydat A nie jest pod żadnym względem najgorszy w rozwa:
nej trójce, a co więcej, pod każdym względem (i inteligencji, i moralności) j lepszy od kandydata C. Zupełnie podobnie w wypadku drugim: kandydat B i jest pod żadnym względem najgorszy w rozważanej trójce, a co więcej, I każdym względem (tj. i inteligencji, i moralności) jest lepszy od kandydata Na pierwszy rzut oka wydawałoby się, że rozważany układ wyborów jest w. najlepszym porządku. A jednak zawiera on pewien podstęp. Otóż kandydac i B mogą być w obu sytuacjach dokładnie tymi samymi kandydatami. 1° z co różni obie sytuacje, to dobór trzeciego kandydata. W sytuacji l. znalaz taki kandydat C, który pod względem moralnym był gorszy od obu A i B, a l względem inteligencji "przedzielił" A i B, to znaczy był gorszy tylko o
fS>YL;MULU»JIL;Z;Nt PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
W sytuacji 2. znalazł się dla odmiany taki kandydat D, który pod względem inteligencji był gorszy od obu A i B, a pod względem moralnym "przedzielił" A i B - był gorszy tylko od B. Wniosek końcowy jest o tyle jasny, co niepokojący:
kandydat A ma większe szansę, że zostanie wybrany, jeżeli on sam albo jego zwolennicy "wynajdą" takiego kandydata C, który będzie inteligentniejszy od B (ale nie od A!) i będzie przy tym jak najbardziej wątpliwy moralnie. Z kolei kandydat B ma lepsze szansę, że zostanie wybrany, jeżeli on sam albo jego zwolennicy "wynajdą" takiego kandydata D, który będzie gorszy moralnie od A (ale nie od B!) i będzie przy tym jak najmniej inteligentny. Mówiąc ogólnie, okazuje się, że wybory ludzkie są zależne od kontekstu.
A teraz wyobraź sobie, Czytelniku, że magazyn Twojego sklepu zalegają ręczniki frotte, których z jakichś powodów klienci nie chcą kupować. Próbowałeś już różnych marketingowych zabiegów: promocji, wyprzedaży, ale nic to nie pomogło. Ceny nie możesz już dalej obniżać, bo zszedłbyś poniżej ceny hurtowej i byłaby to jawna strata. W tej dramatycznej sytuacji można jeszcze skorzystać z pewnego sposobu sugerowanego przez tzw. efekt asymetrycznej dominacji. To sposób bardzo prosty - położyć obok "feralnych" ręczników inne ręczniki o identycznej cenie, ale o wyraźnie gorszej jakości. Może to zachęcić klientów do zakupu sprawiających kłopot ręczników. Sugerują to następujące badania:
Simonson (1989) pokazywał osobom badanym zbiory złożone z dwóch podstawowych niedominujących się wzajemnie wyborów i trzeciego wyboru zdominowanego przez jeden z dwóch podstawowych. Na przykład dla gatunków piwa opisanych ze względu na dwie cechy: cenę i szacowaną jakość piwa, pokazywał następujące zbiory:
Zbiór l
Szacowana jakość 65 75 75
Cena sześciu opakowań Gatunek A $1,90 Gatunek B $ 2,80 Gatunek C $3,10
Zbiór II
Szacowana jakość 65 75 65
Cena sześciu opakowań Gatunek A $1,90 Gatunek B $ 2,80 Gatunek D $ 2,20
Rys. 6.3.
Dwa zestawy gatunków piwa opisanych ze względu na dwie cechy: cenę i szacowaną
jakość w eksperymencie Simonsona (1989).
oa
ZNACZENIE KONTEKSTU
Jak widać, w zbiorze I wybór C jest zdominowany przez wybór B, a w zbiorze II wybór D jest zdominowany przez wybór A.
Tabela 6.1.
Procent wyborów tej samej opcji, kiedy nie była ona i kiedy byla wyborem dominującym, w sytuacji oczekiwanego i nieoczekiwanego uzasadnienia wyboru.
Cechy
Oczekiwane
Brak
Opcja
Inna opcja
piwa
uzasadnienie
dominacji
dominująca
dominująca
cena: 1,90
nie
36%
42%
26%
"' jakość: 65
tak
27%
44%
11%
łącznie
31%
43%
19%
cena: 2,80
nie
• 64%
67%
57%
jakość: 75
tak
73%
87%
53%
łącznie
69%
77%
55%
Simonson potwierdził efekt asymetrycznej dominacji: wybór B był częściej wybierany w zbiorze I (gdzie dominował inny wybór) niż w zbiorze II (gdzie nie dominował żaden wybór). Podobnie wybór A był częściej wybierany w zbiorze II (gdzie dominował inny wybór) niż w zbiorze I (gdzie nie dominował żaden wybór). Pokazuje to powyższa tabela, która dodatkowo zawiera jeszcze jeden wynik. Simonson (1989) wykazał, że efekt asymetrycznej dominacji jest nawet większy wtedy, gdy dokonujący wyboru spodziewa się, że będzie uzasadniał swój wybór przed innymi. Wygląda więc na to, że badani uważali, iż fakt wyboru opcji, która dominuje inną w danym zbiorze, jest dobrym argumentem uzasadniającym dokonany wybór.
Simonson i Tversky (1992) pokazali, że efekt asymetrycznej dominacji występuje także przy wyborze dobrze znanych produktów i wtedy, gdy chodzi o wybór prawdziwy, tj. gdy wybrane produkty badani rzeczywiście zabierali do domów. Badanie zorganizowano w ten sposób, że prezentowano konsumentom ręczniki papierowe i chusteczki do twarzy. Dobierano przy tym owe ręczniki i chusteczki w sposób następujący:
(A) ręcznik lepszej jakości - chusteczka lepszej jakości - chusteczka gorszej jakości;
albo
(B) ręcznik lepszej jakości - ręcznik gorszej jakości - chusteczka lepszej jakości.
Tak więc, w zestawie (A) chusteczka lepszej jakości miała w sąsiedztwie chusteczkę gorszej jakości, a w zestawie (B) ręcznik lepszej jakości miał w są-
'^•>-<I->JIVI^V»MIMIA DECYZJI
śledztwie ręcznik gorszej jakości. Dawało to wyraźny skutek: gdy w zestawie znajdował się gorszy ręcznik, to konsumenci chętniej wybierali lepszy ręcznik (a nie lepszą chusteczkę), a gdy w zestawie znajdowała się gorsza chusteczka, to konsumenci chętniej wybierali lepszą chusteczkę (a nie lepszy ręcznik).
Drugie zadanie eksperymentalne tych autorów jest nawet jeszcze bardziej czytelne. Mówiono badanym osobom, że w rezultacie pewnego losowania wygrały sześć dolarów. Ale mają wybór: mogą dostać te sześć dolarów albo eleganckie pióro marki "Cross". Innej grupie osób w tej samej sytuacji dawano potrójny wybór: (a) sześć dolarów, (b) eleganckie pióro marki "Cross", (c) inne (mniej eleganckie) pióro. I znowu modyfikacja z dodatkowym piórem przynosiła skutek: gdy wybór zawierał, oprócz eleganckiego, także nie-eleganckie pióro, to pierwsze było wybierane częściej w zestawieniu z sześcioma dolarami. Wniosek stąd dla marketingu oczywisty: jeżeli chcesz coś sprzedać, to wystaw obok sprzedawanego produktu produkt o identycznej cenie, ale wyraźnie gorszy. Zachęci to do zakupu twojego produktu.
6.5.2. Unikanie opcji skrajnych
Efekt kontekstu może się jeszcze wyrażać w unikaniu opcji skrajnych. Simon-son (1989) przedstawiał osobom badanym zbiory zawierające dwa podstawowe, niedominujące się wzajemnie wybory i trzeci wybór, który był skrajny w taki sposób, że czynił jeden z podstawowych wyborów wyborem kompromisowym. Pokazuje to poniższe zestawienie telewizorów opisanych ze względu na cenę i jakość obrazu:
Zbiór l
Telewizor A Telewizor B Telewizor C
Cena $503 $350 $299
Jakość obrazu 100 85 '80
Zbiór II
Telewizor B Telewizor C Telewizor D
Cena $350 $299 $146
Szacowana jakość 85 80 65
Rys. 6.4.
Dwa zestawy telewizorów opisanych ze względu na dwie cechy: cenę i jakość obrazu, w eksperymencie Simonsona (1989).
ZNACZENIE KONTEKSTU
Jak widać, w zbiorze I wybór A jest skrajny i czyni kompromisowym wybór B, a w zbiorze II wybór D jest skrajny i czyni kompromisowym wybór C.
Okazało się, że ludzie rzeczywiście poszukują możliwości kompromisowej. Jak pokazuje tabela, tę samą alternatywę wybierano rzadziej wtedy, kiedy nie stanowiła ona wyboru kompromisowego.
Tabela 6.2.
Procent wyborów tej samej możliwości, kiedy nie była ona i kiedy była wyborem kompromisowym.
Cechy telewizora
Możliwość nie była wyborem kompromisowym
Możliwość była wyborem kompromisowym
cena: $299; jakość obrazu: 80 cena: $350; jakość obrazu: 85
23% 43%
48% \ 51%
Jak się pokazywać w wyborach politycznych? Tendencja ludzi do unikania opcji skrajnych sugeruje m. in. pożyteczną strategię w wyborach politycznych. Przyjmijmy, że w wyborach prezydenckich startuje czterech kandydatów, których można uporządkować na skali "lewica-prawica", jak to pokazuje poniższy rysunek:
lewica A B C D prawica
Rys. 6.5.a
Uporządkowanie czterech hipotetycznych kandydatów na skali "lewica-prawica".
Tendencja do unikania opcji skrajnych sugeruje prostą strategię dla kandydatów A i D. Nie muszą oni wcale zmieniać swojego stanowiska. Wystarczy "postarać się" o kandydata, który będzie bardziej skrajny od nas. Tak więc kandydat A powinien "poszukiwać" i prezentować się na tle takiego kandydata A', który będzie bardziej od niego lewicowy - por. rys. 6.5.b.
lewica -A'- A B C D prawica
Rys. 6.5.b
Uporządkowanie pięciu hipotetycznych kandydatów na skali "lewica-prawica".
Kandydat D powinien poszukiwać i prezentować się na tle takiego kandydata D', który będzie bardziej od niego prawicowy - por. rys. 6.5.c.
v&. ro i ^rn./i-^un^.iMt ruc-A^M UL;t=rMlAIMIA l PODEJMOWANIA DECYZJI
lewica ---- A --- B ---- C ---- D --- D'---- prawica
Rys. 6.5.C
Uporządkowanie pięciu hipotetycznych kandydatów na skali "lewica-prawica".
Jak przegłosować pożądaną rezolucję? W czasie rządów komunistycznych w Polsce grupa dziennikarzy pewnej redakcji postanowiła wnieść protest przeciwko nadmiernej cenzurze stosowanej w ich gazecie. W tym celu przygotowała rezolucję powołującą się na fakty niedopuszczenia do druku w gazecie tekstów, które gdzie indziej zostały wydrukowane, i domagającą się bardziej liberalnej polityki cenzorskiej. Kiedy jednak rezolucję pokazano innym pracownikom redakcji, okazało się, że jest ona postrzegana jako zbyt ostra, i, autorzy rezolucji doszli do wniosku, że nie zyskają dla niej szerszego poparcia wśród swoich kolegów. A jednak zyskali to poparcie, wykonując następujący chwyt: na ogólnym zebraniu, które zorganizowali, przedstawili trzy rezolucje:
(A) Rezolucję wyrażającą "czołobitną" wdzięczność wobec władzy za "liberalną" politykę cenzorską stosowaną w gazecie.
(B) Rezolucję (swoją) domagającą się od władzy bardziej liberalnej polityki cenzorskiej.
(C) Rezolucję domagającą się od władzy zniesienia wszelkiej cenzury w ich
gazecie.
Otrzymawszy taki zestaw, większość członków redakcji opowiedziała się za rezolucją "nieskrajną".
Znaczenie wcześniejszych opinii:
poszukiwanie potwierdzenia własnych
mniemań
7.1. Argumenty neutralne przemawiające na korzyść wcześniejszego przekonania
Przypuśćmy, że śledzimy wyniki rozgrywek między dwoma mistrzami szachowymi i stwierdziwszy, że szachista A wygrywa częściej, dochodzimy do wniosku, że szachista A jest lepszy od szachisty B. Przyjmijmy też, że szachiści ci rozegrali dwie dalsze partie, z których jedną wygrał A, a drugą - B. Ten dodatkowy wynik ani nie umacnia, ani nie osłabia tezy, że szachista A jest lepszy od szachisty B. Jest to wynik neutralny. A jednak ludzie mają skłonność do umacniania się w swojej wcześniejszej opinii po otrzymaniu takiego neutralnego argumentu. Mają skłonność interpretować argumenty neutralne na korzyść swojego wcześniejszego przekonania.
Pokazano to m. in. w eksperymencie odpowiadającym takiej oto sytuacji:
wyobraźmy sobie, że wybieramy się na wyścigi konne i dowiadujemy się, że bywa tam dwóch ekspertów przewidujących wyniki gonitw, którzy oferują swoje usługi zainteresowanym. Choć obaj są uznanymi ekspertami, ich przewidywania nie są naturalnie zawsze trafne - eksperci, jak wiadomo, czasami się mylą. W rozważanym przypadku statystyka dotychczasowych przewidywań wskazywała, że jeden z ekspertów trafia w około 60% przypadków, a w 40% przypadków się myli, a drugi ekspert jest wyraźnie gorszy i odwrotnie - trafia w około 40% przypadków, a w 60% przypadków się myli. Można to zilustrować tak, jak na poniższym rysunku 7.1., na którym dwie urny mogą wyobrażać dwóch ekspertów. Jedna zawiera 60% kuł białych (reprezentują one przypadki, gdy ekspert przewiduje trafnie) i 40% kuł czarnych
i-ilirtiiift i I-^UCJMUWANIA DECYZJI
XI IM ^\_/
wiaassasssis
sa(tm)@iSisa::aiss3:as;ii?g43Bissw(tm)s;a;a;asa^^^
(przypadki, gdy ekspert przewiduje nietrafnie), a druga odwrotnie - zawiera 60% kuł czarnych i 40% kuł białych.
Wyobraźmy sobie teraz, że udaliśmy się na wyścigi i spotkaliśmy jednego z tych ekspertów, ale nie wiemy, którego: lepszego czy gorszego. Zanim skorzystamy z jego usług, postanowiliśmy sprawdzić, czy to ten lepszy ekspert, który trafia w 60% przypadków, czy też gorszy ekspert, który trafia w 40% przypadków. Jak możemy to sprawdzić? Powinniśmy obserwować jego przewidywania w kolejnych gonitwach. Obserwujemy i stwierdzamy na przykład, że w pięciu kolejnych gonitwach ekspert trafił trzy razy, a dwa razy nie trafił. Zrozumiałe, że skłania nas to do mniemania, że mamy raczej do czynienia z lepszym ekspertem, choć naturalnie nie możemy wykluczyć, że to gorszemu ekspertowi udało się akurat tak trafnie przewidzieć wyniki w trzech z pięciu gonitw. Moglibyśmy nawet spróbować wyrazić nasze przekonanie o tym, że mamy do czynienia z lepszym ekspertem i - korzystając ze skali od 50 (całkowita niepewność, że przewidywania pochodzą od eksperta lepszego) do 100 (całkowita pewność, że przewidywania pochodzą od eksperta lepszego) - przypisać temu przekonaniu jakiś stopień pewności.
Jakikolwiek byłby ten nasz stopień pewności, przypuśćmy, że śledzimy dalej trafność naszego eksperta i stwierdzamy, że w dwóch dalszych gonitwach raz przewidział on trafnie, a raz się pomylił. Jak teraz ocenialibyśmy szansę, że jest to lepszy 2 dwóch ekspertów? Czy teraz nasz stopień pewności co do tego, że mamy do czynienia z lepszym ekspertem, wzrósłby, zmalał, czy pozostał niezmieniony?
Pitz ze współpracownikami (Pitz, Downing i Reinhold, 1967; Pitz, 1969) wykonał specjalny eksperyment, żeby zobaczyć, który z tych przypadków zachodzi, jaka tkwi w nas skłonność. Badacze prezentowali badanym osobom urny o różnej proporcji kulek czarnych i białych. Jedna urna zawierała 60% kuł białych i 40% kuł czarnych, a druga, odwrotnie - 60% kuł czarnych i 40% kuł białych. Losowano kolejno kule z jednej z tych urn (badany nie wiedział, z której) i po obejrzeniu wylosowanej kuli przez badanego wrzucano ją z powrotem do urny tak, żeby nie zmieniać jej składu. Badany zaś po każdym losowaniu miał oceniać szansę, że losuje się z urny z przewagą kuł białych. Badacze sprawdzali, jak zachowują się badani w następującej sytuacji: dotychczasowe losowania dawały przewagę kuł białych, tak że badany uważał, iż jest bardziej prawdopodobne, że losowanie odbywa się z urny z przewagą białych. Następnie wylosowywano dwie dalsze kule, z których jedna okazywała się czarna, a druga biała. W takiej sytuacji badany nie miał żadnych powodów, żeby jakkolwiek zmieniać ocenę prawdopodobieństwa tego, że losuje z urny z przewagą białych. Ów nowy argument był neutralny, jednak większość badanych po uzyskaniu takiego neutralnego argumentu utwierdzała się w przekonaniu, że losuje z urny o przewadze kuł białych.
ZNACZENIE WCZEŚNIEJSZYCH OPINII
Neutralny argument był wykorzystywany stronniczo na korzyść dotychczasowego przekonania.
URNA l URNA!!
Rys. 7.1.
Urny do losowania kulek w eksperymencie Pitza, Downinga i Reinholda (1967).
Lord, Ross i Lepper (1979) pokazali tę samą tendencję w nieco bardziej naturalnych warunkach. Wyselekcjonowali oni dwie grupy osób: takie, które były za utrzymaniem kary śmierci, i takie, które były przeciw stosowaniu tej kary. Następnie osobom z obu grup przedstawiono pewien materiał na temat efektywności stosowania kary śmierci, w zapobieganiu przestępstwom. Każda osoba czytała dwa raporty: jeden zawierał argumenty ukazujące efektywność stosowania tej kary, drugi - jej nieefektywność. (Jeden porównywał nasilenie morderstw w różnych stanach przed i po wprowadzeniu kary, śmierci. Drugi porównywał nasilenie morderstw w stanach, które wprowadziły karę śmierci i które jej nie wprowadziły). Badani byli proszeni o ocenę tego, jak bardzo przekonujący był każdy z dwóch materiałów. Okazało się, że każdy uważał za bardziej przekonujący ten z materiałów, który był zgodny z jego przekonaniem. Po lekturze postawy grup zamiast spodziewanego zbliżenia (ze względu na dwustronność wysłuchanej argumentacji) jeszcze bardziej się spolaryzowały (każdy umocnił się w swoim pierwotnym przekonaniu).
Podobne efekty dają się łatwo obserwować w debatach politycznych czy rozprawach sądowych. Na przykład twierdzenia eksperta, że nie da się jednoznacznie ustalić, czy oskarżony był, czy nie był pijany, skłania oskarżenie do wniosku, że był pijany (i tylko nie da się tego ustalić), a obronę - do wniosku, że nie był pijany (i dlatego właśnie ekspert nie mógł stwierdzić tego stanu).
l-'bYUMULm-3lU^.Nfc 1-'UŁAI-'KI UCbNIANIA l I-'UUbJMUWANIA DECYZJI
7.2. Ludzie przejawiający uporczywe trwanie przy raz ustalonych ocenach
Brunner i Potter (1964) pokazywali badanym serię obrazków na slajdach. Każdy slajd pokazywano wiele razy. Pierwsze pokazy były bardzo niewyraźne (nieostre), tak że trudno było zidentyfikować wyświetlany obiekt, po czym ostrość wyświetlania coraz bardziej się poprawiała. Po każdym wyświetleniu badany miał podać swoje przypuszczenie, co widział na obrazku. Stwierdzono, że wczesna (błędna) identyfikacja utrudniała później prawidłowe odczytanie obrazków - badani mieli skłonność pozostawać przy swoich wcześniejszych hipotezach, mimo że w dalszych prezentacjach obraz był dostatecznie klarowny. (Grupa, która od razu zaczynała oglądać ostrzejsze obrazy, nie miała żadnych kłopotów z ich prawidłową identyfikacją.) Tak więc wcześniejsze błędne domniemanie utrudnia przyszłe prawidłowe rozpoznanie.
Kapłan (1973) podzielił grupę badanych osób na dwie części: tych, którzy deklarowali przekonanie, że inni ludzie są na ogół dobrzy, oraz tych, którzy deklarowali przekonanie, że inni ludzie są na ogół źli. Następnie jednym i drugim pokazywał opisy pewnych osób zawierające w połowie pozytywne, a w połowie - negatywne przymiotniki. Badani mieli oceniać opisywane osoby i dodatkowo określać, jak ważna jest każda z cech opisujących daną osobę. Okazało się, że ci, którzy deklarowali przekonanie, że inni ludzie są dobrzy, uważali przymiotniki pozytywne za ważniejsze od negatywnych (przymiotniki negatywne stanowiły dla nich informacje sprzeczne z hipotezą, a przymiotniki pozytywne stanowiły informacje zgodne z hipotezą). Ci, którzy deklarowali przekonanie, że inni ludzie są źli, uważali przymiotniki negatywne za ważniejsze od pozytywnych (przymiotniki pozytywne stanowiły dla nich informacje sprzeczne z hipotezą, a przymiotniki negatywne - informacje zgodne z hipotezą).
Konsekwentnie też w obu grupach przymiotniki oceniane jako mniej ważne (sprzeczne z hipotezą) miały mniejszy wpływ na ostateczną ocenę globalną pewnej hipotetycznej osoby niż przymiotniki oceniane jako ważniejsze (zgodne z hipotezą). Chociaż obie grupy otrzymywały te same zestawy przymiotników, badani o oczekiwaniach pozytywnych formułowali oceny globalne wyższe od tych badanych, którzy mieli negatywne oczekiwania wobec innych ludzi.
7.3. Uprzedzenia
Trzymanie się raz przyjętych przekonań czy ocen ma swoje konsekwencje dla różnych sfer życia społecznego. Szczególnym przypadkiem wcześniej
ZNACZENIE WCZEŚNIEJSZYCH OPINII
wytworzonych przekonań są uprzedzenia (rasowe, klasowe itp.) W okresie kiedy w Stanach Zjednoczonych istniały znaczne uprzedzenia rasowe, znany psycholog Allport (1954) przeprowadził następujący pouczający eksperyment. Pokazywał badanym osobom rysunek przedstawiający grupę osób w metrze. Jedna z tych osób trzymała w ręce brzytwę, którą terroryzowała inną osobę. Brzytwę trzymał Biały, a obok znajdował się Murzyn. Wiele jednak osób (przypuszczalnie uprzedzonych do Murzynów) zapamiętało rysunek w ten sposób, że to Murzyn groził brzytwą Białemu.
W innym eksperymencie sami badacze dokonali manipulacji uprzedzeniem, tak żeby przekonać się o jego skutkach. Langer i Abelson (1974) odtwarzali badanym wywiad przeprowadzony z pewną osobą. Połowa badanych była przy tym informowana (uprzedzana), że jest to wywiad prowadzony z osobą ubiegającą się o pracę, a druga grupa badanych była informowana, że jest to wywiad z osobą, która ma być przyjęta do szpitala psychiatrycznego. Choć był to w obu przypadkach dokładnie ten sam wywiad, to wytworzony w obu grupach obraz osoby drastycznie się różnił. Te same fakty uzyskiwały zupełnie różną interpretację. Na przykład fakt, że osoba kłóciła się z poprzednim kierownikiem był w przypadku ubiegania się o pracę interpretowany jako przejaw niekoniunkturalnego trzymania się własnych przekonań, a w wypadku wywiadu psychiatrycznego -jako przejaw nieumiejętności utrzymywania pozytywnych kontaktów społecznych.
Uprzedzenia, a szczególnie stereotypy, są celowo wytwarzane, a następnie wykorzystywane zarówno w marketingu produktów i usług, jak i w marketingu politycznym. Firmy starają się zwykle ustalić, w jakim zakresie prowadzona przez firmę działalność jest lepsza od działalności konkurencji, pc to by pozytywnie wyróżnić się wśród innych (jest to tzw. umiejscowienie produktu na rynku). Konkurencyjność tę uzyskuje się na ogół poprzez utrzymanie przewagi pewnych cech produktu (naturalnie cech ważnych dla konsumentów), a przynajmniej poprzez przekonanie konsumenta o istnieniu takiej przewagi. Dla niektórych produktów (na przykład dla samochodów) kraj produkcji jest takim właśnie stereotypem wykorzystywanym przez konsumentów do wnioskowania o jakości produktu - niemieckie samochody uważane są za bardziej trwałe od innych. W ten sposób produkty danej marki uzyskują wyraźnie określony wizerunek - na przykład że samochód danej marki jest najlepszy na rynku ze względu na trwałość, bezpieczeństwo szybkość itd.
Wizerunek ten tworzy się poprzez odpowiednie zabiegi: reklamę, opakowanie. Jeśli zachodzi taka potrzeba, firma stara się o zmianę dotychczasowego wizerunku. Samochód Volvo, który przez wiele lat na rynku amerykańskim kojarzył się przede wszystkim z bezpieczeństwem, w pewnym momencie (kiedy segment rynku zainteresowany przede wszystkim bez-
l-'aYCI-l(JLU(JICZ:IMt: l-'UŁAh'M UCtNIANIA l h'UUbJMUWANIA DECYZJI
pieczeństwem samochodu zaczął się kurczyć) zaczął poprzez odpowiednie reklamy zmieniać stereotyp w kierunku szybkości.
Podobne stereotypy tworzą się także na scenie politycznej. Na polskiej scenie politycznej Unia Wolności wykreowała wizerunek partii rozważnej i odpowiedzialnej. Posiadanie pozytywnego wizerunku jest ogromnie korzystne zarówno na rynku produktów i usług, jak i na scenie politycznej. Jeżeli nawet jakiś produkt renomowanej marki albo jakiś polityk cieszącej się zaufaniem partii zawiodą, to konsumenci lub wyborcy przejdą nad tym do porządku dziennego, interpretując dany przypadek jako wyjątkowy.
Bodenhausen i Wyer4 (1985) pokazali, że nasze uprzedzenia (stereotypy) mogą mieć całkiem poważne konsekwencje - mogą na przykład wpływać na podejmowane decyzje dotyczące innych ludzi. Dawali oni studentom (fikcyjne) akta więźniów i prosili o podjęcie decyzji o warunkowym zwolnieniu danego więźnia. Zastosowali przy tym manipulację dotyczącą stereotypów. W jednych przypadkach popełnione przestępstwo przypisywali osobie, do której ono "pasowało": na przykład kiedy Amerykanin meksykańskiego pochodzenia (i z meksykańskim nazwiskiem) dokonał napadu albo kiedy osoba pochodzenia anglosaskiego, należąca do wyższej klasy, popełniła defraudację. W innych przypadkach przestępstwa były niedopasowane do przestępcy. Okazało się, że owo dopasowanie do stereotypu całkiem wyraźnie wpływało na podejmowane przez studentów decyzje dotyczące warunkowych zwolnień. Gdy przestępstwo było zgodne ze stereotypem przestępcy, studenci byli bardziej surowi - mniej chętni do udzielenia warunkowego zwolnienia. Ignorowali też inne ważne informacje, takie jak dobre sprawowanie w więzieniu. Byli natomiast bardziej życzliwi wobec przestępców, których przestępstwa nie były zgodne ze stereotypami.
7.4. Utrzymywanie się mitów i bezpodstawnych mniemań
Inną konsekwencją trzymania się raz przyjętych przekonań jest utrzymywanie się mitów i bezpodstawnych mniemań. Pouczające jest tu utrzymywanie się wierzeń we wróżby. Wanda Markowska (1968), pisząc o wróżbach w starożytnym Rzymie, powiada: Żaden ważniejszy akt państwowy, zgromadzenie ludowe, posiedzenie senatu, bitwa czy sądy nie mogły się odbyć, zanim nie złożono bogom przepisanych rytuałem ofiar i nie zasięgnięto ich rady. Dlatego też wielką rolę w wierzeniach Rzymian odgrywały wszelakiego rodzaju wróżby, mające na celu odgadywanie woli bogów. Powszechna bowiem byla wiara, że bogowie zsyłają ludziom rozliczne znaki i przestrogi, trzeba je
4 W opisie eksperymentu skorzystatem z przedstawienia go w książce Aronsona (1995).
ZNACZENIE WCZEŚNIEJSZYCH OPINII ^ ^^
tylko umieć odczytać i należycie wytłumaczyć. W huku gromów, lśnieniu bly skawic, w locie ptaków, w kształcie chmur płynących po niebie, w dymie pło nących ofiar, we wnętrznościach zwierząt zabijanych na ołtarzach, w tysiąci zjawisk zachodzących na niebie i ziemi objawiają bogowie swe wyroki. [... Zanim Rzymianin powziął jakieś ważne postanowienie, nim wyruszył w pod róż, wszedł w związki małżeńskie czy rozpoczął siewy lub żniwa, pilnie ba dal, jakie też znaki zsyłają mu bogowie, pomyślność mu wróżą czy też niepo wodzenie w jego przedsięwzięciu. Cóż dopiero, gdy wojsko miało wyruszyć nt wroga! Już na długo przed wyprawą zasięgano rady augurów, jaki dzień p(. temu będzie najszczęśliwszy, były bowiem dni pomyślne (dies fasti) i dni nie pomyślne (dies ne fasti) albo zgoła "czarne" (atri), feralne, wróżące nieszczę ście, kiedy nie wolno było podejmować żadnych ważniejszych aktów publicz nych, sprawować sądów, odbywać zgromadzeń ludowych i wydawać bitew.
Wszystkie te praktyki i silne przekonanie o skuteczności wróżb utrzymy wały się mimo występowania niewątpliwych przypadków ich zawodności Spotykając owe "niezgodne przypadki", Rzymianin poszukiwał raczej szcze gólnych okoliczności odpowiedzialnych za pomyłkę (na przykład nietrafni odczytanie rady bogów, niedopełnienie pewnych wymagań stawianych prze;
bóstwo), niż dopuszczał myśl o bezpodstawności wierzenia we wróżby.
Inną pouczającą ilustrację trzymania się przez ludzi raz przyjętych prze konań zawiera fragment pamiętnika dr Sabiny Skopińskiej (Pamiętniki Le karzy, 1939, str. 57-58).
Ludność byla przyzwyczaj ona leczyć się swoimi lekami. Zgłaszano się wię< do mnie, abym zapisała "krople św. Jakuba", "krople św. Genowefy", no i o za pisywanie wielkiej ilości smarowań. Prawie nie było chorego, którego by co;
nie "żgaio", a na "zganić" nie pomagały leki wewnętrzne, tylko "smarowa nie". Pomalutku stawiałam kroki w tym gąszczu przesądów i wierzeń ludo wych. Stosy tłuczonych pod apteką butelek były dla mnie pouczające. Do cho rego trzeba trafić. Trzeba za wszelką cenę wzbudzić jego zaufanie do siebie Rozumiałam to wprost intuicyjnie. Dlatego też nigdy nie bagatelizowałam tego, co chory mówił, choćby to były największe głupstwa i przesądy. Nu mogłam co prawda sprowadzić swojej wiedzy do tępego zapisywania poć dyktando "kropli dziewięciorakich", "amolu" i "ekpelerra" na "zgonie" orai maści zielonej na rany. Przede wszystkim nie rozumiałam z początku, o jaku leki w ogóle chodzi, gdyż wykłady farmakologii na Uniwersytecie Warszawskim nie uwzględniały tego rodzaju receptury. Dopiero aptekarz pouczył mnie że pod postacią "kropli dziewięciorakich" można zapisywać wszelkie leki o podstawie kropli walerianowych na eterze. Pierwsza trudność wówczas znikła. Mieszając z kroplami walerianowymi na eterze inne leki, mogłam jui leczyć bez uszczerbku zdrowia chorego, zgodnie z całą swą wiedzą, cały szereg różnych cierpień, serca, przewodu pokarmowego i układu wspólczulnego
l W
rST^I-lULU^IOZ-IMt ^UŁA^M U^tNIANIA l l-'UL>bJMUWANIA DECYZJI
Chory wierzył, że ma zawsze same "krople dziewięciorakie" lub "troiste", bo lekarstwa zawsze "zalatywały" eterem.
7.5. Czy można "zatrzeć" raz otrzymaną informację?
Oto pojawiła się informacja, że angielska wołowina jest niebezpieczna: krowy angielskie chorują na encefalopatię gąbczastą (tzw. chorobę wściekłych krów), która może mieć związek z chorobą spotykaną u ludzi o podobnych objawach, chorobą Creutzfeldta-Jakoba. Konsumenci powszechnie zaczynają powstrzymywać się od spożywania angielskiej wołowiny. Niebawem pojawia się sprostowanie, że informacja nie jest rzetelna i nie ma bynajmniej przekonujących dowodów na to, iż angielska wołowina jest rzeczywiście niebezpieczna. Nic to jednak nie pomaga, konsumenci nadal powstrzymują się od spożywania angielskiej wołowiny, a bardziej ostrożni - od spożywania wołowiny w ogóle. Producenci wołowiny w innych krajach europejskich wywierają nacisk na swoje rządy, żeby angielska wołowina nie była dopuszczana na ich rynki (nawet gdyby nie chcieli "pognębić" swoich konkurentów angielskich, muszą ratować reputację własnej wołowiny). Rząd angielski musi nakazać zniszczenie "podejrzanych" krów, niezależnie od jakości dowodów na to, że krowy angielskie są zarażone.
Podobny los spotkał tych, którzy usiłowali wprowadzać osoby zarażone wirusem HIV w normalne życie. Szerząca się informacja, że wirus zakaża całe otoczenie chorego, powodowała, iż społeczności lokalne nie chciały zaakceptować budowy na swoim terenie ośrodków dla chorych na AIDS. Nie pomagały tu żadne akcje uświadamiające, zwłaszcza że jeżeli ktoś sam nawet rozumiał, iż zagrożenie wynikające z takiego sąsiedztwa nie istnieje, to jednak bywał nierzadko w sytuacji przymusowej. Na przykład, prowadząc jakiś interes, bał się, że przekonanie innych o niebezpieczeństwie związanym z sąsiadowaniem z chorymi na AIDS spowoduje, że jego produkty nie znajdą odbiorcy.
Ową niechęć do zmiany raz przyjętych ocen pokazano w specjalnie przeprowadzonym eksperymencie. Sędek, Kofta i Tyszka (1993) dawali do wyboru badanym licealistom pięć filmów: mieli oni otrzymać bilet na wybrany przez sobie film. Badanym mówiono przy tym, że filmy te mają swoje oceny ze względu na 10 różnych aspektów (intryga, wartkość akcji, gra aktorów ^P.) - rzekomo pochodzące od krytyków filmowych, ale naprawdę oceny te były przypadkowo przypisane filmom, tak by "w sumie" wszystkie filmy miały mniej więcej wyrównaną atrakcyjność.
Nie wszystkie jednak oceny były od początku znane badanym. Eksperyment przebiegał w taki sposób, że badany w kolejnych trzech fazach otrzy-
ZNACZENIE WCZEŚNIEJSZYCH OPINII U
mywał coraz więcej informacji o filmach i zapoznawał się z coraz większe liczbą ocen, aż przed ostatnim (i ostatecznym) wyborem otrzymywał po prostu wszystkie informacje o wszystkich filmach (5 filmów x 10 ocen o każdym). Badany w kolejnych fazach (a) wskazywał film, na który chciałby otrzymać bilet, oraz (b) dokonywał oceny atrakcyjności każdego z pięciu filmów W kolejnych fazach mógł naturalnie zmienić zarówno wcześniejszy wybór jak i swoje wcześniejsze oceny atrakcyjności każdego z pięciu filmów.
CHARAKTERYSTYKI FILMÓW
FILM A
FILM B
FILM C
FILM D
FILM E
atrakcyjność aktorów grających w filmie
ciekawość intrygi
gra aktorów
jakość muzyki
scenografia [artistic setting)
humor
prawda psychologiczna
żywość akcji
utrzymywanie w napięciu
wzbudzanie emocji
Rys. 7.2.
Prezentacja filmów w eksperymencie Sędka, Kofty i Tyszki (1994).
Ponieważ w kolejnych fazach filmy stawały się coraz bardziej podobni pod względem ogólnej atrakcyjności, to można było oczekiwać, że oceny atrakcyjności filmów w owych fazach będą się zbliżały. A jednak, jak to pokazuje rysunek 7.3., wbrew tej "wyrównującej" informacji okazało się, że w kolejnych fazach rosły wyraźnie oceny atrakcyjności wybranego filmu i zwiększała się różnica w ocenie atrakcyjności wybranego filmu i następnego poć
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
względem atrakcyjności filmu niewybranego. Działo się tak również w trzeciej fazie, kiedy odkrycie całej tabeli pokazywało, iż wszystkie filmy mają swoje za i przeciw i że są jednakowo atrakcyjne. Informacja te nie tylko nie zmniejszyła, ale przeciwnie właściwie - zwiększyła rozpiętość w ocenie atrakcyjności filmu wybranego i jego konkurenta. Badani byli odporni na napływające informacje i pozostawali w przeświadczeniu o trafności wcześniejszego wyboru i oceny.
18-i-16--14--12--
10--8--6--4--2--
FAZY
Rys. 7.3.
Oceny atrakcyjności filmu wybranego i filmu niewybranego w kolejnych fazach eksperymentu.
Następujący eksperyment podpowiada dość perfidną strategię "psucia" opinii konkurentowi politycznemu lub ekonomicznemu. Hong i Wyer (1990) podawali najpierw badanym nazwę kraju, w którym został wytworzony dany produkt. Był to albo kraj kojarzony (stereotyp!) z wysoką jakością wytwarzanych w nim produktów, albo kraj kojarzony z niską jakością wytwarzanych w nim produktów. Następnie podaną wcześniej informację uzupełniano bardziej precyzyjną informacją o zaletach lub wadach danego produktu. Istotnym czynnikiem, jakim manipulowali przy tym eksperymentatorzy, był czas podania tej uzupełniającej informacji. Informacja ta była podawana albo natychmiast po informacji o kraju wytworzenia produktu, albo dopiero 24 godziny później. Wynik eksperymentu był zaskakujący: informacja zmienia-
ZNACZENIE WCZEŚNIEJSZYCH OPINII
jąca pierwsze wrażenie podawana z opóźnieniem miała mniejszy wpływ na ocenę atrakcyjności produktu niż ta sama informacja podana bezpośrednie po informacji o kraju wytworzenia produktu. Innymi słowy, stereotyp o "dobrym" bądź "złym" kraju wytworzenia produktu wywierał większy wpływ na ocenę tego produktu, gdy ważna uzupełniająca informacja została podana z opóźnieniem. Działo się tak jakby czas pozostawiony na przyswojenie sobie przez konsumenta pozytywnej albo negatywnej opinii o produkcie (opartej wyłącznie na informacji o kraju produkcji) działał w kierunku utrwalenie się u konsumenta tej opinii, tak że trudno było już potem ją zmienić.
Eksperyment ten istotnie podsuwa bardzo przemyślną strategię "psucia' opinii konkurentowi politycznemu lub ekonomicznemu. Polega ona na puszczeniu w obieg przesadzonej zdecydowanie negatywnej opinii na temat konkurenta, po czym na skorygowaniu po jakimś czasie "zbyt krzywdzącej" pierwotnej opinii. Okaże się, że korekta niewiele już zmieni utrwaloną wcześnie. negatywną opinię na temat zaatakowanego. Główny efekt negatywnej opini pozostanie. Sugeruje to pomysłowe badanie Dolińskiego i Kofty (1997).
Badacze ci przedstawiali uczestnikom eksperymentu (studentom) pewne wymyśloną, choć całkiem prawdopodobną historię o tym, jak to pewien dy żurny lekarz postawił błędną diagnozę pacjentce skarżącej się na bóle brzu cha i jak w następstwie tego zmarła ona na skutek -jak się później okazałe
- pęknięcia wyrostka robaczkowego. Historia ta miała jednak drugą częśt
- informację uzupełniającą. W informacji uzupełniającej znalazło się spore okoliczności do pewnego stopnia usprawiedliwiających lekarza - był on w cza się dyżuru bardzo wyczerpany fizycznie, gdyż całą poprzednią dobę praco wał, co mu nakazał ordynator, gdyż szpital nie miał wystarczającej liczb;
lekarzy itp.
Badacze podzielili osoby na dwie grupy. Obie grupy otrzymały dokładnie tę samą informację na temat niefortunnego wydarzenia w szpitalu. Jedyni różnica między grupami sprowadzała się do tego, że niektórzy badani cah opowieść otrzymywali w jednym ciągu, podczas gdy inni po wysłuchaniu in formacji o błędnej diagnozie i jej fatalnym skutku mieli krótką (5-minuto wą) przerwę i dopiero po tej przerwie otrzymywali informację uzupełniającą
Okazało się, że oddalenie w czasie informacji uzupełniającej miało zna czący wpływ: (l) na oceny odpowiedzialności, którą za popełnioną pomyłk( badane osoby przypisywały lekarzowi, (2) na oceny moralnej naganności czy nu lekarza i (3) na wielkość postulowanej kary za ów czyn. Kiedy uzupełnię nie było podane z 5-minutowym opóźnieniem, we wszystkich tych ocenacł badani byli dla lekarza bardziej surowi. Tak jakby powstrzymywali się przeć złagodzeniem raz przyjętej (przed przerwą) oceny.
O tym, że nasza skłonność do podtrzymywania raz sformułowanych ocei jest rzeczywiście wykorzystywana do "psucia" opinii konkurentom politycz
l V raYOl-iULUUlU^iMfc PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
nym poprzez świadomie praktykowane puszczanie w obieg przesadnie negatywnych o nich opinii, nie trzeba przekonywać nikogo, kto czyta gazety lub korzysta z innych środków masowej komunikacji.
7.6. Wybór i stronniczość ocen
Oto stoimy przed nieprzyjemnym wyborem: wyjechać na ciekawe wakacje czy pozostać w domu, by opiekować się starą matką. Albo mamy inny, mniej dramatyczny wybór: kupić samochód, który nam się bardzo podoba, ale zarazem jest bardzo drogi, czy też zadowolić się skromniejszym, lecz tańszym samochodem. W wyborach tych, jak i w wielu innych, przeżywamy konflikt motywów. W pierwszym przypadku między przyjemnością odbycia ciekawej podróży i odczuwanym obowiązkiem opieki nad starą matką. W drugim - między pragnieniem bycia właścicielem atrakcyjnego samochodu a pragnieniem, żeby nie wydać za dużo pieniędzy. Jak rozwiązujemy takie konflikty?
Jedną z naszych naturalnych skłonności jest stronniczość ocen, tj. dokonywanie manipulacji na naszych ocenach. Przeżywając konflikt między przyjemnością ciekawej podróży i odczuwanym obowiązkiem opieki nad starą matką, możemy przekonać siebie, że podróż ta ma dla nas ogromne znaczenie, a opieka zastępcza zapewniona matce jest "w istocie" całkiem zadowalająca. Zmierzamy w ten sposób do pomniejszenia jednych wartości, a powiększenia innych, tak aby łatwiej było znaleźć "same" zalety (zdecydowaną przewagę) opcji pożądanej i w ten sposób łatwiej rozwiązać nieprzyjemny konflikt. Literatura piękna dopisuje mnóstwo tego rodzaju walk wewnętrznych. Bolesław Prus tak oto opisał w Lalce wahania swojego bohatera Stanisława Wokul-skiego (Prus, 1956, str. 83-84):
Chodził i myślał:
Oto dwie drogi: jedna wiedzie do nieobliczalnych reform ludzkości, druga do podobania się, a nawet, przypuśćmy, do zdobycia kobiety. Co wybrać?...
Bo jużci jest faktem, że każdy nowy a ważny materiał, każda nowa silą to nowe piętro cywilizacji. Brąz stworzył cywilizację klasyczną, żelazo wieki średnie; proch zakończył wieki średnie, a węgiel kamienny rozpoczął wiek dziewiętnasty. Co się tu wahać: metale Geista dadzą początek takiej cywilizacji, o jakiej nie marzono, i kto wie, czy wprost nie uszlachetnią gatunku ludzkiego.
A z drugiej strony cóż mam?... Kobietę, któraprzy takich jak ja parweniu-szach nie wahałaby się kąpać. Czym jestem w jej oczach obok tych wykwint-nisiów, dla których pusta rozmowa, koncept, kompliment stanowią najwyższą treść życia. Co ta czereda, nie wyłączając jej samej, powiedziałaby na widok obdartego Geista i jego niezmiernych odkryć? Tak są ciemni, że nawet nie dziwiliby się temu.
ZNACZENIE WCZEŚNIEJSZYCH OPINII
Przypuśćmy wreszcie, żebym się z nią ożenił, a wtedy co?... Natychmiast do salonu dorobkiewicza wleliby się wszyscy jawni i tajni wielbiciele, kuzyni rozmaitego stopnia, czyja wiem wreszcie kto!... I znowu musiałbym zamykać oczy na ich spojrzenia, gluchnąć na ich komplimenta, dyskretnie usuwać się od ichpoufnych rozmów - o czym?... O mojej hańbie czy głupocie?... Po roku tego życia spodliliby mnie tak, że może zniżyłbym się do zazdrości o podobne indywidua...
Ach, czy nie wolałbym rzucić serce głodnemu psu aniżeli oddać je kobiecie, która nawet nie domyśla się, jaka jest różnica między nimi a mną.
- Basta!...
O tym, że rozważania te były tylko chwilową manipulacją własnymi pragnieniami, świadczy następne posunięcie bohatera (Wokulskiego), który otrzymuje list zawierający wzmiankę o owej "głupiej" kobiecie i reaguje natychmiastowym spakowaniem się i wyjazdem do owej kobiety.
Czasami inni (szczególnie specjaliści od marketingu!) pomagają nam rozwiązywać konflikty motywów. Deighton i Grayson (1995) cytują pouczającą wypowiedź pewnego dyrektora sieci sprzedawców samochodów: Mówię moim sprzedawcom, że kiedy klient wchodzi do twojego salonu, to dzieje się tak dlatego, że ma on ogromne pragnienie być właścicielem jednego z twoich samochodów. Ale ma on także inne ogromne pragnienie, żeby nie wydać pieniędzy. Twoim zadaniem jest pomóc mu przejść przez ból rozstania się z pieniędzmi, tak by stal się właścicielem samochodu. Jeżeli zrobisz to dobrze, klient ci podziękuje.
Montgomery (1983,1989) rozwinął koncepcję, że formułowanie ocen i dokonywanie decyzji należy rozpatrywać jako proces potwierdzania wcześniej przyjętych hipotez. Osoba, która stoi przed dokonaniem jakiejś decyzji, dokonuje od samego początku preselekcji (wstępnego wyboru) jednej z opcji. Tej mianowicie, którą (wyjściowo) uważa za dobrą (obiecującą). Sędzia bokserski oceniający walkę dwu zawodników może w trakcie pierwszej rundy dojść do przekonania, że lepszym zawodnikiem jest zawodnik N i że to jemu trzeba będzie przyznać zwycięstwo. Kiedy kupujemy krawat i oglądamy różne ich rodzaje, "wpada nam w oko" jeden lub dwa i zaczynamy je traktować jako "obiecujące" opcje.
Taka obiecująca opcja bywa traktowana jako wstępny wybór. Nie zawsze nawet wiadomo, jakie cechy wyznaczają ów wstępny wybór. Zwykle jest to jakaś rzucająca się w oczy cecha (choćby taka jak kolor, kształt, a w wypadku ludzi - nazwisko, uroda itp.). Następnie taka obiecująca opcja zaczyna nabierać atrakcyjności także pod innymi względami. Jak się to dzieje? Poprzez automanipulację właśnie. Osoba dokonująca wyboru może na przykład pomniejszać różnicę między wybieraną i odrzucaną opcją tam, gdzie owa odrzucana opcja ma przewagę. Powiedzmy, że pani B. waha się między
• ww r o T ^ni^L-uulOZ-l^c r-uc-rtr-M uutlMIMIMIA l ^UUfcJMUWANIA DECYZJI
wyborem bluzki ładniejszej, ale droższej, i "skromniejszej", ale tańszej o 50 zł od tej pierwszej. Otóż pani B. potrafi (wiem o tym, bo ją znam!) nawet w wypadku tak dobrze mierzalnej cechy jak pieniądze radykalnie zmniejszyć różnicę 50 zł między dwiema bluzkami, wyobrażając sobie, że w ciągu miesiąca z łatwością oszczędzi owe 50 zł, ograniczając inne wydatki. Równie łatwo osoba dokonująca wyboru może powiększać różnicę między wybieraną i odrzucaną opcją tam, gdzie wybierana ma przewagę. Pani B. potrafi udowodnić (sobie i innym), że jakość wybieranej bluzki jest tak imponująca, że ta druga przy niej to zwyczajna szmata.
7.7. Stronniczość ocen w werdyktach sportowych i w werdyktach politycznych
Wiele badań pokazuje, że naszym wyborom towarzyszy "stronniczość ocen". Do tej koncepcji dobrze pasuje opisany w pierwszym rozdziale wynik badania nad werdyktami sędziów bokserskich. Badanie pokazało, że oceny sędziowskie z kolejnych rund nie są od siebie niezależne: oceny rund wcześniejszych wpływały na oceny rund po nich następujących. Ujawniła się wyraźna tendencja, by zawodnika wygrywającego rundę wcześniejszą oceniać pozytywnie, zaś przegrywającego rundę wcześniejszą oceniać negatywnie. Wyniki uzyskane w owym badaniu bardzo dobrze pasują do koncepcji, że:
(1) Sędziowie bokserscy próbowali od samego początku (już po pierwszej rundzie) podjąć wstępną decyzję o tym, który z zawodników jest lepszy i przypuszczalnie będzie zwycięzcą całej walki.
(2) W kolejnych, dalszych rundach sędziowie przejawiali tendencję do "faworyzowania" zawodnika, który aktualnie posiadał przewagę, czyli zawodnika przewidywanego na zwycięzcę walki. "Zyski" takiego przypuszczalnego zwycięzcy były powiększane, a jego "straty" pomniejszane. Przeciwnie oceniano zawodnika uznawanego za przegrywającego walkę.
Nic dziwnego, że działacze związku bokserskiego zdecydowali się w ostatnich latach zmienić regulamin sędziowania w boksie. Nowy regulamin uwalnia sędziów bokserskich od wydawania werdyktów. Zadanie sędziego jest w tym regulaminie sprowadzone do samego liczenia ciosów. Werdykt wydaje komputer, który: (l) sprawdza, ilu z pięciu obserwujących walkę sędziów zauważyło cios i wcisnęło równocześnie odpowiedni przycisk, (2) zlicza jako zadane ciosy te przypadki, gdy ponad połowa (co najmniej trzech z pięciu) sędziów wcisnęła równocześnie odpowiedni przycisk i (3) pokazuje aktualny stosunek ciosów zadanych przez każdego z zawodników. Regulamin ten zno-
ZNACZENIE WCZEŚNIEJSZYCH OPINII
si decyzyjne zaangażowanie sędziów. Można powiedzieć, że końcowa decyzja jest tu podejmowana przez bezduszną procedurę komputerową, która nie jest wrażliwa na ową tendencyjność.
Decyzyjne zaangażowanie oceniających jest czymś równie powszecłmym, co nieuniknionym. Oto dwie wypowiedzi związane ze śledztwem w sprawie byłego premiera Polski Józefa Oleksego, oskarżonego o przekazywanie" informacji na rzecz obcego wywiadu:
Tekst telewizyjnego wystąpienia premiera Włodzimierza Cimoszewicza w dniu 29.05.1996 (za "Gazetą Wyborczą" z 30 maja 1996: "Stało się' coś bardzo niedobrego"),
Wiele wskazuje na to, że najważniejszy dokument w tej sprawie nie' byt poddany rzetelnej analizie pod względem treści i wiarygodności, że wreszcie nie dotyczy on osoby byłego premiera, któremu przede wszystkim na podstawie tego właśnie dokumentu stawiano zarzuty. Istnieją poważne podssta-wy do przypuszczenia, ze niektóre materiały operacyjne po fakcie dopasowywano do wcześniej sformułowanych zarzutów.
A oto rozmowa z byłym szefem MSW Andrzejem Milcz anowskim (za ."Gazetą Wyborczą" z 31 maja 1996: "Premier nie ma racji").
O ile się orientuję, komisja UOP dopasowywana materiał do fezy, że oficerowie nie działali obiektywnie. Już na początku maja, gdf-y ta komisja dopiero zaczęta pracę, pik Kapkowski, obecny szef UOP, w wywicD-dzie dla "Prawa i Życia" zdyskredytował oficerów prowadzących sprawę panią O. mówiąc, że złamali wszelkie procedury, a winni muszą ponieść odpowiedzialność. Podobnie wypowiedział się w tym samym "Prawie i Życiu" minister Siemiątkowski. Skoro szef Urzędu i szef MSW zajmują tak jednoznaczne' stanowisko - nim wypowiedziała się komisja UOP - to jaki werdykt rnoże wydać komisja przez nich wyznaczona i im podległa2
W świetle opisanych w tym rozdziale wyników obie powyższe wypowiedzi są "w ciemno" trafne. Są trafne, gdyż opisują powszechną wśród ludzi (w' tym także u ministrów i u innych urzędników) tendencję do formułowania łhipo-tez i dopasowywania do nich zbieranych dowodów. Umysł nasz pracuje v\v ten
właśnie sposób.
Oczywiście, nie oznacza to, iż powinniśmy bezkrytycznie przyjmowaćć wyniki takiej tendencyjnej pracy naszego umysłu. Jak pokazuje przykład z boksu, błędne tendencje naszego umysłu można poprawiać, i to na wiele sposobów. W sędziowaniu w boksie wynaleziono sprytną procedurę naprawczą W polityce, tak jak w wielu innych sferach życia społecznego, niwelowanie tendencyjności osiąga się poprzez wprowadzanie neutralnych sęd2ziów Wprawdzie i ci neutralni sędziowie mają podobną jak wszyscy inni teniden-ej ę do formułowania hipotez i dopasowywania do nich zbieranych dow&)dów ale zarówno ich hipotezy, jak i interpretacja dowodów mają szansę być tfnnie.
1 w raT^i-iui-m-in^Nt I--UŁAHKI OCENIANIA l PODEJMOWANIA DECYZJI
aas^BB^^ss^^aaaaasa^iSi^iBiB^^ySBs:^;::^;^
zaangażowane, co w rezultacie osłabia stronniczość. Niestety, wielu polityków głosi nieskromnie (i niedorzecznie), że ich oceny są bezstronne i zgoła obiektywne i nie widzi potrzeby korygowania ich przez osoby mniej czy w inny sposób zaangażowane.
7.8. Stronniczość ocen przy wyborach konsumenckich
Kolejny eksperyment pokazuje, że od automanipulacji nie są wolne wybory konsumenckie. Badanie prowadzono (Tyszka, Sokołowska, 1996) z uczniami szkoły średniej. Uczestnikom przedstawiano pięć długopisów w różnej cenie (ceny nie były ujawniane uczniom) i w konsekwencji - o różnej atrakcyjności.
W czasie pierwszego spotkania informowano badaną osobę, że badanie dotyczy oceny atrakcyjności różnych długopisów i służy poznaniu opinii konsumentów na ten temat. Zadanie będzie polegało na uważnym obejrzeniu długopisów i wyrażeniu swojej opinii o nich. Badanie prowadzono przy pomocy komputera, do którego badany wprowadzał swoje oceny w taki oto sposób: jeżeli w trakcie oglądania i próbowania długopisu coś (jakaś cecha długopisu) podobało się badanemu, to miał po prostu wciskać klawisz "plus" (specjalnie zaznaczony na klawiaturze komputera), jeżeli zaś cokolwiek mu się nie podobało, to miał wciskać "minus". Instrukcja "mówiła", że należy wciskać tyle razy klawisz "plus" i "minus", ile pozytywnych lub negatywnych cech długopisu zostanie zauważonych. W ten sposób uczeń "badał" kolejne długopisy i wciskał dla każdego z nich pewną liczbę plusów i minusów. Na zakończenie tej sesji badany oceniał na specjalnej skali od l do 100 całkowitą atrakcyjność długopisu.
W tydzień po tej pierwszej sesji uczestnik badania otrzymywał informację, że w nagrodę za współpracę w pierwszej części otrzymuje okazję wybrania dla siebie jednego z trzech wcześniej oglądanych długopisów. Przedtem jednak miał jeszcze raz ocenić każdy z nich według tej samej procedury co tydzień wcześniej. Po tym etapie badany rzeczywiście dokonywał wyboru i otrzymywał wybrany długopis.
W tej drugiej części badanych podzielono na dwie grupy. Jednym dano do wyboru między trzema długopisami ze środka skali atrakcyjności; zakładając, że badany oceniał atrakcyjność pięciu długopisów tak jak na rys. 7.4., miał do wyboru między długopisami: A2, A3 i A4. Drugiej grupie badanych dano do wyboru między trzema maksymalnie zróżnicowanymi długopisami;
zakładając, że badany oceniał atrakcyjność pięciu długopisów tak jak na rys. 7.4., miał do wyboru między długopisami: Al, A3 i A5. Zabieg ten służył stworzeniu badanemu albo łatwej, albo trudnej sytuacji wyboru.
ZNAUZhNIh WCZbbNltJ&z-T^i-i ur-n\n
A2
Al
najmniej atrakcyjny długopis
A3
•A4
A5
najbardziej atrakcyjny długopis
Rys. 7.4. Uporządkowana skala atrakcyjności pięciu długopisów (według ocen samych badanych).
Rysunek 7.5. pokazuje, jak były oceniane wybrane i niewybrane długopisy wtedy, gdy oceniano je bez dokonywania wyboru (na rysunku pokazuje to zapis "Ocenianie") i wtedy, gdy oceniania dokonywano w sytuacji wyboru (na rysunku pokazuje to zapis "Wybór"). Rysunek z lewej strony przedstawia oceny długopisów "podobnych", wziętych ze środka skali atrakcyjności, rysunek z prawej strony pokazuje oceny długopisów "niepodobnych", wziętych ze skrajnych pozycji skali atrakcyjności. Same oceny są po prostu stosunkiem ocen pozytywnych (plusów) do wszystkich ocen danego długopisu. Jest to zatem wskaźnik pozytywności oceniania.
Widać od razu, że badani - zgodnie ze zdrowym rozsądkiem - znajdowali większą proporcję pozytywnych ocen w długopisie wybranym niż w dłu-'
-o- wybrany długopis
-o - niewybrany długopis
1-r
0,9-
\^^\
0,8-
^\
| |
0,7-
- <<"
0,6-
l " """4
0,5-
i ..<»
0,4-
: - .'•' :
: ;
y""" i
0,3-
no
Ocenianie Wybór podobne długopisy
Ocenianie Wybór niepodobne długopisy
Rys. 7.5.
Pozytywnosć oceniania wybranego i niewybranych długopisów w sytuacji samego
oceniania i w sytuacji dokonywania wyboru.
•t.iii-i i-ii-ł-ii i\i ^y^i-i^irti^iM i r^ucJiviuwANIA DECYZJI
gopisach niewybranych. Ale przy podobnych długopisach (strona lewa) można zauważyć wyraźny wzrost pozytywnych ocen dla długopisu wybranego i spadek pozytywnych ocen dla długopisów niewybranych, gdy od sytuacji oceniania przechodzi się do sytuacji wyboru. Jest to właśnie przejaw tendencji do powiększania różnicy między atrakcyjnością alternatywy wybieranej i odrzucanej. W ten sposób badani ułatwiali sobie wybór. Ciekawe, że tendencja ta nie pojawia się przy wyborze między bardziej zróżnicowanymi długopisami (strona prawa). Dlaczego? Odpowiedź jest prosta. Dlatego, że przy bardzo zróżnicowanych pod względem atrakcyjności długopisach uczniowie nie mieli najmniejszych trudności z wyborem. W tej sytuacji nie potrzebowali manipulować swoimi ocenami.
7.9. Przywiązanie konsumenta do marki towaru
W zachowaniach konsumenckich znane jest zjawisko przywiązania albo lojalności wobec marki. Wyraża się ono w ponawianiu zakupu produktów tej samej marki. Są gospodynie domowe "lojalne" wobec firmy Procter and Gambie, są inne - "lojalne" wobec firmy Lever. Jedne i drugie kupują tylko produkty "swojej" firmy. Jedne i drugie głoszą, że firma przez nich wybrana ma wyraźną przewagę nad innymi. Podobnie mają swoich zwolenników auta Fiata, Forda czy Renault.
Przy zakupach opartych na przywiązaniu do marki nie poszukuje się informacji o produkcie ani nie dokonuje świadomej jego oceny. Przyjmuje się po prostu pogląd, że produkty danej marki są najlepsze i to dyktuje automatyczny wybór. Skąd bierze się takie przekonanie i przywiązanie? Przypuszczalnie kiedyś przy wcześniejszych okazjach produkt danej firmy okazał się satysfakcjonujący albo usłyszeliśmy kiedyś akurat pozytywną opinię o danej firmie. Tak czy owak, przy następnych okazjach tracimy motywację do próbowania produktów innych firm (mimo że mogłyby one okazać się jakościowo lepsze) i po prostu wybieramy produkt tej samej marki.
Badania nad zachowaniami konsumenckimi pokazują, jak bardzo "wygodne" jest to zjawisko dla właściciela znaku firmowego. Hoyer i Brown (1990) pokazali to w bardzo prostym "naturalnym" eksperymencie. Swoim osobom badanym dawali do wyboru między trzema rodzajami masła orzechowego. W jednej z badanych grup przedstawiali badanym osobom trzy masła nieznanych marek. W innej natomiast grupie przedstawiali dwa masła nieznanych marek i jedno masło znanej marki. Produkty dobrano przy tym tak, żeby prezentowane badanym masła różniły się pod względem jakości. Wzięto w tym celu masło orzechowe o powszechnie uznanej jakości i inne, gorsze masło. Masła te zaopatrywano w różne etykiety, tak że masło lepszej jakości
ZNACZENIE WCZEŚNIEJSZYCH OPINII
występowało albo pod swoją własną marką (znaną badanym), albo pod nieznanymi markami. I podobnie - masło gorszej jakości występowało albo pod ową znaną marką, albo pod nieznanymi markami. Badani najpierw wybierali produkt na próbę na podstawie samego oglądu, a następnie "próbowali" smakowo masła i dokonywali ostatecznego wyboru. Rejestrowano wybory i także podawane przez badanych kryteria (powody) ich dokonania.
Oto uzyskane rezultaty: we wstępnym wyborze (bez próbowania) 93,5 procent badanych z grupy, w której znajdował się produkt znanej marki, decydowało się na jego wybór. Większość tych osób przyznawała się zresztą do stosowania strategii znajomości marki. W grupie, w której badani nie znali żadnego znaku firmowego, najwięcej osób (45%) przyznawało się do kierowania się przy wyborze opakowaniem, następnie - ceną (14%), następnie - składnikami produktu (10,8%). Tak więc przy kupowaniu bez próbowania znajomość marki była powszechnie przyjętym kryterium wyboru.
Co się dzieje, kiedy znana marka zostaje zestawiona z testem smakowym? Najbardziej interesująca jest konfrontacja, gdy produkt znanej marki okazuje się smakowo gorszy od produktu nieznanej marki. Jak pamiętamy, w eksperymencie uzyskiwano taką sytuację, podmieniając etykiety między gorszym i lepszym masłem. Otóż okazało się, że także po spróbowaniu masła badani zachowywali się różnie wtedy, gdy mieli do czynienia z trzema produktami o nieznanej marce, i wtedy, gdy wśród trzech produktów jeden miał etykietę znanego masła. W pierwszej sytuacji, gdy mieli do czynienia z trzema produktami o nieznanej marce, ze znaczną częstością (dokładnie w 59% przypadków) "trafiali" w wyborze w masło o najwyższej jakości (tj. wybierali masło o najwyższej jakości). To, że nie zawsze "trafiali", można zapewne wyjaśnić faktem, że badanymi byli młodzi studenci, którzy przypuszczalnie nie przykładają (jeszcze!) nadmiernej wagi do jakości smakowych. Jest jednak pouczające, że liczba "trafień" gwałtownie spadła wtedy, gdy wśród trzech produktów jeden miał etykietę znanego masła. "Trafienia" w najlepsze masło miały wtedy miejsce już tylko w 41% przypadków i były szczególnie rzadkie wtedy, gdy masło lepszej jakości figurowało pod nieznaną etykietą, a masło gorszej jakości figurowało pod znaną etykietą.
Pouczający jest także trzeci wynik opisywanego badania. Okazało się, że występowanie wśród trzech produktów masła o znanej etykiecie zmniejszało w ogóle chęć do próbowania produktów (wtedy, gdy było to dozwolone). Tak więc znana marka "zniechęcała" do podejmowania sprawdzania jakości produktu.
Wszystkie ustalenia eksperymentu Hoyer i Brown (1990) pokazują, że marka produktu jest rzeczywiście ważnym elementem wyborów konsumenckich. Może to być zresztą "marka" w szerokim sensie. Znam pewien instytut w Warszawie, gdzie w okresie drastycznych braków rynkowych w zakresie
l 1^.
PSYCHOLOGICZNE PUŁAPKI LHJbNIANIA l h-UUtJMUWANIA DECYZJI
podstawowych produktów spożywczych, w latach osiemdziesiątych, pojawiała się pani zaopatrująca pracowników w cielęcinę. Pod koniec roku 1996, kiedy rynek produktów spożywczych w Polsce zmienił się w sposób niewyobrażalny, synowa tej pani ciągle zaopatruje pracowników instytutu w cielęcinę.
Zjawisko lojalności wobec marki nie ogranicza się do sfery produktów i usług. W wyborach politycznych wyraża się ono w trzymaniu się raz przyjętej opcji politycznej (z jakiegokolwiek powodu to nastąpiło) i niewrażliwo-ści na doniesienia prasowe o aferach, kłamstwach czy innych przywarach członków popieranej grupy politycznej. Dobrym przykładem tej niewrażli-wości społeczeństwa na uchybienia polityków jest zwycięstwo Aleksandra Kwaśniewskiego w wyborach prezydenckich w Polsce w 1995 roku, mimo że w trakcie kampanii wyborczej politykowi temu wykazano wyraźne rozminięcie się z prawdą w sprawie swojego wykształcenia.
W trakcie tejże kampanii wyborczej, kiedy odbywały się debaty telewizyjne Kwaśniewski-Wałęsa, zwolennicy każdego z nich uporczywie twierdzili, że zwycięstwo odniósł ich kandydat. Opinie tego rodzaju są tym trudniejsze do zmiany, że nie ma w tej dziedzinie zupełnie pewnych faktów, które zmuszałyby nieuprzedzonych obserwatorów do jednoznacznej oceny. Lojalność wobec grupy politycznej wydaje się zjawiskiem nawet silniejszym niż przywiązanie do marki produktu, a to dlatego, że polityka trudniej "wypróbować" niż na przykład masło orzechowe.
"-,.. 8
Oceny globalne czy cząstkowe
8.1. Dwie procedury formułowania ocen
Kiedy lekarz stawia diagnozę choroby, na którą cierpi pacjent, dokonuje on pewnego zsumowania informacji zawartych w zaobserwowanych symptomach, informacji zawartych w przeprowadzonych testach, w historii choroby pacjenta itd. Podobne zadanie wykonuje meteorolog, kiedy na podstawie poczynionych obserwacji stawia prognozę pogody. Podobnie też postępuje ekonomista albo zwyczajny konsument, kiedy przewiduje poziom inflacji.
Nieco inne, ale ciągle formalnie podobne zadanie wykonuje nauczyciel, kiedy biorąc pod uwagę treść, logikę wywodu, styl i ortografię ocenia na przykład wypracowanie z języka polskiego. "Składa" on różne informacje na temat pracy i dokonuje jej całościowej oceny. To samo zadanie staje przed członkiem jury wybierającego: najlepszego pianistę albo najwybitniejsze dzieło literackie, albo miss piękności itd. We wszystkich tych przypadkach trzeba połączyć różne szczegółowe informacje i ustalić ocenę ogólną. Ocena ogólna jest pewnego rodzaju zakwalifikowaniem obiektu (zjawiska, osoby) do jakiejś klasy: rodzaju choroby, rodzaju pogody, poziomu osiągnięcia szkolnego, literackiego, doskonałości ciała.
Jak dochodzi do formułowania tego typu ocen? W jaki sposób nauczyciel wystawia ocenę z pracy klasowej z języka polskiego albo w jaki sposób lekarz formułuje diagnozę, na jaką chorobę cierpi pacjent? Znane są dwa sposoby postępowania: (A) tzw. procedura kliniczna i (B) procedura oparta na formule zewnętrznej.
Oceny kliniczne. W jaki sposób postępuje nauczyciel, kiedy przystępuje do oceny prac z języka polskiego? Czyta je i zauważa wady i zalety, gdy chodzi o takie cechy prac jak: treść, jakość stylu, poprawność gramatyczna, poprawność ortograficzna i być może jeszcze jakieś inne cechy. Po przeczytaniu pracy tworzy w myśli ogólną ocenę pracy, co wyraża na zwykłej skali szkolnej. Ta ocena ogólna uwzględnia w jakiś sposób rozmaite cechy pracy: jej treść, jakość
f&YUl-IULUUH-iZ.Nfc h'Ut.Ah'M UUtlMIAIMIA l h'UUtJMUWANIA DECYZJI
iSTi."^;» ł ' ";.' Y>. ;.''''" . .. ^ ^ ^ .." ' " ' ^ < < •• '••"', : ^ : : . ^-••
stylu, poprawność gramatyczną, poprawność ortograficzną. Przypuszczalnie wpływ różnych tych aspektów na ocenę ogólną nie jest jednakowy: nauczyciel może przywiązywać większą wagę do treści niż do stylu albo odwrotnie. Można też podejrzewać, że różni nauczyciele przypisują poszczególnym aspektom niejednakową wagę: jeden nauczyciel przykłada większą wagę do treści niż do stylu, a drugi - odwrotnie - większą wagę przykłada do stylu niż do treści (sprytni uczniowie są zresztą w stanie szybko to rozpoznać). Charakterystyczne dla takiej procedury jest to, że nie jest wiadomo (przynajmniej nie jest wiadomo do końca), według jakiej formuły owe oceny poszczególnych aspektów (oceny cząstkowe) są składane przez oceniającego. Dzieje się to "w głowie" i to dzieje się tak, że wytwarzający globalną ocenę na ogół sam nie potrafi dokładnie opisać sposobu dojścia do niej.
W ten sam sposób postępuje lekarz, który stawia kliniczną diagnozę (stąd zresztą pochodzi nazwa procedury - kliniczna). Lekarz dokonuje oględzin pacjenta, przeprowadza różne testy i ustala w ten sposób symptomy (objawy) chorobowe. Po zgromadzeniu wszystkich "ocen cząstkowych" lekarz "w głowie" stawia diagnozę choroby - tworzy uogólniony obraz stanu organizmu pacjenta. Podobnie jak nauczyciel wystawiający ogólną ocenę za pracę, tak i lekarz przypisuje zaobserwowanym objawom odpowiednie wagi (na podstawie wiedzy i doświadczenia). I podobnie jak w wypadku nauczyciela, sumowanie objawów w diagnozę ogólną dokonuje się "w głowie" lekarza. I także w tym wypadku stawiający diagnozę na ogół nie potrafi dokładnie opisać sposobu dojścia do niej.
Taki sam sposób tworzenia ocen ma zastosowanie także w wielu innych miejscach, m. in. w sporcie. Tak postępuje sędzia sportowy, kiedy na podstawie obserwacji poszczególnych ewolucji, na przykład skoków w łyżwiarstwie figurowym, zauważa takie elementy pokazu jak: wywoływane wrażenie estetyczne, kompozycja muzyka-ruch i wystawia zawodnikowi jedną notę końcową. Tak postępuje również członek jury w dowolnym konkursie, kiedy na podstawie różnych osiągnięć decyduje o przyznaniu nagrody jednemu z kandydatów.
Procedura kliniczna polega najogólniej na tym, że oceniający (ekspert) bierze pod uwagę wiele różnych kryteriów czy aspektów i "w głowie" dokonuje jakiegoś ich połączenia, wydając na końcu ocenę globalną czy końcowy werdykt.
Oceny analityczne oparte na zewnętrznej procedurze. Drugi sposób tworzenia złożonych ocen polega na tym, że oceniający dokonuje oddzielnie cząstkowych ocen, tj. przyznaje oceny związane tylko z pojedynczymi kryteriami. Na przykład nauczyciel oddzielnie ocenia pracę ze względu na treść, jakość stylu, poprawność gramatyczną, poprawność ortograficzną. Ocena złożona powstaje natomiast poza oceniającym, jest ustalana na podstawie odpowiedniej zewnętrznej i wyraźnie określonej procedury.
OCENY GLOBALNE CZY CZĄSTKOWE
Najprostszą i naturalną w wielu wypadkach procedurą jest formuła ad-dytywna. Opiszemy ją na przykładzie oceny pisemnej pracy ucznia.
Krok l. Określenie cech (kryteriów), ze względu na które chcemy oceniać prace. Jest to kwestia uświadomienia sobie i jednoznacznego ustalenia, co uznajemy za ważne przy formułowaniu oceny. Przyjmijmy, że w ocenie prac uczniowskich uznajemy za ważne następujące cechy: treść, jakość stylu, poprawność gramatyczną, poprawność ortograficzną. Trzeba przy tym pamiętać, że zwykle nie ma pewności, czy uwzględniliśmy wszystkie ważne cechy; często po pewnym czasie okazuje się, że coś bardzo ważnego nie zostało w takim postępowaniu uwzględnione. Można i należy dokonać wówczas niezbędnego uzupełnienia.
Krok 2. Ocena względnej wagi różnych cech. Przyjmijmy też, że pewien nauczyciel tak oto urangował ważność poszczególnych cech dla oceny pisemnej pracy ucznia (od najmniej do najbardziej ważnej):
(1) poprawność ortograficzna,
(2) jakość stylu,
(3) poprawność gramatyczna,
(4) treść.
Nauczyciel może następnie spróbować określić liczbowo stosunek (proporcję) ważności poszczególnych cech. Może na przykład dojść do wniosku, że stosunek ważności poprawność gramatyczna/treść dobrze wyrażają liczby 3:5. W wypadku stosunku ważności jakość stylu/treść może uznać, że dobrze wyrażają go liczby 2:5. Wreszcie, gdy chodzi o stosunek ważności poprawność ortograficzna/treść, może uznać, że dobrze wyrażają go liczby 2:5.
Gdyby tak rzeczywiście było, narzucałby się następujący układ wag:
(2) poprawność ortograficzna,
(2) jakość stylu,
(3) poprawność gramatyczna,
(5) treść.
Krok 3. Ocena poszczególnych przypadków (prac) ze względu na pojedyncze cechy. Można tu posłużyć się skalą o ustalonej (dowolnej) liczbie kategorii, na przykład przyjętą skalą szkolną.
Krok 4. Utworzenie dla każdego ocenianego przypadku (pracy, kandydata) oceny złożonej. Polega ona na pomnożeniu ocen ze względu na poszczególne cechy przez wagi tych cech i zsumowanie owych ważonych ocen.
olxwl + o2xw2 + ... onxwn,
g''zie oijest oceną uzyskiwaną przez dany przypadek ze względu na cechę l, a wl jest wagą cechy l.
^i i^/i-^»J»i^zJMt= rut-rti-m ^OCI^IMINIM l ^UUbiJMUWANiA DECYZJI
i^siisiagBS^iffls^isaaiBlis^^ssaiassiaa^sa^s^^ń^
Oczywiście, nie zawsze da się łatwo wypełnić taką formułę. Przede wszystkim oceniający nie zawsze potrafią określić wagi, jakie należy przypisać poszczególnym atrybutom. Wyobraźmy sobie na przykład stawianie diagnozy lekarskiej, gdy na podstawie badania, czyli wyników pewnych testów, lekarz ma postawić diagnozę. Zwykle jest tak, że wyniki jednego badania nie przesądzają o końcowej diagnozie. Lekarz formułuje swoją diagnozę dopiero na podstawie wielu objawów, takich jak, załóżmy:
01 - gorączka,
02 - ból gardła,
03 - szmery w klatce piersiowej,
04 - łamanie w kościach.
Jak już mówiliśmy, lekarze stawiają swoje diagnozy w sposób kliniczny - składają "w głowie" oceny poszczególnych objawów. Gdyby jednak lekarz chciał podać jawną formułę, w jaki sposób stawia swoją diagnozę (kiedy ustala, że pacjent ma grypę albo anginę, albo coś innego), to musiałby podać jakąś kombinację wag objawów: 01, 02, 03, 04, która doprowadza go do takiej czy innej diagnozy:
Olxwl +02xw2 + 03xw3 + 04xw4.
Zwykle lekarze nie są w stanie podać takiej kombinacji, twierdzą, że zasady stawianych przez nich diagnoz są bardziej skomplikowane. Można jednak w takich wypadkach odtworzyć wagi stosowane przez lekarzy w sposób następujący: prosi się ich, aby postawili diagnozy w ustalonej liczbie przypadków (wybiera się kilkadziesiąt czy nawet kilkaset przypadków). Dysponując takim materiałem, można zastosować doń specjalną analizę statystyczną, zwaną analizą regresji, która wydobywa wagi stosowane intuicyjnie przez stawiających diagnozy. Tak więc wagi mogą być wydobyte bez świadomego udziału diagnostów.
W niektórych, choć raczej w niewielu, dziedzinach rzeczywiście przyjęte są takie zewnętrzne procedury oceniania. Na przykład w ocenianiu skoków narciarskich sędziowie oceniają tylko styl skoku, a nie jego całościową doskonałość. Drugi element skoku - jego długość - jest oceniany już poza sędziami, przy pomocy metra mierniczego. Ocena całościowa powstaje poprzez specjalne złożenie obu składowych. Dokonuje się tego w następujący sposób: pięciu sędziów niezależnie ocenia styl skoku zawodnika; z tych pięciu odrzuca się dwie oceny skrajne, a z pozostałych tworzy się sumę; druga składowa powstaje poprzez odjęcie od długości wykonanego skoku wartości krytycznej danej skoczni i pomnożenie tej różnicy przez ustalony dla danej skoczni wskaźnik jej trudności; w końcu obie składowe dodaje się i uzyskuje całościową ocenę doskonałości skoku.
OCENY GLOBALNE CZY CZĄSTKOWE
l l f
a^^s^BiHa^asssgai^iss^affl^si^Sfflssai^^^BKaasisis^^
Również niektórzy staranni nauczyciele wypracowują sobie i stosują zewnętrzne procedury oceniania prac pisemnych. Podobnie w niektórych konkursach tworzone są tego typu procedury. Zwykle jednak w wielu dziedzinach oceny kliniczne zdecydowanie przeważają nad ocenami analitycznymi opartymi na procedurze zewnętrznej. W medycynie zdecydowanie dominują właśnie oceny kliniczne, choć z powodzeniem można by sobie wyobrazić diagnozy oparte na pewnych zewnętrznych formułach. Podobnie przy zamówieniach rządowych, gdzie obowiązuje ogłaszanie przetargu na jakiś rodzaj usługi, nie tworzy się na ogół wyraźnych formuł, według których przetarg ma być rozstrzygany. Sformułowanie takiej procedury nie powinno stanowić dużego problemu: wystarczyłoby wypisać ważne dla zamawiającego kryteria - cena, forma płatności, termin realizacji, opinia o jakości itp. - i ustalić ich wzajemną ważność. Rząd czy inny podmiot zamawiający usługę nie byłby w takiej sytuacji pomawiany o faworyzowanie jednych i dyskryminowanie innych uczestników konkursu.
8.2. Trafność obu rodzajów procedur przy tworzeniu złożonych ocen
Porównanie trafności obu rodzajów procedur przy tworzeniu złożonych ocen rozmaitych wytworów (w sporcie, w szkole, w różnego rodzaju konkursach^ jest raczej trudne. Kłopot polega na tym, że nie dysponuje się tu obiektywnym kryterium dobrej oceny. Jak ustalić, czy w konkursie literackim wyłoniono rzeczywiście najlepsze dzieło? Ale jak w tej sytuacji testować przewagę jednej czy drugiej procedury oceniania? Jednak nawet w tych dziedzinacr jakieś możliwości porównania istnieją. Materska (1992,1994) przytacza francuskie badania, w których porównywano ocenianie szkolne według obu pro cedur postępowania. W badaniach tych ustalono, że już samo wyraźne spre cyzowanie kryteriów oceniania (wypracowań z francuskiego) zmniejszało rozbieżności ocen między nauczycielami.
Eksperyment przeprowadzono w ten sposób, że eksperymentalnej grupit nauczycieli polecono najpierw dokonać indywidualnej oceny zespołu prac Następnie - dokonać oceny zbiorowej tych prac w kilkuosobowych zespo łach, po uprzednim uzgodnieniu kryteriów oceny. Wreszcie ponownie ocenił te prace indywidualnie. Inna - kontrolna grupa nauczycieli - nie uczestni czyła w etapie grupowym, a tylko dwukrotnie oceniała te same prace. Ekspe ryment potwierdził większą efektywność oceniania z ustalonymi kryteriami Grupa eksperymentalna uzyskała w ostatniej indywidualnej fazie oceniani;
większą zgodność ocen niż grupa kontrolna.
l 10 PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
W badaniu Caverniego (za: Materska, 1992, 1994) posłużono się specjalnie przygotowanymi ("sztucznymi") wypracowaniami, do których wprowadzono w sposób celowy określone błędy stylu i wywodu. W ten sposób można było obiektywnie określić nasycenie każdego z wypracowań błędami i porównać owe wielkości z ocenami dawanymi przez nauczycieli. Zastosowano przy tym różne instrukcje dla nauczycieli, jak mają dokonywać oceniania. W jednym przypadku proszono po prostu o globalną ocenę każdego wypracowania na 20-stopniowej skali. W innym wypadku nauczyciel miał je ocenić najpierw wyłącznie na podstawie stylu, wyłącznie na podstawie wywodu i dopiero po wystawieniu takich ocen częściowych za każdy z tych aspektów ocenić całościowo wypracowanie. Okazało się, że wtedy gdy postawiono wymagania dokonania najpierw ocen częściowych, a następnie ocenienia całościowego, oceny były wyraźnie bardziej zgodne z wielkością wysycenia wypracowań błędami. Wynika stąd, że ocenianie analityczne - polegające na jawnym zdefiniowaniu kryteriów i niezależnym wystawieniu ocen częściowych - daje zdecydowanie lepsze wyniki niż wyłącznie ocenianie globalne.
8.3. Porównanie trafności procedur przy stawianiu diagnoz i prognoz
Porównanie obu procedur jest łatwiejsze (i bardziej naturalne) w tych sytuacjach, w których badamy prognozy albo diagnozy, które następnie można porównać z możliwym do ustalenia stanem obiektywnym. Kiedy meteorolog stawia prognozę pogody, to łatwo później ustalić, czy była to prognoza trafna, czy nietrafna. Można wręcz policzyć, jak często prognozy meteorologów się sprawdzają. Podobnie ma się sprawa z prognozami ekonomiczny-po pewnym czasie można ustalić przewidywany stan procesów go
nu
spodarczych (inflacji, koniunktury itp.). Podobne badania (choć trochę trudniejsze) są możliwe wobec diagnoz lekarskich, kiedy można później potwierdzić postawioną diagnozę w sposób bezpośredni (w skrajnym i najgorszym wypadku podczas sekcji zwłok pacjenta). Nic więc dziwnego, że trafność obu rodzajów procedur porównywano przede wszystkim w tego rodzaju przypadkach.
8.3.1. Diagnozy i prognozy oparte na zewnętrznej procedurze wykorzystującej wagi statystyczne
W jaki sposób lekarz może "wytworzyć" odpowiednią formułę do diagnozowania określonej choroby? Jak psychiatra mógłby zbudować formułę rozpo-
OCENY GLOBALNE CZY CZĄai KUWt
znawania, czy psychiatryczny pacjent z określonym zestawem objawów jest neurotykiem czy psychotykiem? Właściwą metodą wydaje się być następujące postępowanie: wystarczy zgromadzić pewną (lepiej większą niż mniejszą) liczbę zbadanych przypadków, w których udało się "obiektywnie" (tj. w sposób niewątpliwy) ustalić, na jakie zaburzenie (neurotyczne czy psychotyczne) cierpiał pacjent i jakie przy tym występowały objawy. Wykorzystując następnie prostą (liniową) analizę regresji (jest to metoda statystyczna opisana w każdym podręczniku metod statystycznych, a także realizowana przez wiele statystycznych pakietów komputerowych), można ustalić korelacje między występowaniem odpowiednich objawów i diagnozowaną chorobą. W ten sposób otrzymamy wagi, z jakimi należy sumować poszczególne objawy w formule, która "sama" będzie stawiała diagnozy dla następnych przypadków psychiatrycznych. Podkreślmy, że postępowanie takie wymaga wcześniejszego przeprowadzenia odpowiednich obserwacji objawów u pacjentów, dla których znana jest diagnoza choroby. Czy warto spełnić owo wymaganie - czy diagnozy oparte na takich prostych formułach będą równie dobre, czy gorsze, a może lepsze od diagnoz biegłych psychiatrów stawianych tradycyjnie na podstawie procedury klinicznej?
Przewidywania samych psychiatrów, ale także innych lekarzy, jak również niespecjalistów są w tej sprawie pesymistyczne. Sądzi się, że biegły psychiatra (czy w ogóle każdy specjalista) nie dokonuje "w głowie" takiego prostego składania. Bierze on raczej pod uwagę rozmaite konfiguracje (układy) objawów i znajomość tych właśnie specyficznych konfiguracji, a nie proste dodawanie objawów (choćby i z wagami), pozwala mu stawiać trafne diagnozy. Mimo to spróbowano jednak porównań.
W pewnym badaniu (za: Dawes, Faust i Meehl, 1989) w oparciu o specjalne testy umysłowe określano pewną dysfunkcję mózgu. Na podstawie zbadanych przypadków udało się sformułować statystyczną regułę do przewidywania, czy pacjent cierpi na to zaburzenie, czy nie. Reguła ta pozwalała identyfikować prawidłowo 83% przypadków. Tymczasem doświadczeni klinicyści nie potrafili dla tych samych przypadków zidentyfikować poprawnie więcej niż 63%. Co więcej, nawet kiedy zapoznano ich z ową regułą statystyczną, nie byli w stanie osiągnąć tego samego poziomu trafności co ta reguła.
Inny przykład zastosowania wag statystycznych pochodzi od Dawesa (1988). Badał on przewidywania osiągnięć na studiach. Wszyscy studenci przyjęci na psychologię Uniwersytetu Oregońskiego w latach 1964-1967 byli w roku 1969 oceniani przez pracowników wydziału na typowej skali szkolnej, gdzie: 5 oznaczało osiągnięcia wybitne, 4 - powyżej przeciętnej, 3 - przeciętne, 2 - poniżej przeciętnej, l - wypadł z kursu na skutek trudności akademickich. W próbce znalazło się 111 studentów. Każdy z nich został oceniono przez 1-20 pracowników wydziału, średnio 5,67 pracowni-
P&YUI-IULUUHJ.ĆNh PUŁAPKI OCtNIANIA l PODEJMOWANIA DECYZJI
ków oceniło każdego studenta. Owe uśrednione oceny przyjęto jako miarę osiągnięć na studiach. Osiągnięcia te próbowano przewidywać z ocen studentów uzyskiwanych w czasie studiów na egzaminach, ze średniej ocen przed studiami i z poziomu ukończonej szkoły średniej. Jak pokazuje rys. 8.1., trafność przewidywań opartych na tych trzech wskaźnikach nie była imponująca, wyniosła 0,38. Ale prognozy komisji kwalifikującej oparte na tych samych danych były zaledwie w połowie tak dobre, odpowiednia korelacja wyniosła 0,19.
0,4-
procedura kliniczna procedura zewnętrzna
Rys. 8.1.
Trafność przewidywania ocen studenckich według procedury klinicznej i procedury zewnętrznej.
W przeglądowej pracy Dawesa, Fausta i Meehia (1989) pokazano szeroki wachlarz badań porównujących dokładność klinicznych ocen ekspertów i ocen opartych na statystycznych procedurach wykorzystujących odpowiednie dane empiryczne. Prawie bez wyjątku trafność klinicznych ocen formułowanych przez ekspertów była gorsza od dokładności ocen opartych na statystycznych procedurach wykorzystujących ustalenia empiryczne. Potwierdzono to w bardzo wielu dziedzinach, takich jak diagnozy medyczne, sądowe, przewidywanie powodzenia na studiach itp. Co jest przy tym szczególnie intrygujące to fakt, że te procedury statystyczne przewyższają dokładnością nie tylko wyniki oszacowań przeciętnych ekspertów, ale także ekspertów o uznanej międzynarodowej reputacji.
Skąd bierze się niedoskonałość ocen ludzkich, nawet jeżeli oceniający są wysokiej klasy specjalistami? Dawca, Faust i Meehl pokazują, że eksperci są
OCENY GLOBALNE CZY CZĄSTKOWE^
na ogół w stanie trafnie zauważać rozmaite zdarzenia, czyli zdobywać war teściową informację. To, z czym natomiast mają problemy - to właściwi przetworzenie owej informacji. Doświadczony lekarz może dobrze wiedzieć jakie liczne objawy współwy stępuj ą z daną chorobą. Może też wiedzieć, kto re z nich występują częściej, a które rzadziej przy owej chorobie. To, z czyn idzie mu najtrudniej - to ocena konkretnego przypadku, czyli postawieni diagnozy, gdy jedne objawy występują, a inne nie. Okazuje się, że przydatni jest wtedy jakaś formuła, która podpowiadałaby lekarzowi, jaką należy po stawić diagnozę przy wystąpieniu danego zestawu objawów.
8.3.2. Wagi oparte na intuicjach ekspertów
A co z przypadkami, gdy nie dysponujemy odpowiednim materiałem staty stycznym i nie możemy "wydobyć" wag, z jakimi powinny być składan poszczególne objawy? Możliwy jest wtedy inny sposób "wydobywania" wa, - opiera się on na intuicjach ekspertów. Postępuje się wtedy w sposób na stepujący: przedstawia się ekspertom pewną liczbę przypadków scharakte ryzowanych przez określone objawy (wskaźniki) i prosi się ich, by dokona] przewidywań albo odpowiedniej klasyfikacji (na przykład w medycynie -zdiagnozowania choroby). Na podstawie tych przewidywań czy klasyfika cji, znowu przy pomocy procedury statystycznej (analizy regresji), buduj się wagi dla różnych objawów (wskaźników). Tak więc korzysta się tu z wa "wydobytych" z zachowania ekspertów. Otrzymane w ten sposób wagi znc wu wykorzystuje się do zbudowania formuły, która "sama" będzie stawiał diagnozy dla następnych przypadków. Czy zabieg taki ma sens, skoro ta czy owak, składniki formuły pochodzą od ekspertów? Czy diagnozy opart na takiej formule będą różniły się od klinicznych ocen ekspertów?
Dawes i Corrigan (1974) porównywali trafność przewidywań opartych n takich "wydobytych" wagach i bezpośrednich przewidywań ekspertów. Jedn z badań dotyczyło diagnozy psychiatrycznej opartej na wynikach znanego test MMPI. Test ten zawiera pomiar rozmaitych cech badanej osoby (na przykła emocjonalność, lękowość, introwersja). Uzyskiwane przy użyciu testu wynil pozwalają określić tzw. psychologiczny profil osoby. Profil ten bywa wykorz;
stywany miedzy innnymi do diagnozy tego, czy pacjent psychiatryczny jes neurotykiem, czy psychotykiem. Do badania wyselekcjonowano 861 profi pacjentów psychiatrycznych z różnych szpitali, o których - dzięki wszecP stronnym badaniom - wiedziano, czy są neurotykami, czy psychotykami. 2 klinicznych psychologów, którzy mieli doświadczenie z tego rodzaju praktyki otrzymało owe profile i wydało swoje diagnozy. Diagnozy psychiatrów posh. żyły do stworzenia formuły diagnostycznej. W drugiej części badania wzięt 100 nowych profili pacjentów psychiatrycznych, o których wiedziano, czy s
rv-> i ^n^L.^un^.iMc; rui-Ml-rM UOCINIMIMIA l ^UUtJMUWANIA DFPYZJI
••SSS''f-^.y-i/.:^,{ ••••,' f- ,, <••;..-/, -.'', ...:.-:•" v. •••-.. •.-.•.•.; -.,'',^ •••',, ^ ^ •• i -. ' •~^t-\^ t *-v
neurotykami, czy psychotykami, i poproszono psychiatrów o ich diagnozę kliniczną oraz wykorzystano formułę do diagnozy tychże przypadków.
Stała się rzecz zadziwiająca, żeby nie powiedzieć tajemnicza: formuła wykorzystaj ąca wagi "wydobyte" od ekspertów (z ich wcześniejszych diagnoz) okazała się przewidywać lepiej niż sami eksperci, na zachowaniu których formuła została zbudowana. Dalsze badania (na przykład nad przewidywaniem osiągnięć studentów) pokazały, że jest to znowu stała prawidłowość: formuły budowane na wcześniejszych zachowaniach ekspertów (na ich diagnozach) przewidują lepiej niż sami eksperci.
W świetle tego doświadczenia miałaby sens następująca propozycja eksperta pod adresem analityka: "Przetestuj no pan moje postępowanie i powiedz mi pan, jak ja właściwie stawiam swoje diagnozy, to będzie je można na tej podstawie usprawnić". Jak to możliwe? Wygląda na to, że pożytecznie jest "przefiltrować" zachowanie ekspertów za pomocą odpowiednich procedur statystycznych (na przykład analizy regresji), które odrzucają przypadkowe zniekształcające czynniki wpływające na pojedyncze zachowanie, a zatrzymują podstawowe tendencje.
Potwierdza to następujące osobiste doświadczenie. W czasach studenckich mieszkałem z kolegą, który uchodził w naszym środowisku za eksperta od wyścigów konnych. Zacząłem z nim chodzić na wyścigi i naturalnie radzić się go przy obstawianiu gonitw. Zawczasu kupowaliśmy program i przed udaniem się na wyścigi mój ekspert dokonywał analizy szans poszczególnych koni, po czym stawiał prognozy - typował zwycięzców dla poszczególnych gonitw. Udawaliśmy się na wyścigi i tu nasze zachowanie było różne. Nie mając żadnej dodatkowej wiedzy o koniach, obstawiałem po prostu konie wytypowane wcześniej przez eksperta. Ekspert natomiast czynił dodatkowe obserwacje - a to, że typowany koń wygląda na zmęczonego, a to, że jakiś inny koń wygląda nadzwyczaj rześko albo że tor jest nieco zbyt elastyczny. Pod wpływem owych dodatkowych obserwacji mój ekspert zmieniał nierzadko wcześniejsze typy. Po pewnym czasie obaj zauważyliśmy pewną prawidłowość: ja trafiałem częściej niż ekspert.
8.4. Dlaczego nie wykorzystuje się oceniania opartego na zewnętrznej procedurze?
Mimo istnienia przytłaczających dowodów pokazujących większą trafność ocen opartych na zewnętrznych procedurach niż ocen klinicznych, istnieje znaczna niechęć do stosowania procedur zewnętrznych. Nauczyciele, lekarze, psycholodzy i inni specjaliści preferują oceny kliniczne. Pan Marek Ro-
OCENY GLOBALNE CZY CZĄSTKOWE
-••'..'- •s
sochacz zauważył, że nawet wtedy, gdy istnieją wyraźnie sformułowane kryteria oceny, jak to ma miejsce na konkursach rasowych psów, sędziowie, mimo wszystko, wolą korzystać ze swojego ogólnego wrażenia niż szczegółowo mierzyć rozmaite cechy kandydatów do nagrody.
Skąd bierze się owa niechęć do stosowania procedur zewnętrznych? Istnieje kilka powodów tego stanu rzeczy. Jednym z nich jest zapewne trzymanie się tradycji. Tradycyjnie w większości dziedzin (w szkole, w medycynie, w sporcie) oceny były wydawane w sposób kliniczny. Ludzie mają skłonność bezrefleksyjnie postępować według utartych schematów.
Niekiedy, zwłaszcza w kontekście oceniania ludzi albo ich wytworów, pojawia się mało przejrzysty argument dehumanizacji oceniania opartego na sztywnych zewnętrznych procedurach. Dawes (1988) przytacza wypowiedź kandydatki na psychologię na uniwersytecie w Santa Barbara, która została odrzucona po zastosowaniu wobec niej zewnętrznej procedury oceniania. Uznała ona, że było to wysoce niewłaściwe, gdyż komisja nie przeprowadziła z nią żadnej rozmowy, a tylko wykorzystała dostępne na jej temat dane ilościowe. Czy argumentacja ta ma sens? Jeżeli nawet tak, to jest to sens podejrzany. Przyjmuje albowiem za rzecz niewłaściwą pozbawienie oceniającego prawa do uzupełniania powstałej jawnie oceny jakimś niejawnym "pierwiastkiem humanistycznym".
Inny jeszcze nieprzekonujący powód niechęci do stosowania procedur zewnętrznych jest związany po prostu z nieznajomością wyników badań i z błędnym mniemaniem, że specjalista - dysponujący gruntowną wiedzą na dany temat - oceniać może lepiej niż "niedoskonała" formuła statystyczna. Jest to przekonanie wypływające z ignorancji.
Istnieje jednak także uzasadniony powód zachęcający do ostrożności w korzystaniu z procedur zewnętrznych. Wiąże się on z trudnością wydobycia i sformułowania wszystkich istotnych cech (kryteriów) oceny. Z kłopotem tego rodzaju mamy na przykład do czynienia podczas selekcji ludzi na różnego rodzaju stanowiska, o ile nie wiemy, jakie cechy są istotne dla uzyskania powodzenia w danym zawodzie. Chociaż istnieją tu pewne domniemania, a nawet ustalenia, to jednak jesteśmy dalecy od znajomości pełnego zestawu kryteriów ważnych dla trafnego przewidywania przyszłych sukcesów i niepowodzeń - w kierowaniu ludźmi, w sporcie, w biznesie itd.
Również w wielu dziedzinach twórczości ludzkiej - w wypadku wytworów literackich, malarskich - nie potrafimy do końca zdefiniować kryteriów oceny. Nie umiemy rozbić na elementy ogólnego wrażenia estetycznego. Kryteria, które jesteśmy w stanie określić, wydają się nie wyczerpywać jakichś wyczuwalnych, ale właśnie niedefiniowalnych aspektów. Jeżeli wydaje się nam wówczas, że są to aspekty ważne, nieufność wobec procedur zewnętrznych jest uzasadniona.
« fc-r ro T ^n^L-^^i^^-i^c ruc-ftrr\i ^^I=I\IMI^IA l mUtJMUWANIA DECYZJI
sm^s^- - - -•K-sa^saa&aft^sy-'' •• ........ •• "•• :•", ' ,, . •.::,..
8.5. Nieinteligentnie zaprojektowany system ocen pracowników
Należy zwrócić uwagę na pewną pułapkę czyhającą na tych, którzy "nieinteligentnie" korzystają z zewnętrznych procedur oceniania. Pułapka ta dotyczy oceniania ludzi. Zilustruję ją przykładem pochodzącym z pewnego instytutu naukowego, żeby pokazać, że przed pułapką tą nie są zabezpieczeni także uczeni. Dyrekcja tego instytutu, przejęta szlachetnym zamiarem sprawiedliwego wyważenia wkładu każdego pracownika (po to, by każdego sprawiedliwie wynagrodzić), opracowała szczegółowy system punktowania wszystkich osiągnięć pracowniczych. Na liście punktowanych zasług znalazły się:
napisane książki, napisane artykuły, napisane wewnętrzne raporty (teksty robocze, które nie osiągnęły poziomu publikacji), referaty wygłoszone na konferencjach zagranicznych i krajowych, ale też wykłady lub pogadanki wygłoszone dla dowolnej publiczności, a także zorganizowane seminaria czy inne spotkania, a nawet zdobycie dla instytutu pieniędzy od dowolnego sponsora. System przewidywał określoną (zróżnicowaną dla różnych kategorii) liczbę punktów za każde osiągnięcie. Zasada składania polegała po prostu na zsumowaniu wszystkich punktów pracownika. Ten prosty wskaźnik pozwolił dyrektorowi ułożyć listę wszystkich pracowników od najlepszego do najgorszego. I wszystko wydawało się w najlepszym porządku. Po dwóch latach jednak okazało się, że w instytucie wyraźnie zmalała liczba publikacji, natomiast niepomiernie wzrosła liczba składanych w szafach wewnętrznych raportów, pracownicy jeździli po kraju, wygłaszając mnóstwo różnego rodzaju referatów, wykładów i pogadanek dla rozmaitej publiczności, inni znowu zdobywali dla instytutu pieniądze i wyposażali go w coraz bardziej eleganckie meble i coraz doskonalsze komputery. Mówiąc krótko, instytut przestał "wytwarzać" podstawowe "produkty naukowe", a zaczął wytwarzać łatwiejsze do osiągnięcia "produkty okołonaukowe". Wszystko to było efektem przystosowania się pracowników do wprowadzonego systemu oceniania.
Błąd zaprojektowanego systemu nie polegał na tym, że wprowadzono zewnętrzną formułę oceniania. Ewidentny błąd tkwił w przyjęciu "nieinteligentnej" formuły, którą inteligentni pracownicy bez trudu mogli przechytrzyć. W sytuacji takiej jak omawiana nie ma sensu formuła kompensacyjna, według której ten sam rezultat końcowy można uzyskać na wiele sposobów, na przykład zamiast pisać trudną książkę, można powtórzyć dostatecznie dużo pogadanek i uzyskać tyle samo, albo i więcej punktów. Formułą, która nie pozwalałaby na taką kompensację, jest na przykład formuła koniunkcyj-na - wymagająca przynajmniej minimalnego spełnienia różnych kryteriów:
czyli minimalnej liczby publikacji, minimalnej liczby wystąpień na ważnych konferencjach itd.
OCENY GLOBALNE CZY CZĄSTKOWE
8.6. Parlamentarna utopia
Jak zapadają ważne dla nas decyzje sejmowe o wysokości płaconych przez nas podatków, o wysokości rent i emerytur? Głosowania w tych sprawach zapadają z reguły według tzw. klucza partyjnego czy klubowego, to znaczy, że poszczególne kluby parlamentarne ustalają, jak ich członkowie mają w danej kwestii głosować. Takie partyjne ustalanie decyzji sejmowych ma ten skutek, że głównym czy wręcz jedynym kryterium decyzji podejmowanych w klubach parlamentarnych jest kryterium interesu partyjnego. Kluby wybierają takie rozwiązania, które służą ich interesom, na przykład zwiększają ich szansę wyborcze. Ilustruje to na przykład znana prawidłowość, że podatki są podnoszone we właściwym czasie, czyli wtedy, kiedy nie zagrażają sukcesowi wyborczemu rządzącej partii. Tufte (za: Lea, Tarpy i Webley, 1987) badał dane z 27 krajów dotyczące tzw. dyspozycyjnych dochodów osobistych, dochodów po odjęciu podatków, a więc takich, którymi ludzie rzeczywiście dysponują na wydatki i oszczędności. Okazało się, że w okresie dziesięciolecia 1961-1970 dochód dyspozycyjny w społeczeństwach wzrastał przeciętnie do 64% w roku wyborów i tylko do 49% w latach, w których wyborów nie było.
Czy można jakoś uwolnić parlamentarne podejmowanie decyzji od przesądzającego wpływu interesów partyjnych? Czy można doprowadzić do tego, by oprócz interesów partyjnych jakiś wpływ na decyzję o wysokości podatków miały interesy podatników, interes gospodarczy kraju? Procedura taka jest do pomyślenia, choć trzeba z góry powiedzieć, że jest to na razie czysta utopia.
Procedura składa się z czterech kroków i zakłada, że wcześniej został sformułowany problem decyzyjny oraz jego alternatywne rozwiązania. Przyjmijmy, że decyzja dotyczy progów podatkowych i zgłoszone jest jedno albo kilka alternatywnych rozwiązań.
Krok l. Kompetentna komisja sejmowa określa istotne aspekty związane z daną decyzją. W wypadku decyzji o progach podatkowych mogłyby to być m. in. aspekty podobne do następujących:
- uzyskiwana przez budżet suma podatków,
- możliwy poziom polityki socjalnej państwa,
- wpływ na aktywność gospodarczą,
- wpływ na koniunkturę i wzrost gospodarczy,
- stabilność polityki finansowej państwa,
- wpływ na inflację,
- sytuacja ekonomiczna nisko zarabiających,
- sytuacja ekonomiczna średnio zarabiających,
- sytuacja ekonomiczna dużo zarabiających.
.. ,^.-v^.^.i-iii- rui-ftrr\i I^CIMIAIMIA l KUUtJMOWANIA DECYZJI
Krok 2. Kluby określają przypisywaną przez siebie wagę poszczególnym aspektom - przypisują aspektowi wartość O, jeżeli uznają go ze swojej perspektywy za nieważny, oraz l - jeżeli uznają ze swojej perspektywy dany aspekt za ważny.
Krok 3. Eksperci oceniają wielkość skutków każdej z rozpatrywanych opcji ze względu na wszystkie aspekty. Ekspertami dla decyzji o progach podatkowych mogliby być ekonomiści i socjologowie. Eksperci dokonywaliby swoich ocen na zadanych skalach, w czym mają wielkie doświadczenie.
Krok 4. Komputer podejmuje decyzję według następującej formuły:
(A) liczy dla każdej z rozpatrywanych opcji wielkość:
nlxol + n2xo2 +n3xo3 +nkxok + ...,
gdzie nk - liczba posłów lub liczebność klubów przypisujących aspektowi k
wartość l, ok - ocena ekspertów skutków rozpatrywanej opcji ze względu na aspekt k;
(B) wybiera opcję o najwyższej wartości policzonego wskaźnika. Co dawałaby taka procedura? Bardzo ważną zmianę. Na decyzję (na przykład o progach podatkowych) miałyby wpływ wszystkie wymieniane przez parlamentarzystów aspekty - te aspekty, których waga została doceniona przynajmniej przez jeden klub parlamentarny. I nie tylko to. Na decyzję wpłynie także oceniana przez ekspertów wielkość konsekwencji przyjętego rozwiązania. Tak więc obywatele nie płaciliby wyższych albo niższych podatków tylko dlatego, że tak wynika z interesów i polityki partii rządzących.
Oczywiście, jest to tylko utopia. Nie wydaje się, aby istniały takie partie i takie parlamenty, które zdecydowałyby się na dobrowolne uszczuplenie swojej władzy. A jednak bywają instytucje, które z pożytkiem stosują tego rodzaju procedury. Oto jedna z ilustracji.
8.7. Wybór amunicji do karabinów policyjnych
Pouczające doświadczenie z zastosowaniem procedury analitycznej przy decyzji w sprawie zmiany amunicji w karabinach policyjnych w Denver opisali Hammond i Adelman (za: Dawes, 1988).
W roku 1974 policja w Denver wystąpiła z propozycją zmiany amunicji w karabinach policyjnych: zamiast konwencjonalnych naboi z zaokrąglonym czubkiem chciała wprowadzić naboje spłaszczone. Twierdzono, że takie spłaszczone naboje zwiększą siłę przebicia i będą skuteczniejsze w zatrzymywaniu przestępców. Pojawili się jednak przeciwnicy, którzy twierdzili, że
OCENY GLOBALNE CZY CZĄSTKOWE
SBW^SS:: BH^B:i^ waSBBifi3^-s;?B: ^^fy^^^ww^SS^-WWS^^fiffWSW^ffSwfSSi
naboje takie będą powodowały zbyt duże uszkodzenia u postrzelonych. Spo ry były bardzo gwałtowne, obie strony powoływały się na opinie ekspertów w debacie (jak zawsze) przedstawiano różne aspekty sprawy: fizyczną sku teczność amunicji i społeczne skutki przyjęcia każdego z rozwiązań.
Hammond i Adelman wykonali prosty zabieg: otrzymali od .zainteresowa nych ważne wymiary (kryteria), według których należałoby- porównywa' naboje. Okazało się, że kryteria te były następujące: skuteczność w zatrzy mywaniu (prawdopodobieństwo, że osoba ugodzona w klatkę piersiową bę dzie zdolna odpowiedzieć strzałem w kierunku policjanta), pra^wdopodobień stwo poważnego zranienia i prawdopodobieństwo zranienia przechodniów Następnie poproszono ekspertów balistycznych o ocenę różnych naboi zi względu na te trzy aspekty.
Okazało się przede wszystkim, że dwie cechy - prawdopodobieństwo po ważnego zranienia i prawdopodobieństwo zranienia przechodniów _ są bar dzo ze sobą skorelowane; naboje wysoko ocenione na jednym z tych wymia rów są zarazem wysoko ocenione na drugim wymiarze. Oznaczało to że dl;
porównania naboi wystarczy wziąć pod uwagę tylko skuteczność w zatrzy mywaniu i jedną z tych skorelowanych cech.
Ponieważ administracja nie mogła dojść do porozumienia, który z wymia rów jest ważniejszy, zaproponowano potraktować oba jako jednakowo waż ne. Porównanie ocen ekspertów szybko pokazało, że jeden z rozpatrywanycł rodzajów nabojów jest lepszy od pozostałych ze względu na oba niezależni kryteria: skuteczność w zatrzymywaniu i prawdopodobieństwo poważnegi zranienia (tym samym prawdopodobieństwo zranienia przechodniów). Na boje te okazały się lepsze zarówno od używanych dotychczas przez policję jak i od proponowanych. Wybór był więc jasny, cała sztuka polegała na tym żeby ustalić, co i jak porównywać.
Złudzenia w ocenianiu szans - wyolbrzymianie i niedocenianie szans
W wielu sytuacjach musimy oceniać szansę zajścia takiego czy innego zdarzenia. Przykłady:
- poprawa/pogorszenie koniunktury gospodarczej w następnym roku;
- wzrost/spadek inflacji;
- wzrost/spadek ceny kupowanych akcji;
- szansę kandydata w wyborach prezydenckich;
- trafność diagnozy medycznej;
- ocena prawdziwości zeznań świadka;
- wygrana w toto-lotka.
W ocenach tego typu staramy się określić prawdopodobieństwo tego, że dane zdarzenie miało albo będzie miało miejsce. Niektóre z takich niepewnych zdarzeń oceniamy jako całkowicie niemożliwe (na przykład, żeby człowiek dożył 500 lat), inne oceniamy jako całkowicie pewne (na przykład, że następnego dnia wzejdzie słońce), a większości zdarzeń przypisujemy rozmaity stopień prawdopodobieństwa. Jak dokonujemy tego rodzaju oceny szans? Jaka jest ich trafność? Jakie charakterystyczne błędy popełniamy w tym procesie?
Tversky i Kahneman (1973) w serii eksperymentów pokazali, że przy tworzeniu tego rodzaju ocen ludzie mają skłonność kierować się pewnymi heurystykami (zasadami, które bywają użyteczne, ale nie dają gwarancji trafności). Jako najbardziej typowe opisali trzy takie heurystyki: zasadę reprezentatywności, zasadę zakotwiczenia i zasadę dostępności psychicznej. Jak podkreślają autorzy, każda z tych zasad stanowi w zwykłych warunkach dość dobry sposób oceny szans niepewnych zdarzeń; stwarza jednak charakterystyczne pułapki, które mogą prowadzić do poważnych wypaczeń oceny prawdopodobieństwa.
Część prezentowanych w tym rozdziale badań jest przedstawiona w rozdziale 4. mojej książki Psychologia zachowań ekonomicznych (Tyszka, 1997).
z.c.uuz.blMlA W OGtiMiMiMiu o^-ftiNo
9.1. Zasada reprezentatywności
Spróbujmy zastanowić się nad następującym zdarzeniem: wykonano sześć rzutów monetą. Który z następujących wyników jest najbardziej prawdopodobny, a który najmniej:
(a) O-R-R-O-O-R
(b) O- O-O-R-R-R
(c) R-R-R-R-R-R
Większość pytanych osób uważa, że najbardziej prawdopodobny jest ciąg (a), później (b), a najmniej prawdopodobny jest ciąg (c). Intuicja ta jest jednak złudna. Każdy z trzech ciągów ma równą szansę wystąpić przy sześciu rzutach monetą, gdyż przy każdym kolejnym rzucie może równie dobrze wypaść orzeł, jak i reszka. Zatem wszystko jedno, co zdarzyło się w poprzednich rzutach, w każdym rzucie jednakowo prawdopodobne jest O i R.
Skąd więc bierze się nasze złudzenie? Zdaniem Kahnemana i Tversky'ego (1973) jest to wynik posługiwania się zasadą reprezentatywności. Ciąg (a) jest dlatego uważany w intuicyjnych ocenach za najbardziej prawdopodobny, bo jest najbardziej podobny, "reprezentatywny" dla procesu losowego, z którego pochodzi: "przedstawia naocznie" jednakowe prawdopodobieństwo uzyskania orła i reszki. Jak to sformułowali Kahneman i Tversky (1973), posługując się zasadą reprezentatywności oceniamy prawdopodobieństwo niepewnych zdarzeń według tego, w jakim stopniu są one podobne do populacji, z której pochodzą, albo w jakim stopniu posiadają wyróżniające cechy procesu, który je wytwarza. Stąd zakładając równe szansę wystąpienia orła i reszki i oczekując w długiej serii (w populacji) równej liczby orłów i reszek, przyjmujemy, że to samo zrealizuje się także w krótkiej serii (próbce z populacji).
Jak wypełniać toto-lotka? Popatrzmy na trzy wypełnione kupony totolotka i wybierzmy ten, który najchętniej wysłalibyśmy do kolektury.
y
2
3
4
5
6
7
A
9
10
11
12
13
14
^
16
17
18
19
20
21
N
23
24
25
26
27
28
R
30
31
32
33
34
35
x
37
38
39
40
41
42
43
44
45
46
47
48
49
1
X
X
X
X
X
X
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
1
2
3
4
5
6
7
8
9
10
11
12
^
14
15
16
17
18
19
X
21
22
23
X
25
26
27
28
29
30
31
32
33
34
X
36
37
38
39
40
X
42
43
44
45
46
X
48
49
Rys. 9.1.
Trzy wypełnione kupony toto-lotka.
Przeglądając wypełnione kupony, prawie nie spotyka się wzorów A i B. Wydają się one graczom nieprawdopodobne (czy wręcz niemożliwe). Rzeczywiście, są one "nieprawdopodobne", ale ani więcej, ani mniej "nieprawdopodobne" niż wzór C czy jakikolwiek inny wzór skreśleń. Wzory A i B uświadamiają tylko dobrze, jak niskie są szansę wygrania w toto-lotka. Jeżeli mimo to ktoś decyduje się na grę, to roztropnie zrobi, przyjmując wzory wypełniania A i B, a to dlatego, że prawie nikt ich nie używa (chyba że teraz pod wpływem lektury tej książki!) i w związku z tym nie trzeba będzie dzielić się z nikim wygraną.
Można wykazać wiele błędów w ocenach prawdopodobieństwa, wynikających z posługiwania się zasadą reprezentatywności.
9.2. Zasada reprezentatywności w kasynach gry - złudzenie gracza
W kasynach bez trudu można obserwować następującą prawidłowość. Jeżeli w ruletce przez kilka kolejnych rzutów kula zatrzyma się na polu czerwonym, to coraz mniej graczy kontynuuje obstawianie tego pola, gracze zaczynają obstawiać czarne pole. Stają się coraz bardziej i bardziej pewni, że w następnym rzucie kula zatrzyma się na polu czarnym.
Jak wynika z listów pisanych przez Fiodora Dostojewskiego do żony Anny, wielki pisarz ulegał najwyraźniej temu złudzeniu. Oto dwa cytaty z tych listów, pokazujące, jak optymistyczne były jego oczekiwania:
Do Anny Dostojewskiej w Dreźnie
Hamburg, sobota 18 maja (1867)
dziesiąta rano
[...] Po obiedzie znów poszedłem do kasyna z mocnym postanowieniem, że będę rozsądny do ostateczności. I, Bogu dzięki, odegrałem swoich 16 imperiałów, a ponadto wygrałem jeszcze 100 guldenów. Miałbym 300, taka suma znajdowała się już w mych rękach, jednakże zaryzykowałem i sfuszerowa-lem. Aniu, oto ostateczna konkluzja, do której doszedłem: gdyby się było zimnym jak marmur i nieludzko ostrożnym, to niechybnie, bez żadnych wątpliwości można wygrać, ile się tylko zapragnie. [...]
Do Anny Dostojewskiej w Dreźnie
Hamburg, środa 22 maja (1867) dziesiąta rano
[...] Wybacz mi, aniele mój, ale muszę ci przedstawić niektóre szczegóły mego przedsięwzięcia, to znaczy gry w ruletkę, abyś miała jasne wyobrażenie
ZŁUDZENIA W OCENIANIU SZANS
o tym, na czym rzecz polega. Co najmniej dwudziestokrotne uczestnictwo w grze pozwala mi twierdzić, że gdyby w grze zachować zimną krew, spokój i wyrachowanie, to nie ma żadnej możliwości przegranej. Przysięgam ci, nie ma takiej możliwości! Tam ślepy los, a u mnie wyliczenie, a więc ja mam nad nim przewagę. Jak to jednak wyglądało w praktyce? Zaczynałem z reguły od czterdziestu guldenów, wyciągałem je z kieszeni i siadałem do stołu stawiając po jednym lub po dwa guldeny. Po czterech godzinach na ogól (zawsze) byłem w dwójnasób wygrany. I wtedy należałoby przerwać grę i wyjść, przynajmniej do wieczoru, aby uspokoić nerwy (zaobserwowałem też, to z całą pewnością słuszne spostrzeżenie, że spokój i zimną krew potrafię zachować bez przerwy jedynie w ciągu pól godziny). Ja jednak odchodziłem od stolika jedynie po to, by wypalić papieroska, poczem natychmiast znów wracałem do gry. [...J (Dostojewski, maszynopis).
Owo wyrachowanie i niezawodną strategię ujawnia Dostojewski w Graczu (1992, str. 179):
[... ] Masz, postaw natychmiast na zero.
Ale Antonido Wasiliewno, zero dopiero co wyszło - powiedziałem - więc teraz długo się nie pokaże. Długo pani będzie musiała stawiać; proszę choć trochę poczekać.
I dalej (str. 217) [...] Przyczepi się na przykład szczęście do czerwonego i nie opuszcza go przez dziesięć, a nawet piętnaście razy z rzędu. [...] Rozumie się, wszyscy natychmiast opuszczają czerwone, już po dziesięciu razach i prawie nikt nie decyduje się na nie stawiać.
Jest to złudzenie znane pod nazwą "złudzenie gracza". Opiera się ono właśnie na zasadzie reprezentatywności: ludzie sądzą, że poszczególna seria wyników w ruletce nie powinna zawierać samych czerwonych, gdyż nie odpowiada to losowemu charakterowi sekwencji. Widać tu oczekiwanie graczy, że kula posiada coś w rodzaju pamięci i po serii czerwonych będzie się starała zrównać je czarnymi polami.
O tym, że jest to złudzenie, mógł się przekonać również Dostojewski, który wbrew zapowiedzi, że nie będzie już grać, tracił kolejne przesyłki pieniędzy przysyłane przez żonę i którego kolejny (wcale nie ostatni) list zaczyna się tak oto:
Do Anny Dostojewskiej w Dreźnie
Hamburg, 24 maja (1867)
Aniu miła, przyjacielu mój, żono moja, wybacz mi i nie nazywaj łajdakiem! Popełniłem przestępstwo, wszystko, co mi przesłałaś, przegrałem, wszystko do ostatniego krajcara! Jeszcze wczoraj dostałem pieniądze i wczoraj też wszystko przegrałem! Jakże teraz spojrzę ci w oczy, co ty sobie teraz o mnie pomyślisz! Jedno i tylko jedno mnie w tej chwili gnębi: co powiesz i co sobie
roT>^ni^i-^n_in^z-i\c rui-Mi-iM ui^ciMiMiMift l i-UL>e.JiviuwANIA DECYZJI
o mnie pomyślisz? Twój sąd będzie dla mnie ostateczny! Czy będziesz mogla mnie teraz szanować! Czyż bowiem możliwa jest miłość bez szacunku? Ten mój postępek zachwiał cale nasze małżeństwo. Przyjacielu mój, nie osądzaj mnie ostatecznie! Nienawidzę ruletki, nienawidziłem jej zawsze i wczoraj, i dawniej, niechaj będzie przeklęta! Gdy otrzymałem wczoraj pieniądze po wymienieniu weksla, poszedłem do kasyna z myślą, by choć trochę się odegrać, choć minimalnie powiększyć nasze finanse. Pewien byłem niewielkiej wygranej. Początkowo niewiele przegrałem, gdy jednak zacząłem przegrywać, to grałem dalej chcąc się odegrać i przegrywałem co raz więcej i im więcej przegrywałem, tym bardziej chciałem się odegrać i rad nie rad kontynuowałem grę, by chociaż wróciły mi się pieniądze potrzebne na wyjazd i - przegrałem wszystko. [...] (Dostojewski, maszynopis).
9.3. Ignorowanie ogólnych prawidłowości
Inną konsekwencją kierowania się zasadą reprezentatywności przy szacowaniu szans jest ignorowanie ogólnych statystycznych prawidłowości. Oto ktoś nam mówi, że pewne zamówienie rządowe doszło do skutku dlatego, że właściciel firmy, która otrzymała zamówienie, dał łapówkę wysokiemu urzędnikowi z odpowiedniego ministerstwa. Czy uwierzyć temu doniesieniu? Oczywiście, zależy to od wiarygodności osoby, która przekazuje tę informację. Wiadomo, że są ludzie, którzy wymyślają różne takie sensacyjne plotki, lecz są też inni, którzy wiedzą, co mówią. Ale co zrobić w przypadku, kiedy przekazujący wiadomość nie jest ani skrajnym łgarzem, ani nie jest człowiekiem bezwzględnie wiarygodnym (na ogół mamy do czynienia z takimi właśnie pośrednimi przypadkami). Czy na nasze przyjęcie bądź odrzucenie informacji powinna mieć wpływ ogólna wiedza na temat tego, jak często przy zamówieniach rządowych dochodzi do wręczania łapówek? Powinna! Wyobraźmy sobie bowiem, że żyjemy w kraju, w którym przy każdej takiej okazji wręczana jest łapówka. Oczywiście, w takiej sytuacji trzeba przyjąć, że informacja o tym, iż w danym konkretnym przypadku została wręczona łapówka, zasługiwałaby całkowicie na wiarę, niezależnie od wiarygodności osoby przekazującej nam tę informację. Z kolei w drugim skrajnym przypadku (spróbujmy sobie pomarzyć), gdybyśmy żyli w kraju, w którym w ogóle nie zdarza się wręczanie łapówek, informacja o tym, iż w danym konkretnym przypadku została wręczona łapówka, byłaby całkowicie niewiarygodna, niezależnie od wiarygodności osoby przekazującej nam tę informację. Ogólnie zaś obowiązuje reguła, że im częściej przy okazji zamówień rządowych wręczane są łapówki, tym większe mamy podstawy wierzyć w informację, że w danym konkretnym wypadku łapówka została wręczona.
ZŁUDZENIA W OCENIANIU SZANS
Skrzywienie polegające na ignorowaniu ogólnych statystycznych prawidłowości polega na tym, że nie mamy poczucia, iż przy przyjmowaniu danej informacji powinniśmy się kierować owymi ogólnymi tendencjami. Daje się to dobrze zilustrować przykładem wziętym z badań Kahnemana i Tvers-ky'ego (1973). Przedstawiono w nich badanym następujący problem:
W pewnym mieście zdarzył się wypadek. Taksówkarz, który go spowodował, uciekł. Wmieście tym działają dwa przedsiębiorstwa taksówkowe: "Zielone" i "Niebieskie". Wiadomo przy tym, że:
(1) 85% taksówek w tym mieście należy do przedsiębiorstwa "Zielone" i ma ten kolor, a 15% należy do przedsiębiorstwa "Niebieskie" i jest koloru niebieskiego.
(2) Świadek zajścia zidentyfikował taksówkę, która spowodowała wypadek, jako niebieską. Stwierdzono jednak po zbadaniu świadka, że w danych warunkach oświetleniowych świadek ten nie jest w pełni rzetelny i potrafi dokonać trafnej identyfikacji tylko w 80% przypadków. Jakie jest w tej sytuacji prawdopodobieństwo, że wypadek został spowodowany przez taksówkę niebieską? Jeżeli uwzględnimy oba rodzaje danych, to znaczy podstawową proporcję taksówek i wiarygodność świadka, możemy zastosować odpowiednią formułę probabilistyczną- znaną jako reguła Baye-sa - i obliczyć stosunek prawdopodobieństw tego, że przy podanych informacjach D wypadek spowodowała niebieska taksówka (H) bądź zielona taksówka (H'). Formuła ta wyraża się wzorem:
p(H/D) / p(H'/D) = [p(D/H) p(H)] / [p(D/H') p(H')],
gdzie p(H/D) i p(H'/D) to prawdopodobieństwa tego, że przy podanych informacjach D wypadek spowodowała niebieska taksówka (H) lub zielona taksówka (H');
p(D/H) i p(D/H') to prawdopodobieństwa trafnego zidentyfikowania przez świadka niebieskiej taksówki, która spowodowała wypadek, i zielonej taksówki, która spowodowała wypadek;
p(H) i p(H') to wyjściowe prawdopodobieństwa tego, że niebieska taksówka (H) lub że zielona taksówka (H') spowodowała wypadek. Podstawiając odpowiednie dane, otrzymujemy:
p(H/D) / p(H'/D) = 0,80 x 0,15 / 0,20 x 0,85 = 12/17, stąd prawdopodobieństwo tego, że niebieska taksówka spowodowała wypadek, wynosi: p(H/D) = 12 / (12+17) = 0,41.
Tak więc nawet jeśli ktoś nie śledził rachunkowego wywodu, uwzględniając oba rodzaje danych, czyli podstawową proporcję taksówek w mieście i wiarygodność świadka, należy uznać za bardziej prawdopodobne, że wypadek spowodowała taksówka zielona niż niebieska.
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Typową oceną podawaną przez badanych studentów była jednak wielkość 80%. Oznacza to, że brali oni pod uwagę jedynie wiarygodność świadka, zupełnie ignorując podstawową proporcję między taksówkami obu kolorów, która wskazywała na taksówkę zieloną jako bardziej prawdopodobnego sprawcę wypadku. Zdaniem Kahnemana i Tversky'ego (1973) działa tu właśnie zasada reprezentatywności. Zeznanie świadka (choćby i nie w pełni wiarygodne) -jako odnoszące się do danego konkretnego przypadku -jest traktowane jako bardziej typowe (reprezentatywne) dla tego przypadku niż ogólna proporcja taksówek.
A oto inny przykład, także wzięty z badań Kahnemana i Tversky'ego (1973). Przedstawiono w nich badanym studentom następujący problem:
Grupa ekspertów - psychologów przeprowadziła 100 wywiadów, z 70 inżynierami i z 30 prawnikami. Na tej podstawie psychologowie przygotowali krótkie charakterystyki tych osób. Otrzymasz teraz jedną z takich charakterystyk. Dotyczy ona Johna.
Ma on 30 lat. Jest żonaty i ma dwoje dzieci. Działa aktywnie w lokalnych organizacjach politycznych. Jego największym hobby jest kolekcjonowanie książkowych "białych kruków". Jest osobą elokwentną, przekonywającą i nastawioną rywalizacyjnie.
Pytanie brzmiało: jakie jest prawdopodobieństwo, że opisany mężczyzna jest raczej prawnikiem niż inżynierem.
Jeżeli uwzględnimy oba rodzaje danych, tj. (a) podstawową proporcję inżynierów i prawników wśród osób, z którymi przeprowadzono wywiady, oraz (b) przedstawioną charakterystykę osoby, to mimo "lepszego" dopasowania opisu do typowego prawnika niż do typowego inżyniera, bardziej prawdopodobne jest, że opis odnosi się do jakiegoś inżyniera, a nie prawnika. Decyduje o tym ogromna przewaga inżynierów wśród osób przebadanych przez psychologów. A jednak według przewidywań badanych studentów opisany mężczyzna był prawnikiem.
Znowu działa tu zasada reprezentatywności. W ocenach badanych przewagę zyskiwało porównywanie opisu Johna ze stereotypem prawnika i inżyniera, podczas gdy informacja statystyczna o proporcji inżynierów i prawników nie była w ogóle uwzględniana. Tworzone opinie są zupełnie nieczułe na informację statystyczną.
Ignorowanie informacji statystycznej może mieć różne negatywne konsekwencje. Oto zastanawiając się nad zainwestowaniem naszych pieniędzy (w operacjach bankowych, na giełdzie), chętnie rozważamy przyszłe zyski z owych przedsięwzięć, natomiast nie sprawdzamy podstawowych statystyk mówiących o tym, jak często przedsięwzięcia takie kończą się powodzeniem, a jak często niepowodzeniem.
ZŁUDZENIA W OCENIANIU SZANS
Ignorowanie ogólnych prawidłowości w sądzie.
Powyższy przykład sugeruje, że zasada reprezentatywności może mieć ogromne znaczenie w praktyce sądowej. Sądy rzeczywiście korzystają z dwóch rodzajów informacji: (l) zeznań świadków, które odnoszą się do danego jednostkowego przypadku oraz (2) informacji statystycznych pochodzących od różnego typu ekspertów - na przykład, że określonego typu odciski palców występują rzadziej niż raz na dziesięć tysięcy, że określona grupa krwi jest bardzo rzadka (posiadają tylko 1% osób), że 1/3 samobójców zostawia listy itd. Czy oba rodzaje informacji są traktowane w sądzie z jednakową wagą? Wyobraźmy sobie sytuację, gdy świadek napadu dokonanego w Warszawie zeznaje, że napastnik był czarnoskóry. Ponieważ jednak napad odbył się o zmroku, wiarygodność świadka nie przekracza 90%. Z drugiej zaś strony sędzia otrzymuje statystykę mówiącą, że proporcja ciemnoskórych mężczyzn w Warszawie wynosi l na 10000. Co sędzia powinien przyjąć? Intuicja, a także obserwacja praktyki sądowej (Saks, Kidd, 1988) sugerują, że informacja jednostkowa, jako odnosząca się do danego konkretnego przypadku, nawet wtedy, gdy jest niepewna (zeznania świadków są zawodne), powinna być traktowana jako ważniejsza niż ogólne prawidłowości statystyczne.
Saks, Kidd (1988) argumentują jednak, że postępowanie takie jest niesłuszne. Podają następujący hipotetyczny przykład zawierający wybór między informacją statystyczną a informacją pochodzącą od nie w pełni wiarygodnego świadka. Przypuśćmy, że postawiono przed nami dwa odwrócone dnem do góry kubki, z których każdy przykrywa jedną kulkę. Dowiadujemy się przy tym, że pod jednym wskazanym kubkiem znajduje się kulka wylosowana z pojemnika zawierającego 90% kuł czerwonych. O drugim kubku pewien przygodny świadek powiada, iż widział akurat, jak wkładano tam czerwoną kulkę; rzecz w tym, że wiadomo, iż świadek ten nie zawsze mówi prawdę, a dokładnie wiadomo, że mówi prawdę w 80% przypadków. Przyjmijmy, że za odkrycie kulki czerwonej mamy obiecaną dużą nagrodę. Który pojemnik byśmy odsłonili? Ponieważ informacja statystyczna daje tu szansę wygrania 90%, a informacja jednostkowa - szansę 80%, więc każdy rozsądny człowiek powinien wybrać tę pierwszą. Saks, Kidd (1988) argumentują, że zgodnie z tą samą logiką sąd powinien z jednakową wagą traktować pochodzące od ekspertów informacje statystyczne i pochodzące od świadków informacje dotyczące przypadków jednostkowych.
Ignorowanie ogólnych prawidłowości w polityce personalnej.
Zasada reprezentatywności może mieć ogromne znaczenie w selekcji pracowników i polityce personalnej. Wyobraźmy sobie dwóch absolwentów ubiegających się o pewne atrakcyjne stanowisko. Załóżmy, że jeden z nich - kandydat A - pochodzi z renomowanej szkoły biznesu, o której wiadomo, że większość - ok. 80% jej absolwentów - ma znakomite przygotowanie do
. " -. r ^> i wn'^i-<-"-ii>^-i^r: rut-MrtM uutiMlAMIA l HU DOJMOWANIA DECYZJI
SSi^aia^gBiii^Sffl»S;Si:S:^?H^aea^^^S3BBSiB:igaaB^a(tm)iBB^^^
pracy na tym stanowisku. Kandydat B pochodzi ze znacznie mniej renomowanej szkoły biznesu, o której wiadomo, że najwyżej 20% jej absolwentów ma dobre przygotowanie do pracy na rozważanym stanowisku. Dział personalny otrzymał podania obu kandydatów oraz opinie na ich temat wydane przez władze uczelni. Oba dokumenty dają przewagę kandydatowi B: jego podanie jest napisane w sposób bardziej inteligentny niż podanie kandydata A i opinia o nim jest bardziej pozytywna niż opinia o kandydacie A. Nic więcej o kandydatach nie wiadomo i nie da się uzyskać więcej informacji przed podjęciem decyzji o tym, którego przyjąć. Szef działu personalnego musi podjąć szybką decyzję.
Można się spodziewać, że zgodnie z zasadą reprezentatywności wybierze on kandydata B. I może się zdarzyć, że będzie to wybór trafny. A jednak większą pewność trafnego wyboru daje kandydat A. Ma on z góry 80% szans, że jest znakomicie przygotowany, zapewne są to szansę osłabione niezbyt błyskotliwie napisanym podaniem i niezbyt atrakcyjną opinią, ale jego konkurent, mimo błyskotliwie napisanego podania i świetnej opinii, ma duże szansę bycia niezbyt dobrze przygotowanym do proponowanego stanowiska.
9.4. Nieuwzględnianie regresji w przewidywaniach
Student na egzaminie trafił na temat, z którego był najlepiej przygotowany, i naturalnie egzamin poszedł mu wyśmienicie. Czego może się spodziewać po następnym egzaminie, że również będzie miał taki wyjątkowy fart, trafi mu się "najlepsze" pytanie i że zda znakomicie? Gdyby było tak dobrze, to studenci mieliby znacznie mniej pracy, niż faktycznie mają. Powinien raczej się spodziewać, że następny egzamin nie pójdzie mu tak dobrze.
Ktoś wygrał sporą sumę w toto-lotka. Czy powinien liczyć, że w następnym losowaniu wygra jeszcze więcej? Powinien raczej oczekiwać, że następnym razem wygra mniej (a najpewniej nic nie wygra). Działa tu bowiem, podobnie jak w przypadku "fartownego studenta", tzw. prawo regresji do średniej: po pojawieniu się wyniku wyjątkowo dobrego należy oczekiwać, że następne wyniki będą bliższe wyniku średniego (będą gorsze). Symetrycznie zresztą prawo to głosi, że po pojawieniu się wyniku słabego należy oczekiwać, że następne wyniki będą także bliższe wyniku średniego (będą lepsze). A jednak kierując się zasadą reprezentatywności, mamy skłonność niedoceniania (nieuwzględniania) owej regresji w naszych przewidywaniach.
Oto nauczyciel przeprowadził w pewnej klasie pierwszą klasówkę i podzielił uczniów według uzyskanych wyników na trzy grupy: słabszych, średnich i lepszych. Czego powinien spodziewać się nauczyciel po następnej klasówce: (a) powtórzenia się ocen, (b) jeszcze większego zróżnicowania, tak że
ZŁUDZENIA W OCENIANIU SZANS
uczniowie, którzy za pierwszym razem otrzymali słabsze stopnie, otrzymają jeszcze słabsze, a ci uczniowie, którzy za pierwszym razem otrzymali lepsze stopnie, otrzymają za drugim razem jeszcze lepsze, czy (c) tego, że przy następnej klasówce wyniki grupy słabszej się poprawią, a wyniki grupy lepszej się pogorszą. Wbrew naszej intuicji istnieją statystyczne powody, by nauczyciel oczekiwał zdarzenia (c) - wyniki grupy słabszej powinny się poprawić, a wyniki grupy lepszej powinny się pogorszyć. Jest to statystyczne prawo regresji do średniej.
Rzecz w tym, że prawo to zupełnie nie pasuje do naszej intuicji. Nauczyciel, który uzyska zgodny z nim wynik, zacznie się zastanawiać, co takiego stało się w tej klasie. Może pomyśleć, że uczniowie słabi przestraszyli się i zabrali się do pracy, a uczniowie dobrzy opuścili się w nauce. Nasuwałoby to przypuszczenie, że kara jest skuteczniejszym środkiem wychowawczym niż nagroda. Tymczasem jest to naturalna tendencja regresji do średniej.
Podobnie w sporcie można obserwować następującą prawidłowość: sportowiec, który osiągnął nadzwyczaj dobry wynik i trafia na okładki magazynów zaraz potem, zamiast potwierdzić swój wysoki poziom, osiąga wynik wyraźnie gorszy. Działacze i kibice zaczynają naturalnie natychmiast spekulować, że te nagły sukces wpłynął demobilizująco na zawodnika. Tymczasem jest to wyniŁ całkowicie zgodny z prawami statystyki: po pojawieniu się wyniku wyjątkowe dobrego (albo wyjątkowo złego) - w szkole, w sporcie, czy w innej dziedzinie - należy oczekiwać regresji (pogorszenia w przypadku dobrego wyniku i po prawy w wypadku złego wyniku) w kierunku wyniku średniego. Zgodnie z tync prawem, ponieważ sportowiec trafia na okładki magazynów wtedy, gdy rżę czywiście osiągnął nadzwyczaj dobry wynik, należy oczekiwać (a nie dziwił się), że jego następny wynik będzie z reguły gorszy od poprzedniego.
Zapominanie o prawie regresji do średniej jest potencjalnie groźnym zja wiskiem w polityce personalnej i zarządzaniu kadrami. Nie uwzględniajął go, tworzy się złudne oczekiwania, że osoba uzyskująca znakomity wynil będzie go stale potwierdzać, a osoba uzyskująca słaby wynik nie może g( poprawić. Ponieważ oczekiwania te muszą zostać zawiedzione, będą się po jawiąc błędne spekulacje na temat powodów ich niespełnienia. Nauczycie] trener, kierownik zaczną podejmować beznadziejne próby zapobieżeń!;
zmniejszeniu się mobilizacji.
Bazerman (1994) formułuje następujące zadanie, z jakim może się ze tknąć osoba odpowiedzialna za planowanie zaopatrzenia sklepów w sprze dawane produkty. Przyjmijmy, że w dziewięciu podległych jej sklepach sprze dąż w roku 1996 wynosiła tyle, ile podano w poniższym zestawieniu. Należ:
zaplanować zaopatrzenie na rok 1998, zakładając zgodnie z opracowanym prognozami, że całkowita sprzedaż w roku 1998 wzrośnie w porównaniu d' roku 1996 o 10%.
Sklep
1
2
3
4
5
6
7
8
9 Sprzedaż całkowita
1996 $12000,000 11500,000 11000,000 10500,000 10000,000 9500,000 9000,000 8500,000 8000,000
$90000,000
.iNinitiM i I-^UCJMUWANIA DECYZJI
^BB^aasB^aiasasBB^aiaagaBBggBBgBB^:^^^^^
1998
$99000,000
Ignorując prawo regresji do średniej, moglibyśmy mieć skłonność podnieść zaopatrzenie każdego sklepu o te same 10%, czyli pierwszemu do $13200,00, drugiemu do $12650,000, a ostatniemu do 8800,000. Postępując tak, najprawdopodobniej popełnilibyśmy błąd, polegający na tym, że sklepy, które w roku 1996 sprzedały więcej, w roku 1998 miałyby zapasy, a sklepy, które w roku 1996 sprzedały mniej, w roku 1998 miałyby niedobór produktów. Rozważny kierownik powinien rozdzielić produkty między sklepy w sposób bardziej równomierny (choć nie całkowicie równomierny!).
9.5. Błąd koniunkcji
Kiedy rozpatrujemy szansę uzyskania orła przy rzucie monetą i szansę uzyskania dwu orłów przy dwu rzutach monetą, nie mamy wątpliwości, że ta druga możliwość jest mniej prawdopodobna. Możliwość uzyskania dwu orłów w dwóch rzutach jest koniunkcją dwóch zdarzeń: uzyskania orła w pierwszym rzucie i uzyskania orła w drugim rzucie. Prawdopodobieństwo koniunkcji jakichś zdarzeń musi być mniejsze niż prawdopodobieństwo pojedynczego zdarzenia należącego do tej koniunkcji. (Na przykład prawdopodobieństwo, że pierwszym spotkanym człowiekiem po wyjściu na ulicę będzie mężczyzna-blon-dyn musi być mniejsze od prawdopodobieństwa, że będzie to jakikolwiek mężczyzna). Okazuje się jednak, że w pewnych sytuacjach popełnia się nawet tego rodzaju błędy. Tversky i Kahneman (1983) przedstawiali badanym następujący opis pewnej kobiety, nazwanej Lindą:
Linda ma 31 lat. Jest panną. Jest otwarta i bardzo bystra. Uzyskała dyplom z filozofii. Jako studentka była bardzo zaangażowana w sprawy dyskryminacji i sprawiedliwości społecznej. Uczestniczyła w manifestacjach antynuklearnych.
ZŁUDZENIA W OCENIANIU SZANS
Prosili następnie, by badani uporządkowali następujące stwierdzenia według ich prawdopodobieństwa:
Linda jest nauczycielką w szkole podstawowej;
Linda pracuje w księgarni i bierze lekcje jogi;
Linda jest aktywistką ruchu kobiecego (A);
Linda jest psychiatrycznym kuratorem społecznym;
Linda jest członkiem organizacji kobiecej;
Linda jest kasjerką (B);
Linda zajmuje się sprzedażą ubezpieczeń;
Linda jest kasjerką i aktywistką ruchu kobiecego (A i B).
Zadziwiający wynik uzyskany przez Tversky'ego i Kahnemana polegał na tym, że badani uznawali za bardziej prawdopodobne to, że Linda jest kasjerka i zarazem aktywistką ruchu kobiecego, niż to, że jest po prostu kasjerką (niezależnie od tego, czy jest, czy nie jest aktywistką ruchu kobiecego). A więc prawdopodobieństwu złożonego zdarzenia (A i B) badani nadawali wyższe rangę niż prawdopodobieństwu składowej tego zdarzenia (A). Ten naruszający logikę rezultat jest, jak można sądzić, spowodowany tym, że reprezentatywna dla Lindy cecha bycia aktywistką ruchu kobiecego "poprawia" jakoś szansę zdarzenia, że jest ona równocześnie i kasjerką, i aktywistką ruchu kobiecego (samo bycie kasjerką wydaje się ogromnie mało prawdopodobne).
Dlaczego popełniany jest błąd koniunkcji? Zanim odpowiemy na to pytanie, zastanówmy się, czy wydaje nam się prawdopodobne, by młody człowiek pan XY, który rozpoczął studia, ale był studentem słabym, niesystematycznym, a ogólnie także nieaktywnym ("ospałym"), po kilku latach znalazł się m liście 100 największych przedsiębiorców w Polsce? Taki obrót sprawy wydaje się nam mało prawdopodobny.
Ale wyobraźmy sobie następujący przebieg losów pana XY. W roku 199C zostaje skreślony z listy studentów i, nie mając z czego się utrzymać, pracuje na czarno dla przemytnika alkoholu. Szybko orientuje się, że to, co robi równie dobrze może robić na własne konto. Zaczyna szybko zarabiać duż( pieniądze. Akurat kiedy kończy się dobry okres dla przemytu alkoholu, par XY spotyka przedsiębiorczego człowieka, który również zdobył pieniądze m przemycie i wspólnie otwierają produkcję napojów bezalkoholowych. Współ nik pana XY ma ogromne wyczucie rynku i przedsięwzięcie przynosi partne rom ogromne zyski. Po kilku latach obaj znajdują się na liście 100 najwięk szych przedsiębiorców w Polsce.
Czy taki obrót sprawy jest prawdopodobny? Wydaje się, że tak. Dlaczego' Dlatego, że śledząc krok po kroku poczynania studenta, dostrzeżemy możli wy scenariusz tego, jak słaby, nieaktywny student zostaje jednym ze 10( największych przedsiębiorców w Polsce. Scenariusz ten pozwala nam wie rzyć, iż zdarzenie to nie jest niemożliwe.
l *+U PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
•'^•••^iSSft&^a.ffci..- •- ':'.,-, - -..•-•'
Nie myślimy przy tym, że podany akurat scenariusz jest jedynym możliwym, można by sobie wyobrazić inne jeszcze scenariusze wydarzenia, że słaby, nieaktywny student zostaje jednym ze 100 największych przedsiębiorców w Polsce. To, że nie tworzymy owych innych scenariuszy, sprawia, iż w ocenie prawdopodobieństwa naruszamy zasady logiki. Jak powiada Da-wes (1988), nasze myślenie przebiega nie tyle według praw formalnej logiki, co raczej według łatwych do wyobrażenia (reprezentatywnych) obrazów czy scenariuszy.
Dawes podaje jeszcze inną ilustrację tego rodzaju: oto mamy pewnego znakomitego tenisistę, który jednak stał się alkoholikiem i, jak to się powiada, "stoczył się". Gdyby zapytano nas, czy jest prawdopodobne, żeby ów tenisista, który stał się alkoholikiem, wygrał ważne zawody, które mają się odbyć za osiem miesięcy, uznalibyśmy to za ogromnie nieprawdopodobne. Wyobraźmy sobie jednak następujący scenariusz: (l) tenisista przystąpił do klubu anonimowych alkoholików, (2) przestał pić, (3) tenisista ten wygrał ważne zawody. Zastanawiając się nad tymi kolejnymi zdarzeniami możemy uznać za całkiem prawdopodobne: (l) żeby pewien tenisista, który stał się alkoholikiem, przystąpił po miesiącu do klubu anonimowych alkoholików;
(2) żeby tenisista ten przestał pić; (3) żeby tenisista ten wygrał ważne zawody, które mają się odbyć za osiem miesięcy. Tak opisany obrót sprawy wydaje się prawdopodobny dlatego, że teraz widzimy, jak mogło dojść do tego, żeby tenisista, który stał się alkoholikiem, wygrał ważne zawody.
9-6. Zasada zakotwiczenia
Amos Tversky i Daniel Kahneman (1974) prosili grupę studentów, by szybko w pamięci oszacować następujący iloczyn:
8x7x6x5x4x3x2x1=?. Inną grupę studentów proszono o to samo dla następującego zapisu:
1x2x3x4x5x6x7x8=?
Środkowa wartość oszacowań (mediana) dla pierwszej grupy wyniosła 2250, a dla grupy drugiej - 512. Mając kalkulator, łatwo się przekonać, że prawdziwa wartość dla obu przypadków wynosi 40,320.
W innym eksperymencie Amos Tversky i Daniel Kahneman (1974) zadali grupie studentów pytanie: "Czy procent krajów afrykańskich w Organizacji Narodów Zjednoczonych przekracza 65?" Następnie poprosili tych samych
ZŁUDZENIA W OCENIANIU SZANS
studentów o podanie dokładnego procentu krajów afrykańskich w Organizacji Narodów Zjednoczonych. Środkowa ocena tej grupy wynosiła 45 procent.
Badacze zadali innej grupie studentów pytanie: "Czy procent krajów afrykańskich w Organizacji Narodów Zjednoczonych przekracza 10?" Następnie poprosili tychże studentów o podanie dokładnego procentu krajów afrykańskich w Organizacji Narodów Zjednoczonych. Środkowa ocena tej grupy wynosiła 25 procent.
Tversky i Kahneman wyjaśniają wyniki obu doświadczeń zasadą zakotwiczenia. W pierwszym eksperymencie studenci dokonywali przypuszczalnie mnożenia pierwszych dwóch, trzech czynników, a następnie zgadywali (ekstrapolowali) na tej podstawie całkowity wynik. Grupa, która szacowała ciąg malejący, zaczynała od wyniku większego niż grupa, która szacowała ciąg rosnący, i stąd powstała różnica w końcowej ocenie. W eksperymencie drugim podpowiedziano studentom albo wyższą, albo niższą wartość zakotwiczającą dotyczącą liczby krajów afrykańskich w Organizacji Narodów Zjednoczonych. Oba wyniki pokazują, że mamy skłonność do niedostatecznego korygowania wyjściowej oceny (skądkolwiek by ona pochodziła).
Heurystyka zakotwiczania i sądownictwo. Jaka jest liczba oszustw popełnianych przez firmy? Wraz z grupą kontrolerów przedsiębiorstw przeprowadzono badanie (za Bazerman, 1994), w którym sformułowano następujące zadanie:
Dobrze, wiadomo, że wiele oszustw dokonywanych przez kierownictwa przedsiębiorstw pozostaje niewykrytych, mimo nawet starannie przeprowadzanych kontroli. Powodem jest to, że powszechnie przyjęta procedura kontrolowania nie jest przystosowana do wykrywanie oszustw popełnianych na poziomie kierownictw zakładów. Chcielibyśmy zbadać tę sprawę, więc zaczynamy od zebrania ocen kontrolerów; jaka ich zdaniem jest skala oszustw popełnianych na poziomie kierownictw zakładów.
(1) Proszę odpowiedzieć, czy, opierając się na Pana(i) osobistym doświadczeniu, liczba oszustw popełnianych na poziomie kierownictw zakładów jest wyższa niż 10 na 1000 firm (tj. l procent) w kontrolowanych firmach ?
a. Tak, więcej niż 10 na 1000 kontrolowanych firm popełnia oszustwo na poziomie kierownictw zakładów.
b. Nie, mniej niż 10 na 1000 kontrolowanych firm popełnia oszustwo na poziomie kierownictw zakładów.
(2) Jaka jest szacowana przez Pana(ią) liczba oszustw popełnianych na
poziomie kierownictw zakładów w kontrolowanych firmach? Tu badany miał podać liczbę.
Według tej grupy badanych, średnia liczba oszustw popełnianych na poziomie kierownictw zakładów wynosi 16,5 na tysiąc.
PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Z inną grupą kontrolerów przedsiębiorstw przeprowadzono dokładnie takie samo badanie z jedną tylko różnicą, że w pierwszym pytaniu proszono o odpowiedź, czy więcej niż 200 na 1000 kontrolowanych firm popełnia oszustwo na poziomie kierownictw zakładów. Średnia liczba oszustw według tej grupy badanych wynosi 43,1 na tysiąc. Której grupie wierzyć?
Zauważmy jak łatwo sprytny adwokat lub prokurator może wpłynąć na otrzymane od eksperta oszacowanie. Załóżmy, że chodzi o trudną do oceny wielkość "ukrytego" przez przedsiębiorcę dochodu do opodatkowania. Oto wersja, którą można zastosować w wypadku, gdy adwokat/prokurator jest zainteresowany uzyskaniem zaniżonego oszacowania:
(1) Proszę powiedzieć, czy opierając się na Pana(i) osobistym doświadczeniu wielkość ukrytego dochodu jest wyższa niż 50000?
(2) Jaka jest szacowana przez Pana(ią) wielkość "ukrytego" dochodu? A oto wersja, gdy adwokat/prokurator jest zainteresowany uzyskaniem zawyżonego oszacowania:
(1) Proszę powiedzieć, czy opierając się na Pana(i) osobistym doświadczeniu, wielkość ukrytego dochodu jest wyższa niż 500000?
(2) Jaka jest szacowana przez Pana(ią) wielkość ukrytego dochodu?
Zgodnie z heurystyką zakotwiczenia przy pierwszej procedurze można oczekiwać niższego oszacowania niż przy drugiej procedurze.
Inny sposób oddziaływania heurystyki zakotwiczania w sądzie pokazuje następujące doświadczenie. W badaniu Greenberga, Williamsa i 0'Brie-na (1986) proszono sędziów o wydanie wyroków w sprawach o różnym stopniu winy. Niektórzy sędziowie rozpatrywali sprawy w kolejności od cięższych do lżejszych, inni w kolejności odwrotnej. Okazało się, że procedura pierwsza prowadziła w efekcie do surowszych werdyktów niż procedura druga. Dlaczego? Przypuszczalnie dlatego, że zaczynając od przestępstw cięższych, sędziowie "zakotwiczyli się" na surowszych wyrokach, a zaczynając od przestępstw lżejszych - "zakotwiczyli się" na łagodniejszych.
Heurystyką zakotwiczania i negocjowanie. Heurystyką zakotwiczania ma szczególne znaczenie w procesach negocjacyjnych. Oto zmieniamy pracę i pytamy o wysokość wynagrodzenia w tym zakładzie pracy. Rutynowo jesteśmy pytani o nasze zarobki w dotychczasowym miejscu. Pracodawca ma skłonność zakotwiczać się i przystosowywać swoją ofertę do naszej sytuacji bieżącej. Sprytni pracownicy wykorzystują niekiedy tę tendencję pracodawców w ten sposób, że często zmieniają pracę, starając się w każdej kolejnej zyskiwać przyrost owego punktu zakotwiczenia.
Pracodawcy, chcąc uzyskać korzystne dla siebie zakotwiczenie w negocjacjach płacowych, dobierają dla porównania stawki płacowe z tych branż, w których płace są raczej niskie.
^.t-UDZENIA W OCENIANIU S^ANS
Ile warta jest nieruchomość? Northcraft i Neale (1987) wykonali el^PB-ryment, w którym poddano testowi agentów zajmujących się sprzedaże nle-ruchomości. Zabierano tych agentów na wizytę i ocenę wybranych dopio^ W czasie wizyt agenci otrzymywali 10-stronicowe broszurki zawier^J^s zwykłą informację podawaną przy ocenie nieruchomości: standardową 1-tartę katalogową zawierającą informację o nieruchomości, kartę katalogową °ln" nych nieruchomościach, które ostatnio sprzedano w tej okolicy itd. W^Y' scy agenci wizytujący posiadłość otrzymywali ten sam zestaw inforn"1^1' z jednym wyjątkiem: katalogowej ceny domu. Jednej części agentów podawano cenę zaniżoną o 11-12 procent, drugiej grupie - cenę zani2011^ o 4 procent, trzeciej grupie - cenę zawyżoną o 4 procent i czwartej gr'upie - cenę zawyżoną o 11-12 procent. Agentom dano 20 minut na obefJ8"(r) nieruchomości, po czym mieli oni dokonać jej wyceny. Okazało się, że oce-na wartości nieruchomości w czterech grupach znacznie się różf111^-w skrajnym wypadku nawet o ponad $10000. Tak więc, zakotwicz^111(r) w postaci ceny katalogowej okazało się mieć duży wpływ na wyceny- Na uwagę zasługuje fakt, że wyceniający są profesjonalistami, a więc ekpP(r)1'' tami, którzy zajmowali się sprzedażą nieruchomości od lat. Płynie stąd wniosek, że przed zakotwiczeniem nie chroni nawet biegłość i dośw^"' czenie.
Heurystyką zakotwiczania w marketingu. Heurystyką zakotwi102^' nią jest szeroko wykorzystywana w marketingu. W ostatnich czasach sk^PY zwiększają częstość i wydłużają okresy wyprzedaży produktów, obniżając P^Y tym ich ceny. Dlaczego? Ponieważ ludzie traktują wyprzedaże jako oli^zJ? bardzo zachęcającą do kupowania. Podczas wyprzedaży mają okazję d^0' nać poważnych oszczędności: zamiast zapłacić za bluzkę jej "normalną" icenę 100 zł, mogąją kupić już za 60 zł, zamiast zapłacić za koszulę jej "norma1!11^' cenę 50 zł, mogąją kupić już za 35 zł itp. Konsumenci nie zauważają tęgi"0' ze bluzka prawie nigdy nie była sprzedawana za 100 zł, a koszula za 5(0 u-Najpierw bowiem miały one zredukowane ceny promocyjne, a po króftkim okresie cen "normalnych" (kiedy przypuszczalnie nikt ich nie kupował) ot^y-mały ceny wyprzedaży. Całość została z góry zaplanowana: wcześniejsza <cena nigdy nie była ceną docelową, jej główna funkcja polega na "zakotwiczę!11111 klienta: wysoka cena "normalna" służy tylko do tego, by pokazać klient^o^' ile oszczędza kupując bluzkę lub koszulę.
Cialdini (1996) opisuje pewnego sprzedawcę nieruchomości, który pr^YJ^ następującą strategię pokazywania nieruchomości potencjalnym nabywa0111-Rozpoczynał zawsze od pokazywania dwóch nieatrakcyjnych domów (z211^' dujących się w kiepskim stanie, a w dodatku drogich). Domy te nie były^ na" wet wystawione na sprzedaż. Sprytny sprzedawca posługiwał się nimijł^y' nie do "zakotwiczenia" klientów. Opierając się na zasadzie zakotwiczę31113'
f&YUI-IULUlaH^Z-Mt I^UUrtrM U^tlMIAIMIrt l rUDCJMUWANIA DECY/.JI
przyjmował, że klient, który obejrzy takie domy, "doceni" następne, które sprzedawca będzie mu prezentował.
Pani Elżbieta Sołoma opisała następującą swoją przygodę: pewnego dnia zjawiła się w jej domu osoba, która powiedziała, że zbiera właśnie opinie na temat nowego produktu, który w najbliższym czasie ma wejść na rynek. Produktem tym był elektroniczny słownik angielsko-polski. Według informacji akwizytora, słownik ten miał być dostępny w sprzedaży za dwa tygodnie, w cenie 450 złotych. Marketingowiec zadał następnie pytania: kogo, zdaniem osoby badanej, taki produkt może zainteresować, dla kogo byłby dobrym prezentem, czy cena jest odpowiednia. Po uwadze "badanej", że cena wydaje się wygórowana, padło pytanie, ile wobec tego taki produkt powinien kosztować. Pani Elżbieta zasugerowała cenę 250 zł. Wtedy marketingowiec poinformował ją, że akurat wypada dzień wielkiej promocji produktu i dziesięć najsympatyczniejszych osób udzielających mu odpowiedzi może otrzymać słownik za jedyne 100 złotych.
W przedstawionym postępowaniu sprzedawca niewątpliwie wykorzystywał efekt kotwicy. Była nią podana na początku cena 450 złotych. Pani Sołoma przyznała, że jej wycena produktu na 250 złotych była jakąś próbą redukcji wyjściowej ceny 450 zł: "Zastanawiałam się nad tym, o ile niższa powinna być cena od podanej mi wartości, a nie nad tym, ile taki produkt jest w rzeczywistości wart".
Mechanizm podobny do użytego w opisanej przygodzie leży u podstaw organizowania obniżki cen i wyprzedaży w domach towarowych. Wprowadzając nowy produkt, ustala się jego cenę na tyle wysoko, by można było stosunkowo szybko ją obniżyć. Redukcja o 50% czy nawet o 70% jest przez klienta odbierana jako szczególna okazja, gdyż "zakotwicza" go na wysokiej cenie wyjściowej.
9.7. Złudzenie w ocenianiu zdarzeń łącznych (koniunkcji) i rozłącznych (dysjunkcji)
Innym interesującym aspektem zakotwiczenia i niedostatecznego korygowania wyjściowej oceny jest złudzenie w ocenianiu zdarzeń łącznych (koniunkcji) i rozłącznych (dysjunkcji). Wyobraźmy sobie, że dano nam możliwość wygrania 100 dolarów. Mamy przy tym do wyboru:
A) losować siedem razy (za każdym razem zwracając wylosowaną kulę) z urny zawierającej 9 kul białych i l kulę czarną - 100 dolarów otrzymujemy wtedy, gdy we wszystkich siedmiu losowaniach wyciągniemy kulę bialą (zdarzenie koniunkcyjne);
ZŁUDZENIA W OCENIANIU SZANS
B) losować raz z urny zawierającej 5 kul białych i 5 kul czarnych - 100 dolarów otrzymujemy wtedy, gdy raz wylosujemy kulę białą (zdarzenie proste);
A co zrobimy, mając następujący wybór:
B) losować raz z urny zawierającej 5 kul białych i 5 kul czarnych - 100 dolarów otrzymujemy wtedy, gdy raz wylosujemy kulę bialą;
C) losować siedem razy (za każdym razem zwracając wylosowaną kulę) z urny zawierającej l kulę bialą i 9 kul czarnych - 100 dolarów otrzymujemy wtedy, gdy co najmniej raz w siedmiu losowaniach wyciągniemy kulę białą (zdarzenie dysjunkcyjne).
URNA A URNA B
Rys. 9.2.
Urny z różną zawartością kulek białych i czarnych.
W eksperymencie Bar-Hillel (1973) wyraźnie więcej osób decydowało się wziąć udział w zakładzie A niż w zakładzie B i więcej osób decydowało się wziąć udział w zakładzie B niż w zakładzie C. Kiedy jednak policzyć prawdopodobieństwa wygranej dla obu zdarzeń, okaże się, że szansa wygrania w zakładzie A wynosi 48%, w zakładzie B wynosi 50%, a w zakładzie C 52%. Tak więc badani wykazywali większe zaufanie do zdarzenia mniej prawdopodobnego (koniunkcyjnego) niż do zdarzenia bardziej prawdopodobnego (dysjunk-cyjnego). Znowu wynika to prawdopodobnie z początkowego zakotwiczenia szansy wylosowania czarnej kuli z każdej z urn i niedostatecznego korygowania tej szansy dla zdarzeń koniunkcyjnych i dysjunkcyjnych.
Ostrożnie przy koniunkcji zdarzeń! Przecenianie prawdopodobieństwa koniunkcji zdarzeń łatwo prowadzi do decyzji pochopnych. Przyjmijmy, że ktoś chce otworzyć interes, którego powodzenie zależy od spełnienia wielu pomyślnych okoliczności. Przypuszczalnie będzie on wtedy oceniał szansę każdej z tych okoliczności i jeśli stwierdzi, że są wysokie, łatwo może przeoczyć fakt, że spełnienie wszystkich takich okoliczności naraz wymaga
PaYCMOLOUlU^Nb PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
przemnożenia owych szans, co znacznie redukuje prawdopodobieństwo łączne (prawdopodobieństwa są wszak ułamkami mniejszymi od jedności!). Zilustrujmy to kłopotami w prowadzeniu bezstronnej polityki personalnej przez partie polityczne.
"Lepsze wrogiem dobrego". W oficjalnych deklaracjach partii politycznych formułuje się zwykle trzy kryteria, które mają obowiązywać w polityce kadrowej. Obejmują one: (a) wysokie kompetencje w zakresie sprawowanej funkcji, (b) wysokie umiejętności w pracy z ludźmi, czyli umiejętności kierownicze, (c) wysoki poziom świadomości ideowo-politycznej, czyli wysoką lojalność wobec partii. Jednak nawet pobieżna obserwacja życia politycznego dowodzi, że polityki takiej nigdy nikomu nie udało się zrealizować. I nic dziwnego, łatwo bowiem pokazać, że formułowany postulat jest całkowicie nierealistyczny.
Załóżmy dla przykładu, że chcemy na podstawie tego rodzaju zestawu kryteriów wybrać naczelnego architekta Wrocławia. Wydaje się, że nie byłoby wygórowane wymaganie, aby przez "wysoki stopień" kompetencji zawodowej rozumieć w tym wypadku posiadanie przez kandydata kwalifikacji zawodowych w stopniu wyższym niż, powiedzmy, 75% osób danej grupy. Na wszelki wypadek przyjmijmy jednak także inną wersję, mówiącą że "wysoki stopień" kompetencji gwarantuje bycie lepszym od 50% danej grupy. Teraz kolej na kompetencje kierownicze. Tego, jak uczy doświadczenie, ludzie nie mają w nadmiarze (i nie są na ogół uczeni tego, jak kierować zespołami ludzkimi). Mimo swej najlepszej opinii o architektach wrocławskich, uważam, że wysoki stopień kompetencji kierowniczych nie może charakteryzować więcej niż 10% tej populacji. Pozostaje sprawa wysokiego poziomu moralnego. Jeżeli przyjąć, że trzeba tu uwzględnić całkiem znaczny zestaw cnót - takich jak: zdolność niekierowania się własnym interesem, w tym znaczna odporność na przekupstwo, nieuleganie naciskom ani zwierzchników, ani podwładnych, ani rodziny, punktualność i dotrzymywanie terminów - to ciągle, mimo jak najlepszej opinii o architektach wrocławskich, uznałbym za bezpieczne przyjąć, że w "wysokim stopniu" może spełniać to kryterium jakieś 10% owej populacji. Na wszelki wypadek przyjmijmy też wersję skrajnie optymistyczną, że "wysoki stopień" moralności spełnia 25% populacji architektów Wrocławia. Zobaczmy po tych wszystkich ustaleniach, jaka jest szansa natrafienia na architekta wrocławskiego, który spełnia wszystkie trzy warunki naraz: jest kompetentny zawodowo, ma umiejętności w kierowaniu ludźmi i jest moralny w wyżej opisanym sensie. Przyjmując, że owe trzy rzeczy nie są ze sobą statystycznie powiązane (tj. że architekt wysoce kompetentny może równie dobrze być, jak i nie być wysoce moralnym itd.), szansa spotkania architekta, który "uzyskuje trzy razy tak" jest iloczynem:
0,25 x 0,10 x 0,10 = 0,002, czyli dwie osoby na tysiąc, gdy przyjmiemy
ZŁUDZENIA W OCENIANIU SZANS
^^ . " '"".
wymaganie surowsze, bądź: 0,50 x 0,10 x 0,25 = 0,012, czyli dwanaście osób na tysiąc, gdy przyjmiemy wymaganie łagodniejsze. Czy można rozsądnie liczyć na znalezienie tak rzadkich osób?
Kiedy można mieć nadzieję? Oto poszukujemy pilnie rzadko spotykanej książki. Przyjmijmy, że ktoś kompetentny wyliczył, że szansa na to, b;
dowolna w miarę dobrze wyposażona biblioteka uniwersytecka miała tę książkę, wynosi 20%. Istnieje w Polsce kilka (załóżmy, że 7) dość dobrze wyposażonych bibliotek uniwersyteckich. Czy można mieć nadzieję na znalezienie tej książki choć w jednej z nich? Żeby wyliczyć szansę takiego alternatywne go zdarzenia, policzmy, jaka jest szansa zdarzenia przeciwnego, tj. tego, ż( żadna z bibliotek nie będzie posiadała poszukiwanej książki. Wyniesie one 0,8 x 0,8 x 0,8 x 0,8 x 0,8 x 0,8 x 0,8 = 0,21. Zatem szansa zdarzenie dopełniającego tj. że choć jedna z siedmiu bibliotek będzie miała poszukiwani książkę wynosi l - 0,21 = 0,79. Rokuje to dużą nadzieję - warto spróbować
9.8. Zasada dostępności psychicznej
Amerykańskich respondentów zapytano, czy więcej ich rodaków umiera z po wodu uderzenia kawałkiem rozbitego samolotu, czy z powodu zaatakowani;
przez rekina? Większość pytanych odpowiadała, że z drugiego z tych powo dów i myliła się. Szansa śmierci od uderzenia odłamkiem rozbitego samolo tu jest według statystyk amerykańskich 30-krotnie wyższa niż z powodl zaatakowania przez rekina. Skąd więc przeciwne mniemanie? Stąd, że ła twiej przypominamy sobie obrazy (choćby z filmów) zabójstw ludzi prze;
rekiny niż przypadki śmierci na skutek uderzenia przez odłamki rozbitycł samolotów. Te ostatnie rzadko bywają przedmiotem dyskusji.
Tversky i Kahneman (1973) czytali studentom listę nazwisk znanycł postaci obojga płci i prosili o ocenę, czy na danej liście było więcej nazwisi mężczyzn, czy kobiet. W rzeczywistości listy zawierały jednakową liczb< nazwisk mężczyzn i kobiet. Różne grupy studentów otrzymywały listę sław niejszych mężczyzn i nieco mniej sławnych kobiet, bądź przeciwnie - sław niejszych kobiet i nieco mniej sławnych mężczyzn. Okazało się, że dla każde listy badani błędnie wskazywali przewagę tej płci, która miała sławniejszyci reprezentantów. Naturalnym wytłumaczeniem tego wyniku jest oceniani' częstości (w tym wypadku płci) podług łatwości, z jaką można sobie przypo mnieć odpowiednie przypadki należące do danej klasy. Tę umysłową dostęp ność odpowiednich przypadków ludzie biorą za wskaźnik względnej często ści zdarzeń.
Tversky i Kahneman (1974), którzy opisali i wykazali, że ludzie w oceni częstości zdarzeń kierują się zasadą dostępności, podkreślają, że w wieli
. ••»» r>.> l >^ri^L->_>'>.lli^z_lMC: 1-Ut-MriM ^I^CIMIAIMIA l I^UUtJMUWANIA DECYZJI
sytuacjach zasada ta sprawdza się całkiem dobrze. Zdarzenia częste są przez częstotliwość swego występowania łatwiej dostępne w naszej pamięci niż zdarzenia rzadsze. To, że bociany białe występują znacznie częściej niż bociany czarne, wiemy stąd, że rzeczywiście znacznie częściej zdarzało nam się widzieć pierwsze niż drugie.
Zdarzają się jednak szczególne okoliczności, gdy zasada dostępności prowadzi do poważnych zniekształceń naszych ocen. Jest tak wtedy, gdy zdarzenia są łatwiej dostępne pamięci nie dlatego, że występują częściej, ale dlatego, że wydarzyły się niedawno albo są wysoce emocjonalne, albo niezwykłe itd. Kierując się wtedy zasadą dostępności, przeceniamy częstości zdarzeń sensacyjnych, niezwykłych, widowiskowych, a nie doceniamy częstości zdarzeń powszechnych i mało barwnych.
Pokazał to m. in. wspomniany wyżej eksperyment przeprowadzony przez Lichtenstein, Slovica, Fischhoffa, Layman i Combsa (1978). Proszono w nim badanych o ocenę częstości różnych przyczyn zgonów w Stanach Zjednoczonych (gdzie badanie się odbywało). Znając statystyki przyczyn zgonów, autorzy mogli porównać oceny subiektywne z prawdziwymi danymi. Okazało się, że badani przeceniali częstość zgonów z powodów niezwykłych, nagłaśnianych przez prasę - takich jak tornado, powódź, samobójstwo, a nie doceniali częstości zdarzeń powszechnych - takich jak choroby w rodzaju astmy, cukrzycy czy zawału.
Wyniki wielu badań sugerują, że zarówno zwykli ludzie, jak i eksperci - lekarze, sędziowie, nauczyciele - w swoich ocenach, diagnozach czy rozstrzygnięciach opierają się w znacznej mierze na doświadczeniach najświeższych, które niedawno miały miejsce. Oto lekarz, któremu ostatnio zdarzyły się dwa, trzy przypadki, w których dana terapia (lek) nie zadziałała, będzie wykazywał tendencję do unikania jej w kolejnym przypadku na korzyść jakiejś innej terapii, która generalnie daje gorsze efekty. Podobnie sędzia, który miał ostatnio do czynienia z przypadkami gwałtu dokonanymi przez przedstawicieli określonej subkultury młodzieżowej, będzie miał skłonność do podejrzewania kolejnego reprezentanta tej subkultury o podobne skłonności.
Znaczenie żywych i budzących emocje opisów: polityka. Wiele badań pokazuje, że oceny i decyzje, zarówno ludzi zwykłych, jak i profesjonalistów, pozostają pod większym wpływem żywych i budzących emocje opisów, niż pod wpływem suchej argumentacji opartej na rzeczowej informacji statystycznej. Pouczający przykład z kampanii prezydenckiej w Stanach Zjednoczonych w roku 1988 przytacza Aronson (1995). W kampanii tej George Bush wykorzystał w walce przeciwko Michaelowi Dukakisowi historię niejakiego Williego Hortona. Horton był więźniem, którego wypuszczono na urlop z więzienia w Massachusetts. Gubernatorem tego stanu był Dukakis, a Hor-
ZŁUDZENIA W OCENIANIU SZANS
ton w czasie urlopu zgwałcił kobietę i zranił jej towarzysza. Zacytujmy za Aronsonem:
[...] Głosząc, że Dukakis jest zbyt łagodny wobec przestępców, Bush zamieścił w telewizji i prasie szereg ogłoszeń, w których obok zdjęcia patrzącego spode łba Williego Hortona przedstawiono kryminalistów wchodzących do więzienia i wychodzących z niego przez drzwi obrotowe. Ogłoszenia te poruszyły czulą strunę w wielu Amerykanach, którzy mają uzasadnione obawy przed zbrodniami dokonywanymi na ulicach miast i którzy mocno podejrzewają, że system sprawiedliwości faworyzuje przestępców kosztem ofiar. Ponadto fakt, że Willie Horton jest Murzynem, a jego ofiary - białymi, nie uszedł uwadze większości telewidzów.
Dukakis w odpowiedzi przytaczał mnóstwo faktów i cyfr pokazujących, że programy urlopowania więźniów realizowano nie tylko w Massachusetts i że programy te były na ogół bardzo skuteczne - tylko niewielki procent Urlopowanych więźniów popełnił w trakcie urlopu przestępstwo. Wszystko to niewiele Dukakisowi pomogło - George Bush został wybrany na prezydenta.
Znaczenie żywych i budzących emocje opisów: firmy. Podobne obserwacje poczyniono w zachowaniach konsumenckich, gdzie pojedyncza pozytywna albo negatywna opinia wyrażona w sposób emocjonalny przez użytkownika produktu wygrywa często z solidnym raportem opartym na statystycznych zestawieniach (Nisbett, Borgida, Crandall, & Reed, 1976). Wszystko jedno, czy są to opinie prawdziwe, czy zupełnie fantastyczne - jak na przykład, że "McDonald's dodaje robaki do mięsa na hamburgery" albo że "Coca-cola potrafi rozpuścić sztuczną szczękę pozostawioną w niej na jedną noc". Szczególnie negatywne opinie (prawdziwe czy nie) mogą doprowadzić do unikania marki albo produktu. Badania pokazują, że nawet nieznacznie nieprzychylna opinia o firmie może spowodować drastyczne skutki. W pewnym badaniu dotyczącym coca-coli stwierdzono, że konsumenci, którzy skierowali skargę do firmy i nie byli usatysfakcjonowani jej reakcją, przekazywali swoje negatywne doświadczenie przeciętnie 9, 10 osobom.
Zasada dostępności i środki masowego przekazu. Oto zestaw tematów telegazety z dnia 31.10.1996:
Podpisanie porozumienia z Rosją przed podjęciem finalnej decyzji o rozszerzeniu Paktu będzie praktyczną akceptacją specjalnych praw Rosji -powiedział szef polskiego rządu Włodzimierz Cimoszewicz.
Rosja może rozważyć utworzenie bazy wojskowej w byłej Jugosławii wobec dążenia NATO do rozszerzenia swych struktur na kraje Europy Wschodniej -powiedział sekretarz Rosyjskiej Rady Obrony Jurij Baturin.
Oddziały wierne obalonemu rządowi Afganistanu przygotowują się do ofensywy na prowincję Herat.
l »MJ l-'t>YL;MULUUH-;Z:Nt l-'Ut-AI-'K.I UUtlNIAIMIA l h-UUbJMUWANIA DECYZJI
'. "^aĄ&siSissiaaasss . ^ ^ .. '.\ " '
Oddziały ruandyjskie opanowały dziś rano lotnisko w Górnie na terytorium Zairu. Przez kilka godzin trwał tam silny ostrzał artyleryjski.
Prezydent Rosji Bory s Jelcyn nie wygłosi w tym tygodniu przez radio swego orędzia do narodu, wbrew regule przyjętej od tygodnia.
Opałowe zostanie wkrótce zmniejszona liczebność odwalanych przez NATO międzynarodowych sil pokojowych w Bośni.
Rosyjski minister spraw zagranicznych Jewgienij Primakow przybył dziś rano do Izraela.
Co najmniej 117 osób zginęło w katastrofie samolotu pasażerskiego typu Fokker w Sao Paulo w Brazylii. Na jego pokładzie było 89 pasażerów i 6 członków załogi. Pozostałe ofiary to mieszkańcy domów, na które spadł samolot. Według rzecznika miejscowych władz, zabitych może być więcej.
Aronson (1995) zwraca uwagę na specyficzny obraz świata, jaki wytwarza się u odbiorców współczesnych środków masowego przekazu. Kompletując wiadomości do dziennika telewizyjnego, organizujący je dziennikarze dokonują selekcji według kryterium widowiskowości tych wydarzeń. Nie podają wiadomości, że gdzieś dzięki przezorności władz lub obywateli udało się uniknąć kataklizmu - na przykład powodzi - albo że gdzie indziej dzięki czyjejś ofiarności uratowano bezdomnego. Wystarczy jednak, że gdzieś nie zadbano o bezpieczeństwo i nastąpiła powódź powodująca wiele strat i ofiar albo że gdzieś czyjaś obojętność spowodowała śmierć bezdomnego, a wiadomości takie - jako widowisko - są natychmiast eksponowane. W efekcie odbiorcy nabierają przekonania, że świat jest pełen klęsk i kataklizmów, a ludzie bezduszni, niedbali i w ogóle "wszystko idzie ku gorszemu". Stąd też można obserwować charakterystyczną rozbieżność w opiniach ludzi na temat zagrożeń w kraju i w ich najbliższym otoczeniu. Kiedy pytanie dotyczy zagrożenia w kraju, respondenci zwykle oceniają, że zagrożenie to jest znaczne, kiedy natomiast pytanie dotyczy zagrożenia w ich najbliższym otoczeniu, podają na ogół znacznie niższe oceny. Ta rozbieżność bierze się z tego, że odpowiadając na pytanie o sytuację w kraju, badani opierają się na wiadomościach z mass mediów, a kiedy oceniają sytuację w swoim otoczeniu, sięgają po prostu do własnego doświadczenia.
Zasada dostępności i spostrzegane zagrożenie. W latach osiemdziesiątych została przeprowadzona seria badań nad tym, jak ludzie w różnych krajach postrzegają i oceniają różne zagrożenia technologiczne i naturalne. Pytano o ocenę stopnia zagrożenia w odniesieniu do energii atomowej, pojazdów motorowych, palenia papierosów, lotnictwa pasażerskiego, promieniowania rentgenowskiego, kolei, gospodarstwa domowego i wielu innych. W badaniach tych ustalono wiele różnic w spostrzeganiu zagrożeń związanych z tymi działaniami. Otrzymano wtedy bardzo intrygujący wynik badania, pokazany na rysunku 9.3. Kiedy uśredniono oceny poszczególnych zagrożeń (dokony-
^ŁUDZENIA W OCENIANIU &Z.AIMS
5&Ł ' ' " " ' . ^
wane na 100-stopniowej skali) w poszczególnych krajach, okazało się, że uło żyły się one w taki sposób, jakby najwyższy poziom tych zagrożeń występowa w Stanach Zjednoczonych, dalej w Polsce, Norwegii, na Węgrzech i w (daw nym) Związku Radzieckim (por. Goszczyńska, Tyszka, Slovic, 1991).
50-i
45-40-
35-
30-
25-
20-
15-
"
10-
5-
n
i
i
-1-
i
1
USA Polska Norwegia Węgry
Rys. 9.3.
Uśrednione oceny zagrożeń w kilku porównywanych krajach (według: Goszczyńska
Tyszka, Slovic 1989).
Co oznaczać może taki układ? Czyżby technologiczne i naturalne zagro żenią w Stanach Zjednoczonych były najwyższe na świecie, a w byłym ZSRE - najniższe? Wydaje się, że trafniejsze wytłumaczenie daje odwołanie si( z jednej strony do heurystyki dostępności psychicznej, a z drugiej - do poli tyki informacyjnej charakterystycznej dla różnych krajów. Heurystyka do' stępności mówi, że oceniając wielkość zagrożeń ludzie przypominają sobie po prostu wszelkie zapamiętane katastrofy i na tej podstawie formułują swojt oceny. Wiadomo z kolei, że prasa i inne media w krajach komunistycznych - w przeciwieństwie do mediów w świecie zachodnim - znacznie częściej informowały o niekorzystnych wydarzeniach (katastrofach, kataklizmach, prze' stępczości itp.) mających miejsce poza granicami niż o tego samego typi;
wydarzeniach we własnym kraju (ta świadomie stosowana w krajach komu nistycznych polityka informacyjna traktowana była jako kolejny argumeni na rzecz wyższości tego systemu społeczno-politycznego). W efekcie miesz
l «^<- roTL/nuLm.an^z.iMC: i-uc.rti-r\i U^CIMIMINIM i ruueJMUWANIA DPfYZJI
/^^Ą8^>^ «^»_^
kańcy Węgier czy ZSRR mogli przypomnieć sobie mniej niebezpiecznych zdarzeń niż Amerykanie czy Norwegowie. Z tego właśnie powodu ich oceny zagrożeń były wyraźnie wyższe niż oceny ludzi żyjących w krajach komunistycznych.
Charakterystyczna ciekawostka dotycząca Polski - w czasie, kiedy przeprowadzaliśmy nasze badania, Polska również należała do bloku komunistycznego, a mimo to poziom odczuwanego zagrożenia był tu wyższy niż w innych krajach komunistycznych. Sugeruje to, że dostępność informacji o zagrożeniach była w naszym kraju wyższa niż w innych krajach komunistycznych. Mogło się to wiązać z faktem istnienia w Polsce niezależnych, niecenzurowa-nych wydawnictw podziemnych. Dzięki nim świadomość różnych zagrożeń w społeczeństwie polskim była znacznie wyższa niż w pozostałych krajach bloku komunistycznego. Dotyczyło to przede wszystkim negatywnych skutków rozwoju różnych dziedzin przemysłu w naszym kraju. Wiele miejsca w niezależnej prasie polskiej poświęcano na przykład opisom obszarów kraju dotkniętych groźbą klęski ekologicznej. Znalazło to, jak widać, oddźwięk w wykrytym w naszym badaniu wysokim poziomie spostrzeganego ryzyka związanego z technologiami i substancjami chemicznymi w Polsce.
Zasada dostępności i percepcja inflacji. Bates i Gabor (1986) pokazali, w jaki sposób zasada dostępności zniekształca naszą percepcję inflacji. Prosili respondentów o przypomnienie sobie i podanie ceny różnych kupowanych ostatnio produktów spożywczych: cukru, mąki, herbaty, kawy, chleba, masła, mięsa. Respondenci ci zwykle odpowiadali trafnie. Następnie w odniesieniu do niektórych produktów pytano o zmianę ceny w ostatnim miesiącu ("Czy cena chleba, który zwykle kupujesz, zmieniła się w ostatnim miesiącu? Jaka była jego stara cena i jaka jest nowa?"). Znowu okazało się, że badani przypominali sobie prawdziwe ceny.
Wreszcie zapytano: "Czy ogólnie ceny produktów spożywczych zmieniły się w ostatnim miesiącu?"; "W górę czy w dół?"; "O jaki procent?" Odpowiedzi na to ogólne pytanie okazały się wysoce nietrafne: szacowany wzrost cen był mocno przesadzony. Autorzy tłumaczą to właśnie działaniem zasady dostępności: respondenci pozostawali pod większym wrażeniem zmiany ceny tych produktów, których ceny drastycznie wzrosły w ostatnim okresie, niż tych cen, które zmieniły się niewiele lub nie zmieniły się wcale. Mieli zatem większy pamięciowy dostęp do tych cen, które mocno podniesiono, niż tych, które tak nie wzrosły. W efekcie te pierwsze w większym stopniu niż drugie wpłynęły na ogólną ocenę wzrostu cen produktów spożywczych.
Zasada dostępności i percepcja swojego wkładu w obowiązki domowe. Ross i Sicoły (1982) pokazali, że zasada dostępności psychicznej dobrze wyjaśnia znany fakt występującego u ludzi poczucia nierówności wkładu we wspólną pracę. Oto dwaj uczeni prowadzą wspólne badania, a po
ZŁUDZENIA W OCENIANIU bZANb
uzyskaniu wyników obaj mają poczucie, że ich wkład we wspólne dzieło był nierówny - przy tym każdy uważa, że on wniósł więcej.
Ross i Sicoły (1982) w swoim badaniu sięgnęli jednak do bardziej przyziemnego doświadczenia, do poczucia krzywdy u współmałżonków, które towarzyszyło ich ocenie własnego wkładu pracy w obowiązki domowe. Pytali oni 37 par małżeńskich o zaangażowanie każdego z małżonków w różnego rodzaju prace domowe - takie jak przygotowywanie śniadania, ścielenie łóżka, mycie naczyń. Każde z małżonków określało, czy dana czynność jest głównie wykonywana przez męża czy przez żonę. Każda ze stron podawała też przykłady, co w zakresie danej czynności wnosiła ona, a co współmałżonek. Co się okazało? Kiedy dodano "wkłady" obu stron w poszczególne czynności, całość znacznie przekraczała 100%, a działo się tak dlatego, że każda ze stron przypisywała sobie znacznie większy udział niż tej drugiej osobie. Towarzyszyła też temu większa łatwość przypominania sobie przykładów własnych działań na rzecz domu niż przykładów działań współmałżonka.
Przekonanie takie można faktycznie wyjaśnić zasadą dostępności psychicznej. Każdy z nas ma lepszą możliwość zauważenia własnego "wkładu" niż działań współmałżonka. Łatwiej też zapamiętamy własne działanie, zwłaszcza wtedy, gdy wiązało się ono ze znacznym wysiłkiem. Łatwiej też jesi przypomnieć sobie przykłady własnych działań niż przykłady działań współmałżonka. W rezultacie nabieramy poczucia, że nasz udział w podziale obowiązków jest większy niż udział współmałżonka.
Pan Krzysztof Przybyszewski zwrócił uwagę, że kiedy w latach 80. w Polsce zaopatrzenie w towary rynkowe było bardzo złe, osoby podróżujące pc Polsce po powrocie często stwierdzały, że "gdzie indziej zaopatrzenie jes< lepsze". Przypuszczalnie wrażenie to powstawało na skutek następującego mechanizmu: ze względu na niesprawny system dystrybucji, w różnych re glonach kraju występowały różne braki. W ten sposób osoby podróżujące pc Polsce znajdowały w innych miejscach takie towary, których bezskutecznie poszukiwały u siebie. Równocześnie osoby te nie zwracały przypuszczaniu uwagi na brak w tych regionach towarów, które były dostępne w ich miejsci zamieszkania ("Po co szukać czegoś, co można kupić u siebie"). W wyniki tego po powrocie dochodziły one do wniosku, że "gdzie indziej zaopatrzeni;
jest lepsze".
Być może podobny mechanizm leży u podłoża niezadowolenia niektórycł osób z miejsca, w którym akurat przebywają. Kiedy na przykład mieszkaj;
na wsi, głoszą, że lepsze jest życie w mieście, gdy znowu przeniosą się d( miasta, utrzymują, że lepiej im się żyło na wsi. Przypuszczalnie zwracaj;
one uwagę przede wszystkim na braki w swoim otoczeniu.
Zasada dostępności i zachowania konsumenckie. Wielu z nas iry tuje wielokrotne oglądanie i wysłuchiwanie tej samej reklamy proszku "Poi
rv3 i ^n^i_^<"ii^^.i-<i_ rut.ftrr\i >-/^c-iiiftiNift i r^ucJn/lUWANiA DECYZJI
lena" albo "Wizir", albo dowolnego innego proszku czy produktu. Czujemy się osaczeni, potraktowani jak bardzo nieinteligentne istoty, którym trzeba tyle razy powtarzać, że "Pollena" wywabia plamy, a "Wizir" wybiela, jakby nie wystarczyło powiedzieć tego raz. Otóż, wbrew naszej irytacji, marketin-gowcy wiedzą, co robią. Częste powtarzanie sprawia - zgodnie z zasadą dostępności - że kiedy chcemy kupić proszek do prania, wówczas przypomina nam się akurat ten, który był najczęściej powtarzany, niezależnie od tego, czy nas owo powtarzanie irytowało, czy nie.
Alba i Marmmorstein (1987) pokazali, że marketingowcy wiedzą, co robią, również wtedy, gdy wymieniają maksymalnie dużo zalet swojego produktu, nie troszcząc się zgoła o to, czy zalety te są ważne, czy bez znaczenia. W pewnym eksperymencie naukowcy badanym osobom prezentowali opisy zalet trzech samochodów. Jednemu z nich przypisywali trzy ważne zalety (manewrowość, małe zużycie paliwa, korzystne warunki gwarancji). Drugiemu - trzy mało ważne zalety (zacieniane szyby, chromowane wykończenia itp). Trzeciemu - dziewięć mało ważnych zalet. Okazało się, że ten trzeci samochód był najczęściej wybierany (wprawdzie tylko na niby, w eksperymencie!), szczególnie wtedy, gdy badani poświęcali mało czasu na uważne "studiowanie" zalet samochodów.
Fitzsimons i Morwitz (1996) pokazali, że samo pytanie o chęć zakupu jakiegoś produktu może zwiększać szansę jego zakupu - dzięki zwiększaniu dostępności wyobrażenia danego produktu w umyśle respondenta. Badacze ci wykorzystali pewne badanie panelowe (tzn. wielokrotnie powtarzane z tymi samymi respondentami) dotyczące planowanych i realizowanych zakupów różnych produktów - w tym samochodów. Porównali oni procent gospodarstw domowych, które ponownie zakupiły samochód tej samej marki, co dotychczas: (a) wśród tych respondentów, którzy już wcześniej byli pytani o intencję zakupu (zakupu w ogóle i zakupu określonej marki), oraz (b) wśród tych respondentów, którzy wcześniej nie byli pytani o zamiar zakupu (znaleźli się oni później w grupie panelowej). Stwierdzono nieoczekiwaną zależność: ci, których wcześniej nie pytano, rzadziej kupowali samochód tej samej marki, co dotychczas, niż ci, którzy wcześniej byli pytani o intencję zakupu. W przypadku Forda uzyskano następujące dane: spośród tych, którzy wcześniej nie byli pytani o intencję zakupu, 34,1% dotychczasowych użytkowników ponownie zakupiło Forda, a spośród tych, którzy wcześniej byli pytani o intencję zakupu, aż 57,0% dotychczasowych użytkowników ponownie zakupiło Forda. Tak więc samo pytanie zwiększało szansę zakupu produktu tej samej marki. Dlaczego? Mówiąc najprościej dlatego, że powodowało ono wzrost dostępność "obrazu" danego produktu (w rozważanym przypadku samochodu danej marki) "w głowach" respondentów.
ZŁUDZENIA W OCtrMIMIMIU ^^"'^^^^^^^^^^^^^"^^^^^g^ailaii^tBisss^^ -
Zasada dostępności i stronniczość ocen. Eksperyment niniejszy pokazuje, że kierując się zasadą dostępności, można łatwo manipulować przekonaniami ludzi (w tym również własnymi!). W roku 1976 Carroll (1978) przeprowadził badanie w przededniu amerykańskich wyborów prezydenckich. Respondentów biorących udział w badaniu podzielono na dwie grupy.
Jedną z grup poproszono, aby śledząc wyborcze audycje telewizyjne, próbowała sobie wyobrazić, że Ford wygrywa, a Carter przegrywa w większość:
stanów środkowo-zachodnich i zachodnich oraz wygrywa wybory w kilku innych ważnych stanach. Forda popierają więc 32 stany, a Cartera 18 stanów i dystrykt Columbia. Ford zdobywa 316 głosów elektorskich, a Cartel
- tylko 222.
Druga grupa respondentów, śledząc wyborcze audycje telewizyjne, miale sobie wyobrazić, że Carter wygrywa wybory w stanach południowycł i wschodnich na tyle zdecydowanie, że lekka przewaga Forda na zachodzit nie jest w stanie zmienić wyniku i Cartera popiera 28 stanów oraz dystryk Columbia, a Forda popierają 22 stany. Tak że Carter zdobywa 342 głos;
elektorskie, a Ford - tylko 196.
Scenariusze te odpowiadały rzeczywistym danym z badań opinii publicz nej, tak by sprawiały wrażenie prawdziwych. Po zabiegu tym respondentóv poproszono, by podali swoje przewidywania prawdziwego wyniku wyborów
Okazało się wówczas, że osoby, które wyobrażały sobie wcześniej zwycię stwo Cartera, wyżej oceniały szansę wygrania wyborów przez Cartera m:
osoby, które wyobrażały sobie wcześniej zwycięstwo Forda. Odwrotnie był< dla przewidywania szans wygranej Forda. Tak więc wyobrażenie sobie okre słonego wyniku czyniło ten wynik bardziej prawdopodobnym. Przypuszczał nie dlatego, iż działała tu zasada dostępności psychicznej: wcześniejsze wy obrażenie sobie pewnego wyniku sprawiło, że był on bardziej dostępny i stąi oceniany jako bardziej prawdopodobny.
,10. "
<-
Oceny zależności - kłopoty z wykorzystaniem doświadczenia
10.1. Współwystępowanie i korelacja
Bardzo często poszukujemy odpowiedzi na pytania w rodzaju wymienionych poniżej. v.
Czy jakość domu rodzinnego ma związek z przestępczością młodzieży? Czy płynność mówienia zależy od zasobu słów posiadanych w danym języku ?
Czy surowość kar ma wpływ na liczbę przestępstw w społeczeństwie? Czy styl zarządzania ma związek z wydajnością pracy? O związkach między tymi i wieloma innymi zjawiskami mówi korelacja. Korelacja jest miarą siły związku między dwiema cechami (czy ogólniej, między dwiema zmiennymi) oraz kierunku tego związku. Jeżeli jakieś dwie cechy nie są ze sobą wcale powiązane - na przykład intensywność owłosienia i inteligencja - to korelacja między nimi wynosi 0. Jeżeli jakieś inne cechy są ze sobą powiązane bardzo ściśle, tak że każdemu wzrostowi jednej cechy odpowiada proporcjonalny przyrost drugiej - na przykład promień okręgu i jego pole - to korelacja między nimi wynosi +1. Jeżelfwreszcie jakieś dwie cechy są ze sobą powiązane bardzo ściśle, ale w zależności odwrotnej, tak że każdemu wzrostowi jednej cechy odpowiada proporcjonalne zmniejszenie drugiej cechy -jak choćby wzrost osoby i odległość jej głowy od sufitu w danym pokoju - to korelacja między nimi wynosi -l. W rzeczywistości tak doskonałe zależności, ani pozytywne, ani negatywne, nie są prawie nigdy spotykane. Toteż korelacje nie osiągają w praktyce wartości +1 ani -l. Ogólnie jednak wysokie pozytywne korelacje wskazują na pozytywne powiązanie między cechami czy zjawiskami, a negatywne korelacje wskazują na negatywne powiązanie między cechami czy zjawiskami. Czy potrafimy trafnie zauważać owe związki?
OCENY ZALEŻNOŚCI - Miui^u l Y z. vvYt\UMZ-Yai/\i\iieivi LluowirtLi^z-ciNirt i %^f
10.2. pozorne korelacje
Chapman i Chapman (1969) pokazywali badanym osobom rysunki twarz;
ludzkich, sugerując, że są to rysunki wykonane przez pacjentów ośrodków psychiatrycznych. Następnie prosili o ocenę częstości występowania różnyci charakterystyk tych rysunków - takich na przykład jak pełne fałszu ócz;
- u różnych grup pacjentów. Mimo że obiektywnie nie było żadnych powią zań między cechami rysunków a kategorią pacjentów będących ich autora mi, jednak badani "znajdowali" wyraźne Współwystępowanie pewnych cec] rysunków z pewnymi kategoriami pacjentów, zauważali "fałszywe" oczy w ry sunkach paranoików. Zauważona korelacja ("fałszywe" oczy - rysunek po chodzący od paranoika) była nierzeczywista, czyli pozorna.
Złudzenie współwystępowania różnych zjawisk jest wśród ludzi ogromni rozpowszechnione. Niektórzy wierzą, że istnieje związek między kolorer włosów i pewnymi cechami psychicznymi człowieka: "rudzi są fałszywi' Jednym z przejawów pozornej korelacji jest także tendencja do przypisywa nią poszczególnym osobom albo wyłącznie cech pozytywnych, albo wyłąc2 nie negatywnych. Stwierdziwszy u kogoś inteligencję, możemy mieć skłon ność przypisywać takiej osobie odpowiedzialność, albo dostrzegając urodę możemy mieć skłonność do przypisywania komuś inteligencji (zwłaszcza dc tyczy to kobiet). Zjawisko to nosi nazwę błędu "aureoli".
W literaturze pięknej można spotkać mnóstwo opisów złudnych korelac między cechami fizycznymi człowieka i jego cechami psychicznymi. Ostr zarysowany podbródek ma świadczyć na przykład o silnym charakterze, duż jajowata czaszka - o wybitnej inteligencji. Oczywiście zależności tego typ nie istnieją. Korelacje są w rzeczywistości pozorne.
10.3. Oceny oparte na obserwacji i oceny oparte na mniemaniach
Przyjrzyjmy się parom liczb na listach A i B w tabeli 10.1. i zastanówmy SK czy między liczbami na tych listach występuje zależność pozytywna (tj. cz większym liczbom w pierwszej kolumnie odpowiadają w zasadzie większ liczby w drugiej kolumnie), czy negatywna (tj. czy większym liczbom w pierv szej kolumnie odpowiadają w zasadzie mniejsze liczby w drugiej kolumnie Jeżeli któraś z tych tendencji występuje, jak bardzo jest nasilona?
h'SJYCI-101-UUICZNb PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Tabela 10.1.
Pary liczb - lista A i B.
A
B
4 2
3 2
5 4
5 4
6 3
5 3
5 3
6 3
5 5
6 5
6 7
6 7
5 7
6 7
6 6
5 6
2 3
4 3
6 5
6 5
Jennings, Amabile i Ross (1988) pokazywali badanym studentom podobne zestawy liczb i prosili, by respondenci oszacowali, czy w obrębie każdego zestawu istnieje jakaś (pozytywna albo negatywna) zależność (korelacja) między parami liczb i jak duża jest ewentualna zależność. W innej części badania ci sami studenci otrzymywali pary określeń informujących o pewnych cechach ludzi, jak na przykład wzrost i waga albo nieuczciwość dzieci mierzona ich fałszywymi stwierdzeniami o osiągnięciach (wynikach) sportowych i ich nieuczciwość mierzona oszukiwaniem (liczbą oszustw) przy układaniu łamigłówki, albo zdolność osoby do odraczania gratyfikacji (przyjemności) i zdolność do przeciwstawienia się pokusie do oszukiwania itd. Trzeba zauważyć, że w tej drugiej serii badani nie dokonywali żadnych obserwacji, a tylko mieli oprzeć się na swoich poglądach, domniemaniach i doświadczeniu życiowym. Podobnie jednak jak w pierwszym typie zadań, badani określali najpierw, czy między przedstawionymi cechami zachodzi zależność pozytywna czy negatywna, a następnie oceniali nasilenie tej zależności.
Aby lepiej docenić niezwykłość otrzymanego wyniku, należy najpierw ustalić obiektywny stan rzeczy. Stan ten jest następujący: staranne badania psychologiczne pokazały, że w wypadku nieuczciwości dzieci, mierzonej raz ich fałszywymi stwierdzeniami o osiągnięciach sportowych, a drugi raz ich oszukiwaniem podczas układania łamigłówki, korelacja między tymi miarami wynosi zaledwie 0,18, czyli zależność między nimi istnieje, lecz jest niewielka. W wypadku zdolności osoby do odraczania gratyfikacji i z drugiej strony zdolności, przeciwstawienia się pokusie do oszukiwania, to obiektywnie ustalana korelacja między tymi cechami wynosi 0,31, jest więc nieco wyższa niż w poprzednim przypadku, ale również niezbyt imponująca. Pary
OCENY ZALEŻNOŚCI - KŁOPOTY Z WYKORZYSTANIEM DOŚWIADCZENIA l 03
mf. . " . ' ...
liczb w przytoczonym wyżej zestawie A są skorelowane na poziomie 0,2C (więc tak jak dwa pomiary nieuczciwości dziecięcej), a pary liczb w zestawie B są skorelowane na poziomie 0,30 (tak jak zdolność do odraczania gratyfikacji i zdolność przeciwstawienia się pokusie do oszukiwania). Można by więc oczekiwać, że studenci będą dostrzegać podobne zależności dla zestawu A i dla nieuczciwości dziecięcej mierzonej na dwa sposoby oraz dla zestawu B i dla zdolności do odraczania gratyfikacji i zdolności przeciwstawienia się pokusie do oszukiwania.
Jak wyglądały oceny studentów Stanfordu? Badani studenci skonfrontowani z bezpośrednimi danymi (pary liczb) oceniali (przeciętnie) te same zależności na poziomie od 0% do 10%, czyli prawie nie zauważali zależności. Kiedy jednak oceniali zależności między zjawiskami znanymi z doświadczenia, czy raczej z domniemań (dwa rodzaje nieuczciwości dziecięcej, zdolności do odraczania gratyfikacji i zdolności do przeciwstawienia się pokusie dc oszukiwania), wówczas oceniali je jako bardzo mocno skorelowane.
Morał z tego doświadczenia jest następujący: wiele związków między zjawiskami, w które jesteśmy skłonni wierzyć, ma charakter pozornych korelacji. Tworzy się je na podstawie domniemanych czy naiwnych teorii. Skonfrontowane z danymi, domniemania te okazują się bezzasadne.
10.4. Iluzja kontroli
Mając do czynienia ze zdarzeniami losowymi, takimi jak wyrzucenie kostką określonej liczby oczek czy wystąpienie określonego zjawiska naturalnego (deszczu albo pogody), ludzie wierzą niekiedy, albo zachowują się tak jakby wierzyli, że mogą wpływać na owe wydarzenia. Wyraźnie pokazują to obserwacje nad zachowaniem graczy w kasynach. Niektórzy gracze, chcąc uzyskać niski wynik przy rzucie kostką, rzucają ją bardzo delikatnie, a chcąc uzyskać wysoki wynik, rzucają kostkę energicznie. Podobno nawet zdarzało się, że kasyna zwalniały krupierów, którzy "mieli pecha" i uzyskiwali przy rzucaniu kostką niekorzystne dla kasyna wyniki (Langer, 1982).
Strickland, Lewicki i Katz (1966) wykonali specjalny eksperyment, który wykazywał istnienie owego poczucia kontroli nad zdarzeniami losowymi. Pozwalali oni badanym osobom stawiać większe lub mniejsze stawki w grze w kości. Zmieniali przy tym sytuację w ten sposób, że obstawianie następowało, zanim kostka została rzucona albo kiedy rzut już został wykonany, ale wynik był nie znany (nie można było go zobaczyć). W sytuacji nielosowej, kiedy mamy wpływ na wydarzenia, to, czy fakt zaistniał, czy jeszcze nie, ma oczywiście zasadnicze znaczenie: kiedy fakt już miał miejsce ("kości zostały rzucone"!) nie może być w żaden sposób zmieniony, natomiast fakt, który
l W
r-oT^nuLmJan^JMe: ruł-Mr-M U^ŁIMIANIA l l^uutJMUWANIA DECYZJI
jeszcze nie zaistniał, może być zmieniony. Przy zdarzeniu losowym nie mamy jednak takiego wpływu i stąd obie sytuacje są równoważne. A jednak dla badanych osób sytuacje, gdy kostka jeszcze nie została rzucona oraz kiedy rzut już został wykonany, nie były równoważne. Zróżnicowanie objawiało się w tym, że w sytuacji przed wyrzuceniem kostki badani stawiali większe kwoty pieniężne niż w sytuacji po wykonaniu rzutu - tak jakby mieli jakiś wpływ na rzut jeszcze nie wykonany.
To poczucie wpływu na zdarzenia objawiało się jeszcze inaczej w eksperymencie wykonanym przez Langer (1982). Oto zaproszony do laboratorium student spotykał tam innego, oczekującego już na badanie, osobnika. Ten mówił mu, że muszą chwilę zaczekać, nawiązywał konwersację na temat sportu i zarówno w konwersacji, jak i w całym zachowaniu wykazywał znaczną pewność siebie. Kiedy pojawiał się eksperymentator, zalecał obu badanym prostą grę: wyciągali z talii karty i wyciągający starszą kartę wygrywał. To, ile wygrywał, zależało od stawki, którą postawił. Z dwóch uczestników gry tylko jeden był właściwym badanym, drugi był pomocnikiem eksperymentatora, demonstrującym pewność siebie. Tak to wyglądało dla połowy badanych. Dla drugiej połowy wprowadzono zmianę: spotykany w laboratorium partner zamiast pewności siebie wykazywał nieśmiałość. W eksperymencie sprawdzano, jakie stawki będą obstawiali badani, mając do czynienia z jednym (pewnym siebie) i drugim (nieśmiałym) partnerem. Badani zachowywali się różnie: przy pewnym siebie partnerze stawiali mniej niż przy nieśmiałym. Zachowanie takie byłoby naturalnie rozsądne, gdyby gra zależała jakoś od uzdolnień graczy, ale w grze czysto losowej było to niczym nieuzasadnione - chyba że badani wierzyli, iż pewny siebie partner będzie wyciągał lepsze karty niż partner nieśmiały.
10.5. Niezauważane przypadki
Powodzenie uzdrowicieli. W pewnej miejscowości działa bardzo popularny uzdrowiciel. Zjeżdża do niego duża ilość poszukujących pomocy, a sława uzdrowiciela rośnie wraz z liczbą tych, którzy uzyskali poprawę stanu zdrowia. Często stawiane jest pytanie, jak się to dzieje, że zabiegi znachora wywołują pozytywne skutki. Czy działa tu tajemnicza energia psychiczna (której jednak nie daje się mierzyć), czy jest to efekt sugestii lub autosugestii, czy może jeszcze coś innego?
Pojawia się jednak bardziej podstawowe pytanie, czy w ogóle mają miejsce jakieś nadzwyczajne uzdrowienia. Nie chodzi przy tym o to, czy przypadki poprawy zostały dobrze zarejestrowane, tj. że w każdym z zapisywanych na konto uzdrowiciela przypadku ustalono starannie stan sprzed i stan
u^tNY ZALEZNObt^l - r\curu i T z. WTr\ur-i^Ya IHIMIŁ.M uu&wiALH^Z.tlMIA l U
po uzdrowieniu, tak by nie było wątpliwości, że naprawdę nastąpiła poprą wa. Przyjmijmy, że działa kontrola tego rodzaju. Czy już możemy orzec, ż zabiegi znachora skutkują, ponieważ obserwuje się częste przypadki pc prawy?
Logika nakazuje ciągle jeszcze zachować sceptycyzm i przyjrzeć się pc prawom na tle innych przypadków. Jakie są te inne przypadki? Najpierw jest to kwestia tych, którzy przybywają do znachora i odchodzą z niczyrr nie uzyskują poprawy. Ilu ich jest? Więcej czy mniej niż tych, którzy doznaj poprawy? Jak dużo więcej? Ale to nie wszystko; są tacy potrzebujący pomc cy, którzy do znachora nie przychodzą. Czy nie jest tak, że także i w t( grupie zdarzają się przypadki, że (bez żadnej interwencji znachora) nast^ puje poprawa? Jak dużo jest takich przypadków? Jest grupa takich, którz potrzebują pomocy, ale do znachora nie idą i nie następuje u nich poprawę Ważna jest proporcja tych, którzy doznają i nie doznają poprawy, w grupit która do znachora nie idzie. Żeby lepiej zorientować się we wszystkich tyć przypadkach przyjrzyjmy się poniższej tabeli.
Tabela 10.2.a
Częstość występowania i niewystępowania poprawy u odwiedzających i nieodwiedzc jących znachora.
poprawa nastąpiła
poprawa nie nastąpiła
odwiedzający znachora
a
b
nieodwiedzający znachora
c
d
Załóżmy, że ktoś rzeczywiście "uparł się", by przeprowadzić badanie na skutecznością znachora. Co powinien zrobić? Powinien zebrać, na przykłac 500 klientów znachora z jednego tygodnia (100 pacjentów dziennie to zdaj się być normą u znachorów) i zbadać, u ilu z nich nastąpiła poprawa, a u ii nie. Dodatkowo powinien zebrać 100 przypadkowych osób (albo ich akta które cierpiały kiedyś na podobne objawy, co klienci znachora, i zbadać, u iii z nich nastąpiła spontaniczna poprawa, a u ilu nie. Przyjmijmy, że otrzyma] by zestaw pokazany w tabeli 10.2.b. Wynika z niego, że wśród osób, u ktć rych występują tego typu objawy, 4% uzyskuje spontaniczną poprawę (ni wiadomo dlaczego). Wynika też, że wśród osób, u których występują teg typu objawy, 5% uzyskuje poprawę po wizycie u znachora (również nie wia domo dlaczego). Wynika wreszcie, że w takim wypadku przewaga znachor nad losem nie byłaby imponująca (o ile w ogóle nie byłaby przypadkowa, ja uczy statystyka).
Oczywiście zestaw w tabeli 10.2.b jest całkowicie fikcyjny, nieznane mi s żadne systematyczne badania nad skutecznością leczniczą znachora. By
l .-) l ^l i^i-^^n^^-i^i- rui-nriM >^>^l-i^i7-»l^l7-\ l r>^'l-'c>JIVH_»VVMl^lA UtUYZ-JI
może badania takie ukazałyby rzeczywistą przewagę znachora nad losem. To, co owej przewagi nie daje, to przedstawienie w telewizji 25 osób, którym znachor pomógł.
Tabela 10.2.b Częstość występowania i niewystępowania poprawy u odwiedzających i nieodwiedza-
jących znachora.
poprawa nastąpiła
poprawa nie nastąpiła
odwiedzający znachora
25
475
nieodwiedzający znachora
4
96
Niezauważane przypadki. Jak to jednak często bywa, logika logiką, a psychologia psychologią. Zobaczmy teraz, jak ludzie mają skłonność patrzeć na tego rodzaju zestawienia. Smedsiund (1963) pokazywał pielęgniarkom 100 kart będących rzekomo wyciągami z kart chorobowych pacjentów. Każda karta zawierała informację o tym, czy wystąpił, czy nie wystąpił pewien symptom i czy wystąpiła, czy nie wystąpiła pewna choroba. Pielęgniarki obejrzały w sumie 100 kart zawierających przypadki zestawione w poniższej tabeli.
Tabela 10.3.
Częstość występowania symptomów i choroby w stu zaobserwowanych przypadkach.
choroba obecna
choroba nieobecna
symptom obecny
37
33
symptom nieobecny
17
13
85% pielęgniarek stwierdziło, że istnieje związek między symptomem a chorobą. Czy miały ku temu podstawy? Zauważmy, że "spośród 70 przypadków, w których wystąpił symptom (górny wiersz tabeli) w 37 przypadkach, czyli tylko w nieco ponad połowie, wystąpiła choroba. Podobnie, spośród 30 przypadków, w których nie wystąpił symptom (dolny wiersz tabeli), w 17 przypadkach wystąpiła choroba - znowu w nieco ponad połowie przypadków. Tak więc u nieco ponad połowy pacjentów wystąpiła choroba, niezależnie od tego, czy wystąpił symptom, czy nie. Zatem symptom i choroba były zupełnie niezależne.
Smedsiund, a następnie wielu innych badaczy, stwierdził, że popełniony przez pielęgniarki błąd polegający na zauważaniu zależności tam, gdzie jej nie ma, jest typowy i że jest wynikiem faktu, że przy ocenie związku (korela-
OCENY ZALEŻNOŚCI - KŁOPOTY Z WYKORZYSTANIEM DOŚWIADCZENIA l DO
cji) między zdarzeniami ludzie nie zwracają uwagi na niektóre spośród rubryk powyższej czteropolowej tabeli. Pielęgniarki, a także my wszyscy, oceniając związek między zdarzeniami, koncentrujemy uwagę przede wszystkim na tych przypadkach, gdy oba interesujące zdarzenia są obecne w powyższej tabeli - w rubryce symptom obecny/choroba obecna. Jeżeli zaobserwujemy wiele przypadków tego rodzaju, to uważamy, że między wymienionymi zjawiskami zachodzi związek. Może to być powodem popularności znachorów. Jest to jednak obserwacja niewystarczająca. Dla ustalenia związku symptomu z chorobą czy zabiegów znachora z poprawą zdrowia trzeba zbadać wszystkie przypadki.
Russo i Schoemaker (1989) przytaczają kosztowną pomyłkę tego rodzaju, która miała miejsce przy śledzeniu awarii w czasie startów wahadłowców kosmicznych w NASA. Podają dokonane przez inżynierów tej renomowanej amerykańskiej agencji badań kosmicznych zestawienie nad przypadkami awarii wahadłowców w czasie startów w zależności od temperatury powietrza w dniu startu. Zestawienie to - pokazane na rys. 10.1. - nic szczególnego nie sugeruje (i nie zrobiło też, według Russo i Schoemaker, szczególnego wrażenia na kierownictwie NASA).
^ 2
=• 1
50 55 60 65 70
Temperatura w F
-przypadki, gdy na-
Rys. 10.1.
Temperatura (w stopniach F) w czasie startów wahadłowców •
stąpiła awaria.
Kiedy jednak do analizy dodano te przypadki startów wahadłowców kosmicznych, przy których awaria nie wystąpiła, można było już zauważyć pewną prawidłowość. Pokazuje ją rys. 10.2. Zauważono, że znakomita większość bezawaryjnych startów odbywała się w dni, kiedy temperatura była
ł
.. ^1 i^i-^^in^-iMc rui-rtrr\i ^^CIMIMINIM l r-uutJMUWANIA DECYZJI
',«fV^f^- - . ' •••yw;^;- ; •• . ?^
raczej wyższa, w każdym razie przekraczała 66 stopni F. Możliwe zatem, że istnieje związek między przypadkami awarii wahadłowców w czasie startów w zależności od temperatury powietrza w dniu startu.
+^ t » » f-<h-<-^4-» » » ^
50
55
60
75
80
85
65 70 Temperatura w F
Rys. 10.2.
Temperatura (w stopniach F) w czasie startów wahadłowców.
10.6. Dlaczego nie uczymy się z doświadczenia:
brakująca informacja
Kierownik działu kadr pewnej renomowanej firmy wypracował procedurę zatrudniania pracowników w tej firmie. Jest z tej procedury bardzo dumny, gdyż okazuje się, że na 100 przyjmowanych według niej pracowników 80 sprawdza się, to znaczy pracuje w sposób satysfakcjonujący. Czy kierownik działu kadr ma podstawy do takiej dumy? Jak pokazuje poniższa tabela, dane, na których opiera on swoje dobre samopoczucie, są pełniejsze niż typowe dane znachora, ale przecież są niepełne. Pozwalają mu wprawdzie ustalić, w ilu przypadkach przyjęty pracownik okazał się dobry, a w ilu przypadkach nastąpiła pomyłka - przyjęty pracownik się nie sprawdził. W świetle naszych rozważań sprawdzenie takie jest jednak niewystarczające. Zęby ustalić, czy przyjęta procedura selekcyjna ma rzeczywiście jakąś wartość, trzeba by zrealizować cały schemat; oprócz przypadków, gdy selekcja była pozytywna, trzeba by uwzględnić także przypadki, gdy selekcja była negatywna, i sprawdzić, jaki procent kandydatów odrzuconych uzyskiwałby wysokie, a jaki niskie wyniki. Dopiero ustalenie, że większość kandydatów ocenionych pozytywnie sprawdza się w pracy, a większość kań-
OCENY ZALEŻNOŚCI - KŁOPOTY Z WYKORZYS lANIfcM UOawiAUCZbNIA 10^
dydatów ocenionych negatywnie się nie sprawdza, dawałoby podstawę do stwierdzenia, że przyjęty system selekcyjny działa dobrze.
Tabela 10.4.
Zgodność selekcji z wynikami pracy pracowników.
dobre wyniki w pracy
słabe wyniki w pracy
selekcja pozytywna
80% przypadków
20% przypadków
selekcja negatywna
brak danych
brak danych
Niestety, kierownikowi działu kadr brakuje danych na temat odrzuconych przypadków i nie ma on sposobu przekonać się o trafności swojej procedury selekcyjnej.
Bardzo często znajdujemy się w sytuacji podobnej do kierownika: nauczy^ ciel przyjął pewną metodę nauczania i może obserwować jej skutki w postaci liczby uczniów uzyskujących zadowalające wyniki i liczby uczniów nieuzy-skujących zadowalających wyników, ale nie może porównać tej metody z inną metodą, którą odrzucił - brak mu na ten temat danych. Firma przyjęła pewną strategię marketingową i uzyskała określony wynik finansowy, ale na ogół nie może wiedzieć, jaki wynik uzyskałaby, przyjmując inną, alternatywną strategię marketingową itd.
W tej sytuacji (braku danych na temat skutków alternatywy odrzuconej) tylko osoby naiwne (lub traktujące odbiorcę jako osobę naiwną) deklarują, że przyjęte rozwiązania są optymalne. Słyszy się to szczególnie często w debatach politycznych: oto "rząd przyjął optymalny plan gospodarczy", "minister przygotował optymalny wariant budżetu" itp. W sformułowaniach takich nie wyraża się nic więcej, jak tylko robienie sobie reklamy przez polityków.
W sytuacji braku danych na temat skutków alternatywy odrzuconej znajdują się z natury rzeczy historycy Wiadomo, że generał Jaruzelski wprowadził w Polsce w roku 1981 stan wojenny i że nie nastąpiła wówczas interwencja sowiecka. Generał Jaruzelski twierdzi potem, że interwencja nie nastąpiła dlatego, iż wprowadził stan wojenny Nie ma w tym nic dziwnego (z punktu widzenia psychologii), że generał tak twierdzi, ale ogromnie trudno jest dowieść istnienia zależności między tymi wydarzeniami. Nie ma danych na temat tego, co zdarzyłoby się, gdyby generał Jaruzelski nie wprowa^ dził stanu wojennego. Naturalnie historycy muszą w tej sytuacji odwoływać się do różnego rodzaju dowodów pośrednich.
W dziedzinach innych niż historia istnieją na ogół możliwości rozstrzygania, które z konkurujących (alternatywnych) rozwiązań jest lepsze. Wymaga to jednak podejścia "eksperymentalnego". Eksperymentowaniu poświęcony jest następny paragaf.
l \J\J t-SYUl-IUl-UUal^Z-IME: t-UŁAt^lM U^tlMIMNIA l ^UUtJMUWANIA DECYZJI
10.7. Jak korzystać z doświadczenia:
potrzeba eksperymentowania
Einhorn i Hogarth (1978) pokazują, jak nasz zwykły sposób korzystania z doświadczenia może utrwalać nawet najbardziej błędne mniemania. Wyobraźmy sobie kelnera, który jest przekonany, że znakomicie zna się na ludziach i że potrafi na oko odróżnić klienta, który zostawi wysoki napiwek, od takiego, który albo zostawi mały napiwek, albo wcale. W jaki sposób będzie zachowywał się taki kelner? Oczywiście będzie on każdorazowo oceniał, czy ma do czynienia z klientem hojnym, który da wysoki napiwek, czy raczej z klientem skąpym, który nie da napiwku. Stosownie do dokonanej diagnozy będzie też albo bardziej, albo mniej starannie obsługiwał klienta (naturalnie dobrego klienta będzie obsługiwał staranniej, słabego - nieco mniej starannie). Czy taki kelner ma możliwość dowiedzieć się, czyjego znajomość "psychologii klienta" jest duża, a diagnozy trafne?
Zobaczmy, jaki typ informacji zwrotnej otrzymuje nasz kelner. Dowiaduje się on, jak często klient oceniony jako dobry i stosownie do tego starannie obsługiwany zostawia hojny napiwek oraz jak często klient oceniony jako słaby i stosownie do tego niestarannie obsługiwany nie zostawia napiwku. Czy obserwacje te wystarczą do ustalenia, że kelner jest faktycznie "dobrym psychologiem" i czy słusznie podtrzymuje wysokie mniemanie o swojej kompetencji. Czy wystarczy obserwacja, że hojni klienci rzeczywiście zostawiają wysokie napiwki, a skąpi klienci nie zostawiają napiwków?
Łatwo zauważyć, że oprócz diagnozowanej przez kelnera jakości klienta na wielkość napiwku może mieć również wpływ obsługa kelnera. Przypuszczalnie dobra obsługa kelnera, niezależnie od jakości klienta, także wpływa na wysokość zostawianych napiwków. Klienci dobrze obsługiwani będą zapewne mieli większą skłonność do zostawiania wysokich napiwków, a klienci obsługiwani słabo - do zostawiania skąpych napiwków. Zatem pełna liczba możliwych przypadków wynosi cztery. Pokazuje je następująca tabela.
Tabela 10.5.
Sprawdzanie związku wysokości napiwku z trafnością diagnozy i postępowania kel
nera.
dobry klient
słaby klient
obsługa staranna
a
b
obsługa niestaranna
c
d
OCENY ZALEŻNOŚCI-KŁOPOTY Z WYKORZYSTANIEM DOŚWIADCZENIA lUł
Kelner w swoim postępowaniu "testującym" ogranicza się, jak widać, tylko do rubryk a i d, ale takie postępowanie nie rozstrzyga, czy pozytywny albo negatywny skutek (wysoki napiwek / brak napiwku) pochodzi z trafnej diagnozy kelnera, czy z bardziej albo mniej starannej obsługi klienta. Rzetelne sprawdzenie zdolności diagnostycznych kelnera wymagałoby zaryzykowania z jego strony "eksperymentalnego" potraktowania części dobrych klientów niestaranną obsługą i części słabych klientów - staranną obsługą, Gdyby się okazało, że napiwki w rubrykach a i b są zdecydowanie wyższe od napiwków w rubrykach c i d, oznaczałoby to, że decydującą dla wysokości napiwku jest (wbrew mniemaniu kelnera) staranność obsługi, a nie "dobre rozeznanie" klienta. Gdyby się okazało, że napiwki w rubrykach a i c ss zdecydowanie wyższe od napiwków w rubrykach b i d, oznaczałoby to, że decydujące dla sprawy wysokości napiwku jest (zgodnie z mniemaniem kelnera) "dobre rozeznanie" klienta, a nie staranność obsługi. (Postępowanie kelnera polegające na starannej obsłudze dobrego klienta i niestarannej obsłudze skąpego klienta byłoby zresztą w tym przypadku nieracjonalne - wszak liczyłoby się tu tylko "dobre rozeznanie" klienta). Gdyby się okazało że napiwki w rubryce a są zdecydowanie wyższe od pozostałych, a w rubryce d są zdecydowanie niższe od pozostałych, to oznaczałoby to, że ważne są "dobre rozeznanie" klienta i staranność obsługi (postępowanie kelnera w tyir wypadku byłoby racjonalne!).
Wykonanie tego rodzaju doświadczenia napotyka jednak na związaną z po trzeba wykonania trudnego eksperymentu przeszkodę. Trudnego dlatego że zrealizowanie go oznacza tu podjęcie pewnego ryzyka. Kelner dla przeko nania się o trafności swoich diagnoz musi zaryzykować (zbędną z jego punk tu widzenia) dobrą obsługę skąpych klientów i z drugiej strony (szaleńczs z jego perspektywy), słabą obsługę hojnych klientów. Czy można znaleźi wśród kelnerów tak odważnych eksperymentatorów? Doświadczenie poka żuje, że raczej trudno. Nie tylko zresztą wśród kelnerów, ale także wśróc nauczycieli, przedsiębiorców, polityków. Zastanówmy się, jak trudna byłaby decyzja kierownika działu kadr, który wierząc w swoje doświadczenie w do borze pracowników, miałby zaryzykować przyjęcie nie tylko grupy odpowied nich, ale także grupy nieodpowiednich kandydatów, po to, aby po pewnyn czasie ustalić, czy kandydaci odpowiedni rzeczywiście lepiej sobie radzą z za daniami w jego firmie.
We wszystkich tych przypadkach rysuje się wyraźnie konflikt między po znaniem prawdy a określonymi celami praktycznymi. Poznanie prawdy wy maga podjęcia ryzyka polegającego na tym, że wtedy, kiedy potwierdzi sil sprawdzana hipoteza, "eksperymentator" ponosi określone koszty - kie równik działu kadr traci na zatrudnieniu grupy nieodpowiednich kandyda tów, kelner traci dbałość o klienta, który i tak nie zostawi napiwku itp. Z dru
l W r&T^IIULUUal^/.IMt ^UC.Ah'K.1 UUtlNIAIMIA l h'UUbJMUWANIA DECYZJI
giej jednak strony, nie podejmując ryzyka weryfikacji naszych wątpliwych przekonań, także coś ryzykujemy, a mianowicie ryzykujemy trwanie w błędnych przekonaniach.
Wybór postępowania w tym wypadku bynajmniej nie jest oczywisty. Z pewnością nieracjonalną rzeczą jest bezrefleksyjne trwanie w potencjalnie błędnych przekonaniach i unikanie wszelkiego ryzyka związanego z ich weryfikacją. Postępowanie takie na dłuższą metę może prowadzić do większej straty niż strata zawarta w eksperymencie. Młodemu kelnerowi mającemu w perspektywie, na przykład, 20 lat pracy w tym zawodzie raczej opłaca się zaryzykować kilkutygodniowy eksperyment dla przekonania się o trafności swoich diagnoz, w ten sposób może bowiem uniknąć niepotrzebnych strat w następnym długim okresie. Eksperyment taki byłby natomiast przypuszczalnie nieopłacalny dla kelnera, który za pół roku odchodzi na emeryturę (chyba że kelner miałby bardzo rozwiniętą potrzebę poznawczą).
Bywają sytuacje, w których oczywisty wydaje się wybór na niekorzyść eksperymentowania (i poznania prawdy). Wyobraźmy sobie, że przytrafiła się nam poważna choroba, w dodatku tego rodzaju, że lekarze nie bardzo wiedzą, jak ją leczyć. Znane są wprawdzie dwie metody leczenia, ale żadna nie daje gwarancji skutecznego wyleczenia. Załóżmy dalej, że lekarze mają podejrzenie (ale nie pewność), iż skuteczność metody (wynik leczenia) może zależeć od wieku pacjenta. Wydaje im się, że wobec młodszych pacjentów - na przykład do 35 roku życia - skuteczniejsza jest metoda A, a wobec pacjentów starszych skuteczniejsza jest metoda B. Analizując przypadek kelnera, wiemy już, jak lekarze mogą ustalić, czy rzeczywiście wiek pacjenta pozostaje w związku ze skutecznością metody leczenia. Zmieniając dane w tabeli 10.5., uzyskujemy odpowiednią tabelę 10.6. pozwalającą sprawdzić istnienie związku między wiekiem pacjenta i skutecznością metody leczenia.
Tabela 10.6. ^ Sprawdzanie związku między wiekiem pacjenta i skutecznością metody leczenia.
pacjenci młodsi
pacjenci starsi
terapia A
a
b
terapia B
c
d
A teraz, Czytelniku, zastanów się, czy zgodziłbyś się znaleźć w rubryce b tej tabeli, czyli być leczony metodą A, będąc pacjentem powyżej 40 roku życia, albo czy zgodziłbyś* się znaleźć w klatce c tej tabeli, być leczony metodą B, będąc pacjentem poniżej 30 roku życia. W obu przypadkach oznaczałoby to zaakceptowanie terapii przypuszczalnie mniej skutecznej dla Twojego wieku. Z pewnością byłyby kłopoty ze skompletowaniem takich
OCENY ZALEŻNOŚCI - KŁOPOTY Z WYKORZYSTANIEM DOŚWIADCZENIA l 03
grup pacjentów dla uzyskania porównania skuteczności obu terapii w zależności od wieku.
Co mają zatem robić lekarze - czy powinni realizować tego rodzaju eksperymenty? Względy etyczne nakazują im powstrzymać się od takiego eksperymentowania, mimo że "odkrycie prawdy" mogłoby przynieść korzyść i medycynie, i przyszłym pacjentom. Przykład ten pokazuje jeszcze wyraźniej, że wybór między poznaniem prawdy a wymaganiami praktycznymi nie jest bynajmniej sprawą oczywistą. Nie możemy sobie pozwolić na weryfikowanie wszystkich naszych przekonań. Niektóre z nich muszą pozostawać niesprawdzone ze względu na wymagania praktyczne. Trzeba jednak pa miętać, że nic podejmując ryzyka weryfikacji naszych przekonań ryzykujemy trwanie w błędnych i bezzasadnych mniemaniach.
Błędy w ocenie własnej wiedzy
I. NADMIERNA PEWNOŚĆ SIEBIE 11.1. Test nieuzasadnionej pewności siebie
Russo i Schoemaker przygotowali następujący test, pozwalający sprawdzić, czy właściwie oceniamy naszą wiedzę. Zanim Czytelnik podejmie dalszą lekturę, dobrze uczyni, poddając się temu testowi - wystarczy wziąć kartkę (żeby nie bazgrać po książce!) i wypełnić zadanie zgodnie z instrukcją (należy jednak starannie zasłonić podane zaraz za tabelką odpowiedzi).
Tabela 11.1.
Test (Russo i Schoemakera) nieuzasadnionej pewności siebie6.
Dla każdego z poniższych pytań proszę podać po dwie wartości: DOLNĄ i GÓRNĄ, tak żeby miał(a) Pan(i) 90% pewności, że prawdziwa odpowiedź mieści się między tymi dwiema wartościami. Proszę postarać się, żeby granice nie były ani zbyt wąskie (nadmierna pewność siebie), ani zbyt szerokie (niedocenianie siebie). Wymaganie to będzie spełnione, kiedy uzyska się 10% błędów, czyli kiedy dokładnie jedna odpowiedź będzie błędna.
Przedział 90% pewności Wartość Dolna Górna
1. Wiek Adama Mickiewicza w chwili śmierci .............................. ..............................
2. Długość rzeki Nil .............................. ..............................
3. Liczba krajów zrzeszonych w organizacji OPEC .............................. ..............................
4. Liczba ksiąg Starego Testamentu .............................. ..............................
Dla polskiego czytelnika zamieniono pytanie o wiek Martina Lutera Kinga w chwili śmierci na wiek Adama Mickiewicza w chwili śmierci.
BŁĘDY W OCENIE WŁASNEJ WIEDZY . . •
5. Długość średnicy księżyca w kilometrach
6. Waga pustego Boeinga 747 w kilogramach
7. Rok urodzenia Wolfganga Amadeusza Mozarta
8. Okres ciąży (w dniach) u słonia azjatyckiego
9. Odległość powietrzna z Londynu do Tokio
10. Najgłębszy (znany) punkt na oceanach w metrach
Teraz porównajmy nasze odpowiedzi z podanymi niżej odpowiedzą(tm) prawdziwymi i ustalmy, w ilu przypadkach podane przez nas granic^ nl( zawierały prawdziwej odpowiedzi. Jeżeli więcej niż raz, popełniliśmy ^sce, niż dopuszczane w instrukcji 10% błędów. Jeżeli Czytelnik jest typfi^^y" przedstawicielem gatunku homo sapiens, przyjmę zakład, że popełnił duż( więcej błędów. Prawie wszyscy udzielają w teście kilku odpowiedzi błęd^^ Jaki stąd morał? Zwykle ludzie przeceniają zasób swojej wiedzy, co zi^^S że w rzeczywistości wiedzą mniej, niż sądzą, że wiedzą.
Tabela 11.2.
Poprawne odpowiedzi w teście nieuzasadnionej pewności siebie.
Nr pytania
Prawdziwa odpowiedź
1.
57 lat
2.
7754 km
3.
13 krajów
4.
46 ksiąg
5.
4017 km
6.
177060 kg
7.
1756
8.
645 dni
9.
11036 km
10.
11033 m
11.2. Powszechność zjawiska nieuzasadnionej pewności siebie
Jak dobrze rozpoznajemy własną zawodność/niezawodność przy formi^t^ niu ocen? Czy twierdząc, że jesteśmy czegoś pewni na 100%, rzeczy^^ nigdy (lub prawie nigdy) się nie mylimy? Albo kiedy twierdzimy, żejes^811" czegoś pewni na 90%, to mylimy się tylko w 10% przypadków?
Istnieje duża liczba badań, w których porównywano trafność odp^^' dzi udzielanych przez ludzi z ocenami pewności, z jakimi odpowiedzi 1 były udzielane. Porównania miały pokazać, który z następujących itrzec
• • k 1-^3 i ^n^i-^/^i^.z.i-yc ruc-MriM ^k^cmrti^iM i ruutJMUWANIA DECYZJI
Ł ł: •: i --. •- •-. ^(tm):^^A •• ..' ,..••'. , , ^,^
przypadków zachodzi, gdy ludzie twierdzą, że są czegoś pewni na 100%, 90%, 75%, 50%:
(a) proporcja trafnych odpowiedzi jest w przybliżeniu równa deklarowanej pewności (trafna ocena własnej wiedzy);
(b) proporcja trafnych odpowiedzi jest większa niż deklarowana pewność (niedocenianie własnej wiedzy);
(c) proporcja trafnych odpowiedzi jest mniejsza niż deklarowana pewność (nadmierna pewność siebie).
W badaniach na ten temat posługiwano się pytaniami dotyczącymi wiedzy ogólnej, takimi jak: "Co to jest absynt?", "Ile liczy ludność Brazylii?", "Co ma większy nakład: «Playboy» czy «Time»?" itd. Wykorzystywano przy tym różne techniki badawcze.
Jedną z nich jest technika "jednej alternatywy" - prosi się w niej osoby badane o ocenę prawdopodobieństwa (na skali od O do l), że prawdziwe jest dane stwierdzenie, na przykład "Absynt jest drogocennym kamieniem". .
Według innej techniki - dwu alternatyw - formułuje się dwie odpowiedzi, na przykład absynt jest:
(a) drogocennym kamieniem;
(b) napojem alkoholowym.
Osoba badana ma najpierw wskazać, która z dwóch odpowiedzi jest, jej zdaniem, bardziej prawdopodobna, a następnie określić (na skali od 50 do 100%) pewność swojej odpowiedzi. Rzecz jasna, można też stosować technikę trzech i więcej możliwości do wyboru.
Podsumowując wyniki wielu badań, Lichtenstein, Fischhoff i Phillips (1977) ustalili, że prawie we wszystkich badaniach tego rodzaju proporcja trafnych ocen była zwykle zdecydowanie niższa od formułowanych ocen pewności. Innymi słowy, ludzie z reguły byli nadmiernie pewni siebie w formułowaniu ocen. Lichtenstein i Fischhoff (1977) stwierdzili przy tym, że owa nadmierna pewność siebie nie jest związana ani z inteligencją, ani z byciem bądź nie-byciem ekspertem w danej dziedzinie. Można powiedzieć - nadmierną pewność siebie ujawniają wszyscy. Kiedy twierdzimy, że jesteśmy czegoś pewni na 90%, to mylimy się nie w 10%, ale w 40-50% przypadków itd. A co w wypadku sądów wygłaszanych jako całkowicie (100%) pewne? Lichtenstein i Fischhoff (1977) stwierdzili, że spośród twierdzeń deklarowanych jako pewne, przeciętnie 20-30% okazywało się fałszywymi. Podobny odsetek twierdzeń ocenianych jako z pewnością fałszywe okazywał się w rzeczywistości twierdzeniami prawdziwymi.
Ustalenia te brzmią szczególnie niepokojąco, gdy pomyśleć o werdyktach wydawanych w sądach. Gdyby tego rzędu proporcja werdyktów miała być nietrafna w sprawach, w których została orzeczona wina oskarżonego, to byłoby się czego obawiać (zwłaszcza gdy wyroki obejmują także karę śmierci). Nie ma
BŁĘDY W OCENIE WŁASNEJ WIEDZY
naturalnie żadnych dowodów na to, że proporcja nietrafnych orzeczeń w sądzie miałaby być aż tak znaczna, ale sama skłonność do nadmiernej pewności siebie powinna być w tym kontekście wciąż brana pod uwagę.
Gilbert, McPeek i Mosteller (1977) przejrzeli publikacje medyczne z okresu 1964 do 1973, które zawierały doniesienia badawcze na temat skuteczności innowacji w zakresie zabiegów chirurgicznych i anestezjologicznych. Przeanalizowali badania, w których porównywano korzyści płynące z owych innowacji w zestawieniu z metodami tradycyjnymi. Innymi słowy, analizowali wyniki eksperymentów medycznych, w których sprawdzano (zgodnie z regułami metody eksperymentalnej), czy grupy pacjentów poddane nowym sposobom leczenia uzyskują większą poprawę niż grupy poddane dotychczasowym metodom leczenia. Poprawa mogła dotyczyć albo skutków leczenia głównej choroby pacjenta, albo zmniejszenia skutków ubocznych leczenia. Z porównania powstał następujący obraz: innowacje w zakresie zabiegów chirurgicznych i anestezjologicznych okazały się udane w około połowie zbadanych przypadków. Udane w takim sensie, że innowacja dawała lepsze wyniki niż metoda tradycyjna. Oznacza to, że w pozostałych przypadkach pożytki z zastosowania innowacji nie potwierdziły się. Jest to wynik niepokojący, dlatego że, jak słusznie zauważają Gilbert, McPeek i Mosteller (1977);
innowatorzy, którzy decydowali się na przeprowadzenie eksperymentu medycznego, byli prawie w 100% przekonani, że eksperyment udowodni przewagę nowego sposobu leczenia nad sposobem dotychczasowym. Blisko połowa badań nie potwierdziła jednak tego mocnego przekonania lekarzy.
11.3. Gdy rośnie pewność bez poprawy trafności stawianych diagnoz
Oskamp (1962) przedstawiał różnym grupom psychologów klinicznych (doświadczonym psychologom klinicznym i bardziej oraz mniej zaawansowanym studentom psychologii) pewien przypadek dorosłej osoby z zaburzeniami. Przypadek ten był opisywany partiami. Najpierw opisywano zajęcie i bieżące zachowanie pacjenta (część pierwsza). Następnie w drugiej część opisywano wczesne dzieciństwo pacjenta. Trzecia część obejmowała okres szkolny i wreszcie czwarta część - służbę wojskową i dalsze jego losy. Za stosowano szczególną procedurę. Najpierw przedstawiano klinicystom częś( pierwszą i proszono o opartą na tym szczupłym materiale diagnozę doty czącą osobowości pacjenta. Proszono także o ocenę pewności postawione diagnozy. Następnie podawano dalszą informację, czyli drugą część opisu i znowu proszono o diagnozę dotyczącą osobowości pacjenta i o ocenę pew
^.-,<"->i <ii-i i i <^I->[.:UIVII^VVA|\IA DECYZJI
;as;.?^BiBSBsa^B?:ss^sas^iHS?;^a??ia^;:a;s:ga^g^;BB ••• • • •.•..•••.•••.^•••••'"••"w-
ności postawionej diagnozy. Z kolei podawano trzecią część informacji i wreszcie czwartą, za każdym razem prosząc o ponowną diagnozę i o ocenę pewności postawionej diagnozy.
We wszystkich trzech grupach badanych proporcja trafnych diagnoz była mniejsza niż deklarowana przez te osoby pewność. Szczególnie zadziwiał fakt, że w miarę dodawania kolejnych porcji informacji o pacjencie trafność prognoz nie ulegała poprawie, natomiast bardzo rosła pewność stawianych diagnoz. Pokazuje to rys. 11.1.
60 50.
40-30-20-10-0-
H trafność • pewność
^'•^913s ^^"•^"^^^ilii
: 'iiilffli
':M lig MlISIMBB
^1 11
III 11111(1
11
IV
FAZY
Rys. 11.1.
Trafność i pewność diagnoz stawianych w kolejnych fazach eksperymentu Oskam-pa (1965). ('
Podobny wynik uzyskał Pauł Slovic ze współpracownikami, kiedy badał predykcje ekspertów od wyścigów konnych. Eksperci ci, kierując się wcześniejszymi wynikami koni, oceniają szansę konia w kolejnym wyścigu. Interesującą specyfiką ich poczynań jest to, że wcześniejsze dokonania konia są charakteryzowane przez około 100 różnych wskaźników. Jest nie do wyobrażenia, by byli oni w stanie wziąć pod uwagę aż tyle różnych informacji, toteż Slovic zalecał im, by przed oceną szansy każdego konia wybrali sobie tylko pięć najbardziej istotnych informacji o jego przeszłości i postawili diagnozę opartą na tej podstawie. Następnie pozwalał "dobrać" jeszcze pięć informacji o diagnozowanym koniu, w trzecim kroku dodawał jeszcze dziesięć dalszych informacji, a w czwartym ekspert otrzymywał w sumie aż czterdzieści informacji.
Bt.t;DY W OCENIE WŁASMbJ WibDZLY
Pytanie, na które badacze szukali odpowiedzi, brzmiało: jak będzie się zmieniała trafność stawianych prognoz i pewność stawiających prognozy? Okazało się, że pewność systematycznie rosła wraz ze wzrostem ilości informacji posiadanych przez ekspertów. Trafność zaś najpierw utrzymywała się na tym samym poziomie, tzn. nowe informacje nie poprawiały przewidywań, w przypadku skrajnym - kiedy ekspert dysponował aż czterdziestoma informacjami - trafność się pogarszała. Dlaczego? Wydaje się, że wystąpiło zjawisko przeciążenia informacyjnego: eksperci przestali panować nad nadmiarem informacyjnym.
11.4. Czy można poprawić oceny pewności (zmniejszyć nadmierną pewność siebie)?
W Amerykańskim Biurze Prognoz Pogody wprowadzono obowiązek zaopatrywania prognoz pogody w informację o prawdopodobieństwie jej trafności. Tak więc podaje się nie tylko prognozę, że będzie słonecznie albo że będzie padało, ale także, jaka jest szansa, że podawana prognoza się sprawdzi. Przy takiej procedurze stawiający prognozę ma dobre warunki, żeby stwierdzić, czy przewidywał trafnie, czy nie. Może się uczyć na podstawie doświadczenia. Okazuje się, że jest to sprawa najważniejsza. Prognozy ekspertów meteorologicznych dotyczące opadów i temperatury bardzo się poprawiły w tym znaczeniu, że kiedy stwierdzano, iż szansa opadów wynosi 0,60, w takiej mniej więcej ilości przypadków padało. O takiej prognozie mówi się, że jest dobrze wykalibrowana.
Inny rodzaj techniki zaproponowali Koriat, Lichtenstein i Fischhoff(1980). Sprawdzali oni skuteczność następującej techniki: prosili badanych, aby przed oceną pewności wygłaszanego sądu próbowali wymienić wszystkie powody za i przeciw danej opinii. Technika ta okazała się skuteczna: pewność sądów malała. Dalsze badanie pokazało, że działa nie tyle samo wyszukiwanie powodów, co raczej wyszukiwanie powodów niezgodnych z własnym przekonaniem. Mówiąc najprościej: wtedy gdy jesteśmy bardzo pewni jakiegoś własnego sądu, dobrze jest poddać go testowi rozważenia rozmaitych racji, które przemawiają za sądem przeciwnym. Jeżeli w wyniku tej próby nadal pozostaniemy przy swoim wcześniejszym sądzie, to sąd ten będzie prawdopodobnie lepiej uzasadniony, a z pewnością, jak wskazuj e doświadczenie, zredukujemy nieuzasadnioną pewność siebie.
Jeszcze inna technika polega na wykorzystaniu zjawiska "spoglądania wstecz", które wprawdzie samo stanowi rodzaj błędu (zajmiemy się nim za chwilę), ale owa błędna tendencja może być zręcznie wykorzystana do zre-
1 *J 1 \^i i^i_^^i'^-iii- i-ui_/"M-r\> ^K^^iMirtmM l r^i-/CJivi^WAN|A DECYZ.JI
^aB:»S??&4ifo^^. ••......,.' .••.•.•.•.•,,-•"..:. •• , , , ,, ,,
dukowania naszej nieuzasadnionej pewności siebie. Zilustrujemy ją na przykładzie przewidywania wyniku następnych wyborów prezydenckich. Otrzymujemy następujące pytanie:
Proszę podać, czy jest bardziej prawdopodobne, że w następnych wyborach prezydenckich:
(a) mężczyzna zostanie wybrany na prezydenta Polski?
(b) kobieta zostanie wybrana na prezydenta Polski? Proszę otoczyć kółkiem wybraną możliwość, a następnie proszę zaznaczyć "x" na poniższej skali stopień pewności swojej odpowiedzi:
całkowita niepewność
100 całkowita pewność
A teraz proszę "przenieść się w wyobraźni" w rok wyborów, a nawet do czasu, gdy wybory już się odbyły i wyobrazić sobie, że to właśnie kobieta została wybrana prezydentem Polski. Proszę pomyśleć o możliwych powodach tego wydarzenia (przed dalszym czytaniem należy koniecznie wykonać to polecenie!).
Proszę teraz podać w procentach, jak duża jest szansa, że w następnych wyborach prezydenckich mężczyzna zostanie wybrany na prezydenta Polski?
.%
Jeżeli wykonaliśmy oba zalecenia w podanej kolejności, to nasza ocena liczbowa powinna być niższa od oceny na skali (punkt zaznaczony na skali należy zamienić na wartość liczbową). Jeśli tak właśnie się stało, to zmalała pewność naszego sądu, że w następnych wyborach prezydenckich mężczyzna zostanie wybrany na prezydenta Polski. Powodem owej redukcji jest "wyobrażenie sobie" zjawiska przeciwnego do tego, którego szansę oceniamy. Dlaczego owo "wyobrażenie sobie" odnosi skutek? Pokazuje to następna część rozdziału.
II. "WIEDZIAŁEM, ŻE TO SIĘ ZDARZY" 11.5. Złudzenie pod nazwą "wiedziałem, że to się zdarzy"
Jako ludzie mamy nie tylko skłonność do przeceniania swojej aktualnej wiedzy, przejawiamy też tendencję, która każe nam nie doceniać naszej wcześniejszej ignorancji, wówczas gdy już dowiedzieliśmy się o jakimś fakcie czy zdarzeniu. Uważamy wtedy, że zdarzenie to było bardzo prawdopodobne, łatwe do przewidzenia i że nawet się go spodziewaliśmy. Ktoś z naszych znajomych zapadł na jakąś chorobę, ktoś inny zrobił karierę, zmieniła się partia
BŁĘDY W OCENIE WŁAbIMbJ WltU/:Y III
rządząca, poprawiła się koniunktura gospodarcza - wszystkie takie wydarzenia ex post wydają się wielce prawdopodobne i łatwe do przewidzenia.
Zjawisko to najłatwiej zaobserwować, kiedy wydarzy się coś mało prawdopodobnego. Oto w końcu lat osiemdziesiątych upadł system komunistyczny w Polsce, a następnie w innych krajach europejskich. Było to wydarzenie prawie całkowicie nieprzewidywalne. Jedyną osobą publiczną w Polsce, która w latach osiemdziesiątych głosiła szybki upadek komunizmu, był Leszek Moczulski. Prawie wszyscy, którzy słuchali wówczas jego prognoz, brali je za całkowite mrzonki. Okazało się jednak, że system komunistyczny (wbrew oczekiwaniom) upadł. I wkrótce potem coraz więcej osób - zwłaszcza wśród polityków - zaczęło głosić, że upadek ten był łatwy do przewidzenia i że oni go przewidywali.
Podobnie tak unikatowe i zaskakujące wydarzenie, jak wybuch elektrowni atomowej w Czernobylu, był przez wiele osób komentowany jako "żadne" zaskoczenie, bo znając radziecką technologię, brak dbałości o bezpieczeństwo i tak dalej, i tak dalej, można się było tego spodziewać. Tak się zresztą złożyło, że na krótko przed katastrofą w Czernobylu prowadzono w Holandii badanie ankietowe, w którym m. in. zapytywano respondentów o możliwość i prawdopodobieństwo wystąpienia dużej awarii elektrowni atomowej. Respondenci podawali swoje oszacowania. Potem nastąpiła katastrofa. W jakiś czas po tym powtórnie poproszono respondentów o przypomnienie sobie wcześniejszych ocen możliwości dużej awarii elektrowni atomowej. Przypomnienia okazały się "lepsze" od oryginalnych oszacowań; pytanym wydawało się, że przed katastrofą bardziej wierzyli w możliwość wystąpienia czegoś takiego, niż to rzeczywiście miało miejsce. Złudzenie to nosi nazwę "wiedziałem, że to się zdarzy" (hindsight bias).
Fischhoff (1975) poprosił grupę psychologów, by zapoznała się z leczeniem pewnego przypadku zaburzonego zachowania, do którego zastosowano określony rodzaj psychoterapii. Psycholodzy ci byli pytani o to, jakich skutków oczekiwaliby po zastosowaniu owej metody. Byli oni uprzedzeni, że w grę mogą wchodzić cztery rodzaje skutków: A, B, C i D, i mieli ocenić prawdopodobieństwo wystąpienia każdego z nich.
Oprócz tak sformułowanego zadania wobec jednej grupy psychologów, Fischhoff (1975) poddał badaniu jeszcze cztery inne grupy psychologów, którym opisywał ten sam przypadek, co grupie pierwszej, ale wprowadzał im pewną dodatkową informację - o tym, że psychoterapia została właśnie zakończona i zaobserwowano, iż nastąpił jeden ze skutków: A, B, C lub D. Grupie (a) mówiono, że terapia doprowadziła do rezultatu A;
Grupie (b) mówiono, że terapia doprowadziła do rezultatu B;
Grupie (c) mówiono, że terapia doprowadziła do rezultatu C;
Grupie (d) mówiono, że terapia doprowadziła do rezultatu D.
-III/IIMI/A i ri^ucuivn_>vvANIA Dbt-'Y^11
Każdą z czterech dodatkowych grup proszono o ocenę tego, z jakim prawdopodobieństwem mogła ona była przewidzieć taki właśnie wynik (skutek) zastosowanej psychoterapii. Grupę (a) pytano o prawdopodobieństwo przewidzenia skutku A przy zastosowaniu danej psychoterapii. Grupę (b) pytano o prawdopodobieństwo przewidzenia skutku B przy zastosowaniu danej psychoterapii itd.
Okazało się, że psycholodzy oceniający prawdopodobieństwo przewidzenia każdego ze skutków postfactum oceniali je o wiele wyżej niż wtedy, kiedy nie byli z góry poinformowani o wyniku i musieli oceniać je zawczasu. Każda z badanych grup twierdziła, że przewidzenie z góry danego skutku (każda grupa mówiła o innym skutku) było bardzo łatwe.
Arkes, Wortmann, Saville i Harkness (1981) powtórzyli ten eksperyment wśród lekarzy. Przedstawiali grupie lekarzy historię pewnego przypadku medycznego i prosili o ocenę prawdopodobieństwa czterech możliwych diagnoz dla tego przypadku: A, B, C i D. Czterem innym grupom lekarzy prezentowali ten sam przypadek, mówiąc, że trafna dla niego okazała się odpowiednio diagnoza: A, B, C lub D. I znowu, po fakcie, badani w poszczególnych grupach byli znacznie pewniejsi związku danej diagnozy z opisanym przypadkiem, niż kiedy oceniali diagnozę zawczasu.
11.6. Złudzenie "wiedziałem, że to się zdarzy" i przewody sądowe
Przyjemną konsekwencją złudzenia "wiedziałem, że to się zdarzy" może być nasze dobre samopoczucie, powodowane przekonaniem, iż potrafimy dobrze przewidywać przyszłe zdarzenia. Ale skłonność ta może też prowadzić do poważnych negatywnych rezultatów. Saks i Kidd (1986) zwracają uwagę, że w praktyce sądowej złudzenie "wiedziałem, że to się zdarzy" może wpływać na stronnicze ocenianie oskarżonego tak przez świadków, jak i przez sędziów. Istotnie, kiedy ktoś jest już oskarżony o zabójstwo, kradzież czy inne przestępstwo, to zarówno świadkowie, jak i sędziowie - zgodnie ze złudzeniem "wiedziałem, że to się zdarzy" - będą mieli skłonność dopasowywać przytaczane dowody do jego domniemanej winy. Będą zatem mieli skłonność do przeceniania zasadności dowodów przemawiających przeciwko oskarżonemu.
Na tym samym polu - przewodów sądowych - złudzenie "wiedziałem, że to się zdarzy" może powodować niepożądane konsekwencje w kwestii tzw. niedopuszczalnych dowodów.
Proszę przeczytać następujący opis napadu i morderstwa i na podstawie przytoczonych dowodów wydać werdykt w tej sprawie. Opis jest natural-
BŁĘDY W OCENIE WŁASNEJ WIEDZY
"^a^afia^ss^^^wa^^^ .
nie tylko streszczeniem postępowania sądowego, ale wyobraź sobie, Czytelniku, że znajdujesz się na sali rozpraw i jesteś członkiem składu sędziowskiego.
W piątek, 12 listopada 19** roku, Dawid Alport, właściciel niewielkiego sklepu warzywnego w Nowym Jorku, został zaskoczony przez człowieka, który zażądał od niego wydania pieniędzy znajdujących się w kasie. Pan Alport natychmiast wydal mu 110 dolarów, napastnik wziąl pieniądze i zaczai się wycofywać. Nagle jednak, bez żadnych wyraźnych powodów, odwrócił się i dwukrotnie wystrzelił, zabijając pana Alporta i jego pięcioletnią wnuczkę, która stała za kontuarem. Śmierć obojga nastąpiła natychmiast.
Pomocnik pana Alporta, który w tym czasie znajdował się na tyłach sklepu, słyszał, jak pan Alport prosił napastnika: "bierz pieniądze, ale nie strzelaj". Słyszał też odpowiedź: .Jesteś świadkiem". Po strzelaninie pomocnik ostrożnie wszedł do sklepu. Zadzwonił na policję, której powiedział, że zobaczył, jak napastnik wbiegał w boczne drzwi domu znajdującego się dwie przecznice dalej.
Dwie i pól godziny później policja aresztowała podejrzanego, niejakiego George'a Watsona. Został on oskarżony o napad i morderstwo, rozprawę wyznaczono na 3 lutego 19**.
Sprawa rozpoczęła się od tego, że oskarżony George Watson oświadczył, iż jest niewinny. Oskarżyciel jednak wniósł o wszczęcie sprawy przeciw George'owi Watsonowi. Oskarżyciel rozpoczął mowę od komentarza, że zbrodnia była .Jedną z najbardziej ohydnych i bezsensownych, jakie kiedykolwiek popełniono". Podsumował sprawę w następujących punktach:
(1) Pomocnik właściciela jest przeświadczony, że oskarżony jest tą samą osobą, która napadła pana Alporta i zastrzeliła jego oraz jego wnuczkę. Pomocnik widział napastnika przelotnie.
(2) Napastnik był widziany, gdy wbiegał do domu, który okazał się domem, w którym oskarżony mieszkał.
(3) Oskarżony nie ma żadnego alibi; zeznaje, że w czasie, gdy wydarzył się napad, był sam w domu i oglądał telewizję.
(4) W pokoju oskarżonego znaleziono 125 dolarów (pamiętamy, że skradziono 110 dolarów).
(5) Na butach oskarżonego znaleziono ślady amoniaku, który był używany do czyszczenia podłogi w sklepie Alporta. Tego typu amoniaku używa się jednak często w mieszkaniach i innych pomieszczeniach.
(6) Test parafinowy stosowany w celu ustalenia, czy dana osoba ma na rękach cząsteczki prochu odkładającego się w trakcie strzelania, wykazał, że istnieje pewne prawdopodobieństwo, iż oskarżony strzelał tego dnia.
(7) Oskarżony był już wcześniej skazany za napad.
..«•_• . ^ 1 v^. i>^i-'^"-ii»-'<-i^i-ruŁ./ir-r>.i i^^ci^lftlMIM l rUUtJMUWANIA DECYZJI
A^a koniec oskarżyciel zaprezentował taśmę magnetofonową z nagraniem rozmowy telefonicznej oskarżonego przeprowadzonej w godzinę po napadzie. Tak się zdarzyło, że detektywi zajmujący się inną sprawą mieli pozwolenie na podsłuch pewnego podejrzanego bukmachera. Przypadkowo nagrali rozmowę telefoniczną oskarżonego z owym podejrzanym. Glos oskarżonego został zidentyfikowany przy pomocy analizy śladów głosu, która jest niezawodna w 99% przypadków. Glos na taśmie mówił: "Mam wreszcie pieniądze, by zwrócić ci dług... Gdy przeczytasz jutrzejsze gazety, to będziesz wiedział, co mam na myśli... A teraz przestań mnie niepokoić, bo dostaniesz ten sam lek". Obrona ostro zaprotestowała przeciw temu dowodowi, ponieważ nagranie odnosiło się do bukmachera, a nie do oskarżonego. Oskarżyciel nie zgodził się z tą opinią. Sędzia zdecydował, że dowód z nagrania jest rzeczywiście niedopuszczalny i że sędziowie przysięgli powinni go nie uwzględniać, gdyż podsłuch dotyczył tylko podejrzanego bukmachera, a nie telefonujących do niego. Chociaż oskarżyciel wezwał bukmachera na świadka, ten odmówił zeznań zgodnie z przysługującym mu prawem.
A oto podsumowanie sprawy dokonane przez obrońcę:
Oskarżony George Watson zgodził się zeznawać i oświadczył, że naoczny świadek musiał pomylić się w swojej identyfikacji. Pieniądze znalezione u niego w domu byty po prostu oszczędnościami z dwóch ostatnich miesięcy. Siady amoniaku na butach mogły pochodzić skądkolwiek, ponieważ oskarżony pracował jako doręczyciel. Oskarżony przysiągł, że w dniu przestępstwa nie strzelał.
Obrońca zażądał umorzenia sprawy. Chociaż przestępstwo było rzeczywiście ohydne, jego klient jest niewinny. Dowody są pośrednie, a George Watson padł ofiarą zbiegu okoliczności.
Jaki werdykt wydalibyśmy, mając tak przedstawioną sprawę: winny czy niewinny? Sue, Smith i Caldwell (1973), którzy postawili to pytanie studentom z Uniwersytetu w Washingtonie, ustalili, że 35% badanych uznało George^ Watsona za winnego.
Ciekawszym jednak wynikiem tego eksperymentu był efekt pewnej manipulacji dotyczącej ósmego punktu podsumowania prokuratorskiego. Oto wobec części studentów wprowadzono modyfikację mówiącą, iż sędzia zadecydował, że dowód z nagrania jest dopuszczalny i że sędziowie przysięgli powinni go uwzględniać, gdyż podsłuch dotyczył zarówno podejrzanego bukmachera, jak i telefonujących do niego. Okazało się, że fakt ten nie miał żadnego znaczenia dla badanych - bynajmniej nie wzrosła liczba osób uznających George'a Watsona winnym. Ogromne znaczenie miała natomiast inna modyfikacja - całkowite pominięcie punktu ósmego w prezentacji sprawy. Kiedy punkt ten nie występował się w ogóle, absolutnie żadna z badanych osób nie uznała George'a Watsona za winnego. Co to znaczy? Tylko tyle, że
BŁĘDY W OCENIE WŁASNEJ WIEDZY
przekazana informacja, choćby później została uznana za "niedopuszczalną", psychologicznie nie może być unieważniona. Instrukcja sędziego, że dowód jest niedopuszczalny, nie ma w praktyce żadnego znaczenia.
W rozdziale 8. pokazano, że istnieje silna tendencja do podtrzymywania raz przyjętego przekonania czy oceny. W tym wypadku działa jeszcze coś innego: otrzymawszy raz "niedopuszczalny" dowód, który np. wskazuje na winę, zaczynamy - zgodnie ze złudzeniem "wiedziałem, że to się zdarzy" - dopasowywać inne przytaczane dowody do założonej winy. Efekt ten musi być znany albo wyczuwany przez prawników, znana jest bowiem praktyka, kiedy prokurator lub obrońca zapoznaje sędziów z dowodami albo z sugestiami, o których wie, że nie powinny i nie mogą być brane pod uwagę przez sąd. Czyniąc tak, prokurator wie (spodziewa się), że będą one przez sędziego wycofane jako niedopuszczalne. Równocześnie jednak wie, że dowody takie, gdy raz zostaną wypowiedziane i zaistnieją w świadomości oceniających, będą kształtowały ocenę w sposób nieunikniony.
11.7. Złudzenie "wiedziałem, że to się zdarzy"
i nadmierna surowość w ocenie nieudanych decyzji
W roku 1989 kierownictwo PZPR zaakceptowało częściowo wolne wybory w Polsce. PZPR definitywnie przegrała "wolną część" tych wyborów. Bezpośrednio potem zwolennicy częściowo wolnych wyborów w PZPR byli przez współtowarzyszy ostro krytykowani za nierozważną decyzję, która doprowadziła do tak fatalnego wyniku. Krytycy nie brali pod uwagę faktu, że nikt (także z opozycji) nie przewidywał przed wyborami aż tak złego wyniku wyborczego PZPR. Dopiero kiedy ujawniły się negatywne (dla PZPR) skutki zgody na taki model wyborów, jej autorzy zostali poddani surowej krytyce.
Inny przykład: organizacja kombatancka zaplanowała wyjazd swoich członków na obchody rocznicowe do miejscowości, gdzie kombatanci ci wsławili się przed laty bohaterską walką. Firma turystyczna, która podjęła się zorganizować przejazd i pobyt kombatantów za granicą i otrzymała odpowiednią zaliczkę, okazała się nierzetelna -jej szef zniknął wraz z pieniędzmi. Kiedy się to wydarzyło, członkowie organizacji kombatanckiej zaczęli obwiniać kierownictwo organizacji o to, że powierzyło pieniądze i organizację wycieczki tak niepewnej firmie. Te same osoby uważały wcześniej wybór małej, niedrogiej i efektywnej firmy turystycznej za bardzo racjonalny.
Powyższe przykłady ilustrują powszechne zjawisko nadmiernie surowych ocen stosowanych wobec autorów nieudanych decyzji. Oto ktoś źle zainwestował pieniądze, ktoś źle się ożenił, minister podjął złą decyzję gospodarczą
1 ruutJMUWANIA DECYZJI
isasesa^iiissti^siMiimsst.estsm^^u.wssms-i^
- przyjmujemy to bez krytyki, dopóki nie ujawnią się negatywne następstwa tych decyzji. Kiedy jednak pojawiają się negatywne skutki takich nietrafionych decyzji, obserwatorzy mają zwyczaj bardzo surowo oceniać ich sprawców, wykazując, że niepowodzenie decyzji dało się z góry przewidzieć. Często jest tak w istocie. Cała niniejsza książka pokazuje, jak dużo zasadzek czyha na nas przy tworzeniu ocen i podejmowaniu decyzji i jak łatwo w te pułapki wpadamy. Surowość ocen stosowanych wobec autorów nieudanych decyzji jest jednak sama pułapką, w którą wpadają krytycy Jest ona bowiem złudzeniem "wiedziałem, że to się zdarzy". Po fakcie przeceniamy po prostu przewidywalność negatywnych skutków.
Obwinianie ofiary. Złudzenie "wiedziałem, że to się zdarzy" tłumaczy m. in. znane zjawisko obwiniania ofiary (np. gwałtu) za to, co ją spotkało. Janoff-Bulman i Timko Carli (1985) dawali badanym do przeczytania opis randki. Wszyscy otrzymywali identyczny opis, z wyjątkiem ostatniego zdania. Niektórzy z badanych jako ostatnie zdanie przeczytali: "Następną rzeczą, z jakiej zdałam sobie sprawę, było to, że mnie zgwałcił". Inni zamiast tego w zakończeniu przeczytali zdanie: "Następną rzeczą, z jakiej zdałam sobie sprawę, było to, że zabrał mnie do swego domu". Badanych poproszono, by nie biorąc pod uwagę zakończenia randki (tak jak w sądzie zakwestionowanie dopuszczalności dowodu), określili z samego opisu randki, czy mogła ona prowadzić do gwałtu (jakie było prawdopodobieństwo takiego zakończenia).
Zgodnie z przewidywaniem, ocena szansy, że tak przebiegająca randka mogła się zakończyć gwałtem, była wyraźnie wyższa w grupie, która przeczytała informację gwałcie niż w grupie, która tego opisu nie przeczytała. Powstała też dalsza rozbieżność między grupami: badani, którzy przeczytali o zakończeniu randki gwałtem, mieli skłonność do większego obwiniania kobiety o jej sposób zachowania na randce, który mógł przyczynić się do sprowokowania gwałtu.
11.8. Przekleństwo wiedzy
W pewnym związku ze złudzeniem "wiedziałem, że to się zdarzy" pozostaje paradoksalne zjawisko, że pewna wiedza lub informacja może być dla jej posiadacza nie tylko nieużyteczna, ale wręcz zgubna. Pokazał to m. in. Hoch (1988), który prosił swoich respondentów, by odgadywali oceny i upodobania konsumenckie. Wśród respondentów znajdowali się zwykli konsumenci oraz specjaliści od marketingu. Okazało się, że specjaliści od marketingu przewidywali oceny i upodobania innych konsumentów gorzej niż zwykli konsumenci, nieeksperci. Jak to jest możliwe? Dlaczego dodatkowa wiedza, jaką dysponowali specjaliści od marketingu, szkodziła, zamiast pomagać? Przy-
BŁĘDY W OCENIE WŁASNEJ WIEDZY
g^B^^B^SS^^SSS^:^^:::.^^;?;.:^:;:?;;;;;?:^-^:;:.:^:-::::'^:1:.'-:^:^
puszczalnie dlatego, że specjaliści "przekładali" na zachowania innych własną wiedzę, która różniła się od wiedzy zwykłych konsumentów.
Zjawisko polegające na tym, że posiadana wiedza nie pomaga, a wręcz szkodzi, nie jest wcale takie rzadkie. We wstępie do doskonałej książki popularnonaukowej na temat teorii gier jej autor D. J. Williams (1965) pisze żartobliwie, iż grupa, w której dyskutowano potrzebę napisania takiej książki, uznała, że najlepszym kandydatem do jej napisania jest osoba o stosunkowo skromnej wiedzy dotyczącej technicznych spraw teorii gier. Dyskutanci uważali bowiem, że fachowcowi z dużą wiedzą w danej dziedzinie bywa rzeczywiście trudno wyłożyć tę dziedzinę w sposób przystępny. Jego duża wiedza nie pozwala mu dostrzec, że wiele zagadnień, które dla niego są trywialnie proste, wcale nie jest takimi dla innych.
Jeszcze innym przejawem zjawiska polegającego na tym, że nie potrafimy uwolnić się od posiadanej wiedzy, jest osobliwe ustalanie ceny produktów i usług. Jeżeli na przykład w negocjacjach jedna strona jest z jakichś powodów lepiej poinformowana niż druga strona - sprzedawca lepiej zna prawdziwą wartość produktu, który sprzedaje, niż kupujący - to naturalne jest oczekiwanie, że wykorzysta on tę przewagę nad partnerem. Okazuje się, że wcale tak nie musi być. Sprzedawca może być tak "sparaliżowany" wiedzą o niskiej wartości sprzedawanego produktu, że nie potrafi uwolnić się od niej i zażądać za produkt odpowiednio wysokiej ceny, którą kupujący prawdopodobnie by zapłacił. Mam wrażenie, że dokładnie taki przypadek zachodzi, gdy mowa o "sprzedawaniu" wiedzy i umiejętności przez polskich uczonych. W różnego rodzaju agencjach doradztwa organizacyjnego, marketingowych, szkoleniowych itp., usługi są świadczone firmom po bardzo wysokich cenach rynkowych. Usługi te oferują specjaliści krajowi i zagraniczni, których wiedza nierzadko (oczywiście nie zawsze!) nie wystarczyłaby, żeby taki osobnik mógł uzyskać zaliczenie odpowiedniego przedmiotu na uczelni. Równocześnie profesor, który mógłby szkolić owych pracowników agencji (i czasami to czyni), wahałby się zażądać za swoje usługi połowy ceny, jaką biorą tamci od swoich klientów. Wiedza, którą oferuje, nie jest, jego zdaniem, aż tak cenna.
. 12. Pragnienia i przekonania
l. ZNIEKSZTAŁCANIE PRZEKONAŃ PRZEZ PRAGNIENIA
12.1. Czy nasz kandydat ma szansę w wyborach prezydenckich?
Tuż przed wyborami prezydenckimi w Polsce w 1995 roku wylosowana grupa mieszkańców Torunia była proszona o udzielenie odpowiedzi na kilka pytań dotyczących kandydatów. Obejmowały one m. in.:
(a) pytanie o kandydata, na którego respondent zamierza głosować;
(b) prośbę o ocenę atrakcyjności pierwszych sześciu (według sondaży) kandydatów;
(c) prośbę o ocenę szans wyborczych pierwszych sześciu kandydatów. Porównano oceny atrakcyjności pięciu kandydatów (pięciu, gdyż na szóstego kandydata zadeklarował chęć głosowania tylko jeden respondent) między badanymi, którzy deklarowali, że będą głosować na danego kandydata, i tymi, którzy deklarowali, że będą głosować na innego kandydata. Tabela 12.1. pokazuje oceny atrakcyjności wydawane przez zwolenników i przeciwników poszczególnych kandydatów (oraz łącznie dla wybranego i niewybra-nego kandydata). Jak widać, dla swych zwolenników dany kandydat był bardziej atrakcyjny niż dla tych, którzy zamierzali głosować na kogo innego. Jest to wynik całkowicie logiczny: naturalne, że wyżej oceniamy atrakcyjność kandydata, na którego zamierzamy głosować, niż takiego, na którego nie zamierzamy głosować.
Tabela 12.1. pokazuje także oceny szans wyborczych poszczególnych kandydatów, dokonane przez ich zwolenników i przeciwników (także łącznie dla wybranego i niewybranego kandydata). Jak widać, zwolennicy oceniali wyżej nie tylko atrakcyjność własnego kandydata, lecz także jego szansę wyborcze, niż czynili to zwolennicy innych kandydatów. Ten wynik nie jest już
PRAGNIENIA l PRZEKONANIA
zgodny z logiką: z tego, że zamierzam na kogoś głosować i go lubię, nie wynika, iż ma on większe od innych szansę bycia wybranym. A jednak ludzie wydają się w to wierzyć (także autor książki wykazał tę samą skłonność przyjmując zakład za wygraną kandydata, na którego głosował - i przegrywając ten zakład!).
Tabela 12.1.
Oceny atrakcyjności (na skali 1-7) i oceny szans wyborczych (na skali 0-100) dawani przez zwolenników i przeciwników poszczególnych kandydatów.
Oceny atrakcyjności
Oceny szans wyborczych
Kandydaci
Przeciwnicy Zwolennicy
Przeciwnicy Zwolennicy
Gronkiewicz-Waltz
2,09 5,43
6,02 41,43
Kuroń
3,39 5,17
9,94 30,04
Kwaśniewski
2,43 5,58
25,89 60,53
Wałęsa
1,80 4,97
23,47 59,90
Zieliński
3,19 5,38
5,42 16,00
Łącznie
2,41 5,32
10,29 45,81
W kontekście wyborów politycznych wpływ preferencji na oczekiwani;
jest zjawiskiem powszechnym. Granberg i Brent (1983) przytaczają wyni ki Ośrodka Studiów Politycznych na Uniwersytecie w Michigan, gdzie pod czas ośmiu kolejnych wyborów prezydenckich w Stanach Zjednoczonycł w okresie 1952-1980 prowadzono badania na reprezentatywnej próbce Ame rykanów. Respondentom zadawano pytanie o ich preferencje wyborcze: Jął zamierza Pan(i) głosować w obecnych wyborach prezydenckich?, oraz pyta nie o ich oczekiwania: Kto, zdaniem Pana(i), zostanie wybrany na pręży denta ?
Jak pokazuje poniższa tabela, za każdym razem około 4/5 respondentóv w odpowiedzi na oba pytania podawało tego samego kandydata. Sądzili oni że wygra kandydat, na którego będą głosować. Jak widać w kolejnych ko lumnach, zwolennicy partii demokratycznej nie różnili się pod tym wzglę dem od zwolenników partii republikańskiej.
Wygląda na to, że przynajmniej w przypadku wyborów politycznych po wszechnajest tendencja do wierzenia w coś, co wydaje się bardziej atrakcyj ne, niż w to, co wydaje się mniej atrakcyjne. Tendencja ta nie ogranicza si( tylko do wyborów politycznych.
. ^ . ^, .^.-^/^.iw^-Ki- r •^i-/"u r\i V^^|_|-VI/-MIIM i I-UUCIJMUWANIA DECYZJI
aaaas^a^asiaaasasfi^^s^s^iBaBi^a
Tabela 12.2.
Procent respondentów przewidujących zwycięstwo swojego kandydata w wyborach prezydenckich w Stanach Zjednoczonych.
Rok wyborów
% oczekujących
% oczekujących
% oczekujących
zwycięstwa
zwycięstwa
zwycięstwa
preferowanego
preferowanego
preferowanego
kandydata
kandydata wśród
kandydata wśród
zwolenników
zwolenników
demokratów
republikanów
1980
83,8
87,0
80,4
1976
82,4
84,2
80,6
1972
77,2
24,7
99,6
1968
81,1
62,5
95,4
1964
81,3
98,6
30,5
1960
81,5
78,4
84,2
1956
80,1
54,6
97,6
1952
84,0
81,4
85,9
Średnia
81,4
71,4
81,8
12.2. Myśleń ie życzeniowe
Weinstein (1980) prosił grupę studentów, by każdy indywidualnie ocenił swoje szansę "w porównaniu z innymi studentami tego samego uniwersytetu i tej samej płci, że przytrafi mu się każde z następujących zdarzeń". Tu następowała lista 18 zdarzeń pozytywnych (np. otrzymanie po studiach dobrze płatnej pracy) i 24 zdarzeń negatywnych (np. przejście zawału przed czterdziestką). Weinstein policzył, że przeciętny student szacował swoje szansę na pozytywne zdarzenia o 15% wyżej niż szansę innych. W skrajnych przypadkach różnica ta była zresztą dużo większa. Szansa otrzymania po studiach dobrze płatnej pracy była przeciętnie oceniana jako wyższa o 42% niż taka sama szansa dla innych. Z kolei w wypadku zdarzeń negatywnych przeciętny student szacował swoje szansę o 20% niżej od szans innych. W skrajnych przypadkach szansę te były dużo niższe - szansa przejścia zawału przed czterdziestką była oceniana o 38% niżej niż dla innych, a szansa popadnięcia w alkoholizm aż o 58% niżej niż dla innych. Badanie to pokazuje naszą skłonność do zawyżania szans, do podtrzymania optymizmu w wypadku zajścia zdarzenia dla nas pozytywnego (pożą-
PRAGNIENIA l PRZEKUIMAINIIA
danego) i skłonność do zaniżania szans w wypadku zajścia zdarzenia negatywnego (niepożądanego).
Skłonność do zaniżania możliwości, że przydarzy się nam coś niepożądanego, pokazał na ogólnokrajowej próbie Polaków Czapiński (1993). Zadał on w swoim kwestionariuszu serię pytań o porównanie swojej szansy, że przytrafi nam się każde z niepożądanych zdarzeń w porównaniu z innymi osobami tego samego wieku i tej samej płci. Jak pokazuje tabela 12.3., bardzo mały odsetek naszych współrodaków sądzi, że mają większe niż inni szansę paść ofiarą włamania, pójść do więzienia czy znaleźć się wśród rozwiedzionych, a bardzo duży odsetek uważa, że to raczej innym przytrafią się te nieprzyjemne zdarzenia.
Tabela 12.3.
Oceny szans, że przytrafi nam się każde z niepożądanych zdarzeń w porównaniu z innymi osobami tego samego wieku i tej samej płci (według Czapińskiego, 1993).
Szansę
Wydarzenia
Większe
Takie same
Mniejsze
zostanie ofiarą włamania
10,7
48,6
50,7
zostanie alkoholikiem
4,7
10,7
84,6
QC Q
znalezienie się w więzieniu
2,0
11,1
ob,9
podjęcie próby samobójczej
3,6
9,0
87,4
rozwód po kilku latach małżeństwa
4,4
17,4
78,2
wyrzucenie z pracy
10,3
28,2
61,5
konieczność podjęcia nieatrakcyjnej pracy
16,2
' 27,7
56,1
zachorowanie na raka
12,3
66,0
21,7
doznanie ataku serca
22,2
57,4
20,4
popadniecie w ubóstwo
22,0
40,5
37,5
zarażenie się chorobą weneryczną
2,7
15,0
82,3
zatrucie pokarmem
9,0
62,3
28,7
załamanie nerwowe
26,6
37,5
35,9
zarażenie się AIDS
3,9
20,0
76,1
Kurt Koch (1985) przytacza przypadek studenta psychologii na uniwer sytecie w Paryżu, który na myśleniu życzeniowym zrobił dobry interes. Po dając się za astrologa, stawiał horoskop zgłaszającym się klientom. Przyją około 400 osób (po 20 franków od klienta) i otrzymał wiele listów potwiei dzających trafność horoskopu. Niezwykłe w tym przypadku było to, że stu dent używał cały czas tego samego horoskopu dla wszystkich 400 klientóv nie zwracając najmniejszej uwagi na ich znaki zodiaku. Powodzenie przed
sięwzięcia opierało się na tym, że horoskop głosił każdemu, że posiada dobre cechy charakteru i że czeka go wspaniała przyszłość.
Badania nad kierowcami pokazują, że przeceniają oni własne szansę i umiejętności przy prowadzeniu samochodu. Na przykład, kiedy badanych proszono o ocenę prawdopodobieństwa, że ulegną wypadkowi samochodowemu, większość oceniła je jako dużo niższe niż przeciętne (Slovic, Fisch-hoff, Lichtenstein, 1978). W badaniach Naatanen i Summala (1975) oraz Svensona (1981) stwierdzono, że większość kierowców uważa, iż są zdolniejsi niż przeciętny kierowca i że ich jazda stwarza mniejsze ryzyko niż to, które stwarza jazda przeciętnego kierowcy.
W niektórych przypadkach myślenie życzeniowe może być niegroźnym zabiegiem służącym do podtrzymania własnego optymizmu. Przyjemnie jest myśleć, że czekają nas raczej dobre niż złe rzeczy. Co więcej, optymizm ów "się opłaca", może nas mobilizować do działań, które sprawią, że nasze optymistyczne oczekiwania rzeczywiście się spełnią. Na przykład obserwacje lekarskie pokazują, że pacjenci o pozytywnym nastawieniu, czyli optymiści właśnie, rzeczywiście łatwiej wracają do zdrowia niż pacjenci pesymistycznie widzący przyszłość.
Są jednak sytuacje, w których myślenie życzeniowe może prowadzić do zachowania jawnie szkodliwego. Robotnicy nierzadko podejmują się niebezpiecznej dla zdrowia pracy - na przykład w przemyśle chemicznym - i zachowują optymizm, że wbrew statystykom, które dają prawie pewność wystąpienia po pewnym czasie nieuleczalnej choroby, oni tego niebezpieczeństwa unikną.
Ryzykowna decyzja startu mimo oblodzenia. 13 stycznia 1982 roku miał miejsce następujący wypadek: z lotniska w Waszyngtonie wystartował Boeing 737, który zaraz po starcie zahaczył o most na rzece Potomac i wpadł do rzeki. Udało się wyłowić i uratować zaledwie kilku pasażerów. Jak doszło do tego wypadku? Samolot przyleciał ze słonecznej Florydy na mroźne i ośnieżone lotnisko w Waszyngtonie. Z powodu owych fatalnych warunków meteorologicznych jego powrót się opóźniał. Samolot trzeba było odladzac. Odladzanie szło bardzo opornie: niska temperatura i ciągły opad śniegu sprawiały, że usuwane oblodzenie ciągle powracało. Kapitan i drugi pilot, wymieniając uwagi na ten temat, podkreślali beznadziejność wysiłków zmierzających do odlodzenia samolotu. Zastanawiali się, czy nie podjąć startu mimo oblodzenia samolotu. I zdecydowali się na start. Okazało się, że miało to fatalne skutki.
Analiza sytuacji i zachowania załogi (w tym ich zarejestrowanych wypowiedzi) skłania do następującej rekonstrukcji procesu decyzyjnego załogi. Złe warunki pogodowe na lotnisku w Waszyngtonie (szczególnie w porównaniu ze słoneczną Florydą), już zaistniałe opóźnienie i wreszcie nieprzyjemne
PRAGNIENIA l PRZEKONANIA
i "beznadziejne" odladzanie samolotu - wszystko to sprawiało, że dalszt pozostawanie na lotnisku było ze wszech miar niepożądane. W zestawieni!:
z tym powrót na Florydę musiał być czymś bardzo atrakcyjnym. Oczywiścit czym innym była ocena szans pomyślnego wystartowania. W tej sprawie ist niały uzasadnione obawy, że w danych warunkach start się nie powiedzie Załoga musiała sobie uświadamiać to zagrożenie, podejmowała przecież prób] odlodzenia samolotu. A jednak piloci podjęli decyzję o starcie. Można przy puszczać, że decyzja ta została oparta na "stronniczej" ocenie szans pomyśl nego startu w danych warunkach, a ocena szans nie była niezależna od ocew atrakcyjności obu alternatyw. Prawdopodobnie załoga "dopasowała" swoji przekonania do swoich pragnień.
Optymizm w ocenie szans skłania ludzi do akceptacji wyższego ryzyka Co więcej, okazuje się, że w sytuacjach, w których można wpływać na skutk działania, ludzie ujawniają większy optymizm i są skłonni do podejmowani;
działań bardziej ryzykownych niż w sytuacjach, w których wynik zależy 01 losu (przypadku). Hendrickx, Vlek i Oppewal (1989) prosili badanych, ab:
ocenili prawdopodobieństwo, że mógłby się im zdarzyć wypadek w każde z szesnastu różnych sytuacji (np. w trakcie pływania w morzu, w trakci skakania ze spadochronem itd.). Sytuacje opisywano przy tym albo tak, ż wypadek zależy od działań wykonawcy, albo że działanie wykonawcy nie m wpływu na wynik. Okazało się, że (l) sytuacje, w których wynik był przed stawiany jako zależny od własnego działania, były oceniane jako mniej ryzy kowne, oraz (2) decyzje były zależne od spostrzeganego wpływu na wynr
działania.
W innym eksperymencie (Hendrickx, Vlek 1991) proszono kierowców o prowadzenie samochodu na 24-kilometrówym odcinku krętej drogi. Wsz^ scy badani przebywali tę trasę dwukrotnie - raz w roli kierowcy i drugi ra w roli pasażera. Mierzono (l) prędkość, z jaką osoba wjeżdżała w zakręt prowadząc samochód, oraz (2) prędkość, którą ta sama osoba deklarował jako właściwą prędkość jazdy, kiedy znajdowała się w roli pasażera. Okazał się, że prędkość, z jaką kierowca wjeżdżał w zakręt, była wyższa niż podaws na przez niego właściwa prędkość jazdy, kiedy znajdował się w roli pasażer;
Oczywiście, kierowca, prowadząc samochód, jest w sytuacji sprawnościowe a kiedy występuje w roli pasażera, jest w sytuacji losowej.
12.3. Samooszukiwanie się
Ouattrone i Tversky (1984) prosili grupę osób, by wzięła udział w teście t( lerancji bólu wywołanego przez zimno. Test ten polegał na utrzymywani ręki zanurzonej w lodowatej wodzie tak długo, dopóki dana osoba jest w st!
i <-> 1 \^i i»_>i-^»-iiv^-iii_ r i_ii-ł->r r\i i^'^c-111/łlllft l ri^'Ut:«JIVIUVVANIA DECYZJI
nie znieść wywołany w ten sposób ból. Po teście informowano uczestników, że najnowsze badania medyczne pozwalają odróżnić u ludzi dwa typy serc. Jeden z tych typów rokuje mniej ataków i dłuższe życie niż drugi. Dobrą zaś metodą do zdiagnozowania, jaki mamy typ serca, jest zbadanie wpływu ćwiczenia na wynik otrzymany w wyżej wymienionym teście. Części osób mówiono przy tym, że przy dobrym typie serca ćwiczenie zwiększa tolerancję na ból wywołany przez zimno, części zaś mówiono coś przeciwnego. Tak więc część osób sądziła, że gdy po ćwiczeniu zwiększy się ich tolerancja na ból wywołany przez zimno, przekona się, iż posiada dobry typ serca, a część osób sądziła, że przekona się, że posiada dobry typ serca, gdy po ćwiczeniu zmniejszy się ich tolerancja na ból wywołany przez zimno. Po tej informacji osoby wykonywały jednominutowe ćwiczenie i ponownie poddawano je testowi tolerancji bólu wywołanego przez zimno.
W obu grupach w drugiej próbie (tj. po uzyskaniu informacji w sprawie związku między typem serca a tolerancją na ból wywołany przez zimno), zmieniła się tolerancja osób na ból wywołany przez zimno w kierunku zgodnym z informacją o tym, jaki wynik wskazuje na dobry typ serca. Eksperyment ten ilustruje zjawisko samooszukiwania się. Jego istotą jest (nieświadome) podejmowanie działania mającego nas przekonać albo utwierdzić w pewnym pożądanym przekonaniu (może to również być powstrzymywanie się od działania).
Jak powiada Witwicki (1959): Wżyciu mówi się w takich razach, że wmawiamy cos w siebie, że gramy i przejmujemy się tą grą, że ulegamy autosugestii. W ten sposób nieraz chory, który gorąco pragnie wyzdrowieć, chce wierzyć i wierzy, że wyzdrowieje, i nie pozwala sobie na żadne wątpliwości w tym względzie. Umyślnie nie patrzy na termometr, aby się nie dowiedzieć, że jeszcze i dziś miał gorączkę znowu. W takich wypadkach akt sądzenia, czyli akt wiary, zdaje się występować jako bezpośredni skutek naszych pragnień lub postanowień, czyli objawów woli, jest jakby przez nas samych czynnie wywołany.
Podobną tendencję do podejmowania działania mającego nas przekonać albo utwierdzić w pożądanym przekonaniu można odnaleźć w staraniu się wyznawcy kalwinizmu o dobre uczynki. Według kalwinizmu dobre uczynki, jako środki zapewniające zbawienie, są bezużyteczne, ponieważ o zbawieniu decyduje boska predestynacja: człowiek jest od początku przeznaczony albo do zbawienia, albo do potępienia. Wszystkie bowiem wydarzenia - w tym i ludzkie czyny, zarówno dobre jak i złe, są nie tylko przewidziane przez Boga, ale są zgodne z Jego wolą i Jego planem. To Bóg jednych ludzi przeznaczył do zbawienia, a innych skazał na potępienie. Wydawałoby się, że na gruncie takiej religii wszelkie staranie się o dobre uczynki jest zbyteczne. A jednak wyznawcy kalwinizmu przejawiali całkiem duże staranie o cnotliwe życie
PRAGNIENIA l PRZEKUNAMIA
i mieli ku temu słuszne powody. Dobre uczynki stanowiły bowiem niezawodny znak Bożego wybrania. Jak wyraził to Weber (za: Elster, 1984): [...] są one technicznymi środkami nie nabycia zbawienia, ale pozbycia się strachu przed potępieniem.
Jak to ilustruje następny eksperyment, zjawisko samooszukiwania może się też wyrażać w tym, że zniekształcane są procesy spostrzegania, przetwarzania informacji i oceniania, tak by uchronić osobę przed doznawaniem negatywnych emocji. Pyszczynski, Greenberg, Solomon i Stubing (1993) przeprowadzili eksperyment, w którym prosili osoby badane o ocenienie, w jakim stopniu są podobne do osoby scharakteryzowanej poprzez pewien zestaw cech osobowości. Wykonano przy tym następującą manipulację: mówiono badanym, że osoba scharakteryzowana przez ten zestaw cech jest chora na raka. W innym przypadku mówiono, że osoba ta ma, na przykład, zwichniętą kostkę. Wynik był wyraźny. Badani wierzący, że opisywana osoba jest chora na raka, oceniali swoje cechy jako całkowicie odmienne od cech owe;
osoby. Badani, którym tego nie mówiono, nie dystansowali się tak bardzo od cech owej osoby.
12.4. Redukowanie dysonansu poznawczego
Festinger i Carsmith7 (1959) zapraszali studentów do laboratorium, gdzie przybysz przez całą godzinę wykonywał bardzo nudną pracę. Polegała one na tym, że badany student przez pół godziny, używając tylko jednej ręki układał na tacy 12 szpul, następnie zdejmował te szpule, znowu kładał, zno wu zdejmował itd. Przez dalsze pół godziny, znowu używając tylko jedne ręki, odwracał na planszy klocki. W tym czasie eksperymentator siedział z( stoperem w ręku i robił jakieś notatki na kartce papieru.
Kiedy skończyło się już to nudne zadanie, eksperymentator zwracał si( do badanego z następującą instrukcją:
Chciałbym teraz wyjaśnić Panu (badanymi byli mężczyźni), o co w całe^ tej sprawie chodzi [...J. W eksperymencie tym biorą udział dwie grupy. Par znalazł się w grupie, której poleca się wykonanie owych zadań bez żadnegi wprowadzenia [...J. W wypadku drugiej grupy wynajmujemy specjalnego stu denta, który wchodzi do poczekalni, w której czeka kolejna osoba badana jest przedstawiany, że właśnie skończył eksperyment [...]. Student ten wcho dzi w pogawędkę z oczekującym i mówi mu, że eksperyment był bardzo przy jemny, dawał mnóstwo uciechy, sprawił mu przyjemność, był bardzo intere sujący [...J.
7 W opisie eksperymentu skorzystałem z przedstawienia go w książce Plousa (1993).
.iMił-iiMift i r>-^ucJiviuvvAIMIA DECYZJI
Dalszy ciąg instrukcji był następujący: Student, którego wynajmujemy, dzisiaj jest nieobecny - właśnie zadzwonił, że coś mu wypadło - i w tym momencie poszukujemy na jego miejsce kogoś, kto by wykonał jego zadanie. Właśnie mamy oczekującego badanego (eksperymentator spogląda na zegarek), który powinien znaleźć się w tej drugiej grupie eksperymentalnej [...]. Gdyby Pan się zgodził, to wynająłbym Pana na dzisiaj, a także na przyszłość-, gdyby jeszcze zaszedł tego rodzaju wypadek. Mogę Panu zapłacić za wykonanie tego zadania, to znaczy za wykonanie go teraz i za umówienie się na telefon na przyszłość (tu podana była kwota). Czy zgadza się Pan na tę umowę?
Badani byli podzieleni na trzy grupy, z których jedna (kontrolna) otrzymywała tylko pierwszą część instrukcji, bezpośrednio po której była proszona o ocenę tego, jak przyjemne było wykonywane właśnie zadanie. Dwie pozostałe grupy otrzymywały także dalszy ciąg instrukcji, przy czym w jednej grupie eksperymentator oferował za wykonanie zadania (polegającego na wytłumaczeniu czekającej osobie, że eksperyment był przyjemny) l dolara, a w drugiej grupie - 20 dolarów. W każdym przypadku, po wykonaniu zadania i otrzymaniu obiecanej zapłaty, osoby były proszone o ocenę, w jakim stopniu było przyjemne wykonywane wcześniej zadanie.
Pytanie, na które Festinger i Carsmith chcieli znaleźć odpowiedź, brzmiało:
w jakiej grupie badani będą oceniać niżej, a w jakiej wyżej to, że wykonywane wcześniej zadanie było przyjemne? Odpowiedź okazała się jednoznaczna:
w grupie, której płacono l dolara za udzielenie oczekującemu (nieprawdziwej) informacji o tym, że eksperyment był bardzo przyjemny, własna ocena tego, że wykonywane wcześniej zadanie było przyjemne, okazała się najwyższa. Osoby te jakby przychyliły się do opinii, którą przekazywały innym.
Festinger i Carsmith tłumaczą ten fakt zjawiskiem tzw. dysonansu poznawczego. Polega ono na tym, że ludzie nie lubią stanów, w których wytwarzają się u nich dwa niezgodne ze sobą przekonania. W opisanym eksperymencie stan taki mógł powstać u osób, które za bardzo małą nagrodę (l dolara) powiedziały innym, że eksperyment był bardzo przyjemny. Niezgodne zaś były przekonania:
(1) eksperyment, w którym wziąłem udział, był skrajnie nudny;
(2) bez żadnego dostatecznego powodu powiedziałem innym, że eksperyment był bardzo przyjemny.
Stan taki nie powstawał w grupie, która miała dobre powody (20 dolarów), żeby przekazać nieprawdziwą informacje innym.
Festinger (1957) rozwinął teorię, że ludzie nie znoszą sytuacji dysonansu poznawczego i gdy sytuacja taka zaistnieje, starają się ją rozwiązać poprzez zmianę przynajmniej jednego z owych niezgodnych przekonań.
Typową sytuacją prowadzącą do dysonansu jest dokonanie trudnego wyboru, kiedy istnieją racje za jednym, ale i za innym wyborem (zakup samo-
H'RAGNIEN1A l P R/, b KU IM A IM i f\
chodu, wybór kariery zawodowej). W sytuacji takiej powstaje dysonans po-decyzyjny związany z przekonaniem, że odrzuciło się atrakcyjną opcję. Festinger i jego następcy wielokrotnie pokazywali, że kiedy wybór zostanie dokonany, typową reakcją jest przypisywanie większej niż przedtem wartości opcji wybranej i przypisywanie mniejszej wartości niż przed dokonaniem wyboru opcji odrzuconej. Brehm (1956) pokazał to w kontekście wyborów konsumenckich. Grupę kobiet poproszono najpierw o ocenę atrakcyjności rozmaitych przedmiotów domowego użytku. Każdej z kobiet mówiono, że w nagrodę otrzyma jeden z ocenianych przedmiotów - mogła sobie wybrać jeden z dwóch produktów, które poprzednio uznała za atrakcyjne. Kiedy wybór został już dokonany i odpowiedni przedmiot został badanej wręczony, poproszono ją jeszcze raz o ocenę wszystkich przedmiotów. Okazało się, że po otrzymaniu wybranego przedmiotu zyskiwał on na atrakcyjności, podczas gdy przedmioty niewybrane traciły na atrakcyjności. Wytłumaczenie tego wyniku jest zgodne z teorią dysonansu. Podjęcie decyzji wytworzyło dysonans - między wyborem danego przedmiotu i jego słabymi stronami oraz między odrzuceniem innego przedmiotu i jego pozytywnymi cechami. Zęby dysonans ów zredukować, badane osoby zwiększały dystans w atrakcyjności między przedmiotem wybranym i niewybranym.
Frenkel i Doob (1976) pokazali podobny efekt w wyborach politycznych. Prosili oni uczestników wyborów politycznych o wyrażenie swojej opinii na temat preferowanych przez siebie kandydatów. Opinia dotyczyła przekonania, że preferowany kandydat jest najlepszy i że wygra wybory. Badania dokonano raz przed głosowaniem, a drugim razem po głosowaniu (ale przed ogłoszeniem wyników). Okazało się, że po dokonaniu wyboru kandydaci zyskiwali na atrakcyjności i zwiększali swoje szansę zwycięstwa.
Jak pokazało jeszcze inne badanie, podjęcie decyzji umacnia również wiarę w zwycięstwo konia (a nie tylko kandydata politycznego). Knox i Inkster (1968) prowadzili swoje badanie na wyścigach konnych. Zatrzymywali ludzi podchodzących do okienka, by kupić zakład na kolejną gonitwę. Pytali ich, na którego konia stawiają i jak pewni są zwycięstwa typowanego konia. Podobnie zatrzymywali osoby, które właśnie dokonały zakupu zakładu, i także pytali, na którego konia stawiają i jak pewni są zwycięstwa typowanego konia. Różnica między obiema grupami dotyczyła więc tego, czy pytano gracza przed, czy po zawarciu zakładu. Okazało się, że robi to różnicę. Na ogół gracz;
który już postawił na jakiegoś konia, dawał mu większe szansę zwycięstwa niż gracz, który dopiero miał obstawić konia.
Uleganie pokusie i ocenianie moralne. Po zmianie w 1989 roku systemu politycznego w Polsce i uznaniu przez znakomitą większość społeczeństwa systemu komunistycznego za (delikatnie mówiąc) niewłaściwy nastąpiła znaczna polaryzacja ocen moralnych wobec osób podtrzymują-
^l-r-u l\l ł^wŁ
cych wcześniej ów system (członków, aktywistów i funkcjonariuszy komunistycznej partii). Jedni wykazywali postawę całkowicie usprawiedliwiającą owo podtrzymywanie funkcjonowania systemu (innej Polski nie było i trzeba było wykazać aktywność społeczną w warunkach, jakie wtedy były), inni mieli skłonność do skrajnego potępiania wszelkiego zaangażowania w ówczesną rzeczywistość polityczną. Nie wchodząc w merytoryczną dyskusję na temat tych postaw, warto jednak zauważyć interesującą prawidłowość, że postawy bardziej tolerancyjne wobec zachowań podtrzymujących system ujawniają osoby, które same działania takie podejmowały, natomiast postawy bardziej potępiające tego rodzaju angażowanie się ujawniają osoby, które same takiej pokusie nie uległy. Według teorii dysonansu poznawczego prawidłowość ta jest wynikiem redukowania u obu kategorii osób dysonansu poznawczego.
W wypadku osób, które same działały na rzecz systemu komunistycznego, pojawia się dysonans między przekonaniem, że podtrzymywanie jego funkcjonowania jest rzeczą naganną i przekonaniem - pragnieniem - pozostawania przyzwoitą osobą. W jaki sposób można zredukować taki dysonans? Dobrze jest uznać, że podtrzymywanie systemu komunistycznego nie było w istocie rzeczą naganną (wszelkie argumenty wspierające tę tezę będą mile widziane).
W przypadku osób, które nie działały na rzecz komunistycznego systemu, prawdopodobny jest innego rodzaju dysonans: oto była okazja podjęcia współpracy na rzecz systemu - współpraca taka mogła zaowocować różnego rodzaju korzyściami (kariera, wyjazdy zagraniczne, mieszkanie). Nie podjąłem tej współpracy i bezpowrotnie straciłem dobrą okazję. W jaki sposób można zredukować taki dysonans? Dobrze jest uznać, że podtrzymywanie komunistycznego systemu było rzeczą tak naganną, że nie opłaciło się nawet za cenę oferowanych przezeń korzyści.
Potwierdzeniem tego, że interpretacja taka nie jest tylko wydumaną konstrukcją, jest następujący eksperyment przeprowadzony przez Millsa (1958). W eksperymencie tym ustalono najpierw postawy poszczególnych grup uczniów wobec oszukiwania. Następnie uczniowie ci wzięli udział w pewnym teście, który miał charakter konkursu i zawierał atrakcyjne nagrody. Sytuację specjalnie zaaranżowano w ten sposób, że zwycięstwo bez oszukiwania było prawie niemożliwe, a zarazem oszukiwać można było bez większych trudności i w taki sposób, że nikt tego nie mógł zauważyć. Oczywiście, jak można się było spodziewać, część uczniów uległa pokusie i oszukiwała, ale byli też tacy, którzy nie ulegli pokusie. Następnego dnia znów poproszono wszystkich uczniów o wyrażenie swej postawy wobec oszukiwania. I okazało się, że dzieci, które poprzedniego dnia oszukiwały, przejawiały bardziej tolerancyjną niż poprzednio postawę wobec oszukiwania, a dzieci, które nie uległy pokusie, wzmocniły swoją negatywną postawę wobec oszukiwania.
PRAGNIENIA l PRZEKONANIA^^^^^^^^^^^^^
II. PRZYSTOSOWYWANIE PRAGNIEŃ DO PRZEKONAŃ
Omówione wyżej przypadki obejmowały przystosowywanie naszych przekonań do posiadanych przez nas pragnień. Istnieje jednak także odwrotna tendencja - same pragnienia bywają przystosowywane do posiadanych przekonań.
12.5. Efekt kwaśnych winogron
Lis pewien, Igarz i filut, wychudły, zgłodniały, Zobaczył winogrona rosnące wysoko. Owoc, przejrzystą okryty powloką, Zdał się lisowi dojrzały.
Więc rad z uczty, wytężył swoją chudą postać, Skoczył, sięgnął, lecz nie mógł do jagód się dostać. Wprędce przeto zaniechał daremnych podskoków I rzekł: "Kwaśne, zielone, dobre dla żarłoków". (La Fontaine, 1988, str. 204)
Znana bajka La Fontaine'a o lisie i winogronach stanowi ilustrację przystosowywania pragnień do możliwości. Lis spostrzega winogrona, jest wygłodzony i myśli o znakomitej uczcie, po nieudanej próbie konkluduje jednak, że owe winogrona są na pewno kwaśne. Podobną postawę wyraża znane powiedzenie: "Gdy się nie ma, co się lubi, to się lubi, co się ma".
O tym, że ludzie przystosowują pragnienia do możliwości, wiadomo nie tylko z bajek. Harris (1969) prosił badane osoby o to, by oceniły na pewnej skali, jak bardzo podobają im się różne płyty gramofonowe i jak bardzo chciałyby mieć każdą z tych płyt. Zapowiadano im przy tym, że po badaniu każdy ^ otrzyma jedną z płyt. Kiedy jednak badany podał już swoje oceny, mówiono mu (była to manipulacja eksperymentalna), że niektórych płyt nie będzie mógł otrzymać. Potem jeszcze raz proszono badanego o podanie swoich ocen dla wszystkich płyt. Okazało się, że (tak jak z winogronami u lisa) oceny atrakcyjności płyt niedostępnych obniżyły się.
Brehm (1959) nakłaniał dzieci do zjedzenia nielubianej jarzyny, a gdy już to zrobiły, informował niektóre z nich (połowę badanych), że w przyszłości będą musiały częściej niż dotychczas jadać tę (nielubianą) jarzynę. Innym tej niemiłej zapowiedzi nie podawał. Na koniec jedne i drugie dzieci były proszone o ocenę smaku zjedzonej jarzyny. Okazało się, że oceny dzieci, które przekonano, że będą musiały w przyszłości jadać tę jarzynę, były wyraźnie bardziej pozytywne niż tych dzieci, którym tej zapowiedzi nie podawano.
190 PSYCHOLOGICZNE PUŁAPKI OCENIANIA l PODEJMOWANIA DECYZJI
Oba przykłady ilustrują zjawisko przystosowywania pragnień do możliwości. Zjawisko to chroni nas niewątpliwie przed nadmiernym pesymizmem, któremu musielibyśmy ulec, gdybyśmy mieli żałować z powodu nieosiągal-ności niektórych marzeń. Chroni też przed podejmowaniem działań, które nie mają szans powodzenia. Zarazem jednak zbyt "radykalne" przystosowywanie pragnień do możliwości ("zbyt radykalny realizm") prowadzi do pochopnego rezygnowania z bardziej ambitnych celów. Ładnie to ilustruje przypowieść ewangeliczna o talentach - Mt. 25, 14-30.
[Z królestwem niebieskim jest] tak jak z człowiekiem, który udając się w podróż, wezwał swoich służących i powierzył im całą swoją majętność. Jednemu dał pięć talentów, drugiemu dwa, a trzeciemu jeden - każdemu [zresztą] według jego zdolności - i odjechał. Zaraz też ten, który otrzymał pięć talentów, poszedł, obracał nimi i zarobił pięć innych. Podobnie postąpił ten, który otrzymał dwa talenty, zarabiając dwa inne. Lecz ten, który otrzymał tylko jeden, wykopał dół w ziemi i schował tam pieniądze swojego pana. Po dłuższym czasie wrócił pan owych sług i zaczął rozliczać się z nimi. Ten, który otrzymał pięć talentów, przyniósł drugie pięć mówiąc: Panie, dałeś mi pięć talentów. Oto pięć innych, które zarobiłem. Dobrze, sługo prawy i wierny -powiedział j ego pan. Ponieważ byłeś wierny w małym, postawię cię nad wieloma. Wejdź do radości pana twego. A potem przyszedł ten, który otrzymał dwa talenty, i powiedział:
Panie, dałeś mi dwa talenty - oto inne dwa, który zarobiłem. A pan jego powiedział: Dobrze, sługo prawy i wierny. Ponieważ byłeś wierny w małym, postawię cię nad wieloma. Wejdź do radości pana twego. Przyszedł wreszcie ten, który otrzymał jeden talent, i powiedział: Panie, wiedziałem, że jesteś człowiekiem surowym, że chcesz żąć tam, gdzie nie posiałeś, i zbierać tam, gdzie nie rozsypałeś. Obawiając się tedy ciebie, poszedłem i zakopałem twój talent w ziemi. A teraz oto masz go! Ale jego pan odpowiedział mu: Sługo zły i leniwy! Wiedziałeś, że chcę żąć tam, gdzie nie posiałem, i zbierać tam, gdzie nie rozsypałem? Powinieneś był tedy powierzyć moje pieniądze bankierom, a ja, po powrocie, otrzymałbym, co moje, razem z należnym zyskiem. Dlatego odbierzcie mu ten talent i oddajcie temu, który ma dziesięć talentów. Każdemu bowiem, kto ma, będzie jeszcze dodane, żeby posiadał nadmiar; temu zaś, kto nie ma, będzie zabrane nawet to, co ma. Tego zaś sługę, który nic nie wart, wyrzućcie na zewnątrz, w ciemności. Tam będzie płacz i zgrzytanie zębów.
12.6. Świadoma kontrola pragnień: samozobowiązania
Efekt kwaśnych winogron jest dopasowywaniem pragnień do przekonań w sposób nieświadomy. Znane jest także zjawisko świadomego przystosowywania pragnień do przekonań. Są to przypadki tzw. samokontroli.
PRAGNIENIA l PRZEKONANIA
Klasycznym opisem literackim tego zjawiska jest pochodzący od Homera opis zachowania Ulissesa. Miał on przepływać obok wyspy, o której wiedział, że jest zamieszkana przez Syreny o pięknym wabiącym głosie; miały one jednak nieprzyjemny zwyczaj zabijania zwabionych przybyszów. Ulisses wiedział, że podobnie jak wielu przed nim, nie będzie w stanie oprzeć się owym głosom. Wiedział, że owładnie nim silne pragnienie, którego nie powinien zrealizować. W tej sytuacji, przed zbliżeniem się do wyspy, Ulisses kazał się przywiązać do masztu i wydał polecenie swoim sługom (którym umyślił zatkać uszy woskiem), by przywiązali go do masztu, a nadto pod żadnym pozorem nie słuchali jego przyszłych poleceń, dopóki nie miną niebezpiecznej wyspy. Podjął środki w postaci samozobowiązania, uniemożliwiające mu w przyszłości ulegnięcie pokusie .'.Polegały one na tym, że pozbawił się możliwości działania w czasie pokusy.
Bardziej codzienną ilustracją takiego kontrolowania niepożądanych pragnień jest wyrzucanie papierosów przez palacza, który rzuca palenie. Wyrzucenie papierosów ma mu uniemożliwić zapalenie papierosa w chwili nasilenia niewłaściwego pragnienia. Innym znanym zabiegiem, stosowanym w związku z niechęcią do rannego wstawania, jest umieszczanie budzika dostatecznie daleko, tak by nie dało się go wyłączyć bez wstawania z łóżka Ludzie stosują różne tego rodzaju sposoby samokontroli w tych sferach, w których nie dowierzają sile własnego charakteru.
Samozobowiązania i oszczędzanie. Samozobowiązania znane są m przykład w sferze działalności ekonomicznej. Thaler (1985) przytacza pouczającą ilustrację zabezpieczania się ludzi w sferze wydawania pieniędzy.
Oto państwo J. zaoszczędzili 15000 dolarów na wymarzony domek letni Przewidują jego zakup zapięć lat. Zaoszczędzone pieniądze mają złożone nc 10-procentowym koncie w banku. Równocześnie kupują wiośnie nowy samo chód za 11000 dolarów, które pozy czaj ą, korzystając z 3-letniego kredytu opro centowanego na 15%.
Z pewnością zrobiliby mądrzej, przerywając oszczędzanie na trzy lata i trą cąc w ten sposób 10-procentowy przyrost z oszczędzania, zamiast płacić a;
15% za kredyt. Dlaczego tego nie robią? Ano właśnie ze względu na samo kontrolę: państwo J. obawiają się, że przerywając oszczędzanie, mogliby ni gdy nie zrealizować swojego dążenia do założonego celu (domku letniego).
Szczególną formą samozobowiązańjest to, co Ainsly nazywa "publiczny mi zakładami na boku". Oto chcąc rzucić palenie, palacz zawczasu ogłasz;
wśród swoich znajomych, że podejmuje się tego przedsięwzięcia. Co chce prze;
to osiągnąć, zwłaszcza gdy jest świadom, że przedsięwzięcie nie jest łatw< i może się nie powieść? Chce właśnie wzmocnić to przedsięwzięcie, a to w ta ki sposób, że ogłaszając je publicznie, liczy, iż wywoła w ten sposób u siebii pewien skutek. Liczy na to, że nie chcąc w przyszłości narazić się na docink
^ i wi i^/i-^^ii^-i^i- r^i-rti-rM ^OCINIMINIM l ruucJMUWANIA DECYZJI
SSUS^-r^-.W^f:"".:: •',",^:::'•r •• '.•..,;.••••..,, •• . .. . •. .• .. ł" l «_/fc__V/
i inne niepochlebne komentarze otoczenia, bardziej będzie się starał o wytrwanie w owym trudnym postanowieniu. Dla większego efektu przy tego rodzaju oświadczeniach dodaje się niekiedy coś w rodzaju: "A jak zobaczysz mnie z papierosem, to możesz mnie nazwać...", albo po prostu zakład w sensie dosłownym, w którym w wypadku powrotu do palenia obiecuje się wypłatę określonej kwoty.
12.7. Manipulowanie informacją
Inną znaną formą samokontroli jest selekcja napływających informacji. Palacz starający się rzucić palenie próbuje unikać widoku papierosów, towarzystwa palących itp. Pewną skrajną formą unikania "niebezpiecznej" informacji (unikania pokus) było rozpowszechnione w pewnym okresie chrześcijaństwa życie pustelnicze. Oprócz tego, że ograniczało ono szeroki zbiór światowych sposobów życia, ograniczało również zakres napływającej "niebezpiecznej" informacji. Oto odnoszące się do tego cytaty z Księgi Starców (1983):
Abba Izydor poszedł kiedyś do abba Teofila, arcybiskupa Aleksandrii; a kiedy wrócił do Sketis, pytali go bracia: "Co tam w mieście?" Odpowiedział:
"Zaiste, bracia, nie widziałem tam żadnej ludzkiej twarzy, tylko samego arcybiskupa". Słysząc to, przestraszyli się i pytali: "Czy jakaś plaga dotknęła ich, abba?" On odrzekł: "Ależ nie! tylko nie dałem się zwyciężyć pokusie spojrzenia na kogokolwiek". Słysząc to, zdumieli się i utwierdzili się w postanowieniu pilnowania swych oczu przed rozproszeniem (str. 175).
Ainslie (1975) przytacza eksperyment Mischela, pokazujący skuteczność manipulowania informacją przy kontroli zachowania dzieci. Wybór, jaki stawiano (przedszkolnym) dzieciom, dotyczył otrzymania ulubionej potrawy za 15 min. albo mniej lubianej potrawy w dowolnym czasie przedtem. Okazywało się, że dzieci łatwo poddawały się i zjadały wcześniej mniej lubianą potrawę, zamiast zaczekać na lepszą, wtedy gdy potrawy znajdowały się na ich oczach (w tym samym pokoju). Kiedy potrawy znajdowały się w innym pokoju i były niewidoczne, znacznie więcej dzieci potrafiło poczekać na lepszą potrawę. Ciekawe, że nawet takie sugestie, by nie patrzeć na potrawy albo by nie myśleć o potrawach (myśleć o czym innym), pomagały dzieciom w opieraniu się pokusie.
Warto też zauważyć, że współczesny zalew reklamy znacznie utrudnia stosowanie tego rodzaju technik. Cele marketingu są tu wręcz przeciwne. Jednym ze znanych chwytów jest na przykład umieszczanie czekolady i innych słodyczy blisko kasy, po to by rodzice musieli zaspokoić pragnienia swoich spostrzegawczych dzieci.
PRAGNIENIA l PRZEKONANIA
Warto także odnotować, że oprócz świadomego powstrzymywania uwag od niebezpiecznych pragnień, można też świadomie kierować uwagę na nie przyjemne skutki owych pragnień. Dobitnie pokazuje to następujący cyta1 z Księgi Starców (1983, str. 136): Kiedy indziej ten sam abba Zenon szedl drogą w Palestynie i zmęczył się. Usiadł więc, żeby się posilić, a obok byłe pole ogórków. I przyszła mu myśl: "Weź sobie jeden ogórek i zjedź go: cóż ti takiego". Więc odpowiedział sam sobie: "Złodzieje idą do piekła: wypróbu^ siebie, czy zdołasz znieść męki piekielne". Wstał więc i stal na słońcu przei pięć dni, aż spalił skórę, a wreszcie rzekł: "Nie potrafię już dłużej wytrzymać". I odpowiedział pokusie: "Jeśli tego nie możesz, to nie kradnij i nit wyjadaj".
Jak widać, sposób ten może jednak wymagać znacznych wyrzeczeń. Wią że się on zresztą już z następną formą samokontroli.
12.8. Kształtowanie charakteru
Kontrolowanie napływającej informacji to strategia "unikania pokusy" oparts na przeświadczeniu, że na skutek słabej woli nie potrafimy się tej pokusit oprzeć. Formą alternatywną jest umacnianie woli albo tzw. kształtowana charakteru. Tu zaleca się nie unikanie, a wręcz przeciwnie - poszukiwani* pokusy, po to, aby dostarczyć sobie okazji do ćwiczenia woli - do jej umoc nienia. Tradycyjnie zalecano (specjalnie młodzieży) wykonywanie działań które nie bardzo pociągają daną osobę, po to by właśnie umocnić wolę. Ot( cytat na ten temat z Księgi Starców (1983, str. 163): Abba Pojmen opowiada o abba Janie Karle, że kiedyś błagał on Boga i Bóg odebrał mu namiętności a dal mu całkowitą swobodę ducha. On wtedy poszedł do pewnego starci i powiedział: "Stwierdzam w sobie doskonały pokój i brak jakiejkolwiek poku sy". Starzec mu na to odrzekł: "Idź i proś Boga, żeby przyszły na ciebie poku sy i takie jak przedtem utrapienia: bo tylko w walce dusza czyni postępy" Zaczął więc prosić, a kiedy przyszły pokusy, już się więcej nie modlił o uwol nienie od nich, ale mówił: "Daj mi, Panie, wytrwałość w walce".
Asceza i ćwiczenie woli nie są obecnie w modzie. Nie jest to naturalni! żaden argument przeciwko tej metodzie. Argument poważniejszy wiąże sil z tym, że nie bardzo wiadomo, na czym polega istota silnej woli i, w konse kwencji, jak ją ćwiczyć. Prosta teoria, że wolę, podobnie jak inne umiejętne ści, wyrabia się poprzez powtarzanie odpowiednich aktów, nie jest oczywi sta. Badania prowadzone przez Wegnera (1994) pokazują, że często, kied:
staramy się uzyskać kontrolę nad naszymi wewnętrznymi stanami, zdarz;
się nam uzyskiwać efekt zgoła przeciwny naszym intencjom. Im bardzie staramy się nie myśleć o sprawach, nad którymi chcemy zapanować, tyn
^SY^I-IULUl-aH^Z.IMt h-UC-A^M Ul^tlMIAMIA l h'UUfcJMUWANIA DECYZJI
więcej właśnie o nich myślimy. Im bardziej pragniemy wyzbyć się niewłaściwych pragnień, tym częściej o nich myślimy i stają się one tym bardziej pożądane. Na przykład: im bardziej osoba odchudzająca się stara się zachować dietę, tym częściej przychodzą jej do głowy myśli o jedzeniu.
Wegner (1994), który poświęcił tym sprawom wiele badań, nazywa owe "przeciwintencyjne" skutki kontrolowania własnych stanów umysłowych skutkami ironicznymi. Ich występowanie pokazują bardzo proste eksperymenty. W jednym z pierwszych eksperymentów proszono badanych, aby wypowiadali głośno, co im przychodzi do głowy, wtedy gdy żądano od nich, by powstrzymywali się od myślenia o określonym przedmiocie - np. o białym niedźwiedziu. Badani relacjonowali, że wypełniając polecenie, starali się zająć myśli czym innym niż biały niedźwiedź i że niekiedy im się to udawało. Ale bardzo rzadko osiągali pełny sukces, gdyż biały niedźwiedź coraz to powracał.
Wegner następująco tłumaczy zjawisko skutków "przeciwintencyjnych" oraz okoliczności jego występowania: kontrola umysłowa odbywa się poprzez dwa równoczesne procesy - proces wypełniania zamierzenia i proces ostrzegania (monitorowania). Oba one mają wspólny cel - osiągnięcie pożądanego stanu umysłowego - np. nie myśleć o niechcianych sprawach. Proces pierwszy (wypełniania zamierzenia) polega na poszukiwaniu takich umysłowych treści, które pomagają w osiąganiu pożądanego stanu umysłowego. Ma on "wypełnić" umysł myślami i odczuciami zgodnymi z owym pożądanym stanem. Na przykład w przypadku osiągnięcia dobrego nastroju byłyby to myśli odnoszące się do rozmaitych pozytywnych aspektów życia. Gdyby chodziło o niepalenie, byłyby to naturalnie myśli ukazujące korzyści niepalenia itd. Proces drugi (ostrzegania) polega na poszukiwaniu takich umysłowych treści, które sygnalizują niepowodzenia w osiąganiu pożądanego stanu umysłowego. Takie przeszukiwanie treści związanych z potencjalnym niepowodzeniem kontroli "wypełnia" umysł myślami i odczuciami niezgodnymi ze stanem pożądanym. To ten właśnie proces ostrzegawczy odpowiada za ironiczne -jak je nazywa Wegner - skutki wprowadzania kontroli nad naszymi wewnętrznymi stanami. Wegner przytacza wynik pewnego badania, w którym proszono palaczy, by liczyli ilość wypalanych dziennie papierosów. Okazało się, że postawienie takiego wymagania zwiększało liczbę wypalanych papierosów. Kiedy z kolei innej grupie palaczy polecono, by liczyli, ile razy nie zapalili papierosa, kiedy mieli na to ochotę, wymaganie to zmniejszało liczbę wypalonych papierosów. Wegner uważa, że wszelka próba samokontroli (np. postanowienie rzucenia palenia), oprócz podejmowanych świadomie działań związanych z wypełnianiem zamierzenia, które pomagają w osiąganiu pożądanego stanu umysłowego, wzbudza także proces ostrzegania, który w sposób nieświadomy,
PRAGNIENIA l PRZEKONANIA
ale i nieuchronny powoduje skutki ironiczne, utrudniające osiągnięcie zamierzonego celu (np. niepalenia).
Skuteczność samokontroli sprowadzałaby się, w tym ujęciu, do tego, który z dwóch procesów - wypełniania zamierzenia czy ostrzegania - zyska przewagę nad drugim. Dzieje się tak, ponieważ oba te procesy zachodzą w tym samym umyśle i są przeto wzajemnie konkurencyjne: im więcej jednego, tym mniej drugiego.
Według Wegnera czynnikiem decydującym o tym, który z procesów "wygra", jest wielkość obciążenia umysłowego towarzysząca procesom kontroli. Oba procesy - wypełniania zamierzenia i ostrzegania - różnią się bowiem właśnie potrzebnym na ich realizację wysiłkiem umysłowym. Wypełnianie zamierzenia wymaga zwykle dużo większego wysiłku umysłowego niż proces ostrzegania. Na przykład trudniej jest utrzymać myśli przy pozytywnych skutkach niepalenia (Jeżeli mamy ogromną chęć na papierosa), niż zaobserwować niepowodzenia w osiąganiu tego pożądanego stanu umysłowego. Gdyby tak właśnie było, można by przewidywać następującą prawidłowość: kiedy nie jesteśmy zbyt obciążeni umysłowo (jesteśmy w dobrej formie, nic nas zanadto nie absorbuje), to wypełnianie zamierzenia ma szansę "wygrać" z procesami ostrzegania i kontrola nad naszymi wewnętrznymi stanami (myślami, pragnieniami) będzie skuteczna; kiedy jednak wystąpi jakiekolwiek dodatkowe obciążenie umysłowe (stres, napięcie), to ma ono szansę zaburzyć wypełnianie zamierzenia i wtedy proces ostrzegania może wziąć górę nad owym wypełnianiem zamierzenia, i w efekcie wystąpi proces ironiczny: zamiast skutecznej kontroli uzyskamy skutek przeciwintencyjny. Im bardziej będziemy się starali nie myśleć o paleniu, tym bardziej będziemy właśnie o nim myśleć.
12.9. Manipulowanie własnym wewnętrznym systemem
Inną formą samokontroli jest to, co za Elsterem (1984) można nazwać manipulowaniem własnym wewnętrznym systemem (a co Ainslie [1975] nazywa "prywatnymi zakładami na boku"). Zacznijmy od pewnej ilustracji. Oto osoba walcząca z otyłością postanawia jadać normalny posiłek tylko raz dziennie, natomiast pozostałe posiłki zastąpić dietą typu slimfast (specjalna substancja rozpuszczana np. w mleku). Zaraz jednak (za kilka dni) pojawia się sytuacja szczególna - w hotelu, w którym osoba ta się zatrzymała, podają bardzo apetyczne rogaliki. Pojawia się pokusa naruszenia zasady, by jadać normalny posiłek tylko raz dziennie, natomiast pozostałe posiłki zastąpić dietą typu slimfast. Jak może się ratować osoba narażona na taką pokusę? Ratunek może stanowić uświadomienie sobie, że takie jednorazowe naru-
'^•"-""-' "'-"^.''>•' ^'^'-'^'"I^IM i i-uutJMUWANIA DECYZJI
szenie zasady daje złe rokowania na przyszłość - zapowiada przyszłe naruszenia (oczekiwanie oparte na znajomości własnej natury!) i klęskę całej idei odchudzenia się. Uświadomienie sobie tego właśnie pogorszenia rokowań może stanowić dobrą przeciwwagę dla obecnej chęci naruszenia zasady, może się okazać silniejsze od tej chęci. Zatem skuteczną formą samokontroli może być specjalne tworzenie reguł, których naruszenie zapowiada zastopowanie osiągnięcia ważnego celu (stąd nazwa "prywatne zakłady na boku").
Ainslie (1975) przypomina także znaną praktykę składania przysięgi (obietnicy) wobec istoty nadprzyrodzonej (boskiej, świętej), na której wsparcie przysięgający liczy Praktyka ta może powodować te same skutki, co przyjęcie pewnej reguły, o ile w mniemaniu przysięgającego naruszenie przysięgi może prowadzić do niezadowolenia istoty nadprzyrodzonej, która może w tej sytuacji odmówić w przyszłości swojego wsparcia. Stanowiłoby to w mniemaniu składającego przysięgę złe rokowanie na przyszłość.
l Oi fi
Kiedy oceny wpływają na fakty:
samospełniające się proroctwa8
13.1. Niezwykły przyrost inteligencji
W roku 1968 Robert Rosenthal i Leonore Jacobson (1968) opublikowali niezwykłe doniesienie badawcze. Oto przeprowadzili w pewnej szkole podstawowej badania testowe i ustalili iloraz inteligencji poszczególnych dzieci, po czym wskazali nauczycielom 20% dzieci, które według uzyskanych wyników miały rokować bardzo wyraźny przyrost inteligencji w najbliższym roku szkolnym. Zdaniem badaczy inteligencja tych dzieci była dotąd utajona, ale przeprowadzone badania testowe pozwalają przewidywać, że nastąpi wyraźna poprawa. Kiedy powrócili za rok i powtórnie zmierzyli inteligencję badanych dzieci, badane wcześniej 20% dzieci rzeczywiście ujawniło znaczący przyrost inteligencji.
Niezwykłość uzyskanego wyniku polega na tym, że 20% dzieci było w pierwszym badaniu wybrane nie w oparciu o jakiś specjalny test, ale na zasadzie czysto losowej (wylosowano nazwiska z kapelusza). Zrealizowało się coś, co przepowiadano bez żadnych realnych podstaw, czyli po prostu coś, co opierało się na fałszywej przesłance. Jak mogło się to stać? Skąd akurat u losowo wskazanej grupy dzieci - i tylko u tych dzieci - nastąpił wyraźny przyrost inteligencji?
Opisane badanie ujawniło zjawisko samospełnienia się proroctwa - zjawisko opisane wcześniej przez Roberta Mertona (1965), który tak je charakteryzował: "Samospełniające się proroctwo jest, początkowo, fałszywą definicją sytuacji prowokującą wystąpienie nowych zachowań, które sprawiają, że fałszywa wyjściowo definicja sytuacji staje się (na końcu) prawdziwa".
' Część prezentowanych w tym rozdziale badań jest przedstawiona w rozdziale 4. mojej książki Psychologia zachowań ekonomicznych(Tyszka, 1997).
^"^'"^'"^'^'-'^"'''-''^ANIA DECYZJI
Zgodnie z tą definicją w przeprowadzonym badaniu: (a) została postawiona pewna fałszywa hipoteza: u wskazanej przez badaczy grupy dzieci rozwinie się w najbliższym czasie inteligencja, (b) hipoteza ta zainicjowała specjalne zachowanie nauczycieli: można się domyślać, że nauczyciele - uprzedzeni o "wybuchu" inteligencji u wybranej grupy dzieci - musieli specjalnie się nimi zajmować, (c) co w efekcie doprowadzało do rzeczywistego przyrostu inteligencji u specjalnie traktowanych dzieci.
13.2. Przewidywanie urody nieznanej rozmówczyni9
Zjawiska samospełniania się proroctw nie ograniczają się bynajmniej do sytuacji szkolnych. W badaniu Snydera, Tanke i Berscheid (1977) zilustrowano to zjawisko w sytuacji dotyczącej dorosłych. W badaniu tym studenci (mężczyźni) rozmawiali przez telefon z losowo dobranymi partnerkami na zadany przez badaczy temat. U połowy studentów wzbudzano przy tym przekonanie, że ich partnerka jest bardzo atrakcyjna - dawano im (zawsze to samo) zdjęcie ładnej dziewczyny, u połowy zaś - że jest ona brzydka (zdjęcie mało atrakcyjnej kobiety).
W następnej fazie zupełnie innym osobom (obu płci) odtwarzano nagrane na taśmę wypowiedzi. Jednej części osób prezentowano tylko wypowiedzi mężczyzn z owych konwersacji, drugiej grupie - tylko wypowiedzi dziewcząt. Słuchający nagrania miał ocenić zachowanie uczestnika telefonicznej konwersacji i odgadnąć, czy przesłuchiwana dziewczyna jest (raczej) ładna czy brzydka. Okazało się, że oceniający nie mieli dużych kłopotów z odgadnięciem urody rozmówczyń: trafnie uznawali za ładne te dziewczęta, których partnerzy z pierwszej fazy badania oglądali ładne zdjęcia i byli przekonani, że rozmawiają z kobietą atrakcyjną. Analogicznie - za brzydkie uważali te dziewczęta, których partnerzy z pierwszej fazy badania byli przekonani, że rozmawiają z kobietą nieatrakcyjną.
Skąd ta intuicja? Okazało się, że dziewczęta, o których partnerzy byli przekonani, że są ładne, były bardziej ożywione, pewne siebie i sprawniejsze w konwersacji, natomiast dziewczęta, o których partnerzy byli przekonani, że są nieatrakcyjne, przejawiały w konwersacjach mniej ożywienia, mniej pewności siebie i mniej sprawności. Dlaczego? Jak pokazały oceny wypowiedzi rozmówców, studenci przekonani, że rozmawiają z kobietą ładną, sami przejawiali więcej sprawności, dowcipu i ciepła niż studenci przekonani, że rozmawiają z kobietą nieatrakcyjną. Tak więc, przekonania studentów na temat urody rozmówczyni decydowały o ich zachowaniu, a to z kolei kształ-
W opisie eksperymentu skorzystałem z przedstawienia go w książce Wojciszke (1991).
KIEDY OCENY WPŁYWAJĄ NA FAKTY
towało zachowanie ich partnerek. Badacze puentują to następująco: To, co było najpierw rzeczywistością w mniemaniu mężczyzn, stało się później rzeczywistością w zachowaniu kobiet, z którymi owi mężczyźni rozmawiali [...] (Snyder, Tanke i Berscheid, 1977, str. 661).
13.3. Czy dyskryminacja rasowa ma podstawy?
Merton (1965) pokazuje, jak ten sam mechanizm samospełniających się proroctw utrwala dyskryminację rasową w społeczeństwie. Na przykład biali robotnicy amerykańscy sprzeciwiali się przyjmowaniu czarnych robotników do związków zawodowych, powołując się na fakty, że nie przejawiają oni chęci do prowadzenia walki, strajków czy solidarnego negocjowania uprawnień związkowych. Postępując jednak w ten sposób, utrwalali owe antyzwiązkowe poczynania czarnych robotników, gdyż ci, nie mając ani poparcia związków, ani pracy, zmuszeni byli godzić się na gorsze warunki płacowe, podejmowali pracę jako łamistrajki itp. W ten sposób spełniało się proroctwo o antyzwiąz-kowym zachowaniu czarnych robotników.
Word, Zanna i Cooper (1974) pokazali eksperymentalnie funkcjonowanie samospełniających się proroctw w kontekście uprzedzeń rasowych. Polecali oni białym studentom przeprowadzać wywiady raz z innym białym studentem, a raz ze studentem czarnym. Mierzyli przy tym takie charakterystyki jak: (a) długość wywiadu, (b) liczbę błędów w wypowiedziach (traktowano to jako miarę dyskomfortu), (c) fizyczny dystans między prowadzącym wywiad i rozmówcą. Okazało się, że biali studenci prowadzący wywiad: (l) kontynuowali go o 35% dłużej ze studentami białymi niż z czarnymi, (2) popełniali ok. 50% więcej błędów w rozmowie ze studentami czarnymi niż z białymi i (3) utrzymywali w trakcie rozmowy większą odległość wobec studentów czarnych niż wobec białych.
Ustaliwszy to, w następnym eksperymencie badacze polecili innej grupie białych studentów przeprowadzić wywiady z białymi (!) studentami na dwa sposoby. Wobec jednej grupy kazali postępować według sposobu, w jaki w pierwszym eksperymencie postępowano z białymi studentami (dłuższy czas, mniej błędów w rozmowie, krótszy dystans fizyczny), wobec drugiej grupy białych studentów kazali postępować według sposobu, w jaki w pierwszym eksperymencie postępowano z czarnymi studentami (krótszy czas, więcej błędów w rozmowie, dłuższy dystans fizyczny). Co się okazało? Rezultat był jednoznaczny: studenci biali, z którymi prowadzono wywiad w taki sposób, jak w pierwszej części z czarnymi, wypadali w tym wywiadzie gorzej niż ci, z którymi prowadzono wywiad w taki sposób, jak z białymi w pierwszej części eksperymentu.
i.^^-iit- i ^*i_^rrM ^^CINIMIMIM l ruutJMUWANIA DECYZJI
(tm)Bwaa^%as<^sssA:(tm)aaTOw.ww:w:w^^^^^^ .. iił-ł L^l_v^ l <-U l
13.4. Samospełniajace się proroctwa w szkole
Od czasów głośnego eksperymentu Rosenthala i Jacobson przeprowadzono olbrzymią ilość badań nad funkcjonowaniem samospełniających się proroctw w szkole. Jussim (1986) dokonał przeglądu wielu z tych badań i pokazał, jak realizują się one w kolejnych fazach: (a) wytworzenia się określonych oczekiwań u nauczycieli, (b) zróżnicowanego traktowania dobrych i słabych uczniów przez nauczycieli, (c) wytworzenia się u uczniów określonych reakcji na zróżnicowane traktowanie.
Oczekiwania nauczycieli. Najpierw u nauczycieli pojawiają się określone wyjściowe - pozytywne bądź negatywne - oczekiwanie wobec ucznia. Niektóre z nich opierają się na informacjach wcześniejszych nawet niż pierwszy kontakt nauczyciela z uczniem. Nie chodzi przy tym tylko o te nieliczne przypadki, gdy ma się starszego brata lub siostrę, którzy zawczasu "przygotowali" dobrą albo złą opinię o danym nazwisku. Takie okoliczności jak pochodzenie społeczne czy etniczne, płeć, strój, wygląd fizyczny, mogą wytwarzać u nauczyciela określone wyjściowe oczekiwanie wobec ucznia. Naturalnie ogromne znaczenie mają pierwsze reakcje - odpowiedzi ucznia:
wytwarzają one wyjściowe - pozytywne bądź negatywne - oczekiwanie wobec ucznia.
Zróżnicowane traktowanie dobrych i słabych uczniów przez nauczycieli. Wytworzone (wszystko jedno jak) oczekiwania prowadzą do tego, że nauczyciel zaczyna traktować ucznia w sposób stosowny do owych oczekiwań. Jussim (1986) wymienia tu szereg możliwości dochodzenia do owego zróżnicowanego traktowania ucznia dobrego i ucznia słabego. Wśród nauczycieli obserwowana jest na przykład zróżnicowana tendencja do dostarczanie informacji zwrotnej o wykonaniu zadania uczniowi dobremu i uczniowi słabemu. Uczniowi dobremu informacja ta jest dostarczana częściej i jest to informacja dokładniejsza niż informacje przekazywane uczniowi słabemu.
Oddziaływać może też czynnik pochodny od przypisywania różnych powodów niepowodzenia w przypadku ucznia dobrego i ucznia słabego. Istnieje tendencja, by niepowodzenie ucznia dobrego przypisywać sytuacji zewnętrznej (trudny materiał, niedostateczne wyjaśnienie zagadnienia), natomiast niepowodzenie ucznia słabego przypisywać właściwościom osoby (brak zdolności, staranności). Stosownie do tego nauczyciel może mieć skłonność do zróżnicowanego traktowania uczniów spostrzeganych jako dobrych i słabych, gdy spotyka ich niepowodzenie. Tym pierwszym może poświęcać znacznie więcej czasu i uwagi, żeby ułatwić im zrozumienie materiału, niż tym drugim, którzy tak czy owak "nie są zdolni lub skłonni opanować wymaganego zadania".
Inny czynnik powodujący zróżnicowane traktowanie ucznia dobrego i ucznia słabego wiąże się ze znaną teorią dysonansu poznawczego Festingera
KIEDY OCENY WPŁYWAJĄ NA PAK l Y
(1957). Jak była o tym mowa w rozdziale 11, ludzie nie lubią stanu dysonansu poznawczego, (tj. niezgodności posiadanych przekonań) i gdy sytuacja taka zaistnieje, starają się dysonans zredukować. Zgodnie z tą teorią, kiedy uczeń dobry wykona dobrą pracę albo uczeń zły wykona słabą pracę, nauczyciel odbiera to jako zgodność zdarzeń ze swoimi oczekiwaniami i po prostu uzyskane wyniki przekazuje w sposób bezstronny uczniom. Kiedy jednak uczeń dobry wykona słabą pracę albo uczeń zły wykona dobrą pracę, nauczyciel przeżywa dysonans poznawczy i w obu wypadkach ma skłonność reagować negatywnie. Reakcja taka jest naturalnie adekwatna wobec dobrych uczniów, którzy wykonali słabą pracę - doświadczają oni negatywnej reakcji nauczyciela na słaby wynik. Ale negatywna reakcja nauczyciela na dobry wynik ucznia słabego jest nieadekwatna i sprawia zamęt w głowie ucznia słabego - doświadcza on negatywnej reakcji za dobrze wykonaną pracę.
Reakcje na zróżnicowane traktowanie. Naturalnie, zróżnicowane traktowanie dobrych i słabych uczniów przez nauczycieli prowadzi do określonych skutków i reakcji ze strony uczniów. Najbardziej bezpośredni skutek dotyczy niejednakowej częstości dostarczania informacji zwrotnej o wykonaniu zadania obu kategoriom uczniów. Informacja zwrotna jest udzielana częściej uczniowi dobremu i powoduje, że zaczyna on wyraźnie rozróżniać wykonanie dobre i niedobre (załóżmy, że niewłaściwe jest pisanie zbyt długich, skomplikowanych składniowo zdań). Uczeń słaby, pozbawiony często informacji zwrotnej, ma gorsze szansę na nauczenie się różnicy między dobrym i niedobrym wykonaniem zadania.
Równie niekorzystnym skutkiem zróżnicowanego traktowania dobrych i słabych uczniów przez nauczycieli jest wytwarzanie się u ucznia słabego przekonania, że nie ma wyraźnego związku między wkładanym wysiłkiem i osiągniętym efektem a uzyskaną nagrodą lub karą. Jest to według psychologicznej teorii uczenia się podstawowa kwestia dla nabywania przez człowieka określonych (pożądanych) nawyków. Człowiek uczy się określonych zachowań wtedy, kiedy dostrzega związek między danym zachowaniem (np. dobrym wykonaniem zadania) a nagrodą czy pochwałą. Niektóre badania (Cooper, 1979) pokazują, że nauczyciele mają większą skłonność do chwalenia za włożony wysiłek uczniów zdolnych niż niezdolnych. Ale to właśnie może powodować, że uczniowie niezdolni mogą nie dostrzegać związku między wysiłkiem i dobrym wykonaniem zadania a nagrodą (pochwałą nauczyciela).
Niekorzystny wpływ zróżnicowanego traktowania zdolnych i niezdolnych uczniów w szkole nie powinien być jednak traktowany jako wygodne wytłumaczenie wszelkich niepowodzeń szkolnych. Absurdalne byłoby mniemanie, że gdyby tylko nauczyciele zaczęli mieć pozytywne oczekiwania wobec wszystkich uczniów, tym samym wszyscy ci uczniowie zaczęliby mieć wysokie osią-
gnięcia w szkole. Badania pokazują, że oczekiwania nauczycieli wobec uczniów w praktyce szkolnej nie powstają z niczego. Okazuje się, że wiele z opinii nauczycielskich o ich uczniach jest całkiem trafnych, opartych na rzeczywistych możliwościach wychowanków (Brophy, 1983). W przeważającej mierze to raczej samo zachowanie uczniów niż jakieś niesprawdzone opinie innych kształtuje odpowiednie oczekiwania nauczycieli i w konsekwencji zróżnicowane traktowanie (rzeczywiście różnych) uczniów.
13.5. Samospełniające się oczekiwania ekonomiczne:
jak można doprowadzić do upadku banku, bessy na giełdzie, wzrostu inflacji?
Zjawisko samospełniającego się proroctwa ma zastosowanie w różnych dziedzinach życia społecznego. Merton (1965) ilustruje w ten sposób mechanizm utraty wypłacalności banku. Przyjmijmy, że z jakiegoś powodu (wszystko jedno, uzasadnionego czy nie) zaczyna się szerzyć opinia, że określony bank znajdzie się w tarapatach i może być niewypłacalny. Zaniepokojeni posiadacze kont niepokoją się i na wszelki wypadek wycofują swoje oszczędności z banku. Tworzą się kolejki i zaczyna działać następujący mechanizm: im więcej ludzi oczekuje, że bank znajdzie się w tarapatach i może być niewypłacalny, tym większa liczba posiadaczy kont przejawia niepokój i wycofuje z niego swoje wkłady. W miarę, gdy liczba ta rośnie, ich zachowanie sprawia, że bank rzeczywiście znajduje się w tarapatach i traci płynność wypłat. Coś, co wyjściowo było tylko opinią, staje się rzeczywistością.
Oto opis beletrystyczny tego procesu z książki Jamesa Clavella Noble House:
[...J Każdy wychodzący z banku powtarzał, że dostał wszystkie pieniądze. Niemniej obawy oczekujących na zewnątrz nie malały. Wszyscy pamiętali zeszłoroczny krach, straty, oszustwa, korupcję. I wszyscy mieli świadomość, jak łatwo, niezależnie od tego, czy panują komuniści, nacjonaliści, gubernator czy ktoś inny, mogą ulotnić się ich cale życiowe oszczędności. Nic się nie zmienia od czterech tysięcy lat.
[...] - Ależ, Szlachetny Panie, już czeka około pięciuset ludzi, a kolejka ciągnie się aż do brzegu.
- Nie szkodzi, Szlachetny Sung! Płaćcie tym, którzy chcą pieniędzy. Nie martw się! Mówcie każdemu, że jest niepotrzebnie przesądny. Ale tym, co będą nalegać, wypłacajcie. Ho-Pakjest równie silny jak Blacs i Yictoria! Wierutne kłamstwo, że wpadliśmy w tarapaty. Wypłacajcie! Dokładnie sprawdzajcie książeczki oszczędnościowe, nie spieszcie się. Postępujcie rozsądnie!
KIEDY OCENY WPŁYWAJĄ NA hAK l Y
^^SSiSSS^;:^^^
A zatem dyrektor przekazał kasjerkom, aby próbowały przekonywać klientów, że nie ma powodów do niepokoju, że fałszywe plotki rozsiewają źli ludzie.
[...] I bank zaczai wypłaty. W całości.
Jak wszystkie banki, Ho-Pak przeznaczał zdeponowane pieniądze na wszelkiego rodzaju kredyty. W Honkongu regulowało tę sprawę kilka praw i rozporządzeń. Niektóre banki pożyczały aż osiemdziesiąt procent pieniędzy, ponieważ miały pewność, że nigdy wszyscy klienci nie przyjdą po swoje pieniądze jednocześnie [...].
Mechanizm samospełniającego się proroctwa odpowiada też za dynamikę cyklu hossy i bessy na giełdzie. Wszyscy inwestujący na giełdzie kierują się prostą zasadą: "chcą po prostu kupić akcje po niskich cenach, a sprzedać po wysokich" (Plummer 1995). Inwestorzy różnią się natomiast w swoich oczekiwaniach. Jedni spodziewają się wzrostu cen akcji, a drudzy - spadku cen akcji. Ta rozbieżność opinii sprawia, że "działa" rynek, czyli następują stopniowe zmiany cen akcji - w górę albo w dół, stosownie do tego, czy więcej inwestorów spodziewa się wzrostu czy spadku cen akcji. Jak dochodzi do powstania hossy lub bessy na giełdzie? Oto jakaś część inwestorów zaczyna podejrzewać, że wkrótce nastąpi odwrócenie obecnego trendu: z hossy na bessę. Odpowiednio do tego zaczynają oni zmieniać proporcje swojego portfela, sprzedając część swoich akcji. Ponieważ nie są pewni zmiany, dokonują wyprzedaży w umiarkowanym (niewielkim) stopniu. Gdy jednak coraz więcej posiadaczy akcji zaczyna wierzyć, że na giełdzie zapanuje bessa i ceny akcji zaczną spadać, coraz więcej akcji wystawianych jest na sprzedaż. Ruch ten sprawia, że jeszcze więcej inwestorów rozpoznaje trend bessy i pojawia się tym silniejsza chęć wyzbywania się akcji. Tworzy to warunki rzeczywistego wystąpienia bessy. Zjawisko to może powstawać przypadkowo, ale może też być (i bywa) wywołane celowo - w ramach spekulacji giełdowych.
Podobnie może działać mechanizm samonapędzania się inflacji. Zgodnie z teorią ekonomiczną inflacja, czyli ogólny i trwały wzrost cen, pojawia się wtedy, gdy zasoby pieniężne społeczeństwa rosną szybciej niż zasób dóbr na rynku. Jak to jednak zauważył Katona (1963), owe czynniki ekonomiczne nie zawsze powodują w efekcie inflację, a przy tym wzrost cen nie jest zwykle proporcjonalny do owej przewagi wzrostu zasobów pieniężnych i spadku zasobu dóbr. Ta nieproporcjonalność jest szczególnie widoczna przy tzw. hi-perinflacji, kiedy to ceny rosną w sposób galopujący. Katona zwrócił uwagę, że oprócz czynników ekonomicznych wpływ na inflację mają oczekiwania inflacyjne - to czy ludzie spodziewają się dalszego wzrostu cen, czy nie. Jeżeli ludzie spodziewają się dalszego dużego wzrostu cen (dużej inflacji), zaczynają wyzbywać się gwałtownie pieniędzy, kupując cokolwiek (wszystko). Wśród konsumentów oczekujących wysokiej inflacji pojawia się tenden-
l V I-OTUnUL-^UK^Z-INC: 1-Ut.MI-lM UI^CIMIMINIA l l-UUtJMUWANIA DECYZJI
cja do szybkiej wymiany pieniędzy na produkty. Tendencja ta zwiększa popyt, co zwiększa dalej rozziew między zasobami pieniędzy i zasobami dóbr na rynku. Nie jest to zresztą jedyna konsekwencja oczekiwania wysokiej inflacji. Inną konsekwencją jest na przykład żądanie przez pracowników oczekujących wysokiej inflacji większych podwyżek płac. Realizacja tych żądań zwiększa z kolei koszty produkcji i znowu powoduje wzrost cen. Tak więc oczekiwania wysokiej inflacji prowadzą rzeczywiście do zwiększonej inflacji.
Podobnie jak w wypadku innych samospełniających się proroctw, oczekiwania inflacyjne mogą być wyjściowo zupełnie nieuzasadnione. Mogą to być plotki rozsiewane przez jakieś grupy osób. Ważne jest to, czy społeczeństwo uwierzy w nie, czy nie. Oczywiście, można się spodziewać, że plotki nie oparte na żadnych realnych podstawach nie będą na ogół miały tak dużej siły, by przekonać dostatecznie dużą część społeczeństwa, iż nastąpi gwałtowny wzrost cen. Jak podkreśla Katona (1963) ludzie mają na ogół tyle doświadczenia i wiedzy ekonomicznej, że potrafią rozpoznać, kiedy pogłoski na temat wzrostu cen są całkowicie bezpodstawne, a kiedy "coś jest na rzeczy" (rząd zaczyna dodrukowywać pieniądze albo zaciąga duże pożyczki).
13.6. Bajka na temat kariery
Docent Kaszanka - jako jedyny specjalista w kraju - zajmował się deseniem czerwonych pasków na ciele bezbarwnego orzęska. Sprawa tylko z pozoru brzmi paradoksalnie. Chociaż bowiem orzęsek wyglądał i byl przez długi czas uważany za organizm bezbarwny, jednak istniały pośrednie dowody na istnienie na jego ciele czerwonych pasków. Szczególnie docent Kaszanka wykazywał, że owe czerwone paski na ciele orzęska są podłużne. Posługiwał się przy tym znaną w psychologii metodą uczenia się instrumentalnego. Robił to w sposób następujący: uczył wyróżniające się dobrym wzrokiem owady, by zbliżały się do obiektów pomalowanych w czerwone podłużne paski (otrzymywały za to ulubiony pokarm). Następnie badał zachowanie tychże owadów wobec orzęska - umieszczał je w pobliżu orzęska i obserwował, czy będą się doń zbliżały. Zaobserwował, że owady owe istotnie zbliżały się do orzęska.
Docent Kaszanka miał dwóch asystentów. Zatrudnił ich, gdy wykazali się zdolnościami do pracy naukowej, robiąc pod jego kierunkiem prace magisterskie na temat deseniu domniemanych pasków orzęska. Jeden z asystentów, mgr Klusek, stosując zaproponowaną przez docenta Kaszankę technikę uczenia się, wykazywał w swojej pracy magisterskiej, że prawdopodobnie czerwone paski na ciele orzęska nie są całkiem podłużne, lecz raczej z lekka ukośne, a to dlatego, że przeszkolony owad szybciej zbliżał się do orzęska, gdy byl do niego ustawiony pod kątem ostrym (paski na ciele orzęska musiały mu się
KIEDY OCENY WPŁYWAJĄ NA FAK l Y^
wówczas wydawać z lekka ukośne), niż wtedy, gdy byl ustawiony na wprost orzęska. Tak więc mgr Klusek zaproponował hipotezę "z lekka ukośnych pasków podłużnych". Drugi z asystentów, mgr Zacierek, wybrał całkiem inną metodę badania. Była to znana w psychologii metoda tzw. primingu. Zamiast uczyć czegokolwiek wyróżniające się dobrym wzrokiem owady, po prostu pokazywał im najpierw w ciągu ułamka milisekundy pomalowane w pewien sposób obiekty (w tym pomalowane w paski podłużne, z lekka ukośne, mocno ukośne, a nawet poprzeczne), a więc wzbudzał u owych owadów podwyższoną wrażliwość na określony deseń, po czym mierzył szybkość zbliżania się owada do orzęska. Okazało się, że średnio biorąc, szybkość zbliżania się owada do orzęska była największa przy primingu z paskami poprzecznymi. Mgr Zacierek zaproponował więc hipotezę "pasków poprzecznych"'. Obaj asystenci przygotowywali teraz rozprawy doktorskie mające w sposób niezbity dowieść słuszności ich hipotez.
Docent Kaszanka z równą uwagą obserwował postępy obu prac, ale już na podstawie prac magisterskich i obserwacji zachowania się obu asystentów powziął przekonanie, że mgr Klusek rokuje lepiej. Nie potrafił wprawdzie dać wyraźnego uzasadnienia, dlaczego akurat mgr Klusek rokuje lepiej niż mgr Zacierek, ale tak właśnie mniemał. Rzeczywiście powody były raczej trudne do ustalenia, jako że asystenci Klusek i Zacierek różnili się pod wieloma względami. Asystent Klusek miał naturalną skłonność do trzymania się w badaniu naukowym zasad przyjmowanych przez docenta Kaszankę (czego wyrazem bylo m. in. posłużenie się w pracy magisterskiej metodą uczenia się instrumentalnego, preferowaną przez docenta Kaszankę). Asystent Zacierek miał natomiast przemożną skłonność do próbowania w badaniu naukowym nowych metod i kwestionowania zasad głoszonych przez starszych (w tym przez docenta Kaszankę - wyrazem tego było m. in. posłużenie się w pracy magisterskiej metodą primingu, nie bardzo lubianą przez docenta Kaszankę). Różnice te przejawiały się zresztą także w zachowaniach społecznych obu asystentów. Pierwszy przy każdej okazji podkreślał bystrość i osiągnięcia szefa, drugiemu zdarzało się komentować niektóre wypowiedzi szefa przy pomocy takich słów, jak "bzdura", "nonsens", a nawet "duperela".
Oprócz owej różnicy charakterów, z perspektywy docenta Kaszanki asystent Klusek miał inną jeszcze przewagę nad asystentem Zacierkiem - posiadał bardziej naukowy światopogląd. Chodziło głównie o stosunek do ideologii czerwonego kolczyka. Mówiąc najkrócej, ideologia czerwonego kolczyka opierała się na hipotezie (uznawanej przez jej wyznawców za pewnik), że pierwotnie gatunek ludzki byl wyposażony przez naturę w czerwoną kulkę zwisającą u lewego ucha (czerwony kolczyk). W pewnej jednak fazie rozwoju ludzkości u mniejszości gatunku pojawiła się anomalia, polegająca na bra-
_ . _ 1 ^> 1 <^i iv^i-^>-n>^z-iMc rui-Mi-r\i >^"^i=iMi/-u'łiM i I-UL-'CJIVIUWANIA DECYZJI
:(r):s^ss(r)^ssaaisaaas5sa^aaa^^^(r)^i^sB^saa^^^^^
A^ owego czerwonego kolczyka. Mniejszość ta wykazywała przy tym (a raczej dlatego) niski poziom uczuć moralnych. Ów brak skrupułów pozwolił tej mniejszości podjąć skuteczną eksterminację większości kolczykowej. Obcinając po prostu przez wiele pokoleń czerwone kolczyki wszystkim niemowlętom, doprowadziła ona do zaniku tej cechy w całym gatunku. Wyznawcy ideologii czerwonego kolczyka głosili potrzebę naprawienia tej anomalii i w tym celu transplantowali niemowlętom czerwone kulki u lewego ucha. Wierzyli, że w ten sposób z czasem ludzkość wróci do stanu pierwotnego, co spowoduje zanik instynktu agresji i innych niepożądanych instynktów, a w dalszej perspektywie doprowadzi ludzkość do stanu powszechnej szczęśliwości. Konsekwentnie też sami nosili w lewym uchu czerwony kolczyk.
Asystent Klusek, podobnie jak docent Kaszanka, był aktywistą organizacji czerwonego kolczyka, podczas gdy asystent Zacierek nie tylko nie był członkiem organizacji, ale zgoła pozwalał sobie na niewybredne żarty na jej temat. Mówił na przykład, że gdyby czerwonokolczykowcy transplantowali sobie zamiast czerwonego kolczyka dodatkowe jądro, szybciej osiągnęliby zamierzone cele. Tak czy owak, docent Kaszanka dostrzegał w ogólnej postawie asystenta Zacierka pewien brak "pogłębionej" refleksji i choć daleki był od dyskryminowania go z powodów ideologicznych, to jednak mniemał, iż właśnie ten brak gorzej rokuje w prognozowaniu jego rozwoju naukowego.
Dalszy przebieg kariery naukowej obu asystentów pokazał, że domniemanie docenta Kaszanki nie było bezzasadne (chwalił się tym zresztą w czasie zasłużonej emerytury). Istotnie, to asystent Klusek stał się następcą emerytowanego docenta Kaszanki i głównym krajowym specjalistą od czerwonych pasków na ciele bezbarwnego orzęska. Przewaga docenta Kluska nad doktorem Zacierkiem była niewątpliwa. To ten pierwszy mógł się wykazać wykładami (naturalnie na temat czerwonych pasków na ciele bezbarwnego orzęska) na wielu zagranicznych uniwersytetach, podczas gdy dr Zacierek miewał co najwyżej odczyty na kursach dla nauczycieli. To docent Klusek "widział" i nawet wziął udział w rozstrzygającym doświadczeniu w sprawie deseniu domniemanych pasków na ciele orzęska. Doświadczenie rozstrzygające przeprowadzone zostało na Uniwersytecie Haruarda, a polegało po prostu na obejrzeniu orzę-skapod bardzo silnym mikroskopem elektronowym, jakiego w Polsce nie było. Okazało się wówczas, że deseń pasków na ciele bezbarwnego orzęska nie odpowiadał żadnej z wcześniejszych hipotez. Mikroskop pokazał, że nie były to w ogóle paski, ale kropki. Tymczasem dr Zacierek ciągle eksperymentował z nowymi metodami pośrednimi i doszedł jedynie do wyniku, że "poprzeczne paski na ciele orzęska są w niektórych miejscach poprzerywane".
Jako ciekawostkę można dodać, że docent Klusek zyskał nadto pewien rozgłos jako demaskator oszustwa zawartego w ideologii czerwonego kolczyka. Kiedy już zyskał znaczne uznanie i pozycję, odkrył, że założenie czerwonokol-
l «J
KIEDY OCENY WPŁYWAJĄ NA hAK Y f
czykowców o zaniku czerwonej narośli na lewym uchu na skutek systematycznego jej odcinania jest nienaukowe. Jako dowód przytaczał znane eksperymenty Weissa, który na drodze odcinania usiłował pozbawić gatunek myszy ogonów i okazało się, że mimo to myszy w kolejnych pokoleniach rodziły się z ogonami. Docent Klusek został naturalnie przez czerwonokolczykowców ogłoszony rewizjonistą, co po późniejszym upadku tej ideologii przyniosło mu niejaki prestiż.
Morał bajki dotyczy, rzecz jasna, funkcjonowania samospełniających się proroctw w przebiegu karier (nie tylko naukowych). Domniemanie docenta Kaszanki o przewadze asystenta Kluska nad asystentem Zacierkiem mogło być jedynie fałszywą definicją sytuacji. Domniemanie to prowokowało jednak wystąpienie zdarzeń, które sprawiły, że fałszywa wyjściowo definicja sytuacji stała się (na końcu) prawdziwa. Można domyślać się następującego przebiegu zdarzeń: nie stosując żadnej świadomej dyskryminacji, docent Kaszanka miał jednak naturalną skłonność pokazywania na zewnątrz raczej tego z dwóch asystentów, którego cenił wyżej. Toteż gdy pojawiały się okazje, że mógł zabrać tylko jednego z asystentów na ważne naukowe imprezy (przede wszystkim zagraniczne), bywał to raczej asystent Klusek niż Zacierek. Gdy pojawiła się możliwość wyjazdu na staż do dobrego amerykańskiego uniwersytetu (Harvarda), to również wytypowany został asystent Klusek. Zresztą także aktywność asystenta Kluska w organizacji czerwonego kolczyka stwarzała mu dodatkowe możliwości kontaktu z dobrymi ośrodkami naukowymi za granicą - panowała tam bowiem moda, a co najmniej zainteresowanie tą egzotyczną ideologią. Tymczasem asystent Zacierek miał niewiele kontaktów ze światem zewnętrznym i ze światową nauką, nie miał dostępu do podstawowych czasopism w swojej dziedzinie, nie orientował się w najnowszych trendach (tj. modach), a o dostępie do mikroskopu elektronowego nie miał nawet co marzyć. W efekcie przegrał w konkurencji z Klu-skiem.
Uwaga dydaktyczna: bajka nie musi być odczytywana (przez młodych ludzi pragnących zrobić karierę) w ten sposób, że po to, by zrobić karierę, należy koniecznie "szanować starszych", zachowywać się konformistycznie i uznawać właściwą ideologię. Uczy raczej tego, że koniecznie trzeba wiedzieć, iż przebieg kariery nie jest niewrażliwy na działanie mechanizmu samospełniających się proroctw i że nie należy go lekceważyć. Chcąc zachować niezależność, trzeba być przygotowanym na większy własny wkład i wysiłek, tak by zrównoważyły one "naturalne" przewagi bardziej konformistycz-nych konkurentów.
l;; ..1-tB'ffl
Dodatek dla studentów:
skale i techniki skalowania
Rozdział niniejszy ma inny charakter niż wszystkie pozostałe. Zawiera on opis rozmaitych technik "pozyskiwania" ocen od ludzi (konsumentów, wyborców czy ekspertów). Oceny te mogą dotyczyć najrozmaitszych spraw. W badaniach konsumenckich, w badaniach opinii publicznej, we wszelkiego rodzaju konkursach itp. oceniana jest zwykle ogólna atrakcyjność określonych obiektów (produktów, usług, kandydatów, polityków). Innymi słowy, chodzi o upodobania (czyli preferencje) ludzi względem pewnego zespołu obiektów. Zarówno w badaniach konsumenckich, jak i społecznych jesteśmy też często zainteresowani nie tylko globalną oceną atrakcyjności różnych obiektów, lecz także ich oceną ze względu na jakieś pojedyncze cechy. Chcemy na przykład wiedzieć, jak konsumenci oceniają różne kształty robotów kuchennych albo kolory samochodów. Możemy też chcieć dowiedzieć się, jak wyborcy oceniają wiarygodność kandydatów na prezydenta itp. Wreszcie nierzadko przedmiotem oceny są szansę - kiedy chcemy ustalać oceny prawdopodobieństwa przypisywane przez ludzi rozmaitym zdarzeniom: przewidywanej pogodzie, koniunkturze gospodarczej, zwycięstwu kandydata w wyborach.
Istnieje wiele technik skalowania, przy pomocy których można "pozyskiwać" różne oceny. Zostaną tu one krótko opisane.
14.1. Skale rangowe
Prosi się tu osobę oceniającą o uporządkowanie pewnej grupy obiektów (np. produktów, wytworów, osób, zdarzeń) według zadanego kryterium: np. atrakcyjności czy podobania się, doskonałości, stopnia przekonania co do prawdziwości pewnego zdarzenia. Osoba oceniająca ma po prostu przypi-
DODATEK DLA STUDENTÓW: SKALE l TECHNIKI SKALOWANIA
sać liczby tym obiektom w taki sposób, by wyrażały one kolejność, według której dana cecha jest nasilona w różnych tych obiektach (atrakcyjność produktów, intensywności światła, stopień przekonania o prawdziwości zdarzenia).
Na przykład upodobania autora wobec różnych owoców dobrze oddaje następujące ich uporządkowanie od najmniej do najbardziej atrakcyjnego:
l - awokado,
2-jabłka,
3 - morele,
4 - pomarańcze, 5-śliwki, 6 - grapefruity, 7- banany,
8 - gruszki,
9 - brzoskwinie,
10- winogrona.
Kiedy zamiast owoców wprowadzimy listę kandydatów na prezydenta, to są to równie dobre obiekty do uporządkowania od najgorszego do najlepszego (naturalnie zdaniem oceniającego). Kiedy eksperci oceniają pianistów w konkursie, także mogą to robić na skali rangowej.
Główna trudność związana z ocenianiem tego typu wiąże się z koniecznością porównywania wielu obiektów jednocześnie. Istotnie, oceniający musi pamiętać wiele obiektów naraz i dokonywać wyborów, który z nich jest najlepszy, który jest drugi i tak dalej. Łatwo się w tym pogubić, zwłaszcza wtedy, gdy owych obiektów jest dużo. Żeby to zadanie ułatwić, zwykle ogranicza się liczbę rangowanych obiektów do kilku, najwyżej kilkunastu. Innym stosowanym ułatwieniem jest wprowadzenie procedury dwustopniowej: prosi się, aby najpierw osoba podzieliła obiekty na trzy klasy: dwie skrajne i środkową (np. produkty najbardziej atrakcyjne, średnio atrakcyjne i najmniej atrakcyjne albo prace najlepsze, średnie i najgorsze itp.). Następnie prosi się o dokonanie urangowania obiektów odrębnie w każdej klasie. Można je później złożyć w jedno uporządkowanie.
Przykład oceny ryzyka dla różnych aktywności rekreacyjnych:
mało ryzykowne
bieganie
jazda na rowerze
pływanie
średnio ryzykowne ^
jazda na nartach
skoki do wody
nurkowanie
bardziej ryzykowne
skoki na linie (bungeejump) wspinaczka górska latanie na lotni
14.2. Porównywanie parami
Łatwiejszym od rangowania obiektów wymaganiem jest porównywanie obiektów w parach. Prezentuje się tu osobie po dwa obiekty (parami) i prosi się o wskazanie za każdym razem obiektu lepszego. Pierwszeństwo jest określone jak w przypadku poprzednim w postaci wyraźnego kryterium: np. atrakcyjności, podobania się, doskonałości, stopnia przekonania co do prawdziwości pewnego zdarzenia itd. Jest to zadanie niewątpliwie łatwiejsze od rangowania: wymaga skoncentrowania się na dwóch tylko obiektach, a nie na wielu naraz. Kłopot, jaki tu się jednak pojawia, wiąże się ze znaczną na ogół liczbą potrzebnych porównań. Przy n obiektach jest ich: n x (n-1) / 2. Zauważmy, że liczba ta bardzo szybko rośnie wraz ze wzrostem liczby obiektów. Np. dla pięciu obiektów jest ich 5x4/2= 10, dla dziesięciu obiektów porównań jest 10 x 9 / 2 = 45, a dla dwudziestu obiektów porównań jest 20 x 19/2 = 190!
Poza samą liczbą porównań pojawia się tu też bardziej teoretyczny problem, co zrobić, jeżeli porównania są niekonsekwentne. Na przykład porównując czyjeś preferencje dla trzech krawatów oczekiwalibyśmy, że jeżeli osoba ta przedkłada krawat A nad krawat B, a krawat B nad krawat C, to w zestawieniu A i C będzie przedkładała A nad C. Co jednak zrobić, gdy tak nie będzie, gdy osoba powie, że w zestawieniu A i C woli C niż A? Są tu dwa możliwe i całkowicie różne wyjścia. Jedno wyjście opiera się na założeniu, że taki brak logiki w porównywaniu oznacza po prostu, że oceniający się pogubił. Należy przeto zwrócić mu uwagę na powstałą niekonsekwencję w ocenach i grzecznie poprosić o zrewidowanie ocen, tak by były konsekwentne (w wypadku większej liczby porównywanych obiektów takich rewizji może być wiele).
Diametralnie inne podejście do braku konsekwencji w porównaniach przyjął Thurstone. Przyjął on mianowicie, że skoro oceniający popełnia niekonsekwencje w porównaniach, to pewnie nie wie do końca, co ocenia wyżej, a co niżej. Łatwo zresztą możemy się przekonać o tym, że w pewnych wypadkach jesteśmy rzeczywiście całkiem niepewni swoich ocen. Oto stoimy przed skrzynią z melonami i mamy sobie wybrać jeden z nich. W pewnej chwili decydujemy się na któryś (wydaje się on najatrakcyjniejszy), za chwilę odkładamy go jednak i inny melon wydaje się nam bardziej atrakcyjny, ale znowu wra-
UUDATEK DLA S l UUtn) i uvv: oi\m-t: i i C^I-IIMIIM oi\Mi-'^vvMiMirt
camy do pierwszego itd. Można w tej sytuacji postawić pytanie, czy w ogóle wiemy, co wolimy? Thurstone wpadł na pomysł, że wahanie, niezdecydowanie i związaną z tym niekonsekwencję w ocenianiu można wykorzystać jako technikę pomiaru samych preferencji.
Nie wchodząc w skompikowane rozumowania Thurstone'a, jego podstawowa idea wyraża się w tym, żeby wykorzystać częstość, z jaką osoba (lub osoby) ujawnia preferencję (wybór) jednego z dwu porównywanych bodźców. Częstości te zdaniem Thurstone'a wyrażają różnicę w ocenianiu przez osobę owych dwóch bodźców: jeżeli konsument wyraźnie woli winogrona od jabłek, to przy każdym porównaniu tych dwu owoców będzie wybierał jabłka, ale jeżeli winogrona tylko trochę woli od bananów, to od czasu do czasu, mając do wyboru między tymi dwoma owocami, wybierze banany (choć częściej będzie wybierał winogrona). Thurstone zaproponował w związku z tym, aby przyjąć, że częstość, z jaką osoba wybiera bodziec x w stosunku do drugiego bodźca, y - oznaczmy tę częstość przez p(x, y) - wyraża różnicę w ocenie bodźca x i bodźca y:
p(x, y) = o(x) - o(y).
Jeżeli tak, to mając porównania osoby (niekonsekwentne!) dla różnych par bodźców, możemy sformułować wiele takich równań jak powyższe (dokładnie: n(n-l)/2 równań) i rozwiązując je w zwykły sposób, odkryć kryjące się za nimi oceny osoby.
Zilustrujmy taki pomiar na preferencjach klienta wobec owoców. Przyjmijmy na przykład, że pewien sprzedawca owoców zarejestrował u swojego (stałego) klienta pokazane w poniższej tabeli częstości, z jakimi klient dokonywał wyborów w obrębie poszczególnych par owoców: jabłek, pomarańczy, bananów i winogron. Porównania w wypełnionych rubrykach tabeli odnoszą się zawsze do owoców wypisanych w danej kolumnie z owocami w danym wierszu.
Tabela 13.1.
Częstości, z jakimi klient dokonywał wyborów w obrębie poszczególnych par owoców.
winogrona
banany
pomarańcze
jabtka
winogrona
banany
0,6
pomarańcze
0,9
0,5
jabłka
1,0
0,8
0,5
SS(r)%^" " "^•S^&SSiSW^SffjSf^wSSiWWmtW^^SY^
L_ l ^l_ł-u 1\1 \^/^Ł_l^l/-\l^lrt
r<^uc:JiviuwAIMIA DECYZJI
Jak możemy zamienić te częstości na wartości skalowe preferencji klienta wobec owoców?
Najpierw zupełnie swobodnie przyjmujemy dwie wartości na skali atrakcyjności owoców dla rozważanego klienta: wyznaczą one początek skali i jednostkę pomiaru. Warto, aby były to wartości przypisane dwóm skrajnym owocom - najmniej i najbardziej lubianemu owocowi (w przypadku klienta rozpatrywanego w tabelce będą to jabłka i winogrona). Dobrze byłoby, żeby przyjęte wartości były "okrągłe" - załóżmy O dla jabłek i l dla winogron. Jakie wartości, zgodnie z procedurą Thurstone'a, powinniśmy przyjąć dla dwóch pozostałych owoców?
Banany: z porównania częstości wybierania winogron i bananów otrzymaliśmy równanie: o(w) - o(b) = 0,6.
Podstawiamy przyjętą wartość o(w) = l i otrzymujemy: o(b) = l - O 6-o(b) = 0,4.
Jednakże ocenę bananów możemy także otrzymać z porównania częstości wybierania bananów i jabłek - mamy wówczas równanie: o(b) - o(j) = 0,9.
Podstawiamy przyjętą wartość o(j) = O i otrzymujemy: o(b) -0=09-o(b) = 0,9.
Otrzymaliśmy w ten sposób dwie różne wartości dla oceny atrakcyjności bananów. Możemy je zgodnie z sugestią Thurstone'a uśrednić i otrzymujemy ocenę: o(b) = (0,4+ 0,9) / 2 = 0,65.
Wartość dla pomarańczy: z porównania częstości wybierania winogron i pomarańczy otrzymaliśmy równanie: o(w) - o(p) = 0,9
Podstawiamy przyjętą wartość o(w) = l i otrzymujemy: o(p) = l - 0,9-o(p) = 0,1
Z porównania częstości wybierania pomarańczy i jabłek mamy inne równanie: o(p) - o(j) = 0,5.
Podstawiamy przyjętą wartość o(j) = O i otrzymujemy: o(p) - O == O 5-o(p) = 0,5.
Teraz uśredniamy te dwie wartości i otrzymujemy: o(b) = (0,1+ 0,5)/2 = 0,30.
I w ten sposób dochodzimy do pewnej skali oceny czterech owoców dla rozważanego (niekonsekwentnego) konsumenta. Przemnożywszy uzyskane wartości przez 10 (dla jasności obrazu) otrzymujemy:
O -jabłka,
3 - pomarańcze,
6,5-banany,
10 -winogrona.
Jest w tym wprawdzie pewna nieścisłość (zaraz ją pokażemy), ale podstawowa idea jest już jasna (autor ma taką nadzieję!). Na czym polega nieścisłość? Na tym, że w porównaniach nie wzięliśmy pod uwagę jeszcze jednej wielkości: porównania częstości wyboru w parze banany-pomarańcze.
l
DODATEK DLA STUDENTÓW: SKALE l TECHNIKI SKALOWANIA
Sprawdźmy, czy posługując się tym porównaniem, otrzymalibyśmy wynik zgodny z powyższym.
Z porównania winogron i bananów otrzymaliśmy: o(b) = 0,4.
Z porównania bananów i pomarańczy mamy równanie: o(b) - o(p) = 0,5;
a stąd: o(b) = 0,5 + 0,3 = 0,8.
Teraz uśredniamy te dwie wartości i otrzymujemy: o(b) = (0,4 + 0,8) / 2 = 0,6,
Ocena banana z tego porównania wychodzi więc trochę niższa niż powyżej. Sprawdźmy jeszcze ocenę pomarańczy w porównaniu ich z bananami.
Z porównania pomarańczy i jabłek otrzymaliśmy: o(p2) = 0,5.
Z porównania bananów i pomarańczy mamy równanie: o(b) - o(pl) = 0,5:
a stąd: o(pl) = 0,65 - 0,5 = 0,15.
Teraz uśredniamy te dwie wartości i otrzymujemy: o(p) = (0,5+ 0,15) / 2 = 0,325.
Tak więc ocena pomarańczy z tego porównania wychodzi trochę niższe niż powyżej. Starając się o większą dokładność, powinniśmy uzgodnić te niezgodne wartości. Na szczęście istnieje znana procedura statystyczna, zwane metodą najmniejszych kwadratów, która bez żadnego trudu z naszej strona dokonuje dopasowania wartości ocen dla dowolnego zestawu bodźców, die których znamy częstości z porównań parami.
Oto przykład badania opisanego przez Coombsa, Dawesa i Tversky'egc (1977), w którym badano opinie ludzi na temat różnych przestępstw. Badań:
otrzymywali listę złożoną z par przestępstw - np. parę oszustwo-morder-stwo - i mieli wskazać, które przestępstwo w parze oceniają jako cięższe Przedstawiono im 171 par przestępstw (wszystkie możliwe kombinacje dwójkowe 19 przestępstw).
W rezultacie przeprowadzonego badania uzyskano tabelę częstości, z jakimi badani dokonywali wyborów w obrębie poszczególnych par. Różniła si^ ona od przedstawionej wyżej tabeli porównań par owoców tym, że tu wybór} pochodziły nie od jednej osoby, lecz od grupy badanych osób. Oznacza to, że uzyskane wyniki będą charakteryzowały przeciętne oceny jakiejś grupy ludzi (badanymi byli w tym przypadku studenci jednego z amerykańskich uniwersytetów), a nie pojedynczej osoby.
Przypisując arbitralnie dwie skrajne wartości O i 100 odpowiednio: najła-godniej ocenianemu przestępstwu (włóczęgostwo) i naj surowiej ocenianemi. przestępstwu (zabójstwo), udało się stworzyć skalę dla listy 19 badanycł-przestępstw.
Oceny dotyczące powagi porównywanych 19 przestępstw przedstawia rys 14.1. Jak wynika z zaznaczonych punktów, za najpoważniejsze z przestępstw uznano zabójstwo, dalej, że przestępstwa polegające na naruszeniu niety kalności osobistej ocenia się jako stosunkowo poważne, przestępstwa prze ciw własności - jako stosunkowo mniej poważne itd.
•'L-'-/ l f-\Jl
•BH^iaS^SBgii^s
100
1. Przerywanie ciąży
2. Cudzołóstwo
3. Podpalenie
4. Napad z pobiciem
5. Przemyt i nielegalna
sprzedaż alkoholu 6. Włamanie
11 15
14. Krzywoprzysięstwo
15. Zgwałcenie
16. Paserstwo
17. Uwiedzenie
18. Przemyt
19. Włóczęgostwo
10
^ -
9 5
16
13 9
1714 2
6
<«
4
18
7 12 8
1
3
7. Fałszerstwo pieniędzy
8. Defraudacja
9. Podrabianie dokumentów
10. Zabójstwo
11. Uprowadzenie (kidnaping)
12. Kradzież
13. Oszczerstwo
Rys. 14.1.
Skala ocen surowości 19 przestępstw.
14.3. Skale ocen
Jest to bodaj najpowszechniej stosowana technika skalowania. Zadaje się tu osobie pewną skalę liczbową - np. skalę pięciostopniową - i prosi, by dla każdego ocenianego obiektu wybrała jedną z wartości tej skali. Dobrze znanym przykładem tego rodzaju skali i skalowania jest ocenianie szkolne. Mamy w nim do czynienia z pięciostopniową skalą ocen (choć stosowane są i skale o znacznie większej liczbie stopni - np. we Francji używa się aż dwudziestu
stopni) i zadanie nauczyciela polega na przypisaniu jednej z tych wartości każdej z ocenianych prac.
Charakterystyczny dla tego typu oceniania jest jego raczej absolutny niż porównawczy charakter. Ocenia się nie tak, jak przy rangowaniu albo porównywaniu parami przewagę jednego obiektu wobec drugiego czy wobec innych, ale "przymierzając" kolejne obiekty do pewnego określonego standardu. Oznacza to przede wszystkim, że wszystkie oceniane obiekty mogą
otrzymać albo wysokie (np. finaliści zawodów łyżwiarskich), albo niskie oceny (np. prace klasowe słabej klasy szkolnej).
Ważnym wymaganiem przy tym ocenianiu jest precyzyjne określenie poszczególnych punktów skali. Punkty te mogą być opisane jako liczby albo jako kategorie opisowe (np. ocena bardzo dobra, dobra, dostateczna, niedostateczna), ale w każdym wypadku powinno być dokładnie wyjaśnione znaczenie owych punktów.
Przykład skali do oceny ryzyka. Oto możliwe sformułowanie skali do oceny ryzykowności podanej listy działań:
DODATEK DLA STUDENTÓW: SKALE l TECHNIKI SKALOWANIA
jazda na rowerze
wspinaczka górska
latanie samolotem
używanie antybiotyków
używanie nawozów sztucznych
praca w zakładzie petrochemicznym
praca w kopalni
palenie papierosów
używanie napojów alkoholowych
używanie narkotyków
Instrukcja powinna wyjaśniać, że l na tej skali oznacza ocenę, że dane działanie zawiera minimalne lub zgoła żadne ryzyko, 2 - oznacza ocenę że działanie zawiera niewielkie ryzyko, 3 - oznacza ocenę, że działanit zawiera średnie ryzyko, 4 - oznacza ocenę, że działanie zawiera znaczne ale nie najwyższe ryzyko, 5 - oznacza ocenę, że działanie zawiera najwyż sze ryzyko. Po wyjaśnieniu oznaczeń skali prosi się o ocenę ryzykownośc poszczególnych działań na tej skali.
Przykład skali do oceny atrakcyjności napojów. Oto możliwe sformulowa nie skali do oceny atrakcyjności rozmaitych napojów:
coca-cola 1-2-3-4-i.
pepsi-cola l 1-2-3-4-i
7-up 1-2-3-4-i
sprite 1-2-3-4-i.
woda mineralna 1-2-3-4-i
Instrukcja powinna wyjaśniać, że l na tej skali oznacza całkowiti nieatrakcyjność napoju (oczywiście dla oceniającej osoby), 2 - hardzi niewielką atrakcyjność, 3 - niewielką atrakcyjność, 4 - średnią (umiar kowaną) atrakcyjność, 5 - znaczną (więcej niż średnią) atrakcyjność 6 - dużą atrakcyjność, 7 - wybitną atrakcyjność. Po wyjaśnieniu ozna czeń skali prosi się o ocenę atrakcyjności poszczególnych napojów na tę skali.
I jeszcze j eden przy kład - oceny prawdopodobieństwa przypisywanej róż maitym zdarzeniom:
poprawa koniunktury gospodarczej w przyszłym roku
wygranie dużej sumy w toto-lotka
przyszłoroczna inflacja powyżej 10%
zapłacenie mandatu przy przechodzeniu przez jezdnię na czerwonym świetle
wzrost ceny zakupionych akcji na następnej sesji
uzyskanie orla przy rzucie monetą
wygranie przez kobietę następnych wyborów prezydenckich
<ił-i i i wL^i-uivi^vv/-\l'JIM UtUY^-wl
^iiaissaEiias^Bs^s^iaisKaasBBiaai^saaasaasa^i^^^a^iasiai^Bsas^^iSBB^^
Instrukcja powinna wyjaśniać, że l na tej skali oznacza ocenę, że zdarzenie jest całkowicie niemożliwe, 2 - oznacza ocenę, że zdarzenie jest bardzo mało prawdopodobne, 3 - oznacza ocenę, że zdarzenie jest mało prawdopodobne, 4 - oznacza ocenę, że zdarzenie jest średnio prawdopodobne (jest tyle samo szans za, co i przeciw), 5 - oznacza ocenę, że zdarzenie jest raczej prawdopodobne (więcej niż średnio), 6 - oznacza ocenę, że zdarzenie jest bardzo prawdopodobne, 7 - oznacza ocenę, że zdarzenie jest całkowicie pewne. Po wyjaśnieniu oznaczeń skali prosi się o ocenę prawdopodobieństwa poszczególnych zdarzeń na tej skali.
14.4. Skalowanie bez liczb
Zdarza się, że chcemy mieć skalę ocen z dużą liczbą kategorii. Chcemy na przykład ustalać oceny prawdopodobieństwa przypisywane przez ludzi rozmaitym zdarzeniom z dokładnością do jednej setnej na skali od O (zdarzenie całkowicie niemożliwe) do l (zdarzenie całkowicie pewne). Albo załóżmy, że ktoś formułuje jakieś przewidywania: meteorolog twierdzi, że jutro będzie padało, lekarz sądzi, że wobec pacjenta zadziała dana terapia, i chcielibyśmy ustalić, jaka pewność towarzyszy każdemu z tych twierdzeń. W takich przypadkach oceniający mogą odczuwać dyskomfort w posługiwaniu się precyzyjną skalą liczbową. Zamiast posługiwać się liczbami, możemy jednak poprosić ich, by zaznaczyli swoją ocenę pewności na odcinku niezawierającym żadnych kategorii ani liczb, a tylko opis krańców skali. Można poprosić o ocenę pewności wygłaszanego sądu na poniższym odcinku, którego lewy kraniec oznacza całkowitą niepewność wygłaszanego sądu, a kraniec prawy całkowitą pewność.
całkowicie niepewny
x
całkowicie pewny
Oceny zaznaczane na takim odcinku łatwo przełożyć na liczby, przypisując krańcom odcinka wybrane wielkości - np. O i l albo l i 100 -
i odczytując wielkości zaznaczane przez badanych na tak określonej skali.
A oto przykład, jak moglibyśmy zastosować ten typ skalowania wobec wypowiedzi na temat zależności ekonomicznych (prezentowaliśmy je z wykorzystaniem skali ocen w rozdziale 2.).
Proszę zaznaczyć na poniższej skali swoją ocenę, w jakim stopniu uważa Pan(i) za interesujące każde z poniższych stwierdzeń.
DODATEK DLA STUDENTÓW: HKALh l l tUMNiM S>\ALUVVAIMIA
x-
całkowicie
nieinteresujące
bardzo interesujące
Wysokie zasiłki dla bezrobotnych prowadzą nieuchronnie do nakładania wyższych podatków na obywateli;
Wysokie podatki od dochodów zachęcają ludzi do podejmowania pracy "na czarno";
Wysoka inflacja zniechęca ludzi od oszczędzania;
Wysokie zasiłki dla bezrobotnych zniechęcają ludzi do poszukiwania pracy;
Wysoka progresja podatkowa prowadzi do spadku produkcji;
Odpłatność za nauczanie sprawia, że studenci pilniej się uczą;
Wysokie podatki od dochodów przyczyniają się do zmniejszenia tempa wzrostu realnych dochodów obywateli.
14.5. Bezpośrednia ocena wielkości
Stevens (1957) wykazał, że ludzie potrafią dokonywać dobrych bezpośrednich ocen stosunku między bodźcami. Podaje się tu osobie pewien wyjściowy obiekt, któremu przypisuje się arbitralnie pewną wartość (np. 10). Można tak określić atrakcyjność pewnego produktu albo stopień przekonania co do prawdziwości pewnego zdarzenia, albo pewne natężenie jasności bodźca wzrokowego. Ów wyjściowy bodziec stanowi punkt odniesienia oceniającego, który dostaje następnie kolejne inne obiekty (różne produkty, różne zdarzenia, różne intensywności światła itd.) i za każdym razem ma im przypisać liczbę w relacji do wartości przyjętej dla bodźca wyjściowego. Jeżeli na przykład jakiś kolejny bodziec odczuwa jako dwa razy bardziej intensywny (atrakcyjniejszy itd.) niż bodziec wyjściowy, powinien mu przypisać wartość 20 itd.
Można na przykład określić atrakcyjność gruszki na 10 i poprosić, by osoba przypisała innym owocom liczby w relacji do tej wartości. Możemy natknąć się tu na kłopot tego rodzaju, że oceny mogą być wewnętrznie niezgodne. Ktoś będzie określał stosunek atrakcyjności jabłka i gruszki jak 3/10, pomarańczy i gruszki jak 6/10, a jabłka i pomarańczy jak 1/3 zamiast 1/2, jak by to wynikało z dwóch pierwszych porównań. W takim wypadku zwraca się oceniającym uwagę na powstałe niekonsekwencje w ocenach i prosi ich o dokonanie rewizji.
Przykład. Przyjmijmy, że rozważamy zakup samochodu i stoimy przed wyborem jednego z kilku samochodów, które różnią się ze względu na wielf
r5YUI-lULU>-aHJZ.I\t ^Ut.Ah'K.1 UL-tlMIANIA l h'UUtJMUWANlA DECYZJI
ważnych dla nas cech: cenę, trwałość, ekonomiczność, komfort, bezpieczeństwo i dostępność usług. Na nieszczęście, żaden z samochodów nie jest najlepszy ze względu na wszystkie cechy naraz. Jeden ma przewagę komfortu jazdy, ale jest drogi, inny jest ekonomiczny, ale nie jest bezpieczny, itd. W tej sytuacji zdecydowaliśmy się na ocenienie względnej ważności (dla siebie) różnych tych cech. Możemy cechy te najpierw uszeregować tak, jak nakazuje skala rang. Następnie możemy spróbować określić liczbowo stosunek (proporcję) ważności poszczególnych cech.
Załóżmy, że ktoś tak oto urangował ważność poszczególnych cech - od najmniej do najbardziej ważnej:
(1) dostępność usług,
(2) komfort,
(3) bezpieczeństwo,
(4) trwałość,
(5) ekonomiczność,
(6) cena.
Porównując następnie stosunek ważności "ekonomiczność / cena", potencjalny klient dochodzi do wniosku, że dobrze wyrażają go liczby 8:10. W wypadku stosunku ważności "trwałość / cena" dochodzi do wniosku, że dobrze wyrażają go liczby 7:10. W wypadku stosunku ważności "bezpieczeństwo / cena" dochodzi do wniosku, że dobrze wyrażają go liczby 6:10. Gdy mowa o stosunku ważności "komfort / cena", dochodzi do wniosku, że dobrze wyrażają go liczby 3:10. Natomiast w wypadku stosunku ważności "dostępność usług / cena" dochodzi do wniosku, że dobrze wyrażają go liczby 2:10.
Oceny takie sugerowałyby następujące wagi dla poszczególnych cech:
(2) dostępność usług,
(3) komfort,
(6) bezpieczeństwo,
(7) trwałość,
(8) ekonomiczność,
(10) cena.
Oceniający może jednak stwierdzić po dłuższym namyśle, że stosunek ważności "komfort / ekonomiczność", który w takim układzie wyrażają liczby 3:8, nie odpowiada jego ocenom i że lepiej wyrażałby to stosunek 1:2 lub, co na to samo wychodzi, stosunek 4:8. Może wobec tego jeszcze raz zastanowić się, czy stosunek ważności "komfort / cena" powinien być rzeczywiście wyrażony liczbami 3:10, czy może 4:10.
Gdyby tak było, to narzucałby się następujący układ wag:
(2) dostępność usług,
(4) komfort,
(6) bezpieczeństwo,
DODATEK DLA STUDEN l UW: SaKALt l l tUMlMiM &KALUWANIA
(7) trwałość,
(8) ekonomiczność,
(10) cena.
Jeżeli ciągle jakieś porównania byłyby nieodpowiednie, trzeba by dokonywać dalszych korekt aż do stanu, gdy oceniający będzie zadowolony ze wszystkich porównań.
Odmianą bezpośredniego oceniania wielkości jest proporcjonalne dzielenie stałej wielkości. Mamy na przykład pięciu kandydatów na prezydenta i chcemy ustalić, jakie szansę zwycięstwa przypisują im różni ludzie (np. zwolennicy, przeciwnicy, młodzi, starsi). Proporcjonalne dzielenie stałej wielkości polega na tym, że określa się pewną wielkość - np. 100 punktów - i prosi się o rozdzielenie ich między kandydatów w takiej proporcji, by przypisane kandydatom części odpowiadały ocenianym szansom ich zwycięstwa. Odpowiednia instrukcja może wyglądać następująco:
Proszę przydzielić każdemu z kandydatów taką część 100 punktów, która odpowiada jego szansom wygrania wyborów. Proszę sprawdzić, czy przypisane kandydatom punkty sumują się do stu (jeżeli nie, to proszę odpowiednio skorygować przydzielane punkty).
KANDYDAT A ........
KANDYDAT B ........
KANDYDAT C ........
KANDYDAT D ........
KANDYDAT E ........
SUMA PUNKTÓW 100
Oczywiście w ten sam sposób można oceniać także inne wielkości, na przykład atrakcyjność owoców. Swoje sto punktów rozpisałbym między dziesięć owoców w sposób następujący:
awokado l
jabłka 2
morele 4
6
pomarańcze śliwki
7
grapefruity
banany
gruszki
brzoskwinie
winogrona
SUMA
10
12
13 20 25 100
•Na tym ostatnim przykładzie można się przekonać, jak ocenianie według tej skali staje się kłopotliwe w miarę zwiększania się liczby ocenianych obiektów.
Bibliografia
AINSLIE, G. (1975). Specious reward; A behavioral theory ofimpulsiveness and impul-
se control. Psychological Bulletin, 82, 463-495. ALBA, J. W., MARMMORSTEIN, H. (1987). The effects of frequency knowledge
on consumer decision making. Journal of Consumer Research, 14, 14-25. ALLPORT, G. W. (1954). The Naturę ofPrejudice. Reading, Mass.: Addison-Wesley. ARKES, H. R., WORTMANN, R. C., SAYILLE, P. D., HARKNESS, A. R. (1981).
Hindsight bias among physicians weighting the likelihood ofdiagnosis. Journal ofAp-
plied Psychology, 66, 252-254.
ARONSON, E. (1995). Człowiek istota społeczna. Warszawa: PWN. ASCH, S. (1951). Effects ofgroup pressure upon the modification and distortion ofjudg-
ment. [w:] M. H. Guetzkow (red.), Groups, Leadership, And Men. Camagie, Pitts-
burgh,s. 117-190. ASCH, S. Studies of independence and conformity: A minońty ofone against a unani-
mous majority, Psychological Monographs, 70, P, 416. BAR-HILLEL, M. (1973). On the subjective probability ofcompound events. Organiza-
tional Behavior and Human Performance, 9, 396-406. BATES, J. M., GABOR, A. (1986). Price perception creeping inflation. Report on an
inquiry. Journal ofEconomic Psychology, 7, 291-314. BAZERMAN, M. H. (1983). Negotiator judgment: A critical look at the rationality as-
sumption. American Behavioral Scientist, 27, 211-228. BAZERMAN, M. H. (1994). Judgment In Managerial Decision Making. New York:
John Wiley & Sons, Inc. BICKART, B. (1992). Ouestion - order effects and brand evaluations: The moderating
role of consumer knowledge. [w:] Schwarz, N., Sudman S. (red.), Context Effects In
Survey And Psychological Research New York: Springer, s. 63-80. BOCHEŃSKI, J. (1992). Sto zabobonów. Kraków: PHILED. BODENHAUSEN, G., WYER, R. (1985). Effects of stereotypes on decision making
and information-processing strategies. Journal of Personality and Social Psychology, 48, 267-282. BREHM, J. (1956). Postdecision changes in the desirability of altematives. Journal of
Abnormal and Social Psychology, 52, 384-389. BREHM, J. (1959). Increasing cogmtive dissonance by a fait-accompli. Journal of Abnormal and Social Psychology, 58, 379-382.
-r\i ^^cilirtiNiM i ruutJMUWANIA DECYZJI
BROPHY, J. E. (1983). Research on the self-fulfilling prophecy and teacher expecta-
tions. Joumal of Educational Psychology, 75, 631-661. BRUNNER, J. S, POTTER, M. C. (1964). Interference in visual recognition. Science,
144, 424^25.
CARROLL, J. S. (1978). The effect ofimagining an event on expectations for the event:
Ań interpretation in terms ofthe availability heuristic. Joumal of Experimental So-cial Psychology, 14, 88-96.
CHAPMAN, L., CHAPMAN, J. P. (1969). Illusory correlation as an obstade to the use ofvalid psychodiagnostic signs. Journal of Abnormal Psychology, 74, 271-280.
CHERRINGTON, D. J., REITZ, H. J., SCOTT, W. E. (1971). Effects ofcontingent and noncontingent reward on the relationship between satisfaction and task performance. Journal ofApplied Psychology, 55, 531-536.
CIALDINI, R. (1996). Wywieranie wpływu na ludzi. Teoria i praktyka. Gdańsk: Gdańskie Wydawnictwo Psychologiczne.
CLAYELL, J. (1993). Noble House. Warszawa: UNIV-COMP.
COREN, S., MILLER, J. (1974). Size contrast as a function offigural similarity. Percep-tion and Psychophysics, 16, 355-357.
COOMBS, C. H., DAWES, R. M., TYERSKY, A. (1977). Wprowadzenie do psychologu matematycznej. Warszawa; PWN.
COOPER, H. (1979). Pygmalon grows up: A model for teacher expectation communica-tion and performance influence. Review of Educational Research, 49, 389-410.
CZAPINSKI, J. (1993) Polski generalny sondaż dobrostanu psychicznego. Badaniapa-nelowe J 991 i 1992. Struktura danych i podstawowe statystyki. Warszawa-Olsztyn:
Polskie Towarzystwo Psychologiczne.
DAAMEN, D. D. L., DE BIE, S. E. (1992). Serial contexts in Survey interviews. [w:] Schwartz, N., and Sudman, S. (red.), Context Effects In Social And Psy chologi-cal Research. New York: Springer-Yerlag, s. 97-119.
DAWES, R. M. (1988). The robust beauty ofimproper linearmodels in decision making. [w:] Kahneman, D., Slovic, P, Tversky, A. (red.), Judgment Under Uncertainty: Heuristic An Biases. Cambridge: Cambridge University Press, s. 391-407.
DAWES, R. M., CORRIGAN, B. (1974). Linear models in decision making. Psycholo-gical Bulletin, 81, 95-106.
DAWES, R. M., FAUST, D., MEEHL, P. E. (1989).'Clinical versus actuarial judgment. Science, 243, 1668-1674.
DEIGHTON, J., GRAYSON, K. (1995). Marketing and seduction: Building exchange relationships by managing social consensus. Journal of Consumer Research 21 660-676.
DERENICZ, M. (1977). Japonia Nippon. Warszawa: Nasza Księgarnia. DION, K., BERSCHEID, E., WALSTER, E. (1972). What is beautiful is good. Joumal of Personality and Social Psychology, 24, 285-290.
BIBLIOGRAFIA
-. ^^^^•o^^y^a ^'sy^^^i-^y^f^s^wui
DOSTOJEWSKI, F. (1992) Notatki z Podziemia. Gracz. Londyn: Puls. EAGLY, A. H., ASHMORE, R. D., MAKHIJANI, M. G., LONGO, L. C. (1990). What
is beautiful is good, but...: A meta-analitic review ofresearch on the physical attracti-
veness stereotype. Psychollogical Bulletin, 110, 109-128. EINHORN, H. J., HOGARTH, R. M. (1978). Confidence in judgment: Persistence in
the illusion ofvalidity. Psychological Review, 85, 395^16. ELSTER, J. (1983). Sów Grapes. Studies In The Subversion OfRationality. Cambridge:
Cambridge University Press.
ELSTER, J. (1984). Ulysses And The Sirens. Cambridge: Cambridge University Press. FELDMAN, J. M. (1992). Constructive processes as a source of Context effects in survey
research: explorations in self-generated validity. [w:] Schwartz, N., Sudman, S. (red.),
Context Effects in Social and Psychological Research. New York: Springer-Verlag,
s.49-61. FERGUSON, E. S. (1987). Risk and the American engineering profession: The ASME
boiler code and Ameńcan industrial safety standards. [w:] Johnson, B. B., Covello,
V. T. (red.), The Social And Cultural Construction Of Risk. Dordrecht: Reidel,
s. 301-316. " FESTINGER, L. (1957). A Theory OfCognitive Dissonance. Evanston: Rów, Peter-
son. FESTINGER, L., CARSMITH, J. M. (1959). Cognitiye consequences offorced com-
pliance. Journal of Abnormal and Social Psychology, 58, 203-210. FISCHHOFF, B. (1975). Hindsight ^ foresight: The effect ofoutcome knowledge on
judgment under uncertainty. Journal of Experimental Psychology: Human Percep-
tion and Performance, l, 288-299. FITZSIMONS, G. J., MORWITZ, V. G. (1996). The effect ofmeasuring intent onbrand-
-level purchase behavior. Journal of Consumer Research, 23, 1-11. FORGAS, J. P, BOWER, G. H. (1987). Mood effects on person-perceptionjudgments.
Journal o f Personality and Social Psychology, 53, 53-60. FORGAS, J. P., MOYLAN, S. (1988). After the movies: Transient modę and social
judgments. Personality and Social Psychology Bulletin, 13, 467-477. FRENKEL, O. J., DOOB, A. (1976). Post-decision dissonance at the pooling booth.
Canadian Journal ofBehavioral Science, 8, 347-350. GILBERT, J. P., McPEEK, B., MOSTELLER, F. (1977). Statistics and ethics in surgery
and anesthesia. Science, 198, 684-689. GOLDBERG, R. L. (1959). The effectiveness ofciinician's judgments. The diagnosis of
organie brain damage from the Bender-Gestalt Test. Journal ofConsulting Psychology, 23,25-33. GOSZCZYŃSKA, M., TYSZKA, T., SLOVIC, P. (1991). Risk perception in Poland in
comparison with three other countries. Journal ofBehavioral Decision Making, 4, 179-193.
&«JW i-OTi^n^in^n-in^.t.iNC: rut-Mrr\l U^CI\IMIMIA l I^UUtJMUWANIA DECYZJI
•S- !!... >."(tm)*(!W»s»B»iSS>>- ./:•>.-"!: ,;,- •-.•-•••., .•. - » > .• •. .,••;,- ,....- . ",":.. ." ,"." . ,^,,
GRANBERG, D., BRENT, E. (1983). When prophecy bends: The preference-expecta-
tion link m U. S. presidential elections, 1952-1980. Joumal ofPersonality and So-
cial Psychology, 45,477-^91. GREENBERG, J., WILLIAMS, K. D., 0'BRIEN, M. K. (1986). Considering the har-
shest verdict first: Biasing effects on mock juror verdicts. Personality and Social
Psychology Bulletin, 12, 41-50. GROSS, E. J. (1964). The effect ofquestion sequence on measures ofbuying interest.
Journal ofAdvertising Research, 4, 40-41. HASTRORF, A. H., CANTRIL, H. (1954). They saw a gamę: A case study. Joumal of
Abnormal and Social Psychology, 49, 129-134. HENDRICKX, L., VLEK, C. (1991). Perceived control, naturę ofrisk information and
risk taking: an experimental test of a simple taxonomy of uncertainty. Journal of
Behayioral Decision Making.
HENDRICKX, L., VLEK, C., OPPEWAL, H. (1989). Relative importance ofscenario information and fi-equency information m thejudgment ofrisk. Acta Psychologica, 72,41-63. HOCH, S. J. (1988). Who do we know: Predicting the interest and opinions ofthe Ame-
rican consumer. Journal of Consumer Research, 5, 315-324. HONG, S. T., WYER, R. S. JR. (1990). Determinants ofproduct evaluation: effects of
the time interval between knowlidge ofa producfs country oforigin and information
about its specific attributes. Journal of Consumer Behavior, 70, 277-288. HOYER, W. D., BROWN, S. P. (1990). Effects ofbrand awareness on choice for a com-
mon, repeat-purchase product. Journal of Consumer Research, 17, 141-148. ISEN, A., SHALKER, T. E., CLARK, M., KARP, L. (1978). Affect, accessibility of
materiał in memory, and behavior: A cognitive loop? Joumal of Personality and
Social Psychology, 36, l, 1-12.
JANIS, I. L. (1982). Groupthing. Boston: Houghton Mifflin Company JANOFF-BULMAN, R., TIMKO C., CARLI L. L. (1985). Cognitive biases in blaming
thevictim. Journal of'Experimental Social Psychology, 21, 161-177. JENNINGS, D. L., AMABILE, T. M., ROSS, L. (1988). Informal covariation asses-
sment: Data-based versus theory-bases judgments. [w:] Daniel Kahneman, Pauł Slo-
vic, Amos Tversky (red.),Judgment Under Uncertainty: Heuristics and Biases. Cambridge University Press, s. 211-230. JUSSIM, L. (1986). Self-fulfilling prophecies: A theoretical and integrative review. Psy-
chological Review, 93, 429-445. KAHNEMAN, D., TVERSKY, A. (1972). Subjective probability: Ajudgment ofrepre-
sentativeness. Cognitive Psychology, 3, 430-454. KAHNEMAN, D., TVERSKY, A. (1973). On the psychology ofprediction. Psychologi-
cal Review, 80, 237-251.
KAPLAN,M. F. (1973). Stimulus inconsistency and response dispositions in fonning judg-ments ofother persons. Journal ofPersonality and Social Psychology, 25, 58-64.
BIBLIOGRAFIA
KATONA, G. (1963). Psychological Analysis of Economic Behavior. New York
McGraw-Hill.
KISIELEWSKI, S. (Kisiel) (1989). Lata pozłacane, lata szare. Kraków: Znak. KNOX, R., INKSTER, J. (1968). Post-decision dissonance at post time. Joumal ofPer
sonality and Social Psychology, 8, 319-323. KOCH, K. E. (1985). Pomiędzy wiarą a okultyzmem. Warszawa: Zjednoczony Kośció
Ewangeliczny. KOFTA, M., DOLIŃSKI, D. (1997). Rola formalnych cech przekazu w dynamice sądóv
społecznych: wpływ przerwy w komunikacie na przypisywanie odpowiedzialność
i na ocenę moralną bohatera, [w:] Tokarz, A., i Nęcka, E. (red.), Psychologia Po
znawcza w Polsce. Kolokwia Psychologiczne, 6, s. 123-140. Warszawa: Instytut Psy
chologii PAN. KORIAT, A., LICHTENSTEIN, S., FISCHHOFF, B. (1980). Reason for confidence
Journal of Experimental Psychology: Human Learning and Memory, 6, 107-118. LA FONTAINE, J. (1988). Bajki. Warszawa: Wydawnictwo Artystyczne i Filmowe. LANGER, E. (1988). The illusion of control. [w:] Kahneman, D., Slovic, P., Tversk)
A. (red.), Judgment Under Uncertainty: Heuristics Ań Biases. Cambridge: Cambrid
ge University Press, s. 231-239. LANGER, E., ABELSON, R. P. (1974). A patient by any other name...: Clinician grou]
difference in labeling bias. Joumal ofConsulting and Clinical Psychology, 42, 4-9 LASKY, J. J., HOVER, G. L., SMITH, P. A., BOSTIAN, D. W., DUFFENDACK, S. C.
NORD, C. L. (1959). Post-hospital adjustmentas predicted by psychiatrie patient
and by their staff. Journal of Consulting Psychology, 23, 213-218. LEA, S., TARPY, M. R., WEBLEY, P. (1987). The Indnidual in the Economy. A Surve
of Economic Psychology. Cambridge: Cambridge University Press. LEVIN, I. P, JOHNSON, R. D., RUSSO, C. P, DELDIN, P. J. (1985). Framing effect
in judgment tasks with varying amounts of information. Organizational Behavio
and Human Performance, 36, 362-377. LEWICKA, M. (1993). Aktor czy obserwator: Psychologiczne mechanizmy odchylę,
od racjonalności w myśleniu potocznym. Warszawa: Polskie Towarzystwo Psyche
logiczne.
LICHTENSTEIN, S., FISCHHOFF, B. (1977). Do those who know morę also IOK» morę about how much they know? Organizational Behavior and Human Perfor
mance, 20, 159-183. LICHTENSTEIN, S., FISCHHOFF, B., PHILLIPS, L. D. (1977). Calibration of próba
bilities: The state ofthe art. [w:] H. Jungermann, G. deZeeuw (red.), Decision Ma
king And Change In Human Affairs. Amsterdam: D. Reidel, s. 275-324. LICHTENSTEIN, S., SLOVIC, P, FISCHHOFF, B., LAYMAN, M" COMBS, B. (1978:
Judged frequency of lethal events. Joumal of Experimental Psychology: Huma
Learning and Memory, 4, 551-578.
L,^"1"'';1"'"1 r'UL'tJlvluwANIA DECYZJI
LORD, C. G., ROSS, L., LEPPER, M. R. (1979). Biases assimilation and attitude pola-
rization: The effects of prior theories on subsequently considered evidence. Journal
of Personalny and SocialPsychology, 37, 2098-2109. LOUDON, D. L., DELLA BITTA, A. J. (1993). Consumer Behavior. New York:
Mc Graw-Hill
LOYOLA, I., ŚW. (1996). Ćwiczenia duchowe. Kraków: WAM.
MACHIAVELLI, N. (1993). Książę. Warszawa: Alfa.
MARKOWSKA, W. (1968). Mity Greków i Rzymian. Warszawa: Iskry.
MATERSKA, M. (1992). Procesy ewaluacji. [w:] Materska, M., Tyszka, T., Psychologia i poznanie. Warszawa: PWN, s. 234-258.
MATERSKA, M. (1994). Z badań nad ocenianiem profesjonalnym, czyli jak mierzona jest niewymierna wartość szkolnych wypracowań? Warszawa: Wydawnictwo Instytutu Psychologii PAN.
MENCWEL, S. (1996). Giełda papierów wartościowych a pułapki psychologiczne i społeczne. Nie opublikowana praca magisterska, Wydział Psychologii UW, Warszawa.
MERTON, R. K. (1957). Soda! Theory And Social Structure. New York: Free Press of Glencoe.
MILLER, N., CAMPBELL, D. T. (1959). Recency and primacy in persuasion as a func-tion of the timing of speeches and measurements. Journal of Abnormal and Social Psychology, 59, 1-9.
MILLS, J. (1958). Changes in morał attitudes following temptation. Journal of Persona-lity, 26, 463-476.
MONTGOMERY, H. (1989). From cognition to action, the search for dominance in
decision making. [w:] H. Montgomery, O. Svenson (red.), Process and Structure in
Human Decision Making. Chichester: Wiley, s. 23-49. MONTGOMERY, H. (1983). Decision rules and the search for a dominance structure:
towards a process model of decision making. [w:] P. Humphreys, O. Svenson, A. Vari
(red.), Analyzing and Aiding Decision Processes. Amsterdam: North-Holland,
s.343-369.
MOSCOVICI, S., LAGĘ, E., NAFFRECHOUX, M. (1969). Influence of a consistent minority on the responses of a majority in a cołor perception task. Sociometry, 32, 365-380.
NAATANEN, R., SUMMALA, H. (1975). Road-user Behavior and Traffic Accident.
Amsterdam: North-Holland.
NISBETT, R. E., BORGIDA, E., CRANDALL, R., REED, H. (1976). Popular induc-tion: Information is not always informative. [w:] J. S. Carroll, J. W. Payne (red.), Cognition And Social Behavior. Hillsdale, NJ: Lawrence Eribaum Associates, t. 2, s.227-236.
NOIZET, G., CAVERNI, J. P. (1988). Psychologiczne aspekty oceniania osiągnięć szkolnych. Warszawa: PWN.
BIBLIOGRAFIA
NORTHCRAFT, G., B., NEALE, M. A. (1987). Experts, amateurs, and real estate
Ań anchoring-and-adjustment perspective on property pricing decisions. Organiza-
tional Behavior and Human Decision Processes, 39, 84-97. OSKAMP, S. (1962). The relationship ofciinical expeńence and training methods to seve
rai criteriaofcIinicałprediction.P^c/io/o^cfl/Monograpfo, 76, (28, WholeNo. 547} PAMIĘTNIKI LEKARZY(1939). Warszawa: Wydawnictwo Zakładu Ubezpieczeń Spo
łecznych. PAYNE, J. W. (1982). Contingent decision behavior. Psychological Bulletin, 92
382^02. PETERSON, R. A., WILSON, W. R. (1992). Measuring customer satisfaction: Fact an(
artifact. Journal ofthe Academy of Marketing Science, 20, 61-71. PETERSON, C. R., DUCHARME, W. M. (1967). A primacy effect in subjective próba
bility revision. Journal of Experimental Psychology, 73, 61-65. PISAREK, M., L. (1971). Świat oczami odkrywców. Warszawa: Nasza Księgarnia. PITZ, G. F. (1969). Ań inertia effect (resistance to change) in the revision ofopinion
Canadian Journal of Psychology, 23, 24-33. PITZ, G. F., DOWNING, L., REINHOLD, H. (1967). Sequential effects in the revisioi
of subjective probabilities. Canadian Journal of Psychology, 21, 381-393. PLOUS, S. (1993). The Psychology of Judgment and Decision Making. New York
McGraw-Hill. PLUMMER, T. (1995). Psychologia rynków finansowych. U źródeł analizy technicznej
Warszawa: WIG-Press. PRATKANIS, A. R., (1988). The attitude heuristic and selective fact identification. Bri
tish Journal of Social Psychology, 27, 257-263. PROTHRO, J. W., GRIGG, C. M. (1960). Fundamental principles ofdemocracy: Base
of agreement and disagreement. Journal ofPolitics, 22, 276-294. PRUS, B. (1956). Lalka. Warszawa: PIW. PYSZCZYNSKI, T, GREENBERG, J., SOLOMON, S., STUBING, M. (1993). Emo
tional expression and the inhibition of motivated cognitive bias: Evidence from co
gnitive dissonance and distancing from yictims' paradigm. Journal of Personalit
and Social Psychology, 64, 177-186. OUATTRONE, G. A., TVERSKY, A. (1984). Causal versus diagnostic contingenciei
On selfdeception and the voter's illusion. Journal of Personality and Social Psyche
logy, 46, 237-248.
ROSENTHAL, R., JACOBSON, L. (1968). Pygmalion in the Ciassroom: Teache Expectation andPupils ' Intellectual Development. New York: Holt, Rinehart & Wir
ston. (9, 15) ROSS, M., SICOLY, F. (1982). Egocentric biases in availability and attribution. [w:] Kat
neman. D., Slovic, P., Tversky, A. (red.), Judgment Under Uncertainty: Heuristics a Biases. Cambridge: Cambridge University Press, s. 179-198.
raTŁ/l-IULULaK^-IMt I^Uł-Al^M U^tlMIAIMIA l l^UUtJMUWANIA DECYZJI
RUSSO, J. E., SHOEMAKER, P. J. H. (1989). Decision Traps. New York: Doubleday.
SAKS, M. J., HASTIE, R. (1988). Social Psychology in court: Thejudge. [w:] Arkes, H. R., Hammond, K. R. (red.), Judgment and Decision Making. Cambridge: Cambridge University Press, s. 255-274.
SAKS, M. J., KIDD, R. F. (1988). Human information processing and adjudication: Trial by heuristics. [w:] Arkes, H. R., Hammond, K. R. (red.), Judgment and Decision Making. Cambridge: Cambridge University Press, s. 213-242.
SCHUMAN, H., PRESSER, S. (1981). Questions andAnswers inAttitudeSuryeys: Expe-riments on Question Form, Wording, and Context. Orlando: Academic Press.
SCHUMAN, H. (1992). Context effects: State ofthe past / state ofthe art. [w:] Schwartz, N., Sudman, S. (red.), Context Effects in Social and Psychological Research. New York: Springer-Verlag, s. 5-20.
SCHWARZ, N., CLORE, G. L. (1983). Mood, misattribution, and judgments ofwell-being: Informative and directive functions ofaffective states. Journal ofPer-sonality and Social Psychology, 45, 513-523.
SĘDEK, G., KOFTA, M., TYSZKA, T. (1993). Effects ofuncontrollability on subsequ-ent decision making: Testing the cognitive exhaustion hypothesis. Journal ofPerso-nality and Social Psychology, 65, 1270-1281.
SIGALL, H., OSTROVE, N. (1975). Beautiful but dangerous: Effects ofoffender attrac-tiveness and naturę of the crime on juridical Judgment. Journal of Personality and Social Psychology, 31, 410^14.
SIMONSON, I., TVERSKY, A. (1992). Choice m Context: Tradeoff contrast and extre-meness aversion. Journal of Marketing Research, 29, 281-295.
SIMONSON, I. (1989). Choice based on reason: The case ofattraction and compromise effects. Journal of Consumer Research, 16, 158-174.
SLOVIC, P., FISCHHOFF, B., LICHTENSTEIN, S., (1980). Facts and fears: Under-standing pereeived risk. [w:] Schwing R. C., Alberts W. A. Jr. (red.), Societal Risk Assessment: How Sofę is Safe Enough? New York: Plenum Press, s. 181-216.
SLOVIC, P. (1987). Perception ofrisk. Science, 236, 280-285.
SLOVIC, P., FISCHHOFF, B., LICHTENSTEIN, S. (1982). Response modę, framing, and information processing effects in risk assessment. [w:] R. M. Hogarth (red.), New Directions For Methodology of Social and Behavioral Science: The Framing of Questions and the Consistency of Response. San Francisco: Jossey-Bass, s. 21-36.
SLOVIC, P, FISCHHOFF, B., LICHTENSTEIN, S. (1978). Accident probabilities and seat belt usage: A psychological perspective. Accident Analysis and Prevention, 10,281-285.
SMEDSLUND, J. (1963). The concept ofcorrelation in aduits. Scandinavian Journal of Psychology, 4, 165-173.
SNYDER, M., TANKE, E. D., BERSCHEID, E. (1977). Social perception and interper-sonal behavior: On the self-fulfilling naturę ofsocial stereotypes. Journal of Personality and Social Psychology, 35, 656-666.
BIBLIOGRAFIA
^^^,^<i^ssii^B^<iia^w^spWi@^^:ai(r)^ii^^K^^-^-?%^^^^
STAROWIEYSKI, M. (red.) Księga Starców (1983). Kraków: Znak, s. 294. STEYENS, S. (1957). On the psychological law. Psychological Review, 64, 153-181. STRICKLAND, L. H., LEWICKI, R. J., KATZ, A. M. (1966). Temporal orientation am
pereeived control as determinants of risk-talking. Journal of Experimental Soda
Psychology, 2, 143-151. STEWART, J. E. II. (1980). Defendanfs attractiveness as a factor in the outcome ofthi
trials. Journal of Applied Social Psychology, 10, 348-361. SUE, S., SMITH, R. E., CALDWELL, C. (1973). Effects of inadmissible evidence 01
the decision of simulated jurors: A morał diiemma. Journal of Applied Social Psy
chology. 3, 345-353. SVENSON, O. (1981). Arę we all less risky and morę skillful than our fellow drivers'
Acta Psychologica, 47, 143-148. TESSER, A., CAMPBELL, J. (1982). Self-evaluation maintenance and the perceptiol
offriends and strangers. Journal of Personality, 50, 216-279. THALER, R. (1980). Toward a positive theory ofconsumer choice. Journal ofEcono
mic Behavior and Organization, l, 39-80. THALER, R. (1985). Mental accounting and consumer choice. Marketing Science, A
199-214. TTOURANGEAU, R. (1992). Context Effects on Responses to Attitude Questions
Attitudes as Memory Structures. [w:] Schwartz, N., Sudman, S. (red.), Context E)
fects in Social and Psychological Research. New York: Springer-Verlag, s. 35^7. TVERSKY, A., KAHNEMAN, D. (1973). Availability: A heuristic forjudging frequen
cy and probability. Cognitive Psychology, 5, 207-232. TVERSKY, A., KAHNEMAN, D. (1974). Judgment under uncertainty: Heuristics an
biases. Science, 185, 1124-1130. TVERSKY, A., KAHNEMAN, D (1981). The framing of decision and the psycholog
of choice. Science, 211, 453^63. TYSZKA, T. (1998). Two pairs ofconflicting motives in decision making. Organizatic
nal Behavior and Human Decision Processes, 74, 189-211. TYSZKA, T. (1997). Psychologia zachowań ekonomicznych. Warszawa: PWN. TYSZKA, T. (1983). Contextual multi-attribute decision rules. [w:] L. Sjoberg, T. Tys2
ka, and J. Wise (red.), Human Decision Making. Sweden: Lund, Doxa, s. 243-256 TYSZKA, T., SOKOŁOWSKA, J. (1991). Struktura poznawcza i struktura preferenc
Polaków w sferze społeczno-ekonomicznej. Studia Socjologiczne, 3-4, 29-50. TYSZKA, T. SOKOŁOWSKA, J. (1996). Decision importance and consumer decisio
processes. [w:] Roland-Levy, Ch. (red.), Social and Economic Representation.
Paris: Universite Renę Descartes, s. 756-777. TYSZKA, T., WIELOCHOWSKI, M. (1991). Must boxmg verdicts be biased? Joumi
of Behavioral Decision Making, 4, 283-295.
YALLONE, R. P., ROSS, L., LEPPER, M. R. (1985). The hostiie media phenomenon:
Biased perception and perceptions of media bias in converge ofthe Beimt massacre. Journal of Personality and Social Psychology, 49, 577-585. ,
WEINSTEIN, N. D. (1980). Unrealistic optimism about future life events. Journal of Personality and Social Psychology, 39, 806-820.
WILLIAMS, D. J. (1965). Strateg doskonały: wprowadzenie do teorii gier. Warszawa:
PWN.
WITWICKI, W. (1959). Wiara oświeconych. Warszawa: PWN.
WOJCISZKE, B. (l 991). Procesy oceniania ludzi. Warszawa: Instytut Psychologii PAN.
WORD, C. O., ZANNA, M. P, COOPER, J. (1974). The noiwerbal mediation ofself-
-fulfilling prophecies in interracial interaction. Journal ofExperimental Social Psychology. 10, 109-120.
Joan Borysenko KSIĘGA ŻYCIA KOBIETY. Ciało - psychika - duchowość
Kobieca mądrość, intuicja i specyficzny sposób postrzegania świata sprawiają, że kobiety mogą odegra kluczową rolę w dziele tworzenia nowej kultury. Spragnione są jednak wiedzy o sobie samych. Autorki przedstawia nową teorię rozwoju kobiety. Zawarte tu opisy procesów rozwojowych podane są w sposól przystępny i klarowny, a dziesiątki przykładów pozwalają lepiej zrozumieć prezentowane tezy. Dzięki temu lektur, "Księgi życia kobiety" może być pasjonującym zajęciem dla wszystkich czytelniczek, niezależnie od ich wieku przekonań i poziomu wiedzy.
Katrin Oppermann, Erika Weber JĘZYK KOBIET -JEŻYK MĘŻCZYZN. Jak porozumieć się w miejscu pracy
Różny sposób postrzegania rzeczywistości przez mężczyzn i kobiety wpływa na powstawanie odrębnych dl obu płci stylów komunikowania się. Książka adresowana jest do osób aktywnych zawodowo - pracowników którzy chcieliby pracować efektywniej, i pracodawców, pragnących kierować sprawnym i zgranym zespoleń ludzi. W osiąganiu tych celów przeszkadza im jednak nieumiejętność porozumiewania się z płcią przeciwne Autorki, doświadczone trenerki zajmujące się od lat doradztwem i szkoleniem personelu, podpowiadają czytelni kowi, jak udoskonalić swoje zdolności komunikacyjne.
Sandra Lipsitz Bem
MĘSKOŚĆ - KOBIECOŚĆ. O różnicach wynikających płci
W kulturze masowej oraz w psychice jednostek zakorzenione są schematy, na podstawie których dokonujem podziału świata na męski i kobiecy. Owe uświęcone przez historię schematy autorka nazywa pryzmatarr rodzaju (lenses ofgendef). To one utrwalają z pokolenia na pokolenie męski porządek społeczny, co nie tyłki sankcjonuje nierówność płci, ale również prowadzi do dyskryminacji wszelkich mniejszości (seksualnycr narodowych, ludzi niepełnosprawnych). Celem książki jest uwidocznienie pryzmatów rodzaju oraz umożli wienie przyjrzenia się im.
EIłyn Kaschak
NOWA PSYCHOLOGIA KOBIETY. O feminizmie
Myśli zawarte w książce rozwijały się w kontekście feministycznej refleksji autorki i jej działalności w ciąg ostatnich dwóch dziesięcioleci. EIłyn Kaschak opisuje codzienne życiowe doświadczenia kobiet. Móv o związku między społeczną koncepcją płci a najgłębszymi odczuciami i przemyśleniami każdej kobiet) Pisze o dorastaniu, stawaniu się dziewczyną, następnie kobietą; o towarzyszących tym procesom problemac i sposobach radzenia sobie z nimi. Książka jest empatycznym opisem problemów, z jakimi boryka si współczesna kobieta.
^sprzedaż wysyłkowa: ^ -..-•^-1:::::1;:,^1,, .-.y-
81-7S3 Sopot, ul. Bema 4/1a, tel./1ax S51 61 04, łel. SS11101 e-mall: gwp@gwp.gda.pl LNASZA STRONA W INTERNECIE; http://www.gwp.gda.pl
Robert Cialdini WYWIERANIE WPŁYWU NA LUDZI. Teoria i praktyka
Przegląd klasycznych, a także najnowszych teorii i badań z zakresu psychologii wpływu społecznego, mechanizmów, dzięki którym ludzie wywierają wpływ na innych i mogą się przed takim wpływem bronić! Autor tej interesującej publikacji w umiejętny sposób (nie stroniąc od dowcipu) łączy wykład teoretyczny z praktycznymi zastosowaniami omawianych teorii. Książka adresowana do wszystkich osób uprawiających te profesje, w których umiejętność wpływania na innych jest elementem zawodowego kunsztu.
Mark H. Davis EMPATIA. O umiejętności współodczuwania
Mark Davis, doświadczony badacz empatii i uznany autorytet w tej dziedzinie podjął udaną próbę przedstawienia współczesnego stanu teorii i badań nad empatią, jej istotą, wyznacznikami i konsekwencjami. Omawiane zagadnienia ukazał na tle istotnych problemów dotyczących zachowań społecznych: agresji, zachowań prospołecznych, dynamiki bliskich związków między ludźmi. Szerokie spojrzenie na zagadnienie empatii, aktualność przedstawionego stanu badań i własne, oryginalne propozycje autora sprawiają, że praca ta jest cenną monografią o wyraźnych walorach poznawczych i dydaktycznych.
N. Macrae, Ch. Stangor, M. Hewstone
STEREOTYPY l UPRZEDZENIA. Najnowsze ujęcie
Zbiór artykułów wybitnych badaczy tego zagadnienia. Swym zakresem tematycznym obejmuje całość problematyki stereotypów, co stanowi główną zaletę publikacji. Lektura książki daje czytelnikowi możliwość zapoznania się z najnowszymi wynikami badań, które mogą zadziwić nawet wytrawnych badaczy stereotypów. Poruszane są nowe wątki teoretyczne, uprzednio słabo akcentowane w literaturze przedmiotu. Książka adresowana jest przede wszystkim do psychologów i socjologów, a także do studentów nauk społecznych.
Mark Leary
WYWIERANIE WRAŻENIA NA INNYCH. O sztuce autoprezentacji
Książka przedstawia w sposób uporządkowany i przejrzysty różnorodne stosowane przez ludzi taktyki auto-prezentacyjne, motywacje, które tkwią u podłoża autoprezentacji. Autor, wybitny specjalista w tej dziedzinie w systematyczny sposób omawia problematykę związaną z wywieraniem wpływu na innych. Ukazuje kontekst kulturowy i społeczny, w jakim przebiegają takie zachowania, a także konsekwencje, jakie mają one dla człowieka i jego społecznego otoczenia.
sprzedaż wysyłkowa:
^ 81-753 Sopot, ul. Bema 4/1a, tel./fax SS1 61 04, tel.551 11 01 e-mail: gwp@gwp.gda.pl NASZA STRONA W INTERNECIE; http://www.gwp.gda.pl
i ••laiTiinriiiiiniiTiTim m
WYWlERflNIE WPŁYWU PRZEZ GRUPY
9999 • '»»•»» .»»»»»»•
»»»»» •
»••» -
WYWIERANIE WPŁYWU PRZEZ GRUPY. Psychologia relacji Walter G. Stephan, Cookie W. Stephan
Żyjemy w świecie, w którym stosunki między grupami społecznymi naznaczone są wrogością i przemocą U źródeł konfliktów znajdziemy stereotypy, uprzedzenia i dyskryminację. Chcąc poprawić relacje między-grupowe, powinniśmy najpierw zapytać: Dlaczego ludzie odwołują się do stereotypów? Skąd bierze si( nienawiść między członkami poszczególnych grup? Dlaczego ludzie dyskryminują tych, którzy się od nict różnią? Niniejsza książka odpowiada na te pytania, prezentując dorobek psychologii społecznej w zakresif stosunków międzygrupowych. Zbudowana jest z krótkich, lecz nasyconych treścią opisów najważniejszyct danych związanych z tą problematyką.
NIEPEWNOŚĆ l ZAKŁOPOTANIE O pokonywaniu niechcianych uczuć Rowland S. Miller
Niepewność i zakłopotanie to złożone i spotykane tylko u ludzi emocje, które odgrywają ogromną rolę w interakcjach społecznych. Autor wyjaśnia ich przyczyny i skutki. Przedstawia osobowe, sytuacyjne i międzyludzki! czynniki zakłopotania, opierając się na literaturze z zakresu psychologii, socjologii, biologii oraz innych dziedzin Książka pełna jest interesujących przykładów i anegdot oraz opisów najnowszych badań.
Z wyjątkową przejrzystością i w doskonałym stylu Miller analizuje daleko idący wpływ zakłopotania na schowanie człowieka Czytelnicy zyskają nowe spojrzenie na te emocję i zaczną traktować jako istotną w życiu każdego z nas.
Mark Leary (autor Wywierania wrażenia na innych
Już wkrótce Podręcznik XXI wieku
^Psychologia
; Ridn;ra'"li iil>iul<'nii<'ki
Psychologia
: Riiliwnili akiiilriilirki
• ponad trzy tysiące stron rzetelnej wiedzy psychologicznej
• najaktualniejsze badania i teorie z zakresu psychologii
• bogaty słownik terminów psychologicznych (z ich anglojęzycznymi odpowiednikami)
• liczne ilustracje, tabele i schematy uatrakcyjniające przekaz
sprzedaż wysyłkowa:
81-7S3 Sopot, ul. Bema 4/1a, tól/feur 5S1 61 04, tel. SS11101
e-malt: gwp@gwp.gda.pl
NASZA STRONA W INTERNECIE: http://www.gwp.gda.pl