11.3.3. Metody i techniki diagnostyczne w świetle badań
Szybki postęp wiedzy naukowej w ostatnich latach umożliwia tworzenie
doskonalszych procedur diagnostycznych i stałe podnoszenie standardów diagnozy. Sprawia
też jednak, że wiele klasycznych twierdzeń i obyczajów w praktyce diagnozowania traci
aktualność, a uznane narzędzia diagnostyczne okazują się mieć poważne wady. W niniejszym
podrozdziale przedstawimy sposoby oceniania narzędzi diagnostycznych na podstawie testów
empirycznych, a także przedstawimy niektóre wnioski, płynące z tego typu badań.
11.3.3.1. O potrzebie krytycznego spojrzenia na techniki i metody
diagnostyczne
W swym popularnym podręczniku diagnozy psychologicznej Gary Groth-Marnat (2003)
wyróżnia trzy główne metody diagnozowania: wywiad, obserwowanie zachowania i
testowanie. Chcąc najogólniej je scharakteryzować, można powiedzieć, że wywiad polega na
rozmawianiu z osobą badaną, obserwacja – na zaplanowanym rejestrowaniu jej określonych
zachowań, a testowanie – na stawianiu jej wobec różnego rodzaju zadań. Jest to klasyczny
podział metod diagnostycznych, wydaje się jednak, że współcześnie te kategorie tracą ostrość
i można zasadnie pytać, czy jest sens posługiwać się nimi nadal. Czy rzeczywiście są testami
wszystkie techniki diagnostyczne, których nie sposób uznać za wywiad ani obserwację? I czy
z kolei pewne procedury wywiadu lub obserwacji nie mogłyby zostać nazwane testami?
Przypomnijmy na początek, że pojęcie testu psychologicznego (zob. także rozdział 10) jest
ściśle określone (patrz ramka 11.9).
Ramka 11.9.
Definicja testu
Test psychologiczny
jest specyficzną procedurą diagnozowania. Może to być zbiór zadań lub pytań,
które w standardowych warunkach wywołują określone rodzaje zachowań i dostarczają wyników o
pożądanych właściwościach psychometrycznych (Hornowska, 2001; Paluchowski, 2001). Test jako
procedura zbierania danych, musi spełniać następujące warunki:
1. standaryzacja (taki sam przebieg badania, materiał, instrukcja itp. dla każdej osoby badanej);
2. obiektywność (sposób obliczania/interpretacji wyniku na tyle jednoznaczny, że każdy diagnosta
dochodzi do tych samych rezultatów);
3.
normalizacja (znane są średnie wyniki, jakie wiele innych osób uzyskało w tym zadaniu).
Testy stosowane w praktyce powinny także mieć udowodnioną empirycznie trafność i rzetelność, które
da się określić tylko dla procedur, spełniających dwa pierwsze z powyższych warunków
Testem jak najbardziej może być procedura obserwacyjna lub procedura wywiadu, jeśli tylko
jest wystandaryzowana, zobiektywizowana, posiada normy i znana są jej trafność i rzetelność.
Z takim stanowiskiem spotykamy się w innym współczesnym podręczniku diagnozy
psychologicznej. Daniel Segal i Frederick Coolidge (2003) zaliczając ustrukturalizowane i
częściowo ustrukturalizowane procedury wywiadu do testów obiektywnych, wyjaśniają, że
„choć klasycznie nie uważano ich za obiektywne testy, jednak są nimi, skoro zawierają
jednoznaczne, standardowe pytania, podawane w określonym porządku, a odpowiedzi są
kodowane w określony sposób” (Segal i Frederick, 2003, s. 4-5). Teoretycznie nic nie stoi na
przeszkodzie, by dowolne zadanie, pytanie czy ich zestaw opracować w formie testu –
potrzebne jest tylko zainwestowanie w to badawczego wysiłku.
Z drugiej strony nie wszystko, co na test wygląda, jest nim w istocie. W kolorowych
tygodnikach, a niekiedy nawet w poważnych wydawnictwach można spotkać się z zestawami
zadań, które jakoby mają wykazać różne skłonności wykonującej je osoby. Jeśli jednak „test”
nie spełnia wymienionych wyżej warunków, a żadne badania na temat jego trafności i
rzetelności nie były przeprowadzane, albo też przeprowadzono ich za mało, wybiórczo lub w
inny sposób nie dopełniono procedur naukowych, to twierdzenia o związku pewnych
właściwości psychicznych z wynikami w takim zadaniu są jedynie prywatnymi wierzeniami
zwolenników takich zadań. Nie ma przy tym żadnego znaczenia, czy w nazwie zadania
występuje słowo „test”. Słowo to nie jest terminem prawnie zastrzeżonym, w związku z czym
każdy może je nadać dowolnemu zadaniu własnego pomysłu.
Nie są też testami niektóre – całkiem liczne - instrumenty, tworzone ad hoc w organizacjach
na potrzeby selekcji, rekrutacji lub oceny pracowników. Jak pisze Lutz Homke (2002) siły
rynku wymuszają szybkie decyzje i menażerowie naciskają nierzadko, aby w krótkim czasie
zdiagnozować interesujące ich zjawisko. Jednak narzędzia tworzone doraźnie zazwyczaj nie
mają podbudowy ani teoretycznej, ani empirycznej (trafność!), ich wartość więc bywa
wątpliwa. Nie chcemy tu jednak dyskredytować nowych narzędzi diagnostycznych, które nie
spełniają wymagań tylko dlatego, że są w trakcie badań. Fakt, że test na przykład nie ma
jeszcze norm, nie musi oznaczać, że jest nieprzydatny – można stosować go w badaniach
naukowych lub do porównywania między sobą wielu badanych osób czy grup, nie wolno
natomiast przy braku norm dla testu formułować na jego podstawie diagnozy indywidualnej.
Słowo „test” figuruje też w nazwach niektórych uznanych narzędzi diagnostycznych,
które z pewnością testami nie są. Na przykład Test Apercepcji Tematycznej w wąskim
rozumieniu jest nazwą własną techniki projekcyjnej autorstwa Henry Murraya (1943), która
nie spełnia kryteriów testu. Psycholodzy stosują też – na mocy utrwalonego obyczaju - termin
„Test Apercepcji Tematycznej” w szerszym znaczeniu, mając na myśli rodzinę technik
projekcyjnych, z których niektóre są testami w najściślejszym sensie psychometrycznym, ale
inne z pewnością nie. Nie znaczy to, że wszystkie z tej ostatniej kategorii są bez wartości dla
diagnozy, jednak należy stosować je inaczej i do innych celów, niż testy (por. Stemplewska-
Żakowicz, 2004a).
Są jednak i takie techniki, które – choć w nazwie mają słowo „test”, to nie tylko nie są
testami, ale w ogóle nie powinny być używane w diagnozie psychologicznej, ponieważ
badania dowiodły, że są nietrafne. Na liście zdyskredytowanych narzędzi diagnostycznych,
którą na podstawie opinii 101 ekspertów stworzyli John Norcross, Gerald Kocher i Ariel
Garofalo (2006), dwa pierwsze miejsca zajmują Test Kolorów Lűschera i Test Szondiego
jako techniki badania osobowości (zob. podrozdział 11.3.3.2). Co ciekawe, słowo „test”
figuruje w nazwie wielu technik, łagodnie mówiąc, mało ścisłych, natomiast techniki, które
prawdziwie są testami, często nazywają się inaczej (np. skala, zestaw). Ponieważ zarówno
nazwy, jak i ogólne klasyfikacje mogą być mylące, najpewniejszym sposobem rozpoznania,
czym jest dana technika diagnostyczna i jaka jest jej wartość, jest samodzielna ocena, na ile
spełnia ona standardy psychometryczne i jakie dane
zebrano o
jej trafności, rzetelności i
praktycznej efektywności. A jeśli sami psycholodzy nie dokonają krytycznej oceny
stosowanych przez siebie metod, może się zdarzyć, że zastąpią ich w tym - i zawstydzą
zarazem - profesjonaliści z innych dziedzin, co spotkało pewnego biegłego sądowego z
dziedziny medycyny i stało się powodem sformułowania tak zwanych „kryteriów Dauberta”
(patrz ramka 11.10).
Ramka 11.10
Kryteria Dauberta
W roku 1993 przed Sądem Najwyższym Stanów Zjednoczonych toczyła się sprawa "Daubert vs
Merrell Dow Pharmaceuticals Inc.", w której William Daubert i inni wystąpili przeciwko firmie
farmaceutycznej o odszkodowanie za upośledzenia noworodków, spowodowane przez zażywanie
leku o nazwie Bendectin przez matki w ciąży. Sąd orzekł, że brak jest naukowych dowodów na
związek między zażywaniem leku a uszkodzeniem płodu. Kryteria, którymi się kierował oceniając
wiarygodność opinii biegłych, stały się znane jako „kryteria Dauberta” i na mocy precedensowego
prawa Stanów Zjednoczonych stanowią obecnie dla sędziów wskazówki, jak podejmować decyzje o
dopuszczeniu dowodu z opinii biegłego (często psychologa).
Kryteria Dauberta są dobrze spełnione przez techniki diagnostyczne, wypracowane lub
zweryfikowane w ramach nurtu EBA (Faigman i Monahan, 2005).
11.3.3.2. Ocena narzędzi diagnostycznych z perspektywy EBA
Charakterystycznym rysem EBA jest akcent położony na wiarygodne techniki pomiaru. Aby
określone narzędzie diagnostyczne zostało na gruncie EBA uznane za wiarygodne, jego
parametry psychometryczne muszą być przekonujące (por. też Brzeziński, 1996). Wydaje się
to oczywiste. Mniej znane polskim psychologom są natomiast szczegółowe pojęcia i
statystyki, stosowane w praktyce do szacowania trafności diagnostycznej narzędzia, a
wywiedzione z zastosowania twierdzenia Bayesa i teorii decyzji (por. Anastasi i Urbina, 1999;
Paluchowski 2001) do zagadnień diagnozy psychologicznej.
Wykorzystanie w psychologii podejścia Bayesa zaproponowali Paul Meehl i Albert
Rosen (1955), co zaowocowało dalszymi badaniami i koncepcjami (Cronbach i Gleser, 1957;
Grove, 2006; Mash i Hunsley, 2005), stanowiącymi dziś element kanonu wiedzy na temat
praktyki diagnostycznej (APA - Division 12: Presidential Task Force, 1999). Podejście to
stanowi także w dużym stopniu realizację postulatów Meehla na temat sformalizowania reguł
podejmowania decyzji klinicznych. Dokładniej, chodzi o oszacowanie prawdopodobieństwa,
z jakim diagnosta może orzekać o zaistnieniu pewnego zjawiska lub o stwierdzeniu pewnej
właściwości u diagnozowanej osoby na podstawie zaobserwowanego wskaźnika tego
Kryteria Dauberta to w gruncie rzeczy – jak piszą William Grove i Christopher Barden (1999, s. 226) –
podstawowe zasady naukowego poznania, sformułowane jako 6 pytań o wskaźniki naukowej
rzetelności.
1. Czy teoria lub technika, stanowiąca podstawę dowodu, jest sprawdzalna?
2. Czy istotnie została sprawdzona za pomocą trafnych i rzetelnych procedur i czy wynik
tych badań był pozytywny?
3. Czy została poddana tzw. ślepej recenzji (peer review)?
4. Jak duże jest ryzyko, że teoria jest błędna? Jaki jest błąd pomiaru techniki?
5. Czy zostały ustanowione standardy dla stosowania danej techniki?
6. Czy dana teoria lub technika jest ogólnie akceptowana przez odpowiednie środowisko
naukowców?
zjawiska lub właściwości. Na przykład, na ile pewne jest rozpoznanie określonego zaburzenia
psychicznego na podstawie stwierdzenia jego objawu, albo orzekanie o specyficznych
uzdolnieniach u osoby, która dobrze wypadła w zadaniu testowym, wymagającym
wykorzystania tych uzdolnień.
Problem nie jest banalny, ponieważ wskaźniki empiryczne – jak to wyjaśnił polskim
badaczom Stefan Nowak (1965) - miewają różną moc rozdzielczą i wyjątkowo tylko osiągają
wartość jedności. Realnym problemem diagnostycznym są wobec tego wątpliwości,
przykładowo, co do tego, z jaką pewnością można rozpoznać schizofrenię u pacjenta, który
relacjonuje poczucie depersonalizacji i omamy słuchowe. Wprawdzie oba te objawy są
charakterystyczne dla schizofrenii, jednak przytrafiają się niekiedy także ludziom zdrowym.
Jak więc mamy uzyskać pewność, że w tym przypadku jest to – lub nie jest – choroba
psychiczna? (zob, tabela 11.2).
Nie da się odgadnąć odpowiedzi na to pytanie. Również doświadczenie kliniczne
może być bardzo mylące, ponieważ psycholog nie powinien zakładać, że klienci, z którymi
miał dotąd do czynienia w swojej praktyce, stanowili próbę reprezentatywną i że jednakowo
dobrze ich wszystkich zapamiętał. Tylko badania empiryczne mogą dostarczyć tu wytycznych
do wnioskowania. Dla każdego wskaźnika trzeba empirycznie określić prawdopodobieństwo
trafnego rozpoznania na jego podstawie diagnozowanego zjawiska lub właściwości, a także
ryzyko popełnienia przy tym błędu. Innymi słowy, trzeba określić warunkowe
prawdopodobieństwo zaistnienia kryterium (w naszym przykładzie: schizofrenii u danej
osoby), gdy spełniony jest warunek dotyczący predyktora (gdy występuje dany objaw).
Tabela 11.2. Hipotetyczne wyniki badania wartości poczucia depersonalizacji jako predyktora
(wskaźnika) schizofrenii
Predyktor (wskaźnik):
poczucie depersonalizacji
Kryterium (diagnozowane zjawisko): schizofrenia
zdiagnozowano schizofrenię
nie zdiagnozowano
schizofrenii
występuje poczucie
depersonalizacji
30
(a)
15
(b)
nie występuje poczucie
depersonalizacji
10
(c)
35
(d)
Do tego właśnie pomocne okazało się twierdzenie Bayesa, na którym opierają się
stosowane dziś sposoby oceniania narzędzi diagnostycznych. Miarą trafności narzędzia są
empiryczne współczynniki, dotyczące proporcji trafnych i nietrafnych diagnoz, postawionych
na podstawie tego narzędzia. W tabeli 11.3 zestawiliśmy podstawowe pojęcia, dotyczące tak
rozumianej trafności diagnostycznej:
Tabela 11.3. Podstawowe pojęcia dotyczące trafności diagnostycznej predyktora (wskaźnika).
Pojęcie
Znaczenie pojęcia
Przykład (por. tabela 11.2)
•
diagnozowane zjawisko
(kryterium) – schizofrenia
•
wskaźnik (predyktor) – poczucie
depersonalizacji
Proporcja podstawowa
(base rate) diagnozowanego
zjawiska (kryterium)
Częstość występowania
diagnozowanego zjawiska
(kryterium) w populacji
Odsetek w populacji osób chorych na
schizofrenię
(a)+(c)/[(a)+(b)+(c)+(d)]
Czułość (sensitivity)
wskaźnika (predyktora).
Inaczej: trafne wskazania
(true-positives)
Warunkowe
prawdopodobieństwo
wystąpienia predyktora, gdy
wystąpiło kryterium
Odsetek osób doświadczających
poczucia depersonalizacji wśród
chorych na schizofrenię.
(a)/[(a)+(c)]=0,75
Swoistość (specificity)
wskaźnika (predyktora)
Inaczej: trafne odrzucenia
(true-negatives)
Warunkowe
prawdopodobieństwo nie
wystąpienia predyktora, gdy
nie wystąpiło kryterium.
Odsetek osób nie doświadczających
poczucia depersonalizacji wśród
zdrowych
(d)/[(b)+(d)]=0,70
Moc prognozy pozytywnej,
PPP (positive prediction
power)
Warunkowe
prawdopodobieństwo
wystąpienia kryterium, gdy
wystąpił predyktor
Odsetek chorych na schizofrenię
wśród osób doświadczających
poczucia depersonalizacji.
(a)/[(a)+(b)]=0,67
Moc prognozy negatywnej,
NPP (negative prediction
power)
Warunkowe
prawdopodobieństwo nie
wystąpienia kryterium, gdy
nie wystąpił predyktor
Odsetek zdrowych wśród osób nie
doświadczających poczucia
depersonalizacji
(d)/[(c)+(d)]=0,78
Błędne wskazania (false-
positivse)
Proporcja błędnie
wskazanych przez predyktor
przypadków wystąpienia
kryterium
Odsetek osób, które okazały się
zdrowe, wśród wszystkich osób,
doświadczających poczucia
depersonalizacji
(b)/[(a)+(b)]=0,33
Błędne odrzucenia (false-
negatives)
Proporcja błędnie
wskazanych przez predyktor
przypadków nie wystąpienia
kryterium
Odsetek osób, które okazały się chore
na schizofrenię wśród wszystkich
osób, nie doświadczających poczucia
depersonalizacji
(c)/[(c)+(d)]=0,22
Efektywność (eficiency)
wskaźnika (predyktora)
Inaczej: proporcja trafień
(hit rate)
Proporcja trafnych predykcji
(wskazań i odrzuceń razem)
we wszystkich predykcjach
(trafnych i błędnych razem)
Łączny odsetek osób, które okazały się
chore na schizofrenię i doświadczały
depersonalizacji oraz tych, które
okazały się zdrowe i nie doświadczały
depersonalizacji, w grupie wszystkich
osób, dla których formułowano te
przewidywania.
[(a)+(d)]/[(a)+ (b)+(c)+(d)]=0,75
Bardzo przydatne przy ocenie trafności danego wskaźnika lub testu są wykresy
związku między odsetkiem wyników prawdziwie i fałszywie dodatnich, nazywane krzywymi
ROC (receiver operating characteristic curve). O ile nam wiadomo, w polskiej literaturze
psychologicznej nie ma na razie opracowań na ten temat, zainteresowanych Czytelników
zachęcamy więc do sięgnięcia do prac angielskojęzycznych (Grove, 2006: Swets, Dawes i
Monahan, 2000;) lub polskojęzycznych z pokrewnej dziedziny EBM czyli medycyny opartej
na dowodach empirycznych (Jaeschke, Cook i Guyatt, 1998b; Smoleń , 2003).
Kwestie dobroci psychometrycznej narzędzia diagnostycznego nie są oczywiście
nowością w psychologii, ani też nie są specyficzne tylko dla EBA, jednak – co może już być
uznane za pewną nowość w praktyce psychologicznej – bezwarunkowe obstawanie przy
standardach psychometrii ma tutaj charakter fundamentalny. W ocenie przydatności narzędzia
do konkretnych celów diagnostycznych przykłada się też wielką wagę do tego, czy istnieją
badania walidacyjne i normalizacyjne, dokonane w odniesieniu do tego właśnie celu
diagnostycznego i tej konkretnej populacji, z której pochodzi osoba, mająca być
diagnozowana danym narzędziem.
Ta rygorystyczna postawa doprowadziła do intensywnej debaty, jaką odbyto w
ostatnich latach w kwestii wiarygodności różnych narzędzi diagnostycznych, w tym
zwłaszcza technik projekcyjnych (Lillienfeld, Wood i Garb, 2000/2002; Hibbard, 2003; por.
Stemplewska-Żakowicz, 2004b). Jednym z jej efektów jest niemal powszechna dziś zgoda
wśród psychologów co do tego, że pewne narzędzia diagnostyczne w świetle współcześnie
dostępnych danych empirycznych należy uznać za zdyskredytowane i zaprzestać ich
stosowania (Norcross, Kocher i Garofalo, 2006). Listę sześciu pierwszych pozycji
zdyskredytowanych narzędzi diagnostycznych stworzoną na podstawie opinii 101
psychologów-ekspertów (Norcross, Kocher i Garofalo, 2006, s. 520) przestawiono niżej. Przy
każdej pozycji podano cel diagnostyczny, do którego przydatność danej techniki była
oceniana.
Niech nas zatem nie zmyli fakt, że jakieś narzędzia są od dawna stosowane w praktyce, uczy
się o nich studentów, a nawet znajdują się w ofercie wydawnictw, zajmujących się testami
psychologicznymi. Jak piszą Norcross, Kocher i Garofalo (2006, s. 522):
Psychologia nieustannie dokonuje autopoprawek, ponieważ jej podstawą (w większym
stopniu, niż innych profesji) są dowody empiryczne. Dokonaliśmy – jako dyscyplina –
znaczącego postępu w odróżnianiu nauki od pseudonauki w praktyce psychologicznej.
1.1.1.Narzędzia diagnostyczne i strategie diagnozowania
Rzetelne narzędzia diagnostyczne to podstawa EBA, ale – jak podkreśla wielu
autorów (por. Fernández-Ballesteros, De Bruyn, Godoy, Hornke, i in., 2001; Krishnamurthy,
VandeCreek, Kaslow, Tazeau i in., 2004) - diagnozowanie to coś więcej niż stosowanie testów
i innych technik diagnostycznych. Przeprowadzanie badania pojedynczym narzędziem
diagnostycznym to zadanie – rzec można - poziomu podstawowego w diagnozowaniu.
Proponujemy wyróżnić dwa kolejne poziomy o większym stopniu złożoności. Poziom
pośredni to wybór i zrealizowanie strategii diagnozowania konkretnej właściwości lub
zjawiska (np. kompetencji społecznych pracownika, uzdolnień ucznia czy ryzyka
samobójstwa pacjenta). Najbardziej złożony jest poziom całościowy czyli integracja
wszystkich zadań z poziomu pośredniego i skuteczna realizacja całego procesu
diagnozowania zgodnie z przyjętą strukturą. Relacja między zadaniami z tych trzech
Ramka 11.11
Narzędzia diagnostyczne uznane za zdyskredytowane (opis w tekście)
Test Kolorów Lűschera (diagnoza osobowości),
Test Szondiego (diagnoza osobowości),
grafologiczna analiza pisma (diagnoza osobowości),
Wzrokowo-Motoryczny Test Gestalt Lauretty Bender (wykrywanie uszkodzeń
neuropsychologicznych, diagnoza osobowości),
technika „Enneagram” (diagnoza osobowości)
stosowanie anatomicznie dokładnych lalek (wykrywanie nadużyć seksualnych u
dzieci).
poziomów jest hierarchiczna. Przeprowadzenie badania konkretną techniką diagnostyczną
(np. kwestionariuszem BDI ) jest elementem wybranej strategii rozpoznania pewnego
zjawiska (np. oszacowania ryzyka samobójstwa), a ta z kolei stanowi część całościowego
procesu diagnostycznego, którego celem jest rozwiązanie postawionego problemu (np. jaki
rodzaj pomocy psychologicznej jest odpowiedni dla osoby X.?)
Obecnie zadania z dwóch niższych poziomów złożoności są lepiej opracowane
empirycznie, niż zagadnienia dotyczące struktury procesu diagnozowania jako całości (o co
upominał się Meehl). Przegląd prac, w których jako słowo kluczowe figuruje „EBA”,
pokazuje, że w ostatnich latach przeprowadzono cały szereg prac badawczych, poświęconych
technikom i strategiom wiarygodnego diagnozowania różnych szczegółowych konstruktów,
istotnych w praktyce psychologicznej. Na przykład w pracy Phillipa M. Kleespies i Elizabeth
L. Dettmer (2000) wszechstronnie omówiono strategię szacowania ryzyka zachowań
samobójczych. Omówimy tę pracę nieco szerzej, ponieważ ilustruje ona, czym w praktyce
jest oparta na dowodach empirycznych strategia diagnozowania określonego zjawiska lub
właściwości
Szczególnych trudności nastręcza diagnostom szacowanie prawdopodobieństwa
zjawisk, które są wyjątkowo rzadkie czyli – by zastosować nowe pojęcie z tabeli 11.3 - ich
proporcja podstawowa jest bardzo niska. Do takich należą (na szczęście!) samobójstwa. W
latach 1995-1999 ich częstość wynosiła w Polsce 14,9 przypadków, a w USA 11,3
przypadków na 100 tysięcy mieszkańców
. Oznacza to, że statystycznie polski psycholog
może zetknąć się z problemem dokonanego samobójstwa w przybliżeniu raz na 7000 osób,
które konsultuje, a psycholog amerykański nawet nieco rzadziej. Jednak każdy psycholog
pragnie oczywiście nie zetknąć się z tym ani razu – zapobieganie ewentualnemu samobójstwu
to przecież jeden z celów jego pracy! Jak jednak określić, którego spośród 7000 tysięcy
klientów trzeba otoczyć szczególną opieką z powodu groźby samobójstwa z jego strony?
Trudność tego problemu Kleespies i Dettmer (op. cit.) ilustrują następująco: wyobraźmy
sobie, że pewien diagnosta dysponuje absolutnie wyjątkową zdolnością określania ryzyka
samobójstwa z 99% czułością i 99% swoistością. Oznacza to (por. tabela 11.3), że wśród
100 000 pacjentów trafnie rozpozna on 99 000 tych, którzy w przyszłości nie popełnią
samobójstwa, a pozostałych 1000 osób zaliczy do grupy podwyższonego ryzyka. Proporcja
podstawowa jednak mówi, że przyszłych samobójców jest w tej grupie tak naprawdę tylko
około 11 (w USA) lub 15 (w Polsce). Nawet jeśli nasz diagnosta ma do czynienia z samymi
1
Dane oryginalnie zamieszczone przez autorów (dotyczące tylko USA), zamieniliśmy tu na analogiczne, podane
przez Marię Jarosz (2005), ponieważ te ostatnie pochodzą z badan międzynarodowych i obejmują dodatkowo
wskaźnik odnoszący się do Polski.
tylko pacjentami psychiatrycznymi, wśród których odsetek samobójstw jest wyższy, to w
grupie wytypowanych 1000 osób z podwyższonym ryzykiem samobójstwa znajdzie się 60
przyszłych samobójców i aż 940 osób, które zostały wytypowane „na wyrost” i stanowią
błędne wskazania (false-positives).
Przykłady te pokazują, jak wiele znaczy proporcja podstawowa – to ona wyznacza, o
jakich w gruncie rzeczy liczbach mówimy, szacując czułość i swoistość testu. Widzimy też,
jaka jest skala trudności w diagnozowaniu rzadkich zjawisk, takich jak ryzyko samobójstwa.
Nawet gdybyśmy dysponowali fantastyczną precyzją, która jest nie do osiągnięcia przez
współczesne narzędzia diagnostyczne, i tak zjawisko samobójstwa pozostawałoby
praktycznie nieprzewidywalne, konkludują Kleespies i Dettmer (op. cit.). Zarazem w tych
nielicznych sytuacjach, gdy jednak staje się ono realną groźbą, którą pacjent może
zrealizować w ciągu najbliższych godzin lub dni, wymaga to natychmiastowych działań
psychologa. Wszystko to, jak piszą autorzy, każe myśleć o skromniejszych niż jedno
wyspecjalizowane narzędzie sposobach oceniania ryzyka samobójstwa na potrzeby skutecznej
praktyki psychologicznej.
Kleespies i Dettmer (op. cit.) dokonali przeglądu kilkudziesięciu badań empirycznych,
dotyczących samobójstw dokonanych. Były to badania post mortem, w których na podstawie
zachowanej dokumentacji określano różne psychospołeczne i psychopatologiczne
właściwości osób zmarłych i sprawdzano, które z tych właściwości w sposób istotny
różnicowały osoby zmarłe w wyniku samobójstwa i zmarłe z innych przyczyn. Okazało się,
że choć różnic tych było sporo, to nie sposób ułożyć ich w uniwersalną formułę predykcji,
ponieważ pewne czynniki mają znaczenie tylko dla niektórych grup osób, inne zaś zaczynają
odgrywać jakąkolwiek rolę dopiero zestawione razem, a nie same w sobie. Kleespies i
Dettmer (op. cit.) dokonali drobiazgowej kategoryzacji wszystkich tych czynników ze
względu na wyniki badań nad ich znaczeniem dla samobójstw i powiązania z innymi
czynnikami. Ostatecznie wyłoniło się z tego pięć profili, wyróżnionych ze względu na
podstawowe zaburzenie psychiczne, rozpoznane u danej osoby. Wyniki te prezentuje tabela
11.31:
Tabela 11.31. Czynniki empirycznie związane z ostrym ryzykiem samobójstwa (zaczerpnięto
z Kleespies i Dettmer, 2000, str.1113).
Rozpoznanie
Współwystęp
owanie
innych
zaburzeń
Czynniki
zaostrzające
Osobowość
Stres
Czynniki
ułatwiające
Tło historyczne
lub środowiskowe
depresja
nadużywanie
alkoholu
aktualny
epizod
dwubiegunow
ej choroby
afektywnej
nasilona
anhedonia
bezsenność
obniżona
koncentracja
nasilony lęk
ataki paniki
cechy
obsesyjno-
kompulsyw
ne
brak w domu
dzieci w
wieku
poniżej 18 lat
obecny epizod
depresji jest co
najwyżej trzecim w
ciągu życia
brak przyjaciół w
okresie dorastania
nadużywanie
substancji
depresja
niedawna
utrata
ważnego
emocjonaln
ie związku
nadużywanie
alkoholu przez
długi czas
trudności
interpersonalne w
jakimś okresie
życia
schizofrenia
utrata nadziei
wrogość
depresja
wyobrażenia
paranoidalne
cechy
obsesyjno-
kompulsyw
ne
podwyższo
ny poziom
subiektywn
ego
distressu
negatywna
postawa
wobec
leczenia
podwyższona
świadomość
upośledzając
ych skutków
choroby
wiek pomiędzy 20 a
40 lat
wczesny początek
schizofrenii
wysoka inteligencja
lub wykształcenie
dużo krótkich
hospitalizacji
poważne próby
samobójcze w
przeszłości
zaburzenie
stresu
pourazowego
współwystępo
wanie innych
zaburzeń
poczucie winy
(np. za
działania w
czasie walki
lub za fakt
przeżycia)
epizod utraty
kontroli podczas
walki
zaburzenia
osobowości:
antyspołeczna
, pograniczna
lub
zaburzenia
zachowania
zaburzenia
afektywne
nadużywanie
substancji
słaba
regulacja
afektu (tylko
przy
zaburzeniach
zachowania)
doznanie nadużyć
fizycznych lub
seksualnych w
jakimś okresie
życia (tylko przy
zaburzeniach
zachowania)
Posługiwanie się profilami z tabeli 11.31 przez diagnostę polega na sprawdzaniu, na
ile każdy z nich pasuje do konkretnej osoby, u której diagnozujemy ryzyko samobójstwa. W
razie stwierdzenia pewnego podobieństwa pod niektórymi względami, diagnosta wie, jakie
inne okoliczności lub właściwości tej osoby powinien rozpoznać. Na przykład Adam, którego
przypadek opisaliśmy wcześniej, zdaje się spełniać wiele warunków, charakterystycznych dla
profilu pierwszego: wykazuje objawy depresji i nadużywa alkoholu. Jednak, jak
wspominaliśmy wyżej, na podstawie wstępnej rozmowy nie stawia się rozpoznania – na razie
diagnosta ma jedynie hipotezy na temat depresji i uzależnienia Adama i obecnie
najpilniejszym zadaniem jest ich weryfikacja, w czym pomogą mu wyspecjalizowane
narzędzia diagnostyczne – najlepiej te, które poddano wszechstronnej ocenie w ramach EBA
(por. Joiner, Walker, Pettit, Perez i Cukrowicz, 2005 na temat diagnozy depresji oraz Babor,
de la Fuente, Saunders, Grant, 1996; Taracha, Habrat, Smela, Gruszyński, 2002 w kwestii
oceny uzależnienia od alkoholu). Gdyby weryfikacja tych hipotez wypadła pozytywnie, profil
pierwszy z tabeli 11.31 poprowadzi diagnostę do kolejnych czynników ryzyka, które należy
zdiagnozować, aby na ich podstawie ocenić ryzyko samobójstwa. Na przykład, Adam
relacjonował obniżoną koncentrację, nie wiadomo jednak, czy dotyczą go także pozostałe
czynniki zaostrzające: anhedonia (utrata zdolności doświadczania przyjemności), bezsenność,
lęk i ataki paniki – pomiar tych zmiennych stanowi więc kolejne zadanie diagnostyczne.
Generalnie w EBA istnieją opracowania na temat optymalnych dla różnych populacji i
w różnych kontekstach metod i strategii diagnozowania wielu różnych konstruktów
psychologicznych, prócz wymienionych wcześniej są to między innymi zaburzenia
osobowości (Widiger, Samuel, 2005), lęk i zaburzenia z nim związane (Antony, Orsillo i
Roemer, 2001; Antony i Rowa, 2005) czy brak satysfakcji ze związku u dorosłych (Snyder,
Heyman i Haynes, 2005), a także autyzm i zespół Aspergera (Ozonoff, Goodlin-Jones i
Solomon, 2005) czy ADHD u dzieci i młodzieży (Pelham, Fabiano i Massetti, 2005).
Trzeba też jasno stwierdzić, że młody nurt EBA nie jest oczywiście źródłem
wszystkich wiarygodnych i empirycznie ugruntowanych technik diagnostycznych, nie ma też
monopolu na ich ocenianie. Istnieje wiele procedur diagnostycznych, stworzonych wcześniej i
nie mających w nazwie hasła „EBA” , jednak po przeanalizowaniu okazują się jak najbardziej
spełniać postulaty diagnozy opartej na dowodach empirycznych. Tytułem przykładu można tu
wymienić procedury diagnozowania kompetencji osobistych oraz projekcyjne sposoby
pomiaru motywacji, stworzone przez Davida McClellanda i rozwijane następnie przez jego
współpracowników
(Smith, 1992; Spencer i Spencer, 1993), a na gruncie psychologii
polskiej – podejście Jana Strelaua i współpracowników do diagnozy temperamentu (Strelau i
Zawadzki, 1998; Zawadzki i Strelau , 1997). Strategie te i techniki diagnostyczne zostały
opracowane w sposób, który może uchodzić za wzorcowy z punktu widzenia standardów
diagnozy opartej na dowodach empirycznych. Niektóre z tych dawniejszych technik i strategii
zostały już explicite docenione w pracach z nurtu EBA, inne zapewne doczekają się tego
później.
Zachęcamy też Czytelników do samodzielnego poddawania różnych technik i strategii
diagnostycznych ocenie według standardów praktyki opartej na dowodach empirycznych.
Charakterystycznym rysem EBA jest wezwanie praktyków do stania się po trosze badaczami
we własnej praktyce. Diagnosta, który stoi przed konkretnym problemem czy decyzją
diagnostyczną, postąpi bowiem najlepiej – w myśl zaleceń EBA - jeśli dokona krytycznego
przeglądu prac badawczych na temat, którego dotyczy jego problem lub decyzja i wybierze na
tej podstawie sposób postępowania, który najlepiej odpowiada specyfice przypadku i
indywidualności diagnozowanej osoby. W ten sposób wypełni ideę EBA, która – jak
pisaliśmy na wstępie tego rozdziału – polega na integrowaniu najlepszych dostępnych
wyników badań naukowych z biegłością praktyczną, w zgodzie z indywidualnymi
wartościami, kultura i preferencjami osoby diagnozowanej.
2
W języku polskim z eksperymentami Mc Clellanda i współpracowników, prowadzonymi w tzw. paradygmacie
wzbudzania, można zapoznać się w pracy Katarzyny Stemplewskiej-Żakowicz (2004), natomiast o
diagnozowaniu kompetencji bliżej pisze Tamara Kasprzyk (2005).