Podstawy evidence based medicine (EBM), czyli o sztuce podejmowania trafnych decyzji w opiece nad pacjentami
dr med. Jacek Mrukowicz
Dyrektor Polskiego Instytutu Evidence Based Medicine w Krakowie
Opublikowano w Medycyna Praktyczna Ginekologia i Po艂o偶nictwo 2004/06
Wprowadzenie
Praktykowanie medycyny na wszystkich szczeblach systemu ochrony zdrowia - od opieki nad indywidualnym pacjentem do zarz膮dzania instytucjami, organizacjami lub ca艂ymi systemami opieki zdrowotnej - bardzo cz臋sto sprowadza si臋 do podejmowania decyzji (tab. 1). Wymagania stawiane w tym zakresie pracownikowi opieki zdrowotnej zwi臋kszaj膮 si臋 z roku na rok, a wraz z nimi ro艣nie ilo艣ciowo i jako艣ciowo codzienna potrzeba informacji dotycz膮cych rozpoznawania, rokowania, zapobiegania i leczenia chor贸b. Od lekarzy wymaga si臋 ju偶 nie tylko skutecznego i bezpiecznego, ale i szybkiego oraz op艂acalnego ekonomicznie post臋powania. Z powodu wzrastaj膮cych oczekiwa艅 i coraz wi臋kszej wiedzy pacjent贸w praca lekarza staje si臋 jeszcze bardziej z艂o偶ona.
Tabela 1. Przyk艂ady niekt贸rych rodzaj贸w decyzji podejmowanych na r贸偶nych szczeblach opieki zdrowotnej
lekarz |
艢rodki, jakimi dysponuje w tych zmaganiach lekarz, s膮 cz臋sto nieadekwatne - tradycyjne 藕r贸d艂a informacji s膮 bowiem zwykle:
飩 przestarza艂e (tradycyjne podr臋czniki, tradycyjne zalecenia ekspert贸w);
飩 wzajemnie sprzeczne (tradycyjne podr臋czniki, tradycyjne zalecenia ekspert贸w, opinie starszych koleg贸w);
飩 ma艂o skuteczne (proces nauczania oparty na tradycyjnych wyk艂adach ekspert贸w);
飩 nieprzydatne, gdy偶 "zalewaj膮" lekarza du偶膮 ilo艣ci膮 klinicznie nieistotnych i cz臋sto ma艂o wiarygodnych informacji (tradycyjne czasopisma medyczne [wg elektronicznej bazy publikacji medycznych MEDLINE tylko w 2003 roku opublikowano w nich 19 575 artyku艂贸w oryginalnych na temat leczenia i 16 701 takich artyku艂贸w na temat diagnostyki!]).
Ponadto, przeci臋tny lekarz (wg danych brytyjskich) nie chce lub nie mo偶e ze wzgl臋du na obowi膮zki zawodowe po艣wi臋ci膰 wi臋cej ni偶 30 minut tygodniowo na zdobywanie nowej wiedzy przydatnej do rozwi膮zywania aktualnych problem贸w klinicznych swoich pacjent贸w. Dochodzi wi臋c do sytuacji, w kt贸rej wielu lekarzy, w miar臋 up艂ywu czasu i nabywania jak偶e cennego do艣wiadczenia klinicznego, pos艂uguje si臋 wiedz膮 sprzed lat, niedostosowan膮 do coraz szybszego post臋pu medycyny. Trac膮 na tym zar贸wno pacjenci, jak i systemy ochrony zdrowia.
Do niedawna powy偶sze problemy by艂y niemo偶liwe do rozwi膮zania dla przeci臋tnego lekarza praktyka. W ci膮gu ostatnich kilku lat nast膮pi艂a jednak ewolucja (niekt贸rzy twierdz膮, 偶e nawet rewolucja) wielu aspekt贸w zmaga艅 ze stale zwi臋kszaj膮c膮 si臋 ilo艣ci膮 informacji medycznej. Nale偶y tu wymieni膰 nast臋puj膮ce kwestie:
飩 wypracowanie zasad szybkiej oceny wiarygodno艣ci nowych informacji (critical appraisal of evidence);
飩 opracowanie metod szybkiej syntezy nowych danych z danymi dost臋pnymi dotychczas (przegl膮dy systematyczne i metaanalizy);
飩 wytworzenie instrument贸w pozwalaj膮cych na zebranie oraz szybkie odszukanie klinicznie istotnej i wiarygodnej informacji (strukturalne streszczenia wiarygodnych bada艅 klinicznych i metaanaliz, zawieraj膮ce w zwi臋z艂ej formie najwa偶niejsze informacje potrzebne do podj臋cia decyzji w praktyce klinicznej, publikowane m.in. w postaci elektronicznych baz danych);
飩 wykszta艂cenie metod pozwalaj膮cych na kompleksow膮 ocen臋 dost臋pnych danych naukowych (r贸wnie偶 ocen臋 ekonomiczn膮 w postaci analizy ekonomicznej) i przetworzenie ich w form臋 wiarygodnych wytycznych post臋powania, maj膮cych zastosowanie kliniczne (evidence based clinical practice guidelines);
飩 wprowadzenie wszystkich powy偶szych idei do codziennej praktyki klinicznej, czyli proces okre艣lony jako evidence based medicine (EBM). Okre艣lenie to najlepiej odzwierciedla praktyczne aspekty zastosowania wymienionych instrument贸w w zapewnianiu optymalnej opieki medycznej. W Polsce u偶ywa si臋 r贸wnie偶 takich okre艣le艅, jak "praktyka medyczna oparta na wiarygodnych i aktualnych publikacjach" lub "medycyna oparta na faktach".
Jak nale偶y rozumie膰 EBM?
Fakt, 偶e s艂owo evidence (dane, przes艂anki, dowody) jest eksponowane w nazwie EBM, nie oznacza, 偶e dowody (evidence) wystarczaj膮 do podj臋cia decyzji. Nawet najbardziej wiarygodne dowody nigdy nie "podejm膮" decyzji za lekarza, stanowi膮 one jednak niezb臋dny element w tym procesie. Ignorowanie wiarygodnych dowod贸w mo偶e spowodowa膰 op贸藕nienie wprowadzenia do praktyki skutecznych metod rozpoznawania lub leczenia chor贸b (np. podanie glikokortykosteroid贸w ci臋偶arnym z zagra偶aj膮cym porodem przedwczesnym w celu zapobiegania zespo艂owi b艂on szklistych i zgonom przedwcze艣nie urodzonych noworodk贸w; p. dalej) albo stosowanie metod nieprzynosz膮cych korzy艣ci lub wr臋cz szkodliwych (np. hormonalna terapia zast臋pcza stosowana u kobiet w wieku pomenopauzalnym w pierwotnej i wt贸rnej profilaktyce choroby wie艅cowej; p. dalej).
Ka偶da indywidualna sytuacja kliniczna wymaga ustalenia prawdopodobnego rozpoznania oraz opcji post臋powania. Informacje charakteryzuj膮ce pacjenta, kt贸rego ma dotyczy膰 nasza decyzja, objawy kliniczne (lub choroba), z kt贸rymi si臋 zg艂asza, choroby wsp贸艂istniej膮ce i nasze wst臋pne podejrzenia co do najbardziej prawdopodobnych rozpozna艅 s膮 punktem wyj艣cia do poszukiwania optymalnego w danej sytuacji klinicznej post臋powania. Rozpoznaj膮c sytuacj臋 kliniczn膮 pacjenta, ustalamy r贸wnie偶 ryzyko podstawowe wyst膮pienia okre艣lonych zdarze艅 zdrowotnych (korzystnych i niekorzystnych). B艂臋dne ustalenia na tym wst臋pnym etapie powoduj膮, 偶e ca艂y dalszy wysi艂ek w poszukiwaniu mo偶liwych sposob贸w post臋powania p贸jdzie na marne, a podj臋ta przez nas decyzja b臋dzie nietrafna. Umiej臋tno艣ci lekarza i do艣wiadczenie kliniczne s膮 oczywi艣cie na tym etapie kluczem do sukcesu. Dost臋pne opcje post臋powania zale偶e膰 b臋d膮 r贸wnie偶 od uwarunkowa艅 danego systemu ochrony zdrowia.
Rozwa偶enie korzystnych i niekorzystnych skutk贸w mo偶liwych sposob贸w post臋powania, prawdopodobie艅stwa wyst膮pienia i wielko艣ci tych efekt贸w, wymaga na tym etapie znajomo艣ci wynik贸w wiarygodnych bada艅 naukowych zar贸wno obserwacyjnych, jak i - w coraz wi臋kszym stopniu - eksperymentalnych (zw艂aszcza bada艅 z randomizacj膮). W tym sensie koncepcja EBM wymaga od lekarzy (i innych pracownik贸w ochrony zdrowia decyduj膮cych o post臋powaniu) rozwa偶enia danych naukowych potencjalnie wp艂ywaj膮cych na ostateczn膮 decyzj臋 kliniczn膮 (lub administracyjn膮).
Elementem modyfikuj膮cym decyzje jest oczywi艣cie system warto艣ci i preferencji pacjenta, od kt贸rego zale偶y zakres dzia艂a艅, jakie pacjent jest sk艂onny podj膮膰 i kontynuowa膰. Interpretacja danych (evidence) w kontek艣cie warto艣ci jest sekwencj膮 decyzji b臋d膮cych wynikiem przeprowadzenia bilansu potencjalnych korzystnych i niekorzystnych skutk贸w rozwa偶anego post臋powania (czy korzy艣ci przewa偶aj膮 nad skutkami niekorzystnymi?); a je艣li jest on dodatni, to czy dodatkowe korzy艣ci zdrowotne s膮 warte poniesienia dodatkowych koszt贸w i innych niedogodno艣ci zwi膮zanych z proponowanym post臋powaniem (np. niewygodny spos贸b dawkowania leku, konieczno艣膰 regularnego wykonywania bada艅 kontrolnych itp.). Decyzje podj臋te na podstawie tych samych dowod贸w (evidence) mog膮 si臋 r贸偶ni膰, zale偶膮 bowiem od tego, kto podejmuje decyzj臋 i jaki system warto艣ci reprezentuje (np. pacjent patrz膮cy przez pryzmat swoich korzy艣ci vs osoby zarz膮dzaj膮ce systemem opieki zdrowotnej, kt贸re bior膮 pod uwag臋 mo偶liwo艣ci finansowe i korzy艣ci dla systemu opieki zdrowotnej).
Po艂膮czenie tych trzech rodzaj贸w uwarunkowa艅 wymaga od lekarza umiej臋tno艣ci rozpoznania stanu klinicznego, znajomo艣ci danych naukowych oraz zrozumienia sytuacji i mo偶liwo艣ci pacjenta, w tym jego emocji, rozterek, indywidualnych uwarunkowa艅 rodzinnych, kulturowych czy finansowych. Powy偶sze uwarunkowania decyzyjne przedstawiono na rysunku 1. Jak wida膰, dane z bada艅 naukowych stanowi膮 tylko jeden z kilku element贸w wp艂ywaj膮cych na decyzj臋 kliniczn膮, niemniej jednak niezb臋dny. EBM nale偶y wi臋c rozumie膰 jako normaln膮 praktyk臋 lekarsk膮 uwzgl臋dniaj膮c膮 w podejmowaniu decyzji wiarygodne i aktualne dane (dowody, evidence) z bada艅 naukowych.
W kontek艣cie podanych powy偶ej uwarunkowa艅 istot膮 EBM jest:
飩 identyfikacja luk w naszej wiedzy;
飩 zadanie w艂a艣ciwego, precyzyjnego pytania klinicznego;
飩 znalezienie danych i ocena ich wiarygodno艣ci;
飩 przedstawienie wynik贸w;
飩 sformu艂owanie odpowiedzi i jej zastosowanie w praktyce w odniesieniu do konkretnego pacjenta.
Rys. 1. Elementy uwzgl臋dniane w procesie podejmowania decyzji w opiece nad pacjentami wed艂ug zasad evidence based medicine (EBM).
Pierwszy, krytyczny etap
Pierwszym niezb臋dnym krokiem w praktykowaniu EBM jest u艣wiadomienie sobie, 偶e nie znamy najnowszych informacji dotycz膮cych problemu, z kt贸rym si臋 stykamy, lub mamy w膮tpliwo艣ci, czy nasza wiedza jest w tym zakresie aktualna i(lub) wystarczaj膮co szczeg贸艂owa. Krytyczny i pokorny stosunek do swojej wiedzy jest niezb臋dny do skutecznego praktykowania EBM. W tym zakresie EBM wymaga od niekt贸rych lekarzy zmiany postawy, co nie zawsze jest 艂atwe. By膰 mo偶e dlatego, 偶e na wielu szczeblach naszej edukacji - pocz膮wszy od szko艂y podstawowej - niewiedza (brak informacji) by艂a karana, a przyznanie si臋 do niej budzi艂o za偶enowanie. Ten l臋k (niech臋膰) mo偶na zwalczy膰, nabywaj膮c umiej臋tno艣ci zadawania precyzyjnych pyta艅, szybkiego dost臋pu do 藕r贸de艂 odpowiedzi oraz sprawnego wydobycia i oceny informacji. Uczenie si臋 - czyli zadawanie pyta艅 i znajdowanie odpowiedzi - na ka偶dym etapie drogi zawodowej lekarza powinno by膰 bowiem stymuluj膮ce i satysfakcjonuj膮ce.
Zadawanie precyzyjnych pyta艅 klinicznych
Na konferencjach naukowych, w niekt贸rych artyku艂ach przegl膮dowych, a tak偶e w codziennych dyskusjach lekarskich w szpitalu lub w przychodni do艣膰 cz臋sto mo偶na si臋 spotka膰 ze stwierdzeniem, 偶e "lek A jest skuteczny w chorobie X". Poniewa偶 stwierdzenie takie jest dalece nieprecyzyjne, mo偶na mie膰 wiele w膮tpliwo艣ci:
(1) Co to znaczy lek A? (jaka dawka? jak podawany? jak d艂ugo stosowany?)
(2) Co to znaczy skuteczny? (zwi臋ksza prawdopodobie艅stwo ust膮pienia objaw贸w? zmniejsza ryzyko nawrot贸w choroby? skraca czas utrzymywania si臋 objaw贸w? zmniejsza ryzyko powik艂a艅? zmniejsza nasilenie objaw贸w? poprawia jako艣膰 偶ycia? zmniejsza ryzyko zgonu w okre艣lonym czasie?)
(3) Co to znaczy choroba X? Czy lek jest skuteczny u wszystkich chorych na dan膮 chorob臋 bez wzgl臋du na ich wiek i stopie艅 jej zaawansowania?
(4) Lek jest skuteczny w por贸wnaniu z czym? (z niestosowaniem 偶adnego leku? z placebo? ze standardow膮, zaakceptowan膮 metod膮 leczenia?).
Ze wzgl臋du na nieprecyzyjno艣膰 powy偶szego stwierdzenia zastosowanie takiej informacji w praktyce obarczone jest ryzykiem podj臋cia b艂臋dnej decyzji, polegaj膮cej na nieuzasadnionym uog贸lnieniu efekt贸w okre艣lonej interwencji na wszystkie jej modyfikacje (np. schematy dawkowania), wszystkie grupy chorych i r贸偶ne sposoby mierzenia efektu. Poszukuj膮c w pi艣miennictwie danych (dowod贸w) na temat efekt贸w r贸偶nych opcji post臋powania, lekarz zainteresowany jest jednak konkretnym pacjentem, kt贸ry zg艂osi艂 si臋 do niego w okre艣lonym stanie klinicznym i u kt贸rego chcia艂by osi膮gn膮膰 okre艣lony efekt.
Aby unikn膮膰 nieporozumie艅, pytanie kliniczne musi by膰 wystarczaj膮co precyzyjne i zawiera膰 elementy opisu:
- pacjent贸w (populacji), u kt贸rych oceniano okre艣lon膮 metod臋 post臋powania (patients - P);
- interwencji, kt贸r膮 u nich zastosowano (intervention - I);
- interwencji, z kt贸r膮 j膮 por贸wnywano, tzn. interwencji w grupie kontrolnej (comparison - C);
- sposobu mierzenia efektu interwencji, czyli tzw. punkt贸w ko艅cowych (okre艣lonych zmian stanu zdrowia; outcome - O).
Struktur臋 precyzyjnego pytania klinicznego odzwierciedla akronim PICO, kt贸ry mo偶e u艂atwi膰 jej zapami臋tanie. Przyk艂ady prawid艂owo i nieprawid艂owo sformu艂owanych pyta艅 klinicznych przedstawiono w tabeli 2.
Tabela 2. Przyk艂ady prawid艂owo i nieprawid艂owo sformu艂owanych pyta艅 klinicznych *
Nieprawid艂owo |
Prawid艂owo |
Czy tamoksyfen jest skuteczny w raku sutka? |
Czy u kobiet w wieku 35-70 lat obci膮偶onych du偶ym ryzykiem zachorowania na raka sutka (P) tamoksyfen stosowany w dawce 20 mg na 24 h przez 5 lat (I) zmniejsza w por贸wnaniu z placebo (C) ryzyko wyst膮pienia raka sutka (O)? |
Czy podawanie lek贸w przeciwdepresyjnych jest korzystne w zespole napi臋cia przedmiesi膮czkowego? |
Czy u kobiet z ci臋偶k膮 postaci膮 zespo艂u napi臋cia przedmiesi膮czkowego (P) stosowanie doustne selektywnych inhibitor贸w zwrotnego wychwytu serotoniny przez okres co najmniej jednego cyklu miesi膮czkowego (I) zmniejsza w por贸wnaniu z placebo (C) nasilenie objaw贸w somatycznych i psychicznych tego zespo艂u (O)? |
Czy zak艂adanie szwu okr臋偶nego na szyjk臋 macicy jest skuteczne w niewydolno艣ci cie艣niowo-szyjkowej? |
Czy u kobiet z grupy du偶ego ryzyka porodu przedwczesnego (co najmniej 3 porody w II trymestrze ci膮偶y) (P) profilaktyczne zak艂adanie szwu okr臋偶nego na szyjk臋 macicy sposobem McDonalda przed 24. tygodniem ci膮偶y (I) zmniejsza w por贸wnaniu z niezak艂adaniem tego szwu lub stosowaniem leczenia zachowawczego (re偶im 艂贸偶kowy) (C) ryzyko porodu przedwczesnego przed 33. tygodniem ci膮偶y (O)? |
*Ka偶de precyzyjnie sformu艂owane pytanie kliniczne powinno zawiera膰 elementy opisu populacji pacjent贸w (P - patients), ocenianej interwencji (I - intervention), interwencji alternatywnej, z kt贸r膮 by艂a ona por贸wnywana (C - comparison), i sposobu pomiaru ich efektu (O - outcome). Struktur臋 prawid艂owo sformu艂owanego pytania klinicznego odzwierciedla akronim PICO.
Formu艂uj膮c pytanie kliniczne i oceniaj膮c publikacje medyczne pod wzgl臋dem ich przydatno艣ci w praktyce, nale偶y zwr贸ci膰 uwag臋 na wyb贸r w艂a艣ciwych, istotnych klinicznie punkt贸w ko艅cowych, czyli takich, kt贸re maj膮 istotne znaczenie dla pacjenta (np. zachorowanie, ust膮pienie objaw贸w choroby, zgon, z艂amanie ko艣ci, por贸d w terminie, urodzenie zdrowego dziecka). Badania kliniczne, w kt贸rych oceniano wp艂yw okre艣lonego post臋powania (interwencji) na wyst臋powanie takich punkt贸w ko艅cowych, dostarczaj膮 znacznie wa偶niejszych informacji dla praktyk贸w ni偶 te, w kt贸rych uwzgl臋dniano wy艂膮cznie tzw. zast臋pcze punkty ko艅cowe (np. st臋偶enie kreatyniny w surowicy, st臋偶enie gonadotropiny 艂o偶yskowej w surowicy, zapis kardiotokograficzny). Opieranie si臋 wy艂膮cznie na zast臋pczych punktach ko艅cowych mo偶e si臋 okaza膰 szkodliwe dla pacjent贸w.
殴r贸d艂a danych
EBM opiera si臋 na za艂o偶eniu, 偶e lekarze s膮 w stanie wy艂owi膰 spo艣r贸d ogromnej liczby publikacji te, kt贸re s膮 wiarygodne i jednocze艣nie maj膮 znaczenie kliniczne, tzn. wnioski z nich mo偶na bezpo艣rednio wykorzysta膰 w opiece nad pacjentami. Zadanie to jest jednak czasoch艂onne, wymaga odpowiedniej wiedzy z zakresu epidemiologii klinicznej, a zatem w praktyce ma nik艂e szanse powodzenia. Wynika to nie tylko z nat艂oku informacji (setki tysi臋cy artyku艂贸w publikowanych corocznie), ale tak偶e z faktu, 偶e wi臋kszo艣膰 doniesie艅 medycznych dotyczy zagadnie艅 niezwi膮zanych bezpo艣rednio z praktyk膮 lekarsk膮, a publikacje, z kt贸rych mo偶na by skorzysta膰, niejednokrotnie zawieraj膮 b艂臋dy metodologiczne albo przedstawiaj膮 dane naukowe wybi贸rczo; w efekcie tylko niewielka cz臋艣膰 publikacji zawiera wiedz臋 now膮 i wystarczaj膮co wiarygodn膮, kt贸r膮 mo偶na zastosowa膰 w praktyce (rys. 2).
Rys. 2. Dob贸r bada艅 medycznych przydatnych w praktyce
Zamiast si臋 zmaga膰 z mn贸stwem prac oryginalnych lekarz mo偶e korzysta膰 z nielicznych 藕r贸de艂 zawieraj膮cych publikacje wyselekcjonowane pod wzgl臋dem znaczenia klinicznego i wiarygodno艣ci. Podstaw膮 selekcji bada艅 jest za艂o偶enie, 偶e wyniki maj膮 r贸偶n膮 wiarygodno艣膰 w zale偶no艣ci od metodologii badania, a badania, w kt贸rych ocenia si臋 tzw. kliniczne punkty ko艅cowe (p. wy偶ej), dostarczaj膮 wa偶niejszych informacji ni偶 oceniaj膮ce wy艂膮cznie tzw. zast臋pcze punkty ko艅cowe. Do g艂贸wnych 藕r贸de艂 wyselekcjonowanych bada艅 przedstawionych w formie specjalnych streszcze艅 nale偶膮 czasopisma "ACP Journal Club" i "Evidence Based Medicine" oraz ich strony internetowe:
http://www.acpjc.org i http://www.evidencebasedmedicine.com.
W Polsce analogiczne streszczenia s膮 publikowane w czasopismach wydawanych przez Medycyn臋 Praktyczn膮 (z dziedziny ginekologii i po艂o偶nictwa w "Medycynie Praktycznej Ginekologii i Po艂o偶nictwie") i dost臋pne w internecie (http://www.mp.pl/artykuly).
Sposobem radzenia sobie z zalewem informacji s膮 tak偶e podsumowania bada艅 pierwotnych dotycz膮cych okre艣lonego zagadnienia, w postaci przegl膮d贸w systematycznych (tzw. badania wt贸rne), jak r贸wnie偶 aktualizowane na bie偶膮co wytyczne post臋powania, w kt贸rych uwzgl臋dniono wyniki dost臋pnych bada艅 pierwotnych i wt贸rnych.
Ocena wiarygodno艣ci danych
Wiarygodno艣膰 wynik贸w badania w zasadniczy spos贸b zale偶y od jego metodologii (rys. 3).
Badania eksperymentalne
Za najbardziej wiarygodne uznaje si臋 badania z randomizacj膮, czyli takie, w kt贸rych pacjent贸w kwalifikuje si臋 losowo do grupy eksperymentalnej (poddawanej ocenianej interwencji, np. otrzymuj膮cej nowy lek) lub do grupy kontrolnej (otrzymuj膮cej placebo albo poddawanej innej, sprawdzonej interwencji o znanych ju偶 efektach). Ten rodzaj bada艅 jest szczeg贸lnie przydatny do oceny skuteczno艣ci i bezpiecze艅stwa r贸偶nych metod leczenia lub profilaktyki. Celem randomizacji jest uzyskanie grup podobnych pod wzgl臋dem wszystkich czynnik贸w rokowniczych, zwanych zak艂贸caj膮cymi (a zw艂aszcza tych nieznanych), czyli o takim samym wyj艣ciowym ryzyku wyst膮pienia ocenianych punkt贸w ko艅cowych. Dzi臋ki temu jedyn膮 cech膮 r贸偶ni膮c膮 obie grupy jest oceniana interwencja i mo偶na jej w贸wczas przypisa膰 r贸偶nice w obserwowanych efektach (rys. 4). R贸偶nice mi臋dzy grupami w wielko艣ci tego ryzyka mog艂yby natomiast spowodowa膰 zafa艂szowanie (zawy偶enie lub zani偶enie) efekt贸w ocenianej interwencji. Wiarygodno艣膰 badania z randomizacj膮 zale偶y od poprawno艣ci jego przeprowadzenia, a uchybienia w tym zakresie zwi臋kszaj膮 ryzyko, 偶e zaobserwowane przez badaczy r贸偶nice efekt贸w b臋d膮 istotnie odbiega膰 od istniej膮cych w rzeczywisto艣ci (tzw. b艂臋dy systematyczne). W ocenie wiarygodno艣ci badania z randomizacj膮 nale偶y zwr贸ci膰 uwag臋 na nast臋puj膮ce szczeg贸艂y metodyczne: poprawno艣膰 randomizacji i jej utajnienie (allocation concealment); odsetek pacjent贸w, kt贸rzy uko艅czyli obserwacj臋 (completeness of follow-up); analiza zgodna z zaplanowanym leczeniem (intention-to-treat analysis); 艣lepa pr贸ba (maskowanie; blinding); interwencje dodatkowe (co-intervention).
Czy randomizacja by艂a przeprowadzona prawid艂owo? Istot膮 randomizacji jest zapewnienie wszystkim pacjentom takiej samej szansy dostania si臋 do grupy eksperymentalnej lub kontrolnej. Jej celem jest uzyskanie grup jednakowych pod wzgl臋dem czynnik贸w rokowniczych (znanych i nieznanych). Prawid艂ow膮 metod臋 randomizacji mo偶na por贸wna膰 do rzutu monet膮. Je偶eli natomiast kwalifikacja do grup odbywa si臋 na podstawie tylko pozornie losowych kryteri贸w (tzw. quasi-randomizacja), np. daty urodzenia (dni parzyste vs nieparzyste) czy pory dnia, w kt贸rej pacjent trafi艂 do szpitala (dzie艅 vs noc), do podzia艂u na grupy zostaje wprowadzona nier贸wnowaga czynnik贸w rokowniczych, kt贸ra mo偶e istotnie zniekszta艂ci膰 wyniki obserwacji. Mo偶na mie膰 w膮tpliwo艣ci, czy pacjent, kt贸ry zostaje przyj臋ty do szpitala w nocy, jest pod wzgl臋dem czynnik贸w rokowniczych taki sam, jak pacjent przyj臋ty w dzie艅, lub czy mo偶na postawi膰 znak r贸wno艣ci pomi臋dzy operacj膮 przeprowadzan膮 w nocy i w dzie艅. We wsp贸艂czesnych badaniach randomizacja jest zwykle przeprowadzana komputerowo (lista kod贸w randomizacyjnych generowana komputerowo).
Nawet je偶eli metoda randomizacji jest prawid艂owa, istnieje mo偶liwo艣膰 manipulowania kwalifikacj膮 pacjent贸w do grup, je艣li badacz w艂膮czaj膮cy kolejnych pacjent贸w do badania wie, do kt贸rej grupy maj膮 oni trafi膰 (eksperymentalnej czy kontrolnej). 艁atwo sobie wyobrazi膰 sytuacj臋, 偶e rzuca on monet膮 dot膮d, dop贸ki nie uzyska po偶膮danego rezultatu. Metod膮 uniemo偶liwiaj膮c膮 tego typu ingerencj臋 jest utajnienie randomizacji (allocation concealment). Mo偶e ono polega膰 na przyk艂ad na generowaniu listy randomizacyjnej poza miejscem prowadzenia badania i odpowiednim kodowaniu ocenianych lek贸w (dostarczanych w identycznych opakowaniach i formie) lub dostarczaniu informacji o interwencji w kodowanych, nieprzezroczystych kopertach (w przypadku interwencji operacyjnych), kt贸rych lekarz kwalifikuj膮cy do badania nie mo偶e otworzy膰. Utajnienie randomizacji jest zawsze mo偶liwe. Na podstawie analizy 250 bada艅 z randomizacj膮 stwierdzono, 偶e badania z prawid艂owym utajnieniem randomizacji wykaza艂y efekt interwencji o 30-40% mniejszy ni偶 badania bez niego lub z nieprawid艂owym utajnieniem. Sama metoda randomizacji nie mia艂a natomiast istotnego wp艂ywu na ocen臋 efekt贸w interwencji.
Czy wszyscy pacjenci, kt贸rzy rozpocz臋li badanie, zostali obj臋ci analiz膮 po jego zako艅czeniu (completeness of follow-up)? Liczba pacjent贸w obj臋tych analiz膮 powinna si臋 zgadza膰 z liczb膮 pacjent贸w w艂膮czonych do badania (poddanych randomizacji), lecz w praktyce rzadko udaje si臋 to osi膮gn膮膰. Problem polega na tym, 偶e osoby, kt贸re "wypadaj膮" z badania, cz臋sto r贸偶ni膮 si臋 od pacjent贸w uczestnicz膮cych w badaniu do ko艅ca. Bywa tak, 偶e lekarze ju偶 po rozpocz臋ciu badania wycofuj膮 osoby nie "pasuj膮ce" pod wzgl臋dem charakterystyki lub reakcji na leczenie. Niekiedy pacjenci sami si臋 wycofuj膮, poniewa偶 poczuli si臋 gorzej i uznaj膮 to za efekt badanej interwencji, albo poczuli si臋 lepiej i w zwi膮zku z tym nie widz膮 potrzeby kontynuowania czasoch艂onnych wizyt kontrolnych. Przyczyn膮 niestawienia si臋 pacjenta na wizyt臋 kontroln膮 mo偶e by膰 tak偶e jego 艣mier膰. W miar臋 zwi臋kszania si臋 liczby os贸b nieobj臋tych analiz膮 zwi臋ksza si臋 proporcjonalnie prawdopodobie艅stwo zachwiania r贸wnowagi czynnik贸w rokowniczych mi臋dzy badanymi grupami i wiarygodno艣膰 uzyskanych wynik贸w staje si臋 podwa偶alna. Przyjmuje si臋, 偶e w przypadku "utraty" oko艂o 20% badanej populacji problem ten nabiera zasadniczego znaczenia i powoduje, 偶e uzyskane wyniki (r贸偶nice) istotnie odbiegaj膮 od istniej膮cych w rzeczywisto艣ci.
Czy wszystkich pacjent贸w zanalizowano w grupach, do kt贸rych zostali przydzieleni na pocz膮tku badania (analiza intention-to-treat)? Analiz臋 wyst膮pienia punkt贸w ko艅cowych powinno si臋 przeprowadza膰 w grupach pacjent贸w wyodr臋bnionych w wyniku randomizacji, niezale偶nie od tego, czy ostatecznie poddano ich zaplanowanej interwencji, czy nie (analiza intention-to-treat, analiza wynik贸w w grupach wyodr臋bnionych zgodnie z zaplanowanym leczeniem). W ten spos贸b zostaje zachowana wyj艣ciowa r贸wnowaga znanych i nieznanych czynnik贸w rokowniczych mi臋dzy grupami, czyli istota randomizacji.
Czy spos贸b leczenia by艂 nieznany pacjentom i osobom oceniaj膮cym wyniki interwencji? Aby unikn膮膰 sytuacji, gdy korzy艣ci zwi膮zane z danym leczeniem s膮 pozorne i wynikaj膮 z samego faktu zastosowania interwencji, po kt贸rej pacjent i lekarz spodziewaj膮 si臋 poprawy (tzw. efekt placebo), nie za艣 z jej swoistego dzia艂ania - zar贸wno sami pacjenci, jak i badacze nie powinni wiedzie膰, jakiej interwencji (eksperymentalnej [np. badany lek] czy kontrolnej [np. placebo]) s膮 oni poddani. Ma to szczeg贸lne znaczenie w przypadku subiektywnych punkt贸w ko艅cowych (np. nat臋偶enia b贸lu). Taka metod膮 nazywa si臋 pr贸b膮 podw贸jnie 艣lep膮. Je偶eli tylko pacjenci nie wiedz膮, jakiej interwencji s膮 poddani, m贸wimy o pr贸bie pojedynczo 艣lepej, a gdy pacjenci i badacze znaj膮 przynale偶no艣膰 do grupy, mamy do czynienia z pr贸b膮 otwart膮. O ile utajnienie randomizacji jest zawsze mo偶liwe, to w pewnych sytuacjach klinicznych nie mo偶na zastosowa膰 艣lepej pr贸by (np. por贸wnanie metody operacyjnej z leczeniem zachowawczym).
Wspomniana ju偶 powy偶ej analiza 250 bada艅 z randomizacj膮 wykaza艂a r贸wnie偶, 偶e badania przeprowadzone metod膮 podw贸jnie 艣lepej pr贸by wykaza艂y o 4-29% mniejszy efekt interwencji ni偶 badania bez niej.
Czy poza badan膮 interwencj膮 pacjenci w obu grupach byli traktowani podobnie (co-intervention)? Zaobserwowana r贸偶nica efekt贸w interwencji eksperymentalnej i kontrolnej mo偶e by膰 wynikiem r贸偶nej opieki nad pacjentami w badanych grupach (np. cz臋stszych wizyt kontrolnych lub cz臋stszego stosowania dodatkowych lek贸w w jednej z grup), a nie rzeczywistej przewagi jednej z nich.
Badania obserwacyjne
Badania obserwacyjne (nieeksperymentalne; rys. 3) tym si臋 r贸偶ni膮 od bada艅 eksperymentalnych, 偶e poddanie pacjent贸w danej interwencji lub ekspozycja na dany czynnik nie zale偶y od badaczy. Tego rodzaju badania przeprowadza si臋 g艂贸wnie w celu oceny szkodliwo艣ci i czynnik贸w rokowniczych, zw艂aszcza gdy odpowiednie badanie z randomizacj膮 nie jest mo偶liwe. Do bada艅 obserwacyjnych nale偶膮 badania analityczne (kohortowe, kliniczno-kontrolne i przekrojowe) oraz badania opisowe (opis przypadku lub serii przypadk贸w), kt贸re w przeciwie艅stwie do bada艅 analitycznych nie maj膮 grupy kontrolnej.
Dla wiarygodno艣ci wynik贸w bada艅 analitycznych, podobnie jak w przypadku bada艅 eksperymentalnych, zasadnicze znaczenie ma w艂a艣ciwe dobranie grupy kontrolnej, tak aby r贸偶ni艂y si臋 tylko ocenian膮 ekspozycj膮. Tworzenie grupy kontrolnej w inny spos贸b ni偶 poprzez randomizacj臋 nie eliminuje jednak potencjalnego wp艂ywu nieznanych czynnik贸w rokowniczych, dlatego wiarygodno艣膰 wynik贸w tych bada艅 jest mniejsza ni偶 bada艅 z randomizacj膮 (p. dalej przyk艂ad z hormonaln膮 terapi膮 zast臋pcz膮).
Badanie obserwacyjne, w kt贸rym ocenia si臋 prospektywnie wyst膮pienie okre艣lonego punktu ko艅cowego (np. porodu przedwczesnego) w grupach (kohortach) os贸b nara偶onych i nienara偶onych na dany czynnik (np. cukrzyca) lub interwencj臋 (np. stosowanie lek贸w przeciwhistaminowych), u kt贸rych ten punkt ko艅cowy na pocz膮tku obserwacji nie wyst臋powa艂, nazywamy badaniem kohortowym. Je偶eli natomiast w celu wykazania zwi膮zku mi臋dzy dan膮 ekspozycj膮 a wyst膮pieniem okre艣lonego punktu ko艅cowego por贸wnuje si臋 retrospektywnie ekspozycj臋 (odsetek nara偶onych) w grupie os贸b, u kt贸rych punkt ko艅cowy wyst膮pi艂, z ekspozycj膮 w odpowiednio dobranej grupie os贸b kontrolnych, u kt贸rych punkt ko艅cowy nie wyst膮pi艂 - to mamy do czynienia z badaniem kliniczno-kontrolnym.
Badanie zwi膮zku mi臋dzy wyst臋powaniem okre艣lonej choroby a ekspozycj膮 na dany czynnik w okre艣lonej populacji i jednym punkcie czasowym to badanie przekrojowe. Ekspozycj臋 i wyst膮pienie punktu ko艅cowego (choroby) ocenia si臋 jednocze艣nie, w przeciwie艅stwie do bada艅 kliniczno-kontrolnych (wychodzi si臋 od punktu ko艅cowego i wstecz ocenia ekspozycj臋) i kohortowych (wychodzi si臋 od ekspozycji i prospektywnie ocenia wyst臋powanie punktu ko艅cowego).
Opisy przypadk贸w (pojedynczych lub serii) prawie nigdy nie pozwalaj膮 wyci膮ga膰 wniosk贸w o zwi膮zkach przyczynowo-skutkowych, poniewa偶 nie maj膮 grupy kontrolnej. Ich wiarygodno艣膰, z wyj膮tkiem skrajnych przypadk贸w, jest mniejsza ni偶 bada艅 z grup膮 kontroln膮 (eksperymentalnych i analitycznych); s膮 jednak po偶yteczne, gdy偶 sygnalizuj膮 potencjalne problemy, kt贸re mog膮 si臋 sta膰 przedmiotem bardziej wiarygodnych bada艅.
Przegl膮dy systematyczne i metaanalizy
Jako艣ciowy przegl膮d wszystkich bada艅 dotycz膮cych tego samego problemu klinicznego, z u偶yciem odpowiednich metod zmniejszaj膮cych b艂臋dy systematyczne (z g贸ry okre艣lony spos贸b wyszukiwania wszystkich bada艅 dotycz膮cych tego problemu, okre艣lone kryteria kwalifikacji i dyskwalifikacji odszukanych bada艅, ocena jako艣ci [wiarygodno艣ci] zakwalifikowanych bada艅, ocena prowadzona r贸wnolegle przez 2 badaczy) nazywa si臋 przegl膮dem systematycznym (systematic review). W uzasadnionych przypadkach (ten sam precyzyjnie okre艣lony problem kliniczny; odpowiednia do pytania klinicznego, wiarygodna metodyka bada艅; podobna populacja; podobne interwencje; te same punkty ko艅cowe) mo偶e on obejmowa膰 metaanaliz臋, czyli ilo艣ciow膮 syntez臋 wynik贸w wielu bada艅 za pomoc膮 odpowiednich metod statystycznych.
Hierarchia dowod贸w naukowych
Kliniczne badania naukowe (rys. 3) mo偶na uszeregowa膰 pod wzgl臋dem wiarygodno艣ci ich wynik贸w od najbardziej do najmniej wiarygodnych (wraz ze schodzeniem na ni偶szy poziom zwi臋ksza si臋 ryzyko, 偶e zaobserwowany efekt istotnie odbiega od rzeczywi艣cie istniej膮cego):
- metaanalizy bada艅 z randomizacj膮 (metaanalysis);
- badania z randomizacj膮 (randomised controlled trial - RCT);
- badania eksperymentalne z grup膮 kontroln膮 bez randomizacji;
- badania kohortowe (cohort study);
- badania kliniczno-kontrolne (case-controlled study);
- badania przekrojowe (cross sectional study);
- opis przypadku (case report) lub serii przypadk贸w (case series).
Rys. 3. Rodzaje bada艅 epidemiologicznych
Przedstawianie wynik贸w bada艅 - podstawowe poj臋cia
Przedstawianie wynik贸w bada艅 klinicznych sprowadza si臋 najcz臋艣ciej do por贸wnania badanych grup pod wzgl臋dem 艣rednich warto艣ci mierzonego parametru (np. wysoko艣ci ci艣nienia t臋tniczego, st臋偶enia glukozy we krwi itp.) lub do oceny cz臋sto艣ci (prawdopodobie艅stwa, ryzyka) wyst膮pienia jakiego艣 stanu zdrowotnego (np. zachorowanie, zgon). W pierwszym przypadku oceniamy r贸偶nic臋 艣rednich, czyli na przyk艂ad r贸偶nic臋 ci艣nienia t臋tniczego. Nieco wi臋cej mo偶liwo艣ci daje przedstawianie wynik贸w w formie ryzyka (prawdopodobie艅stwa) i por贸wnywania tych prawdopodobie艅stw. W takich przypadkach wyniki bada艅 na temat skuteczno艣ci okre艣lonych interwencji s膮 przedstawiane, je艣li tylko jest to mo偶liwe, zar贸wno za pomoc膮 parametr贸w wzgl臋dnych (np. ryzyko wzgl臋dne lub wzgl臋dne zmniejszenie ryzyka), jak i bezwzgl臋dnych (np. bezwzgl臋dne zmniejszenie ryzyka i NNT), gdy偶 korzystanie tylko z jednych mo偶e by膰 myl膮ce.
Przyk艂ad 1*
cz臋sto艣膰 (ryzyko) rzucawki w grupie otrzymuj膮cej siarczan magnezu - 0,8%, a w grupie placebo - 1,9%
* przybli偶one wyniki badania Magpie, w kt贸rym stosowano 50% roztw贸r siarczanu magnezu u ci臋偶arnych i kobiet do 24 h po porodzie z rozpoznaniem stanu przedrzucawkowego (skurczowe ci艣nienie krwi >=140 mm Hg lub rozkurczowe >=90 mm Hg stwierdzone co najmniej 2-krotnie oraz bia艂komocz o nasileniu co najmniej 1+), ale bez innych objaw贸w zapowiadaj膮cych wyst膮pienie rzucawki (The Lancet, 2002; 359: 1877 i Med. Prakt. - Ginekol. Po艂o偶., 2002; 5-6: 49) |
Bezwzgl臋dne zmniejszenie ryzyka (absolute risk reduction - ARR) to bezwzgl臋dna r贸偶nica mi臋dzy ryzykiem w grupie kontrolnej a ryzykiem w grupie eksperymentalnej, okre艣laj膮ca bezwzgl臋dn膮 wielko艣膰 "usuni臋tego" ryzyka.
Ryzyko wzgl臋dne (relative risk - RR) okre艣la, jaka cz臋艣膰 ryzyka podstawowego (tzn. ryzyka w grupie kontrolnej) "pozosta艂a" po interwencji. Jest to iloraz prawdopodobie艅stwa wyst膮pienia okre艣lonego punktu ko艅cowego w grupie eksperymentalnej, w kt贸rej stosuje si臋 ocenian膮 interwencj臋 i tego prawdopodobie艅stwa w grupie kontrolnej. W badaniach zwi膮zk贸w przyczynowo-skutkowych (np. dotycz膮cych rokowania) jest to analogicznie iloraz prawdopodobie艅stwa wyst膮pienia okre艣lonego punktu ko艅cowego w grupie, w kt贸rej wyst臋puje dany czynnik, i tego prawdopodobie艅stwa w grupie kontrolnej.
Wzgl臋dne zmniejszenie ryzyka (relative risk reduction - RRR) stanowi cz臋艣膰 prawdopodobie艅stwa (ryzyka) wyst膮pienia niekorzystnego punktu ko艅cowego "usuni臋t膮" w wyniku zastosowania okre艣lonej interwencji (leku lub zabiegu). Jest ilorazem bezwzgl臋dnej r贸偶nicy ryzyka mi臋dzy grup膮 kontroln膮 a eksperymentaln膮 (ARR) oraz ryzyka w grupie kontrolnej. Ryzyko "pozosta艂e" (RR) i ryzyko "usuni臋te" (RRR) dope艂niaj膮 si臋 do jedno艣ci (RR + RRR = 1).
NNT (number needed to treat) jest to liczba pacjent贸w, kt贸rych trzeba podda膰 danej interwencji przez okre艣lony czas, aby zapobiec jednemu niekorzystnemu punktowi ko艅cowemu. NNT wylicza si臋 jako odwrotno艣膰 ARR (1/ARR).
Rys. 4. Schemat badania z randomizacj膮 (randomised controlled trial - RCT). Istot膮 randomizacji jest losowa kwalifikacja pacjent贸w do grupy eksperymentalnej i kontrolnej, a jej celem jest uzyskanie grup wyj艣ciowo jednakowych pod wzgl臋dem czynnik贸w rokowniczych (tzw. zak艂贸caj膮cych). Na tym etapie znaczenie ma poprawno艣膰 randomizacji i jej utajnienie (allocation concealment; p. tekst). Wiarygodno艣膰 badania z randomizacj膮 zale偶y r贸wnie偶 od tego, czy grupy s膮 jednakowe pod wzgl臋dem czynnik贸w rokowniczych tak偶e na ko艅cu obserwacji. Gwarantuje to jak najwi臋kszy (>80%) odsetek pacjent贸w, kt贸rzy uko艅czyli obserwacj臋 (completeness of follow-up; p. tekst) oraz analiza zgodna z zaplanowanym leczeniem (intention-to-treat analysis; p. tekst). Zwi臋kszenie obiektywno艣ci oceny efekt贸w interwencji zapewnia 艣lepa pr贸ba (maskowanie [blinding]; p. tekst).
W doniesieniach z bada艅 naukowych spotyka si臋 tak偶e nast臋puj膮ce parametry:
Bezwzgl臋dne zwi臋kszenie ryzyka (absolute risk increase - ARI), czyli bezwzgl臋dna r贸偶nica pomi臋dzy ryzykiem w grupie eksperymentalnej i w grupie kontrolnej. Okre艣la, o ile zwi臋kszy艂o si臋 ryzyko wyst膮pienia niekorzystnego punktu ko艅cowego w wyniku ekspozycji na dany czynnik lub interwencj臋.
Wzgl臋dne zwi臋kszenie ryzyka (relative risk increase - RRI), czyli cz臋艣膰 prawdopodobie艅stwa (ryzyka) wyst膮pienia niekorzystnego punktu ko艅cowego "dodana" w wyniku zastosowania okre艣lonej interwencji (leku lub zabiegu). Iloraz ryzyka "dodanego" (ARI) i ryzyka w grupie kontrolnej. Poj臋cie stosowane w badaniach, w kt贸rych oceniana interwencja zwi臋ksza prawdopodobie艅stwo wyst膮pienia niekorzystnego punktu ko艅cowego (np. powik艂ania leczenia).
NNH (number needed to harm), czyli liczba pacjent贸w, kt贸rych poddanie okre艣lonej interwencji przez okre艣lony czas wi膮偶e si臋 z wyst膮pieniem jednego dodatkowego niekorzystnego punktu ko艅cowego. NNH wylicza si臋 jako odwrotno艣膰 ARI (1/ARI).
Hazard wzgl臋dny (hazard ratio - HR) - pod wzgl臋dem interpretacyjnym poj臋cie analogiczne do ryzyka wzgl臋dnego. Jest wynikiem analizy krzywych lub tabeli prze偶ywalno艣ci. Okre艣la wzgl臋dne prawdopodobie艅stwo zaj艣cia jakiego艣 zdarzenia w badanych grupach w okre艣lonym czasie przy za艂o偶eniu, 偶e zdarzenie to do tej pory nie wyst膮pi艂o (w uproszczeniu: okre艣la cz臋艣膰 ryzyka podstawowego "pozosta艂膮" po interwencji).
Iloraz szans (odds ratio - OR), czyli iloraz szansy wyst膮pienia okre艣lonego stanu klinicznego w grupie eksponowanej na dany czynnik lub interwencj臋 i szansy wyst膮pienia tego stanu w grupie nieeksponowanej (kontrolnej). W badaniach kliniczno-kontrolnych mo偶e to by膰 iloraz szansy nara偶enia na potencjalny czynnik sprawczy w grupie, w kt贸rej okre艣lony punkt ko艅cowy wyst膮pi艂, i szansy nara偶enia na ten sam czynnik w grupie kontrolnej. Szansa jest to stosunek prawdopodobie艅stwa wyst膮pienia okre艣lonego stanu klinicznego do prawdopodobie艅stwa jego nie wyst膮pienia w danej grupie.
Istotno艣膰 statystyczna i kliniczna
Niezale偶nie od parametr贸w u偶ytych do przedstawiania wynik贸w badania autorzy podaj膮 zwykle prawdopodobie艅stwo (poziom istotno艣ci statystycznej, warto艣膰 p), z jakim zaobserwowana w badaniu lub wi臋ksza r贸偶nica (zale偶no艣膰) mi臋dzy badanymi grupami mo偶e by膰 dzie艂em przypadku, zak艂adaj膮c, 偶e w rzeczywisto艣ci r贸偶nica ta nie istnieje. Warto艣膰 p nieod艂膮cznie zwi膮zana jest z testowaniem hipotez statystycznych i z punktu widzenia lekarza praktyka, zainteresowanego wyborem optymalnej metody post臋powania u konkretnego pacjenta, jest raczej trudna do interpretacji i niesie niewiele informacji.
Wi臋cej m贸wi natomiast przedzia艂 ufno艣ci (confidence interval - CI), kt贸ry dodatkowo informuje o najbardziej prawdopodobnej wielko艣ci, kierunku i zakresie mo偶liwych warto艣ci zaobserwowanego efektu; okre艣la stopie艅 precyzji (a raczej braku precyzji) danego oszacowania. Zwykle podaje si臋 95% CI, czyli przedzia艂, w kt贸rym z 95% pewno艣ci膮 znajduje si臋 prawdziwa warto艣膰 danego parametru (np. ARR, RR, NNT itd.) w badanej populacji. Je艣li w tym przedziale zawarte jest 0 dla r贸偶nicy ryzyka, a 1 - dla ryzyka wzgl臋dnego, hazardu wzgl臋dnego albo ilorazu szans, to jest to r贸wnoznaczne z brakiem istotno艣ci statystycznej danego wyniku (p >0,05). W powy偶szym przyk艂adzie 95% CI dla RR wyni贸s艂 0,29-0,6, a dla NNT - 63-143.
Analizuj膮c wyniki ka偶dego badania, najpierw trzeba sprawdzi膰, czy uzyskane wyniki s膮 istotne statystycznie, a nast臋pnie czy s膮 klinicznie istotne (tzn. czy r贸偶nice mi臋dzy grupami s膮 wystarczaj膮co du偶e, aby uzna膰 je za warto艣ciowe w praktyce). Bywa to trudniejsze ni偶 ustalenie istotno艣ci statystycznej, a ponadto podlega subiektywnej interpretacji.
Przedstawienie wynik贸w metaanalizy
Wyniki zbiorczej analizy obejmuj膮cej wszystkie wiarygodne badania pierwotne dotycz膮ce tego samego problemu klinicznego (tzn. podobnej populacji i interwencji oraz takich samych punkt贸w ko艅cowych), czyli metaanalizy (p. wy偶ej), s膮 standardowo przedstawiane w postaci graficznej (tzw. forrest plot; p. przyk艂ad 2.). Metaanaliza bada艅 z randomizacj膮 znajduje si臋 najwy偶ej w hierarchii wiarygodno艣ci danych.
W pierwszej kolumnie takiego wykresu podane s膮 badania obj臋te analiz膮 (zwykle wraz z dat膮 ich publikacji), w drugiej i trzeciej - liczba pacjent贸w w por贸wnywanych grupach (og贸lna [N] i liczba tych, u kt贸rych wyst膮pi艂 dany punkt ko艅cowy [n]). Pionowa linia w centrum wykresu wyznacza brak r贸偶nicy pomi臋dzy grupami, wyra偶onej tu jako iloraz szans (OR). R贸偶nicy nie ma, je艣li OR (dotyczy to tak偶e RR i HR) wynosi 1 (a 0 w przypadku ARR i RRR). Wynik ka偶dego z poszczeg贸lnych bada艅 jest przedstawiony jako punkt na odcinku odzwierciedlaj膮cym jego precyzj臋 (czyli 95% przedzia艂 ufno艣ci). Ka偶dy punkt na lewo od pionowej linii (tzn. warto艣ci OR <1) oznacza przewag臋 ocenianej interwencji (w tym wypadku glikokortykosteroid贸w), na prawo (tzn. warto艣ci OR >1) - przewag臋 placebo. Przeci臋cie si臋 odcink贸w wyznaczaj膮cych przedzia艂y ufno艣ci z pionow膮 lini膮 braku r贸偶nicy jest r贸wnoznaczne z brakiem istotno艣ci statystycznej. Najni偶szy punkt (romb) przedstawia iloraz szans (w niekt贸rych przypadkach mo偶e to by膰 RR, ARR lub RRR) b臋d膮cy wynikiem zbiorczej analizy wszystkich bada艅, czyli metaanalizy. Zwraca tu uwag臋 bardziej precyzyjne oszacowanie efektu interwencji - znacznie w臋偶szy przedzia艂 ufno艣ci. W kolumnie znajduj膮cej si臋 najbardziej na prawo przedstawiono warto艣ci ilorazu szans (wraz z 95% CI) dla poszczeg贸lnych bada艅 zakwalifikowanych do analizy, a w ostatnim wierszu zbiorczy wynik metaanalizy.
Przyk艂ad 2*
* iloraz szans (OR) zgonu noworodka po zastosowaniu jednego kursu kortykosteroid贸w (betametazon 2 razy po 12 mg co 12 h lub deksametazon 4 razy 6 mg co 6 h), w por贸wnaniu z placebo lub niestosowaniem lek贸w, u ci臋偶arnych z zagra偶aj膮cym porodem przedwczesnym przed 34. tygodniem ci膮偶y
(na podstawie: Crowley P.: Prophylactic corticosteroids for preterm birth. The Cochrane Database of Systematic Reviews, 2004, wyd. 2 [data ostatniej aktualizacji: luty 1999])
Przedstawiona metaanaliza, przeprowadzona w 1994 roku, jest r贸wnie偶 dobrym przyk艂adem, jak synteza kilku lub kilkunastu r贸偶nych bada艅 odpowiadaj膮cych na to samo pytanie kliniczne, z kt贸rych wiele pojedynczo nie mia艂o wystarczaj膮cej mocy statystycznej, aby wykaza膰 statystycznie istotn膮 r贸偶nic臋 pomi臋dzy grupami (odcinek obrazuj膮cy 95% CI przecina pionow膮 lini臋 braku efektu), mo偶e przyspieszy膰 wprowadzenie skutecznej, ratuj膮cej 偶ycie interwencji do praktyki klinicznej. Jej wyniki przyczyni艂y si臋 do opracowania w 1994 roku przez ekspert贸w zaproszonych przez ameryka艅skie National Institutes of Health wytycznych, w kt贸rych zalecono powszechne stosowanie jednego kursu kortykosteroid贸w (24 mg w ci膮gu 48 h) u ci臋偶arnych z zagra偶aj膮cym porodem przedwczesnym w profilaktyce zgon贸w wcze艣niak贸w, zespo艂u b艂on szklistych i jego powik艂a艅. W USA w 1990 roku interwencj臋 t臋 zastosowano u matek tylko 15% noworodk贸w urodzonych przed 34. tygodniem ci膮偶y, natomiast w 1994 roku, po konferencji, na kt贸rej zaprezentowano wytyczne - u 41%. Gdyby metaanaliz臋 przeprowadzono w pierwszej po艂owie lat 80. ubieg艂ego wieku, ju偶 w贸wczas wykaza艂aby ona skuteczno艣膰 omawianej interwencji. Ignorowanie wynik贸w bada艅 z randomizacj膮 i b艂臋dy w ich interpretacji spowodowa艂y, 偶e przez ponad 14 lat nie stosowano powszechnie skutecznej interwencji ratuj膮cej 偶ycie 1 na ka偶dych 25 noworodk贸w urodzonych przedwcze艣nie (NNT: 25; 95% CI: 16-50).
Tabela 3. Wp艂yw HTZ (skoniugowane estrogeny ko艅skie i octan medroksyprogesteronu) w por贸wnaniu z placebo u zdrowych kobiet po menopauzie w okresie 艣r. 5,2 roku
Punkt ko艅cowy |
Placebo (%) |
HTZ (%) |
RRI* (95% Cl) |
NNH* (95% Cl) |
incydent wie艅cowy |
1,5 |
2 |
29% (2-62) |
231 (106-3337) |
zgon z przyczyn wie艅cowych |
0,3 |
0,4 |
18% (od -30 do 97) |
- |
zawa艂 serca niezako艅czony zgonem |
1 |
2 |
32% (2-71) |
267 (119-4263) |
inwazyjny rak sutka |
1,5 |
2 |
26% (0-58) |
254 (112-niesko艅czono艣膰) |
wszystkie nowotwory 艂膮cznie |
6 |
6 |
3% (od -10 do 16) |
- |
zakrzepica 偶y艂 g艂臋bokich |
0,6 |
1 |
106% (49-185) |
147 (84-320) |
zator t臋tnicy p艂ucnej |
0,4 |
0,8 |
113% (39-224) |
234 (118-677) |
偶ylna choroba zakrzepowo-zatorowa |
0,8 |
1,8 |
110% (58-180) |
110 (67-209) |
udar m贸zgu |
1 |
1,5 |
41% (7-84) |
234 (113-1368) |
og贸lna chorobowo艣膰** |
8 |
9 |
14% (3-27) |
91 (49-452) |
聽 |
聽 |
聽 |
RRR* (95% Cl) |
NNT* (95% Cl) |
zgony og贸艂em |
3 |
3 |
2% (od -18 do 18) |
- |
rak jelita grubego |
0,8 |
0,5 |
37% (8-57) |
326 (212-1512) |
rak trzonu macicy |
0,3 |
0,3 |
17% (od -47 do 53) |
- |
z艂amanie bli偶szego odcinka ko艣ci udowej |
0,8 |
0,5 |
34% (2-55) |
383 (237-6518) |
z艂amanie kr臋gu |
0,7 |
0,5 |
34% (2-56) |
398 (242-6781) |
inne z艂amanie osteoporotyczne |
9 |
7 |
22% (13-30) |
52 (38-86) |
wszystkie z艂amania 艂膮cznie |
10 |
8 |
23% (14-30) |
45 (34-72) |
zgon z innych przyczyn |
2 |
2 |
8% (od -14 do 26) |
- |
* RRR, RRI, NNT, NNH wyliczone przez autor贸w streszczenia na podstawie danych zawartych w artykule
** wyst膮pienie jako pierwszego kt贸regokolwiek z nast臋puj膮cych punkt贸w ko艅cowych: choroby wie艅cowej, inwazyjnego raka sutka, udaru m贸zgu, zatoru t臋tnicy p艂ucnej, raka trzonu macicy, raka jelita grubego, z艂amania bli偶szego odcinka ko艣ci udowej lub zgonu z innych przyczyn
Wyniki badania WHI na podstawie 17. pozycji pi艣miennictwa
Tabela 4. Niekt贸re wa偶ne cechy wytycznych praktyki klinicznej (clinical practice guidelines) decyduj膮ce o ich jako艣ci (wiarygodno艣ci) wg Instrumentu AGREE*
Zakres i cel
* "Jako艣膰" zdefiniowano jako pewno艣膰, 偶e b艂臋dy systematyczne zwi膮zane z opracowywaniem, przedstawianiem i u偶yteczno艣ci膮 wytycznych zosta艂y zminimalizowane. |
Opublikowane pod koniec lat 90. ubieg艂ego wieku oraz w latach 2002 i 2004 wyniki bada艅 z randomizacj膮, zaplanowanych w celu zweryfikowania hipotez i zalece艅 sformu艂owanych na podstawie bada艅 obserwacyjnych, nie potwierdzi艂y korzystnego dzia艂ania HTZ (estrogen z progestagenem lub sam estrogen) w tym zakresie, a nawet wskazywa艂y na wiele skutk贸w niekorzystnych lub jednoznacznie szkodliwych. W badaniu HERS (Heart and Estrogen/Progestin Replacement Study) i HERS II wykazano, 偶e stosowanie przez kobiety po menopauzie z potwierdzon膮 chorob膮 wie艅cow膮 skoniugowanych estrogen贸w ko艅skich i octanu medroksyprogesteronu przez 4-6,8 roku nie zmniejszy艂o ryzyka wyst膮pienia incydent贸w sercowo-naczyniowych. W grupie stosuj膮cej HTZ w por贸wnaniu z grup膮 placebo zaobserwowano znamienne zwi臋kszenie ryzyka zakrzepicy 偶y艂 g艂臋bokich w ci膮gu pierwszych 4 lat (HR: 2,82; 95% CI: 1,32-6,04) i zatoru t臋tnicy p艂ucnej podczas 6,8 roku obserwacji (HR: 2,86; 95% CI: 1,13-7,26). Wi臋ksza by艂a r贸wnie偶 cz臋sto艣膰 operacji dr贸g 偶贸艂ciowych (HR: 1,48; 95% CI: 1,12-1,95).
Inne badanie z randomizacj膮, WHI, dotyczy艂o pierwotnej profilaktyki chor贸b sercowo-naczyniowych u zdrowych kobiet w wieku pomenopauzalnym z u偶yciem d艂ugotrwale stosowanej estrogenowo-progestagenowej HTZ. Badanie to przerwano po 5 latach ze wzgl臋du na niekorzystny bilans ryzyka i korzy艣ci ocenianej metody HTZ (tab. 3). W ramieniu estrogenowym badania WHI bra艂y udzia艂 kobiety w wieku pomenopauzalnym po histerektomii, u kt贸rych stosowano same estrogeny (estrogenowa terapia zast臋pcza - ETZ). To badanie r贸wnie偶 przerwano w lutym 2004 roku, poniewa偶 nie stwierdzono wp艂ywu ETZ na cz臋sto艣膰 wyst臋powania incydent贸w wie艅cowych (g艂贸wny ko艅cowy punkt badania), a odnotowano znamienne zwi臋kszenie ryzyka udaru w艣r贸d kobiet stosuj膮cych ETZ w por贸wnaniu z grup膮 placebo (HR: 1,39; 95% CI: 1,1-1,77) oraz ryzyka zakrzepicy 偶y艂 g艂臋bokich (HR: 1,47; 95% CI: 1,04-2,08).
Wytyczne praktyki klinicznej
Wytyczne praktyki klinicznej (clinical practice guidelines) maj膮 pomaga膰 lekarzom w podejmowaniu w艂a艣ciwych decyzji co do post臋powania z pacjentami w okre艣lonych okoliczno艣ciach. Stanowi膮 one pr贸b臋 syntezy wynik贸w bada艅 naukowych i przeniesienia ich do praktyki w postaci jasno sformu艂owanych zalece艅 dla lekarzy, uwzgl臋dniaj膮cych r贸wnie偶 bilans korzystnych i niekorzystnych efekt贸w post臋powania, a czasem tak偶e bilans koszt贸w, jakie trzeba ponie艣膰, aby osi膮gn膮膰 dodatkowe korzy艣ci zdrowotne. Je艣li wytyczne s膮 opracowane z u偶yciem wiarygodnej metodyki (tab. 4), zmniejszaj膮cej b艂臋dy systematyczne, mog膮 by膰 warto艣ciowym narz臋dziem przynosz膮cym korzy艣ci pacjentom i poprawiaj膮cym jako艣膰 opieki medycznej. Takie wytyczne przyczyniaj膮 si臋 r贸wnie偶 do efektywniejszego wykorzystania ograniczonych zasob贸w.
Zalecenia zawarte w wytycznych r贸偶ni膮 si臋 si艂膮, poniewa偶 oparte s膮 na danych o r贸偶nej wiarygodno艣ci (jako艣ci). Jako艣膰 dowod贸w naukowych zale偶y od prawdopodobie艅stwa, 偶e kolejne prawid艂owo zaplanowane i przeprowadzone badania naukowe zmieni膮 wielko艣膰 oszacowania efektu okre艣lonego post臋powania (im jako艣膰 wy偶sza, tym to prawdopodobie艅stwo mniejsze; tab. 5). Si艂a zalecenia odzwierciedla stopie艅 przekonania jego autor贸w, 偶e korzy艣ci p艂yn膮ce z przestrzegania tego zalecenia przewa偶aj膮 nad niekorzystnymi efektami. Podstaw膮 zalecenia silnego s膮 dowody wysokiej jako艣ci (najbardziej wiarygodne), a korzy艣ci jednoznacznie przewa偶aj膮 nad niekorzystnymi efektami. Zalecenie s艂abe opiera si臋 z kolei na dowodach o niskiej jako艣ci, a bilans korzy艣ci i niekorzystnych skutk贸w jest niepewny. Zwykle zalecenia plasuj膮 si臋 pomi臋dzy tymi dwoma skrajnymi przypadkami, ale lekarz korzystaj膮cy z wytycznych powinien wiedzie膰, w kt贸rym miejscu. Zrozumienie znaczenia si艂y zalece艅 pozwala bowiem skutecznie je wykorzystywa膰 (lub nie) w codziennej praktyce. Zalecenie silne ("r贸b to" albo "nie r贸b tego") wskazuje, 偶e zdecydowana wi臋kszo艣膰 os贸b dysponuj膮cych odpowiednimi danymi zgodzi艂aby si臋 na tak膮 ocen臋 bilansu korzy艣ci i szkodliwo艣ci. Zalecenie o mniejszej sile ("raczej r贸b to" albo "raczej nie r贸b tego") wskazuje z kolei, 偶e wi臋kszo艣膰 os贸b dysponuj膮cych odpowiednimi danymi zgodzi艂aby si臋 na tak膮 ocen臋 bilansu korzy艣ci i szkodliwo艣ci, ale znacz膮ca cz臋艣膰 mia艂aby odmienne zdanie.
Tabela 5. Stopniowanie jako艣ci danych (dowodowych) z bada艅 naukowych wg GRADE
jako艣膰 wysoka |
= dalsze badania prawdopodobnie nie zmieni膮 naszego przekonania o trafno艣ci oszacowania efektu interwencji |
jako艣膰 艣rednia |
= dalsze badania prawdopodobnie b臋d膮 mia艂y istotny wp艂yw na nasze przekonanie o trafno艣ci oszacownania efektu i mog膮 zmieni膰 to oszacowanie |
jako艣膰 niska |
= dalsze badania najpewniej b臋d膮 mia艂y istotny wp艂yw na nasze przekonanie o trafno艣ci oszacowania efektu i prawdopodobnie zmieni膮 to oszacowanie |
jako艣膰 bardzo niska |
= jakiekolwiek oszacowanie efektu jest bardzo niepewne |
Opracowano na podstawie 4. pozycji pi艣miennictwa
Zalecenie stosowania albo zaniechania danej interwencji nie oznacza, 偶e wszystkich chorych powinno si臋 leczy膰 jednakowo. Nie oznacza to r贸wnie偶, 偶e lekarz nie powinien uwzgl臋dnia膰 zdania pacjenta przy podejmowaniu decyzji lub nie przedstawia膰 mu zalet alternatywnego post臋powania. Niemniej jednak, poniewa偶 wi臋kszo艣膰 pacjent贸w dysponuj膮cych odpowiednimi informacjami dokona艂aby takiego samego wyboru, wzgl臋dne korzy艣ci z alternatywnych sposob贸w post臋powania mo偶na im przedstawi膰 stosunkowo kr贸tko. Ka偶de zalecenie jest tworzone z zamiarem u艂atwienia podj臋cia s艂usznej decyzji dotycz膮cej pojedynczego pacjenta lub populacji. Powinno ono zatem odzwierciedla膰 opcj臋, kt贸r膮 pacjenci najpewniej by wybrali na podstawie dost臋pnych danych i w艂asnego systemu warto艣ci lub preferencji oraz oczekiwanych efekt贸w. Zalecenie s艂absze, aby co艣 "raczej robi膰", wskazuje na potrzeb臋 bardziej wnikliwego rozwa偶enia przez lekarza systemu warto艣ci i preferencji pacjenta, gdy proponuje si臋 mu okre艣lony spos贸b post臋powania.
W pewnych okoliczno艣ciach sformu艂owanie zalecenia jest niew艂a艣ciwe z powodu niejasnego bilansu korzy艣ci i szkodliwo艣ci (brak bada艅 o odpowiedniej wiarygodno艣ci) lub istotnych niezgodno艣ci w jego ocenie.
Wytyczne praktyki klinicznej i schematy post臋powania mog膮 mie膰 wiele ogranicze艅, bardzo wa偶na jest wi臋c umiej臋tno艣膰 oceny, czy dane wytyczne s膮 wiarygodne i przydatne. Nale偶y podkre艣li膰, 偶e wytyczne powinno si臋 zawsze traktowa膰 jako jeden z czynnik贸w uwzgl臋dnianych przy podejmowaniu decyzji klinicznych, jak to przedstawiono we wst臋pie do tego artyku艂u (p. dane naukowe na rys. 1). Stosowanie wytycznych nie zmniejsza znaczenia indywidualnej oceny danej sytuacji klinicznej przez lekarza lub zr贸偶nicowanych preferencji pacjent贸w.