2 Podstawy evidence�sed medicine

Podstawy evidence based medicine (EBM), czyli o sztuce podejmowania trafnych decyzji w opiece nad pacjentami

dr med. Jacek Mrukowicz
Dyrektor Polskiego Instytutu Evidence Based Medicine w Krakowie
Opublikowano w Medycyna Praktyczna Ginekologia i Położnictwo 2004/06

Wprowadzenie

Praktykowanie medycyny na wszystkich szczeblach systemu ochrony zdrowia - od opieki nad indywidualnym pacjentem do zarządzania instytucjami, organizacjami lub całymi systemami opieki zdrowotnej - bardzo często sprowadza się do podejmowania decyzji (tab. 1). Wymagania stawiane w tym zakresie pracownikowi opieki zdrowotnej zwiększają się z roku na rok, a wraz z nimi rośnie ilościowo i jakościowo codzienna potrzeba informacji dotyczących rozpoznawania, rokowania, zapobiegania i leczenia chorób. Od lekarzy wymaga się już nie tylko skutecznego i bezpiecznego, ale i szybkiego oraz opłacalnego ekonomicznie postępowania. Z powodu wzrastających oczekiwań i coraz większej wiedzy pacjentów praca lekarza staje się jeszcze bardziej złożona.

Tabela 1. Przykłady niektórych rodzajów decyzji podejmowanych na różnych szczeblach opieki zdrowotnej

lekarz
- Czy u pacjentki X zlecić badanie laboratoryjne A lub B w celu rozpoznania choroby Z?
- Czy u chorej X zastosować lek A lub B, aby uzyskać efekt Z?
- Czy u ciężarnej X zastosować metodę operacyjną A lub B w celu uzyskania efektu Z?
menadżer
-Czy dla określonych chorych zakupić do apteki szpitalnej lek A lub B w celu uzyskania efektu Z?
- Czy zakupić dla szpitala aparaturę A w celu badania chorych na chorobę X, aby poprawić dokładność diagnostyczną i efekty leczenia w porównaniu ze stosowanymi dotychczas metodami?
- Czy w szpitalu można zrezygnować z rutynowego wykonywania badania laboratoryjnego A u chorych, u których występuje objaw/choroba X bez zwiększenia ryzyka niekorzystnych następstw?
płatnik/system opieki zdrowotnej
- Czy finansować program badań przesiewowych X w populacji Y w celu wczesnego wykrywania choroby Z?
- Czy finansować program profilaktyczny X w populacji Y w celu zapobiegania zachorowaniom na chorobę Z?
- Które leki refundować chorym na chorobę X?

Środki, jakimi dysponuje w tych zmaganiach lekarz, są często nieadekwatne - tradycyjne źródła informacji są bowiem zwykle:

 przestarzałe (tradycyjne podręczniki, tradycyjne zalecenia ekspertów);

 wzajemnie sprzeczne (tradycyjne podręczniki, tradycyjne zalecenia ekspertów, opinie starszych kolegów);

 mało skuteczne (proces nauczania oparty na tradycyjnych wykładach ekspertów);

 nieprzydatne, gdyż "zalewają" lekarza dużą ilością klinicznie nieistotnych i często mało wiarygodnych informacji (tradycyjne czasopisma medyczne [wg elektronicznej bazy publikacji medycznych MEDLINE tylko w 2003 roku opublikowano w nich 19 575 artykułów oryginalnych na temat leczenia i 16 701 takich artykułów na temat diagnostyki!]).

Ponadto, przeciętny lekarz (wg danych brytyjskich) nie chce lub nie może ze względu na obowiązki zawodowe poświęcić więcej niż 30 minut tygodniowo na zdobywanie nowej wiedzy przydatnej do rozwiązywania aktualnych problemów klinicznych swoich pacjentów. Dochodzi więc do sytuacji, w której wielu lekarzy, w miarę upływu czasu i nabywania jakże cennego doświadczenia klinicznego, posługuje się wiedzą sprzed lat, niedostosowaną do coraz szybszego postępu medycyny. Tracą na tym zarówno pacjenci, jak i systemy ochrony zdrowia.

Do niedawna powyższe problemy były niemożliwe do rozwiązania dla przeciętnego lekarza praktyka. W ciągu ostatnich kilku lat nastąpiła jednak ewolucja (niektórzy twierdzą, że nawet rewolucja) wielu aspektów zmagań ze stale zwiększającą się ilością informacji medycznej. Należy tu wymienić następujące kwestie:

 wypracowanie zasad szybkiej oceny wiarygodności nowych informacji (critical appraisal of evidence);

 opracowanie metod szybkiej syntezy nowych danych z danymi dostępnymi dotychczas (przeglądy systematyczne i metaanalizy);

 wytworzenie instrumentów pozwalających na zebranie oraz szybkie odszukanie klinicznie istotnej i wiarygodnej informacji (strukturalne streszczenia wiarygodnych badań klinicznych i metaanaliz, zawierające w zwięzłej formie najważniejsze informacje potrzebne do podjęcia decyzji w praktyce klinicznej, publikowane m.in. w postaci elektronicznych baz danych);

 wykształcenie metod pozwalających na kompleksową ocenę dostępnych danych naukowych (również ocenę ekonomiczną w postaci analizy ekonomicznej) i przetworzenie ich w formę wiarygodnych wytycznych postępowania, mających zastosowanie kliniczne (evidence based clinical practice guidelines);

 wprowadzenie wszystkich powyższych idei do codziennej praktyki klinicznej, czyli proces określony jako evidence based medicine (EBM). Określenie to najlepiej odzwierciedla praktyczne aspekty zastosowania wymienionych instrumentów w zapewnianiu optymalnej opieki medycznej. W Polsce używa się również takich określeń, jak "praktyka medyczna oparta na wiarygodnych i aktualnych publikacjach" lub "medycyna oparta na faktach".

Jak należy rozumieć EBM?

Fakt, że słowo evidence (dane, przesłanki, dowody) jest eksponowane w nazwie EBM, nie oznacza, że dowody (evidence) wystarczają do podjęcia decyzji. Nawet najbardziej wiarygodne dowody nigdy nie "podejmą" decyzji za lekarza, stanowią one jednak niezbędny element w tym procesie. Ignorowanie wiarygodnych dowodów może spowodować opóźnienie wprowadzenia do praktyki skutecznych metod rozpoznawania lub leczenia chorób (np. podanie glikokortykosteroidów ciężarnym z zagrażającym porodem przedwczesnym w celu zapobiegania zespołowi błon szklistych i zgonom przedwcześnie urodzonych noworodków; p. dalej) albo stosowanie metod nieprzynoszących korzyści lub wręcz szkodliwych (np. hormonalna terapia zastępcza stosowana u kobiet w wieku pomenopauzalnym w pierwotnej i wtórnej profilaktyce choroby wieńcowej; p. dalej).

Każda indywidualna sytuacja kliniczna wymaga ustalenia prawdopodobnego rozpoznania oraz opcji postępowania. Informacje charakteryzujące pacjenta, którego ma dotyczyć nasza decyzja, objawy kliniczne (lub choroba), z którymi się zgłasza, choroby współistniejące i nasze wstępne podejrzenia co do najbardziej prawdopodobnych rozpoznań są punktem wyjścia do poszukiwania optymalnego w danej sytuacji klinicznej postępowania. Rozpoznając sytuację kliniczną pacjenta, ustalamy również ryzyko podstawowe wystąpienia określonych zdarzeń zdrowotnych (korzystnych i niekorzystnych). Błędne ustalenia na tym wstępnym etapie powodują, że cały dalszy wysiłek w poszukiwaniu możliwych sposobów postępowania pójdzie na marne, a podjęta przez nas decyzja będzie nietrafna. Umiejętności lekarza i doświadczenie kliniczne są oczywiście na tym etapie kluczem do sukcesu. Dostępne opcje postępowania zależeć będą również od uwarunkowań danego systemu ochrony zdrowia.

Rozważenie korzystnych i niekorzystnych skutków możliwych sposobów postępowania, prawdopodobieństwa wystąpienia i wielkości tych efektów, wymaga na tym etapie znajomości wyników wiarygodnych badań naukowych zarówno obserwacyjnych, jak i - w coraz większym stopniu - eksperymentalnych (zwłaszcza badań z randomizacją). W tym sensie koncepcja EBM wymaga od lekarzy (i innych pracowników ochrony zdrowia decydujących o postępowaniu) rozważenia danych naukowych potencjalnie wpływających na ostateczną decyzję kliniczną (lub administracyjną).

Elementem modyfikującym decyzje jest oczywiście system wartości i preferencji pacjenta, od którego zależy zakres działań, jakie pacjent jest skłonny podjąć i kontynuować. Interpretacja danych (evidence) w kontekście wartości jest sekwencją decyzji będących wynikiem przeprowadzenia bilansu potencjalnych korzystnych i niekorzystnych skutków rozważanego postępowania (czy korzyści przeważają nad skutkami niekorzystnymi?); a jeśli jest on dodatni, to czy dodatkowe korzyści zdrowotne są warte poniesienia dodatkowych kosztów i innych niedogodności związanych z proponowanym postępowaniem (np. niewygodny sposób dawkowania leku, konieczność regularnego wykonywania badań kontrolnych itp.). Decyzje podjęte na podstawie tych samych dowodów (evidence) mogą się różnić, zależą bowiem od tego, kto podejmuje decyzję i jaki system wartości reprezentuje (np. pacjent patrzący przez pryzmat swoich korzyści vs osoby zarządzające systemem opieki zdrowotnej, które biorą pod uwagę możliwości finansowe i korzyści dla systemu opieki zdrowotnej).

Połączenie tych trzech rodzajów uwarunkowań wymaga od lekarza umiejętności rozpoznania stanu klinicznego, znajomości danych naukowych oraz zrozumienia sytuacji i możliwości pacjenta, w tym jego emocji, rozterek, indywidualnych uwarunkowań rodzinnych, kulturowych czy finansowych. Powyższe uwarunkowania decyzyjne przedstawiono na rysunku 1. Jak widać, dane z badań naukowych stanowią tylko jeden z kilku elementów wpływających na decyzję kliniczną, niemniej jednak niezbędny. EBM należy więc rozumieć jako normalną praktykę lekarską uwzględniającą w podejmowaniu decyzji wiarygodne i aktualne dane (dowody, evidence) z badań naukowych.

W kontekście podanych powyżej uwarunkowań istotą EBM jest:

 identyfikacja luk w naszej wiedzy;

 zadanie właściwego, precyzyjnego pytania klinicznego;

 znalezienie danych i ocena ich wiarygodności;

 przedstawienie wyników;

 sformułowanie odpowiedzi i jej zastosowanie w praktyce w odniesieniu do konkretnego pacjenta.

0x01 graphic

Rys. 1. Elementy uwzględniane w procesie podejmowania decyzji w opiece nad pacjentami według zasad evidence based medicine (EBM).

Pierwszy, krytyczny etap

Pierwszym niezbędnym krokiem w praktykowaniu EBM jest uświadomienie sobie, że nie znamy najnowszych informacji dotyczących problemu, z którym się stykamy, lub mamy wątpliwości, czy nasza wiedza jest w tym zakresie aktualna i(lub) wystarczająco szczegółowa. Krytyczny i pokorny stosunek do swojej wiedzy jest niezbędny do skutecznego praktykowania EBM. W tym zakresie EBM wymaga od niektórych lekarzy zmiany postawy, co nie zawsze jest łatwe. Być może dlatego, że na wielu szczeblach naszej edukacji - począwszy od szkoły podstawowej - niewiedza (brak informacji) była karana, a przyznanie się do niej budziło zażenowanie. Ten lęk (niechęć) można zwalczyć, nabywając umiejętności zadawania precyzyjnych pytań, szybkiego dostępu do źródeł odpowiedzi oraz sprawnego wydobycia i oceny informacji. Uczenie się - czyli zadawanie pytań i znajdowanie odpowiedzi - na każdym etapie drogi zawodowej lekarza powinno być bowiem stymulujące i satysfakcjonujące.

Zadawanie precyzyjnych pytań klinicznych

Na konferencjach naukowych, w niektórych artykułach przeglądowych, a także w codziennych dyskusjach lekarskich w szpitalu lub w przychodni dość często można się spotkać ze stwierdzeniem, że "lek A jest skuteczny w chorobie X". Ponieważ stwierdzenie takie jest dalece nieprecyzyjne, można mieć wiele wątpliwości:
(1) Co to znaczy lek A? (jaka dawka? jak podawany? jak długo stosowany?)
(2) Co to znaczy skuteczny? (zwiększa prawdopodobieństwo ustąpienia objawów? zmniejsza ryzyko nawrotów choroby? skraca czas utrzymywania się objawów? zmniejsza ryzyko powikłań? zmniejsza nasilenie objawów? poprawia jakość życia? zmniejsza ryzyko zgonu w określonym czasie?)
(3) Co to znaczy choroba X? Czy lek jest skuteczny u wszystkich chorych na daną chorobę bez względu na ich wiek i stopień jej zaawansowania?
(4) Lek jest skuteczny w porównaniu z czym? (z niestosowaniem żadnego leku? z placebo? ze standardową, zaakceptowaną metodą leczenia?).

Ze względu na nieprecyzyjność powyższego stwierdzenia zastosowanie takiej informacji w praktyce obarczone jest ryzykiem podjęcia błędnej decyzji, polegającej na nieuzasadnionym uogólnieniu efektów określonej interwencji na wszystkie jej modyfikacje (np. schematy dawkowania), wszystkie grupy chorych i różne sposoby mierzenia efektu. Poszukując w piśmiennictwie danych (dowodów) na temat efektów różnych opcji postępowania, lekarz zainteresowany jest jednak konkretnym pacjentem, który zgłosił się do niego w określonym stanie klinicznym i u którego chciałby osiągnąć określony efekt.

Aby uniknąć nieporozumień, pytanie kliniczne musi być wystarczająco precyzyjne i zawierać elementy opisu:
- pacjentów (populacji), u których oceniano określoną metodę postępowania (patients - P);
- interwencji, którą u nich zastosowano (intervention - I);
- interwencji, z którą ją porównywano, tzn. interwencji w grupie kontrolnej (comparison - C);
- sposobu mierzenia efektu interwencji, czyli tzw. punktów końcowych (określonych zmian stanu zdrowia; outcome - O).

Strukturę precyzyjnego pytania klinicznego odzwierciedla akronim PICO, który może ułatwić jej zapamiętanie. Przykłady prawidłowo i nieprawidłowo sformułowanych pytań klinicznych przedstawiono w tabeli 2.

Tabela 2. Przykłady prawidłowo i nieprawidłowo sformułowanych pytań klinicznych *

Nieprawidłowo	Prawidłowo
Czy tamoksyfen jest skuteczny w raku sutka?	Czy u kobiet w wieku 35-70 lat obciążonych dużym ryzykiem zachorowania na raka sutka (P) tamoksyfen stosowany w dawce 20 mg na 24 h przez 5 lat (I) zmniejsza w porównaniu z placebo (C) ryzyko wystąpienia raka sutka (O)?
Czy podawanie leków przeciwdepresyjnych jest korzystne w zespole napięcia przedmiesiączkowego?	Czy u kobiet z ciężką postacią zespołu napięcia przedmiesiączkowego (P) stosowanie doustne selektywnych inhibitorów zwrotnego wychwytu serotoniny przez okres co najmniej jednego cyklu miesiączkowego (I) zmniejsza w porównaniu z placebo (C) nasilenie objawów somatycznych i psychicznych tego zespołu (O)?
Czy zakładanie szwu okrężnego na szyjkę macicy jest skuteczne w niewydolności cieśniowo-szyjkowej?	Czy u kobiet z grupy dużego ryzyka porodu przedwczesnego (co najmniej 3 porody w II trymestrze ciąży) (P) profilaktyczne zakładanie szwu okrężnego na szyjkę macicy sposobem McDonalda przed 24. tygodniem ciąży (I) zmniejsza w porównaniu z niezakładaniem tego szwu lub stosowaniem leczenia zachowawczego (reżim łóżkowy) (C) ryzyko porodu przedwczesnego przed 33. tygodniem ciąży (O)?

*Każde precyzyjnie sformułowane pytanie kliniczne powinno zawierać elementy opisu populacji pacjentów (P - patients), ocenianej interwencji (I - intervention), interwencji alternatywnej, z którą była ona porównywana (C - comparison), i sposobu pomiaru ich efektu (O - outcome). Strukturę prawidłowo sformułowanego pytania klinicznego odzwierciedla akronim PICO.

0x01 graphic

Formułując pytanie kliniczne i oceniając publikacje medyczne pod względem ich przydatności w praktyce, należy zwrócić uwagę na wybór właściwych, istotnych klinicznie punktów końcowych, czyli takich, które mają istotne znaczenie dla pacjenta (np. zachorowanie, ustąpienie objawów choroby, zgon, złamanie kości, poród w terminie, urodzenie zdrowego dziecka). Badania kliniczne, w których oceniano wpływ określonego postępowania (interwencji) na występowanie takich punktów końcowych, dostarczają znacznie ważniejszych informacji dla praktyków niż te, w których uwzględniano wyłącznie tzw. zastępcze punkty końcowe (np. stężenie kreatyniny w surowicy, stężenie gonadotropiny łożyskowej w surowicy, zapis kardiotokograficzny). Opieranie się wyłącznie na zastępczych punktach końcowych może się okazać szkodliwe dla pacjentów.

Źródła danych

EBM opiera się na założeniu, że lekarze są w stanie wyłowić spośród ogromnej liczby publikacji te, które są wiarygodne i jednocześnie mają znaczenie kliniczne, tzn. wnioski z nich można bezpośrednio wykorzystać w opiece nad pacjentami. Zadanie to jest jednak czasochłonne, wymaga odpowiedniej wiedzy z zakresu epidemiologii klinicznej, a zatem w praktyce ma nikłe szanse powodzenia. Wynika to nie tylko z natłoku informacji (setki tysięcy artykułów publikowanych corocznie), ale także z faktu, że większość doniesień medycznych dotyczy zagadnień niezwiązanych bezpośrednio z praktyką lekarską, a publikacje, z których można by skorzystać, niejednokrotnie zawierają błędy metodologiczne albo przedstawiają dane naukowe wybiórczo; w efekcie tylko niewielka część publikacji zawiera wiedzę nową i wystarczająco wiarygodną, którą można zastosować w praktyce (rys. 2).

0x01 graphic

Rys. 2. Dobór badań medycznych przydatnych w praktyce

Zamiast się zmagać z mnóstwem prac oryginalnych lekarz może korzystać z nielicznych źródeł zawierających publikacje wyselekcjonowane pod względem znaczenia klinicznego i wiarygodności. Podstawą selekcji badań jest założenie, że wyniki mają różną wiarygodność w zależności od metodologii badania, a badania, w których ocenia się tzw. kliniczne punkty końcowe (p. wyżej), dostarczają ważniejszych informacji niż oceniające wyłącznie tzw. zastępcze punkty końcowe. Do głównych źródeł wyselekcjonowanych badań przedstawionych w formie specjalnych streszczeń należą czasopisma "ACP Journal Club" i "Evidence Based Medicine" oraz ich strony internetowe:
http://www.acpjc.org i http://www.evidencebasedmedicine.com.

W Polsce analogiczne streszczenia są publikowane w czasopismach wydawanych przez Medycynę Praktyczną (z dziedziny ginekologii i położnictwa w "Medycynie Praktycznej Ginekologii i Położnictwie") i dostępne w internecie (http://www.mp.pl/artykuly).

Sposobem radzenia sobie z zalewem informacji są także podsumowania badań pierwotnych dotyczących określonego zagadnienia, w postaci przeglądów systematycznych (tzw. badania wtórne), jak również aktualizowane na bieżąco wytyczne postępowania, w których uwzględniono wyniki dostępnych badań pierwotnych i wtórnych.

Ocena wiarygodności danych

Wiarygodność wyników badania w zasadniczy sposób zależy od jego metodologii (rys. 3).

Badania eksperymentalne

Za najbardziej wiarygodne uznaje się badania z randomizacją, czyli takie, w których pacjentów kwalifikuje się losowo do grupy eksperymentalnej (poddawanej ocenianej interwencji, np. otrzymującej nowy lek) lub do grupy kontrolnej (otrzymującej placebo albo poddawanej innej, sprawdzonej interwencji o znanych już efektach). Ten rodzaj badań jest szczególnie przydatny do oceny skuteczności i bezpieczeństwa różnych metod leczenia lub profilaktyki. Celem randomizacji jest uzyskanie grup podobnych pod względem wszystkich czynników rokowniczych, zwanych zakłócającymi (a zwłaszcza tych nieznanych), czyli o takim samym wyjściowym ryzyku wystąpienia ocenianych punktów końcowych. Dzięki temu jedyną cechą różniącą obie grupy jest oceniana interwencja i można jej wówczas przypisać różnice w obserwowanych efektach (rys. 4). Różnice między grupami w wielkości tego ryzyka mogłyby natomiast spowodować zafałszowanie (zawyżenie lub zaniżenie) efektów ocenianej interwencji. Wiarygodność badania z randomizacją zależy od poprawności jego przeprowadzenia, a uchybienia w tym zakresie zwiększają ryzyko, że zaobserwowane przez badaczy różnice efektów będą istotnie odbiegać od istniejących w rzeczywistości (tzw. błędy systematyczne). W ocenie wiarygodności badania z randomizacją należy zwrócić uwagę na następujące szczegóły metodyczne: poprawność randomizacji i jej utajnienie (allocation concealment); odsetek pacjentów, którzy ukończyli obserwację (completeness of follow-up); analiza zgodna z zaplanowanym leczeniem (intention-to-treat analysis); ślepa próba (maskowanie; blinding); interwencje dodatkowe (co-intervention).

Czy randomizacja była przeprowadzona prawidłowo? Istotą randomizacji jest zapewnienie wszystkim pacjentom takiej samej szansy dostania się do grupy eksperymentalnej lub kontrolnej. Jej celem jest uzyskanie grup jednakowych pod względem czynników rokowniczych (znanych i nieznanych). Prawidłową metodę randomizacji można porównać do rzutu monetą. Jeżeli natomiast kwalifikacja do grup odbywa się na podstawie tylko pozornie losowych kryteriów (tzw. quasi-randomizacja), np. daty urodzenia (dni parzyste vs nieparzyste) czy pory dnia, w której pacjent trafił do szpitala (dzień vs noc), do podziału na grupy zostaje wprowadzona nierównowaga czynników rokowniczych, która może istotnie zniekształcić wyniki obserwacji. Można mieć wątpliwości, czy pacjent, który zostaje przyjęty do szpitala w nocy, jest pod względem czynników rokowniczych taki sam, jak pacjent przyjęty w dzień, lub czy można postawić znak równości pomiędzy operacją przeprowadzaną w nocy i w dzień. We współczesnych badaniach randomizacja jest zwykle przeprowadzana komputerowo (lista kodów randomizacyjnych generowana komputerowo).

Nawet jeżeli metoda randomizacji jest prawidłowa, istnieje możliwość manipulowania kwalifikacją pacjentów do grup, jeśli badacz włączający kolejnych pacjentów do badania wie, do której grupy mają oni trafić (eksperymentalnej czy kontrolnej). Łatwo sobie wyobrazić sytuację, że rzuca on monetą dotąd, dopóki nie uzyska pożądanego rezultatu. Metodą uniemożliwiającą tego typu ingerencję jest utajnienie randomizacji (allocation concealment). Może ono polegać na przykład na generowaniu listy randomizacyjnej poza miejscem prowadzenia badania i odpowiednim kodowaniu ocenianych leków (dostarczanych w identycznych opakowaniach i formie) lub dostarczaniu informacji o interwencji w kodowanych, nieprzezroczystych kopertach (w przypadku interwencji operacyjnych), których lekarz kwalifikujący do badania nie może otworzyć. Utajnienie randomizacji jest zawsze możliwe. Na podstawie analizy 250 badań z randomizacją stwierdzono, że badania z prawidłowym utajnieniem randomizacji wykazały efekt interwencji o 30-40% mniejszy niż badania bez niego lub z nieprawidłowym utajnieniem. Sama metoda randomizacji nie miała natomiast istotnego wpływu na ocenę efektów interwencji.

Czy wszyscy pacjenci, którzy rozpoczęli badanie, zostali objęci analizą po jego zakończeniu (completeness of follow-up)? Liczba pacjentów objętych analizą powinna się zgadzać z liczbą pacjentów włączonych do badania (poddanych randomizacji), lecz w praktyce rzadko udaje się to osiągnąć. Problem polega na tym, że osoby, które "wypadają" z badania, często różnią się od pacjentów uczestniczących w badaniu do końca. Bywa tak, że lekarze już po rozpoczęciu badania wycofują osoby nie "pasujące" pod względem charakterystyki lub reakcji na leczenie. Niekiedy pacjenci sami się wycofują, ponieważ poczuli się gorzej i uznają to za efekt badanej interwencji, albo poczuli się lepiej i w związku z tym nie widzą potrzeby kontynuowania czasochłonnych wizyt kontrolnych. Przyczyną niestawienia się pacjenta na wizytę kontrolną może być także jego śmierć. W miarę zwiększania się liczby osób nieobjętych analizą zwiększa się proporcjonalnie prawdopodobieństwo zachwiania równowagi czynników rokowniczych między badanymi grupami i wiarygodność uzyskanych wyników staje się podważalna. Przyjmuje się, że w przypadku "utraty" około 20% badanej populacji problem ten nabiera zasadniczego znaczenia i powoduje, że uzyskane wyniki (różnice) istotnie odbiegają od istniejących w rzeczywistości.

Czy wszystkich pacjentów zanalizowano w grupach, do których zostali przydzieleni na początku badania (analiza intention-to-treat)? Analizę wystąpienia punktów końcowych powinno się przeprowadzać w grupach pacjentów wyodrębnionych w wyniku randomizacji, niezależnie od tego, czy ostatecznie poddano ich zaplanowanej interwencji, czy nie (analiza intention-to-treat, analiza wyników w grupach wyodrębnionych zgodnie z zaplanowanym leczeniem). W ten sposób zostaje zachowana wyjściowa równowaga znanych i nieznanych czynników rokowniczych między grupami, czyli istota randomizacji.

Czy sposób leczenia był nieznany pacjentom i osobom oceniającym wyniki interwencji? Aby uniknąć sytuacji, gdy korzyści związane z danym leczeniem są pozorne i wynikają z samego faktu zastosowania interwencji, po której pacjent i lekarz spodziewają się poprawy (tzw. efekt placebo), nie zaś z jej swoistego działania - zarówno sami pacjenci, jak i badacze nie powinni wiedzieć, jakiej interwencji (eksperymentalnej [np. badany lek] czy kontrolnej [np. placebo]) są oni poddani. Ma to szczególne znaczenie w przypadku subiektywnych punktów końcowych (np. natężenia bólu). Taka metodą nazywa się próbą podwójnie ślepą. Jeżeli tylko pacjenci nie wiedzą, jakiej interwencji są poddani, mówimy o próbie pojedynczo ślepej, a gdy pacjenci i badacze znają przynależność do grupy, mamy do czynienia z próbą otwartą. O ile utajnienie randomizacji jest zawsze możliwe, to w pewnych sytuacjach klinicznych nie można zastosować ślepej próby (np. porównanie metody operacyjnej z leczeniem zachowawczym).

Wspomniana już powyżej analiza 250 badań z randomizacją wykazała również, że badania przeprowadzone metodą podwójnie ślepej próby wykazały o 4-29% mniejszy efekt interwencji niż badania bez niej.

Czy poza badaną interwencją pacjenci w obu grupach byli traktowani podobnie (co-intervention)? Zaobserwowana różnica efektów interwencji eksperymentalnej i kontrolnej może być wynikiem różnej opieki nad pacjentami w badanych grupach (np. częstszych wizyt kontrolnych lub częstszego stosowania dodatkowych leków w jednej z grup), a nie rzeczywistej przewagi jednej z nich.

Badania obserwacyjne

Badania obserwacyjne (nieeksperymentalne; rys. 3) tym się różnią od badań eksperymentalnych, że poddanie pacjentów danej interwencji lub ekspozycja na dany czynnik nie zależy od badaczy. Tego rodzaju badania przeprowadza się głównie w celu oceny szkodliwości i czynników rokowniczych, zwłaszcza gdy odpowiednie badanie z randomizacją nie jest możliwe. Do badań obserwacyjnych należą badania analityczne (kohortowe, kliniczno-kontrolne i przekrojowe) oraz badania opisowe (opis przypadku lub serii przypadków), które w przeciwieństwie do badań analitycznych nie mają grupy kontrolnej.

Dla wiarygodności wyników badań analitycznych, podobnie jak w przypadku badań eksperymentalnych, zasadnicze znaczenie ma właściwe dobranie grupy kontrolnej, tak aby różniły się tylko ocenianą ekspozycją. Tworzenie grupy kontrolnej w inny sposób niż poprzez randomizację nie eliminuje jednak potencjalnego wpływu nieznanych czynników rokowniczych, dlatego wiarygodność wyników tych badań jest mniejsza niż badań z randomizacją (p. dalej przykład z hormonalną terapią zastępczą).

Badanie obserwacyjne, w którym ocenia się prospektywnie wystąpienie określonego punktu końcowego (np. porodu przedwczesnego) w grupach (kohortach) osób narażonych i nienarażonych na dany czynnik (np. cukrzyca) lub interwencję (np. stosowanie leków przeciwhistaminowych), u których ten punkt końcowy na początku obserwacji nie występował, nazywamy badaniem kohortowym. Jeżeli natomiast w celu wykazania związku między daną ekspozycją a wystąpieniem określonego punktu końcowego porównuje się retrospektywnie ekspozycję (odsetek narażonych) w grupie osób, u których punkt końcowy wystąpił, z ekspozycją w odpowiednio dobranej grupie osób kontrolnych, u których punkt końcowy nie wystąpił - to mamy do czynienia z badaniem kliniczno-kontrolnym.

Badanie związku między występowaniem określonej choroby a ekspozycją na dany czynnik w określonej populacji i jednym punkcie czasowym to badanie przekrojowe. Ekspozycję i wystąpienie punktu końcowego (choroby) ocenia się jednocześnie, w przeciwieństwie do badań kliniczno-kontrolnych (wychodzi się od punktu końcowego i wstecz ocenia ekspozycję) i kohortowych (wychodzi się od ekspozycji i prospektywnie ocenia występowanie punktu końcowego).

Opisy przypadków (pojedynczych lub serii) prawie nigdy nie pozwalają wyciągać wniosków o związkach przyczynowo-skutkowych, ponieważ nie mają grupy kontrolnej. Ich wiarygodność, z wyjątkiem skrajnych przypadków, jest mniejsza niż badań z grupą kontrolną (eksperymentalnych i analitycznych); są jednak pożyteczne, gdyż sygnalizują potencjalne problemy, które mogą się stać przedmiotem bardziej wiarygodnych badań.

Przeglądy systematyczne i metaanalizy

Jakościowy przegląd wszystkich badań dotyczących tego samego problemu klinicznego, z użyciem odpowiednich metod zmniejszających błędy systematyczne (z góry określony sposób wyszukiwania wszystkich badań dotyczących tego problemu, określone kryteria kwalifikacji i dyskwalifikacji odszukanych badań, ocena jakości [wiarygodności] zakwalifikowanych badań, ocena prowadzona równolegle przez 2 badaczy) nazywa się przeglądem systematycznym (systematic review). W uzasadnionych przypadkach (ten sam precyzyjnie określony problem kliniczny; odpowiednia do pytania klinicznego, wiarygodna metodyka badań; podobna populacja; podobne interwencje; te same punkty końcowe) może on obejmować metaanalizę, czyli ilościową syntezę wyników wielu badań za pomocą odpowiednich metod statystycznych.

Hierarchia dowodów naukowych

Kliniczne badania naukowe (rys. 3) można uszeregować pod względem wiarygodności ich wyników od najbardziej do najmniej wiarygodnych (wraz ze schodzeniem na niższy poziom zwiększa się ryzyko, że zaobserwowany efekt istotnie odbiega od rzeczywiście istniejącego):
- metaanalizy badań z randomizacją (metaanalysis);
- badania z randomizacją (randomised controlled trial - RCT);
- badania eksperymentalne z grupą kontrolną bez randomizacji;
- badania kohortowe (cohort study);
- badania kliniczno-kontrolne (case-controlled study);
- badania przekrojowe (cross sectional study);
- opis przypadku (case report) lub serii przypadków (case series).

0x01 graphic

Rys. 3. Rodzaje badań epidemiologicznych

Przedstawianie wyników badań - podstawowe pojęcia

Przedstawianie wyników badań klinicznych sprowadza się najczęściej do porównania badanych grup pod względem średnich wartości mierzonego parametru (np. wysokości ciśnienia tętniczego, stężenia glukozy we krwi itp.) lub do oceny częstości (prawdopodobieństwa, ryzyka) wystąpienia jakiegoś stanu zdrowotnego (np. zachorowanie, zgon). W pierwszym przypadku oceniamy różnicę średnich, czyli na przykład różnicę ciśnienia tętniczego. Nieco więcej możliwości daje przedstawianie wyników w formie ryzyka (prawdopodobieństwa) i porównywania tych prawdopodobieństw. W takich przypadkach wyniki badań na temat skuteczności określonych interwencji są przedstawiane, jeśli tylko jest to możliwe, zarówno za pomocą parametrów względnych (np. ryzyko względne lub względne zmniejszenie ryzyka), jak i bezwzględnych (np. bezwzględne zmniejszenie ryzyka i NNT), gdyż korzystanie tylko z jednych może być mylące.

Przykład 1*

częstość (ryzyko) rzucawki w grupie otrzymującej siarczan magnezu - 0,8%, a w grupie placebo - 1,9%
ARR: 1,9% - 0,8% = 1,1%
RR: 0,8%/1,9% = 0,42 (42%)
RRR: 1,1%/1,9% = 0,58 (58%) (1 - 0,42 = 0,58)
NNT: 1/0,011 = 91

0x01 graphic

* przybliżone wyniki badania Magpie, w którym stosowano 50% roztwór siarczanu magnezu u ciężarnych i kobiet do 24 h po porodzie z rozpoznaniem stanu przedrzucawkowego (skurczowe ciśnienie krwi >=140 mm Hg lub rozkurczowe >=90 mm Hg stwierdzone co najmniej 2-krotnie oraz białkomocz o nasileniu co najmniej 1+), ale bez innych objawów zapowiadających wystąpienie rzucawki (The Lancet, 2002; 359: 1877 i Med. Prakt. - Ginekol. Położ., 2002; 5-6: 49)

Bezwzględne zmniejszenie ryzyka (absolute risk reduction - ARR) to bezwzględna różnica między ryzykiem w grupie kontrolnej a ryzykiem w grupie eksperymentalnej, określająca bezwzględną wielkość "usuniętego" ryzyka.

Ryzyko względne (relative risk - RR) określa, jaka część ryzyka podstawowego (tzn. ryzyka w grupie kontrolnej) "pozostała" po interwencji. Jest to iloraz prawdopodobieństwa wystąpienia określonego punktu końcowego w grupie eksperymentalnej, w której stosuje się ocenianą interwencję i tego prawdopodobieństwa w grupie kontrolnej. W badaniach związków przyczynowo-skutkowych (np. dotyczących rokowania) jest to analogicznie iloraz prawdopodobieństwa wystąpienia określonego punktu końcowego w grupie, w której występuje dany czynnik, i tego prawdopodobieństwa w grupie kontrolnej.

Względne zmniejszenie ryzyka (relative risk reduction - RRR) stanowi część prawdopodobieństwa (ryzyka) wystąpienia niekorzystnego punktu końcowego "usuniętą" w wyniku zastosowania określonej interwencji (leku lub zabiegu). Jest ilorazem bezwzględnej różnicy ryzyka między grupą kontrolną a eksperymentalną (ARR) oraz ryzyka w grupie kontrolnej. Ryzyko "pozostałe" (RR) i ryzyko "usunięte" (RRR) dopełniają się do jedności (RR + RRR = 1).

NNT (number needed to treat) jest to liczba pacjentów, których trzeba poddać danej interwencji przez określony czas, aby zapobiec jednemu niekorzystnemu punktowi końcowemu. NNT wylicza się jako odwrotność ARR (1/ARR).

0x01 graphic

Rys. 4. Schemat badania z randomizacją (randomised controlled trial - RCT). Istotą randomizacji jest losowa kwalifikacja pacjentów do grupy eksperymentalnej i kontrolnej, a jej celem jest uzyskanie grup wyjściowo jednakowych pod względem czynników rokowniczych (tzw. zakłócających). Na tym etapie znaczenie ma poprawność randomizacji i jej utajnienie (allocation concealment; p. tekst). Wiarygodność badania z randomizacją zależy również od tego, czy grupy są jednakowe pod względem czynników rokowniczych także na końcu obserwacji. Gwarantuje to jak największy (>80%) odsetek pacjentów, którzy ukończyli obserwację (completeness of follow-up; p. tekst) oraz analiza zgodna z zaplanowanym leczeniem (intention-to-treat analysis; p. tekst). Zwiększenie obiektywności oceny efektów interwencji zapewnia ślepa próba (maskowanie [blinding]; p. tekst).

W doniesieniach z badań naukowych spotyka się także następujące parametry:

Bezwzględne zwiększenie ryzyka (absolute risk increase - ARI), czyli bezwzględna różnica pomiędzy ryzykiem w grupie eksperymentalnej i w grupie kontrolnej. Określa, o ile zwiększyło się ryzyko wystąpienia niekorzystnego punktu końcowego w wyniku ekspozycji na dany czynnik lub interwencję.

Względne zwiększenie ryzyka (relative risk increase - RRI), czyli część prawdopodobieństwa (ryzyka) wystąpienia niekorzystnego punktu końcowego "dodana" w wyniku zastosowania określonej interwencji (leku lub zabiegu). Iloraz ryzyka "dodanego" (ARI) i ryzyka w grupie kontrolnej. Pojęcie stosowane w badaniach, w których oceniana interwencja zwiększa prawdopodobieństwo wystąpienia niekorzystnego punktu końcowego (np. powikłania leczenia).

NNH (number needed to harm), czyli liczba pacjentów, których poddanie określonej interwencji przez określony czas wiąże się z wystąpieniem jednego dodatkowego niekorzystnego punktu końcowego. NNH wylicza się jako odwrotność ARI (1/ARI).

Hazard względny (hazard ratio - HR) - pod względem interpretacyjnym pojęcie analogiczne do ryzyka względnego. Jest wynikiem analizy krzywych lub tabeli przeżywalności. Określa względne prawdopodobieństwo zajścia jakiegoś zdarzenia w badanych grupach w określonym czasie przy założeniu, że zdarzenie to do tej pory nie wystąpiło (w uproszczeniu: określa część ryzyka podstawowego "pozostałą" po interwencji).

Iloraz szans (odds ratio - OR), czyli iloraz szansy wystąpienia określonego stanu klinicznego w grupie eksponowanej na dany czynnik lub interwencję i szansy wystąpienia tego stanu w grupie nieeksponowanej (kontrolnej). W badaniach kliniczno-kontrolnych może to być iloraz szansy narażenia na potencjalny czynnik sprawczy w grupie, w której określony punkt końcowy wystąpił, i szansy narażenia na ten sam czynnik w grupie kontrolnej. Szansa jest to stosunek prawdopodobieństwa wystąpienia określonego stanu klinicznego do prawdopodobieństwa jego nie wystąpienia w danej grupie.

Istotność statystyczna i kliniczna

Niezależnie od parametrów użytych do przedstawiania wyników badania autorzy podają zwykle prawdopodobieństwo (poziom istotności statystycznej, wartość p), z jakim zaobserwowana w badaniu lub większa różnica (zależność) między badanymi grupami może być dziełem przypadku, zakładając, że w rzeczywistości różnica ta nie istnieje. Wartość p nieodłącznie związana jest z testowaniem hipotez statystycznych i z punktu widzenia lekarza praktyka, zainteresowanego wyborem optymalnej metody postępowania u konkretnego pacjenta, jest raczej trudna do interpretacji i niesie niewiele informacji.

Więcej mówi natomiast przedział ufności (confidence interval - CI), który dodatkowo informuje o najbardziej prawdopodobnej wielkości, kierunku i zakresie możliwych wartości zaobserwowanego efektu; określa stopień precyzji (a raczej braku precyzji) danego oszacowania. Zwykle podaje się 95% CI, czyli przedział, w którym z 95% pewnością znajduje się prawdziwa wartość danego parametru (np. ARR, RR, NNT itd.) w badanej populacji. Jeśli w tym przedziale zawarte jest 0 dla różnicy ryzyka, a 1 - dla ryzyka względnego, hazardu względnego albo ilorazu szans, to jest to równoznaczne z brakiem istotności statystycznej danego wyniku (p >0,05). W powyższym przykładzie 95% CI dla RR wyniósł 0,29-0,6, a dla NNT - 63-143.

Analizując wyniki każdego badania, najpierw trzeba sprawdzić, czy uzyskane wyniki są istotne statystycznie, a następnie czy są klinicznie istotne (tzn. czy różnice między grupami są wystarczająco duże, aby uznać je za wartościowe w praktyce). Bywa to trudniejsze niż ustalenie istotności statystycznej, a ponadto podlega subiektywnej interpretacji.

Przedstawienie wyników metaanalizy

Wyniki zbiorczej analizy obejmującej wszystkie wiarygodne badania pierwotne dotyczące tego samego problemu klinicznego (tzn. podobnej populacji i interwencji oraz takich samych punktów końcowych), czyli metaanalizy (p. wyżej), są standardowo przedstawiane w postaci graficznej (tzw. forrest plot; p. przykład 2.). Metaanaliza badań z randomizacją znajduje się najwyżej w hierarchii wiarygodności danych.

W pierwszej kolumnie takiego wykresu podane są badania objęte analizą (zwykle wraz z datą ich publikacji), w drugiej i trzeciej - liczba pacjentów w porównywanych grupach (ogólna [N] i liczba tych, u których wystąpił dany punkt końcowy [n]). Pionowa linia w centrum wykresu wyznacza brak różnicy pomiędzy grupami, wyrażonej tu jako iloraz szans (OR). Różnicy nie ma, jeśli OR (dotyczy to także RR i HR) wynosi 1 (a 0 w przypadku ARR i RRR). Wynik każdego z poszczególnych badań jest przedstawiony jako punkt na odcinku odzwierciedlającym jego precyzję (czyli 95% przedział ufności). Każdy punkt na lewo od pionowej linii (tzn. wartości OR <1) oznacza przewagę ocenianej interwencji (w tym wypadku glikokortykosteroidów), na prawo (tzn. wartości OR >1) - przewagę placebo. Przecięcie się odcinków wyznaczających przedziały ufności z pionową linią braku różnicy jest równoznaczne z brakiem istotności statystycznej. Najniższy punkt (romb) przedstawia iloraz szans (w niektórych przypadkach może to być RR, ARR lub RRR) będący wynikiem zbiorczej analizy wszystkich badań, czyli metaanalizy. Zwraca tu uwagę bardziej precyzyjne oszacowanie efektu interwencji - znacznie węższy przedział ufności. W kolumnie znajdującej się najbardziej na prawo przedstawiono wartości ilorazu szans (wraz z 95% CI) dla poszczególnych badań zakwalifikowanych do analizy, a w ostatnim wierszu zbiorczy wynik metaanalizy.

Przykład 2*

0x01 graphic

* iloraz szans (OR) zgonu noworodka po zastosowaniu jednego kursu kortykosteroidów (betametazon 2 razy po 12 mg co 12 h lub deksametazon 4 razy 6 mg co 6 h), w porównaniu z placebo lub niestosowaniem leków, u ciężarnych z zagrażającym porodem przedwczesnym przed 34. tygodniem ciąży

(na podstawie: Crowley P.: Prophylactic corticosteroids for preterm birth. The Cochrane Database of Systematic Reviews, 2004, wyd. 2 [data ostatniej aktualizacji: luty 1999])

0x01 graphic

Przedstawiona metaanaliza, przeprowadzona w 1994 roku, jest również dobrym przykładem, jak synteza kilku lub kilkunastu różnych badań odpowiadających na to samo pytanie kliniczne, z których wiele pojedynczo nie miało wystarczającej mocy statystycznej, aby wykazać statystycznie istotną różnicę pomiędzy grupami (odcinek obrazujący 95% CI przecina pionową linię braku efektu), może przyspieszyć wprowadzenie skutecznej, ratującej życie interwencji do praktyki klinicznej. Jej wyniki przyczyniły się do opracowania w 1994 roku przez ekspertów zaproszonych przez amerykańskie National Institutes of Health wytycznych, w których zalecono powszechne stosowanie jednego kursu kortykosteroidów (24 mg w ciągu 48 h) u ciężarnych z zagrażającym porodem przedwczesnym w profilaktyce zgonów wcześniaków, zespołu błon szklistych i jego powikłań. W USA w 1990 roku interwencję tę zastosowano u matek tylko 15% noworodków urodzonych przed 34. tygodniem ciąży, natomiast w 1994 roku, po konferencji, na której zaprezentowano wytyczne - u 41%. Gdyby metaanalizę przeprowadzono w pierwszej połowie lat 80. ubiegłego wieku, już wówczas wykazałaby ona skuteczność omawianej interwencji. Ignorowanie wyników badań z randomizacją i błędy w ich interpretacji spowodowały, że przez ponad 14 lat nie stosowano powszechnie skutecznej interwencji ratującej życie 1 na każdych 25 noworodków urodzonych przedwcześnie (NNT: 25; 95% CI: 16-50).

Tabela 3. Wpływ HTZ (skoniugowane estrogeny końskie i octan medroksyprogesteronu) w porównaniu z placebo u zdrowych kobiet po menopauzie w okresie śr. 5,2 roku

Punkt końcowy	Placebo (%)	HTZ (%)	*RRI (95% Cl)**	*NNH (95% Cl)**
incydent wieńcowy	1,5	2	29% (2-62)	231 (106-3337)
zgon z przyczyn wieńcowych	0,3	0,4	18% (od -30 do 97)	-
zawał serca niezakończony zgonem	1	2	32% (2-71)	267 (119-4263)
inwazyjny rak sutka	1,5	2	26% (0-58)	254 (112-nieskończoność)
wszystkie nowotwory łącznie	6	6	3% (od -10 do 16)	-
zakrzepica żył głębokich	0,6	1	106% (49-185)	147 (84-320)
zator tętnicy płucnej	0,4	0,8	113% (39-224)	234 (118-677)
żylna choroba zakrzepowo-zatorowa	0,8	1,8	110% (58-180)	110 (67-209)
udar mózgu	1	1,5	41% (7-84)	234 (113-1368)
ogólna chorobowość**	8	9	14% (3-27)	91 (49-452)
			*RRR (95% Cl)**	*NNT (95% Cl)**
zgony ogółem	3	3	2% (od -18 do 18)	-
rak jelita grubego	0,8	0,5	37% (8-57)	326 (212-1512)
rak trzonu macicy	0,3	0,3	17% (od -47 do 53)	-
złamanie bliższego odcinka kości udowej	0,8	0,5	34% (2-55)	383 (237-6518)
złamanie kręgu	0,7	0,5	34% (2-56)	398 (242-6781)
inne złamanie osteoporotyczne	9	7	22% (13-30)	52 (38-86)
wszystkie złamania łącznie	10	8	23% (14-30)	45 (34-72)
zgon z innych przyczyn	2	2	8% (od -14 do 26)	-

* RRR, RRI, NNT, NNH wyliczone przez autorów streszczenia na podstawie danych zawartych w artykule
** wystąpienie jako pierwszego któregokolwiek z następujących punktów końcowych: choroby wieńcowej, inwazyjnego raka sutka, udaru mózgu, zatoru tętnicy płucnej, raka trzonu macicy, raka jelita grubego, złamania bliższego odcinka kości udowej lub zgonu z innych przyczyn
Wyniki badania WHI na podstawie 17. pozycji piśmiennictwa

0x01 graphic

Tabela 4. Niektóre ważne cechy wytycznych praktyki klinicznej (clinical practice guidelines) decydujące o ich jakości (wiarygodności) wg Instrumentu AGREE*

Zakres i cel
1. Ogólny cel (lub cele) wytycznych jest (są) precyzyjnie opisany (opisane).
2. Pytanie (pytania) kliniczne objęte wytycznymi jest (są) precyzyjnie opisane.
3. Populacja pacjentów, do której wytyczne się odnoszą, jest precyzyjnie opisana.
Udział użytkowników
4. W skład zespołu opracowującego wytyczne wchodzą przedstawiciele wszystkich grup zawodowych, których one dotyczą.
5. Uwzględniono punkt widzenia i preferencje pacjentów.
6. Użytkownicy wytycznych są jasno określeni.
7. Wytyczne zostały wypróbowane przez przyszłych użytkowników.
Poprawność metodyki
8. Wyszukiwanie danych przeprowadzono w sposób systematyczny (systematyczny przegląd piśmiennictwa).
9. Kryteria doboru danych są jasno opisane.
10. Metody formułowania zaleceń są jasno opisane.
11. Przy formułowaniu zaleceń uwzględniono korzyści zdrowotne, skutki uboczne i zagrożenia.
12. Zalecenia zostały wyraźnie powiązane z danymi, na podstawie których je sformułowano.
13. Przed publikacją wytyczne zostały zrecenzowane przez zewnętrznych ekspertów.
14. Podano procedurę aktualizacji wytycznych.
Przejrzystość i format
15. Zalecenia są konkretne i jednoznaczne.
16. Różne możliwości postępowania w danej sytuacji są jasno przedstawione.
17. Główne zalecenia są łatwe do zidentyfikowania.
18. Wytyczne są uzupełnione narzędziami ułatwiającymi ich stosowanie.
Użyteczność
19. Omówiono potencjalne bariery organizacyjne w stosowaniu zaleceń.
20. Uwzględniono potencjalne skutki ekonomiczne postępowania zgodnego z zaleceniami.
21. Wytyczne zawierają kryteria służące do monitorowania i(lub) kontroli jakości.
Niezależność redakcyjna
22. Instytucje finansujące proces powstawania wytycznych nie miały wpływu na brzmienie zaleceń.
23. Wytyczne zawierają deklaracje autorów dotyczące potencjalnego konfliktu interesów.

0x01 graphic

* "Jakość" zdefiniowano jako pewność, że błędy systematyczne związane z opracowywaniem, przedstawianiem i użytecznością wytycznych zostały zminimalizowane.
Opracowano na podstawie: 1. pozycji piśmiennictwa

Opublikowane pod koniec lat 90. ubiegłego wieku oraz w latach 2002 i 2004 wyniki badań z randomizacją, zaplanowanych w celu zweryfikowania hipotez i zaleceń sformułowanych na podstawie badań obserwacyjnych, nie potwierdziły korzystnego działania HTZ (estrogen z progestagenem lub sam estrogen) w tym zakresie, a nawet wskazywały na wiele skutków niekorzystnych lub jednoznacznie szkodliwych. W badaniu HERS (Heart and Estrogen/Progestin Replacement Study) i HERS II wykazano, że stosowanie przez kobiety po menopauzie z potwierdzoną chorobą wieńcową skoniugowanych estrogenów końskich i octanu medroksyprogesteronu przez 4-6,8 roku nie zmniejszyło ryzyka wystąpienia incydentów sercowo-naczyniowych. W grupie stosującej HTZ w porównaniu z grupą placebo zaobserwowano znamienne zwiększenie ryzyka zakrzepicy żył głębokich w ciągu pierwszych 4 lat (HR: 2,82; 95% CI: 1,32-6,04) i zatoru tętnicy płucnej podczas 6,8 roku obserwacji (HR: 2,86; 95% CI: 1,13-7,26). Większa była również częstość operacji dróg żółciowych (HR: 1,48; 95% CI: 1,12-1,95).

Inne badanie z randomizacją, WHI, dotyczyło pierwotnej profilaktyki chorób sercowo-naczyniowych u zdrowych kobiet w wieku pomenopauzalnym z użyciem długotrwale stosowanej estrogenowo-progestagenowej HTZ. Badanie to przerwano po 5 latach ze względu na niekorzystny bilans ryzyka i korzyści ocenianej metody HTZ (tab. 3). W ramieniu estrogenowym badania WHI brały udział kobiety w wieku pomenopauzalnym po histerektomii, u których stosowano same estrogeny (estrogenowa terapia zastępcza - ETZ). To badanie również przerwano w lutym 2004 roku, ponieważ nie stwierdzono wpływu ETZ na częstość występowania incydentów wieńcowych (główny końcowy punkt badania), a odnotowano znamienne zwiększenie ryzyka udaru wśród kobiet stosujących ETZ w porównaniu z grupą placebo (HR: 1,39; 95% CI: 1,1-1,77) oraz ryzyka zakrzepicy żył głębokich (HR: 1,47; 95% CI: 1,04-2,08).

Wytyczne praktyki klinicznej

Wytyczne praktyki klinicznej (clinical practice guidelines) mają pomagać lekarzom w podejmowaniu właściwych decyzji co do postępowania z pacjentami w określonych okolicznościach. Stanowią one próbę syntezy wyników badań naukowych i przeniesienia ich do praktyki w postaci jasno sformułowanych zaleceń dla lekarzy, uwzględniających również bilans korzystnych i niekorzystnych efektów postępowania, a czasem także bilans kosztów, jakie trzeba ponieść, aby osiągnąć dodatkowe korzyści zdrowotne. Jeśli wytyczne są opracowane z użyciem wiarygodnej metodyki (tab. 4), zmniejszającej błędy systematyczne, mogą być wartościowym narzędziem przynoszącym korzyści pacjentom i poprawiającym jakość opieki medycznej. Takie wytyczne przyczyniają się również do efektywniejszego wykorzystania ograniczonych zasobów.

Zalecenia zawarte w wytycznych różnią się siłą, ponieważ oparte są na danych o różnej wiarygodności (jakości). Jakość dowodów naukowych zależy od prawdopodobieństwa, że kolejne prawidłowo zaplanowane i przeprowadzone badania naukowe zmienią wielkość oszacowania efektu określonego postępowania (im jakość wyższa, tym to prawdopodobieństwo mniejsze; tab. 5). Siła zalecenia odzwierciedla stopień przekonania jego autorów, że korzyści płynące z przestrzegania tego zalecenia przeważają nad niekorzystnymi efektami. Podstawą zalecenia silnego są dowody wysokiej jakości (najbardziej wiarygodne), a korzyści jednoznacznie przeważają nad niekorzystnymi efektami. Zalecenie słabe opiera się z kolei na dowodach o niskiej jakości, a bilans korzyści i niekorzystnych skutków jest niepewny. Zwykle zalecenia plasują się pomiędzy tymi dwoma skrajnymi przypadkami, ale lekarz korzystający z wytycznych powinien wiedzieć, w którym miejscu. Zrozumienie znaczenia siły zaleceń pozwala bowiem skutecznie je wykorzystywać (lub nie) w codziennej praktyce. Zalecenie silne ("rób to" albo "nie rób tego") wskazuje, że zdecydowana większość osób dysponujących odpowiednimi danymi zgodziłaby się na taką ocenę bilansu korzyści i szkodliwości. Zalecenie o mniejszej sile ("raczej rób to" albo "raczej nie rób tego") wskazuje z kolei, że większość osób dysponujących odpowiednimi danymi zgodziłaby się na taką ocenę bilansu korzyści i szkodliwości, ale znacząca część miałaby odmienne zdanie.

Tabela 5. Stopniowanie jakości danych (dowodowych) z badań naukowych wg GRADE

jakość wysoka	= dalsze badania prawdopodobnie nie zmienią naszego przekonania o trafności oszacowania efektu interwencji
jakość średnia	= dalsze badania prawdopodobnie będą miały istotny wpływ na nasze przekonanie o trafności oszacownania efektu i mogą zmienić to oszacowanie
jakość niska	= dalsze badania najpewniej będą miały istotny wpływ na nasze przekonanie o trafności oszacowania efektu i prawdopodobnie zmienią to oszacowanie
jakość bardzo niska	= jakiekolwiek oszacowanie efektu jest bardzo niepewne

Opracowano na podstawie 4. pozycji piśmiennictwa

0x01 graphic

Zalecenie stosowania albo zaniechania danej interwencji nie oznacza, że wszystkich chorych powinno się leczyć jednakowo. Nie oznacza to również, że lekarz nie powinien uwzględniać zdania pacjenta przy podejmowaniu decyzji lub nie przedstawiać mu zalet alternatywnego postępowania. Niemniej jednak, ponieważ większość pacjentów dysponujących odpowiednimi informacjami dokonałaby takiego samego wyboru, względne korzyści z alternatywnych sposobów postępowania można im przedstawić stosunkowo krótko. Każde zalecenie jest tworzone z zamiarem ułatwienia podjęcia słusznej decyzji dotyczącej pojedynczego pacjenta lub populacji. Powinno ono zatem odzwierciedlać opcję, którą pacjenci najpewniej by wybrali na podstawie dostępnych danych i własnego systemu wartości lub preferencji oraz oczekiwanych efektów. Zalecenie słabsze, aby coś "raczej robić", wskazuje na potrzebę bardziej wnikliwego rozważenia przez lekarza systemu wartości i preferencji pacjenta, gdy proponuje się mu określony sposób postępowania.

W pewnych okolicznościach sformułowanie zalecenia jest niewłaściwe z powodu niejasnego bilansu korzyści i szkodliwości (brak badań o odpowiedniej wiarygodności) lub istotnych niezgodności w jego ocenie.

Wytyczne praktyki klinicznej i schematy postępowania mogą mieć wiele ograniczeń, bardzo ważna jest więc umiejętność oceny, czy dane wytyczne są wiarygodne i przydatne. Należy podkreślić, że wytyczne powinno się zawsze traktować jako jeden z czynników uwzględnianych przy podejmowaniu decyzji klinicznych, jak to przedstawiono we wstępie do tego artykułu (p. dane naukowe na rys. 1). Stosowanie wytycznych nie zmniejsza znaczenia indywidualnej oceny danej sytuacji klinicznej przez lekarza lub zróżnicowanych preferencji pacjentów.

Wyszukiwarka

Podobne podstrony:
Evidence?sed Medicine
Evidence based medicine
Evidence Based Medicine in Obs Gyn (04 11 02)
Evidence Based Medicine giełda 2014
2007 3 MAY Evidence Based Veterinary Medicine
2007 3 MAY Evidence Based Veterinary Medicine
Podstawowe zasady udzielania pomocy przedlekarskiej rany i krwotoki
Farmakologia pokazy, Podstawy Farmakologii Ogólnej (W1)
Podstawy fizyczne
CZLOWIEK I CHOROBA – PODSTAWOWE REAKCJE NA
Podstawy elektroniki i miernictwa2
podstawy konkurencyjnosci
KOROZJA PODSTAWY TEORETYCZNE I SPOSOBY ZAPOBIEGANIA
PODSTAWOWE ZABIEGI RESUSCYTACYJNE (BLS) U DZIECI
01 E CELE PODSTAWYid 3061 ppt
Epidemiologia jako nauka podstawowe założenia

więcej podobnych podstron