Medicina Basada en Pruebas. Fundamentos Teóricos.


Métodos de investigación en cardiología clínica. Toma de decisiones en cardiología: metodología.

Rafael Gabriel Sánchez (a) Cayetano Permanyer Miralta (a)
Río Aguilar Torres (b) Francisco Rodríguez Salvanés (c)

(a) Unidad de Epidemiología Clínica. Hospital Universitario de La Princesa. Madrid
(b) Servicio de Cardiología. Hospital Universitario de La Princesa. Madrid
(c) Unidad de Epidemiología Clínica. Hospital Universitario de La Princesa. Madrid

El presente artículo revisa los metódos empleados en el proceso del razonamiento clínico clásico, para la toma de decisión, sus problemas y sus limitaciones, y plantea como alternativa para una toma de decisiones eficiente la utilización del proceso de Medicina Basada en Pruebas.
En el artículo se describen también las bases teóricas (probabilísticas) y las estrategias formales empleadas en la técnica de la toma de decisiones. Se presentan conceptos específicos y se describen los componentes básicos para la construcción de árboles de decisión.

Palabras clave: Toma de decisiones. Métodos. Práctica clínica

Rev Esp Cardiol 1997; 50: 573-585



INTRODUCCIÓN


La toma de decisiones (TD), bien sea de índole diagnóstica o terapéutica, es el camino final común del quehacer médico cotidiano. El médico usa constantemente de forma intuitiva términos como «bastante o poco probable» como aproximación al razonamiento probabilístico y aún se acepta que la experiencia clínica es la mejor garantía para la solución de la mayoría de los problemas médicos.
Sin embargo, la enorme complejidad (variabilidad de la enfermedad, heterogeneidad de los pacientes, etc.) y la incertidumbre asociada a la práctica de la medicina hacen difícil muchas veces saber de antemano cuál sería la decisión correcta ante un caso concreto. Esta realidad ha servido de estímulo al desarrollo de una nueva modalidad de práctica clínica basada en pruebas , que está resultando de ayuda inestimable en la TD (1).
Este nuevo enfoque combina elementos nuevos no contemplados en el modelo tradicional de práctica clínica con las habilidades clínicas clásicas. El proceso exige plantear el problema con precisión, identificar la información específica existente sobre el tema a través de la búsqueda sistemática de toda la evidencia disponible, determinar su validez y limitaciones, seleccionar los estudios más relevantes, sintetizar la evidencia acumulada y aplicar sus conclusiones al problema específico del paciente (2).
Para el abordaje de un problema de decisión con la metodología mencionada es imprescindible ante todo disponer de información clínicamente válida (datos científicamente contrastados). La necesidad de información ha propiciado el desarrollo de numerosos ensayos clínicos en un intento de dar respuesta a un sinnúmero de interrogantes. Sin embargo, la gran cantidad de escenarios posibles en cualquier proceso patológico hace que muchas de las recomendaciones de los ensayos pierdan especificidad ante un paciente con un perfil sociodemográfico y clínico distinto de los participantes en el ensayo publicado. Seguramente muchos de los pacientes a quienes teóricamente serían aplicables los resultados de un ensayo clínico, por una u otra razón (edad, estadio de la enfermedad, falta de consentimiento, etc.), no hubieran sido elegibles para dicho estudio.
Estos hechos dificultan, por un lado, la generalización de las recomendaciones de los ensayos y, por otro, su incorporación a la práctica clínica (3). Para tratar de solucionar este problema se han desarrollado técnicas como el análisis de subgrupos, cuyo objetivo es ofrecer recomendaciones específicas para «pacientes tipo» o el metaanálisis, que persigue la generalización de las recomendaciones al mayor número de situaciones y escenarios clínicos posibles (4).
No obstante, cuando no existe evidencia científica, ésta es limitada o existe controversia, la decisión descansa con frecuencia en la experiencia personal del médico o simplemente en las opiniones de los expertos. Este método subjetivo no contrastado de TD está sujeto a un amplio margen de error y su validez científica es cuestionable.
Alternativamente, el análisis de decisiones aporta un método formal que permite alcanzar una decisión óptima ante un problema concreto, combinando las probabilidades de todos sus posibles desenlaces ( outcomes ) con las utilidades asignadas a cada uno de ellos. De este modo, podrá alcanzarse la «decisión óptima»: aquella que obtenga la «máxima utilidad esperada». El uso de este método está, por tanto, justificado en cualquier situación de índole diagnóstica o terapéutica en la que exista incertidumbre en un intento de hacer más objetivos los juicios clínicos.

EL MODO HABITUAL DEL RAZONAMIENTO CLÍNICO: PRINCIPALES LIMITACIONES Y SESGOS

El razonamiento heurístico es el proceso mental utilizado habitualmente para el aprendizaje, recuerdo y comprensión de conceptos. Es, en esencia, la regla del saber que cotidianamente utilizamos de forma inconsciente.
El proceso habitual del razonamiento clínico sigue esta misma estrategia heurística y los clínicos suelen mostrarse a priori reacios a sustituirla por otra más objetiva que obligue a considerar por adelantado (a hacer explícitas) todas y cada una de las posibles alternativas, a estimar la probabilidad de que sucedan, a ponderar su rentabilidad y a definir previamente una estrategia de selección para dichas alternativas. La principal limitación del razonamiento heurístico viene determinada precisamente por su condición de proceso subjetivo existiendo estudios que muestran cómo la estimación de probabilidades mediante el proceso cognitivo heurístico (modo implícito inconsciente) induce a errores importantes. Los más importantes y frecuentes son:
a) Distorsión del modelo de enfermedad en la experiencia personal del médico, bien por discordancia entre el «patrón típico de la enfermedad» y el cuadro que presenta el paciente bien por conocimiento parcial del problema, o bien por estimación inadecuada de la probabilidad de ocurrencia en su entorno.
b) Excesiva utilización de «pistas» y signos poco específicos para poder aventurar el diagnóstico, predecir el curso o adelantar el desenlace de la enfermedad.
c) Desmesurada tendencia a atribuir cambios en el curso de la enfermedad a factores o intervenciones específicos, aunque aquéllos hubieran podido producirse simplemente por azar.
d) Sesgo de recuerdo a favor de los hechos y fenómenos más raros (los casos y acontecimientos más llamativos suelen estar más acccesibles en la memoria del médico).
e) El «sesgo del ancla o del anzuelo» o «la primera impresión es la que vale». Consiste en la infravaloración o inutilización de datos relevantes obtenidos tardíamente, una vez construida la hipótesis, y que difícilmente llegan a incorporarse a la TD. En el proceso diagnóstico por ejemplo, la información obtenida a posteriori puede resultar de gran utilidad para ajustar las probabilidades estimadas inicialmente (preprueba), a menudo demasiado extremas (próximas a uno o a cero).

FUNDAMENTOS DE LA TOMA DE DECISIONES: OBJETIVOS, PRINCIPALES USOS Y HERRAMIENTAS

El método probabilístico intensa reducir el error sistemático asociado al subjetivismo o a la inexperiencia personal y al mismo tiempo cuantificar el error aleatorio. Por ejemplo, los resultados de un estudio de prevalencia en un determinado grupo de población pueden utilizarse para estimar la probabilidad de dicha enfermedad en un individuo perteneciente al mismo grupo (probabilidad preprueba, o prevalencia) y para clasificar a priori a un paciente en una determinada categoría diagnóstica. Por su lado, los resultados sobre rentabilidad de las pruebas diagnósticas utilizadas en dicho estudio podrían servir también para ajustar la probabilidad diagnóstica inicial.
Igualmente, los datos procedentes de estudios de cohortes y de ensayos clínicos pueden ser utilizados para estimar un pronóstico y para decidir entre alternativas terapéuticas individuales (5).
La principal utilidad de la TD son los dilemas diagnósticos y terapéuticos asociados a incertidumbre. En cardiología son frecuentes las situaciones en las que la decisión de realizar o no una determinada prueba tiene consecuencias sobre la estrategia a seguir o sobre la intervención a realizar. Por ejemplo, dependiendo de su resultado (positivo o negativo), la decisión de realizar o no una coronariografía tiene irremediablemente consecuencias sobre la decisión terapéutica (tratamiento médico, revascularización, etc.). La estimación a priori de los riesgos y ventajas de realizar la prueba y la utilidad de la información suministrada por ella para despejar un dilema terapéutico pueden ambas ser tenidas en cuenta en un análisis formal de decisión.
Las dos herramientas más utilizadas en los problemas de decisión son:
a) El algoritmo clínico, aunque no es en esencia un método probabilístico, resulta un instrumento especialmente útil para describir secuencias de actuaciones clínicas y sirve como guía para el manejo estandarizado de pacientes (protocolos clínicos). Su estructura básica sirve de soporte al árbol de decisión, la herramienta por excelencia en la TD (la figura 1 presenta un típico algoritmo diagnóstico en cardiología: la pauta de actuación ante la insuficiencia cardíaca (6)).


Fig. 1. Ejemplo de algoritmo. Manejo farmacológico de pacientes
con insuficiencia cardíaca; *consultar al cardiólogo si no se ha
realizado aún; **los betabloqueantes y los calcioantagonistas pueden
ser efectivos pero deben ser considerados sólo a nivel de investigación;
tomada de Clinical Practice Guideline (6).


b) El árbol de decisión es esencialmente un algoritmo en el que se representan todas las estrategias disponibles de forma que puedan abordarse cuantitativamente los problemas de decisiones. Un árbol de decisión consiste en nodos que describen todas las alternativas posibles y donde se comparan todos los posibles desenlaces esperables para cada una de ellas (hacer angioplastia o cirugía), todos los posibles estados (como estadios de la insuficiencia cardíaca según la clasificación de la NYHA) y resultados (muerte/supervivencia tras la cirugía o la angioplastia). En él se especifican las probabilidades de que se produzca cada uno de los resultados clínicos considerados y permite cuantificar, en términos de salud, el valor del resultado asociado con cada decisión (utilidad). Su principal diferencia con el algoritmo es que en éste no se especifican probabilidades ni utilidades. La figura 2 presenta la estructura básica de un típico árbol de decisión en el que pueden identificarse sus componentes esenciales: nodos electivos representados por un cuadrado; nodos aleatorios representados por un círculo, y todos los posibles resultados ( outcomes ). La concatenación de las probabilidades de los nodos asume que las probabilidades son independientes (si no lo son debemos usar los procedimientos de cálculo de probabilidad condicionada). Los árboles de decisión se usan, sobre todo, para representar las estrategias disponibles y calcular la probabilidad de ocurrencia de cada resultado tras emplear una determinada estrategia (7).


Fig. 2. Esquema y componentes básicos de un árbol típico de decisión;
tomada de Gabriel et al (7), modificada.


Para su construcción básicamente se precisa:
­ Cuantificar la probabilidad de ocurrencia de resultados en cada nodo y la asignación de «utilidades» a los resultados.
A la hora de construir un árbol de decisión, existen una serie de reglas y consejos de utilidad a tener en cuenta:
­ Es preciso definir claramente el inicio, sin que haya lugar a dudas sobre el escenario inicial.
­ Las soluciones a los nodos deben ser concretas y excluyentes.
­ Una vez diseñado debe utilizarse un caso real para verificar su funcionamiento y hacer que un experto en la materia verifique las conclusiones concatenadas.
­ Probarlo y medir la consistencia en un número suficiente de casos y por distintos usuarios (8).

COMPONENTES BÁSICOS DE LA TOMA DE DECISIONES

La asignación de probabilidades (9).
Ya se ha comentado anteriormente que para que la TD sea eficiente es necesario en primer lugar contar con datos válidos sobre la probabilidad de ocurrencia de cada uno de los acontecimientos (nodos) gobernados por el azar.
Surge entonces la pregunta: ¿dónde podemos obtener información relevante para la asignación de probabilidades a los nodos de incertidumbre?. Son varias las estrategias posibles:
a) Investigación propia: el uso de datos propios, si son disponibles, está especialmente justificado, ya que la información de nuestro medio es esencial para un mejor ajuste de los modelos resultantes a nuestra realidad.
b) Información publicada procedente de estudios de calidad resulta muy útil y fiable para la estimación de probabilidades en aquellos nodos en los que la influencia de las peculiaridades de la población o del medio es pequeña.
c) Agregación de resultados de distintos trabajos mediante metaanálisis para aumentar la precisión y el poder de las inferencias.
d) La opinión de expertos: aunque recabarla siempre es recomendable, de cara a la TD formal la transformación de intuiciones en probabilidades resulta un ejercicio difícil, y en cualquier caso requiere utilizar más de un experto y cuantificar su grado de acuerdo.
Actualmente se acepta que la revisión crítica y sistemática de toda la evidencia científica disponible (publicada o no) sobre un tema concreto es el método más eficiente para la obtención de los datos más fiables y representativos ante un problema de decisión. El grado de validez científica de la información recopilada dependerá del tipo de estudio que apoya los datos, de su calidad, de su tamaño y del grado de consistencia de los resultados entre centros y/o estudios. Existen actualmente diversas escalas para puntuar la calidad de la información y el grado de evidencia científica en función del tipo de estudio. Una de las más populares en cardiología es la propuesta por la AHCPC en USA en la Guía de Práctica Clínica para el Manejo de la Insuficiencia Cardíaca (6). (tabla 1).

Obviamente, aunque la tendencia suele ser seleccionar aquellos estudios que aporten el máximo nivel de evidencia científica, esto no significa que el ensayo clínico aleatorio multicéntico sea el único que ofrezca datos válidos. Un buen estudio transversal, por ejemplo, es insustituible para estimar la probabilidad preprueba (prevalencia) de una enfermedad y la rentabilidad de una prueba diagnóstica en el mismo escenario del problema.
Precisamente una de las posibles limitaciones inherentes a la elaboración de árboles de decisión es la variabilidad de la validez externa de los resultados de la bibliografía, lo que obliga a decidir en qué medida pueden éstos aplicarse a cada situación en particular. Los cálculos deben basarse en aquellos trabajos de suficiente validez interna que mejor representen al grupo de pacientes objeto del análisis. De ahí que la elección de aquellos trabajos que se juzguen realmente pertinentes y aplicables sea un paso crucial. Éste es uno de los principales hechos que hacen problemática la aplicación de los árboles de decisión a la práctica clínica, particularmente de modo no crítico y con un criterio excesivamente literal.
Por todo ello, es muy aconsejable disponer de información propia para contrastar las publicaciones de otros autores. En cualquier caso, la combinación de información de distintas fuentes, como el conocimiento propio, publicado y las opiniones de expertos, posibilita considerar un amplio rango de probabilidades, de forma que el modelo de decisión resultante y los análisis de sensibilidad que se realicen representen más adecuadamente la realidad.
Definición y asignación de utilidades
Podríamos definir utilidades como la cuantificación de las preferencias personales de los resultados de los procesos de TD. Esta cuantificación siempre es discutida y discutible, pero muy útil. Distintas personas o incluso las mismas en distinta situación asignarían un valor de utilidad diferente a un mismo resultado. En general, los médicos suelen discrepar de los pacientes en esta asignación, ya que la clase social, el sexo o el nivel cultural son variables que afectan bastante a este proceso (10) .
En el campo de la cardiología, un ejemplo clásico de controversia en la asignación de utilidades podría ser el desarrollo de impotencia en hombres tratados con betabloqueantes: ¿tendrían las mismas preferencias un grupo de mujeres que un grupo de varones, los pacientes que los médicos, los profesionales sanitarios que otros profesionales (p. ej., psicólogos), los pacientes con hijos que sin hijos, etc.?
Arbitrariamente, y por facilitar el cálculo, se fijan los límites entre 0 y 1; al resultado que nadie desearía se le asigna el valor 0, y al preferido el valor 1. La asignación de los valores intermedios puede hacerse arbitrariamente por el investigador, mediante una encuesta a una muestra de la población o a un grupo de expertos.
El uso discutido y discutible de las utilidades es la mejor forma de incorporar las preferencias subjetivas y/o las prioridades de los profesionales, usuarios y gestores al proceso de TD. El planteamiento, por ejemplo, de estudios que informen al paciente tanto de los potenciales beneficios (lado positivo de la intervención) como de los inconvenientes (lado negativo) y comprueben su grado de aceptación según el formato de información que los sustente es una posibilidad atractiva. Resulta también muy interesante incorporar al proceso habitual de asignación de utilidades otros resultados poco considerados en la práctica diaria y sólo considerados recientemente a los ensayos clínicos. El efecto sobre la calidad de vida es un ejemplo (11).
En definitiva, la participación activa del paciente en el proceso de decisión es decisiva para que las utilidades elegidas tengan relevancia y la asignación de valores se adapte a sus preferencias, aunque son todavía muy escasos los estudios que utilizan esta metodología (12).

Análisis de sensibilidad

La mayor utilidad de la TD no es simplemente hacer evidente el proceso, sino trabajar con situaciones cambiantes («jugar con el modelo») de forma que podamos responder a preguntas del tipo: ¿qué pasaría si el test fuera menos preciso, o esta complicación menos frecuente, o si el tratamiento tuviera resultados menos brillantes, etc.?
Este tipo de simulación se denomina análisis de sensibilidad y esencialmente consiste en cambiar los valores asignados a los distintos nodos, para estudiar el efecto de estos cambios de situación sobre las distintas vías del árbol de decisión.
Estos cambios pueden afectar a la utilidad de una vía concreta de forma que ésta sea función de las variaciones de los parámetros en uno o varios nodos. Con frecuencia la elección por una u otra vía se toma tras analizar estas variaciones, ya que las funciones de utilidad de las distintas ramas pueden no ser paralelas, siendo posible definir un determinado umbral en el que la utilidad de una vía sobrepase a las demás. Estas intersecciones. Se pueden representar gráficamente y se denominan umbrales de decisión (decision thres-holds).
El umbral de decisión se define como el nivel de probabilidad en el que el beneficio esperable de tomar una decisión iguala al de no tomarla (o al de tomar una alternativa); es el llamado nivel de indiferencia. En dicho punto, el médico puede o bien estimar intuitivamente el coste-beneficio de cada decisión o bien calcularlo objetivamente. Las decisiones generadas con este método permiten considerar también el grado asociado de certidumbre diagnóstica, lo que posibilita su aplicación a situaciones relativamente comunes en clínica en las que desconociéndose o dudándose sobre la presencia de la enfermedad pueden plantearse distintas alternativas: no tratar, solicitar más información (nuevas pruebas antes de tratar) o tratar sin someter al paciente a nuevas pruebas (tratamiento empírico) (13).
La elección final de una u otra alternativa se basa en comparar la probabilidad de que el paciente tenga la enfermedad (probabilidad preprueba) con los llamados «umbral de prueba» (nivel de fiabilidad y riesgo de la prueba en cuestión) y con el «umbral de prueba-tratamiento» (riesgos y/o beneficios de un tratamiento específico). El tratamiento debe desaconsejarse si la probabilidad de enfermedad es menor que el «umbral de prueba» (esto ocurre o bien cuando el test es muy seguro o cuando comporta poco riesgo) y administrarse sin más si la probabilidad preprueba es mayor que el umbral prueba-tratamiento. La nueva prueba se realizará solamente si la probabilidad de la enfermedad se encuentra entre ambos umbrales. La figura 3 ilustra un ejemplo de este tipo ante un dilema muy frecuente en cardiología, ingresar o no en la UC a un paciente con sospecha de infarto agudo de miocardio (14).

Fig. 3. Toma de decisiones de índole diagnóstica en el campo de
la medicina de urgencias; tomada de Latour et al 14 .

Análisis de coste-efectividad

En otro artículo de esta serie (15) se describen en detalle los principales conceptos y técnicas de análisis económico en la práctica clínica, a él remitimos al lector para facilitar la comprensión de este apartado. No obstante, recordaremos aquí el concepto de análisis de coste-efectividad: «Aquella forma de análisis socioeconómico en el que los costes se miden en términos económicos y los resultados se expresan como efectividad.»
Evidentemente, podemos utilizar los modelos de análisis de TD para estudiar eficacia global, efectividad y eficiencia tanto de procedimientos diagnóstico-terapéuticos como de cualquier programa de cuidados. En los análisis de eficacia, ya sean terapéuticos o diagnósticos, se consideran los resultados en términos de tasas de curación, recidiva, de verdaderos positivos o negativos, etc. En estos casos, la asignación de utilidades es «poco útil» pues toman sólo valores de 0 o 1, por lo que la información que aportan es redundante. Sin embargo, otros resultados de la acción sanitaria como son las tasas de incidencia o los años de vida perdidos son formas más objetivas y atractivas de cuantificar la eficacia.
Cuando el interés es el análisis de la efectividad resulta imprescindible la inclusión de hechos como los efectos secundarios. Un indicador especial de efectividad de creciente popularidad es el QALY ( Quality Adjusted Life Years ), que permite cuantificar los años de vida perdidos (o ganados) corregidos por el nivel de calidad de vida.
Si conocemos, además de los resultados, el coste de cada posible acción en el árbol, podremos evaluar también la eficiencia de nuestros procedimientos. Esta estimación debe ser considerada siempre, y es imprescindible en los casos en los que la eficacia, la efectividad o las utilidades de las distintas alternativas son similares, ya que en estos casos la decisión final debe basarse fundamentalmente en el análisis de eficiencia. Al considerar los costes deben estimarse no sólo los directos, sino también otros indirectos y a veces intangibles como mortalidad, efectos secundarios, etc. Estos abordajes deben usarse conjuntamente siempre que sea posible, ya que ofrecen enfoques complementarios de los problemas de decisión.

Referencias Bibliográficas:
1. Evidence-Based Medicine Working Group Evidence-based Medicine: a new approach to teaching the practice of medicine. JAMA 1992; 268: 2.420-2.425.
2. Audet A, Greenfield S, Field M Medical practice guidelines: current activities and future directions. Ann Intern Med 1990; 113: 709-714.
3. Clinical trials and clinical practice [editorial] Lancet 1993; 342: 877-878.
4. Sackett DL Applying overviews and meta-analyses at the bedside. J Clin Epidemiol 1995; 48: 61-66.
5. Thornton J, Lilford R, Johnson N Decision analysis in medicine. Br Med J 1992; 304: 1.099-1.103.
6. Clinical Practice Guideline Number 11. Hearth failure: evaluation an care of patients with left-ventricular systolic dysfunction U.S. Department of Health And Human Services. Public Health Service. Agency for Health Care Policy and Research. AH Publication N.º 94-0612, junio 1994.
7. Gabriel R, Rodríguez F, Castrillo JM, eds Toma de decisiones: metodología. En: Tratado de Epidemiología Clínica. Departamento de Medicina y Psiquiatría. Universidad de Alicante, 1995.
8. Pauker S, Kassirer J Decision Analysis. N Engl Med J 1987; 316: 250-258.
9. Sox HC, Blatt MA, Higgins MC, Marton KI En: Medical Decision Making. Publishers Eds., Butterworths, 1988.
10. Kassirer J, Moskowitz A, Lau J, Pauker S Decision analysis: a progress report. Ann Intern Med 1987; 106: 275-291.
11. Williams GH Quality of life and its impact on hypertensive patients. Am J Med 1987; 82: 98-105.
12. Greenfield S, Kaplan S, Ware JE Jr Expanding patients involvement in care: effects on patients outcomes. Ann Intern Med 1985; 102: 520-528.
13. Pauker SG, Kassirer JP The threshold approach to clinical decision making. N Engl J Med 1980; 102: 1.109-1.117.
14. Latour J, Álvarez DO, Barrio M, Estellés MA, Grells ML La creatinincinasa (CK) total, la CK-2 y la mioglobina en el diagnóstico del infarto agudo de miocardio en un servicio de urgencias. Med Clin (Barc) 1993; 100: 641-645.
15. Lázaro P Evaluación socioeconómica de la práctica clínica cardiológica. Rev Esp Cardiol 1997; 50.


Caso Práctico