🤯Compra y obtén de regalo un curso junto a la Dra. Neva Milicic. Descubre aquí

🇲🇽 Hey, esto es Adipa México. Ir a Adipa Chile

Mensajes de Alerta
Letter testimonies
arrow-down-white

La jerarquía de la evidencia

En esta nueva edición de columnas, por el profesional y director académico de Adipa Global, PS. Nicolás Lorenzini, discute sobre la importancia de incorporar la evidencia científica en la práctica clínica.

Además, propone ordenar los resultados según la jerarquía de diseño de estudio y explica la relevancia de analizar las estadísticas en la toma de decisiones.

La jerarquía de la evidencia

En la columna anterior, además de abrirnos a pensar en la doble tarea que tenemos como psicoterapeutas, la tarea idiográfica del día a día en la consulta, y la tarea nomotética, que nos exige considerar la evidencia científica y las generalización que produce, he compartido un consejo para comenzar gentilmente a aproximarse a la producción científica en psicoterapia.

Asumo entonces que mis lectores están suscritos al menos a un par de newsletters de revistas científicas con revisión de pares en algún tema de psicoterapia que les interese.

Un buen lugar para encontrar estas revistas es a través de Google Scholar.

Entonces esas newsletter comienzan a llegar a nuestras casillas de correo y comienzan a aparecer esas expresiones “estudio comparativo”, “grupo control”, “revisión sistemática”, “meta-análisis”.

1. Resultados relevantes en la práctica clínica

La mayoría de estos estudios nos muestra algún resultado en que se ha descubierto, por ejemplo, que los episodios de ruptura de la alianza terapéutica son en promedio más frecuentes en adolescentes que en adultos, o que el estilo de apego del psicoterapeuta predice el resultado de la psicoterapia psicodinámica. Una serie de temas relevantes a la práctica clínica.

Entre estos resultados también se muestra la efectividad de modelos completos de psicoterapia, como por ejemplo los resultados de la terapia sistémica breve en personas que han experimentado recientemente eventos altamente estresantes. O la efectividad del Tratamiento Basado en la Mentalización en adultos diagnosticados con trastorno de la personalidad límite.

 Todos éstos son temas relevantes a la práctica clínica y sin embargo es difícil incorporarlos a nuestro quehacer diario.

¿Cómo lo aplicamos a la práctica clínica?

Uno de los problemas evidentes a la hora de intentar incorporar conocimiento científico a la práctica clínica es saber, de entre todos estos resultados, cuales son más generalizables.

Una forma de resolver ese problema es ordenar de manera jerárquica los resultados según la forma en que los estudios fueron diseñados. En el lugar más bajo de la evidencia están las opiniones expertas y los estudios de caso únicos.

Claramente la experiencia de una sola persona no es generalizable. La evidencia del éxito de un solo caso de psicoterapia, por ejemplo, no nos puede decir nada acerca de la efectividad de la psicoterapia. Hay demasiados factores en juego: la o el psicoterapeuta puede haber sido excepcional, o el paciente estaba especialmente motivado etc.

Siguiendo esta lógica, entonces es más generalizable cuando hay un grupo más grande de pacientes y terapeutas. Si alguna técnica psicoterapéutica obtiene un resultado en varias personas, entonces hay más probabilidad de que se repita en todas las personas.

Generalizar en terapia

Ahora bien, ¿cómo saber si ese resultado obtenido en varias personas es efectivamente el efecto de esa técnica psicoterapéutica? En otras palabras, ¿cómo generalizar los efectos de esa técnica en particular?.

Esas preguntas están a la base de tomar la decisión, como psicoterapeutas, de incorporar esas técnicas a nuestra práctica.

En un segundo lugar en esta jerarquía no solamente comienza a importar la cantidad de participantes en el estudio, sino también las medidas que los investigadores han tomado para controlar que el resultado que obtienen es efectivamente un producto de la técnica que están estudiando.

Esto también es parte del diseño de un estudio. Por lo tanto, en estos niveles siguientes encontraremos el concepto de “muestra”, es decir, un grupo de personas que es sometido a una intervención o técnica terapéutica. Al tener un grupo de personas, y ya no un caso único, podemos utilizar las matemáticas para calcular la probabilidad de que una técnica sea útil, es decir, comenzamos a utilizar el área matemática que se ocupa de las probabilidades: la estadística.

Brecha de la implementación

Es en este paso del caso único a la estadística que muchos de nosotros terapeutas comenzamos a alejarnos de la evidencia científica.

La estadística requiere habilidades que muchas veces están fuera de nuestra caja de herramientas. Es más, muchos colegas (e incluso yo mismo por un tiempo), preferíamos escapar de las matemáticas, pensando que no eran relevantes para el trabajo terapéutico. Nada más lejos de la verdad. Sin embargo, esta resistencia es todavía muy fácil de encontrar entre nuestros colegas y estudiantes. Es esta resistencia uno de los contribuyentes principales a la “brecha de la implementación” a la que me refería en mis columnas anteriores.

Por un lado, es entendible: el lenguaje estadístico puede llegar a ser muy complejo y sofisticado, y las ventajas que tiene entenderlo para nuestra práctica terapéutica no nos saltan a la vista. Pero es esencial: la mejor evidencia es la evidencia estadística, para saber que estamos haciendo bien, que estamos haciendo mal, qué intervenciones funcionan mejor y cuales peor… en suma, nos ayudan, sobre todo, para saber dónde vale más la pena utilizar nuestro tiempo para especializarnos y actualizarnos.

Ahora bien, una muestra grande no es el único factor que nos indica la calidad de la evidencia. Es más bien cómo utilizamos y distribuimos esta muestra.

2. Estudios observacionales

Estudios transversales

Subiendo entonces en la jerarquía de la evidencia, nos encontramos con los estudios transversales. Estos son estudios donde se observa a un grupo de personas en un momento determinado, para saber si podemos encontrar relaciones entre distintas características de estas personas. Por ejemplo, podemos tomar un grupo (una muestra) de personas y medir sus síntomas depresivos. Prontamente nos encontraremos que aquellos miembros de la muestra que son de genero femenino, presentan consistentemente más síntomas depresivos que aquellos de sexo masculino.

La estadística aquí nos permite encontrar una relación entre el género y la severidad de la sintomatología. Esa relación es una correlación.

Ahora bien, una correlación entre género y sintomatología no nos dice nada acerca del porqué de esa relación. No nos entrega una causa. Y si bien la relación existe (y tiene buena evidencia), poco nos puede decir que hacer como terapeutas con una persona depresiva. Solo nos dice que podríamos llegar a esperar de una depresión dependiendo del género de nuestros pacientes. Nos sirve para estar más atentos a la severidad y recaídas de una persona de género femenino. Pero nada más que eso.

Ni siquiera nos dice cómo hacer para prevenir, pero sí nos dice que, si queremos prevenir la depresión, tal vez debemos concentrar nuestros mayoresesfuerzos en las mujeres. Es decir, si nos sirve esta evidencia, pero no nos dice todo lo que querríamos saber para mejorar nuestro trabajo.

En mi próxima columna, continuaré subiendo por la jerarquía de la evidencia, y en próximas columnas me abocaré a aspectos prácticos, para ilustrar cómo podemos usar la ciencia en nuestra práctica sin tener que ser expertos en estadística ni mucho menos. Como siempre, invito al lector a manifestarme su interés en temáticas que sean relevantes a la práctica psicoterapéutica.

La psicoterapia es, al final de cuentas, una aplicación de los resultados (estadísticos y teóricos) que nos entrega la ciencia. Pero esa traducción entre ciencia y aplicación, como ya sabemos, no es algo sencillo. Pero si es posible, y mucho más de lo que muchos de nuestros colegas creen.

Estudios Caso-Control

Si escalamos el siguiente peldaño de la jerarquía de la evidencia, nos encontramos con los estudios de casos controlados. Estos estudios también se hacen sobre un grupo de personas, pero ese grupo se separa en (al menos) dos muestras: una con la afección, trastorno o problemática de salud mental de la que nos interesa aprender, y otra muestra de personas que no tienen esa afección.

Para continuar con el ejemplo de la depresión y el género, podríamos tomar un grupo de personas con depresión y otras sin depresión, y podremos ver si esos dos grupos se diferencian en alguna otra cosa más que la presencia del diagnóstico. Podremos encontrar más información aquí, que en los estudios puramente transversales.

No solamente encontraremos que en el grupo de aquellas personas con diagnóstico de depresión habrá más mujeres (y en el grupo sin depresión habrá más hombres), sino que, si manipulamos estos grupos y artificialmente ponemos la misma cantidad de hombres y mujeres en cada uno, podemos ir más allá del género. A esta manipulación de los grupos se le llama “control”(de ahí el nombre de estos estudios). Podremos ver entonces, por ejemplo, que aun “controlando” la variable género, las personas (tanto hombres como mujeres) que han sufrido abuso o maltrato infantil serán más en nuestra muestra depresiva que en nuestra muestra de personas sin depresión. Esto nos indica entonces que las experiencias adversas durante la infancia están conectadas de alguna forma a la depresión posterior.

Estos estudios nos dicen algo más de la “causa” de la depresión. Porque no podríamos haberhecho esa afirmación con menos evidencia. Ser mujer no es “causa” de la depresión, pero la adversidad infantil si parece tener una relación causal con este trastorno.

Salta a la vista la utilidad de este conocimiento, por ejemplo, en labores de prevención: si evitamos que exista el maltrato infantil, entonces estaremos previniendo los trastornos depresivos años o incluso décadas después. También nos indica que, por ejemplo, si estamos atendiendo a una persona con un diagnóstico de depresión en nuestra consulta, debemos explorar la posibilidad de que haya existido adversidad en la infancia, y mostrar a nuestro paciente como es que esas malas experiencias en la infancia continúan haciendo estragos en la vida actual de nuestro paciente. Si a esto le agregamos el aprendizaje que obtuvimos de los estudios transversales y el género, entonces sabemos que en nuestra práctica, si se nos presenta una mujer con depresión e historia de adversidad infantil, nuestro trabajo y actitud terapéuticas deben ser distintas que con un hombre, o con una persona sin ese historia adverso.

Limitaciones

Es importante reconocer, cuando leemos artículos científicos en psicología clínica, saber reconocer qué tipo de estudio este es, pues las lecciones que podemos extraer de ese artículo son siempre limitadas.

En los estudios de caso controlados, las limitaciones tienen que ver primero que nada, con su naturaleza transversal, es decir, con el hecho que estos estudios implican preguntarle a la muestra acerca de sus síntomas depresivos y sus historiales de adversidad infantil al mismo tiempo. ¿Por qué es importante eso? Porque si bien, los estudios de caso controlados nos acercan a la causa de la depresión (la vivencia de adversidad), no nos puede asegurar completamente esa relación causal.

¿Cómo puede uno estar seguro de que la adversidad infantil realmente ocurrió? ¿No podría ser también alguien que está con depresión simplemente recuerda su infancia peor de lo que realmente fue?

Estudios longitudinales

Los estudios de caso controlados son ideales para descubrir de manera rápida y sencilla las diferencias entre gente con y sin un trastorno ( en nuestro ejemplo, depresión), pero poco nos dicen de la causa propiamente tal, y también nos dicen poco o nada de cuál es la mejor técnica para tratar o prevenir estos casos. Lógicamente entonces, subir un peldaño más en la jerarquía de la evidencia implica hacer estudios, pero longitudinales, es decir, estudios que midan las características de nuestra muestra en distintos momentos.

Podemos, por ejemplo, tener una muestra a la que seguimos desde la infancia, si encontramos adversidad infantil en parte de nuestra muestra, vamos a observar años después que ese grupo con adversidad presenta mas depresión. Ahora, si tenemos un indicador más confiable de la causa de la depresión. Asimismo, podemos observar durante la infancia que, si bien hubo maltrato infantil en una parte de nuestra muestra, parte de esos niños maltratados recibieron algún tipo de intervención (una psicoterapia, un curso especial en el colegio, o fueron rescatados del ambiente maltratador por algún familiar benevolente o por el estado), y podemos no solo aprender que el maltrato es una de las causas de la depresión, pero que incluso habiendo maltrato, hay intervenciones que funcionan (o no) previniendo la depresión años después.

De este tipo de estudios podemos incluso concluir que hacer psicoterapia a los padres es una intervención que funciona luego para evitar depresión en sus hijos cuando sean adultos.

Estudios de cohorte

Los estudios longitudinales más completos se llaman “estudios de cohorte”. En este punto es justo preguntarse: si la evidencia es más confiable en este tipo de estudios, entonces ¿cuál es la lógica de hacer estudios como los transversales o de casos controlados o de casos únicos? Y la respuesta es sencilla: entre más subimos por la jerarquía de la evidencia, los estudios se vuelven más largos, más caros, más difíciles de llevar a cabo.

Si tenemos un estudio longitudinal en que queremos seguir niños maltratados hasta su adultez, para ver si desarrollan depresión, puede que en esos años perdamos contacto con nuestra muestra (porque se han cambiado de casa o han emigrado, por ejemplo, o porque simplemente los miembros de nuestra muestra han perdido interés de participar en el estudio).

Hay veces que los científicos no cuentan con el financiamiento para hacer estos estudios, pero igual es importante investigar. Hay también veces en que los científicos necesitan respuestas rápidas (pensemos en el COVID-19 y el desarrollo en tiempo récord de las vacunas) y no hay tiempo para seguir a la muestra por años.

Otra complicación que se agrega a la ciencia entre más arriba nos movemos por la jerarquía de la evidencia son los dilemas éticos, particularmente en psicología clínica. Por ejemplo: si estamos haciendo un estudio de cohorte, y seguimos a una muestra de personas a través de los años y descubrimos que hay maltrato infantil: ¿qué tan ético es no intervenir, como para descubrir si el maltrato tiene como consecuencia una depresión años después?

Hasta ahora, todos los tipos de estudio en la jerarquía de la evidencia han sido estudios observacionales: los investigadores simplemente miden algo que sucede de manera natural. Pero los estudios experimentales implican que los investigadores deben de una u otra forma manipular a la muestra, para ver qué pasa. Por ejemplo, aplicar o no una técnica que aún no sabemos si funciona.

3. Estudios experimentales

Estos son los estudios que no solamente nos entregarán información acerca de las causas de un trastorno, sino que nos informarán acerca de los tratamientos.

Estos estudios son de particular importancia para quienes practicamos tratamientos de salud mental, y es aquí donde vamos a encontrar estudios que permitan decir que un tratamiento es o no “basado en la evidencia”. Pero esa famosa frase “basado en evidencia”, puede tener muchas formas, y no toda evidencia tiene el mismo valor. La jerarquía, por lo tanto, continúa.

Estudios pre-post

Nos encontramos entonces con los estudios “pre-post”. Estos son estudios que escogen a una muestra de personas que han recibido algún diagnóstico que nos interesa estudiar, les aplicamos un tratamiento y luego comparamos como estas personas se sentían antes del tratamiento y como se sienten después. De ahí el nombre “pre-post”.

A un grupo de personas con depresión, por ejemplo, les hacemos 10 sesiones de terapia cognitivo conductual, por ejemplo, y tras esas sesiones vemos si la depresión ha mejorado. Si han mejorado, entonces ese tratamiento se considera efectivo, “basado en la evidencia”.

Pero uno podría perfectamente preguntarse si la gente se mejoró debido a las sesiones o a algo más. No lo podemos saber, pues no hay “control” de otras variables. Necesitamos agregar ese control, si queremos mejor evidencia.

El regreso a la media

Una de las típicas variables que nos podrían hacer pensar que el tratamiento es eficaz cuando no lo es, se llama “el regreso a la media”.

Este concepto describe un fenómeno estadístico: si nuestra muestra tenía altos niveles de depresión, lo más probable es que si esperamos un tiempo (incluso sin aplicar ningún tratamiento), muchas de esas personas van a tener un nivel más bajo de depresión, pues se comienzan a asemejar al promedio de depresión de la población general.

Si la muestra es grande, este fenómeno estadístico puede ser indistinguible del efecto del tratamiento. Entonces debemos agregar “control”. Y hemos visto que eso se hace reclutando otra muestra a la que no se le aplica el tratamiento.

Estudios experimentales controlados

Nos referimos entonces a “estudios experimentales controlados” o “estudios con grupo control”.

Si hay una diferencia importante en los niveles de depresión entre los dos grupos (uno que recibe y otro que no recibe tratamiento), entonces podemos confiarnos más en que es el tratamiento aquello responsable de las diferencias entre los dos grupos.

Nos acercamos mucho a poder decir: “este tratamiento sirve, está basado en la evidencia”. Pero ya inmediatamente, como ha podido darse cuenta el lector sagaz, los dos grupos pueden haber sido distintos desde el comienzo: un grupo estaba mas grave que el otro, o tenia mas mujeres, o mas personas con historia de maltrato.

Son muchísimas las variables que podrían estar explicando la diferencia entre las muestras, no solamente la administración del tratamiento.

Ensayos controlados aleatorizados

El próximo escalón de la evidencia intenta resolver ese problema, al crear estos dos grupos de manera aleatoria: por simple probabilidad, si vamos asignando aleatoriamente personas a uno u otro grupo, hemos de esperar que en cada grupo haya relativamente la misma cantidad de mujeres, la misma cantidad de gente con historias de maltrato, la misma cantidad de personas de diversas edades, etc.

Estos son los famosos “randomized controlled trials”, nombre que tiene múltiples traducciones al español, ej: “ensayos controlados aleatorizados”. Estos son estudios caros y difíciles de llevar a cabo, por lo que la gran mayoría se realizan en países anglosajones.

A través de la asignación de personas al tratamiento o al grupo de comparación (o grupo control), los investigadores controlan muchas variables que pueden estar influyendo en el trastorno y en la mejora, incluso variables en las cuales no hayan pensado, pues confiamos que lo aleatorio de la asignación nos permite armar grupos homogéneos, comparables entre si. Y que la única diferencia entre los dos grupos es si han recibido o no el tratamiento cuya eficacia se quiere investigar.

En términos de los tipos de estudio que podemos encontrar en la jerarquía de la evidencia, los ensayos aleatorizados con grupo control son la cúspide. Y sin embargo, la evidencia que entregan no es siempre del todo confiable o generalizable.

4. Replicación de estudios

Es entonces donde cobra importancia la replicación de esos estudios. Un solo estudio, pese a tener una muestra grande y varios grupos aleatorios para comparar, es un solo estudio, a fin de cuentas. Aquí es donde cobra mucha importancia la replicación de los estudios, y otros elementos que revisare en mis futuras columnas.

Pero quiero enfocarme en la replicación. Dado que eso nos permite seguir avanzando en la jerarquía hacia evidencia aún más confiable.

El próximo paso en la jerarquía es encontrar estudios similares (por ejemplo: varios estudios aleatorizados con grupo control que midan el efecto de la terapia cognitivo conductual en depresión), y analizarlos todos juntos. Eso se hace a través de revisiones sistemáticas y meta-análisis. A estos dos últimos tipos de investigación (la real cúspide de la jerarquía de la evidencia) se les llama “estudios secundarios”, ya que revisan estudios que ya han sido llevados a cabo (los “estudios primarios” que he venido listando en estas columnas).

Revisiones sistemáticas

Las revisiones sistemáticas son artículos científicos que se han dedicado a recolectar, criticar y sintetizar estudios con el fin de responder a una pregunta (por ejemplo, ¿sirve la terapia cognitivo conductual para tratar la depresión?). Esto se hace de manera sistemática y transparente, dejando muy claro al lector de estos artículos el cómo es que se han seleccionado los estudios primarios y cuales son los potenciales peligros de adjudicar la verdad a un solo estudio.

Las revisiones sistemáticas tienen la ventaja de usar estudios que han sido publicados como aquellos que no han sido publicados, ya que muchas veces, cuando investigadores que han llevado a cabo un estudio aleatorizado no tienen buenos resultados, prefieren no publicar o las revistas científicas optan por no publicarlos, ya que son menos atractivos al lector.

Otra ventaja de las revisiones es que, al juntar varios estudios de varios autores, evitan sesgos de los autores de algún estudio individual. Las revisiones sistemáticas además comentan en la calidad de los estudios que utilizan y son muy buenos indicadores de las limitaciones del conocimiento en general.

¿Meta-análisis?

Los meta-análisis son similares, pero lo que hacen es combinar diversos estudios primarios de manera estadística.

Por ejemplo, un meta-analisis puede tomar varios estudios del resultado de la terapia cognitivo conductual en depresión y promediar sus resultados, lo que, además de ofrecernos una visión del estado general de la pregunta “¿sirve la TCC en depresión?”, suman sus muestras para contestar esa pregunta. Y en general, entre más numerosa es la muestra, más confiables sus resultados.

Es suma, para el practicante de psicoterapia, son las revisiones sistemáticas y los meta-análisis los artículos mas importantes para saber si una práctica particular puede o no ganarse el mote de “basado en la evidencia”. Estos son los artículos que yo recomiendo leer a mis colegas.

Y sin embargo, leer estos artículos no es tarea fácil. Usualmente están llenos de jerga estadística y científica que dificultan la lectura. Por eso, en mi próxima entrega, espero poder ayudar a los lectores a navegar a través de un meta-análisis y entender sus diversos elementos.

Valoraciones

0.0
No existe comentarios que mostrar

Programas relacionados que te pueden interesar

Te mantenemos informado

Ir a noticias

Te podría interesar el programa de:

Whatsapp
¿Necesitas ayuda?
ADIPA
Hola!
¿Cómo te podemos apoyar? Escríbenos