Ensayos aleatorizados por conglomerados

Alexandre Dumont

10 Ensayos aleatorizados por conglomerados

Ejemplo dirigido a la salud materna e infantil

Alexandre Dumont

**Ensayos aleatorizados por conglomerados**
Definición del método Los ensayos aleatorizados por conglomerados evalúan el impacto de las intervenciones sanitarias aplicadas a nivel de un grupo de personas, como las pacientes que dan a luz en un mismo hospital o las personas que viven en la misma aldea.
Fortalezas del método Evita el sesgo de la contaminación mediante la intervención de individuos (u objetivos) de dos grupos diferentes Permite un alto nivel de pruebas de los efectos de la intervención Los ensayos controlados por conglomerados son con frecuencia estudios experimentales pragmáticos que evalúan intervenciones de la vida real.
Desafíos del método La intervención debe ser lo más estandarizada posible Desafíos estadísticos relacionados con el hecho de que la unidad de aleatorización y análisis no es la misma Desafíos en la selección de grupos representativos del sistema de salud en el que se lleva a cabo la investigación.

La maternidad en la RDC. Crédito de *“Action Santé des Femmes”.*

La aplicación de las políticas sanitarias requiere la experimentación periódica de nuevas intervenciones adaptadas al contexto y destinadas a facilitar la aplicación de buenas prácticas que tengan un fuerte impacto en la salud de las poblaciones. En la lucha contra la mortalidad materna, la mayoría de las políticas de salud perinatal del mundo se basan en el parto asistido por personal calificado y el tratamiento de las complicaciones obstétricas cuando se producen durante el trabajo de parto o el parto. Estos tratamientos son conocidos, pero el desafío para la mayoría de los sistemas de salud en desarrollo es implementarlos de manera oportuna. Se han ensayado muchas iniciativas en países de ingresos bajos y medios para movilizar a las comunidades o mejorar el sistema de atención de la salud y las prácticas médicas con el propósito de que las mujeres puedan acceder más rápidamente a servicios obstétricos de calidad.

Algunas evaluaciones experimentales o cuasi-experimentales han proporcionado pruebas tempranas sobre la eficacia y la aplicación de las intervenciones para reducir la mortalidad materna. Sin embargo, esta información sigue siendo fragmentada y se han realizado pocos estudios de impacto de buena calidad en los países de bajos ingresos en comparación con los países con mayores niveles de recursos. Sin embargo, es necesario generar y difundir más pruebas sobre la eficacia de esas intervenciones, ya se trate de programas nacionales o de iniciativas más localizadas. Esto debería permitir a los encargados de formular políticas y adoptar decisiones y a los responsables de los programas de salud materna elaborar políticas públicas más efectivas.

El nivel de pruebas de los estudios de impacto basados en la población puede compararse con el de los estudios clínicos de los tratamientos con drogas (véase el cuadro 1). Los estudios con mayor nivel de pruebas son los ensayos controlados aleatorios (ECA) en los que se controlan la mayoría de los sesgos de selección de los participantes, asegurando así que los cambios observados son efectivamente atribuibles a la intervención y no a las diferencias entre las personas o las prácticas de atención. Existen dos categorías de ECA: ECA individuales en los que los sujetos se seleccionan de forma aleatoria individualmente para participar en diferentes grupos de intervención (aleatorización individual) y ECA por conglomerados en los que los grupos de sujetos se aleatorizan (aleatorización por conglomerados).

**Tabla 1 : Niveles de evidencia científica y grados de recomendación (Fuente: Hautes Autorités de Santé, Francia)**
Nivel de evidencia científica proporcionada por la literatura (estudios terapéuticos)	Grado de recomendaciones
Nivel 1 (NP1) Ensayos controlados aleatorios de alta potencia Meta-análisis de ensayos controlados aleatorios Análisis de decisiones basado en estudios bien realizados	Pruebas científicas establecidas A
Nivel 2 (NP2) Ensayos controlados aleatorios de baja potencia. Estudios controlados no aleatorios bien realizados Estudios de cohortes	Presunción científica B
Nivel 3 (NP3) Estudios de control de casos	Bajo nivel de evidencia C

Los ECA individuales son poco frecuentes en los países de ingresos bajos y medios por tres razones principales: i) el costo de esos estudios es elevado, ya que por lo general requieren la contratación de pacientes de múltiples centros durante varios años; ii) la mayoría de las intervenciones que deberían probarse en un entorno de bajos recursos ya tienen una eficacia conocida en los países de altos recursos; y iii) la asignación aleatoria de sujetos puede no ser posible para evaluar las intervenciones en la comunidad por razones logísticas, administrativas o incluso éticas. Otra desventaja de los ECA individuales es que la captación de sujetos suele ser muy selectiva debido a los múltiples criterios de inclusión y exclusión, y las condiciones en que se aplican las intervenciones están demasiado estandarizadas. Los resultados obtenidos por un ECA son entonces difíciles de generalizar a contextos distintos de aquel en el que se realizó el estudio.

El enfoque utilizado en los ECA por conglomerados es mucho más pragmático que el de los ECA individuales (Cuadro 2). La intervención probada no se dirige directamente al individuo, sino a una unidad “social” independiente (familia, pueblo, médico, hospital, etc.) para cambiar el comportamiento o introducir nuevas prácticas en la “vida real”.

**Tabla 2 : Ensayos aleatorios individuales y por conglomerados**
	ECAs individuales	ECAs por conglomerados
Unidad de Intervención y Aleatoriedad Grupo temático	Sujeto	Grupo de sujetos
Tipo de intervención	Tratamiento	Programa de intervención
Objetivo	Mejorar el estado de salud	Cambiar los comportamientos
Riesgo de contaminación	Alto	Bajo
Contexto del estudio	Altamente estandarizado	El entorno clínico de la vida real
Costo	Alto	Alto

Desafíos de los ensayos controlados aleatorios por conglomerados

Si bien los ensayos aleatorios por conglomerados ofrecen varias ventajas en los países de ingresos bajos y moderados con respecto a los ensayos individuales, presentan algunas dificultades metodológicas porque la unidad de análisis es diferente de la unidad de aleatorización o intervención (figura 1).

*Figura 1. Implicaciones de los ensayos controlados aleatorios por conglomerados*

La aleatorización de los conglomerados, nos pone en la posición de recoger información a nivel de individuos cuyas características no son necesariamente estables en el tiempo, ni equilibradas en los grupos del ensayo. Además, estos datos están correlacionados dentro de cada grupo. Esta situación lleva a tres importantes consecuencias a considerar cuando se analizan los resultados de un ensayo de grupo.

En primer lugar, las características de los individuos de los grupos, pero también el desempeño general del sistema de salud, pueden cambiar durante el período de estudio. Esto explica los cambios observados en los indicadores de salud en los grupos en los que no se aplica ninguna intervención externa (grupo de control), a los que nos referiremos como “efecto del tiempo”. Por ejemplo, la tasa de mortalidad materna ha disminuido casi un 44% en los últimos 25 años en todo el mundo. Muchos países han establecido políticas sanitarias que han contribuido a esta tendencia positiva. Si no se tiene en cuenta la tendencia natural de los indicadores de salud materna en un estudio de los efectos de una nueva intervención, ello equivaldría a atribuir los cambios observados únicamente a esa intervención y no al efecto combinado del tiempo y la intervención. Por ello es esencial comparar los resultados observados en un grupo experimental con los observados en un grupo de control sin intervención externa. Veremos cómo el enfoque de “diferencia en diferencias” en este caso nos permite individualizar el efecto de la intervención del efecto del tiempo.

Otra implicación metodológica de la aleatorización por conglomerados está relacionada con un frecuente desequilibrio en las características de los individuos entre los grupos de comparación. De hecho, la aleatorización de grupos conduce casi sistemáticamente a una situación en la que la aleatorización se produce antes de la inclusión de los sujetos. Las características de los grupos se distribuyen entonces homogéneamente entre los grupos si la aleatorización se realiza adecuadamente. El desequilibrio resultante, denominado “efecto de grupo”, puede explicar las diferencias en los indicadores de salud entre los grupos de comparación, incluso antes de que se inicie la intervención. El riesgo de no tener en cuenta este desequilibrio sería atribuir el efecto de la intervención a la diferencia inicial entre los grupos, aun cuando la intervención fuese inefectiva.

Por último, mediante la asignación aleatoria por conglomerados, se pueden recoger datos correlacionados. Los sujetos de una unidad o grupo “social” no pueden considerarse independientes entre sí. De hecho, los resultados observados en dos sujetos del mismo grupo tenderán a ser más “similares” que si los resultados se asociaran a dos sujetos de dos grupos separados (y por lo tanto independientes). Si no se tiene en cuenta la correlación inducida por el diseño experimental (el efecto de conglomerado) se subestimaría la potencia de las pruebas estadísticas, se reducirían falsamente los intervalos de confianza y se llegaría a conclusiones de estudio erróneas.

En el caso del ensayo QUARITE en Senegal y Malí, se asignaron hospitales al azar para que intervinieran en los profesionales de la salud en el supuesto de que la mejora de la calidad de la atención conduciría a una disminución de la mortalidad materna. Veremos, a través de este ejemplo, cómo el uso de métodos estadísticos apropiados nos permite analizar correctamente estos datos.

Contexto y programa evaluado: el ensayo QUARITE para reducir la mortalidad materna en el hospital

A pesar de la disminución de la mortalidad materna en todo el mundo, ésta sigue siendo muy elevada en muchos países de ingresos bajos y medios. Una gran proporción de las muertes maternas se deben a un tratamiento tardío o inapropiado de las complicaciones obstétricas. Por lo tanto, existe una necesidad urgente de intervenciones efectivas para hacer frente a esta situación. Esas intervenciones suelen entrañar la movilización de las comunidades para mejorar la utilización oportuna de la atención y el mejoramiento de la continuidad de la atención y las prácticas médicas en los diferentes niveles de atención sanitaria.

Probamos un enfoque que combina el análisis de casos de mortalidad materna en centros de salud (o auditorías de muertes) y la capacitación en el servicio del personal de salud (Dumont y otros, 2013) mediante un ECA por conglomerados (ensayo QUARITE) entre 2007 y 2011. La unidad de aleatorización e intervención fue el hospital de referencia en el que se trataron las complicaciones obstétricas más graves en Malí y Senegal. La intervención se dirigió a los profesionales de la salud que trabajaran en la misma unidad (sala de maternidad). La intervención, de dos años de duración, consistió en la capacitación inicial de líderes de opinión locales en las mejores prácticas y en auditorías de muertes maternas (capacitación de instructores). A continuación, los líderes de opinión capacitaron a sus equipos (médicos, parteras y enfermeras capacitadas) en cada hospital e implementaron las auditorías de muerte materna. Un facilitador externo visitó cada centro cada tres meses para supervisar el cumplimiento de la agenda de entrenamiento y supervisar una sesión de auditoría. El objetivo de la Auditoría de Muerte Materna era investigar cualitativa y exhaustivamente las causas y circunstancias de las muertes maternas en los centros de salud. Como primer paso, estas muertes fueron identificadas y analizadas en las instalaciones. Sin embargo, cuando fue posible, estos estudios también trataron de identificar los factores ajenos al hospital, al sistema de salud o a la comunidad que contribuyeron a la muerte. La capacitación del personal sanitario se centró en los problemas de gestión identificados en las sesiones de auditoría para ayudar a mejorar la calidad de la atención en los hospitales participantes.

Protocolo de evaluación

Para medir los efectos de la intervención QUARITE sobre la mortalidad materna en los 46 hospitales de referencia que participaron en el ensayo, se registraron todos los nacimientos en estos centros durante cuatro años, entre octubre de 2007 y octubre de 2011. Las muertes maternas se identificaron a partir de múltiples fuentes de información como los registros de partos, quirófanos, hospitales o morgues y los registros clínicos disponibles. El principal criterio de valoración del ensayo fue la tasa de mortalidad materna estimada (TMM), definida como el número de muertes maternas registradas en el hospital dividido por el número de partos durante el mismo período.

Cuatro años de recogida de datos permitieron estimar este indicador antes de que se aplicara la intervención (año 1), durante el período de intervención (años 2 y 3) y después de que se finalizara la intervención (año 4).

Los hospitales se asignaron al azar al final del primer año de recogida, justo antes del comienzo de la intervención, entre un grupo experimental expuesto al programa y un grupo de control sin intervención externa. La figura 2 muestra los cambios en la mortalidad materna en los dos grupos durante el período de estudio. Disminuyó de 10,4 muertes por cada 1.000 partos a 6,8 muertes por cada 1.000 en el grupo experimental entre los períodos “antes” y “después” de la intervención. Esta disminución fue menos marcada en el grupo de control: entre 8,1 y 7,1 por 1000 partos.

Figura 2. Cambio en la mortalidad materna en ambos grupos – ensayo QUARITE. Nota: La línea de puntos representa el cambio en la mortalidad materna en el grupo de intervención si su nivel de base (antes de la intervención) hubiera sido equivalente al del grupo de control.

Aplicación del método

Teniendo en cuenta el efecto del tiempo: el enfoque de “diferencia de diferencias”

La diferencia de mortalidad materna entre los dos períodos del grupo de control representa la tendencia natural de la mortalidad materna en los hospitales de referencia de Malí y Senegal (figura 2). Esta tendencia es pequeña (-1,0 muertes por cada 1.000 partos) durante el período de estudio, pero no es insignificante. Refleja el efecto de la modificación de las características de los pacientes a lo largo del tiempo, pero también los cambios en el sistema de salud. La cesárea gratuita iniciada en 2005 en Senegal y luego en 2006 en Malí probablemente facilitó el acceso a los servicios de salud y mejoró gradualmente el resultado de los partos entre 2007 y 2011. Además, la supervisión periódica de los equipos de atención de la salud durante el período de prueba para mejorar la calidad de los datos recogidos, puede haber contribuido a mejorar la atención de rutina en los hospitales de ambos grupos y el tratamiento de los pacientes. Por todas estas razones, los resultados de salud materna mejoraron durante el estudio en el grupo de control, aunque no recibieron ninguna intervención. El método de diferencias en diferencias (DD) permite tener en cuenta este efecto del tiempo en el estudio del impacto.

En el enfoque DD, el efecto de la intervención se mide por la diferencia de los cambios observados entre los dos grupos (véase la tabla 3). Los resultados pueden expresarse en términos de diferencia en los riesgos de mortalidad o en los odds ratios (OR).

En cuanto a la diferencia de riesgo, el efecto de la intervención es la disminución de las tasas de mortalidad materna en el grupo experimental (-3,5 muertes por 1000) menos la disminución de la mortalidad en el grupo de control (-1,0 por 1000). Por lo tanto, en este ejemplo, se estima que el DD es de (-3,5) – (-1,0) = – 2,5 muertes por cada 1.000 partos (IC 95% = – 3,5; – 1,5 por cada 1.000 partos). En otras palabras, una intervención en un hospital con 1.000 partos evitaría 2,5 muertes maternas en comparación con otro hospital con el mismo volumen de actividad pero que no se beneficia del programa. Este efecto es estadísticamente significativo porque el intervalo de confianza del 95% del DD no contiene 0.

Cuando los resultados se expresan como odds ratios (OR), el efecto de la intervención es la relación entre los odds ratios de los dos grupos. En nuestro caso, las probabilidades para un grupo determinado en un momento dado es el número de muertes maternas dividido por el número de mujeres vivas antes del alta hospitalaria. Por lo tanto, el odds ratio (OR) entre los dos períodos es el cambio en el riesgo de mortalidad materna entre el año 1 y el año 4. Debido a que la mortalidad disminuyó en ambos grupos entre los dos períodos de estudio, los OR son inferiores a 1 (tabla 2). Sin embargo, la disminución fue mayor en el grupo experimental (OR = 0,66) que en el grupo de control (OR = 0,89). La relación entre los dos OR, es igual a 0,73 (IC del 95% = 0,61; 0,91), mide el efecto de la intervención, que de nuevo es estadísticamente significativo porque el intervalo de confianza del OR no contiene 1. En otras palabras, la intervención redujo la mortalidad materna en un 27% en comparación con los cambios observados en el grupo de control.

**Tabla 3 : Riesgos de mortalidad materna por grupo y período de tiempo – Ensayo QUARITE**
	Año 1 Muerte p. 1000 (recuento)	Año 4 Muerte p. 1000 (recuento)	Diferencia de riesgo p. 1000 (95 % CI)	Proporción de probabilidades (95 % CI)
Grupo de intervención	10,4 (445/43269)	6,8 (356/52662)	– 3, 5 (- 2,3; – 4,7)	0,64 (0,57; 1,15)
Grupo control	8,1 (337/41655)	7,1 (381/53581)	– 1, 0 (- 0,1; – 2,0)	0,88 (0,76; 1,16)

Los resultados brutos estimados con el enfoque DD, ya sea en términos de diferencia de riesgo o de proporción de probabilidades, muestran que la intervención es efectiva para reducir la mortalidad materna hospitalaria en un sistema de salud como el de Malí o Senegal. Aunque el impacto medido parezca pequeño, estos resultados serían lo suficientemente significativos como para convencer a un responsable de la toma de decisiones de aplicar un programa de este tipo a nivel nacional en todos los hospitales. Sin embargo, esta persona podría cuestionar los resultados del estudio, que no tienen en cuenta el desequilibrio inicial entre los grupos y la correlación de los datos. En los dos párrafos siguientes veremos cómo tener en cuenta el efecto de grupo y el efecto de racimo.

Teniendo en cuenta el efecto del grupo

La figura 2 muestra que el nivel de mortalidad materna en el año 1 fue mayor en los hospitales del grupo de intervención que en el grupo de control. La disminución más rápida de la mortalidad en el brazo experimental redujo entonces la tasa de mortalidad materna a casi el mismo nivel que en el grupo de control en el año 4. Si hubiéramos comparado los resultados del ensayo entre los dos grupos en el año 4, habríamos llegado a la conclusión errónea de que la intervención no tuvo ningún efecto en la mortalidad.

El enfoque DD, que analizó los cambios en ambos grupos simultáneamente, abordó este problema, pero no controló el desequilibrio inicial entre los grupos. Debido a que los hospitales fueron asignados al azar antes de la inclusión de los pacientes, sus características no se distribuyeron uniformemente en los brazos del ensayo.

**Tabla 4 : Características de los pacientes por período de tiempo y grupo – Ensayo QUARITE**
	Año 1		Año 4
	Intervención (n=43269)	Control (n=41655)	Intervención (n=52662)	Control (n=53581)
Vive lejos del hospital (fuera de la región)	2 242 (5,2)	509 (1,2)	1 115 (2,1)	854 (1,6)
Evacuado de otra institución	11 644 (26,9)	9 384 (22,5)	15 382 (29,2)	13 097 (24,4)
Edad ≥ 35 años	4 356 (10,1)	4 195 (10,1)	5 325 (10,1)	5 210 (9,7)
Nulíparos	28 435 (65,7)	26 939 (64,7)	35 908 (68,2)	36 397 (67,9)
Antecedentes de cesárea	3 112 (7,2)	2 782 (6,7)	5 196 (9,9)	4 920 (9,2)
Patología antes del embarazo	406 (0,9)	324 (0,8)	516 (1,0)	648 (1,2)
No hay visitas prenatales	4 221 (9,8)	4 535 (10,9)	4 780 (9,1)	5 250 (9,8)
Patología durante el embarazo	3 976 (9,2)	3 401 (8,2)	3 897 (7,4)	4 834 (9,0)
Embarazo múltiple	1768 (4,1)	1555 (3,7)	2 139 (4,1)	2 135 (4,0)

En nuestro caso, la proporción de mujeres que residían lejos del hospital donde dieron a luz era mayor en el brazo experimental que en el grupo de control y, como resultado, las evacuaciones médicas eran más frecuentes entre los hospitales que recibían la intervención (tabla 4). Habida cuenta de los malos resultados de los sistemas de atención de la salud tanto en Malí como en Senegal y de las demoras en la atención médica, el estado de salud de las mujeres del brazo experimental fue en general más deficiente y su riesgo de mortalidad más elevado. El desequilibrio entre los grupos parece disminuir en el año 4, lo que plantea la cuestión del sesgo al que puede conducir en el análisis de la efectividad de la intervención según el enfoque DD: ¿la mayor reducción de la mortalidad materna en el brazo experimental no se explica simplemente por el cambio en el perfil de los pacientes de este grupo?

Para responder a esta pregunta pueden utilizarse varios métodos estadísticos, teniendo en cuenta los factores de confusión del estudio de impacto. Los modelos de regresión logística son particularmente adecuados para este tipo de análisis, ya que permiten ajustar la medida del efecto (DD u odds ratio) a las características individuales o de grupo, como el lugar de residencia o la forma en que los pacientes son admitidos en el hospital. Veremos en el siguiente párrafo que los modelos de regresión logística generalizada permiten tener en cuenta al mismo tiempo el efecto de conglomerado.

Consideración del efecto de grupo

Dado que las pacientes que dan a luz en un mismo hospital no son completamente independientes entre sí, la información comunicada por un hospital de 1.000 mujeres, por ejemplo, es por lo tanto menor que si tuvieran 1.000 pacientes independientes que dieran a luz en centros diferentes. Esto da lugar a una pérdida de poder en el análisis estadístico que debe compensarse con un aumento del número de sujetos a incluir. Además, en el análisis de los datos de conjunto, se deben utilizar métodos estadísticos apropiados, pues de lo contrario los resultados pueden ser indebidamente significativos. Si no se tiene en cuenta este efecto de agrupación, se disminuirán falsamente los intervalos de confianza, porque las pruebas estadísticas no tendrán en cuenta las variaciones inter e intrahospitalarias de la mortalidad materna. Hay varios métodos que pueden utilizarse para analizar adecuadamente este tipo de datos, incluido el uso de modelos mixtos o marginales. El comando diff del programa STATA (versión 13.0), por ejemplo, permite estimar el DD teniendo en cuenta la estructura jerárquica de los datos, organizados en varios niveles anidados (nivel 1: pacientes; nivel 2: hospital) y posibles variables de confusión. El comando xtlogit del mismo programa informático permite estimar la relación de probabilidades utilizando el mismo enfoque multivariante y multinivel.

**Tabla 5 : Estimaciones crudas y ajustadas de los efectos de la intervención – ensayo QUARITE**
Método de medición	Estimación bruta (95% CI)	*Estimación ajustada (95% CI)**
Diferencia en los riesgos	-2,5 (- 3,5; – 1,5)	-2,5 (- 4,2; – 0,9)
Ratios de probabilidad	0,73 (0,61; 0,91)	0,85 (0,73; 0,98)
* efecto ajustado sobre el efecto de grupo y sobre las características del paciente y del hospital

Después de ajustar las variables de confusión y el efecto de conglomerado, la relación OR disminuyó de 0,73 (estimación bruta) a 0,85 (estimación ajustada), como se muestra en la tabla 5. En otras palabras, el desequilibrio de algunas características individuales, como el nivel de accesibilidad a los hospitales, explica en parte la mayor disminución de la mortalidad materna en el brazo experimental en comparación con el brazo de control, pero no del todo. Así pues, puede atribuirse a la intervención una disminución relativa del 15% de la mortalidad materna. Además, después de ajustar el efecto de conglomerado, los intervalos de confianza son mayores que en las estimaciones brutas, independientemente del método de medición utilizado (diferencia de riesgo o coeficiente de probabilidades). Así pues, se ha perdido cierta precisión en las medidas del impacto, pero las diferencias siguen siendo significativas dados los grandes tamaños de las muestras.

Análisis reflexivo y conclusión

En este capítulo hemos visto el valor de realizar un ECA por conglomerados para evaluar el impacto de las intervenciones de salud materna y cómo controlar los tres principales sesgos en la medición de la eficacia: el efecto temporal, el efecto de grupo y el efecto de conglomerado. Hay otras características de los ensayos de grupos que abordaremos en el debate, pero no entraremos en detalles. Estas incluyen las siguientes preguntas: ¿Está el análisis cegado? ¿Se requiere el consentimiento del sujeto? ¿Se pueden generalizar los resultados a otros contextos?

Cuando la intervención que queremos probar toma la forma de un programa de actividades dirigidas a grupos de individuos (como el programa de mejora de la calidad en el ensayo QUARITE que se dirigió a los profesionales de la salud), entonces la inclusión de los sujetos se hace inevitablemente con el conocimiento del brazo en el que serán incluidos. Se dice que el ensayo es “abierto”, a diferencia de la mayoría de los ensayos individuales que son “ciegos”, es decir, sin conocimiento del brazo en el que se asignan los sujetos al azar. Esta situación es potencialmente una fuente de sesgo que puede ser inducida por un comportamiento posiblemente diferente entre los grupos.

La cuestión de la obtención del consentimiento para participar en el estudio también es importante. Si bien el consentimiento del jefe del grupo es esencial, no se requiere necesariamente el consentimiento de los sujetos. Es posible informar a las personas que pueden participar en el estudio sin obtener su consentimiento firmado. En el ensayo de QUARITE, por ejemplo, se obtuvo el consentimiento del director del hospital y del jefe de la sala de maternidad. Sin embargo, no lo hicimos en el caso de las mujeres que dieron a luz en cada uno de los hospitales participantes en el estudio, ya que no intervenimos directamente con ellas y los datos anonimizados recogidos se tomaron de los registros de los hospitales existentes, sin entrevistar a las mujeres.

Otra característica singular del ensayo por conglomerados es que el contexto en el que se aplica la intervención puede variar considerablemente de un conglomerado a otro. Si se conocen de antemano las características de las agrupaciones que afectan al resultado primario, se recomienda estratificar la aleatoriedad con arreglo a esos criterios. En el ensayo QUARITE, asignamos al azar los hospitales según el nivel de atención porque los datos preliminares disponibles indicaban que las tasas de mortalidad diferían entre los hospitales de distrito, regionales y de la capital. El análisis de los resultados por nivel de atención demostró que la intervención fue particularmente efectiva en los hospitales de distrito y poco en los hospitales regionales. Por consiguiente, llegamos a la conclusión de que los beneficios de la intervención deberían aplicarse únicamente a los hospitales de primera línea y que se necesitarían más investigaciones para confirmar si ese programa sería útil o no en los hospitales de nivel superior.

Aunque su aplicación es compleja, los ensayos controlados aleatorios son los estudios de impacto en la salud materna y perinatal que proporcionan el nivel más alto de pruebas si se realizan adecuadamente. Por razones logísticas, organizativas y, a veces, éticas, suele ser más apropiado aleatorizar unidades o grupos “sociales” en lugar de individuos. Los ensayos de agrupación implican desafíos metodológicos que no son insuperables, siempre que se tengan en cuenta en el diseño y el análisis del estudio. También hay que tener en cuenta que, en este tipo de estudio, la unidad de aleatorización es diferente de la unidad de análisis, es decir, la unidad que se tendrá en cuenta para la interpretación de los resultados o el análisis de los impactos. Pero el nivel de pruebas de la efectividad de una intervención no es el único criterio para los responsables de la toma de decisiones. El contexto y las condiciones de aplicación son también elementos esenciales para diseñar políticas públicas más eficaces. Las investigaciones futuras también deberían ayudar a comprender cómo y por qué esta intervención produce efectos positivos en la salud de las madres y los recién nacidos. Los ensayos híbridos que combinan tanto los ensayos de control de agrupaciones como el análisis de la aplicación son los más adecuados para abordar simultáneamente las cuestiones de eficacia y aplicación.

Referencias clave

Campbell, M. K., Mollison, J., Steen, N., Grimshaw, J. M. et Eccles, M. (2000) Analysis of cluster randomized trials in primary care: a practical approach. Family Practice, 17(2), 192–196.

Un artículo que presenta muy claramente el método de los ensayos aleatorios en conglomerados.

Dumont, A., Fournier, P., Abrahamowicz, M., Traoré, M., Haddad, S. et Fraser, W. (2013). Quality of care, risk management, and technology in obstetrics : a cluster-randomized trial of a multifaceted intervention to reduce hospital-based maternal mortality in Senegal and Mali (QUARITE). Lancet, 382(9887), 146 – 157.

Para ilustrar este capítulo se utilizaron los resultados de este estudio realizado en Senegal y Malí.

Chaillet, N., Dumont, A., Abrahamowicz, M., Pasquier, J. C., Audibert, F., Monnier, P., … et Fraser, W. D. (2015). A cluster-randomized trial to reduce cesarean delivery rates in Quebec. New England Journal of Medicine, 372(18), 1710-1721.

Los resultados de este estudio canadiense ilustran los retos metodológicos asociados a los ensayos con conglomerados.

Referencias

Dumont, A., Fournier, P., Abrahamowicz, M., Traoré, M., Haddad, S. et Fraser W. (2013). Quality of care, risk management, and technology in obstetrics : a cluster-randomized trial of a multifaceted intervention to reduce hospital-based maternal mortality in Senegal and Mali (QUARITE). Lancet, 382(9887), 146–157

Stanton, C. K., Newton, S., Mullany, L. C., Cofie, P., Agyemang C. T., Adiibokah, E., … et Gyapong, J. (2013). Effect on postpartum hemorrhage of prophylactic oxytocin (10 IU) by injection by community health officers in Ghana: A community-based, cluster-randomized trial. PLoS Medicine, 10(10), e1001524.
doi: 10.1371/journal.pmed.1001524

Villar, J., Ba’aqeel, H., Piaggio, G., Lumbiganon, P., Belizán, J. M, Farnot, U., … et Garcia, J. (2001). WHO antenatal care trial research group. Lancet, 357(9268), 1551-64.

Resumen / Résumé / Abstract

Los ensayos controlados aleatorios grupales permiten evaluar el impacto de las intervenciones de salud con un nivel muy alto de pruebas. Aunque los ensayos aleatorios grupales ofrecen varias ventajas en los países de bajos recursos con respecto a los ensayos individuales, presentan algunos desafíos metodológicos debido al hecho de que la unidad de análisis es diferente de la unidad de aleatorización o de intervención. Estos desafíos, tanto en la implementación de la intervención como en el análisis estadístico, se presentan sobre la base de un experimento realizado en Malí y Senegal (ensayo QUARITE) para reducir la mortalidad materna y neonatal en los hospitales. Veremos cómo el enfoque de “diferencia de diferencias” permite medir el efecto de la intervención teniendo en cuenta el efecto del tiempo, que a menudo tiene un impacto positivo en los indicadores de salud fuera de cualquier intervención externa. Se presentan modelos estadísticos apropiados para ajustar el efecto de la intervención sobre las diferencias entre los grupos experimentales antes del inicio del programa de prueba y sobre el efecto del grupo específico de los ensayos de grupos.

***

Les essais contrôlés randomisés en grappe permettent d’évaluer l’impact des interventions en santé avec un niveau de preuve très élevé. Si les essais randomisés en grappes offrent plusieurs avantages dans les pays à faibles ressources par rapport aux essais individuels, ils présentent quelques défis méthodologiques qui tiennent au fait que l’unité d’analyse est différente de l’unité de randomisation ou d’intervention. Ces défis tant sur le plan de la mise en œuvre de l’intervention que de l’analyse statistique sont présentés à partir d’une expérience réalisée au Mali et au Sénégal (essai QUARITE) pour réduire la mortalité maternelle et néonatale hospitalière. Nous verrons comment l’approche « différence des différences » permet de mesurer l’effet l’intervention tout en tenant compte de l’effet du temps qui joue souvent favorablement sur les indicateurs de santé en dehors de toute intervention extérieure. Les modèles statistiques appropriés sont présentés pour pouvoir ajuster l’effet de l’intervention sur les différences qui existent entre les groupes expérimentaux avant le démarrage du programme à tester et sur l’effet de groupe propre aux essais en grappe.

***

Cluster-randomised trials are used to assess the impact of health interventions with a very high level of evidenceexpected. While cluster randomized trials offer several advantages in low-resource countries compared to individual trials, they present some methodological issues because the unit of analysis is different from the unit of randomization and intervention. These challenges, both in terms of the intervention implementation and the statistical analysis, are presented based on a trial conducted in Mali and Senegal (QUARITE trial) to reduce maternal and neonatal mortality in hospitals. We will see how the difference-in-differences approach measures the effect of the intervention taking into account the secular trends, which often plays favorably on health indicators outside of any external intervention. The appropriate statistical models are presented in order to adjust the effect of the intervention on baseline case-mix and on the cluster effect which is specific to this type of trial.

***

Alexandre Dumont es ginecólogo-obstetra y epidemiólogo. Ha llevado a cabo ensayos controlados por conglomerados en materia de salud materna y perinatal en el Canadá, Senegal, Malí y Burkina Faso. Se le concedió el Premio de Cumpleaños de la Comisión Europea por el ensayo QUARITE que redujo la mortalidad materna y neonatal en los hospitales de referencia de Malí y Senegal.

Cita

Alexandre Dumont (2020). Ensayos aleatorizados por conglomerados. Ejemplo dirigido a la salud materna e infantil. En Evaluación de las intervenciones sanitarias en salud global. Métodos avanzados. Bajo la dirección de Valéry Ridde y Christian Dagenais, pp. 277-296. Québec: Éditions science et bien commun y Marseille: IRD Éditions.

Licencia

Icono de Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional

Evaluación de las intervenciones sanitarias en salud global Copyright © 2020 por Valéry Ridde y Christian Dagenais se distribuye bajo una Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional, excepto cuando se especifiquen otros términos.