Metaanalisis

47
METAANÁLISIS Notas Índice 1. INTRODUCCIÓN ............................................................................................................. 2 2. TIPOS DE REVISIONES BIBLIOGRÁFICAS CUANTITATIVAS ..................................... 3 2.1. Conteo de votos (vote-counting) ................................................................................................................ 3 2.2. Métodos de probabilidad combinada ......................................................................................................... 3 2.3. Método del mínimo valor de p .................................................................................................................... 4 2.4. Test de probabilidad combinada (2) ........................................................................................................... 4 2.5. Transformación z (3) ................................................................................................................................... 4 2.6. Transformación z ponderada (4) ................................................................................................................ 4 2.7. Metaanálisis moderno (5) ........................................................................................................................... 5 2.8. Claroscuros (6) ........................................................................................................................................... 5 3. ¿QUÉ ES EL METAANÁLISIS?....................................................................................... 5 3.1. Objetivos ..................................................................................................................................................... 6 3.2. Justificación ................................................................................................................................................ 6 4. ETAPAS DE UN METAANÁLISIS ................................................................................... 7 5. LIMITACIONES DE LA TÉCNICA METAANALÍTICA .................................................... 16 5.1. Limitaciones metodológicas del metaanálisis .......................................................................................... 17 5.2. Sesgo de publicación ............................................................................................................................... 17 6. METAANÁLISIS CUALITATIVO .................................................................................... 18 7. METAANÁLISIS CUANTITATIVO ................................................................................. 18 7.1. Modelos de riesgo .................................................................................................................................... 18 8. MÉTODOS ESTADÍSTICOS PARA COMBINAR ESTUDIOS ....................................... 18 8.1. Modelo de efectos fijos ............................................................................................................................. 19 8.2. Modelo de efectos aleatorios.................................................................................................................... 20 8.3. Heterogeneidad ........................................................................................................................................ 21 8.4. Meta-regresión.......................................................................................................................................... 22 8.5. Análisis de subgrupos y de sensibilidad................................................................................................... 22 8.6. Presentación de resultados ...................................................................................................................... 23 8.7. Método de Mantel-Haenszel-Peto para obtener un estimador combinado del efecto de un grupo de ensayos clínicos incluidos en un metaanálisis ................................................................................................ 24 8.8. Odds ratio ajustada de Mantel-Haenszel ................................................................................................. 25 9. CÁLCULO DEL TAMAÑO DEL EFECTO ...................................................................... 27 9.1. Definición .................................................................................................................................................. 27 9.2. Fuente de datos ........................................................................................................................................ 27 9.3. Tamaños de efecto basados medias y desviaciones típicas ................................................................... 27 9.4. d de Hegde (45) ........................................................................................................................................ 27 9.5. d de Cohen (46) ........................................................................................................................................ 28 9.6. Response ratio, R (47) ............................................................................................................................. 28 9.7. Tablas de contingencia 2 x 2 .................................................................................................................... 28 9.8. Risk difference, RD (48) ........................................................................................................................... 29 9.9. Odds ratio OR (49) ................................................................................................................................... 29 9.10. Correlaciones.......................................................................................................................................... 29 9.11. Transformación z de Fisher (2) .............................................................................................................. 29 9.12. Recomendaciones para presentación de datos ..................................................................................... 30 10. COMBINACIÓN DE RESULTADOS ............................................................................ 30 10.1. Tamaño del efecto acumulado ............................................................................................................... 30 10.2. Significación del efecto acumulado ........................................................................................................ 31 10.3. Heterogeneidad total (50) ....................................................................................................................... 31 10.4. Fuentes de heterogeneidad.................................................................................................................... 31 10.5. Predictores categóricos .......................................................................................................................... 31

Transcript of Metaanalisis

Page 1: Metaanalisis

METAANÁLISIS

Notas

Índice1. INTRODUCCIÓN.............................................................................................................22. TIPOS DE REVISIONES BIBLIOGRÁFICAS CUANTITATIVAS .....................................32.1. Conteo de votos (vote-counting) ................................................................................................................ 32.2. Métodos de probabilidad combinada ......................................................................................................... 32.3. Método del mínimo valor de p .................................................................................................................... 42.4. Test de probabilidad combinada (2) ........................................................................................................... 42.5. Transformación z (3)................................................................................................................................... 42.6. Transformación z ponderada (4) ................................................................................................................ 42.7. Metaanálisis moderno (5) ........................................................................................................................... 52.8. Claroscuros (6) ........................................................................................................................................... 53. ¿QUÉ ES EL METAANÁLISIS?.......................................................................................53.1. Objetivos..................................................................................................................................................... 63.2. Justificación ................................................................................................................................................ 64. ETAPAS DE UN METAANÁLISIS ...................................................................................75. LIMITACIONES DE LA TÉCNICA METAANALÍTICA ....................................................165.1. Limitaciones metodológicas del metaanálisis .......................................................................................... 175.2. Sesgo de publicación ............................................................................................................................... 176. METAANÁLISIS CUALITATIVO ....................................................................................187. METAANÁLISIS CUANTITATIVO .................................................................................187.1. Modelos de riesgo .................................................................................................................................... 188. MÉTODOS ESTADÍSTICOS PARA COMBINAR ESTUDIOS .......................................188.1. Modelo de efectos fijos............................................................................................................................. 198.2. Modelo de efectos aleatorios.................................................................................................................... 208.3. Heterogeneidad ........................................................................................................................................ 218.4. Meta-regresión.......................................................................................................................................... 228.5. Análisis de subgrupos y de sensibilidad................................................................................................... 228.6. Presentación de resultados ...................................................................................................................... 238.7. Método de Mantel-Haenszel-Peto para obtener un estimador combinado del efecto de un grupo deensayos clínicos incluidos en un metaanálisis ................................................................................................ 248.8. Odds ratio ajustada de Mantel-Haenszel ................................................................................................. 259. CÁLCULO DEL TAMAÑO DEL EFECTO ......................................................................279.1. Definición .................................................................................................................................................. 279.2. Fuente de datos........................................................................................................................................ 279.3. Tamaños de efecto basados medias y desviaciones típicas ................................................................... 279.4. d de Hegde (45)........................................................................................................................................ 279.5. d de Cohen (46)........................................................................................................................................ 289.6. Response ratio, R (47) ............................................................................................................................. 289.7. Tablas de contingencia 2 x 2.................................................................................................................... 289.8. Risk difference, RD (48) ........................................................................................................................... 299.9. Odds ratio OR (49) ................................................................................................................................... 299.10. Correlaciones.......................................................................................................................................... 299.11. Transformación z de Fisher (2) .............................................................................................................. 299.12. Recomendaciones para presentación de datos ..................................................................................... 3010. COMBINACIÓN DE RESULTADOS............................................................................3010.1. Tamaño del efecto acumulado ............................................................................................................... 3010.2. Significación del efecto acumulado ........................................................................................................ 3110.3. Heterogeneidad total (50)....................................................................................................................... 3110.4. Fuentes de heterogeneidad.................................................................................................................... 3110.5. Predictores categóricos .......................................................................................................................... 31

Page 2: Metaanalisis

2

10.6. Heterogeneidad dentro y entre grupo (50) ............................................................................................. 3210.7. Predictores continuos (51)...................................................................................................................... 3310.8. Efectos fijos y aleatorios (52) ................................................................................................................. 3410.9. Modelo lineal general ............................................................................................................................. 3511. EVALUACIÓN DEL SESGO DE PUBLICACIÓN.........................................................3611.1. Métodos gráficos .................................................................................................................................... 3611.2. Métodos estadísticos.............................................................................................................................. 3712. CUALIFICACIÓN DE EVIDENCIA Y GRADO DE RECOMENDACIÓN ......................3813. METAANÁLISIS DE PACIENTES INDIVIDUALES......................................................3914. METAANÁLISIS BAYESIANO .....................................................................................3915. COMENTARIOS SOBRE EL METAANÁLISIS ............................................................3916. VALIDEZ DEL METAANÁLISIS: COMPARACIÓN CON EL ENSAYO CLÍNICO ........4017. CONCLUSIONES ........................................................................................................4018. GLOSARIO ..................................................................................................................4119. BIBLIOGRAFÍA............................................................................................................4320. BIBLIOGRAFÍA ADICIONAL........................................................................................45

1. Introducción

A mediados del siglo XIX Bichat y Magendi preconizaban un cambio sustancial en la manera de establecerlas bases clínicas del diagnóstico precoz, el pronóstico y el tratamiento de las enfermedades que podemosconsiderar como la base de lo que hoy conocemos como medicina basada en la evidencia (MBE) que surgióformalmente hace 20 años en el seno de la gestión sanitaria como método para facilitar la toma dedecisiones y consecuentemente racionalizar la práctica clínica.El rápido avance de las técnicas diagnósticas y terapéuticas producido en los últimos años dificultaalcanzar una experiencia personal válida y segura como "patrón" en la toma de decisiones clínicas. De ahíla necesidad de disponer de métodos que faciliten la puesta en práctica con cotidianidad de la MBE. Unmétodo básico es el metaanálisis que, a través de métodos estadísticos, sintetizando los resultados deestudios independientes puede proporcionar estimaciones de los efectos de la atención sanitaria másprecisas y conclusiones más contundentes que las derivadas de los estudios individuales incluidos en unarevisión tradicional de la literatura médica.El término metaanálisis fue empleado por primera vez por G.V. Glass en 1976, para referirse al análisisestadístico del conjunto de resultados obtenidos en diferentes ensayos clínicos sobre una misma cuestión,con la finalidad de evaluarlos de manera conjunta. Fue inicialmente aplicado en ciencias sociales ypsicología. A partir de la década de los ochenta se comenzó a aplicar de manera creciente en medicina, yen la actualidad son muy frecuentes los artículos que describen resultados de metaanálisis en publicacionesmédicas.En medicina el metaanálisis se aplica sobre todo en las siguientes situaciones:• para comprobar la consistencia de los ensayos en los que se ha evaluado una intervención determinada

y generar un estimador del efecto, que en principio debe tener mayor poder estadístico que el obtenidoen cada ensayo por separado;

• para comprobar la consistencia de los resultados de diferentes ensayos clínicos sobre una mismaintervención en una misma patología;

• para identificar con mayor precisión los subgrupos de pacientes con posibilidades de responder demanera diferente del promedio a una determinada intervención;

• para calcular cuántos pacientes sería necesario incluir en futuros ensayos clínicos sobre un problemadeterminado; y

• para cuantificar la incidencia de efectos no deseados, que, por ser baja, requiere un número elevado depacientes.

La idea de agregar los datos de diferentes ensayos para examinar este tipo de problemas es sugerente, yha permitido grandes avances en el conocimiento de la historia natural de numerosas patologías y de susposibles tratamientos. La Colaboración Cochrane (véase Colaboración Cochrane en el Glosario) desarrolla

Page 3: Metaanalisis

3

una labor de recopilación y análisis de ensayos clínicos tan imprescindible como ejemplar, y en su web sepuede encontrar amplia información sobre sus métodos de trabajo y una extraordinaria base de datos, enforma de metaanálisis, sobre numerosos aspectos de la terapéutica farmacológica y de otras intervencionespreventivas y educativas en salud.

añodesarrollo

autor evento

1932 Fisher Descripción del método analítico para combinar valores de la p1937 Cochan Descripción del método analítico para combinar valores de la z

equilibrados1959 Mantel y Haenszel Descripción del método analítico para obtener valores de la odds ratio1972 Peto y Peto Modificación del método de Cochran para obtener una prueba log-rank1976 Glass Uso del término metaanálisis1977 Peto y cols. Descripción del método para combinar datos de diferentes ensayos

clínicos. Uso del término pooling

utilización1974 Stjernsward Uso del método de Mantel-Haenszel para combinar distintos ensayos

clínicos1983 Tran Uso de la prueba log-rank de Cochran-Peto para combinar distintos

ensayos clínicos1985 Yusuf Uso del término overview1985 Sacks y cols. Uso de la prueba log-rank de Cochran-Peto para combinar distintos

ensayos clínicosTabla 1. Cronología del desarrollo del concepto y utilización de los metaanálisis en la literatura médica.

Modificado de (1).

2. Tipos de revisiones bibliográficas cuantitativas

El objetivo central de una revisión sistemática es valorar el grado de evidencia que hoy existe pararesponder a una pregunta de investigación sobre un tema (etiología, diagnóstico, tratamiento, etc.). Elmetaanálisis se centra en la estimación cuantitativa de los parámetros que se utilizan para valorar dichaevidencia.

2.1. Conteo de votos (vote-counting)1. Se observan los resultados estadísticos de un conjunto de trabajos.2. Los resultados se asignan a tres categorías: significativos en la dirección esperada, significativos en la

dirección no esperada, y no significativos.3. Se determina la proporción de resultados de cada categoría.4. La hipótesis es evaluada sobre la base de esa proporción.5. Si sólo hay dos categorías se puede emplear una prueba de signos (distribución binomial)Ventaja: simplicidadInconvenientes: conservadores;

poca potencia estadística;no ofrece información sobre la magnitud del efecto.

2.2. Métodos de probabilidad combinada1. Estos métodos combinan resultados estadísticos de un conjunto de estudios basados en valores

exactos de probabilidad.2. Por este motivo, tienen en cuenta los tamaños de muestra de los diferentes trabajos

Page 4: Metaanalisis

4

3. Hay al menos 18 métodos que usan diferentes distribuciones estadísticas (uniforme, normal, t deStudent, 2χ , logística).

2.3. Método del mínimo valor de pHay efecto significativo si al menos un estudio tiene un nivel de significación menor que el nivel crítico α :

( )1

1 1 ** 0,05

nα αα

= − −

=

2.4. Test de probabilidad combinada (2)

1. Sean n estudios con valores de significación individuales ip ;

2. Se genera un estadístico que se ajusta a una 2χ con 2n grados de libertad, usando la siguientefórmula:

( )2

1

2 logn

F ii

pχ=

= − ∑

3. 2Fχ es comprobada frente a la distribución de 2χ cuadrado para ver si hay un efecto significativo de

los datos.

Inconveniente: es muy sensible a valores de ip bajos (asimetría).

2.5. Transformación z (3)

1. Sean k estudios, cada uno con un valor iz de puntuación z para los valores individuales designificación1;

2. Se genera un estadístico que se ajusta a una normal, usando la siguiente fórmula:

1

ki

si

zz

k=

= ∑3. La significación del valor de sz es comprobada frente a una distribución normal.

2.6. Transformación z ponderada (4)

1. Es un método que generaliza el anterior para dar diferente peso iw a cada estudio dependiendo de supotencia;

2. Se genera de nuevo un estadístico que se ajusta a una normal, usando la siguiente fórmula:

1 2

1

ki

w ki

ii

zz

w=

=

= ∑∑

3. Las ponderaciones iw se calculan como el recíproco del error estándar cuadrático del tamaño delefecto;

4. Así, se tiene en cuenta los grados de libertad específicos de cada estudio.

1 La puntuación z se halla a partir de una distribución normal con media 0x = y desviación típica 1s = ycorresponde a los valores correspondientes a una probabilidad dada].

Page 5: Metaanalisis

5

Usar sz o wz es un poco cuestión de gusto, ya que los valores de la p están ya ponderados por eltamaño muestral. Si la hipótesis nula es globalmente cierta, entonces todos los valores de la pdeberían estar uniformemente distribuidos entre 0 y 1 independientemente del tamaño muestral.

2.7. Metaanálisis moderno (5)1. Combina las medidas de los efectos de estudios individuales dentro de una estima de efecto general, y

usa esta estima para determinar la significación;2. Un resultado significativo implica que hay soporte estadístico para la hipótesis que es testada;3. Esta determinación se hace calculando un tamaño de efecto general y determinando si este efecto es

mayor que el esperado por azar;4. La realización de un metaanálisis implica dos fases:

(a) Hay que calcular el tamaño del efecto y su varianza para cada estudio;(b) Hay que combinar esos efectos en un modelo sintético estadístico.

5. Opcionalmente, se puede comprobar la heterogeneidad entre estudios, para ver si provienen de más deuna población estadística.

2.8. Claroscuros (6)Ventajas: impone una disciplina útil en el proceso de sintetizar información científica;

representa una forma más sofisticada de revisar los descubrimientos científicos que losmétodos anteriores;es capaz de encontrar relaciones que permanecen oscuras;representa una forma organizada de manipular información proveniente de un grannúmero de estudios independientes.

Inconvenientes: su dificultad debido a lo complicado de la base conceptual y la metodología estadísticaempleada;la mezcla de estudios de diferente naturaleza;la mezcla de estudios de diferente calidad metodológica.

3. ¿Qué es el metaanálisis?

El metaanálisis es la síntesis formal, cualitativa y cuantitativa, de diferentes investigaciones clínicascontroladas aleatorizadas, como por ejemplo los ensayos clínicos, que poseen en común una mismaintervención y un mismo punto final de resultado y que se agrupan con la intención de sintetizar la evidenciacientífica con respecto a la dirección del efecto producido por la intervención en análisis. Expresado de otramanera, el metaanálisis es una estrategia de revisión sistemática que pretender responder a diversascuestiones y que es especialmente útil cuando los resultados de varios estudios son discordantes conrespecto a la magnitud de la dirección de un efecto, cuando los tamaños muestrales de los estudiosindividuales es demasiado pequeño para detectar dicho efecto como significativo, o cuando un ensayoclínico de gran tamaño es demasiado costoso en términos económicos o de tiempo. El metaanálisis es unprocedimiento de investigación que mejora la calidad de las revisiones bibliográficas, dado que provee loselementos para realizarlas metódicamente y arrojar resultados claramente interpretables.El metaanálisis es una aproximación más estructurada a la revisión de la literatura de lo que lo son lasrevisiones tradicionales y en esta medida pueden ser de más ayuda para establecer principios científicos.Los resultados del metaanálisis permiten planificar futuros ensayos clínicos sobre temas similares, ya queproporcionan la evidencia de los efectos que se pueden esperar de una intervención, permitiendo por ellomejores cálculos del tamaño muestral. Aportan también elementos de juicio para generar nuevas hipótesis odecidir si hacen falta nuevos ensayos clínicos sobre el tema.Los metaanálisis pueden ser utilizados en la aprobación del uso de intervenciones por parte de organismosreguladores y en la docencia, ya que posee capacidad de mostrar sintéticamente la evidencia científicadisponible.Otros términos que se han utilizado para los metaanálisis incluyen, overview, summary studies, evaluationresearch y quantitative synthesis. En general, parece que debería reducirse el uso de estos términos, dadala confusión que pueden generar.

Page 6: Metaanalisis

6

El metaanálisis es un procedimiento estadístico que integra los resultados de diversos estudiosindependientes que se consideran combinables. Un metaanálisis bien realizado permite una evaluación másobjetiva de la evidencia que la que se obtiene con una revisión narrativa tradicional, proporciona unaestimación más precisa del efecto del tratamiento y puede explicar la heterogeneidad entre los resultadosde los estudios individuales. Por otra parte, un metaanálisis mal realizado puede estar sesgado debido a laexclusión de estudios relevantes o a la inclusión de estudios inadecuados. En general, los análisis erróneospueden evitarse si se siguen una serie de principios básicos.

Metaanálisis sensu latoMétodo cuantitativo de sintetizar, resumir o revisar sistemáticamente una serie de resultados de estudiosempíricosLos estudios deben:

• Ser empíricos, no teóricos;• Producir resultados cuantitativos, en vez de cualitativos;• Examinar las mismas cuestiones teóricas;• Ser susceptibles de ser configurados en formas estadísticas comparables (por ejemplo,

correlaciones, proporciones, tamaños de efectos, etc.Los metaanálisis podrían intentar resolver cuestiones analizadas mediante estudios observacionales,aunque más clásicamente se utilizan para la valoración de estudios experimentales.

3.1. ObjetivosCualquier problema clínico es susceptible de ser analizado mediante el metaanálisis. Los objetivos, encualquier caso, deben estar planteados con mucha claridad. Es obligatorio establecer en la fase del diseñoun protocolo de trabajo que formalice el desarrollo del estudio. En la tabla 2 se detallan los objetivosgenerales y específicos del metaanálisis.

1. Comprobar la hipótesis relacionada con el efecto (en particular, su dirección) de la intervenciónbajo análisis;

2. Aumentar la precisión de los estimadores del efecto (en particular, su magnitud) de laintervención bajo análisis, intervalos de confianza más reducidos;

3. Evaluar la consistencia entre los ensayos clínicos de similares intervenciones inherentes al temay generar un estimador del efecto más eficiente;

4. Evaluar la consistencia entre ensayos clínicos de diferentes intervenciones realizadas con elmismo fin y generar un estimador del efecto de esos cuidados;

5. Identificar con mayor precisión subgrupos de pacientes que tendrían mayor probabilidad de verseafectados por la intervención, ya sea en sentido favorable o desfavorable;

6. Calcular los requerimientos, en cuanto a tamaño muestral, de los futuros ensayos clínicos arealizar en el mismo campo.

Tabla 2. Objetivos generales y específicos del metaanálisis.

3.2. JustificaciónAunque es poco probable que dos ensayos clínicos tengan la misma magnitud, si es frecuente que el efectode la intervención lleve, por azar, la misma dirección. Por ello, es útil resumir en un análisis conjunto lasevidencias presentadas por estudios independientes, para reducir la probabilidad de que el azar conduzca aconclusiones erróneas. Esto ocurre porque los efectos de las intervenciones suelen ser solo moderados,con lo que la probabilidad de apreciarlos equivocadamente es grande (las intervenciones que se pruebanactualmente no tienen efectos superiores al 15–30 % de reducción de daño o aumento del beneficio). Estaspequeñas modificaciones obligan a ser muy cautos en la interpretación de los resultados, dado que conestas cifras todos los factores capaces de originar sesgos en la estimación de los efectos pueden ser causade importantes errores en las apreciaciones, ya que con efectos de escasa magnitud, éstos pueden pasarfácilmente inadvertidos o ser engañosamente magnificados.Los errores que se pueden cometer en metaanálisis son iguales que en cualquier otro tipo de estudioepidemiológico: aleatorios y sistemáticos. El sesgo del azar se produce cuando no se incluyen suficientespacientes en el estudio.

Page 7: Metaanalisis

7

Dado que se trata de estudios retrospectivos, existe la posibilidad de cometer todos los sesgos inherentes aeste tipo de diseño, ya que cuando conocemos los resultados es fácil cometer sesgos. También haygrandes posibilidades de cometer sesgo de selección, tanto por el hecho de que no hayamos hecho unarevisión exhaustiva como por la tendencia que existe a publicarse solamente aquellos resultados quecoinciden con la tendencia más vigente (son responsables tanto los autores que no envían sus resultadoscomo los editores que no los consideran para su inclusión en las revistas médicas).Cuando las publicaciones son escasas, pueden incluirse en el metaanálisis poblaciones e intervencionesmuy diferentes, siendo el estudio criticable; sin embargo, debe considerarse que lo que interesa conocer esla dirección de los efectos más que su magnitud y esta dirección se alterará poco porque se aplique laintervención a diferentes poblaciones o las condiciones sean distintas en los estudios. Lo que pretende elmetaanálisis es evaluar tendencias en el conjunto de los estudios, que por separado podrían no apreciarse.

4. Etapas de un metaanálisis

Los metaanálisis deben considerarse como verdaderos proyectos de investigación en los que las unidadesde observación son los estudios originales y que requieren una adecuada planificación, una considerablededicación de recursos (especialmente humanos) y la elaboración de un protocolo en el que se detalle cadauna de las etapas del proceso que se describen a continuación (véase figura 1).(a) Establecimiento del problema y la hipótesis que se desea valorar. La formulación del problema es

crucial en estudios clínicos y observacionales, definiendo de forma clara y precisa tanto la respuestacomo los posibles factores de confusión. Las mejores preguntas son aquellas que se refieren a algúntema para el cual existe incertidumbre colectiva, y cuya respuesta puede cambiar conductas futuras.Para formular correctamente una pregunta destinada a una revisión sistemática deben incluirse en lamisma cuatro componentes: el tipo de sujeto o situación sanitaria o administrativa a estudiar, el tipo deestudio (terapéutico, diagnóstico, de riesgo, de pronóstico o preventivo), el tipo de control utilizado parala comparación y el resultado o efecto a considerar.El investigador debe extraer de los trabajos datos consistentes y elegir las técnicas estadísticas másadecuadas para su análisis. De este modo, el protocolo de un metaanálisis debe incluir una brevereseña de los antecedentes del problema que se pretende abordar con la investigación, plantearclaramente el problema científico, que a menudo se expresa en forma de preguntas e hipótesis,formular los objetivos y delimitar todas aquellas especificaciones sobre la recogida de la información yde datos, así como su análisis. Una correcta definición y delimitación de cada uno de estos aspectosfacilitará enormemente las siguientes etapas del proceso.

Figura 1. Esquema general de las etapas de un metaanálisis.

Page 8: Metaanalisis

8

(b) Cuantificación de los efectos. Antes de realizar el metaanálisis, el investigador ha de establecer lasmedidas que se van a utilizar para describir y representar los efectos, y así poderlos agregar.Obviamente, estas medidas van a depender tanto del tipo de respuesta (binaria o continua) como deldiseño del estudio (experimental u observacional) utilizados en los estudios primarios.Respuesta binaria. Este tipo de respuesta solamente presenta dos categorías de resultado (muerte osupervivencia, enfermos o sanos, etc.). En estudios con este tipo de respuesta, las medidas de efectomás comúnmente utilizadas son la tasa de riesgos (o riesgo relativo), la razón de ventajas (odds ratio), ola diferencia de riesgos.Respuesta continua. En la literatura médica existen multitud de estudios en los cuales la variablerespuesta está medida en escala continua (tensión sistólica, nivel de colesterol, etc.). Si las respuestasde todos los estudios están medidas en la misma escala, entonces la medida del efecto (o tamaño delefecto, effect size) será simplemente la diferencia entre las medias de los grupos. Si no fuese así, esdecir, si los estudios miden la respuesta en diferente escala, habrá que considerar en su lugar unadiferencia estandarizada de medias.

(c) Búsqueda de la información. En general, de cada uno de los estudios que pueden intervenir en elmetaanálisis, interesa extraer información referente a los siguientes aspectos:

• Las características de los estudios: tales como tipo de diseño, características de la muestra deestudio (edad, género, factores pronósticos, etc.), tipo de intervención (principio activo, pauta,dosis, etc.), medidas del resultado consideradas, tiempo de seguimiento y otras característicasque permitan valorar el grado de homogeneidad o heterogeneidad de los estudios que han decombinarse.

• La calidad metodológica de los estudios: existen distintos instrumentos que permiten valorarcualitativamente o cuantitativamente la posible existencia de sesgos y, por lo tanto, la llamadavalidez interna de los estudios originales.

• Los resultados de los estudios: medidas del efecto observadas (odds ratio, riesgo relativo,diferencia de riesgos, diferencia de medias, etc.) con sus indicadores de variabilidad (intervalosde confianza) y nivel de significación estadística.

(d) Localización de los estudios de investigación. La validez de un metaanálisis depende, en buena medida,de lo exhaustivo con que se identifique y localice los trabajos originales.Fuentes de información. Para la realización de búsquedas bibliográficas puede partirse de fuentesinformales, fuentes primarias y fuentes secundarias.

• Las fuentes informales están constituidas por archivos personales, libros, artículos de revisión,contactos con expertos, trabajos en congresos, etc.;

• Las fuentes primarias son las revistas conocidas relacionadas con el tema y la realización derevisiones ascendentes (a partir de las citas bibliográficas de los artículos que ya se tienen y,así, sucesivamente);

• Las fuentes secundarias las constituyen las bases de datos automatizadas, que sonfundamentales para la realización de cualquier búsqueda bibliográfica, pero, a pesar de su granimportancia no son perfectas porque sólo incluyen revistas dejando a un lado todo lo que sedenomina "literatura gris" (tesis doctorales, comunicaciones a congresos, informes hechos paraadministraciones públicas, trabajos no publicados, etc.).

Bases de datos bibliográficas. Hay mucha literatura especializada en bases de datos bibliográficas ycómo acceder a ellas. Dickersin (7) elaboró un algoritmo para encontrar todos los artículos que sepublican de ensayos clínicos, aunque por este método se obtienen muchos falsos positivos, lo queobliga a la revisión posterior de todo lo encontrado como única manera de excluir lo que no interesa.Las bases automatizadas más importantes son MEDLINE, EMBASE, SCISEARCH o Science citationindex (base de citaciones útiles para aquellas no incluidas en MEDLINE) y las bases COCHRANE 5,surgidas a partir de la Colaboración Cochrane, formada por grupos de expertos que revisan temasconcretos y lo envían al Centro de Baltimore, que mantiene un registro internacional de ensayosclínicos.La recuperación de la bibliografía es una tarea larga y laboriosa. Requiere la recopilación de todos lostrabajos localizados, lo cual puede ser más o menos complejo ya que los artículos pueden ser lentapero eficazmente recuperados en bibliotecas nacionales, extranjeras o a través de peticiones al autor,pero la literatura gris suele ser más difícil de conseguir.

Page 9: Metaanalisis

9

(e) Criterios de inclusión/exclusión de los estudios. No todos los trabajos recuperados podrán incluirse en elmetaanálisis. Habrá que establecer, pues, los requisitos que se van a exigir a un estudio para consentirsu inclusión.Como en cualquier estudio estadístico, el diseño muestral es un determinante de la utilidad y validezcientífica de los resultados. En un metaanálisis, las unidades muestrales son los resultados de estudiospublicados o no publicados. Los criterios de inclusión y exclusión dan una definición de caso para losresultados que se van a utilizar en la síntesis.En este paso de realización de un metaanálisis es donde puede incurrirse en el segundo de los sesgosimportantes, el sesgo de selección. Para disminuir el riesgo de cometerlo se ha de procurar que larevisión de los estudios la realicen varios evaluadores de forma ciega o enmascarada (sin conocer larevista, año de publicación, los autores, las instituciones, etc.) elaborando una lista de criterios deinclusión e exclusión, que serán siempre analizables objetivamente, y de carácter metodológico y no deresultados, de modo que su fiabilidad y precisión sean máximas.

(f) Evaluación de la calidad de los estudios incluidos. Es importante porque la validez de los resultados delmetaanálisis es consecuencia de la calidad de los trabajos originales incluidos.Hay muchas escalas para medir la calidad de estudios, que van asignando distintas puntuaciones acada uno de ellos. Este proceso puede complicarse todo cuanto se quiera pero ay algunos aspectosbásicos que hay que controlar a partir de la información metodológica obtenida: el diseño del estudio, laposibilidad de combinar los distintos trabajos, el control de sesgos (mediante determinación del tamañomuestral mínimo, la duración de seguimiento más breve admitida, que la asignación sea realmentealeatoria o que se efectúe realmente doble ciego cuando sea necesario, etc.), y que el análisisestadístico de cada estudio se haya realizado correctamente.Existen distintos instrumentos que permiten, a través de asignación de puntuaciones, valorar cualitativay cuantitativamente la validez interna de los distintos estudios originales. La utilización más usual de laspuntuaciones de calidad es la de asignar un mayor peso a unos estudios que a otros a la hora decombinarlos. Otro uso interesante de estas medidas sería el de realizar agrupaciones de estudios segúnsu calidad, y así determinar si el grado de ésta se relaciona con las estimaciones de los efectos. Estautilización es, sin embargo, un tema controvertido, pudiéndose encontrar ejemplos en la literatura en loscuales no se contempla dicha relación. De todas formas, algún aspecto particular de calidad (como porejemplo, la adherencia al esquema de aleatorización en ensayos clínicos controlados), sí se hamostrado asociado al tamaño del efecto.

(g) Análisis de la heterogeneidad. Existen varios métodos estadísticos y gráficos para evaluar el grado deheterogeneidad que permiten valorar hasta qué punto los resultados que provienen de diferentesestudios pueden ser resumidos en una única medida.En general, todas las pruebas estadísticas diseñadas para comprobar la existencia de heterogeneidadse basan en la hipótesis de que la variabilidad entre estudios es nula. Una de las pruebas másconvenientes para valorarla es la prueba Q propuesta por DerSimonian y Laird (8), preferida porcuestiones de validez y sencillez informática. A pesar de sus ventajas, esta prueba estadística presentabaja potencia, debido principalmente a que el número de estudios primarios que se suelen considerar(por ejemplo, el tamaño muestral efectivo) es en general pequeño (no sobrepasa en general el valor de30 estudios). De ello se deduce que la falta de heterogeneidad estadística no se puede considerar comoevidencia de homogeneidad, ya que pudieran no detectarse diferencias estadísticamente significativasincluso en metaanálisis con niveles moderados de heterogeneidad.Debido a la poca potencia de las pruebas estadísticas existentes, éstas pueden complementarse conalguna representación gráfica que permita la inspección visual de la magnitud de la variabilidad entreestudios. Las representaciones más utilizadas son el gráfico de Galbraith (9), recomendado por seraplicable a cualquier tipo de estudio (observacional y experimental) y el gráfico de L’Abbé (10), másrestrictivo, aplicable únicamente a metaanálisis de ensayos clínicos.El gráfico de Galbraith representa la precisión de cada estudio (el inverso del error estándar) frente alefecto estandarizado; asimismo, representa la línea de regresión ajustada a estos puntos y una bandade confianza. Los estudios que caen fuera de esta banda son los que más contribuyen a laheterogeneidad. Por otra parte, la posición de los estudios en el eje de abscisas permite identificarvisualmente aquellos que tienen un mayor peso en el metaanálisis. Este gráfico también se puedeutilizar para detectar fuentes de heterogeneidad al etiquetar los estudios por diferentes variables, talescomo el año de publicación.El gráfico de L’Abbé representa la tasa de eventos del grupo tratamiento frente a la tasa del grupocontrol, por tanto, este gráfico sólo se presenta cuando la variable respuesta es binaria.

Page 10: Metaanalisis

10

Para poder explicar la heterogeneidad se necesita experiencia en clínica y epidemiología así comoexperiencia en investigación. En caso de que exista heterogeneidad entre los estudios (estadística y/oclínica), se pueden adoptar varias actitudes. Metodológicamente, la menos arriesgada sería no procedera un resumen de los estudios primarios. Otra actitud consistiría en presentar una medida resumen, apesar de la heterogeneidad. Si se toma esta decisión, es necesario advertir claramente sus limitacionesanalíticas y de interpretación, y acompañar dicha medida con una estimación de la variabilidad entreestudios, el coeficiente de variación entre estudios, o un coeficiente de correlación intraclase. Epidat 3.1presenta las siguientes medidas de variabilidad: varianza entre estudios, varianza intra-estudios,coeficiente de variación entre estudios (varianza entre estudios dividida por la medida de efecto global oponderada), y coeficiente RI que representa la proporción de varianza total debida a la varianza entreestudios y, por tanto, toma valores entre 0 y 1.Por último, en caso de que se sospeche que existen motivos que puedan explicar la heterogeneidad delos resultados entre los estudios, la opción más recomendable es realizar un análisis de subgrupos quesólo combine los estudios que cumplen determinada condición o característica, de modo que éstos seanmás homogéneos.Ejemplo. Para ilustrar la interpretación de los gráficos de Galbraith y L’Abbé se va a considerar comoejemplo una revisión sistemática de ensayos clínicos aleatorizados (ECA) sobre los efectos del consejomédico para abandonar el tabaquismo (11) (Tabla 3)

grupo de intervención grupo control

estudio ref. año depublicación

dejaronde fumar

no dejaronde fumar

dejaronde fumar

no dejaronde fumar

1 Porter (12) 1972 5 96 4 862 Rusell (13) 1979 34 997 8 10993 Wilson (14) 1982 21 85 11 944 Stewart (15) 1982 11 493 4 1835 Rusell (16) 1983 43 718 35 6246 Jamrozik (17) 1984 77 435 58 4917 McDowell (18) 1985 12 73 11 678 Page (19) 1986 8 106 5 639 Janz (20) 1987 28 116 12 9410 Slama (21) 1990 1 103 1 10511 Wetter (22) 1990 34 203 20 21412 Demers (23) 1990 15 277 5 28713 Wilson (24) 1990 43 534 17 51514 Haug (25) 1994 20 134 7 10215 Higashi (26) 1995 53 415 35 45116 Slama (27) 1995 42 2157 5 924

Tabla 3. Metaanálisis de dieciséis ensayos clínicos aleatorizados que analizanlos efectos del consejo médico para dejar de fumar (11).

Esta revisión incluye 16 ensayos clínicos aleatorizados publicados entre 1972 y 1995, que investigan losefectos del consejo médico para dejar de fumar. En todos los estudios los pacientes fueron asignadosaleatoriamente al grupo intervención, en el que se realizó consejo médico, o al grupo control. La variablerespuesta es el abandono del tabaco, y la medida de efecto el riesgo relativo. En la figura 2 se muestranlos datos obtenidos con Epidat 3.12.

2 Epidat es un programa de libre distribución. Para más información, véase: http://dxsp.sergas.es/default.asp

Page 11: Metaanalisis

11

Figura 2.

La prueba de DerSimonian y Laird indica, con un nivel de confianza del 95 %, que no hay evidenciaestadística de heterogeneidad ( )0,1280p = . Sin embargo, el gráfico de Galbraith pone demanifiesto que los estudios no son homogéneos. Asimismo, el gráfico de L’Abbé confirma estahipótesis de heterogeneidad, con una nube de puntos que no se alinean en torno a una recta. Estosresultados contradictorios no hacen más que confirmar la poca potencia de la prueba para detectarheterogeneidad. Por esta razón, se ha recomendado reducir el nivel de confianza, al 90 % o inclusoal 80 %, a fin de aumentar la potencia.La inspección visual del gráfico de Galbraith conduce a las siguientes conclusiones:• Hay evidencia de heterogeneidad entre los estudios, con una clara influencia del estudio 2-

Rusell (16), que es el que más contribuye a la heterogeneidad, por caer fuera de las bandas deconfianza del gráfico. Este estudio, el segundo en tamaño, es el que proporciona la mayorestimación del efecto. La repetición del análisis sin este estudio produce un resultado de laprueba de heterogeneidad no significativo ( )13,91; . . 14; 0,4563Q g de l p= = = .

• Se pueden identificar dos grupos de estudios diferentes entre sí pero que internamentemuestran mayor grado de homogeneidad. En el gráfico, los dos grupos quedan separados porla recta horizontal en 1y = . Un primer grupo está constituido por los estudios 1 Porter (12), 4Stewart (15), 5 Rusell (16), 7 McDowell (18), 8 Page (19) y 10 Slama (21) efecto estandarizadoen torno a cero, aunque la precisión varía de unos a otros. El estudio Rusell (16) es el máspreciso y, por tanto, el de mayor peso en el metaanálisis. En el gráfico de L’Abbé estos estudioscorresponden a los puntos que se sitúan sobre la diagonal del cuadrado, pues un efectopróximo a cero se traduce en tasas similares en los grupos tratamiento y control. Los restantesestudios constituyen un segundo grupo con efecto estandarizado variable, pero muy por encimadel estimado en los del primer grupo.

Todas estas evidencias de heterogeneidad deben tenerse en cuenta en la combinación de resultados.(h) Combinación de resultados

Existen diversas técnicas estadísticas para la combinación y presentación de resultados en unmetaanálisis. La elección del método depende fundamentalmente del tipo de medida de resultado/efectoutilizada y de la valoración del grado de heterogeneidad de los resultados de los estudios.

Page 12: Metaanalisis

12

Estimación del efecto combinado. Modelo de efectos fijos. Modelo de efectos aleatorios. Para laobtención de la medida resumen, los resultados de los estudios individuales son ponderados,generalmente por la inversa de su varianza o por el tamaño muestral, aunque también pueden aplicarseotros criterios adicionales como la calidad del estudio. Epidat 3.1 pondera los estudios por la inversa dela varianza.La heterogeneidad entre los estudios puede tenerse en cuenta en el análisis al utilizar los modelos deefectos aleatorios (random-effects model), o no ser incluida, si se utiliza un modelo de efectos fijos(fixed-effects model).El modelo de efectos fijos asume que existe un único efecto en la población y no tiene en cuenta lavariabilidad de los resultados entre los distintos estudios. Así, el tamaño del estudio y su propia varianza(variabilidad intra-estudio) son los únicos determinantes de su peso en el metaanálisis. El modelo deefectos aleatorios, por el contrario, tiene en cuenta la posible heterogeneidad al considerar que losefectos de la exposición/intervención en la población son diversos y que los estudios incluidos en larevisión son sólo una muestra aleatoria de todos los posibles efectos. Así, la ponderación de losestudios bajo este tipo de modelos considera no sólo su propia varianza (variabilidad intra-estudio), sinotambién la que pueda existir entre los estudios (variabilidad entre-estudios).Al comparar ambos modelos, en general se puede decir que:

• Los modelos de efectos aleatorios deben utilizarse siempre que se determine, tras un análisisde heterogeneidad, que los estudios no son homogéneos y no puedan identificarse claramentelas causas, lo que suele ser habitual, especialmente en estudios epidemiológicos.

• Los resultados bajo la suposición de un modelo de efectos aleatorios tienden a ser másconservadores que los obtenidos asumiendo el modelo de efectos fijos, lo que da lugar aintervalos de confianza mayores para el efecto combinado.

• Una limitación de los modelos de efectos aleatorios es que se asume que los estudios incluidosson representativos de una población hipotética de estudios, y que la heterogeneidad entre losensayos puede ser representada por una sola varianza. Otra desventaja es que conceden unpeso excesivo a los estudios con pequeño tamaño muestral.

Representación gráfica de los resultados. La representación gráfica de los resultados de unmetaanálisis contribuye a una fácil y rápida interpretación. Para ello se construye una gráfica en la queen el eje de abscisas (eje X ) se representa la medida de efecto considerada (odds ratio, riesgorelativo, etc.) y a lo largo del eje de coordenadas (eje Y ) se sitúan los diferentes estudios,generalmente ordenados por el año de publicación o cualquier otro criterio de ordenación. Para cadaestudio y para la estimación global del efecto, se representa su estimación puntual y también el intervalode confianza que le corresponde (asumiendo un modelo de efectos fijos y/o efectos aleatorios).Ejemplo. El análisis de heterogeneidad en el ejemplo anterior indica que es aconsejable utilizar elmodelo de efectos aleatorios para obtener la estimación global del efecto. El resultado permite concluirque la intervención médica es significativamente beneficiosa para que los pacientes dejen de fumar.(Resultados con Epidat 3.1.)

Page 13: Metaanalisis

13

Figura 3.

(i) Identificación del sesgo de publicación. Todo metaanálisis debería valorar la posibilidad de la existenciade un sesgo de publicación que pudiese comprometer sus resultados y conclusiones. Se han propuestovarios métodos para la exploración de la posibilidad y la cuantía del sesgo de publicación. El más simpleconsiste en realizar un análisis de sensibilidad, y calcular entonces el número de estudios negativosrealizados y no publicados que debería haber para modificar el sentido de una eventual conclusiónpositiva obtenida con un metaanálisis. Si este número es muy elevado, se considera que la probabilidadde que el sesgo de publicación haya modificado sustancialmente los resultados es baja, y se acepta laexistencia de las diferencias sugeridas por el metaanálisis.También se puede examinar la posibilidad de sesgo de publicación con el método conocido como elgráfico en embudo (funnel plot). Se parte del supuesto de que los estudios que tendrían mayorprobabilidad de no ser publicados serían los que no muestran diferencias (estudios "negativos"), sobretodo si eran de pequeño tamaño. Inversamente, si hubiera sesgo de publicación, entre los estudiospequeños (en los que hay mayor probabilidad de que se alteren los resultados por azar) se tendería apublicar los que mostraran diferencias. En principio, en una comparación entre dos opcionesterapéuticas, los diferentes ensayos clínicos realizados sobre una misma cuestión deberían producirestimadores de diferencias (en forma de razón de ventajas o de riesgo relativo) para cada ensayo quese agrupasen alrededor de un estimador central, y mostrarían tanta mayor dispersión alrededor de estevalor cuanto más pequeño fuera su tamaño, de modo que si se representara una gráfica que en el ejede ordenadas se registre el número de pacientes en cada ensayo y en el de abscisas la magnitud delriesgo relativo, la nube de puntos se distribuiría en forma de embudo invertido. Si hubiera sesgo depublicación en el sentido descrito anteriormente (de los ensayos pequeños, se tendería a haberpublicado los que hubieran mostrado diferencias favorables al tratamiento evaluado), la nube de puntosresultaría "deformada" y el embudo perdería su simetría, porque los estudios de pequeño tamañotenderían a disponerse hacia la parte derecha respecto al estimador central.Entre las limitaciones de estos gráficos se destaca el hecho de tratarse de una técnica visual, y portanto subjetiva, y de difícil interpretación en el caso de que existan pocos estudios, lo que suele ser unacircunstancia habitual. Es aconsejable, entonces, complementar siempre el estudio de sesgo conpruebas estadísticas más objetivas, como las prueba de Begg (28) o de Egger (29) que contrastan lahipótesis nula de ausencia de sesgo de publicación.Ejemplo. Considérese ahora como ejemplo un metaanálisis de estudios epidemiológicos. Se trata dediez estudios que evalúan el efecto del consumo de anticonceptivos orales como factor de riesgo frenteal cáncer invasivo de cuello uterino. Los datos se presentan en la tabla 4.

Page 14: Metaanalisis

14

intervalo de confianza (95 %)estudio ref. año de

publicación n oddsratio límite inferior límite superior

1 Brinton (30) 1986 1268 1,49 1,10 2,102 Celentano (31) 1987 306 0,69 0,25 1,893 Ebeling (32) 1987 404 1,51 0,78 2,924 OMS (33) 1993 4612 1,31 1,19 1,455 Parazzini (34) 1990 556 1,85 1,00 3,146 Beral (35) 1988 432222 1,80 1,00 3,307 Brinton (36) 1990 2072 1,21 0,90 1,608 Kjaer (37) 1993 1190 1,30 0,50 3,309 Daling (38) 1996 687 1,00 0,60 1,6010 Eluf Neto (39) 1994 415 1,65 0,80 3,37

Tabla 4. Metaanálisis de diez estudios sobre el efecto del consumo de anticonceptivos oralescomo factor de riesgo frente al cáncer invasivo de cuello uterino.

Todos son estudios de casos y controles, salvo el de Beral (35), que es de cohortes. La prueba deDersimonian y Laird indica que no hay evidencia estadística de heterogeneidad( )6,4201; . . 9; 0,6972Q g de l p= = = , lo que se puede confirmar con el gráfico de Galbraith (Figura4). Este gráfico permite identificar un estudio, el OMS, que destaca claramente por su mayor precisiónfrente a los demás y, por tanto, por su mayor peso en el metaanálisis. La estimación global de la oddsratio (odds ratio = 1,32 e intervalo de confianza al 95 %: [1,22;1,44]) indica un efecto significativo delconsumo de anticonceptivos orales como factor de riesgo en el cáncer invasivo de cérvix.

Figura 4. Gráfico de Galbraith con Epidat 3.1.

Respecto al sesgo de publicación, la prueba de Begg no arroja un resultado significativo, pero el autoraconseja precaución al interpretar esta prueba, ya que tiene muy poca potencia cuando el número deestudios es pequeño, como ocurre en este caso. El equivalente gráfico a la prueba de Begg, o funnelplot, representa la magnitud del efecto (en este caso, el logaritmo neperiano de la odds ratio) frente auna medida del tamaño como es el error estándar. Con los datos del ejemplo se obtiene una nube depuntos que se distribuyen simétricamente en torno a la estimación global del efecto, lo que es indicativode ausencia de sesgo.La prueba de Egger, más específica que la de Begg, permite detectar asimetría en el gráfico deembudo, sugestiva de la presencia de sesgo de publicación. El método consiste en ajustar una recta deregresión a los puntos con abscisa igual a la precisión, que es el inverso del error estándar (variableindependiente), y ordenada igual al efecto estandarizado (variable dependiente). La regresión sepondera por el inverso de la varianza. Si no hay sesgo de publicación, la ordenada en el origen seráigual a cero; cuanto más alejada de cero, más pronunciada es la asimetría, y mayor la evidencia desesgo. La prueba de Egger está basada en la prueba de significación para el término independiente de

Page 15: Metaanalisis

15

la recta ajustada. Con los datos del ejemplo, la prueba de Egger confirma la hipótesis de ausencia desesgo (Resultados obtenidos con Epidat 3.1):

Figura 5.

Figura 6.

(j) Análisis de sensibilidad. El análisis de sensibilidad pretende estudiar la influencia de cada uno de losestudios en la estimación global del efecto y, por lo tanto, la robustez o estabilidad de la medida finalobtenida.Este análisis consiste en la repetición del metaanálisis tantas veces como estudios seleccionados, deforma que cada vez se omite un estudio combinándose todos los restantes. Si los resultados de losdistintos metaanálisis son similares, esto es, el efecto tiene una misma dirección, magnitud ysignificación estadística, se puede concluir que los resultados son robustos. En caso contrario no setendría un estimador robusto, lo cual exigiría cierta precaución en la interpretación de los resultados opodría ser motivo para generar nuevas hipótesis. El análisis de sensibilidad también puede utilizarsepara estudiar la influencia en los resultados del metaanálisis de ciertos aspectos relacionados con lavalidez de los estudios, como por ejemplo la exclusión de: (a) estudios que no superan un determinadoumbral de calidad; (b) trabajos no publicados; o bien (c) estudios en los que hay incertidumbre sobre elcumplimiento de los criterios de selección.Ejemplo. El análisis de sensibilidad realizado con los estudios del ejemplo anterior pone de manifiesto larobustez del metaanálisis. Cuando se elimina cualquiera de los estudios incluidos no cambia la direcciónni la significación del efecto global. Sin embargo, sí conviene destacar la influencia del estudio OMS, yadetectada con el gráfico de Galbraith, que por ser mucho más preciso que los demás, al ser eliminadoproduce una pérdida de precisión en la estimación global. (Resultados del análisis de sensibilidad conEpidat 3.1):

Page 16: Metaanalisis

16

Figura 7.

(k) Publicación. Se sugiere publicar primero y presentar personalmente después, para que quede protegidala autoría intelectual del metaanálisis. Se debe intentar la publicación en revistas médicas de ampliadifusión y con comité de revisores. El título del artículo debe contener la palabra metaanálisis, paraagilizar las búsquedas bibliográficas futuras, e indicar la intervención evaluada y su intención.El resumen contendrá, en unas 200 palabras, el objetivo del metaanálisis, método de búsqueda,cantidad de ensayos clínicos identificados, incluidos y excluidos, con las razones de estas decisiones.Métodos de análisis empleados y conclusiones alcanzadas.El cuerpo del artículo tendrá las siguientes secciones: Introducción, con razones para requerir la síntesisde la evidencia y el disenso existente. Material y métodos, tipificando los criterios de elegibilidad de losensayos clínicos. Métodos de búsqueda empleados. Listado de los ensayos clínicos encontrados,aclarando incluidos y excluidos. Razones para su selección. Características de diseño y operativas delos ensayos clínicos aclarando, criterios de elegibilidad de los participantes, característicasdemográficas de los mismos, tamaño muestral alcanzado, características de las intervenciones,cumplimiento del protocolo, datos faltantes, control del sesgo de selección, evaluación del punto final(uso de enmascaramiento), acciones para certificar los datos presentes o lograr los faltantes en laspublicaciones y por último métodos de análisis empleados. Análisis de resultados y discusión, con laevaluación cualitativa y cuantitativa de los ensayos clínicos incluidos. Por último, conclusión, sobre laseguridad y eficacia de la intervención analizada, sobre las limitaciones y problemas de las conclusionesreferidas y recomendaciones para el futuro de las investigaciones al respecto.

5. Limitaciones de la técnica metaanalítica

Problemas con los que en la actualidad se enfrenta la técnica del metaanálisis.

Page 17: Metaanalisis

17

1. Calidad de los distintos ensayos clínicos.2. Heterogeneidad de los ensayos clínicos combinados.3. Múltiples comparaciones (error alta).4. Sesgo de publicación.

Dada su relativa juventud, la técnica tiene todavía bastantes detractores. Como se ha indicado es difícilestablecer conclusiones positivas de un metaanálisis cuando los ensayos clínicos individuales no han sidocapaces de hacerlo. Aunque es una tentación sustituir los ensayos clínicos por evaluaciones metaanalíticasde ensayos clínicos y bases informatizadas de datos, en función de su bajo coste relativo, no parece unaactitud científicamente consistente. Está claro que no se pueden obtener buenos resultados de metaanálisisa partir de ensayos clínicos mal realizados. La existencia de heterogeneidad entre los ensayos clínicossupone un reto a la propia validez del método. No obstante, la propia heterogeneidad puede ser indicativade la diferencia de comportamiento de la intervención en diferentes grupos. Por último, debe considerarse latendencia a no publicar los ensayos clínicos con resultados negativos, por lo que en el metaanálisis quedansobre representados aquellos con resultados favorables (esto es importante en el caso de que el resultadosea escasamente positivo). Por otra parte, si se calcula el número de ensayos clínicos que debería habercon resultado negativo para contrarrestar nuestro metaanálisis con resultado positivo, y resulta muy grande,se puede aceptar la eficacia del tratamiento valorada por el metaanálisis en cuestión.

5.1. Limitaciones metodológicas del metaanálisisLos técnicas metaanalíticas presentan ciertas limitaciones propias de su metodología. Estas limitacionesdeben conocerse y tenerse en cuenta a la hora de interpretar sus resultados. En primer lugar, elmetaanálisis puede originar resultados distorsionados debido a posibles sesgos de selección y depublicación de los estudios. Por otro lado, la validez de los resultados y las conclusiones del metaanálisisdependen de la calidad de los estudios individuales de modo que la combinación de estudios sesgadospuede potenciar aún más el sesgo. Por último, la interpretación del metaanálisis en caso de heterogeneidado variabilidad entre los estudios es difícil y controvertida. La obligación de quienes utilizan el metaanálisis esconocer estas limitaciones, así como explicitarlas y discutirlas en cada caso concreto. Antes de comentar lasetapas en el proceso de un metaanálisis, se describen brevemente algunos de sus principales problemasmetodológicos.

Heterogeneidad entre estudios

Una primera crítica metodológica al metaanálisis consiste en intentar una combinación estadística deresultados que provienen de estudios que exhiben una gran variabilidad (heterogeneidad) entre ellos. Estano es una dificultad exclusiva del metaanálisis, ya que es compartida por toda investigación clínica(especialmente los estudios multicéntricos), donde la amplia variedad de características inherentes a lossujetos de estudio hace necesario diseñar un protocolo uniforme, realizar un riguroso proceso de selecciónde los sujetos de estudio y posteriormente efectuar un análisis cuidadoso de la influencia sobre losresultados de los casos extremos. Esto se hace particularmente difícil al integrar evidencia derivada denumerosos estudios que fueron a su vez realizados en distintos contextos, con diseños variados, incluyendosujetos diferentes en cuanto a características sociodemográficas o de gravedad de la enfermedad,comparando con diferentes grupos testigo. También se puede observar heterogeneidad midiendo resultadoso efectos distintos; esto es, cuando los estimadores de efecto de los diferentes estudios individuales van endirecciones opuestas, o que un estudio no encuentre un efecto y otros encuentren un efecto de magnitudmuy importante.

5.2. Sesgo de publicaciónEl sesgo de publicación, es decir, la publicación selectiva de estudios sobre la base de sus hallazgos,representa un riesgo para la validez de cualquier metaanálisis.Es bien sabido que muchos trabajos de investigación terminados no llegan a publicarse. Esto es másfrecuente cuando el resultado del ensayo es "negativo", es decir, cuando no se demuestran diferenciassignificativas entre los grupos comparados o bien cuando es desfavorable a un nuevo fármaco. En estoscasos, el investigador y el patrocinador del ensayo (generalmente una compañía farmacéutica) suelen tenermenos interés en preparar un artículo para publicar. Por otra parte, los directores de revistas médicas tienenmás tendencia a rechazar su publicación, porque los resultados "negativos" no suelen ser noticia. Tambiénse ha comprobado que los estudios en los que no se hallan diferencias significativas tardan más tiempo enser publicados Por estos motivos, los metaanálisis que sólo incluyen los trabajos publicados sobre lacuestión objeto de estudio tienden a dar un resultado sesgado. También puede ocurrir que un mismoestudio haya sido publicado más de una vez, en formas aparentemente diferentes; la publicación duplicada

Page 18: Metaanalisis

18

también puede introducir un sesgo, que favorece la tendencia de los resultados de los estudios que han sidoobjeto de publicación duplicada. Además, se ha comprobado que en una proporción importante demetaanálisis se ignoran los trabajos publicados en idiomas distintos del inglés, y se ha visto que laproporción de estudios "negativos" es mayor en otras lenguas. Dada su naturaleza, es muy difícil impedir elsesgo de publicación, o por lo menos hacerse una idea de su magnitud.

6. Metaanálisis cualitativo

Valoración de la validez de los estudios primarios: método seguido para la extracción de la informaciónrelevante y pertinente de cada investigación. El aspecto central en el metaanálisis cualitativo es lavaloración de la calidad de una investigación. La valoración de la calidad es importante ya que los estudiosde alta calidad reducen sesgos y tienen mayor precisión para estimar el efecto que calculan. Se ha derealizar una comparación vertical de todos los estudios realizados.

7. Metaanálisis cuantitativo

El metaanálisis cuantitativo valora: 1. Los métodos estadísticos empleados para la combinación de resultados:

Cohortes Riesgo Relativo , Casos - controles odds ratio→ →2. Metodología empleada para tratar el problema de la heterogeneidad:

No se pueden comparar riesgo relativo con odds ratio. La heterogeneidad mide las diferencias entre losdistintos tipos de diseños. Ejemplo: la población general no es igual a la población hospitalaria.

3. Análisis de sensibilidad:• Comprobar que el modelo es continuo, hay distintos niveles exposición y distintos niveles de riesgo;• Comparar estudios con resultado de riesgo muy alto o muy bajo.

4. Valoración estadística del sesgo de publicación:Sólo se publican estudios en los que los factores de riesgo estudiados si son factores de riesgo o deprotección significativos.

7.1. Modelos de riesgo• Modelo de efectos fijos: cuando se asume que el efecto producido por la exposición es constante de

estudio en estudio. Es el más usual cuando se estudia toda la población de artículos;• Modelo de efectos aleatorios: se asume una distribución al azar a lo largo de distintos estudios. Cuando

sólo se estudia un estrato de la población de artículos.• Modelos de riesgo: parten del modelo de regresión lineal:

y a b x= +donde: y es la exposición;

b es un coeficiente;a es el efecto aditivo sobre el riesgo.

La exposición a un riesgo x se multiplica por el coeficiente b .

• Cuando 0a = , y b x= ; por tanto yb x= : relación exposiciónriesgo .

• Cuando 1b = , y a x= + ; por tanto a y x= − ; relación entre los riesgos.

• Cuando a α= y b β= ; relación de riesgos entre todos los trabajos publicados.

8. Métodos estadísticos para combinar estudios

Aunque existen diferentes propuestas estadísticas para combinar estudios, hay tres fundamentales, que seconocen con el nombre modelo de efectos fijos, modelo de efectos aleatorios y por último el modelobayesiano.

Page 19: Metaanalisis

19

En el modelo de efectos fijos los estudios se combinan considerando que no existe heterogeneidad entreellos, y que por lo tanto todos ellos constituyen estimaciones de un efecto real, cuya magnitud se deseaconocer. Así pues, la inferencia realizada está condicionada a los estudios que se han efectuado.En el modelo de efectos aleatorios la inferencia se basa en suponer que los estudios incluidos en el análisisconstituyen una muestra aleatoria del universo de estudios posibles, y sus resultados son másconservadores al tener en cuenta una fuente extra de variación, ya que ahora se incluyen dos posiblesfuentes de variación: la existente dentro de los estudios y la variación entre los estudios.La utilización de modelos bayesianos constituye, como ya se comentó en el correspondiente tema, unaalternativa interesante a la estadística inferencial clásica, pero por su complejidad no los comentaremos eneste artículo sobre metaanálisis.Dado que una gran mayoría de metaanálisis se efectúa sobre resultados dicotómicos (fallece, fracasa eltratamiento, efecto secundario, etc.) se centrará la exposición en este tipo de variable, aunque la lógicasubyacente es similar para otro tipo de datos.Si tenemos estudios que comparan dos grupos, por ejemplo un tratamiento nuevo con un grupo control, yen los que el resultado es binario, por ejemplo efectivo no/sí, podemos construir una tabla 2 x 2 parapresentar los datos de cada estudio y en ella calcular alguna de las medidas habituales (odds ratio, riesgorelativo, diferencia de riesgo). Es importante tener en cuenta que no es correcto juntar sin más todas esastablas para crear una tabla global y calcular en ella el dato medido, por ejemplo odds ratio. Esta situaciónerrónea que se conoce con el nombre de paradoja de Simpson ya fue comentada anteriormente.

8.1. Modelo de efectos fijosEl método más general para combinar estudios según un modelo de efectos fijos se conoce como métodoponderado por la inversa de la varianza (inverse variance wighted method), descrito en 1930 por Birge ytambién por Cochran. En él cada estudio interviene en la estimación global de forma ponderada, con unpeso proporcional a su precisión, que en este caso se mide como la inversa de la varianza, ya que lavarianza es una medida de dispersión y por lo tanto su inversa una medida de precisión. Supóngase que setiene k estudios, 1,2, ,i k= … , en los que se calcula una medida del efecto que se denominará iT . En el

modelo de efectos fijos se considera que existe un efecto global fijo Φ que se estimará como:

1

1

k

i ii

k

ii

w TT

w

=

=

=∑

donde iw son las ponderaciones habituales: 21

ii

w s=

2is es la varianza de la medida en el estudio i , cuya fórmula concreta depende del tipo de

medida utilizado (odds ratio, riesgo relativo, media, etc.).

Una estimación de la varianza de T se calcula mediante la siguiente fórmula:

( )1

1var k

ii

Tw

=

=

Y si se admite que T sigue una distribución normal se puede calcular un intervalo de confianza del 95 %para ese efecto global sumando y restando al efecto global la raíz cuadrada de ( )var T multiplicada por

1,96.Para intervenir en el metaanálisis algunas medidas es preciso transformarlas, fundamentalmente tomandologaritmos, antes de que puedan ser combinadas, con el fin de que su distribución se aproxime a la normal.Es lo que ocurre con la odds ratio y el riesgo relativo, con los que se trabajará siempre usando suslogaritmos.

Page 20: Metaanalisis

20

8.2. Modelo de efectos aleatoriosEn el modelo de efectos aleatorios se supone que los estudios incluidos en el análisis constituyen unamuestra aleatoria del universo de estudios posibles, y ahora el efecto iT en uno de los estudios seconsidera que tiene dos componentes:

i i iT eθ= +

donde ie es el error con el que iT estima el verdadero efecto iϑ .

Ahora la varianza viene dada por la expresión:

( ) 2var i iT θτ ν= +

donde iν es la varianza debida al error de muestreo en el estudio i ;

2θτ corresponde a la varianza entre estudios.

Existen diferentes métodos matemáticos para estimar los parámetros de este modelo. Se presentará aquíunas fórmulas sencillas para estimar un modelo de efectos aleatorios cuando se pondera con la inversa dela varianza. Para estimar la varianza debida a la variación entre estudios, se definen las siguientesexpresiones:

( )

1

2 2 2

1

2

11

1

k

ii

k

w ii

w

ww

k

s w k wk

sU k w

k w

=

=

=

= − −

= − −

A partir de ellas se calcula la varianza debida a la variación entre estudios como:

( )2 11

Q kcuando Q k

− −= > −

donde Q es el resultado de la prueba de heterogeneidad que se describe más adelante.

Si 1Q k≤ − entonces la variación entre estudios se considera 0 y el modelo coincide con el de efectos fijosdescrito anteriormente.Seguidamente se calcularán unas ponderaciones ajustadas para cada estudio:

*

2

11i

i

w

=+

y la estimación del efecto global y su varianza viene dada por:

*

1

*

1

k

i ii

k

ii

w TT

w

=

=

=∑

( )*

1

1var k

ii

Tw

=

=

Page 21: Metaanalisis

21

Hay que destacar que no es correcto pensar que la utilización del modelo de efectos aleatorios elimina elefecto de la heterogeneidad en los estudios y se debe tener claro que si la heterogeneidad es acusada elobjetivo primordial del metaanálisis debe centrarse precisamente en el estudio de esa variabilidad.

8.3. HeterogeneidadPuede ocurrir que la variabilidad entre estudios sea superior a la que es de esperar por puro azar, y por ellointeresa contrastar la hipótesis de homogeneidad. Existe una prueba sencilla y utilizada habitualmente quefue originalmente desarrollada por Cochran en 1954, sin embargo hay que llamar la atención sobre la bajapotencia de ésta para detectar diferencias, agravado por el hecho de que el número de estudios que secombinan suele ser pequeño, por lo que no se debe contentar con aplicar la prueba y darla por buena si elresultado ha sido no significativo. Siempre se debe intentar verificar la homogeneidad de los resultadostambién por otros cauces, como puede ser un análisis por subgrupos, que se describe más adelante.En esta prueba se trata en esencia de calcular una suma ponderada de las desviaciones del efectodeterminado en cada estudio con respecto a la media global:

( ) 21

k

i ii

Q w T T=

= −∑

En la hipótesis de homogeneidad Q se distribuye aproximadamente como una 2χ con 1k − grados delibertad, siendo k el número de estudios.Debe insistirse en que aunque esta prueba no resulte significativa suele ser insuficiente para concluir que noexiste heterogeneidad entre los estudios y conviene explorar esa posibilidad con otras alternativas,fundamentalmente de tipo gráfico. Así resulta interesante representar los resultados estandarizados:

( )i

ii

T Tz

es T−

=

ya que bajo la hipótesis de homogeneidad, es decir de existencia sólo de diferencias aleatorias entre losestudios, éstos valores estandarizados debieran seguir una distribución normal ( )0,1N∼ .

Otro enfoque para determinar la presencia de heterogeneidad entre estudios es tratar de localizar la posiblecausa de ésta. Una pregunta que resulta natural en este contexto es si existe relación entre la tasa derespuesta y el riesgo base. Una buena herramienta gráfica para verificarlo la constituye el gráfico de l'Abbé,en el que, para cada estudio, se representa en el eje de ordenadas el resultado en el grupo de tratamientofrente al resultado en el grupo de control en el eje de abscisas, y una línea a 45 º que divida el gráfico endos secciones: a un lado de esta línea quedarán los estudios en los que fue favorable el grupo detratamiento y al otro lado los estudios en los que fue favorable al grupo de control. Se suele representar lospuntos de tamaño variable con un área inversamente proporcional a la varianza de la estimación del efectoen cada estudio (directamente proporcional a la precisión de la estimación), de tal manera que cuanto másgrande es un punto mayor precisión tiene el estudio que representa. La presencia de puntos dispersos en elgráfico de l'Abbé indica heterogeneidad, mientras que si se agrupan en una zona estrecha es señal deresultados más homogéneos.

Figura 8.

Page 22: Metaanalisis

22

La presencia de patrones en este gráfico puede orientar sobre lo que está ocurriendo. Si la eficacia dependedel riesgo base, podría ocurrir que para riesgos base bajos los puntos estén muy próximos a la líneadivisoria o incluso del lado de la no eficacia, y a medida que nos vamos moviendo hacia riesgos basemayores los puntos se vayan alejando de esa línea hacia valores de mayor eficacia como se ve en la figuraanterior.Se puede llevar más lejos la idea de que alguna característica subyacente en los estudios puede estarafectando a la heterogeneidad de los resultados, no sólo el riesgo base, sino cualquiera otra característica.Una herramienta estadística que se emplea para analizar esa posibilidad es la meta-regresión.

8.4. Meta-regresiónEl término meta-regresión describe el análisis en el que las características de los estudios o de los sujetosincluidos en cada estudio se usan como variables explicativas en un modelo de regresión multivariante, enel que la variable dependiente es el efecto medido o alguna medida de la desviación del efecto de cadaestudio respecto del efecto global.Aquí la unidad de observación es cada estudio o cada subgrupo de estudios, y a la hora de estimar loscoeficientes de la ecuación de regresión se emplean métodos que ponderan la intervención de cada estudioen esa estimación, de acuerdo a su precisión (proporcional al tamaño del estudio, inversamenteproporcional a la variabilidad del estudio).Puesto que la muestra es pequeña (número de estudios), el número de variables independientes queintervienen en la ecuación de regresión debe ser pequeño. Al igual que en el análisis de regresióntradicional se usa la regla orientativa de 5 ó 10 casos por cada variable, y dado que el número de estudiosen un metaanálisis suele ser pequeño no se debe utilizar muchas variables en la ecuación de regresión.En la figura 9 puede verse una gráfica típica de meta regresión de un ejemplo ya clásico, en la que sepresenta el logarítmo de la odds ratio (eficacia de la vacuna BCG contra la tuberculosis) frente a la latituddel país en el que se efectuó el estudio. El área de los puntos es inversamente proporcional a la varianzadel ln odds ratio. También se puede ver representada la ecuación de meta-regresión, que a diferencia deuna ecuación de regresión normal en la que todos los puntos intervienen por igual, aquí atraen la rectahacia sí en razón directa a su masa. En este caso se puede ver que probablemente el riesgo de ineficaciade la vacuna tiende a aumentar cuando se acerca al ecuador.

Figura 9.

8.5. Análisis de subgrupos y de sensibilidadOtra posible alternativa para explorar la heterogeneidad consiste en efectuar un análisis de subgrupos. Laidea del análisis de subgrupos o estratificación consiste en efectuar el metaanálisis en diferentes grupos deestudios, reunidos según características de los mismos (estudios publicados frente a no publicados,estudios de gran tamaño frente a pequeño tamaño, estudios según nivel de calidad, según fecha depublicación, etc.) o según las características de los pacientes incluidos y comprobar cómo varía el resultadoal estimarlo de nuevo en cada ocasión.De nuevo creemos conveniente destacar que aunque pudiera parecer que la principal motivación paraefectuar un metaanálisis es la de combinar estudios con el fin de resolver un asunto para el que se hanobtenido resultados discrepantes, nada más lejos de la realidad. La situación ideal para la aplicación delmetaanálisis en cuanto a la determinación de un efecto medio global, se da cuando los estudios que se

Page 23: Metaanalisis

23

combinan son ensayos clínicos aleatorizados y sus resultados son homogéneos, aunque el tamaño demuestra original era insuficiente para obtener resultados concluyentes. En el resto de los casos, estudiosdiscrepantes, la investigación de la presencia y causas de la heterogeneidad de los resultados puede pasara convertirse en el principal objetivo del metaanálisis y desplazar al otro objetivo de obtener un valor globalmedio.Cuando las discrepancias entre los estudios son moderadas no será adecuado utilizar un modelo de efectosfijos y será preciso acudir al modelo de efectos aleatorios o incluso a un modelado más complejo, y encualquier caso los resultados tendrán que ser interpretados con cautela.El primer paso de un análisis de subgrupos, que también se conoce como análisis de sensibilidad, consisteen repetir los cálculos extrayendo uno de los estudios cada vez. Podemos representar gráficamente elresultado del análisis repetido excluyendo un estudio, frente al efecto global calculado con todos losestudios y su intervalo de confianza. Esto permite visualizar como afecta cada estudio al resultado global.

Figura 10.

8.6. Presentación de resultadosSi cualquier trabajo de investigación debe presentarse de una forma clara y bien organizada mucho más losresultados de un metaanálisis que pretenden ser el resultado numérico de una revisión sistemática y por lotanto deben tener una presentación muy cuidada, que facilite su lectura e interpretación. Un grupo detrabajo ha definido un esquema y un diagrama de flujo denominado Quality of reporting of meta-analysis(QUORUM) para guiar en la elaboración del metaanálisis.En cuanto a los datos numéricos es habitual presentarlos en tablas con una fila para cada estudio, así comoun gráfico en el que se visualiza el efecto obtenido en cada estudio, con su intervalo de confianza del 95 %,así como el valor global obtenido al combinar los estudios y su correspondiente intervalo de confianza.En el caso de medidas de tipo cociente como son la odds ratio y el riesgo relativo se representarán enescala logarítmica.El problema de este tipo de gráfico, que en inglés se conoce como Forest plot, radica en que los estudioscon peor precisión, los que tienen menor peso en el cálculo del efecto global son los que presentan unmayor impacto visual, ya que su intervalo de confianza es el más amplio. Para remediar esto de algunaforma, se acude a representar el valor de su efecto medio con un símbolo cuya área sea proporcional a laprecisión, de tal manera que los símbolos más grandes y por tanto más llamativos, corresponden a losestudios más precisos y con mayor peso en la estimación del efecto global.

Page 24: Metaanalisis

24

Figura 11.

intervalo de confianza de la odds ratio 95 %estudio odds ratio límite inferior límitesuperior varianza

1 0,96 0,25 3,73 0,4782 0,96 0,21 4,29 0,5853 0,70 0,26 1,92 0,2654 0,40 0,10 1,60 0,5065 1,00 0,06 16,65 2,0596 0,70 0,21 2,28 0,3657 0,82 0,25 2,69 0,3698 0,69 0,17 2,85 0,524

Global 0,73 0,45 1,16Tabla 5.

Para finalizar después de reconocer que una buena revisión sistemática es una excelente herramienta paravalorar los conocimientos y conclusiones sobre un asunto, es una valiosísima herramienta para ayudar atomar decisiones y para definir nuevas líneas de trabajo, y que además está sirviendo para que mejore lacalidad y homogeneidad en la presentación de los datos en los estudios básicos, pero no está de másrecordar el proverbio popular de que mil conejos blancos no hacen un caballo blanco, ¡ni siquiera en unmetaanálisis!

8.7. Método de Mantel-Haenszel-Peto para obtener un estimador combinado del efecto deun grupo de ensayos clínicos incluidos en un metaanálisis

Test de homogeneidad/heterogeneidad de Woolf

1 2: k ajustadoHipótesis nula odds ratio odds ratio odds ratio odds ratio= = = =…

donde: k es el número de estratos.

tratamiento experimentalpresente ausente

presente ia ib 1imefecto

ausente ic id 2im

totales 1in 2in iN

Page 25: Metaanalisis

25

Para cada estrato i se calcula la odds ratioi , que es la odds ratioespecífica por estrato.Para el estrato i :

( )ln ln

i ii

i i

i ii

i i

a dodds ratio

b c

a dodds ratio

b c

×=

×

×= ×

La varianza específica por estrato 2is es:

2 1 1 1 1i

i i i i

sa b c d

= + + +

y

( )( )2

1

21

1 lnln

1

k

ii i

POND k

i i

odds ratios

odds ratio

s

=

=

×

=∑

El ( )ln PONDodds ratio es el logaritmo neperiano del promedio ponderado de la odds ratio, igual que ellogaritmo neperiano de la odds ratio, ajustado de Mantel-Haenszel.

Finalmente, el test de Homogeneidad de Woolf se distribuye como una 2χ con 1k − grados de libertad (siel valor del estadístico es pequeño, no se puede rechazar la hipótesis nula y se ha de aceptar que losestratos son homogéneos):

( ) ( )( ) 222

1

ln lnk i PONDWoolf

i i

odds ratio odds ratio

=

−= ∑

Si se acepta la hipótesis nula de homogeneidad, tiene sentido calcular una medida de magnitud, resumendel efecto del tratamiento utilizado, a lo largo de los diferentes estratos, que sería la odds ratio ajustado deMantel-Haenszel.

8.8. Odds ratio ajustada de Mantel-HaenszelEs el método más utilizado para valorar la asociación global en un análisis estratificado. El cálculo de laodds ratio de Mantel-Haenszel como medida de magnitud de asociación a lo largo de los diferentes estratosse basa en la siguiente fórmula:

1 1 2 2

1 1 2

1 1 2 2

1 21

ki i k k

i i kM H k k ki i

ki i

a d a d a d a dN N N N

odds ratio b c b c b cb cN N NN

=

=

× × × ×+ + +

= =× × × × + + +

La división por iN sirve para ponderar por los tamaños de los diferentes estratos (tamaños de los distintosestudios). Mediante la fórmula de Woolf se pueden obtener resultados similares.

El estadístico de Mantel-Haenszel es una generalización directa del análisis sencillo de la 2χ . Esta pruebapuede aplicarse tanto a datos independientes como apareados. Se basa en una distribuciónhipergeométrica para estudios de seguimiento acumulados, de casos y controles (densidad y acumulados) yde corte transversal. Para estudios de cohortes con densidad de incidencia se utiliza una distribuciónbinomial. La hipótesis nula es, como habitualmente, que la odds ratio sea 1.

Page 26: Metaanalisis

26

El diseño general (para variables dicotómicas, exposición y enfermedad) es una prueba para grandesmuestras que utiliza el estadístico 2χ con un grado de libertad cuya estructura básica es:

( )( )

2

2

vara

M Ha

a E

Eχ −

−=

donde a es el número de casos expuestos;

aE es el número de casos esperados bajo el supuesto de la hipótesis nula de no asociación; y

( )var aE es la varianza del total de casos expuesto también bajo la hipótesis nula.

La forma específica de estos dos últimos valores depende del diseño del estudio.En tabla anterior, la casilla principal es la superior izquierda, a, ya que los marginales vienen dados por losdatos del estudio y conociendo una casilla, se derivan las tres restantes. Asumiendo que los valores encada estrato son independientes, los valores esperados para todos los estratos y sus varianzas se calculancon las siguientes fórmulas:

( ) ( )

1 1

1 1

1 2 1 22

1

var1

k ki i

a ii i i

ki i i i

ai i i

n mE a

N

n n m mE

N N

= =

=

×= =

× ×=

− ×

∑ ∑

en consecuencia, la 2M Hχ − ponderada por los estratos es la siguiente:

( ) ( )

2 2

1 1

1 1 12

1 2 1 2 1 2 1 22 2

1 11 1

k k ki i i i i i

ii i ii i

M H k ki i i i i i i i

i ii i i i

n m a d b ca

N Nn n m m n n m m

N N N N

χ= = =

= =

× −−

= =× × × ×

− × − ×

∑ ∑ ∑

∑ ∑

que puede ser comparado con los valores de una tabla 2χ con un grado de libertad. Debe tenerse encuenta que aunque los estratos tengan pocos casos en las celdas, lo que interesa son los totalesmarginales para considerar la utilización de esta prueba estadística.La precisión del estimador odds ratioM H puede calcularse por varios métodos. El método de Miettinen (40)es “sucio” y rápido. Calcula un estimador aproximado del error estándar mediante el test based, basado enla prueba 2χ :

1 21

M H

z

M Hintervalo de confianza odds ratio

α

χ

±

−=

donde: 2M H M Hχ χ− −=

Los métodos exactos de Flanders (41) y de Robins (42) son más seguros y complejos. El método deFlanders calcula el error estándar del ( )ln M Hodds ratio − :

( )( ) ( )21

1

11lnp

i i i iM H i ik

i i i i M H

i i

b c a des odds ratio b cb c N odds ratio

N

−= −

=

× × + = + × ×

∑∑

cuyo intervalo de confianza al 95 % es:

( ) ( )( )ln 1,96 lnM H M Hodds ratio es odds ratio− −± ×

Page 27: Metaanalisis

27

9. Cálculo del tamaño del efecto

9.1. Definición1. Tamaño del efecto es un concepto crucial en el metaanálisis moderno2. Tamaño del efecto se puede definir como cualquier medida estadística que evidencia el grado con el

que un evento dado esta presente en una muestra (43). El tipo de medida se llama efecto, y sumagnitud es el tamaño del efecto.

3. Diferentes medidas de tamaños de efecto se calculan a partir de diferentes tipos de datos originales

9.2. Fuente de datos1. Diferentes medidas de tamaños de efecto se calculan a partir de diferentes tipos de datos originales2. En general, los datos originales caen en una de las tres siguientes categorías:

• Medias, tamaños de muestras y desviaciones estándares de los grupos control y experimental;• Tablas de contingencia 2 x 2 que representan las cuatro posibles soluciones categóricas

experimentales;• Coeficientes de correlación.

9.3. Tamaños de efecto basados medias y desviaciones típicas

Tamaño de efecto de Glass (44)

1. Sean Cx y Ex la media de un efecto de distribución continua en el grupo control y el grupoexperimental;

2. Sean Cs y Es las desviaciones típicas de cada grupo y En y Cn los respectivos tamaños de muestra;

3. El tamaño del efecto y su varianza se calculan como:

( ) ( )2

var2 1

E C

C

C E

C E C

x xs

n nn n n

−∆ =

+ ∆∆ = +

Inconveniente: Sólo la varianza del grupo control se usa para estandarizar la diferencia entre medias.

9.4. d de Hegde (45)

1. Sean Cx y Ex la media de un efecto de distribución continua en el grupo control y el grupoexperimental;

2. Sean Cs y Es as desviaciones típicas de cada grupo y En y Cn los tamaños de muestra;

3. El tamaño del efecto y su varianza se calculan como:

( ) ( )2

var2 2

E C

C E

C E C E

x xd J

sn n gdn n n n

−=

+= +

+ −

donde:( ) ( )2 21 1

2C C E E

C E

n s n sS

n n− + −

=+ −

Page 28: Metaanalisis

28

( )31

4 2 1C E

Jn n

= −+ − −

9.5. d de Cohen (46)

1. Sean Cx y Ex la media de un efecto de distribución continua en el grupo control y el grupoexperimental.

2. Sean Cs y Es as desviaciones típicas de cada grupo y En y Cn los tamaños de muestra;

3. El tamaño del efecto y su varianza se calculan como:

( ) ( )2

var22 2

E C

C E C E

C E C EC E

x xd

n n n nddn n n nn n

σ−

=

+ += +

+ −+ −

donde:( ) ( )2 21 1C C E E

C E

n s n sn n

σ− + −

=+

Ventaja: no se afecta por varianzas muestrales distintas.Inconveniente: sesgada por tamaños muestrales pequeños.

9.6. Response ratio, R (47)

1. Sean Cx y Ex la media de un efecto de distribución continua en el grupo control y el grupoexperimental.

2. Sean Cs y Es as desviaciones típicas de cada grupo y En y Cn los tamaños de muestra;

3. El tamaño del efecto y su varianza se calculan como:

( )

( )( )2 2

2 2

ln ln

var ln

E

C

E C

E E C C

xR

x

s sR

n x n x

=

= +

9.7. Tablas de contingencia 2 x 21. La variable respuesta es dicotómica y tiene distribución binomial, por lo que puede ser representada en

la siguiente tabla:

experimental control totalrespuesta a b a b+

no respuesta c d c d+

total En a c= + Cn b d= + N a b c d= + + +

2. Se calcula la tasa de respuesta de ambos grupos, EP y CP , como E

An

y C

bn

, respectivamente:

Page 29: Metaanalisis

29

EE

CC

aPn

bPn

=

=

9.8. Risk difference, RD (48)1. El tamaño del efecto y su varianza se calculan como:

( ) ( ) ( )1 1var

E C

E E C C

E C

RD P P

P P P PRD

n n

= −

− −= +

2. No diferencia entre grupos genera 1RR = , y varía entre 0 e infinito ( )ln( ) 0RR = .

9.9. Odds ratio OR (49)1. Odds de un evento es la probabilidad de que ocurra el evento dividido por la probabilidad de que no

ocurra.2. El tamaño del efecto y su varianza se calculan como:

( )( )

( )( )

( )

1 1

1 1

1 1 1 1var

E E E C

C C C E

P P P P a dodds ratiob cP P P P

RDa b c d

− −= = =

− −

= + + +

9.10. Correlaciones

1. A veces los datos originales están en diferentes fuentes ( F , t , 2χ , ...);

2. Es útil transformar todo estos estadísticos en correlaciones de Pearson y calcular el tamaño del efecto apartir de ellas;

3. Estas transformaciones se pueden hacer con una meta-calculadora. Las transformaciones másfrecuentes son:

21

2

2

zrN

rN

trt gl

FrF gl

χ

=

=

=+

=+

z : datos en forma de probabilidades.

9.11. Transformación z de Fisher (2)1. Con las correlaciones, podemos calcular el tamaño del efecto mediante la fórmula:

Page 30: Metaanalisis

30

( )

1 1ln2 11var3

rzr

zn

+= −

=−

donde n es el tamaño muestral.

2. z oscila entre − ∞ y + ∞ , con 0z = indicando ausencia de efecto.

Ventaja: puede incluir estudios tomados de forma diferente, por lo que puede aumentar lacantidad de estudios metaanalizados.

Inconvenientes: está sesgado ligeramente cuando el tamaño muestral es bajo;hay que tener cuidado con no incluir estudios demasiado heterogéneos

9.12. Recomendaciones para presentación de datos1. Presentar todos los valores de probabilidad exactos;2. Cuando sea posible, presentar medias, desviaciones estándares y tamaño muestral de cada grupo

experimental usado en el diseño y del grupo control.3. Ejemplo de requisitos impuestos por el J. Evol. Biol:

Please make sure any in-line statistics conform to the Instructions for authors: "In-linestatistical results should be presented as test-statistics: degrees of freedom as subscript(s)to test-statistics (e.g. 1,12F =… or 8t =… ), followed by p -value., e.g.

( )1,12 4.9, 0.05F p= < . Statistical results in tables should be comprehensive,

allowing future meta-analyses. Depending on the details of the analyses, resultsreported may include parameter estimates, test-statistics, degrees of freedom, significancelevels and err/residual model information (e.g. error MS's and df's in ANOVA or regressionmodels). Since exact p -values can be useful for meta-analyses, we recommend that

these are quoted even when non-significant, e.g. 23 0.25, 0.34t p= = , or

2,32 1.12, 0.55F p= = . However, non significant tests (i.e. 0.05p > ) should always beinterpreted as such.(see Instructions for Authors, JEB inside back cover, or

http://www.blackwellpublishing.com/journals/jeb/submiss.htm)

10. Combinación de resultados

10.1. Tamaño del efecto acumulado1. Tamaño del efecto acumulado es un estimador que sintetiza el efecto global de los tratamientos que

estamos metaanalizando.2. Se calcula según la siguiente fórmula:

( )

1

1

1

1var

n

i ii

n

ii

n

ii

w EE

w

Ew

=

=

=

=

=

Page 31: Metaanalisis

31

donde iw es la inversa de la varianza del estudio 2

1

is

.

Ventaja: es una media ponderada. De esta forma, se tiene en cuenta la diferencia en tamañomuestral y potencia de cada estudio individual.

10.2. Significación del efecto acumulado1. Se pueda calcular el intervalo de confianza del efecto acumulado usando la fórmula:

2 1 EnE t sα −±

donde t es el valor crítico a partir de un distribución t de Student para el nivel α .2. Una vez establecido el intervalo de confianza, se puede evaluar estadísticamente el efecto global del

conjunto de estudios. Se admite un efecto acumulado significativo cuando el intervalo de confianza noincluye el valor cero.

10.3. Heterogeneidad total (50)

1. La heterogeneidad total TQ indica si los tamaños de efecto son homogéneos:

( )2

212

1 1

1

n

i in ni

T i i ini i

ii

w EQ w E E E

w

=

= =

=

= − = −∑

∑ ∑∑

2. Para ver si TQ es significativa, se contrasta frente a una 2χ con 1n − grados de libertad. [La hipótesis

nula es que todos los tamaños de efecto son iguales. Una TQ significativa indica que la varianza entretamaños de efecto es mayor que la esperada por azar].

3. TQ es un suma de cuadrados ponderada, por lo que es comparable a la suma de cuadrados total de unANOVA.

10.4. Fuentes de heterogeneidad

1. Cuando TQ es significativo, se puede pensar que es debido a que existe una estructura subyacente enlos datos.

2. La estructura puede aparecer porque existan variables que afecten a los resultados. Estas variablespueden ser categóricas o continuas.

3. Se puede incorporar estas variables dentro de nuestros modelos metaanalíticos como predictores.Dependiendo de la naturaleza de estos predictores, tendremos un tipo u otro de modelo metaanalítico.

10.5. Predictores categóricos1. Los predictores son categóricos cuando los estudios se pueden segregar en más de un grupo.

2. En este caso, se calcula el tamaño de efecto acumulado para cada grupo, iE y su varianza según lafórmula:

1

1

k

i j i ji

j k

i ji

w EE

w

=

=

=∑

Page 32: Metaanalisis

32

( )1

1var j k

i ji

Ew

=

=

∑donde jk es el número de estudios en el grupo j ;

i jw son las ponderaciones; y

i jE son los tamaños de efecto del estudio i en el grupo j .

3. El intervalo de confianza se calcula como:

2 1 jj Ek jE t sα −±

3. Se admite que jE es significativo cuando el intervalo de confianza no incluye el valor cero.

10.6. Heterogeneidad dentro y entre grupo (50)1. Se puede ver si dentro de cada grupo existe heterogeneidad significativa a su vez. La heterogeneidad

dentro de grupo wiQ se calcula como:

( ) 21

n

wi i j i j ji

Q w E E=

= −∑

2. Se contrasta frente a una 2χ con 1k j − grados de libertad.

3. Se puede además comprobar si la los grupos difieren entre ellos en tamaño de efectos. Para ello, sedescompone la heterogeneidad total TQ en heterogeneidad o variación en tamaños del efecto debida al

modelo MQ y heterogeneidad debida al error EQ :

T M EQ Q Q= +

4. Para datos categóricos MQ describe la diferencia entre grupos en los tamaños de efectos acumuladosy se calcula como:

( ) 21 1

m k

M i j ji j

Q w E E= =

= −∑∑donde: m es el número de grupos;

jk es el numero de estudios en el grupo j ;

i jw es el peso del estudio i i en el grupo j ;

jE es el tamaño de efecto acumulado para el grupo j ;

E es el tamaño de efecto acumulado global.5. La heterogeneidad del error residual se calcula como

( ) 21 1 1

p m k

E mi i j i j ji i j

Q Q w E E= = =

= = −∑ ∑∑donde: i jE es el número de grupos;

6. Tanto MQ como EQ pueden ser contrastadas frente a una 2χ con 1m − grados de libertad. para

MQ y n m− grados de libertad para EQ .

7. Un MQ significativo significa que hay diferencia en el tamaño del efecto para los grupos, mientras que

un EQ significativo implica que aún hay heterogeneidad no explicada por el modelo.

Page 33: Metaanalisis

33

10.7. Predictores continuos (51)1. A veces el tamaño de los efectos de estudios individuales puede explicarse por una variable

independiente. En este caso se utiliza un modelo metaanalítico continuo.

2. Se requieren tres variables de cada estudio: el tamaño del efecto iE , la ponderación iw y el valor de la

variable independiente iX .

3. La relación entre iE y iX se determina mediante una regresión ponderada:

0 1i iE b b X ε= + +

donde1

1 10

1

j j

i i i ii i

j

ii

w E b w Eb

w

= =

=

−=

∑ ∑

∑es la interceptación de la ordenada; y

1 1

1

11 2

12

1

1

j j

i i i iji i

i i i ji

ii

j

i iji

i i ji

ii

w X w Ew X E

wb

w Xw X

w

= =

=

=

=

=

=

= −

∑ ∑∑

∑∑

es la pendiente

4. Sin embargo, sus errores estándares no pueden calcularse mediante el procedimiento de mínimoscuadrados, sino como:

0

1

2

1 1

1

2

2

1 1

1

1

1

bj j

i i ii i

j

i ii

bj j

i i i ii i

j

ii

s

w w X

w X

s

w X w X

w

= =

=

= =

=

=

=

∑ ∑

∑ ∑

∑5. Dividiendo la pendiente y la ordenada en el origen por sus errores estándares, se halla la puntuación z .

Este valor se compara al de una distribución normal para ver si son significativas [si la variableindependiente explica significativamente la variación en tamaños de efectos].

6. MQ y EQ se calculan como:

1

212Mb

E T M

bQ

s

Q Q Q

=

= −

Page 34: Metaanalisis

34

7. MQ se comprueba con una 2χ con un grado de libertad y su nivel de significación será idéntico al

nivel de significación de 1b .

8. Un MQ significativo significa que iX explica una porción significativa de la variación en tamaños delefecto.

9. EQ se contrasta frente a una 2χ con 2n − grados de libertad, y si sale significativo implica que hayaún heterogeneidad no explicada por el modelo.

10.8. Efectos fijos y aleatorios (52)1. Todos los modelos vistos hasta ahora son modelos de efectos fijos, es decir, modelos que asumen que

hay un tamaño de efecto real compartido por todos los estudios o por cada grupo de estudios;2. Los modelos de efectos fijos calculan los estadísticos basados en el presupuesto de que la única

variación en tamaño del efecto al error del muestreo;3. Sin embargo, existe un segundo tipo de modelos denominados modelos de efectos aleatorios que

asumen que existe además un componente de variación aleatorio en los tamaños de efectos entreestudios;

4. En los modelos con efectos aleatorios, este componente aleatorio de variación se calcula y se introduceen los estadísticos;

5. Un modelo de efectos aleatorios se construye en tres fases• Se asume un modelo de efectos fijos para determinar el valor de los estadísticos;

• Se calcula una varianza entre estudios pooledδ . Este estadístico se usa para recalcular la

ponderación de cada estudio en modelos aleatorios ( )i randw .

• Finalmente las nuevas ponderaciones se incluyen en un modelo de efectos aleatorios en lasmismas ecuaciones descritas antes para calcular los estadísticos metaanalíticos.

6. En todos los casos, el peso en un modelo de efectos aleatorios se calcula como:

( ) 2

1i rand

i pooled

wv σ

=+

7. La varianza entre estudios se calcula usando la siguiente fórmula cuando no hay estructura:

( )2

2

1

1

1

1Tpooled j

iji

i ji

ii

Q n

ww

w

σ

=

=

=

− −=

−∑

∑∑

8. El numerador es la varianza no explicadas en tamaños de efecto menos el número de grados delibertad. El denominador es una función sumatoria de las ponderaciones.

9. Cuando hay estructura subyacente en los datos, y los predictores son categóricos, la varianza secalcula como:

( )2

2

1

1 1

1

Epooled j

i jjmi

i jj i

i ji

Q n m

ww

w

σ

=

= =

=

− −=

∑∑ ∑

∑10. El numerador es de nuevo la varianza no explicada en tamaños de efecto menos el número de grados

de libertad. El denominador es una función sumatoria de las ponderaciones.11. Este modelo se denomina a veces modelo de efectos mixtos porque incluye variación aleatoria entre

estudios dentro de un grupo y diferencias fija entre grupos.

Page 35: Metaanalisis

35

12. Cuando hay estructura subyacente en los datos, y los predictores son continuos, la varianza se calculacomo:

( )2

2 2

1 1 12

1 2 2

1 1 1

2

2

Epooled j j j

i i i i i i iji i i

ij j ji

i i i i ii i i

Q n

w X X w X X ww

w w X w X

σ

= = =

=

= = =

− −=

− +−

∑ ∑ ∑∑

∑ ∑ ∑

ii

i

13. El numerador es de nuevo la varianza no explicadas en tamaños de efecto menos el número de gradosde libertad. El denominador es una función sumatoria de las ponderaciones.

10.9. Modelo lineal generalLa complejidad de los modelos metaanalíticos puede incrementarse introduciendo más variables tanto denaturaleza continua como categórica. Estos modelos pueden ser resueltos mediante modelos linealesgenerales ponderados. El modelo lineal general utiliza álgebra matricial para determinar la relación entre unconjunto de variables dependientes e independientes.Sea E el vector de dimensiones 1 n× de variables dependientes o tamaños de efecto:

1

2

n

EE

E

=

E

y sea X la matriz de dimensiones p n× de variables dependientes

11 21 1

12 22 2

1 2

11

1

p

p

n n p n

X X XX X X

X X X

=

X

donde la primera columna es la única columna incluida para un metaanálisis no estructurado, y las demáscolumnas son añadidas cuando existe estructura.Según el modelo lineal general, la relación entre variables dependientes e independientes se determina deacuerdo con la ecuación:

= +E Xβ εdonde β es un vector de coeficientes (0 a p ); y

ε es el error del modelo.En el metaanálisis, los tamaño de efecto varían en precisión alrededor del tamaño de efecto acumuladoverdadero, por lo que se necesita una estimación ponderada de β :

( ) 1−′ ′=β X WX X WE

donde W es una matriz diagonal con los pesos de los estudios individuales1. Resolviendo el modelo lineal general:

0 1 1 2 2i i i p piX X Xβ β β β= + + + +E …

2. La varianza de los coeficientes β se hallan como:

( ) 1β −′Σ = X WX

Page 36: Metaanalisis

36

3. Usando el modelo lineal general se pueden también hallar la heterogeneidad explicada por el modeloQM, la heterogeneidad residual QE y por ende la heterogeneidad total QT (fórmulas no mostradas):

11. Evaluación del sesgo de publicación

Un problema que puede aparecer al realizar metaanálisis es la presencia de sesgo en las publicaciones: lapublicación selectiva de artículos mostrando cierto tipo de resultados sobre otros (53). Esto ocurre por:(a) la tendencia de las revistas de rechazar resultados no significativos;(b) la tendencia de los propios autores de no enviar resultados nos significativos.Este comportamiento conlleva un déficit de resultados nulos (file-drawer problem), y una sobreestimación deresultados significativos (inferencia anticonservadora).La presencia de sesgo de publicación se evalúa mediante métodos gráficos o estadísticos.

11.1. Métodos gráficos

Histogramas ponderados (51)

Una forma simple de evaluación es a través de histogramas ponderados, en los cuales la altura de lasbarras de cada clase se construye mediante los pesos combinados de los estudios en lugar de lasfrecuencias. Los métodos metaanalíticos asumen normalidad. Así, un histograma ayudará a identificar laexistencia de datos extremos (outliers). Los histogramas bimodales o multimodales indican modelosestructurados según variables categóricas. Si hay sesgo de publicación, con ausencia de estudios con nuloo poco efecto, el histograma mostrará huecos

Figura 12.

Diagrama de embudo

Otra forma simple de evaluación son los diagramas de embudo (funnel plot), un gráfico que representa lostamaños de los efectos frente al tamaño muestral. En ausencia de sesgo debe cumplirse:

• Estudios con tamaño muestral bajo deben tener error de muestreo alto, y por lo tanto la variaciónalrededor del tamaño de efecto debe disminuir cuando aumento el tamaño muestral;

• El tamaño de efecto acumulado debe ser independiente del tamaño muestral;• Para un tamaño muestral dado, los estudios deben estar distribuidos según una normal de media el

tamaño de error acumulado.Si estas tres condiciones se cumplen, se obtendrá un gráfico en forma de embudo (figura 13):

Gráfico de cuantiles normales (54)

El gráfico de cuantiles normales (54) es un tipo especial del gráfico cuantil-cuantil, donde se representan loscuantiles de nuestra distribución (el tamaño de efecto estandarizado) con una distribución normal. Si soniguales, los puntos deben caer en la recta y x= . Este método tiene la ventaja de que es más fácil deinterpretar, y además comprueba el supuesto de normalidad básico a todo estudio metaanalítico.

Page 37: Metaanalisis

37

La pendiente de la regresión lineal indica la desviación típica de los datos (debería ser igual a 1) y laintersección con el eje Y indica la media. La presencia de sesgo de publicación produce huecos extraños oextrema no linealidad.

Figura 13

Figura 14

11.2. Métodos estadísticos

Prueba de correlación de rangos

En la prueba de correlación de rangos (55) se correlaciona el tamaño de efecto estandarizado, *E con eltamaño muestral n . Es un análogo estadístico del gráfico del embudo.

( )*

* i

i

E EE

v

−=

donde *

1

1k

i ij i

v vv=

= −

Como pruebas de correlación se utiliza una correlación de rango simple, la τ de Kendall o la ρ deSpearman. Si la correlación es significativa se deduce que hay sesgo de publicación. Este método aumentasu potencia para detectar sesgo a medida que aumenta el número de estudios incluidos en el metaanálisis.

-4.67

-2.95

-1.23

0.50

2.22

2.00 6.50 11.00 15.50 20.00

Tamaño muestral

Tamaño de efecto

-3.42

-1.18

1.05

3.29

5.53

-2.27 -1.13 0.00 1.13

2.27

Normal Quantile

Page 38: Metaanalisis

38

Fail-safe number

Este método calcula el número adicional de estudios con tamaño de efecto cero que se tiene que añadirpara cambiar los resultados de significativo a no significativo. Existen varios procedimientos para calcularlo.El más clásico es el propuesto por Rosenthal (56):

( )

2

12

i

j

pi

R

zN n

=

= −∑

donde: n es el número de estudios;

( )1pz son las puntuaciones z de los valores individuales significativos;

zα es la puntuación z de una cola asociada al nivel de significación deseado.

Orwin propone un método alternativo:

( )0 mO

m n

n E EN n

E E−

= −−

donde: n es el número de estudios;

0E es el tamaño del efecto medio de los estudios originales;

mE es el tamaño de efecto mínimo deseado, por lo general 0,2; y

nE es el tamaño de efecto medio de los estudios adicionales.

Weigthed fail-safe number

Los métodos anteriores presentan el problema de que no ponderan el tamaño muestral de cada estudioparticular. Rosenberg (57) ha propuesto un método promediado calculando el número de estudios conresultado nulo necesarios para reducir el nivel de significación.

1

n

ii

n WNw

=

′=

∑donde: n es el número de estudios;

1i

i

wv

=

( )

12

12

1

n

i ni

iiv

EW w

=

=

′ = −∑

El safe number en todo caso debe ser inferior a un valor umbral 2 10N + , siendo N el número deestudios.

12. Cualificación de evidencia y grado de recomendación

Toda revisión debería concluir con una recomendación según el nivel de evidencia existente (grado defortaleza metodológica).

Page 39: Metaanalisis

39

recomendación1 grado A metaanálisis

ensayos clínicos aleatorizados con errores α y β bajos2 grado B ensayos clínicos aleatorizados con errores α y β altos3 grado C estudios concurrentes de cohorte4 grado C estudios de cohortes históricas

estudios de casos y controles5 grado C series de casos

Tabla 5 Niveles de evidencia

13. Metaanálisis de pacientes individuales

• Reanalizar los datos de pacientes individuales;• Menos sesgos;• Más fácil de aprovechar los datos;• Más difíciles de realizar.

14. Metaanálisis bayesiano

Algunos estadísticos piensan que otros enfoques estadísticos son más adecuados que los modelosexpuestos anteriormente. Una aproximación utiliza el teorema de Bayes, así denominado en honor deThomas Bayes, clérigo inglés del siglo XVIII. Los estadísticos bayesianos expresan su creencia acerca deltamaño de un efecto mediante una distribución de probabilidades previa al conocimiento de los datos, yactualizan esa creencia calculando una distribución de probabilidades posterior, que tiene en cuenta losdatos observados. Los modelos bayesianos pueden utilizarse tanto bajo las asunciones de efectos fijoscomo las de efectos aleatorios. El intervalo de confianza (o más correctamente, según la terminologíabayesiana, el intervalo de credibilidad del 95 %, que cubre el 95 % de la distribución de probabilidadesposterior) a menudo será más amplio que el que se deriva de los modelos convencionales, debido a que seintroduce otro componente de variabilidad, la distribución previa. Los enfoques bayesianos soncontrovertidos porque la distribución previa a menudo está basada en opiniones y juicios subjetivos.

15. Comentarios sobre el metaanálisis

El metaanálisis resulta un procedimiento de investigación que incrementa la calidad de las revisionesbibliográficas, dado que provee los elementos para realizarlas metódicamente y arrojar resultadosclaramente interpretables.Los resultados del metaanálisis son útiles a la hora de planificar futuras investigaciones clínicas controladasaleatorizadas sobre temas similares, ya que proveen la evidencia de los efectos que es dable esperar,permitiendo por ello mejores cálculos del tamaño muestral. También aportan los elementos de juicionecesarios para generar nuevas hipótesis o papara decidir si es necesario practicar nuevas investigacionesclínicas controladas aleatorizadas sobre la misma cuestión.Si ninguna de las mejores investigaciones clínicas controladas aleatorizadas incluidas mostrara un efectorelevante de la intervención y el metaanálisis sí, recomendar su aplicación sólo sobre la base del resultadode éste puede resultar temerario. Si esta es la situación, la conclusión es que se requieren másinvestigaciones clínicas controladas aleatorizadas bien diseñadas y conducidas que disipen la duda.Los metaanálisis son aplicables para la aprobación del uso de intervenciones por parte de organismosreguladores y en la docencia, ya que poseen la capacidad de mostrar sintéticamente la evidencia científicadisponible.Finalmente, el metaanálisis es un procedimiento de investigación que demanda una utilización consciente,ya que de lo contrario se desacreditará, privando a la Epidemiología Clínica de un instrumento útil.

Page 40: Metaanalisis

40

16. Validez del metaanálisis: comparación con el ensayo clínico

Diversos trabajos han explorado la validez de los resultados de los metaanálisis de ensayos clínicos,comparándolos con los resultados de grandes ensayos clínicos sobre la misma cuestión.En un estudio se revisaron 30 metaanálisis de ensayos clínicos de pequeño tamaño sobre intervenciones enperinatología, y sus resultados fueron comparados con los de un ensayo único con una muestra grande ( demás de 1000 pacientes) sobre la misma cuestión. En un 80 % de los casos la dirección de los resultadoscoincidió, pero la concordancia sobre la significación estadística de uno y otro fue menor.En otra revisión de 79 metaanálisis de intervenciones en perinatología realizados por la ColaboraciónCochrane, se encontró una coincidencia de 80 % a 90 % en la dirección de los resultados. Se halló el doblede desacuerdos si se aplicaban modelos de análisis estadísticos de efectos fijos. De 15 desacuerdosidentificados con el modelo de efectos aleatorios, cinco podían atribuirse a diferencias a diferencias en elpronóstico del grupo control, cuatro a diferencias de protocolo, y uno a un posible sesgo de publicación; dosde los otros cinco desacuerdos eran clínicamente irrelevantes. Los autores concluyeron que generalmentelos resultados de estudios pequeños son compatibles con los de los estudios grandes, pero en ocasionesocurren discrepancias, incluso si se consideran las diferencias de diseño entre ensayos grandes ypequeños; no obstante, es raro encontrar diferencias clínicamente importantes sin explicación.Una comparación de 12 ensayos clínicos de gran tamaño con 19 metaanálisis previos sobre problemas dediversas especialidades médicas llegó a conclusiones más pesimistas: a pesar de que s encontrócongruencia en la dirección del efecto en un 80 % de los casos, los resultados del metaanálisis hubieranconducido a la adopción de un tratamiento inefectivo en un 32 % de los casos y a rechazar un tratamientoefectivo en un 33 %.Cuando existen, las discrepancias entre resultados de metaanálisis de ensayos pequeños y los de losgrandes ensayos clínicos sobre la misma cuestión suelen explicarse por la heterogeneidad de laspoblaciones comparadas. Así por ejemplo, un metaanálisis concluyó que los suplementos de calcio durantela gestación son muy efectivos para prevenir la preeclampsia, pero un gran ensayo clínico posterior noconfirmó estos resultados. Se pudo comprobar que había una importante heterogeneidad entre lospacientes incluidos en los ensayos; cuando estos fueron diferenciados entre los que incluyeron a pacientesde alto riesgo y los que los incluyeron de bajo riesgo, se observó que los suplementos de calcio tienen unimportante efecto beneficioso en las de riesgo elevado, pero en las de bajo riesgo, similares a las incluidasen el citado ensayo, el calcio no mostraba efecto protector. Así, se concluyó que los resultados delmetaanálisis eran compatibles con los del ensayo clínico, y que la aparente discrepancia se debía a laheterogeneidad de los ensayos clínicos incluidos en el metaanálisis.Un metaanálisis es riguroso si cumple una serie de condiciones: en primer lugar, es conveniente queparticipe un clínico, para no perder de vista la significación de lo que se examina. En segundo lugar, espreciso asegurar la calidad del análisis, con la participación de un bioestadística. Es preciso definircuidadosamente las preguntas, asegurar que no se deja de incluir ningún ensayo (evitar sobre todo lossesgos de publicación), aplicar criterios de inclusión estrictos y cuidadosamente definidos ( de modo quefinalmente puede que se llegue a incluir sólo un 10 % de las publicaciones identificadas), expresar losresultados de los diferentes estudios en una escala común, evaluar la calidad de cada uno de los ensayosincluidos y examinar detalladamente cada uno de los estudios por separado. En términos generales, lamayor parte de las revisiones no ponen en duda la validez de los ensayos clínicos incluidos, y atribuyen lasdiscrepancias a fallos o errores metodológicos en la realización del metaanálisis. En cualquier caso, lo másimportante de los resultados de un metaanálisis no debe ser la magnitud del estimador obtenido, sino ladirección del efecto, la comparabilidad de los estudios incluidos y las posibles razones que expliquen lasdiferencias de resultados entre ellos.En general, los metaanálisis cuidadosamente realizados pueden ofrecer un adelanto de la tendencia delefecto que será observada en ensayos clínicos con una muestra grande de pacientes. Sin embargo, cuandose usa sólo un a de estas dos herramientas metodológicas, cabe preguntarse cuánta incertidumbre debeañadir el lector a la que ya indican los intervalos de confianza.

17. Conclusiones

El metaanálisis debe ser visto como la estructuración del proceso a través del cual se realiza una revisiónde la investigación existente. La exhaustividad de la revisión y el grado de "combinabilidad", que deben serconsiderados en cualquier revisión, se abordan de forma explícita. ¿Fue razonable combinar los ensayosindividuales que componen un metaanálisis? ¿Es el resultado robusto en relación con los cambios en lasasunciones? La conclusión alcanzada, ¿tiene sentido desde el punto de vista clínico y fisiopatológico?

Page 41: Metaanalisis

41

Finalmente, ¿ha contribuido el análisis al proceso de toma de decisiones lógicas en el manejo de lospacientes?

18. Glosario

análisis de sensibilidad (sensitivity analysis): existen diferentes tipos. En la valoración de laheterogeneidad, el análisis de sensibilidad trata de la inclusión/exclusión de estudios específicos. En el usode técnicas estadísticas de combinación, consiste en la repetición del análisis de combinación mediantevarios métodos, para valorar si se alcanzan los mismos resultados y si éstos se alteran por la calidad de losestudios individuales y el sesgo de publicación.calidad de un estudio (study quality): valoración global de un estudio según un protocolo probado yvalidado. Dado que las diferentes escalas de calidad dan resultados divergentes, deben interpretarse conprecaución los análisis basados en una puntuación global de la calidad. Resulta más fácil en los ensayosclínicos que en los estudios de observación. Los evaluadores deberían utilizar procedimientos que losmantuvieran enmascarados con respecto a la información que puede influir en la evaluación.Colaboración Cochrane (Cochrane Collaboration): organización internacional llamada así en honor aArchibald Cochrane y cuyo objetivo es ayudar a los profesionales a adoptar decisiones bien informadassobre la asistencia sanitaria por medio de la preparación, diseminación y actualización continua derevisiones sistemáticas de ensayos clínicos sobre los efectos de las intervenciones sanitarias. Estasrevisiones se publican en la Cochrane Database of Systematic Reviews, disponible en CDROM. Se puedenencontrar más detalles en la siguiente dirección de Internet: www.cochrane.org.combinación (pooling): estimación de una magnitud de efecto resumen (o combinada) tras la agregaciónde las magnitudes de efecto de los estudios individuales.estadístico Q (Q statistic): prueba de la ji al cuadrado para valorar la heterogeneidad de los estudiosincluidos en un metaanálisis, en la que la magnitud del efecto de cada estudio individual se compara con elestimador combinado. Por su validez, potencia estadística y facilidad de cálculo, esta prueba deheterogeneidad es la mejor elección.Glass, Gene V.: psicólogo de la educación que acuñó el término metaanálisis en 1976.gráficos en árbol de Navidad (Christmas tree plots): gráfico que se utiliza para detectarel sesgo de publicación, en el que en el eje de ordenadas se representa el tamaño del estudio (o el errorestándar del parámetro que se pondera en sentido decreciente) y en el de abscisas el parámetro que midela magnitud del efecto. Se traza un eje vertical que pasa por el valor ponderado global. La asimetría conrelación al eje (sobre todo en la parte baja del árbol) indica sesgo de publicación.gráficos en embudo (funnel plots): conjunto de métodos gráficos para representar la existencia de unposible sesgo de publicación. Muestra la relación entre la magnitud del efecto (eje de ordenadas) y eltamaño del estudio (eje de abscisas), que se puede medir de distintas maneras (error estándar de lamagnitud del efecto, su inverso, el tamaño de la muestra o el número de efectos observados). Se dibuja unalínea horizontal que pasa por el valor ponderado global. Si no hay sesgo de publicación aparece la forma deun embudo típico (simetría con relación a la línea dibujada).heterogeneidad (heterogeneity): significa que hay variabilidad estadística entre los estudios que secombinan. Puede proceder de muchas fuentes (más numerosas en los estudios de observación que en losdiseños experimentales): características de la población del estudio (por ejemplo, el riesgo subyacente delefecto o subgrupos diferentes de alto o bajo riesgo), variaciones en el diseño del estudio (tipo de diseño,métodos de selección, fuentes de información, manera de reunir la información), diferentes métodosestadísticos y distintos esquemas de ajuste de los factores de confusión. Dado que las pruebas estadísticasde heterogeneidad tienen poca potencia estadística, se recomienda utilizar como punto de corte una p < 0,1(no 0,05). Si hay heterogeneidad, el estimador ponderado no tiene sentido, ya que ello significa que haymás de una magnitud de efecto verdadera en los estudios que se combinan.homogeneidad (homogeneity): lo opuesto a heterogeneidad.inverso de la varianza (inverse of variance): el tipo más común de ponderación utilizado para combinardiferentes estudios individuales en un estimador ponderado. Se puede aplicar a muchas medidas demagnitud del efecto.magnitud del efecto (effect size): estimador estandarizado no escalar de la relación entreuna exposición y un efecto. En sentido general, este término se aplica a cualquier medida de la diferenciaen el resultado entre los grupos de estudio; de tal manera que el riesgo relativo (relative risk), la razón deodds (odds ratio) y la diferencia de riesgos (risk difference) son «magnitudes de efecto». Cuando lamagnitud del efecto se aplica a mediciones de variables continuas (como la media), su estimador común

Page 42: Metaanalisis

42

más usado es la diferencia media estandarizada, que se calcula como la diferencia de medias dividida por ladesviación estándar. Esto es sobre todo útil cuando no hay una medida común a todos los estudios. metaanálisis (meta-analysis, overview): el prefijo meta (del griego µετα) significa «después de». Se puededefinir como la sistemática identificación, valoración, síntesis y, si es pertinente, la agregación estadística detodos los estudios sobre el mismo tema, siguiendo un método explícito y predeterminado. metaanálisis acumulado (cumulative metaanalysis): tipo de metaanálisis en el que los estudios secombinan secuencialmente mediante la adición cada vez de un estudio nuevo según una variable ordinal.Por ejemplo, si la variable ordinal es el año de publicación, los estudios se ordenarán por ella, y acontinuación se realizará un análisis combinado cada vez que aparezca un estudio. Muestra la evolución delestimador ponderado según la variable ordinal. Otras variables frecuentemente usadas en el metaanálisisacumulado son la calidad del estudio, la frecuencia del efecto en el grupo de referencia, el tamaño de ladiferencia entre los grupos y otras variables (por ejemplo, el tiempo medio transcurrido hasta el tratamiento).Mide la contribución de un nuevo estudio a lo ya existente y también se puede utilizar como procedimientopara explicar la heterogeneidad.metaanálisis cualitativo (qualitative metaanalysis) : parte del metaanálisis que se refiere a la valoración delos métodos utilizados en cada estudio individual. En la actualidad se considera prácticamente sinónimo delconcepto de revisión sistemática.metarregresión (meta-regression): colección de métodos estadísticos (regresión lineal ponderada o no,regresión logística) para valorar la heterogeneidad, en los que la magnitud del efecto se enfrenta a una omás covariables. Es un procedimiento que se puede utilizar cuando el número de estudios no es muyabundante (< 20).método de De Simonian-Laird (DerSimonian- Laird’s method): fue descrito por vez primera por Cochraneen 1954. Fue el primer modelo de efectos aleatorios y se aplicó a un modelo aditivo (diferencia de riesgos),ponderado por el inverso de la varianza.método de Egger (Egger’s method): procedimiento para detectar un sesgo de publicación. Consiste en unaregresión lineal simple de la magnitud del efecto dividida por su error estándar sobre el inverso del errorestándar, en la que se prueba si la ordenada en el origen es estadísticamente significativa con p < 0,1.método de Macaskill, Walter e Irwig (Macaskill et al’s method (58)): es mejor que el método de Egger paradetectar un sesgo de publicación. Se realiza una regresión lineal simple entre la magnitud del efecto y eltamaño del estudio (el clásico funnel plot). Se recomienda ponderar la regresión por el inverso de lavarianza del efecto global observado en cada estudio individual. Se investiga si la pendiente de la recta deregresión es distinta de cero o no. En el caso de estudios experimentales o de cohortes, el efecto es laenfermedad (curación, etc.); en estos casos se suman los efectos observados en los grupos que secomparan y el resultado se divide por el tamaño total del estudio (incidencia acumulada o tasa total).método de Mantel-Haenszel (Mantel-Haenszel’s method): método estadístico de combinación de riesgosrelativos y razón de odds de estudios individuales, que se describió para combinar estratos de un mismoestudio. Hay que conocer la distribución cruda de los datos, por lo que suele ser apropiado para los estudiosexperimentales aleatorizados, pero si los autores de los estudios originales proporcionan la informaciónnecesaria, puede aplicarse a cualquier tipo de estudio.método de Peto (Peto’s method): método estadístico para combinar estudios individuales, derivado delmétodo de Mantel-Haenszel, en el que los efectos observados en el grupo índice se comparan con losesperados, ponderando por la varianza. Debería usarse sólo cuando el tamaño de muestra de las ramas deun estudio es similar y cuando la magnitud de efecto es próxima al valor nulo; en otras situaciones da unresultado sesgado (que es lo más habitual).modelo de efectos aleatorios (random effects model): método de combinación de magnitudes de efectoindividuales en el que la heterogeneidad se incorpora al estimadorresumen mediante la inclusión de un componente de la variabilidad entre los estudios. Supone que lamuestra de estudios incluidos en el análisis se extrae de una población de estudios. Este modelo no suponehomogeneidad en las magnitudes de efecto de los estudios que se combinan; esto es, cada muestra deestudio tiene una verdadera magnitud de efecto. No hay acuerdo sobre si este modelo es más apropiadoque el de efectos fijos para combinar estudios. Se recomienda cuando el número de estudios es pequeño,siempre y cuando no haya sesgo de publicación, ya que es un método que da más importancia a losestudios pequeños.modelo de efectos fijos (fixed effects model): cualquier modelo estadístico en el que se asumehomogeneidad del efecto en los diferentes estudios que se combinan, esto es, en el que la verdaderamagnitud del efecto tiene un valor común y real para todos los estudios. En el estimador ponderado sólo seconsidera la varianza de cada estudio individual.

Page 43: Metaanalisis

43

peso (weighting): la influencia dada a cada estudio individual en el análisis combinado. Hay diferentes tiposde ponderaciones: inverso de la varianza, por la distribución de los datos (Mantel-Haenszel), por la varianzade los casos esperados en la referencia (Peto), etcétera.problema de la extracción de archivos (file drawer problem): término acuñado por Rosenthal parareferirse al número de estudios con resultados no significativos estadísticamente (p > 0,05) que no se hanpublicado. revisión sistemática (systematic review): síntesis de los resultados de varios estudios primarios mediantetécnicas que limitan los sesgos y el error aleatorio. Estas técnicas incluyen la búsqueda de todos losestudios potencialmente relevantes y el uso de criterios explícitos y fiables en la selección de lasinvestigaciones. La revisión sistemática cualitativa resume las investigaciones primarias u originales sincombinación estadística (metaanálisis cualitativo). La revisión sistemática cuantitativa es sinónimo demetaanálisis.sesgo de búsqueda (bias, search): error sistemático introducido cuando la búsqueda se centra en una solabase de datos (normalmente Medline). Las revistas escritas en inglés están más representadas en Medline;además, las revistas de un país (y de países vecinos o de similar idioma o cultura) donde se confecciona labase de datos también están proporcionalmente más representadas. Es recomendable consultar más deuna base de datos, junto con una búsqueda manual de las referencias localizadas en cada estudio.sesgo de idioma (bias, language): error sistemático introducido cuando la búsqueda de estudiospotenciales de un metaanálisis se centra en un solo idioma, en general el inglés. Es posible que losresultados significativos alcanzados en países de habla no inglesa se publiquen más frecuentemente eninglés que en su idioma nativo, por la mayor difusión alcanzada.sesgo de publicación (bias, publication): sesgo introducido cuando los estudios publicados no representanadecuadamente todos los estudios realizados sobre un tema específico. Puede deberse a muchos hechos,aunque el mejor conocido es la tendencia a publicar resultados estadísticamente significativos (p < 0,05) oclínicamente relevantes (magnitud del efecto alta, aunque no significativa). Otras variables que influyen enel sesgo de publicación son el tamaño de muestra (mayor sesgo en estudios pequeños), tipo de diseño(menor en los ensayos clínicos aleatorizados), financiación, conflicto de intereses, prejuicio frente a unaasociación y el patrocinio.

19. Bibliografía

1. Dickersin K, Higgins K, Meinert CL. Identification of meta-analyses. The need for standardterminology. Control Clin Trials. 1990;11(1):52-66.2. Fisher RA. Statistical methods for research workers. 4ª ed. Londres: Oliver and Boyd; 1932.3. Stouffer SA, Suchman EA, DeVinney LC, Star SA, Williams RM. The American soldier: Adjustmentduring army life. Princeton: Princeton University Press; 1949.4. Mosteller F, Bush RR. Selected quantitative techniques. In: Lindsey G, editor. Handbook of socialpsychology. Vol 1. Theory and method. Cambridge: Addison-Wesley; 1954. p. 289-334.5. Smith ML, Glass GV. Meta-analysis of psychotherapy outcome studies. American Psychologist1977;32:752—760.6. Lipsey MW, Wilson DB. Practical meta-analysis. Londres: Sage Publications; 2001.7. Dickersin K, Scherer R, Lefebvre C. Identifying relevant studies for systematic reviews. Bmj.1994;309(6964):1286-91.8. DerSimonian R, Laird N. Meta-analysis in clinical trials. Control Clin Trials. 1986;7(3):177-88.9. Galbraith RF. A note on graphical presentation of estimated odds ratios from several clinical trials.Stat Med. 1988;7(8):889-94.10. L'Abbe KA, Detsky AS, O'Rourke K. Meta-analysis in clinical research. Ann Intern Med.1987;107(2):224-33.11. Silagy C, Ketteridge S. Physician advice for smoking cessation. In: Lancaster T, Silagy C, FullertonD, editors. Tobacco addiction module. The Cochrane Database of Systematic Reviews. Nº 4. (1 Septiembre1997). Oxford: The Cochrane Collaboration. Disponible en Cochrane Library.; 1997.12. Porter AM, McCullough DM. Counselling against cigarette smoking. A controlled study from ageneral practice. Practitioner. 1972;209(253):686-9.13. Russell MA, Wilson C, Taylor C, Baker CD. Effect of general practitioners' advice against smoking.Br Med J. 1979;2(6184):231-5.

Page 44: Metaanalisis

44

14. Wilson D, Wood G, Johnston N, Sicurella J. Randomized clinical trial of supportive follow-up forcigarette smokers in a family practice. Can Med Assoc J. 1982;126(2):127-9.15. Stewart PJ, Rosser WW. The impact of routine advice on smoking cessation from family physicians.Can Med Assoc J. 1982;126(9):1051-4.16. Russell MA, Merriman R, Stapleton J, Taylor W. Effect of nicotine chewing gum as an adjunct togeneral practitioner's advice against smoking. Br Med J (Clin Res Ed). 1983;287(6407):1782-5.17. Jamrozik K, Vessey M, Fowler G, Wald N, Parker G, Van Vunakis H. Controlled trial of three differentantismoking interventions in general practice. Br Med J (Clin Res Ed). 1984;288(6429):1499-503.18. McDowell I, Mothersill KJ, Rosser W, Hartman R. A randomized trial of three approaches tosmoking cessation. Can Fam Phys 1985;31:351-355.19. Page AR, Walters DJ, Schlegel RP, Best JA. Smoking cessation in family practice: the effects ofadvice and nicotine chewing gum prescription. Addict Behav. 1986;11(4):443-6.20. Janz NK, Becker MH, Kirscht JP, Eraker SA, Billi JE, Woolliscroft JO. Evaluation of a minimal-contact smoking cessation intervention in an outpatient setting. Am J Public Health. 1987;77(7):805-9.21. Slama K, Redman S, Perkins J, Reid AL, Sanson-Fisher RW. The effectiveness of two smokingcessation programmes for use in general practice: a randomised clinical trial. Bmj. 1990;300(6741):1707-9.22. Wetter DW, Remington PL, Pezzino G. The smoking continuum in Wisconsin, 1990. Wis Med J.1992;91(4):183, 185-6.23. Demers RY, Neale AV, Adams R, Trembath C, Herman SC. The impact of physicians' brief smokingcessation counseling: a MIRNET study. J Fam Pract. 1990;31(6):625-9.24. Wilson PA. Effectiveness of anti-smoking advice from doctors who smoke. J R Coll Gen Pract.1989;39(326):388.25. Haug K, Fugelli P, Aaro LE, Foss OP. Is smoking intervention in general practice more successfulamong pregnant than non-pregnant women? Fam Pract. 1994;11(2):111-6.26. Higashi A, Ozasa K, Watanabe Y, Hayashi K, Aoike A, Kawai K, et al. [Efficacy of smoking cessationinstruction for general smokers at an annual physical examination]. Nippon Koshu Eisei Zasshi.1995;42(5):313-21.27. Slama K, Karsenty S, Hirsch A. Effectiveness of minimal intervention by general practitioners withtheir smoking patients: a randomised controlled trial in France. Tobacco Control 1995;4:162-169.28. Begg CB, Mazumdar M. Operating characteristics of a rank correlation test for publication bias.Biometrics. 1994;50(4):1088-101.29. Egger M, Davey Smith G, Schneider M, Minder C. Bias in meta-analysis detected by a simple,graphical test. Bmj. 1997;315(7109):629-34.30. Brinton LA, Huggins GR, Lehman HF, Mallin K, Savitz DA, Trapido E, et al. Long-term use of oralcontraceptives and risk of invasive cervical cancer. Int J Cancer. 1986;38(3):339-44.31. Celentano DD, Klassen AC, Weisman CS, Rosenshein NB. The role of contraceptive use in cervicalcancer: the Maryland Cervical Cancer Case-Control Study. Am J Epidemiol. 1987;126(4):592-604.32. Ebeling K, Nischan P, Schindler C. Use of oral contraceptives and risk of invasive cervical cancer inpreviously screened women. Int J Cancer. 1987;39(4):427-30.33. Invasive squamous-cell cervical carcinoma and combined oral contraceptives: results from amultinational study. WHO Collaborative Study of Neoplasia and Steroid Contraceptives. Int J Cancer.1993;55(2):228-36.34. Parazzini F, la Vecchia C, Negri E, Maggi R. Oral contraceptive use and invasive cervical cancer. IntJ Epidemiol. 1990;19(2):259-63.35. Beral V, Hannaford P, Kay C. Oral contraceptive use and malignancies of the genital tract. Resultsfrom the Royal College of General Practitioners' Oral Contraception Study. Lancet. 1988;2(8624):1331-5.36. Brinton LA, Reeves WC, Brenes MM, Herrero R, de Britton RC, Gaitan E, et al. Oral contraceptiveuse and risk of invasive cervical cancer. Int J Epidemiol. 1990;19(1):4-11.37. Kjaer SK, Engholm G, Dahl C, Bock JE, Lynge E, Jensen OM. Case-control study of risk factors forcervical squamous-cell neoplasia in Denmark. III. Role of oral contraceptive use. Cancer Causes Control.1993;4(6):513-9.

Page 45: Metaanalisis

45

38. Daling JR, Madeleine MM, McKnight B, Carter JJ, Wipf GC, Ashley R, et al. The relationship ofhuman papillomavirus-related cervical tumors to cigarette smoking, oral contraceptive use, and prior herpessimplex virus type 2 infection. Cancer Epidemiol Biomarkers Prev. 1996;5(7):541-8.

39. Eluf-Neto J, Booth M, Munoz N, Bosch FX, Meijer CJ, Walboomers JM. Human papillomavirus andinvasive cervical cancer in Brazil. Br J Cancer. 1994;69(1):114-9.40. Schiaffino A, Rodríguez M, Pasarín MI, Regidor E, Borrell C, Fernández E. ¿Odds ratio o razón deproporciones?: Su utilización en estudios transversales. Gac Sanit. [online] [citado 2007-11-20]2003;17(1):51.41. Flanders WD. A new variance estimator for the Mantel-Haenszel odds ratio. Biometrics 1985;41:637-642.42. Robins J, Breslow N, Greenland S. Estimators of the Mantel-Haenszel variance consistent in bothsparse data and large-strata limiting models. Biometrics. 1986;42(2):311-23.43. Cohen J. Statistical power analysis for the behavioral sciences. 2ª ed. Nueva York: Academic Press.;1988.44. Glass GV. Primary, Secondary, and Meta-Analysis of Research. Educational Researcher1976;5(10):3-8.45. Hedge LV. Distribution theory for Glass's estimator of effect size and related estimator. J Ed Stat1981;6:107-128.46. Cohen J. Statistical power analysis for the behavioural sciences. Nueva York: Academic Press;1969.47. Hedges LV, Gurevitch J, Curtis PS. The meta-analysis of response ratios in experimental ecology.Ecology 1999;80:1150-1156.48. Normand SL. Meta-analysis: formulating, evaluating, combining, and reporting. Stat Med.1999;18(3):321-59.49. Sokal RR, Rohlf FJ. Biometry. 3ª ed. San Francisco: Freeman; 1995.50. Hedges LV, Olkin I. Statistical methods for meta-analysis. Nueva York: Academic Press; 1985.51. Greenland S. Quantitative methods in the review of epidemiologic literature. Epidemiologic Reviews1987;9:1-30.52. Gurevitch J, Hedges LV. Statistical isues in ecological meta-analysis. Ecology 1999;80(1142-1149).53. Begg CB, Berlin JA. Publication bias: a problem in interpreting medical data. J Roy Stat Soc, Ser A1988;151:419-463.54. Wang MC, Bushman BJ. Using the normal quantile plot to explore meta-analytic data sets.Psychological Methods 1998;3:46-54.55. Begg CB. Publication bias. In: Cooper H, Hedge LV, editors. The Handbook of research synthesis.Nueva York: Russell Sage Fundation; 1994. p. 399-409.56. Rosenthal R. The "file drawer problem" and tolerance for null results. Psychological Bulletin1979;86:638-641.57. Rosenberg MS. The file-drawer problem revisited: a general weighted method for calculating fail-safenumbers in meta-analysis. Evolution 2005;59(464-468).58. Macaskill P, Walter SD, Irwig L. A comparison of methods to detect publication bias in meta-analysis.Stat Med. 2001;20(4):641-54.

20. Bibliografía adicional

1. Abraira V. Revisiones sistemáticas y metaanálisis. Semergen 2003; 29(4): 183-5.2. Bero L, Rennie D. The Cochrane Collaboration. JAMA 1995; 274: 1935-8.3. Berkey CS, Hoaglin DC, Mosteller F, Colditz GA. A random-effects regression model for meta-analysis.Stat Med 1995; 14: 395-411.4. Boissel J-P, Blanchard J, Panak E, Peyrieux JC, Sacks S. Considerations for the meta-analysis ofrandomised clinical trials. Summary of a panel discussion. Contr Clin Trials 1989; 10: 254-81.

Page 46: Metaanalisis

46

5. Brockwell SE, Gordon IR. A comparison of statistical methods for meta-analysis. Stat Med 2001; 20: 825-40.6. Ceballos C., Córdoba E ,Valdizán JR, García Campayo J, Artal A, Giraldo P. Medicina nuclear basada enla evidencia: 20 años de metaanálisis. Alasbimn Journal 2000; 2(7).http://www.alasbimnjournal.cl/revistas/7/ceballostotal.html7. Colditz GA, Burdick E, Mosteller F. Heterogeneity in meta-analysis of data from epidemiologic studies: acomentary. Am J Epidemiol 1995; 142: 371-82.8. Cook DJ, Mulrow CD, Haynes RB. Systematic reviews: synthesis of best evidence for clinical decisions.Ann Intern Med 1997; 126: 376-80.9. Delgado-Rodríguez M. Glossary on meta-analysis. J Epidemiol Commun Health 2001; 55: 534-6.10. Egger M, Zellweger-Zähner, Schneider M, Junker C, Lengeler C, Antes G. Language bias in randomisedcontrolled trials published in English and German. Lancet 1997; 350: 326-9.11. Escrig-Sos J, Molina Martínez J Interpretación de los resultados de un ensayo clínico o metaanálisis enangiología y cirugía vascular: odds ratios, riesgo relativo, intervalos de confianza y credibilidad. Angiología2007; 59; 3-11.12. Felson DT. Bias in meta-analytic research. J Clin Epidemiol 1992; 45: 885-92.13. Fleiss JL. The statistical basis of meta-analysis. Stat Methods Med Res 1993; 2: 121-45.14. Gibaldi M. Meta-analysis. A review of its place in therapeutic decision-making. Drugs 1993; 46: 805-1815. Greenland S, Salvan A. Bias in the one-step method for pooling study results. Stat Med 1990; 9: 247-52.16. Greenland S. Meta-analysis. En: Rothman KJ, Greenland S, eds.: Modern epidemiology, 2.ª ed. Boston:Lippincott-Raven; 1998, 643-73.17. Guallar E, Banegas JR, Martín-Moreno JM, del Río A. Metaanálisis: su importancia en la toma dedecisiones clínicas en cardiología. Rev Esp Cardiol 1994; 47: 509-1718. Hardy RJ, Thompson SG. A likelihood approach to meta-analysis with random effects. Stat Med1996;15:619-2919. Katerndahl DA, Lawler W R. Variability in meta-analytic results concerning the value of cholesterolreduction in coronary heart disease. A meta-analysis. Am J Epidemiol 1999; 149: 429-41.20. Jenicek M. Méta-analyse in medecine. Québec: Edisem 1987.Jenicek M. Méta-analyse en médecine. Évaluation et synthèse de l’information clinique et épidémiologique.St. Hyacinthe, y Paris: EDISEM y Maloine Éd., 1987.21. Jenicek M. Meta-analysis in medicine: where we are and where we want to go. J Clin Epidemiol 1989;42: 35-44.22. Jüni P, Witschi A, Bloch R, Egger M. The hazards of scoring the quality of clinical trials for meta-analysis.JAMA 1999; 282: 1054-60.23. Leandro G. Meta-analysis. Meta-analysis in medical research : the handbook for the understanding andpractice of meta-analysis. Malden, Mass: BMJ books: Blackwell, 2005.24. Lau J, Schmid CH, Chalmers TC. Cumulative meta-analysis of clinical trials builds evidence forexemplary medical care. J Clin Epidemiol 1995; 48: 45-57.25. Marín-Martínez, F., Sánchez-Meca, J., & Huedo-Medina, T. (2004). El coste de la dicotomización enmeta-análisis [The cost of dichotomizing in meta-analysis]. Metodología de las Ciencias delComportamiento, Volumen Especial, 367-375. 26. Molinero LM. Metaanálisis: claves para interpretar una herramienta de investigación controvertida.Hipertensión 2001; 18: 232-40.27. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving the quality of reports of meta-analysis of randomised controlled trials: the QUOROM statement. Lancet 1999; 354: 1896-900.28. Pértega Díaz S, Pita Fernández S. Revisiones sistemáticas y metaanálisis. Cad Aten Primaria 2005; 12:109-12.29. Petitti DB. Meta-analysis, decision analysis and cost-effectiveness analysis. Methods for quantitativesynthesis in medicine. New York: Oxford University Press, 1994.30. Ruano-Ravina A, Figueiras A, Barros-Dios JM. El metaanálisis a debate. Med Clin (Barc) 2002; 119:439.31. Sánchez-Meca J, Marin-Martínez F y Huedo-Medina T. Modelo de efectos fijos y modelo de efectosaleatorios. En Matías JLR, Tobias A, Seoane T, eds.: Revisiones sistemáticas en ciencias de la vida.Toledo: FISCAN, 2006; 189-204

Page 47: Metaanalisis

47

32. Sánchez-Meca J, Marín-Martínez F. Testing significance of a common risk difference in meta-analysis.Com Stats Data Anal 2000; 33: 299-313.33. Sánchez-Meca J, Marín-Martínez F. Meta-analysis of 2x2 tables: Estimating a common risk difference.Ed Psychol Measurement 2001; 61: 249-7634. Sutton AJ, Abrams KR, Jones DR, Sheldon TA, Song F. Methods for meta-analysis in medical research.New York: Wiley, 2000.35. Takkouche B, Cadarso-Suárez C, Spiegelman D. Evaluation of old and new tests of heterogeneity inepidemiologic meta-analysis. Am J Epidemiol 1999; 150: 206-15.36.Tang JL, Liu JL. Misleading funnel plot for detection of bias in meta-analysis. J Clin Epidemiol 2000; 53:477-84.37. Teagarden JR. Meta-analysis: whither narrative review? Pharmacotherapy 1989; 9: 274-81.38 Thompson SG, Sharp SJ. Explaining heterogeneity in meta-analysis: a comparison of methods. Stat Med1999; 18: 2693-708.39. Thornton A, Lee P. Publication bias in meta-analysis: its causes and consequences. J Clin Epidemiol2000; 53: 207-16.40. www.icf.uab.es/llibre/pdf/cap-6.pdf41. www.prematuros.cl/webmarzo06/metaanalisis/metaanalisis_revisionsistematica.htm42. http://www.seh-lelha.org/pdf/metaanalisis.pdf43. http://mural.uv.es/safu/preventiva/Tema%2018.htm44. www.iambe.org.ar45. http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/11-Ayuda%20Meta-an%E1lisis.pdf