U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de...

63
DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I U9 Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! © Centro de Estudios Colegiales Colegio Oficial de Médicos de Barcelona 1 U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE RESULTADOS: DESARROLLE SU TEORÍA Y ... ¡PRUÉBELA! Albert Cobos: Doctor en Medicina. MSc Estadística Aplicada. Profesor de Bioestadística. Departamento de Salud Pública. Facultad de Medicina. Universidad de Barcelona 1. INTRODUCCIÓN En esta unidad hablaremos de muchas cosas, todas ellas muy importantes. En primer lugar, hablaremos de distintos tipos de estudios o diseños frecuentemente utilizados en investigación médica. En segundo lugar, veremos algunos ejemplos de aplicación de las dos herramientas básicas de inferencia que hemos tratado en unidades anteriores: las pruebas de hipótesis y los intervalos de confianza. Aunque introduciremos algunas de las pruebas más comúnmente utilizadas y de los parámetros más usualmente estimados, es importante tener en cuenta que lo presentado aquí no tiene pretensión de ser completo en ningún sentido. Hay muchas más pruebas y parámetros de potencial interés que los que hemos ilustrado en esta unidad. Posteriormente, discutiremos brevemente los argumentos en los que se basa la inferencia estadística (tanto las pruebas de hipótesis como los intervalos de confianza), y las limitaciones de dichos argumentos. Por último, consideraremos una importante limitación de la inferencia estadística que se conoce como el problema de la multiplicidad. En relación con esta limitación y sus implicaciones, hablaremos, finalmente, de la diferencia entre dos actitudes con las que se puede abordar un ejercicio de inferencia: confirmatoria o exploratoria. Al presentar los ejemplos de aplicación de pruebas de hipótesis (y de estimaciones por intervalo), lo hemos hecho escuetamente y acercándonos al modo en que se procede en la práctica: utilizando un paquete estadístico -en nuestro caso, StatCrunch- para obtener un p-value (o un intervalo de confianza). La conclusión de cualquier prueba de hipótesis puede establecerse a partir del p-value y, para interpretar la conclusión, basta conocer cuáles son y qué significan las hipótesis nula y alternativa relevantes. Una exposición detallada de la forma en que se resuelve cada prueba requeriría mayor extensión de la que sería razonable dedicar a una unidad de este curso. Para cada prueba, habría que definir el estadístico en que se basa la prueba, justificar la distribución muestral de dicho estadístico bajo la

Transcript of U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de...

Page 1: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 1

U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE RESULTADOS: DESARROLLE SU TEORÍA Y ... ¡PRUÉBELA!

Albert Cobos: Doctor en Medicina. MSc Estadística Aplicada. Profesor de Bioestadística. Departamento de Salud Pública. Facultad de Medicina. Universidad de Barcelona

1. INTRODUCCIÓN

En esta unidad hablaremos de muchas cosas, todas ellas muy importantes.

En primer lugar, hablaremos de distintos tipos de estudios o diseños frecuentemente utilizados en investigación médica.

En segundo lugar, veremos algunos ejemplos de aplicación de las dos herramientas básicas de inferencia que hemos tratado en unidades anteriores: las pruebas de hipótesis y los intervalos de confianza. Aunque introduciremos algunas de las pruebas más comúnmente utilizadas y de los parámetros más usualmente estimados, es importante tener en cuenta que lo presentado aquí no tiene pretensión de ser completo en ningún sentido. Hay muchas más pruebas y parámetros de potencial interés que los que hemos ilustrado en esta unidad.

Posteriormente, discutiremos brevemente los argumentos en los que se basa la inferencia estadística (tanto las pruebas de hipótesis como los intervalos de confianza), y las limitaciones de dichos argumentos.

Por último, consideraremos una importante limitación de la inferencia estadística que se conoce como el problema de la multiplicidad. En relación con esta limitación y sus implicaciones, hablaremos, finalmente, de la diferencia entre dos actitudes con las que se puede abordar un ejercicio de inferencia: confirmatoria o exploratoria.

Al presentar los ejemplos de aplicación de pruebas de hipótesis (y de estimaciones por intervalo), lo hemos hecho escuetamente y acercándonos al modo en que se procede en la práctica: utilizando un paquete estadístico -en nuestro caso, StatCrunch- para obtener un p-value (o un intervalo de confianza). La conclusión de cualquier prueba de hipótesis puede establecerse a partir del p-value y, para interpretar la conclusión, basta conocer cuáles son y qué significan las hipótesis nula y alternativa relevantes.

Una exposición detallada de la forma en que se resuelve cada prueba requeriría mayor extensión de la que sería razonable dedicar a una unidad de este curso. Para cada prueba, habría que definir el estadístico en que se basa la prueba, justificar la distribución muestral de dicho estadístico bajo la

Page 2: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 2

hipótesis nula (¡que no siempre es Normal o Binomial!) y definir la región crítica sobre esta distribución muestral.

Entiéndase, pues, que lo presentado aquí son meros ejemplos de aplicación de análisis inferenciales, pero que no nos hemos detenido a explicar ni las mecánicas de resolución o de cálculo, ni las argumentaciones lógicas en que se basa cada uno de estos análisis.

La mecánica de resolución no es muy importante: los ordenadores están para algo. La argumentación lógica en que se basa lo que hacemos sí es importante, porque sólo entendiéndola podremos juzgar si lo que hacemos es razonable o no. En este punto, debemos remitir al alumno a las unidades 7 y 8 anteriores, en que se presentaron con detenimiento las argumentaciones en que se basa toda estimación por intervalo y toda prueba de hipótesis.

Page 3: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 3

2. DISEÑO DE ESTUDIOS

En investigación médica se utiliza una gran variedad de diseños, por lo que cualquier intento de clasificación corre el riesgo de ser incompleto. Sin embargo, algunos diseños son particularmente frecuentes y conviene conocerlos, ni que sea superficialmente. Los diseños de los que hablaremos se resumen en el esquema 9.1.

En primer lugar, cabe distinguir los diseños comparativos de los no comparativos. Esta clasificación atiende al propósito del estudio. En el primer caso, el objetivo es comparar dos condiciones (por ejemplo dos tratamientos, o dos conjuntos de individuos que difieren por alguna característica como la exposición o no exposición a un factor de riesgo. En el segundo caso, no existe un propósito explícito de realizar comparaciones.

Los dos diseños no comparativos más frecuentes son los estudios transversales y los estudios de cohorte única. En los estudios transversales, cada individuo se observa en una única ocasión, sin realizar un seguimiento a lo largo del tiempo (figura 9.2a). En los estudios de cohorte única, se selecciona un conjunto de individuos (cohorte) y se observa su evolución a lo largo del tiempo (figura 9.2b).

En cuanto a los diseños comparativos, cabe distinguir al menos tres tipos: los estudios de cohortes concurrentes, los estudios de casos y controles y los experimentos. La comparación no es más que un recurso para investigar una posible relación causal: se comparan sujetos en los que la hipotética causa esta presente con otros en que no lo está y se verifica si cierto resultado (la consecuencia) difiere entre ambos grupos de sujetos.

A veces, la hipótesis de relación causal que queremos investigar implica consecuencias deseables. Éste es el caso de las hipótesis sobre la eficacia de un tratamiento (T). Si es así, podemos plantearnos un experimento, es decir, un diseño en que se manipula la causa: el investigador determina (aleatoriamente) en qué sujetos estará presente la hipotética causa (T) y en cuáles no (placebo). Esto es lo que se hace en los ensayos clínicos aleatorizados (ECA). El ECA es el diseño preferible cuando la hipotética causa es manipulable (figura 9.2c).

En otras ocasiones la hipótesis de relación causal que queremos investigar implica consecuencias indeseables. Éste es el caso cuando queremos investigar factores de riesgo (FR). Evidentemente, no es planteable la manipulación del FR (¡fume usted, que voy a ver si desarrolla una neo de pulmón!). Por ello, el investigador se limitará a observar sujetos que, de una forma espontánea, están sometidos o no al FR, con objeto de investigar posibles diferencias en la aparición de la consecuencia indeseable.

Page 4: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 4

Se abren entonces dos posibilidades muy diferentes. La primera posibilidad es seleccionar dos cohortes de sujetos definidas por la exposición o no exposición al FR y observarlos prospectivamente durante un periodo de tiempo para ver si aparece o no la enfermedad. Esto constituye un estudio de cohortes concurrentes (figura 9.2d).

La segunda posibilidad es seleccionar los sujetos, no por la causa, sino por la consecuencia. Esto consiste en seleccionar sujetos enfermos o casos y sujetos no enfermos o controles, e investigar retrospectivamente la exposición al FR. Esto constituye un estudio de casos y controles (figura 9.2e).

En las siguientes secciones veremos algunos ejemplos e ilustraremos cómo se puede utilizar las PDH y los IC para analizar e interpretar los datos en todos estos diseños.

Page 5: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 5

3. DISEÑOS TRANSVERSALES

Como ya se ha dicho, los estudios transversales se caracterizan porque los individuos se observan en una única ocasión sin realizar un seguimiento a lo largo del tiempo. Un ejemplo paradigmático de diseño transversal es la encuesta epidemiológica de base poblacional. Estas encuestas permiten estimar la prevalencia de enfermedades, de estilos de vida, de exposición a factores de riesgo o, en general, de cualquier característica de los individuos. En la unidad 7 se introdujo un ejemplo de encuesta epidemiológica realizada sobre una muestra aleatoria de la población de Cataluña para estimar la prevalencia del tabaquismo.

Aunque la estimación de prevalencias (y de otros parámetros poblacionales) es un objetivo habitual y a menudo fundamental de los estudios transversales, en estos estudios se puede también analizar relaciones entre variables. Veamos un ejemplo.

Page 6: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 6

3.1 ESTUDIO DE RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS

Supongamos que en una encuesta realizada sobre una muestra aleatoria de una población, se registran los datos de edad y de talla que mostramos en la figura 5.4. El coeficiente de correlación de Pearson calculado con los datos muestrales es -0,25 sugiriendo una débil relación inversa.

Al tratarse de una muestra aleatoria, podría haber sucedido lo que se ilustra en la figura 9.3a. Alternativamente, lo que observamos en la muestra podría reflejar la existencia de una relación entre la edad y la talla en la población, como se ilustra en la figura 9.3b.

Estas dos posibles explicaciones se representan en las siguientes hipótesis en

las que (rho) representa el coeficiente de correlación poblacional:

H0: = 0 independencia lineal entre la edad y la talla (en la población)

H1: 0 relación lineal entre la edad y la talla (en la población)

Para resolver la prueba de hipótesis necesitamos conocer la probabilidad de que, si H0 es cierta, al extraer una muestra aleatoria el valor absoluto de r sea 0,25 o mayor. Podemos obtener esta probabilidad mediante la opción de StatCrunch Stat>Summary stats>Correlation, escogiendo las variables peso y talla (en cualquier orden) y marcando la casilla del siguiente diálogo (Display two-sided P-values from sig.test)”. En el output se muestra el valor de r y entre paréntesis el grado de significación p, que es exactamente la probabilidad que buscamos.

Dicho valor es p=3,0E-5 = 0,00003 y esta es la probabilidad de que, si la H0 anterior es cierta, al extraer una muestra aleatoria obtengamos un valor de r como el observado o todavía más extremo. Como esta probabilidad es muy pequeña (p=0,00003), rechazamos la H0 de independencia y concluimos que existe una relación (inversa) entre la edad y la talla.

Aunque no hay un modo sencillo de obtenerlo con StatCrunch, podríamos

calcular el IC(95%) de . Este IC se extiende desde –0,363 hasta –0,130, por lo que podemos afirmar, con una confianza del 95%, que el valor del coeficiente

de correlación poblacional () está comprendido entre estos dos valores. Nótese que el IC(95%) excluye el cero, resultado que es consistente con el obtenido en la prueba de independencia anterior.

Tanto la prueba de hipótesis como la estimación por intervalo de un coeficiente de correlación poblacional pueden afectarse por la presencia de observaciones atípicas. Tal como se ha recomendado en unidades anteriores, es muy importante descartar esta eventualidad visualizando un diagrama de dispersión antes de abordar estos análisis.

Page 7: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 7

Si se detectan casos muy atípicos que distorsionen el coeficiente de correlación (particularmente probable con un tamaño muestral limitado) puede ser conveniente utilizar otros método (p.ej., coeficiente de correlación no paramétrico de Spearman) que, por limitaciones de extensión, no se presenta este curso.

Page 8: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 8

3.2 ESTUDIO DE RELACIÓN ENTRE VARIABLES CUALITATIVAS

Los datos que muestra la tabla 9.4a sobre la ocupación y el sexo se obtuvieron en una encuesta de salud realizada en 1994 sobre una muestra aleatoria de la población Catalana. ¿Existe (en la población de Cataluña) una relación entre el sexo y la ocupación?

Para responder a esta pregunta planteamos una prueba en que H0 representa la independencia a nivel poblacional y H1 representa la no independencia o relación. Para resolver la prueba podemos utilizar la opción Stat>Contingency table de StatCrunch. Tras introducir los datos de la tabla 9.4a, obtendremos un resultado análogo al de la figura 9.4b.

El valor del estadístico chi-cuadrado es de 239,6. Para una tabla con 7 x 2 casillas, este valor es demasiado grande como para ser debido exclusivamente a las fluctuaciones del azar en el muestreo. La probabilidad de obtener este valor (o uno más extremo) es lo que indica el Pval(ue). En este caso, es tan pequeña que StatCrunch la considera nula y la redondea a 0. Por lo tanto, rechazamos la hipótesis nula de independencia y concluimos que existe relación entre el sexo y la ocupación.

Para ayudar a interpretar en qué consiste esta relación, es útil calcular los llamados residuales de cada casilla, es decir, la diferencia entre el número de casos observados en la casilla y los esperados bajo la hipótesis de independencia (H0). StatCrunch no facilita los residuales, pero su cálculo es muy sencillo y lo mostramos en la figura 9.4c. Nótese que las mujeres están infrarepresentadas en los grupos 1 a 4a y sobrerepresentadas en los restantes grupos de ocupación.

La prueba de hipótesis presentada requiere que las frecuencias esperadas en cada casilla no sean muy pequeñas (mayores que 5 o que 10, según los autores). Si en alguna casilla las frecuencias esperadas son pequeñas, se puede optar por agregar categorías (filas o columnas) antes de realizar la prueba.

Cuando se evalúa la probabilidad de obtener un determinado valor en el estadístico chi-cuadrado bajo la hipótesis nula de independencia, hay que tener en cuenta el número de casillas de la tabla de contingencia. Si revisa la fórmula del estadístico chi-cuadrado que ofrecimos en la figura 5.19 verá que se construye sumando, para cada casilla, la diferencia entre los casos observados y esperados (elevada al cuadrado) dividida por los esperados. Por tanto, el valor del estadístico chi-cuadrado tenderá a ser más elevado cuantas más casillas tenga una tabla, por el mero hecho de que habrá más sumandos.

Por otra parte, en cualquier tabla de contingencia, la diferencia entre el número de casos (tanto observados como esperados) en la casillas de la última fila y de la última columna depende de los casos que haya en el resto de las casillas,

Page 9: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 9

puesto que deben preservarse los marginales de la tabla (totales de fila y de columna).

Por esta razón, si una tabla tiene F filas y C columnas, el valor del estadístico chi-cuadrado se evalúa teniendo en cuenta que está compuesto por (F-1)x(C-1) casillas independientes. En este caso (F-1)x(C-1) = (7-1)x(2-1) = 6. Se dice que el estadístico chi-cuadrado calculado en esta tabla tiene 6 grados de libertad, y esto se indica con las siglas DF (Degrees of Freedom) en el resultado que ofrece StatCrunch.

Page 10: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 10

4. DISEÑOS DE COHORTE ÚNICA

En un estudio de cohorte única puede interesar describir la evolución de los sujetos. Frecuentemente la descripción se hará en términos de la proporción de sujetos que, al finalizar el seguimiento, presentan cierta característica (p.ej., complicación). Dicha proporción puede estimarse por intervalo utilizando los métodos presentados en la unidad 7.

En estos diseños también es posible analizar relaciones entre variables, tal como se ilustró en la figura 9.2b. Por ejemplo, en una cohorte de pacientes neoplásicos se podría analizar la relación entre el tiempo de evolución y el tamaño del tumor, o entre el estadío en el momento del diagnóstico y la supervivencia (vivo o muerto) a los 5 años. Para ello, podríamos utilizar los mismos procedimientos de análisis presentados en relación con los diseños transversales, por lo que detendremos aquí la discusión del análisis de diseños de cohorte única.

Page 11: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 11

5. DISEÑOS DE COHORTES CONCURRENTES

Como se ha sugerido en la figura 9.2d, estos diseños suelen utilizarse para estudiar si una enfermedad o complicación aparece con igual frecuencia o probabilidad en dos cohortes definidas por la exposición a un factor de riesgo. En otros casos, las cohortes pueden estar definidas por la exposición a distintos tratamientos o condiciones.

En realidad, lo que define las cohortes es poco relevante. Lo distintivo de un diseño de cohortes concurrentes es que el muestreo se realiza seleccionando a los sujetos por la causa (sea un factor de riesgo, sea un tratamiento) y se compara la consecuencia o resultado entre las cohortes.

Cabe que esta consecuencia o resultado se evalúe mediante una variable cualitativa dicotómica (enfermo/no enfermo, éxito/fracaso) o mediante una variable cuantitativa. El tipo de análisis dependerá de ello. Nos ocuparemos de ambas posibilidades en las siguientes secciones.

5.1 Comparación de variables cualitativas

La tabla 9.5a muestra los resultados de un estudio en que se quiso comparar la cumplimentación del tratamiento antituberculoso cuando se administra bajo supervisión directa (S) y cuando se la autoadministra el propio paciente (A).

Para estudiar esta cuestión, se puede plantear una prueba de comparación de proporciones, con las siguientes hipótesis nula y alternativa, en que P indica la probabilidad o de completar el tratamiento al cabo de un año, y el subíndice indica la forma de administrar el tratamiento:

H0: PS = PA

H1: PS PA

Esta prueba puede resolverse mediante la opción Stat>Proportions>Two Sample>Use summary data! de StatCrunch. Para ello habrá que introducir los datos y escoger las opciones en las subpantallas que aparecerán, tal como se indica en la figura 9.5b.

El resultado que obtendremos se muestra en la figura 9.5c. El p-value es muy inferior a 0,05 y por lo tanto rechazamos la hipótesis nula de igualad de proporciones.

Sería interesante estimar por intervalo la diferencia de probabilidades entre los dos tratamientos. Podemos hacerlo fácilmente mediante la misma opción de StatCrunch que acabamos de utilizar para resolver la prueba de hipótesis

Page 12: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 12

(Stat>Proportions>Two Sample). Bastará que, tras introducir los datos, escojamos las opciones adecuadas tal como se indica en la figura 9.5d.

El resultado obtenido se muestra en la figura 9.5e. La diferencia de proporciones se estima en 0,2486 con un IC(95%) que se extiende desde 0,1396 hasta 0,3575. Nótese que excluye al cero, resultado que es consistente con el rechazo de la hipótesis nula en la prueba de comparación de proporciones realizada anteriormente.

Tanto la prueba de comparación de proporciones como la estimación por intervalo que acabamos de presentar pueden producir resultados indebidos cuando las proporciones (P) son muy extremas (demasiado bajas o demasiado elevadas) y el tamaño muestral (N) de las cohortes es limitado.

En realidad, estos análisis son fiables cuando, en ambas cohortes, los productos N x P y N x (1-P) son mayores que 5 (ó 10, según autores). En caso contrario habrá que utilizar otro tipo de pruebas (como la prueba exacta de Fisher) y de procedimientos de estimación que no tienen esta limitación pero que no presentaremos aquí.

La diferencia de proporciones, a veces llamada diferencia de riesgos es una de las muchas medidas que se pueden utilizar para caracterizar el efecto diferencial en dos grupos (aunque en este caso es poco adecuado hablar de 'riesgo'), cuando el resultado se evalúa mediante una variable dicotómica (figura 9.6a). Si bien StatCrunch no las contempla, hay otras posibilidades que vale la pena conocer.

Una forma interesante de expresar el resultado es mediante el número de casos que es necesario tratar (NNT) con la opción que consigue mejores resultados para poder obtener un éxito que no se hubiera conseguido con la opción alternativa. Esta medida no es más que la inversa de la diferencia de riesgos (figura 9.6b).

Alternativamente, podríamos expresar el resultado en términos de riesgo relativo, que no es más que un cociente de proporciones, (véase tabla 9.6c) o mediante la diferencia de riesgos relativa (figura 9.6d).

Por último, también podríamos expresar el resultado mediante un Odds Ratio, cuyas propiedades se comentaron ya en unidades anteriores y se recuerdan en la figura 9.6e.

5.2 Comparación de variables cuantitativas

Cuando lo que se ha de comparar entre las cohortes es la distribución de una variable cuantitativa, podemos atender a distintos aspectos de la distribución. Por ejemplo, podríamos probar si las dos distribuciones tienen la misma forma, o la misma dispersión, o la misma mediana, o la misma media.

Page 13: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 13

En general, cualquier diferencia entre las distribuciones es de potencial interés, pero no existe una única prueba de hipótesis que permita detectar (en condiciones óptimas) cualquier tipo de diferencia entre las distribuciones. La aproximación utilizada con mayor frecuencia (quizás con demasiada frecuencia) es la de comparar las medias y por esto nos centraremos en ella.

En la figura 9.7a se muestran datos de consumo energético correspondientes a dos grupos de mujeres (obesas y delgadas). Para comparar las medias de

ambas distribuciones, se plantean las siguientes hipótesis, en las que simboliza la media en la población origen de las cohortes:

H0: 1 = 2

H1: 1 2

Para concluir acerca de las hipótesis anteriores se puede utilizar una prueba que se basa en un estadístico denominado t de Student y que se puede realizar con la opción Stat>T statistics>Two sample de StatCrunch, indicando las variables que queremos comparar, tal como se muestra en la figura 9.7b.

La diferencia de medias entre los dos grupos es -2,23, y el p-value obtenido es 0,0008 (véase la figura 9.7c). Esto significa que si la hipótesis nula es cierta, la probabilidad de observar una diferencia entre las medias muestrales como la observada (o más extrema), es 0,0008. Puesto que este valor es muy inferior a 0,05 rechazamos la hipótesis de igualdad de medias.

Tendrá interés estimar por intervalo la diferencia de medias poblacionales. La misma opción Stat>T statistics>Two sample de StatCrunch permite hacerlo, seleccionando la opción Confidence Interval después de seleccionar las variables (¡pruébelo!). La estimación puntual de esta diferencia es 2,23 y si IC del 95% se extiende desde 1,05 hasta 3,41. Nótese que el resultado es consistente con la conclusión de la prueba de comparación de medias realizada anteriormente, porque el IC excluye el cero.

Tanto la prueba de hipótesis como la estimación por intervalo se basan en la suposición de que las distribuciones cuyas medias se comparan son Normales y homocedásticas (con igual dispersión). Nótese que, si la suposición es cierta, demostrar una diferencia entre las medias implica demostrar que (todos los cuantiles de) una de las distribuciones está desplazada respecto de la otra.

Estas suposiciones pueden evaluarse calculando medidas de dispersión, inspeccionando dot-plots, box-plots, y otro gráfico que podemos obtener con la opción Graphics>QQ-plot de StatCrunch, que permite evaluar la Normalidad: si las distribuciones son aproximadamente Normales, los puntos deben situarse a lo largo de la diagonal (figura 9.7d). En este caso, no se aprecian asimetrías ni heterocedasticidad marcadas, y los QQ-plots no muestran un patrón muy alejado de una distribución Normal, con lo que no hay problema en utilizar los análisis basados en la t de Student.

Page 14: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 14

Cuando los datos se apartan mucho de la Normalidad o son muy heterocedásticos hay dos posibilidades. Una de ellas es intentar transformarlos para que se aproximen a las condiciones ideales de Normalidad y homocedasticidad. Por ejemplo, la transformación logarítmica puede ser útil cuando la asimetría es positiva (distribución alargada hacia valores elevados) y la variabilidad es mayor en la distribución que tiene mayor media, como ocurre con los datos del ejercicio 3.2 (figura 9.8a).

Si la transformación consigue su propósito (véase la figura 9.8b), llevaremos a cabo el análisis con los datos transformados (p.ej., el logaritmo de la variable original), y tendremos esto muy presente al interpretar los resultados.

La segunda alternativa es utilizar otro tipo de pruebas que no requieren suposiciones, como las llamadas pruebas no-paramétricas.

Page 15: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 15

6. DISEÑOS DE CASOS Y CONTROLES

En los diseños de casos y controles (figura 9.2e), el hecho de que el muestreo se haga seleccionando por la consecuencia tiene unas implicaciones muy importantes en el análisis. De todas las medidas comparativas de las que hablamos en relación con los diseños de cohortes, sólo puede utilizarse el Odds Ratio.

El motivo es que las demás medidas son combinaciones de la proporción de pacientes que desarrollan la consecuencia (enfermedad) en los grupos definidos por la causa (factor de riesgo). Estas proporciones no pueden estimarse en un diseño de casos y controles, porque dependen del número de unos y de otros que hayamos decidido seleccionar, tal como se ilustra en la figura 9.9.

Aunque no es posible hacerlo mediante StatCrunch, existen métodos para hacer análisis basados en el OR, como por ejemplo estimarlo por intervalo. El IC(95%) puede utilizarse para someter a prueba la hipótesis nula de que el OR poblacional es 1 (que significa independencia): basta verificar si el IC(95%) incluye o excluye dicho valor. Si lo incluye, es que los datos son compatibles con la hipótesis nula. Si lo excluye, podemos rechazar dicha hipótesis y concluir que hay relación entre el factor y la enfermedad.

Al final de esta unidad se ofrecen links a calculadoras estadísticas en Web que permiten obtener el IC de un OR.

Page 16: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 16

7. DISEÑOS EXPERIMENTALES: ENSAYOS CLÍNICOS ALEATORIZADOS

En un ECA, se selecciona una muestra de pacientes con la enfermedad problema y dicha muestra se asigna aleatoriamente a distintas condiciones experimentales. Existen muchos diseños posibles, pero sólo presentaremos el diseño de dos grupos paralelos que es, con mucho, el más frecuente.

En un diseño paralelo, los pacientes se asignan aleatoriamente a uno de dos tratamientos o condiciones experimentales. Puede tratarse de dos tratamientos farmacológicos activos, de un activo y un placebo, de un tratamiento quirúrgico y uno médico, o en general, de cualquier par de condiciones experimentales que se quieran comparar.

Es importante distinguir la asignación aleatoria o aleatorización de los tratamientos en un ECA, de la selección de una muestra aleatoria a partir de una población. Aunque en los dos casos se usa el término aleatorio, se trata de cosas diferentes.

Como ya se comentó en la unidad 7, la selección de una muestra aleatoria a partir de una población consiste en seleccionar a los individuos de forma que todos los integrantes de la población tengan igual probabilidad de ser escogidos.

En un ensayo clínico paralelo que compare dos tratamientos (A y B), habrá que asignar algunos individuos a A y otros a B. La asignación puede hacerse por procedimientos muy diversos. Por ejemplo, podríamos asignar los nacidos en día par al grupo A y los nacidos en día impar al grupo B.

Como muchos otros, este procedimiento puede parecer inofensivo, en el sentido de que no favorece a ninguno de los tratamientos. Sin embargo no es aleatorio. El término de asignación aleatoria tiene una definición precisa y es la siguiente:

Un procedimiento de asignación es aleatorio si todos los integrantes de la muestra (los pacientes incluidos en el ensayo) tienen las mismas probabilidades de ser asignados a uno u otro grupo.

Nótese que la probabilidad de ser asignado a un grupo u otro no tiene por qué ser igual. Puede interesar que, de un total de 45 pacientes, 30 sean tratados con la opción A y 15 con la opción B. En tal caso, la probabilidad de asignación al grupo A será doble que la de asignación al B. Pero esto debe ser así para todos los integrantes de la muestra.

Si se utiliza un procedimiento de asignación aleatorio, el tratamiento asignado a un paciente es completamente independiente de cualquier característica de ese paciente. Si se utiliza un procedimiento no aleatorio, puede tener

Page 17: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 17

apariencia inofensiva o neutral pero nunca podremos garantizar esta neutralidad.

En cuanto al análisis de un ECA, sirve todo lo que hemos visto en relación con los diseños de cohortes concurrentes, siempre que la unidad de asignación haya sido el paciente, es decir, la asignación se haya hecho paciente a paciente, que es lo más habitual.

En definitiva, en ambos diseños se compara dos conjuntos de individuos. La diferencia estriba en que, en el ECA, estos conjuntos se han generado al azar y (si la aleatorización se llevado a cabo correctamente) ello garantiza que no se habrán derivado sistemáticamente los casos con mejor o con peor pronóstico a uno de los grupos, mientras que en los diseños de cohortes concurrentes no tendremos estas garantías.

Page 18: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 18

8. INFERENCIA BASADA EN MODELO

Desde que comenzamos a hablar de los distintos diseños, venimos esquivando (expresamente) una cuestión muy peliaguda. Se trata de los argumentos que justifican la inferencia estadística (pruebas de hipótesis o intervalos de confianza) cuando se utilizan muestras de conveniencia, caso nada infrecuente.

Tal como dijimos en la unidad 7, la inferencia estadística se justifica por el muestreo aleatorio. Por ejemplo, el argumento en que se basa la prueba de comparación de proporciones presentada en relación con los diseños de cohortes concurrentes es el siguiente:

1. Si en una población tratada con S la proporción de éxitos es PS, bajo ciertas condiciones, la proporción de éxitos observada en muestras aleatorias de tamaño NS tendrá una distribución muestral que seguirá un modelo Normal, de media PS y varianza PS (1- PS)/NS.

2. Si en una población tratada con A la proporción de éxitos es PA, bajo ciertas condiciones, la proporción de éxitos observada en muestras aleatorias de tamaño NA tendrá una distribución muestral que seguirá un modelo Normal, de media PA y varianza PA (1- PA)/NA.

3. Si extrajéramos pares de muestras aleatorias, una de cada una de las poblaciones anteriores, y calculáramos la diferencia entre las proporciones observadas en las muestras (d = pmS - pmA), entonces, la distribución muestral de esta diferencia seguiría un modelo Normal de media PS - PA y de varianza [PS(1-PS)/NS]+[PA(1- PA)/NA].

4. Bajo la hipótesis nula de que PS = PA (o lo que es lo mismo PS - PA = 0), la distribución muestral de las diferencias (d) quedaría definida tal como se muestra en la figura 9.10. Sobre ella se puede demarcar una región crítica de tamaño alfa 0,05 y rechazar la hipótesis nula si la diferencia d observada en nuestro estudio cae en la región crítica.

Todos los métodos inferenciales que se han presentado en este curso y, más generalmente, los que se exponen en la mayoría de textos de estadística, se basan en el concepto de distribución muestral de un estadístico, es decir, la distribución de un estadístico a través de distintas muestras aleatorias.

En todos los casos, se supone que, bajo ciertas condiciones, la distribución muestral del estadístico sigue un determinado modelo de distribución de probabilidad conocido. Ese modelo se utiliza para derivar métodos de estimación por intervalo y de resolución de pruebas de hipótesis sobre los parámetros del modelo, tal como se hizo en las unidades 7 y 8. De ahí que este tipo de inferencia se denomine inferencia basada en modelos.

Page 19: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 19

Desde luego, la inferencia basada en modelos (y por lo tanto, basada en la suposición de muestreo aleatorio) puede utilizarse sin limitaciones cuando se trabaja con muestras aleatorias, como en el caso de las encuestas de salud de base poblacional. Sin embargo, en muchos estudios se utilizan muestras de conveniencia. ¿Cómo entonces podemos aplicar métodos de análisis que se basan en la suposición de que la muestra es aleatoria, si esta suposición no se cumple?

Cuando trabajamos con muestras de conveniencia, no sólo los métodos de inferencia se justifican con dificultad, sino que es muy difícil (si no imposible) precisar a qué población hace referencia el parámetro por el que nos interesamos. Por ejemplo, cuando estimamos por intervalo una proporción, estamos estimando una proporción poblacional, pero ¿de qué población se trata? ¿Cuál es la población de inferencia? La respuesta no es obvia.

La única forma de justificar la inferencia y de definir la población de inferencia es suponer que, aunque la muestra sea de conveniencia, acaso pueda considerarse que tiene una composición como la que tendría una muestra aleatoria de ‘alguna’ población. ¿Cuál? La única forma razonable de definirla es mediante los criterios utilizados para seleccionar a los individuos que han integrado la muestra (edad, sexo, enfermedad, gravedad, etc..., ámbito geográfico y temporal, centro de salud u hospital).

Por estas razones, la validez de la argumentación en que descansa una prueba de hipótesis basada en modelos es más que discutible. Alternativamente, en ocasiones se puede utilizar una argumentación distinta, cuya validez descansa solamente en una cosa: la aleatorización. Por eso, este tipo de pruebas de hipótesis se conocen como pruebas de aleatorización (randomisation tests) o también pruebas de permutación (permutation tests). A continuación ilustramos en qué consisten estas pruebas.

Page 20: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 20

9. INFERENCIA BASADA EN ALEATORIZACIÓN

Suponga que en un ECA sólo se asignan (aleatoriamente) 6 pacientes a uno de dos grupos que recibirá uno de dos tratamientos, experimental (E) y Control (C), y que se evalúa una respuesta cuantitativa. Suponga que los resultados son los de la figura 9.11a. La diferencia entre las dos medias es de 4 unidades. Esta diferencia entre los grupos podría ser debida a cualquiera de las dos razones siguientes:

los dos tratamientos tienen el mismo efecto, pero la aleatorización ha distribuido a los pacientes de forma que se ha producido este desequilibrio entre las medias.

los dos tratamientos tienen distinto efecto sobre de esta variable.

Para evaluar la verosimilitud de la primera de estas hipótesis, podríamos examinar cómo hubiera sido la diferencia de medias si el resultado de la aleatorización hubiera sido distinto.

En la figura 9.11b se muestran todas las posibles asignaciones de los seis pacientes a los dos grupos, así como las medias y la diferencia de medias en cada posible asignación. De las 20 posibles asignaciones, sólo en 4 se produce una diferencia de medias que, en valor absoluto, sea superior o igual a la constatada en el ECA (superior o igual a 4 unidades). Por tanto, si los dos tratamientos tuvieran el mismo efecto, observar una diferencia de medias tan grande o mayor que la observada tiene una probabilidad de 4/20 = 0,2. El p-value correspondiente a estos datos sería, por tanto, 0,2 (p=0,2).

Si este valor hubiera sido suficientemente pequeño (inferior a 0,05), rechazaríamos la primera de las posibles explicaciones porque, para sostenerla, es necesario creer que ha sucedido algo muy improbable.

Nótese que la argumentación anterior no ha sido necesario invocar ningún modelo teórico de distribución de probabilidad para calcular el p-value. Por otra parte, la argumentación se refiere exclusivamente a los datos observados en la muestra y no ha intervenido para nada la noción de una población origen de la muestra. Se podría preguntar ¿Dónde está la inferencia si no hay población? Bien. En realidad sí que hay población orígen de la muestra: la del conjunto de posibles ordenaciones o aleatorizaciones de los individuos de la muestra repartidos en dos grupos. Aunque esta población no incluye otros individuos distintos de los incluidos en la muestra.

Las pruebas de aleatorización utilizan una argumentación análoga a la utilizada por la inferencia basada en modelos, en el sentido de que se rechaza una hipótesis (nula) en base a la improbabilidad del resultado observado si esa hipótesis fuese cierta. Pero nótese que para calcular el p-value, la única

Page 21: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 21

premisa en que nos hemos basado es que la asignación de los tratamientos fue aleatoria.

La ventaja fundamental de las pruebas de aleatorización es que no dependen ni del muestreo aleatorio (porque no se hace inferencia a población alguna) ni de suposiciones acerca de la distribución muestral de un estadístico (Normal, binomial u otras).

Al no realizarse inferencia respecto de una población de individuos más amplia que la muestra, las conclusiones que se alcanza con estas pruebas hacen referencia exclusivamente a la muestra observada y no constituyen una generalización a otros conjuntos de individuos más amplios. Lo único que permite una prueba de aleatorización es ver hasta que punto es verosímil que un patrón observado en los datos se haya producido por azar.

Algunos autores ven en esto una limitación. Otros argumentan que la pretendida capacidad de generalización a una población que permite la inferencia basada en modelos es ficticia o engañosa, a menos que se trabaje con muestras aleatorias.

Page 22: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 22

10. MULTIPLICIDAD

En la unidad 8 se argumentó que la naturaleza probabilística del criterio de decisión utilizado en las pruebas de hipótesis implica que la conclusión de éstas pueda ser errónea. Recordemos que una prueba de hipótesis consiste en intentar rechazar la hipótesis nula en base a la escasa probabilidad (p<0,05) que tendrían los resultados observados si dicha hipótesis fuera cierta.

Pero los hechos improbables ocurren de tanto en tanto. De hecho, acaban ocurriendo siempre, si se le da las suficientes oportunidades.

Supongamos que someto a prueba 100 hipótesis nulas, todas ellas ciertas. Debemos esperar que (en promedio) en cinco de las cien pruebas el resultado sea p<0,05 (porque p<0,05 quiere decir precisamente que el resultado observado sólo se observaría 5 veces de cada cien, si la correspondiente hipótesis nula fuera cierta).

En estas circunstancias, ¿qué valor tendría un resultado significativo? Puede tratarse de un hallazgo casual: hemos mirado muchas cosas en busca de resultados ‘singulares’, hasta que los hemos encontrado. Y los hemos encontrado porque nuestra definición de ‘singular’ es la siguiente: ‘improbable’ o ‘infrecuente’.

Se han acuñado muchos términos distintos - rastreo de datos (data dredging), tortura de datos (data torturing), expediciones de pesca (fishing expeditions)- para indicar este fenómeno consistente en buscar mucho hasta que se encuentra la singularidad (¡Victoria! ¡He encontrado una p<0,05!). Este fenómeno se conoce técnicamente como el problema de la multiplicidad, término que se refiere a la multiplicidad de uso de un criterio probabilístico.

¿Por qué podemos vernos obligados a hacer muchas pruebas de hipótesis? En cualquier estudio se evalúan muchas variables y el número de análisis que es posible hacer crece muy rápido con el número de variables observadas. A modo de ejemplo, la figura 9.12a ilustra el número de pruebas que podríamos hacer en un estudio comparativo sobre hipertensión arterial.

Siempre que realicemos más de una prueba de hipótesis debemos preguntarnos: ¿Cuál es la probabilidad de que, si todas las hipótesis nulas que sometemos a prueba son ciertas, a pesar de ello rechacemos alguna (una o más de una) sólo por azar?

Esta probabilidad es dependiente del número de pruebas que realicemos. La figura 9.12b muestra el valor de esta probabilidad según el número de pruebas realizadas. Nótese que, cuando se realiza una sola prueba, esta probabilidad es 0,05. Cuando se realizan dos pruebas es casi el doble. Con 15 pruebas ya supera el 50%. A partir de 50 pruebas supera el 90%, y con 100 tenemos

Page 23: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 23

práctica certeza de que alguna hipótesis nula será rechazada, sólo porque el criterio de rechazo es probabilístico.

¿Qué hacer para evitar el problema de multiplicidad? Una solución en la próxima sección.

Page 24: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 24

11. CONFIRMAR O EXPLORAR

Naturalmente, no incurriríamos en un problema de multiplicidad si nos limitáramos a hacer una única prueba de hipótesis. Sin embargo, esto no es realista porque cualquier estudio es demasiado costoso como para analizar sólo una cosa, renunciando a muchas otras de potencial interés.

No hay inconveniente en analizar tantas cosas como sea necesario, con una condición: que sólo una de ellas tenga carácter confirmatorio, y las demás tengan carácter exploratorio. Si hacemos varias pruebas de hipótesis, pero sólo conferimos valor confirmatorio (esto es, valor de demostración) a una de ellas y consideramos exploratorios (tomamos con cautela, conscientes del problema de multiplicidad) los resultados de las demás, el problema de multiplicidad ya no es grave.

Se habla a veces de estudios confirmatorios o exploratorios para distinguir dos situaciones muy distintas. Una, en la que existe una hipótesis de trabajo bien definida que ha motivado el diseño del estudio, cuyo principal objetivo es confirmar dicha hipótesis. En este caso la hipótesis es anterior al estudio. Otra, en la que nuestro desconocimiento sobre un fenómeno es tal que, sin hipótesis previa, deseamos explorar muchos datos con el propósito de generar hipótesis. Esto último es perfectamente lícito. El pecado es pretender que, el mismo conjunto de datos utilizados para generar una hipótesis, sirva también para confirmarla.

En la práctica, un estudio suele tener varios objetivos y puede que alguno tenga pretensión confirmatoria mientras que otros sean de carácter exploratorio. Siempre que en un estudio haya un objetivo confirmatorio es muy importante distinguirlo como objetivo principal, indicando su carácter confirmatorio y especificando de antemano (¡antes de tener acceso a los datos!) qué prueba de hipótesis será aquella a la que conferiremos un valor de confirmación.

Page 25: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 25

12. DESARROLLE SU TEORÍA Y ¡PRUÉBELA!

Ahora ya esta Usted en disposición de probar sus teorías. Sólo tendrá que hacer un estudio, recopilar muchos datos y liarse a hacer pruebas de hipótesis como un poseso en busca de un resultado significativo. Ya sabe que, encontrar una p<0,05, es sólo un problema de paciencia: calcule muchos p-values hasta que obtenga uno suficientemente pequeño y...¡a publicar!

Sólo que...si intenta publicar en un sitio serio, esperarán que Usted especifique en el artículo qué hipótesis tenía antes de acceder a los datos, y por qué hizo el estudio como lo hizo (diseño utilizado, cálculo de tamaño muestral) si el objetivo era someter a prueba esa hipótesis.

También esperarán que Usted diga que el análisis estadístico que ha realizado para obtener su maravilloso p-value estaba definido de antemano. Muchas veces, se pueden utilizar diferentes técnicas de análisis para un mismo propósito, y puede que no todas den el mismo resultado. Es muy feo probar con varias y escoger la que produce un resultado más favorable...

Cuando se trate de un ejercicio confirmatorio realizado ética y decentemente, son admisibles ciertas formas de redactar las conclusiones de un trabajo, como por ejemplo ‘nuestros datos demuestran tal cosa’.

Cuando, declaradamente (o veladamente), un trabajo de investigación ha constituido un ejercicio de exploración, en el mejor de los casos, todo lo que se puede concluir es que ‘los datos sugieren tal cosa’.

En cualquier caso, le recomendamos que, cuando haya desarrollado su teoría, antes de liarse a hacer un estudio ( esto es, a recoger datos), haga una de dos cosas:

Vaya a ver a un estadístico, explíquele sus propósitos y sea receptivo a su consejo. Es muy posible que ahora no tenga excesivas dificultades para comunicarse con él.

O bien,

Si tanto le gusta esto de la estadística, estudie más. Hay mucha más. Muchísima más.

Lo que no debe hacer es pensar, ni por un instante, que con lo aprendido en este curso ya tiene suficiente para sus propósitos de investigación. Una investigación, por sencilla que sea, es demasiado costosa (en tiempo, en esfuerzo, en dinero, o en todos ellos) como para que tenga sentido arriesgarse a errar el tiro de manera irreparable.

Page 26: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 26

Con este curso, esperamos que Usted haya aprendido a decir ‘Allons enfants de la Patrie’ pero sería muy peligroso que Usted pensase: ¡ Ya sé hablar francés!

Aunque, desde luego, por algo se empieza, y llegar a pronunciar correctamente ‘Allons enfants de la Patrie’, es meritorio y puede ser más útil de lo que parece: del mismo modo que los franceses son muy dados a cantar siempre la Marsellesa, en estadística hay un puñado de conceptos básicos que aparecen hasta en la sopa.

No nos queda mas que agradecer su paciencia, si ha llegado hasta aquí. Esperamos que, en este momento, Usted esté satisfecho de haber hecho el curso. Si ha disfrutado la décima parte de lo que lo hemos hecho nosotros preparándolo, habremos alcanzado nuestro objetivo secreto: demostrarle que la estadística no es tan aburrida ni tan espesa como a veces la pintan.

Page 27: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 27

13. LECTURAS RECOMENDADAS Y LINKS DE INTERÉS

Una entrada de la Wiki sobre diseño de estudios: http://en.wikipedia.org/wiki/Study_design

Altman DG, Machin D, Bryant TN, Gardner M. Statistics with confidence. Second ed. 2000.

Un libro maravilloso donde se explica cómo estimar por intervalo cualquier parámetro. Además adjunta un programa para Windows que hace los cálculos y que es extraordinariamente sencillo de utilizar.

Aquí podrá calcular fácilmente el IC del 95% de una correlación: http://vassarstats.net/rho.html

Una página en la que encontrará links a calculadoras on-line para resolver la mayoría de los análisis que pueda llegar a necesitar, y muchos otros que quizás no necesite nuncahttp: http://statpages.org/

Page 28: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 28

14. RESUMEN

En esta unidad hemos presentado brevemente los distintos tipos de estudios o diseños frecuentemente utilizados en investigación médica, y hemos visto algunos ejemplos de aplicación de las dos herramientas básicas de inferencia que hemos tratado en unidades anteriores, las pruebas de hipótesis y los intervalos de confianza, discutiendo los argumentos en los que se basa la inferencia estadística y sus limitaciones en la práctica. Hemos introducido el problema de la multiplicidad, que se genera por el uso repetido de las pruebas de hipótesis, y de la necesaria distinción entre la inferencia conformatoria y la exploratoria.

Page 29: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 29

15. EJERCICIOS

15.1 Ejercicio 1

Se realiza un estudio para investigar la posible relación entre el hábito de mascar chicle y la incidencia de caries dental. Para ello, se selecciona a una serie de 200 sujetos con severos problemas de caries. Por cada uno de estos sujetos, se selecciona a otro sin caries, de igual edad y sexo. En cada conjunto de sujetos (con caries y sin caries) se investiga el hábito de mascar chicle. ¿Cuál de los siguientes diseños se ha utilizado en este estudio?

1. diseño transversal

2. diseño de cohorte única

3. diseño de cohortes concurrentes (con caries y sin caries)

4. diseño experimental

5. diseño de casos y controles

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line del curso, que encontrará en el Campus del CEC.

15.2 Ejercicio 2

En StatCrunch, escoja la opción Data > Load > Shared datasets, y busque el dataset Cigarettes Lung Kidney Leukemia Bladder. Cargue estos datos (clickando sobre el icono JNCI), que se refieren al consumo de tabaco e incidencia de neoplasias en los EEUU (para más detalles, utilice la opción Data > Properties tras cargar los datos). Investigue la correlación entre el consumo de tabaco (Cigarettes) y el cancer de vejiga (Bladder). Obtenga el coeficiente de correlación de Pearson mediante StatCrunch, y su IC(95%) mediante alguno de los links que se ofrecen al final de la unidad y decida cuál es la conclusión más correcta:

1. CIG y BLAD son variables independientes

2. CIG y BLAD son variables linealmente independientes

3. CIG y BLAD están relacionadas

4. CIG y BLAD están inversamente relacionadas

5. CIG y BLAD están directamente relacionadas

Page 30: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 30

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line del curso, que encontrará en el Campus del CEC.

15.3 Ejercicio 3

En un artículo original se dice lo siguiente: “Se realizó un ensayo clínico aleatorizado para comparar la eficacia de dos tratamientos T1 y T2 en pacientes hipertensos. De los 200 pacientes hipertensos que se visitan regularmente en nuestro servicio, se seleccionó al azar una muestra de 50 pacientes, asignando aleatoriamente los pacientes a cada grupo, según la inicial del nombre del paciente: de la A a la LL a T1, y el resto a T2”. Decida la opción correcta:

1. es un diseño aleatorizado, con una muestra aleatoria

2. es un diseño aleatorizado, con una muestra NO aleatoria

3. es un diseño NO aleatorizado, con una muestra aleatoria

4. es un diseño NO aleatorizado, con una muestra NO aleatoria

5. es un diseño de cohorte única

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line del curso, que encontrará en el Campus del CEC.

15.4 Ejercicio 4

Uno de los ejemplos utilizados en esta unidad hacía referencia a unos datos de tratamiento anti-TBC administrado bajo supervisión (S) o autoadminitrado (A). Con estos datos se realizó una comparación de las proporciones. Utilice estos mismos datos (tabla 9.5a) para someter a prueba la hipótesis de independencia entre el sistema de administración del tratamiento y el resultado (tratamiento completado o no completado) mediante una prueba de chi-cuadrado. La conclusión alcanzada ¿es la misma que la que se estableció al comparar las proporciones?

1. sí, porque se concluye independencia

2. no, porque se concluye independencia

3. sí, porque se concluye relación

4. no, porque se concluye relación

Page 31: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 31

5. no se puede aplicar una prueba de chi-cuadrado

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line del curso, que encontrará en el Campus del CEC.

15.5 Ejercicio 5

Se realizó un estudio para evaluar si una intervención educativa destinada a pacientes asmáticos conseguía mejorar la forma de autoadministración de los tratamientos inhalados. De 100 pacientes a los que se entrenó en el uso de inhaladores (durante dos sesiones de 15 minutos específicamente dedicadas a ello), 80 se autoadministraban el tratamiento correctamente al cabo de 3 meses. En un grupo control de 100 pacientes, también asmáticos, pero que no recibieron entrenamiento específico, 69 utilizaban correctamente los inhaladores. ¿Cuál es el p-value obtenido en una prueba unilateral de comparación de proporciones, en que la hipótesis alternativa postula que la probabilidad de correcta administración es superior si se ha recibido entrenamiento específico?

1. 0,0372

2. 0,0743

3. 0,9628

4. 0,05

5. no se puede hacer una prueba unilateral

Nota: Para ver y contestar la pregunta de este caso, debe acceder a la versión on line del curso, que encontrará en el Campus del CEC.

Page 32: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 32

FIGURAS

F 9·1 Diseños más frecuentes en investigación médica

Diseños Ejemplo típico

NO COMPARATIVOS:

Transversales: Encuesta epidemiológica en que se observa el estado de individuos en un punto del tiempo.

Cohorte única: Seguimiento de un conjunto o serie de casos

COMPARATIVOS:

Experimentos: Ensayo clínico aleatorizado en que se compara cierta respuesta entre

grupos de sujetos asignados aleatoriamente a distintos tratamientos.

Cohortes concurrentes: Comparación de la incidencia de enfermedad entre expuestos y no

expuestos a un factor de riesgo.

Casos y controles: Comparación de la exposición a un factor de riesgo entre efermos (casos) y

no enfermos (controles).

Page 33: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 33

F 9·2a Diseños transversales

Page 34: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 34

F 9·2b Diseños de Cohorte única

Page 35: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 35

F 9·2c Diseños experimentales: ensayos clínicos aleatorizados

Page 36: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 36

F 9·2d Diseños de Cohortes Concurrentes

Page 37: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 37

F 9·2e Diseños de Casos y Controles

Page 38: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 38

F 9·3a H0 en la prueva de independencia lineal

F 5·4 Edad y talla

Page 39: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 39

F 9·3b H1 en la prueva de independencia lineal

Page 40: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 40

F 9·4 Ocupación y el sexo. Encuesta de Salud de Cataluña 1994

Ocupación y el sexo Encuesta de Salud de Cataluña 1994

Hombres Mujeres

grupo 1 413 274

grupo 2 1.179 1.252

grupo 3 1.200 1.254

grupo 4a 2.703 2.499

grupo 4b 1.078 1.468

grupo 5 440 869

otros 130 241

grupo 1: Directivos de la administración y de empresas (excepto los incluidos en el grupo 2), altos funcionarios, profesionales liberales y técnicos superiores.

grupo 2: Directivos y propietarios-gerentes de comercio y de servicios personales, otros técnicos (no superiores), artistas y deportistas.

grupo 3: Cuadros y mandos intermedios, administrativos y funcionarios en general, personas de servicios de protección y seguridad.

grupo 4a: Trabajadores manuales cualificados de la industria, comercio y servicios.

grupo 4b: Trabajadores manuales semicualificados de la industria, comercio y servicios. Idem

del sector primario.

grupo 5: Trabajadores no cualificados.

otros: Otros no incluidos en las categorías anteriores.

Page 41: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 41

F 9·4b Resultado obtenido con Webstat

Page 42: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 42

F 9·4c Cálculo de Residuales bajo la hipótesis de independencia

Cálculo de Residuales bajo la hipótesis de independencia

casos Observados (O) casos Esperados (E)

Hombres Mujeres Total Hombres Mujeres Total

grupo 1 413 274 687 grupo 1 327,1 359,9 687

grupo 2 1.179 1.252 2.431 grupo 2 1.157,6 1.273,4 2.431

grupo 3 1.200 1.254 2.454 grupo 3 1.168,6 1.285,4 2.454

grupo 4a 2.703 2.499 5.202 grupo 4a 2.477,2 2.724,8 5.202

grupo 4b 1.078 1.468 2.546 grupo 4b 1.212,4 1.333,6 2.546

grupo 5 440 869 1.309 grupo 5 623,3 685,7 1.309

otros 130 241 371 otros 176,7 194,3 371

Total 7.143 7.857 15.000 Total 7.143 7.857 15.000

Bajo independencia, la probabilidad de pertenecer a un grupo dado es la misma para

los hombres que para las mujeres y la mejor forma de estimarla es mediante la probabilidad marginal.

Por ejemplo, la probabilidad marginal de pertenecer al grupo 2 es: 2.431 / 15.000

Si hay 7.143 hombres, el nº de hombres esperados en el grupo 2 es : 7.143 x 2.431 / 15.000 = 1.157,6

Residuales: R = O – E

Hombres Mujeres Total

grupo 1 85,9 - 85,9 687

grupo 2 21,4 - 21,4 2.431

grupo 3 31,4 - 31,4 2.454

grupo 4a 225,8 - 225,8 5.202

grupo 4b - 134,4 134,4 2.546

grupo 5 - 183,3 183,3 1.309

otros - 46,7 46,7 371

Total 7.143 7.857 15.000

R > 0 indica más casos de los esperados (bajo independencia) R < 0 indica menos casos de los esperados (bajo independencia)

Page 43: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 43

F 9·5a Cumplimentación del tratamiento anti-TBC a los 12 meses de su inicio según la forma de administrar el tratamiento

F 9·5b Introducción de datos en StatCrunch para una prueba de comparación de proporciones

Page 44: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 44

F 9·5c Resultado obtenido con Webstat

Page 45: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 45

F 9·5d Introducción de datos en StatCrunch para una prueba de compración de proporciones

Page 46: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 46

F 9·5e Resultado obtenido con Webstat

Page 47: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 47

F 9·5e Resultado obtenido con Webstat

Page 48: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 48

F 9·6a Diferencia de Riesgos (DR), Reducción Absoluta de Riesgos (RAR)

Page 49: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 49

F 9·6b Número de casos que es Necesario tratar (NNT)

Page 50: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 50

F 9·6c Riesgo Relativo o Razón de Riesgos (RR)

Page 51: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 51

F 9·6d Riesgo Relativo o Razón de Riesgos (RR)

Page 52: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 52

F 9·6e Odds Ratio (OR)

Page 53: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 53

F 9·7a Consumo energético (MJ/día) en 24 horas en dos grupos de mujeres

Consumo energético (MJ/día) en 24 horas en dos grupos de mujeres

Delgadas N = 13

Obesas N = 9

6,13 8,79

7,05 9,19

7,48 9,21

7,48 9,68

7,53 9,69

7,58 9,97

7,90 11,51

8,08 11,85

8,09 12,79

8,11

8,40

10,15

10,88

Page 54: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 54

F 9·7b Introducción de datos en StatCrunch para una prueba de comparación de medias

Page 55: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 55

F 9·7c Resultado obtenido con el Webstat

Page 56: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 56

F 9·7d Evaluando las suposiciones de la t de Student para los datos de consumo energético

Page 57: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 57

F 9·8a Evaluando las suposiciones de la t de Student para los datos de consumo lisozoma en jugo grástico

Page 58: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 58

F 9·8b Evaluando las suposiciones de la t de Student para los datos de consumo lisozoma en jugo grástico - transformación logarítmica

Page 59: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 59

F 9·9 Diseños de casos y controles: lo que se puede calcular y lo que no

Page 60: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 60

F 9·10 Posibles aleatorizaciones con N=6 pacientes en un EC de dos grupos paralelos

Page 61: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 61

F 9·11a Consumo energético (MJ/día) en 24 horas en dos grupos de mujeres

Resultados de un EC aleatorizado y paralelo con N=6 pacientes

Grupo de Tratamiento

Experimental Control

Pacientes A B C D E F Diferencia

Respuestas 12 17 14 21 16 18 de medias

Medias 14.3 18.3 4

F 9·11b Posibles aleatorizaciones con N=6 pacientes en un EC de dos grupos paralelos

Page 62: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 62

F 9·12a Pruebas de hipótesis posibles en un ECA para comparar dos tratamientos en HTA

Page 63: U9. DISEÑO DE ESTUDIOS E INTERPRETACIÓN DE … · U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela! ... un objetivo habitual y

DISEÑO y ANÁLISIS de INVESTIGACIONES CLÍNICAS: MÓDULO I

U9 – Diseño de estudios e interpretación de resultados: desarrolle su teoría y ... ¡pruébela!

© Centro de Estudios Colegiales – Colegio Oficial de Médicos de Barcelona 63

F 9·12b Multiplicidad: la magnitud del problema

Multiplicidad: la magnitud del problema

K = Nº de pruebas de hipótesis nulas ciertas sometidas a prueba.

Probabilidad = probabilidad de rechazar alguna (una o más) de estas hipótesis.

K Probabilidad K Probabilidad

1 0.0500 30 0.7854

2 0.0975 40 0.8715

3 0.1426 50 0.9231

4 0.1855 60 0.9539

5 0.2262 70 0.9724

10 0.4013 80 0.9835

15 0.5367 90 0.9901

20 0.6415 100 0.9941