Post on 16-Feb-2017
SEMINARIO 7
Análisis bivariado con variables cualitativas (proporciones)
EJERCICIO 1Si queremos conocer si existe asociación entre el consumo de tabaco y el
bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:
– De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.– De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al
nacer.• 1. Representa los datos en un tabla de contingencia indicando las
frecuencias observadas y porcentajes • 2. Establece una hipótesis adecuada para el estudio • 3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu
hipótesis • 4. Calcula la odds ratio• 5. Repite el ejercicio con R Commander ¿Los resultados son los
mismos?• 6. Sube los resultados al blog
En primer lugar representamos los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes
Niño con bajo peso
Niño normopeso
Total
Mujeres fumadoras
43 207 250
Mujeres no fumadoras
105 1645 1750
Total 148 1852 2000
Podemos observar los resultados de una forma más clara realizandola tabla de contingencia con porcentajes.
Niño con bajo peso
Niño normopeso
Total
Mujeres fumadoras
17,2% 82,2% 100%
Mujeres no fumadoras
6% 94% 100%
Observando la tabla de contingencia apreciamos que el porcentaje de mujeres fumadoras que tienen un hijo con bajo peso al nacer es mayor que aquellas no fumadoras.
Ello nos lleva a realizar una pregunta de investigación: ¿Que la madre sea fumadora influye en el peso de sus hijos?
A continuación, se establecen las hipótesis para su estudio:
Ho: No existe relación entre el peso de los recién nacidos y una madre fumadora
H1 : Existe relación entre el peso de los recién nacidos y que la mujer sea fumadora.
A continuación, utilizamos el estadístico Chi cuadrado de Pearson para contrastar la hipótesis, es decir, para comprobar si la
diferencia en los datos que observamos es debida al azar o por el contrario, es estadísticamente significativa.
Para ello, en primer lugar calculamos las frecuencias esperadas.
Niños con bajo peso
Niños normopeso
Total
Mujer fumadora 43(148·250/2000= 18,5)
207(1852·250/2000= 231,5)
250
Mujer no fumadora 105(48·1750/2000= 129,5)
1645(1852·1750/2000= 1620,5)
1750
Total 148 1852 2000
Calculamos el valor del estadístico Chi cuadrado a través de la fórmula:
𝑥2 = (43−18,5)218,5 + (207−231,5)2231,5 + (105−129,5)2129,5 + (1645−1620,5)21620,5 = 40,03
Calculamos los grados de libertad:GL =(fila-1)·(columna-1) = 1
Ahora vamos a comparar nuestro valor, 40,03, con el valor de la Chi cuadrado teórica, para ello, consultamos la tabla, teniendo en
cuenta que tenemos 1 grado de libertad y un nivel de significación de 0,05
• Chi cuadrado en la tabla teórica : 3,8415• Chi cuadrado en los datos observados: 40,03
40,03 es mayor que el resultado de las tablas, 3,8415, por lo tanto, existen diferencias estadísticamente significativas o lo
que es lo mismo, estas diferencias no son debidas al azar.Por ello aceptamos la H1: Existe relación entre el peso de los
recién nacidos y que la madre sea fumadora. Existe asociación entre madre fumadora e hijos con bajo
peso al nacer a un nivel de significación de 0,05
Odds RatioOR = a·dc·b Teniendo en cuenta que consideramos que ser mujer fumadora es un factor de riesgo para tener un bebé con bajo peso al nacer:
Niño con bajo peso
Niño normopeso
Total
Mujeres fumadoras 43 a 207 b 250
Mujeres no fumadoras 105 c 1645 d 1750
Total 148 1852 2000
OR = 43·1645207·105 = 3,25 Teniendo en cuenta que:OR=1 indica que no hay asociación (independencia) – OR>1 la presencia del factor de exposición se asocia a mayor ocurrencia del evento – OR<1 la presencia del factor de exposición se asocia a menor ocurrencia del evento
OR > 1. La presencia del factor deexposición se asocia a mayor ocurrenciadel evento, o lo que es lo mismo,fumar es un factor de riesgo para tener hijos con bajo peso al nacer.
Repite el ejercicio con R Commander ¿Los resultados son los mismos?
Nos sale como frecuencias observadas y como porcentajes.
Resultado de la chi cuadrado,con 1 grado de libertad y un p-valorDe 2,483·10^-10
Odds ratio: 3,2515
Si aceptamos la hipótesis alternativa cometemos un error de 2,483e-10,mucho menor del que nosotros estábamos dispuestos a asumir, por lo tanto, se acepta la hipótesis alternativa que dice que existe relación entre el peso de los recién nacidos y que la madre sea fumadora, al igual que el resultado que habíamos obtenido mirándolo desde la tabla teórica.
En cuanto al valor de la Odds ratio, hemos obtenido el mismo que al hacerlo de manera teórica con la fórmula : 3,2515, lo que quiere decir que fumar es un factor de riesgo paraque los hijos tengan bajo peso al nacer.
EJERCICIO 2 Siguiendo todos los pasos anteriores establece y describe si
existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:
– Practicadeporte (Sí, No) – Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por
semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario
¿Existe relación entre el sexo y la práctica de deporte?
En base a nuestra pregunta de investigación: ¿Existe relación entre el sexo y la práctica de deporte?,
formulamos nuestras hipótesis nula y alternativaH0: No existen diferencias en las horas de práctica
deportiva entre hombres y mujeresH1: Existen diferencias en las horas de práctica
deportiva en hombres y mujeres.
Nos salen como frecuencias observadasy como porcentajes.Observamos que existen diferencias con respecto a las horas de práctica deportiva según el sexo, pero para saber si estas diferencias son estadísticamente significativas o son debidas al azar, usamos chi cuadrado
El p-valor obtenido en la Chi cuadrado es de 1,2e-05, esto nos muestra el error que cometeríamos si aceptamos la hipótesis alternativa. Como el error que nosotros estamos dispuestos a asumir es de 0.05, aceptamos la hipótesis alternativa que dice que existen diferencias en las horas de práctica deportiva entre hombres y mujeres.
La Odds ratio es 0,2048, inferior a 1 lo que significa que la presencia del factor de exposición se asocia a menor ocurrencia del evento, es decir que ser hombre implica una práctica deportiva menor ,una afirmación contraria a lo que habíamos obtenido anteriormente. Sin embargo, si nos fijamos en el intervalo de confianza de la Odds ratio, este se encuentra entre 0,0838… y 0,4508… , es decir, no se encuentra incluido el 1 y por lo tanto se rechaza la Odds ratio, siguiendo con la hipótesis ya aceptada anteriormente, la alternativa.
¿Hay relación entre el sexo y la ingesta de fruta?
Establecemos nuestra pregunta de investigación:¿Hay relación entre el sexo y comer fruta? Y en base a
ella, establecemos las hipótesis:H0: No existe relación entre el sexo y la ingesta de
fruta.H1: Si existe una relación entre el sexo y la ingesta de
fruta.
Observamos el valor de p-value, que es 0,1072, esto nos indica el error que
cometeríamos si aceptamos la hipótesis alternativa, como el error que nosotros
estamos dispuestos a asumir es de 0,05, es decir, mayor del que cometemos, aceptamos la hipótesis alternativa que dice que existen
diferencias entre el sexo y la ingesta de fruta.