Seminario 7

21
SEMINARIO 7 Análisis bivariado con variables cualitativas (proporciones)

Transcript of Seminario 7

Page 1: Seminario 7

SEMINARIO 7

Análisis bivariado con variables cualitativas (proporciones)

Page 2: Seminario 7

EJERCICIO 1Si queremos conocer si existe asociación entre el consumo de tabaco y el

bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:

– De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.– De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al

nacer.• 1. Representa los datos en un tabla de contingencia indicando las

frecuencias observadas y porcentajes • 2. Establece una hipótesis adecuada para el estudio • 3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu

hipótesis • 4. Calcula la odds ratio• 5. Repite el ejercicio con R Commander ¿Los resultados son los

mismos?• 6. Sube los resultados al blog

Page 3: Seminario 7

En primer lugar representamos los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes

Niño con bajo peso

Niño normopeso

Total

Mujeres fumadoras

43 207 250

Mujeres no fumadoras

105 1645 1750

Total 148 1852 2000

Podemos observar los resultados de una forma más clara realizandola tabla de contingencia con porcentajes.

Niño con bajo peso

Niño normopeso

Total

Mujeres fumadoras

17,2% 82,2% 100%

Mujeres no fumadoras

6% 94% 100%

Page 4: Seminario 7

Observando la tabla de contingencia apreciamos que el porcentaje de mujeres fumadoras que tienen un hijo con bajo peso al nacer es mayor que aquellas no fumadoras.

Ello nos lleva a realizar una pregunta de investigación: ¿Que la madre sea fumadora influye en el peso de sus hijos?

A continuación, se establecen las hipótesis para su estudio:

Ho: No existe relación entre el peso de los recién nacidos y una madre fumadora

H1 : Existe relación entre el peso de los recién nacidos y que la mujer sea fumadora.

Page 5: Seminario 7

A continuación, utilizamos el estadístico Chi cuadrado de Pearson para contrastar la hipótesis, es decir, para comprobar si la

diferencia en los datos que observamos es debida al azar o por el contrario, es estadísticamente significativa.

Para ello, en primer lugar calculamos las frecuencias esperadas.

Niños con bajo peso

Niños normopeso

Total

Mujer fumadora 43(148·250/2000= 18,5)

207(1852·250/2000= 231,5)

250

Mujer no fumadora 105(48·1750/2000= 129,5)

1645(1852·1750/2000= 1620,5)

1750

Total 148 1852 2000

Page 6: Seminario 7

Calculamos el valor del estadístico Chi cuadrado a través de la fórmula:

𝑥2 = (43−18,5)218,5 + (207−231,5)2231,5 + (105−129,5)2129,5 + (1645−1620,5)21620,5 = 40,03

Calculamos los grados de libertad:GL =(fila-1)·(columna-1) = 1

Page 7: Seminario 7

Ahora vamos a comparar nuestro valor, 40,03, con el valor de la Chi cuadrado teórica, para ello, consultamos la tabla, teniendo en

cuenta que tenemos 1 grado de libertad y un nivel de significación de 0,05

Page 8: Seminario 7

• Chi cuadrado en la tabla teórica : 3,8415• Chi cuadrado en los datos observados: 40,03

40,03 es mayor que el resultado de las tablas, 3,8415, por lo tanto, existen diferencias estadísticamente significativas o lo

que es lo mismo, estas diferencias no son debidas al azar.Por ello aceptamos la H1: Existe relación entre el peso de los

recién nacidos y que la madre sea fumadora. Existe asociación entre madre fumadora e hijos con bajo

peso al nacer a un nivel de significación de 0,05

Page 9: Seminario 7

Odds RatioOR = a·dc·b Teniendo en cuenta que consideramos que ser mujer fumadora es un factor de riesgo para tener un bebé con bajo peso al nacer:

Niño con bajo peso

Niño normopeso

Total

Mujeres fumadoras 43 a 207 b 250

Mujeres no fumadoras 105 c 1645 d 1750

Total 148 1852 2000

OR = 43·1645207·105 = 3,25 Teniendo en cuenta que:OR=1 indica que no hay asociación (independencia) – OR>1 la presencia del factor de exposición se asocia a mayor ocurrencia del evento – OR<1 la presencia del factor de exposición se asocia a menor ocurrencia del evento

OR > 1. La presencia del factor deexposición se asocia a mayor ocurrenciadel evento, o lo que es lo mismo,fumar es un factor de riesgo para tener hijos con bajo peso al nacer.

Page 10: Seminario 7

Repite el ejercicio con R Commander ¿Los resultados son los mismos?

Page 11: Seminario 7

Nos sale como frecuencias observadas y como porcentajes.

Resultado de la chi cuadrado,con 1 grado de libertad y un p-valorDe 2,483·10^-10

Odds ratio: 3,2515

Page 12: Seminario 7

Si aceptamos la hipótesis alternativa cometemos un error de 2,483e-10,mucho menor del que nosotros estábamos dispuestos a asumir, por lo tanto, se acepta la hipótesis alternativa que dice que existe relación entre el peso de los recién nacidos y que la madre sea fumadora, al igual que el resultado que habíamos obtenido mirándolo desde la tabla teórica.

En cuanto al valor de la Odds ratio, hemos obtenido el mismo que al hacerlo de manera teórica con la fórmula : 3,2515, lo que quiere decir que fumar es un factor de riesgo paraque los hijos tengan bajo peso al nacer.

Page 13: Seminario 7

EJERCICIO 2 Siguiendo todos los pasos anteriores establece y describe si

existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:

– Practicadeporte (Sí, No) – Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por

semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario

Page 14: Seminario 7

¿Existe relación entre el sexo y la práctica de deporte?

En base a nuestra pregunta de investigación: ¿Existe relación entre el sexo y la práctica de deporte?,

formulamos nuestras hipótesis nula y alternativaH0: No existen diferencias en las horas de práctica

deportiva entre hombres y mujeresH1: Existen diferencias en las horas de práctica

deportiva en hombres y mujeres.

Page 15: Seminario 7
Page 16: Seminario 7

Nos salen como frecuencias observadasy como porcentajes.Observamos que existen diferencias con respecto a las horas de práctica deportiva según el sexo, pero para saber si estas diferencias son estadísticamente significativas o son debidas al azar, usamos chi cuadrado

El p-valor obtenido en la Chi cuadrado es de 1,2e-05, esto nos muestra el error que cometeríamos si aceptamos la hipótesis alternativa. Como el error que nosotros estamos dispuestos a asumir es de 0.05, aceptamos la hipótesis alternativa que dice que existen diferencias en las horas de práctica deportiva entre hombres y mujeres.

Page 17: Seminario 7

La Odds ratio es 0,2048, inferior a 1 lo que significa que la presencia del factor de exposición se asocia a menor ocurrencia del evento, es decir que ser hombre implica una práctica deportiva menor ,una afirmación contraria a lo que habíamos obtenido anteriormente. Sin embargo, si nos fijamos en el intervalo de confianza de la Odds ratio, este se encuentra entre 0,0838… y 0,4508… , es decir, no se encuentra incluido el 1 y por lo tanto se rechaza la Odds ratio, siguiendo con la hipótesis ya aceptada anteriormente, la alternativa.

Page 18: Seminario 7

¿Hay relación entre el sexo y la ingesta de fruta?

Establecemos nuestra pregunta de investigación:¿Hay relación entre el sexo y comer fruta? Y en base a

ella, establecemos las hipótesis:H0: No existe relación entre el sexo y la ingesta de

fruta.H1: Si existe una relación entre el sexo y la ingesta de

fruta.

Page 19: Seminario 7
Page 20: Seminario 7
Page 21: Seminario 7

Observamos el valor de p-value, que es 0,1072, esto nos indica el error que

cometeríamos si aceptamos la hipótesis alternativa, como el error que nosotros

estamos dispuestos a asumir es de 0,05, es decir, mayor del que cometemos, aceptamos la hipótesis alternativa que dice que existen

diferencias entre el sexo y la ingesta de fruta.