Seminario 7

16
Seminario VII: Análisis bivariado con variables cualitativas (proporciones) Beatriz Rojas Jíménez Estadística y Tic’s 1º Enfermería Virgen del Rocío; subgrupo 16 Curso: 2015/16

Transcript of Seminario 7

Page 1: Seminario 7

Seminario VII: Análisis bivariado con variables

cualitativas (proporciones)

Beatriz Rojas JíménezEstadística y Tic’s

1º Enfermería Virgen del Rocío; subgrupo 16Curso: 2015/16

Page 2: Seminario 7

IntroducciónEn R Commader podemos realizar operaciones diferentes. En este caso vamos a realizar operaciones para dos o más variables cualitativas relacionadas (tablas de contingencia, chi-cuadrado y odds ratio). 1) Contrastar los resultados del ejercicio realizado manualmente con los resultados en R

Commander: Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer;

estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al nacer.

2) Establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:

• Practicadeporte (Sí, No)• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”,

4- “Tres o más veces a la semana”, 5 “A diario”

Page 3: Seminario 7

Ejercicio 1: Contrastar los resultados del ejercicio realizado manualmente con los resultados en R Commander

Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:• De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer.• De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al

nacer.

Page 4: Seminario 7

1º) Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes.

V1 = MUJERES V2 = NIÑOS

SÍ bajo peso al nacer

NO bajo peso al nacer

TOTAL

F1 = Fumadoras a = 43 b = 207 250 (a+b)

F1% 17’2 82’8 100

F2 = no fumadoras

c =105 d = 1645 1750 (c+d)

F2% 6 94 100

TOTAL 148 (a+c) 1852 (b+d) N =2000

TOTAL% 7’4 92’6 100

Page 5: Seminario 7

2º) Establece una hipótesis adecuada para el estudio.

¿Existe asociación entre el consumo de tabaco de las mujeres y la probabilidad de tener hijos con bajo peso al nacer?• H0 = No existe asociación entre el consumo de tabaco en

mujeres y tener hijos con bajo peso.• H1 = Existe asociación entre el consumo de tabaco en

mujeres y tener hijos con bajo peso.

Page 6: Seminario 7

3º) Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis.

A. Primero debemos calcular las frecuencias esperadas a partir de las observadas:• FE11 = = = 18’5• FE12 = = = 231’5• FE21 = = = 129’5• FE22 = = = 1620’5

Page 7: Seminario 7

B. Ahora ya podemos calcular la chi-cuadrado a partir de la fórmula:

X2 = ∑ = + + + = 40’04436402

V1 = MUJERES V2 = NIÑOSSÍ bajo peso al nacer

NO bajo peso al nacer

TOTAL

F1 = Fumadoras a = 43 (FE = 18’5) b = 207 (FE = 231’5)

250 (a+b)

F1% 17’2 82’8 100F2 = no fumadoras c =105 (FE = 129’5) d = 1645 (FE =

1620’5)1750 (c+d)

F2% 6 94 100TOTAL 148 (a+c) 1852 (b+d) N =2000TOTAL% 7’4 92’6 100

Page 8: Seminario 7

C. Calculamos los grados de libertad:

g. i. = (Número de filas – 1)*(Número de columnas – 1) = (2 – 1)*(2 – 1) = 1

Es una variable dicotómica, tabla 2x2.

Page 9: Seminario 7

D. Buscamos la chi-cuadrado teórica en las tablas de chi-cuadrado asociada al margen de error establecido (0’05)

X2 = 3’8415• Aceptamos H0 X2 real < X2 teórica (no existe relación entre las variables).• Rechazamos H0 X2 real > X2 teórica (existe relación entre las variables).Por tanto, en nuestro caso 40’044 > 3’8415 Rechazamos la hipótesis nula (H0) Existe relación entre las variables.

Page 10: Seminario 7

4º) Calcula la Odds ratio

OR = = = 3’2544

• Si OR = 1 no hay asociación, son independientes• Si OR > 1 la presencia del factor se asocia a mayor ocurrencia del evento.• Si OR < 1 la presencia del factor se asocia a menor ocurrencia del evento.

En nuestro caso, 3’2544 > 1 por tanto, la presencia del factor se asocia a mayor ocurrencia del evento.

Page 11: Seminario 7

5º) Repite el ejercicio con R Commander ¿Los resultados son los mismos?

Como siempre que empezamos con R Commander: establecemos el directorio de trabajo y cargamos los datos que vamos a utilizar.A) Estadísticos Tablas de contingencia Introducir y analizar una tabla de doble entrada Introducir datos en la tabla 2x2

Page 12: Seminario 7

Aquí podemos comprobar como:

• X2 = 40’044.

• “P”

• FE

• Test exacto de Fisher’s

• Odds ratio = 3’25158

Por tanto, podemos ver como los valores son similares a los resultados obtenidos manualmente (aceptamos H1).

Page 13: Seminario 7

Ejercicio 2:

Establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:• Practicadeporte (Sí, No)• Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por

semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”

Page 14: Seminario 7

Abrimos de nuevo R Commander, establecemos el directorio de trabajo y cargamos los datos de “activossalud” (como en los seminarios anteriores).1º) Realizamos una tabla de contingencia: Estadísticos Tablas de contingencia Tabla de doble entrada… Elegir variables (sexo-practicadeporte)

Page 15: Seminario 7

Tenemos una chi-cuadrado de 19’163.Sabiendo que la chi-cuadrado teórica es 3’84 establecemos que:Como real > X2 teórica (19’163 > 3’84), rechazamos la hipótesis nula (H0) y por tanto, aceptamos la hipótesis alternativa (H1). Esto significa que existe asociación entre las variables “sexo” y “practicadeporte”.

Page 16: Seminario 7

2) Ahora cambiamos las variables y elegimos, “sexo” y “fruta”

En este caso, X2 real > X2

teórica (7’6036>3’84) por tanto, rechazamos la hipótesis nula (H0) y

podemos afirmar que las variables “sexo” y “fruta”

están relacionadas.