Tablas de Contingencia Ji Cuadrada, Coef de Contingencia y v de Cramer 2012

30
Tablas de contingencia Ji cuadrada, C contingencia Y V Cramer

description

estadística

Transcript of Tablas de Contingencia Ji Cuadrada, Coef de Contingencia y v de Cramer 2012

Tablas de contingenciaJi cuadrada, C contingencia Y V Cramer

Introducción

En los temas anteriores se realizaron pruebas de hipótesis respecto de una sola media de población, dos medias de poblaciones y tres o más medias de poblaciones. Para estas pruebas se establece el supuesto que las poblaciones siguen la distribución de probabilidad normal.

Sin embargo , hay pruebas disponibles en las cuales no es necesario una suposición respecto de la forma de la población. A estas pruebas se les conoce como no paramétricas. Esto significa que no es necesario suponer una población normal.

Introducción

También hay pruebas exclusivas para datos a escala de medición nominal. En este tipo de medición, los datos se clasifican en categorías donde no hay un orden natural, como el genero de los representantes del congreso, el estado donde nacieron los estudiantes o la marca de mantequilla de maní que compró.

El estadístico Ji cuadrada, es útil para datos medidos con una escala nominal.

La forma de la distribución X2 se aproxima a una distribución normal conforme gl aumenta

Tablas de contingencia

• El estadístico Ji cuadrada sirve para probar de manera formal si hay una relación entre dos variables con escala nominal. En otras palabras ¿es independiente una variable de la otra?.

• En el caso de variables cualitativas la falta de independencia suele denominarse asociación, y el análisis del grado de asociación entre variables cualitativas tiene fuerte incidencia en la estadística de atributos. Se dice que dos atributos A y B son independientes cuando entre ellos no existe ningún tipo de influencia mutua.

Hipótesis Nula

• H0: No existe dependencia, nos dice que son independientes las variables.

• H1: Existe dependencia

Tablas de contingencia

Ejemplos para probar si dos variables están relacionadas.

• La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La planta opera tres turnos por día, 5 días a la semana. El gerente de control de calidad quiere comparar el nivel de calidad en los tres turnos. Los vehículos se clasifican por su nivel de calidad (aceptable, inaceptable) y por turnos (matutino, vespertino, nocturno), ¿Hay alguna diferencia en el nivel de calidad en los tres turnos?. Es decir, ¿está relacionada la calidad del producto del turno dónde se fabricó?, ¿O es independiente la calidad del producto del turno dónde se fabricó?

Tablas de contingencia

Ejemplos para probar si dos variables están relacionadas.

• Una muestra de 100 conductores detenidos por rebasar los límites de velocidad se clasificó por genero y el uso del cinturón de seguridad. Para esta muestra. ¿El uso del cinturón de seguridad se relaciona con el género?

Tablas de contingencia

Ejemplos para probar si dos variables están relacionadas.

• ¿Un hombre liberado de una prisión federal tiene una adaptación diferente a la vida civil si regresa a su ciudad natal o si se va a vivir a otra parte?. Las dos variables son: una adaptación a la vida civil y el lugar de residencia. Observe que las dos variables se miden en una escala nominal.

Ejemplo

La Agencia Correccional Federal investiga lo siguiente: ¿Un hombre liberado de una prisión federal tiene una adaptación diferente a la vida civil si regresa a su ciudad natal o si va a vivir a otra parte?. ¿Hay una relación entre la adaptación a la vida civil y el lugar de residencia después de salir de prisión?. Utilice un nivel de significancia 0.01.

H0: No hay una relación entre la adaptación a la vida civil y el lugar donde vive el individuo después de salir de prisión.H1: Hay una relación entre la adaptación a la vida civil y el lugar donde vive el individuo después de salir de prisión.

Base de datos de información

Sacar frecuencia esperada de cada uno

𝑓𝑒=(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑓𝑖𝑙𝑎𝑠)(𝑇𝑜𝑡𝑎𝑙 𝑑𝑒𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 )

𝐺𝑟𝑎𝑛𝑡𝑜𝑡𝑎𝑙

𝑓𝑒=(120)(40)200

=24

Significancia 0.126 rebasa 0.01, no se puede rechazar la hipótesis nula

Por lo tanto no hay evidencia de una relación entre la adaptación a la vida civil y el lugar de residencia del individuo al salir de presión.

PRUEBA EN SPSS

Coeficiente de Contingencia

• Se utiliza para saber la asociación de variables cualitativas nominales, que tienen dos o más categorías.

• Este coeficiente requiere del cálculo previo del estadístico Chi Cuadrado.

Coeficiente de contingencia

• El coeficiente de contingencia, toma valores comprendidos entre cero y uno.

• Cuando está próximo a cero, indica asociación nula o muy débil entre las variables involucradas.

• Cuando está próximo a uno, indica asociación alta, fuerte, o casi perfecta, dependiendo de la cercanía al número uno.

V de Cramer

• Se trata de un coeficiente que toma el valor de 1 cuando existe asociación perfecta entre atributos, cualquiera que sea el número de filas y columnas de la tabla de contingencia analizada.

• valor puede ir desde 0 (no existe relación entre las variables) hasta 1(asociación perfecta).

No hay asociación entre las variables :Residencia al salir de prisión y la adaptación a la vida civil

Tipo de familia Tipo de Ideas Frecuencia

No rigorista Conservadora 2

No rigorista Moderada 2

No rigorista Liberal 26

Moderada Conservadora 2

Moderada Moderada 23

Moderada Liberal 3

Autoritaria Conservadora 29

Autoritaria Moderada 1

Autoritaria Liberal 1

Ejemplo 2: Influencia de una variable en otraH0: El tipo de familia no influye o determina el tipo de Ideas políticas en las familias. (No existe dependencia)H1: El tipo de familia determina las ideas políticas en las familias (Existe dependencia).

Tabla de contingencia, proporciones

Coeficientes

Se rechaza la hipótesis de que “no existe dependencia”

Por lo tanto existe dependencia Entre las variables

Coeficiente menor a 0.05

Coeficientes

Coeficiente V de Cramer menorA 0.05

Coeficiente de contingencia menorA 0.05

Coeficiente V de Cramer 0.814

Coeficiente de contingencia 0.755 tabla simétrica, mismo numero de filas y columnas

Por lo tanto no solo son dependientes el tipo de familia y las ideas políticas que tienen los hijos si no que además, si no que además existe una asociación entre estas dos variables del:

• H0: No existe dependencia

• H1: Existe dependencia

Conclusión• El tipo de familia determina las ideas conservadoras,

moderadas o liberales. La asociación es fuerte

Ejercicio• El departamento de reclamaciones de Wise Insurance

Company cree que los conductores jóvenes tienen mas accidentes y, por tanto, se les debe cobrar primas mayores. Una muestra de 1200 asegurados por Wise reveló el siguiente análisis acerca de las reclamaciones en los últimos tres años y a edad del asegurado. ¿Es razonable concluir que hay una relación entre la edad del asegurado y si hizo una reclamación o no? Utilice el nivel de significancia 0.05

• Suponga que para 120 pacientes de salud mental que no recibieron tratamiento psicoterapéutico y 120 pacientes que recibieron este tratamiento, un grupo de psiquiatras determino después de seis meses si su condición se había deteriorado, permanecido sin cambios o mejorado. Básese en los resultados de la tabla que sigue en el nivel de significancia α = 0.05 si el tratamiento terapéutico es efectivo:

• H0: para cada alternativa, las probabilidades son las mismas sin cambios para personas sin terapia y con terapia

• H1: No son los mismos resultados para las personas que recibieron terapia y las que no la recibieron ( la terapia es efectiva).

Sin terapia Con terapiaDeteriorado 6 11Sin cambios 65 31Mejorado 49 78Total 120 120

• Nivel de significancia: α=0.05 • Criterio:• Rechace la hipótesis nula si X2 > 7.82, el valor de X2 0.05 para ( 2-1) y(3-1) = 3

grados de libertad, donde :• De lo contrario, acéptela o resérvese el juicio. n = 240

• Decisión:• X2 = 20.14 es mayor que 7.82 , se rechaza la hipótesis nula; se

concluye que la terapia es efectiva.

Sin terapia Con terapia

Deteriorado o 6 11 17e 8.5 8.5

Sin cambios o 65 31 96e 48 48

Mejorado o 49 78 127e 63.5 63.5

Total 120 120 240