Chi cuadrado

17
Prueba Chi cuadrado Dr. RUBÉN PÁEZ LANDETA

Transcript of Chi cuadrado

Page 1: Chi cuadrado

Prueba Chi cuadrado

Dr. RUBÉN PÁEZ LANDETA

Page 2: Chi cuadrado

PRUEBA de Chi-cuadrado 

Es particularmente útil para analizar datos de variables cualitativas nominalesPermite determinar si dos variables cualitativas están o no asociadas.

La prueba de independencia Chi-cuadrado, permite determinar si existe una relación entre dos variables categóricas.

Esta prueba no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.

Si al final del estudio se concluye que las variables no están relacionadas se afirma con un determinado nivel de confianza, previamente fijado, que ambas son independientes.

Entre mayor sea el valor del Chi-cuadrado mayor es la relación entre las variables.

Norman GR y Streiner DL. (2005). Bioestadística

Page 3: Chi cuadrado

La prueba χ² de Pearson es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.La fórmula que da el estadístico es la siguiente:

Cuanto mayor sea el valor de , menos verosímil es que la hipótesis sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.Los grados de libertad gl vienen dados por :gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.Criterio de decisión:No se rechaza H0 cuando .

En caso contrario sí se rechaza.Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.

χ²

Page 4: Chi cuadrado

La prueba χ² de Pearson es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.La fórmula que da el estadístico es la siguiente:

Cuanto mayor sea el valor de , menos verosímil es que la hipótesis sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.Los grados de libertad gl vienen dados por :gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.Criterio de decisión:No se rechaza H0 cuando .

En caso contrario sí se rechaza.Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.

χ²

Page 5: Chi cuadrado

PRUEBA de Chi-cuadrado 

En lo operativo: consiste en un contraste de frecuencias observadas (FO) con las frecuencias teóricos o esperados (FE) representadas en la tabla de contingencia de dimensiones 2 x 2

Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico tomará un valor igual a 0; por el contrario

Si existe una gran discrepancias entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. (no hay asociación entre variables)

Norman GR y Streiner DL. (2005). Bioestadística

La prueba parte de la hipótesis que las variables en estudio son independientes; es decir, que no existe ninguna relación entre ellas.

El objetivo de esta prueba es comprobar la hipótesis mediante el nivel de significación, por lo que sí el valor de la significación es mayor o igual que el Alfa (0.05), se acepta la hipótesis, pero si es menor se rechaza.

Page 6: Chi cuadrado

Para obtener los valores esperados, estos se calculan a través del producto de los totales marginales (multiplicar) dividido por el número total de casos (n).

Tabla de contingencia:Valores observados y valores esperados (entre paréntesis)

GESTANTES

RECIÉN NACIDO DE BAJO PESO

 TotalSí NoFrecuencia Frecuencia

Observada Esperada Observada Esperada

Fumadora 43 (18.5) 207 (231.5) 250

No fumadora 105 (129.5) 1645 (1620.5) 1750

Total 148 1852 2.000

Norman GR y Streiner DL. (2005). Bioestadística

Ejemplo: Se propone valorar la relación entre fumar durante la gestación y el

bajo peso del niño al nacer..

Page 7: Chi cuadrado

Lo primero es plantear un contraste de hipótesis:

H0: No hay asociación entre las variables, (en el ejemplo, el bajo peso del niña/o y el hecho de fumar durante la gestación son independientes, no están asociados).

Y la hipótesis alternativa:

Ha: Sí hay asociación entre las variables, es decir, el bajo peso y el fumar durante la gestación están asociados.

χ 2  = 40,04

Decisión:40,04 supera el valor para α =0.05 (3,8415 con 1 Gl.), por lo que podemos concluir que las dos variables no son independientes, sino que están asociadas.

A la vista de los resultados, rechazamos la hipótesis nula (H0) y aceptamos la hipótesis alternativa  (Ha) como probablemente cierta.

Norman GR y Streiner DL. (2005). Bioestadística

Page 8: Chi cuadrado

Dentro de la distribución Ji Cuadrado, los denominados «Grados de Libertad» atribuibles a un conjunto de variables, equivalen al número de datos independientes entre sí existentes dentro de un conjunto que es necesario conocer previamente para poder estimar el valor de cualquier otro dato independiente del mismo grupo.

Ejemplo, si se afirma que en una sala de espera hay un conjunto de 30 pacientes, conformado por 3 clases de enfermos independientes entre sí, pues algunos pacientes son pediátricos, otros adolescentes y otros adultos, entonces:

1.Basta con saber que en la sala hay 12 pacientes pediátricos y 9 adolescentes para poder calcular exactamente que los restantes 9 pacientes son adultos.

2.El Grado de Libertad o grado de independencia existente entre las tres clases de datos tiene un valor de 2, pues únicamente conociendo el valor de 2 clases de datos se puede saber con exactitud cómo están distribuidas las tres clases de pacientes dentro de la población total del conjunto analizado.

3.El Grado de Libertad, que usualmente se representa por las letras G.L., equivale a restarle 1 a un conjunto conformado por k variables consideradas independientes entre sí, lo cual se resume en la fórmula: G.L. = k − 1

GRADOS DE LIBERTAD

Page 9: Chi cuadrado

GRADOS DE LIBERTADEn síntesis, el Grado de Libertad, que usualmente se representa por las letras G.L., equivale a restarle 1 a un conjunto conformado por k variables consideradas independientes entre sí, lo cual se resume en la fórmula: G.L. = k − 1. Así, si el conjunto contiene 5 variables consideradas independientes entre sí, entonces el Grado de Libertad que le corresponde a cualquier variable de ese conjunto es de: G.L. = 5−1 = 4, lo que equivale a que en ese conjunto sólo 4 variables una vez conocidas pueden operar de manera independiente sin necesidad de que deba ser conocido el valor exacto de la quinta variable del conjunto. Y si el conjunto contiene 2 variables independientes, como en el ejemplo de las manzanas verdes y las manzanas rojas, entonces el Grado de Libertad es 1, ya que: G.L. = 2−1 = 1, lo que equivale a que en ese conjunto sólo una variable ya conocida puede operar de manera independiente sin necesidad de que deba ser conocido el valor exacto de la otra.

Page 10: Chi cuadrado
Page 11: Chi cuadrado

Prueba t Prueba t de Students

Dr. RUBÉN PÁEZ LANDETA

Page 12: Chi cuadrado

La distribución t (de Student) surge ante el requerimiento de estimar la media de una población normalmente distribuida cuando el tamaño

de la muestra es pequeño.

Hipótesis nula "H0" → µ1 = µ2; 

Hipótesis alternativa "H1" → µ1 ≠ µ2 

 Con la prueba t se comparan las medias y las desviaciones estándar de un grupo de datos y se determina si entre esos parámetros las

diferencias son estadísticamente significativas o si sólo son diferencias aleatorias.

PRUEBA t de Student 

Norman GR y Streiner DL. (2005). Bioestadística

Page 13: Chi cuadrado

1.Ordenar los datos en función de los momentos antes y después, y obtener las diferencias entre ambos.

2.Calcular la media aritmética de las diferencias ( ).

3.Calcular la desviación estándar de las diferencias (d).

4.Calcular el valor de t por medio de la ecuación.

5.Calcular los grados de libertad (gl) = N - 1. (el número de variables aleatorias independientes de la muestra - 1).

6.Comparar el valor de t calculado con respecto a grados de libertad en la tabla respectiva, a fin de obtener la probabilidad.

7. Decidir si se acepta o rechaza la hipótesis.

¿Cuál es el procedimiento para ejecuta una prueba t-Student?

Norman GR y Streiner DL. (2005). Bioestadística

Page 14: Chi cuadrado

Objetivo. Comparar los niveles de ansiedad de jóvenes no asertivos (con dificultad para comunicarse) antes y después de participar en un

entrenamiento de habilidades sociales.

Especificaciones. 10 jóvenes no asertivos que asisten a la Clínica Universitaria de Salud Integral (CUSI). Se evaluó el número de comportamientos ansiosos que reportaban los jóvenes antes y después del entrenamiento.

Planteamiento de la hipótesis.• Hipótesis alterna (Ha). El nivel de ansiedad de los jóvenes no asertivos disminuye después de participar en un entrenamiento en habilidades sociales, existiendo diferencias significativas entre antes y después.

• Hipótesis nula (Ho). Los cambios observados antes y después del entrenamiento en habilidades sociales se deben al azar, y no hay diferencias entre ambos períodos.

Norman GR y Streiner DL. (2005). Bioestadística

Ejemplo:

Page 15: Chi cuadrado

Comparar los niveles de ansiedad de jóvenes no asertivos

Nivel de significación. Para todo valor de probabilidad menor que 0.05 se acepta Ha y, se rechaza Ho. si es mayor o igual 0.05

Puntaje obtenido de 10 jóvenes no asertivos que asisten a la CUSI.

Norman GR y Streiner DL. (2005). Bioestadística

Page 16: Chi cuadrado

1. edia aritmética de las diferencias2. Desviación estándar de las diferencias3. valor de t de la ecuación

= 0.05gl = 9to = 5.79tt = 2.262

Cálculo de la prueba estadística.

El valor calculado u obtenido de t (5.79) se compara con los valores críticos de la distribución t (tabla), y se observa que a una probabilidad de 0.05 le corresponde 2.262 de tt. Por lo tanto, el cálculo tiene un probabilidad menor que 0.05.

Decisión. Como toto es de 5.79, con 9 grados de libertad, tiene un valor mayor que tt = 2.262 o una probabilidad menor que 0.05, entonces se acepta Ha y se rechaza Ho.

Interpretación. El nivel de ansiedad de jóvenes no asertivos disminuye después de participar en un entrenamiento en habilidades sociales, existiendo diferencias significativas entre antes y después.

Norman GR y Streiner DL. (2005). Bioestadística

Page 17: Chi cuadrado