Distribucion de Chi Cuadrado

25
COMPROBACION DE HISPOTESIS : Distribución de chi cuadrado ING. ROY DONALDO SILVA

description

como se distribuye el chi cuadrado

Transcript of Distribucion de Chi Cuadrado

COMPROBACION DE HISPOTESIS : Distribución de chi cuadrado

ING. ROY DONALDO SILVA

Etapas Básicas en Pruebas de Hipótesis.

Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en parámetro poblacional. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional ( µ). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

• Una hipótesis estadística se denota por “H” y son dos:

• Ho: hipótesis nula• H1: hipótesis alternativa

El término ‘hipótesis‘ deriva del griego y significa suponer o poner bajo consideración. Una hipótesis es un supuesto que puede ser verdadero o puede ser falso ; la característica principal y más elemental de una hipótesis tiene que ver con su calidad de proposición, de posibilidad o de sugerencia que debe ser todavía comprobada y aprobada para transformarse finalmente en una aseveración o teoría científica

etapasEtapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula

(H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5% o según lo establecido, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve como estadística de prueba.

Consecuencias de las Decisiones en Pruebas de Hipótesis.

Decisiones Posibles

Situaciones Posibles

La hipótesis nula es verdadera La hipótesis nula es falsa

Aceptar la Hipótesis Nula

Se acepta correctamente

Error tipo II

Rechazar la Hipótesis Nula

Error tipo I Se rechaza correctamente

Errores de tipo I y de tipo II. Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se cometió un error de tipo II. En ambos casos, se ha producido un juicio erróneo. Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica, un tipo de error puede ser más grave que el

otro, y debe alcanzarse un compromiso que disminuya el error más grave

• Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos.

• • Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al

probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

• • Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística

muestral con el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la

• alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

Prueba de chi-cuadrado• A la prueba “Chi-cuadrado” se le llama coeficiente X2 .

Debe usarse cuando los datos obtenidos en su investigación son de nivel nominal (es decir, asigna sujetos a categoría). Esto significa que en lugar de medir los puntajes de los sujetos, sólo es posible asignar los sujetos a una o más categorías. Además sólo puede usarse cuando se asigna sujetos diferentes a cada grupo

• El objetivo de la prueba de chi-cuadrado es comparar las frecuencias observadas ( fo ) en cada una de las casillas de un cuadro de doble entrada, con frecuencias esperadas ( fe ) para cada una, si las diferencias entre ambas se debieran al azar, como lo afirma la hipótesis nula Ho .

Calculo de X2

El valor observado del estadístico X2 (Chi-cuadrado), viene dado por la siguiente fórmula: • • Donde :

fo= Frecuencia observada de realización de un acontecimiento o evento determinado. fe = Frecuencia esperada o teórica, que se determina de acuerdo al enunciado de la

hipótesis nula Ho.

Limitaciones de la Chi-cuadrada.

El uso de la chi-cuadrada tiene dos limitaciones:1. Cuando al resolver el problema solo existe un grado de libertad, esto es para

tablas de 2 x 2.2. La chi-cuadrada, solamente debe usarse cuando las frecuencias esperadas

sean mayores o iguales a cinco, en todas las celdas ( fe 5 ).

n

ni e

2eo2

f

)f(fX

Ejemplo Supongamos que se tiene una muestra de 340 personas,

cada una de las cuales ha dado su opinión en términos de “ACUERDO” y “DESACUERDO” frente a la proporción: “El respeto a la autoridad define a un buen ciudadano”. Para ello se le pregunto cual era su nivel de instrucción : alto, medio, bajo.

Si queremos establecer la posible asociación entre las respuestas obtenidas y el nivel de instrucción a un nivel de significación del 0.001 ó 0.1%, disponemos los datos en la siguiente tabla:

Datos : Respuestas

Nivel de Instrucción Acuerdo Desacuerdo

Total

Alto 35 (1) 10 (4)

45

Medio 30 (2) 108 (5)

138

Bajo 112 (3) 45 (6)

157

Total 177 163 340

Pasos

1. Planteamos la hipótesis Nula y la alternativa o también llamada de trabajo• Ho : hipótesis nula• H2 : hipótesis de trabajo

2. Establecemos el nivel de significancia que queremos comprobar3. Encontramos el chi cuadrado calculado

Para poder aplicar chi-cuadrado calculado, debemos hacer lo siguiente:

• Encontrar la diferencia entre cada frecuencia observada y la correspondiente frecuencia esperada, para lo cual se sugiere numerar las celdas.

• Elevar al cuadrado estas diferencias.

• Dividir cada diferencia elevada al cuadrado entre las correspondiente frecuencia esperada.

• Sumar los cocientes resultantes ( divisiones realizadas).

El valor de la suma encontrada será el X2 calculado

Paso 4 : Encontramos el valor del chi cuadrado teorico , utilizando las tablas de chi cuadrado de la siguiente manera : Para comparar los resultados, debemos escoger los grados de libertad :

Grados de Libertad ( V , gl , DF) = ( filas - 1 ) (columnas - 1)

Paso 5 : Contrastar el valor X2 calculado con el teórico.Aceptar o rechazar hipótesis de trabajo según :

X2t < X2c Rechazamos la hipótesis H0 y aceptamos H1

X2t > X2c Rechazamos la hipótesis H1 y aceptamos Ho

N

columna) de marginal lfila)(Tota o renglón de marginal (Total ef

23.4340

45x177e1f 21.6

340

45x163e4f

71.8340

138x177e2f 66.2

340

138x163e5f

81.7340

157x177e3f

75.3340

157x163e6f

86.13f

)f(fX

n

ni e

2eo2

N = número total de frecuencias observadas.

Por lo tanto

Comparación del chi cuadrado• 86.13 es el valor es el calculado.•  Si tomamos en cuenta las hipótesis; tendremos:

• H1 = El respeto a la autoridad está influido por el nivel educativo de las personas.  

• H0 = El respeto a la autoridad no está influido por el nivel educativo de las personas.

• Donde :

• H0 = Es la hipótesis nula y

• H1 = Es la hipótesis de trabajo.

•  

Para comparar los resultados, debemos escoger los grados de libertad.•  

• Grados de Libertad ( V ) = ( filas - 1 ) (columnas - 1 ).•  • Para este caso: V = ( 3 – 1) ( 2 – 1 ) = ( 2 ) ( 1 ) = 2•  

Si usamos un nivel de significación del 0.001 ó 0.1% entonces tendríamos:

X2t = 13.8 y X2

c = 86.13

Donde : X2

t = Chi- cuadrado teórico, buscado en tabla, con 2 grados de libertad y un nivel de significación del 0.001 o 0.1% .

X2c = Chi-cuadrado calculado.

Conclusión:Como el valor teórico es menor al valor calculado, es decir :• X2

t < X2c ( 13.8 < 86.13 ) ,

Rechazamos la hipótesis H0 y aceptamos H1, que dice que el respeto a la autoridad está influenciada por el nivel educativo. Lo cual indica que las variables están asociadas, en otras palabras que la distribución de frecuencias en la tabla no se debe al azar.

Para el primer caso de Limitaciones de la Chi-cuadrada.

: Cuando solo existe un grado de libertad.

Para este caso en aconsejable usar la fórmula corregida:

e

2

eo2

f

0.5ffX

Ejemplo 2:

Si desea verificar si la elección del tipo de carrera (Técnica o humanística) depende del sexo.

Se tomó una muestra de 200 estudiantes de último año de bachillerato de ambos sexos y se les preguntó si estudiarían carreras universitarias técnicas o humanísticas, para un Nivel de significación = 0.05 ó 5% . Elabore y compruebe una hipotesis. Par ello se obtuvieron las respuestas como se muestra en el siguiente cuadro:

Tabla de doble entrada

Carreras Preferidas

Sexo Técnicas Humanísticas Totales

Masculino

Femenino 36

26

52

86

88

112Total 62 138 200

Ejemplo de aplicacion • Probar la hipótesis que la carrera preferida es dependiente del sexo, es

decir, las diferencias entre las preferencias por las carreras según el sexo, es significativa, usar un nivel de significación de 0.05.

• • Planteamiento de Hipótesis:• • H0 = La preferencia del estudiante por las carreras • universitarias es independiente del sexo, es decir, el sexo • no influye en la elección de la carrera.• • H1 = La preferencia del estudiante por las carreras • universitarias depende del sexo, es decir, el sexo influye • en el tipo de carrera.

Para contrastar tenemos:

• X2 c = 6.41

• Para el teórico:•  • Grados de libertad V = ( f – 1 ) ( c – 1 ) • V = 1 x 1 = 1 • Nivel de significación = 0.05 ó 5% .•  

• Buscando en tabla : X2t = 3.48

•   Conclusión:

•  Como X2t < X2

c , entonces se rechaza H0 y se acepta H1 , y se puede decir que el sexo del estudiante influye en la escogitación de la carrera.

•  Nota: Entre más grande es el valor de X2 observado ( X2c ) más tentado se

está e rechazar la hipótesis nula, y aceptar que las diferencias son significativas. Por eso, el valor observado debe ser igual o mayor que el valor crítico dado por la tabla.

USO DE LA PRUEBA t STUDENT

• Esta medida también es utilizada para analizar diferencias entre grupos.

• • La prueba t student, básicamente se utiliza para hacer:• • Prueba de medias de dos muestras relacionadas.• • Prueba de medias de dos muestras independientes o no

relacionadas.•

Prueba de Medias de dos Muestras Relacionadas

• Para hacer uso de esta prueba se deben cumplir las siguientes condiciones:

• Debe de usarse para diseñar experimentales cuando se estudia una variable independiente, bajo dos condiciones.

• Cuando los mismos sujetos se desempeñan en ambas condiciones

Es para muestra pequeñas ( n 30).

Planteamiento de la hipótesis nula (Ho) se hace diciendo que las medias bajo ambas condiciones son iguales ,es decir : H0 : .

• Los grados de libertad ( V ), se calculan: V = n - 1 .

• La fórmula para hallar el t calculado (t c ) es:

21

1n

ddn

dt

2n

1i

n

1ii

2i

n

1ii

c