Pruebas de Hipótesis

56
Pruebas de Hipótesis Pruebas de Hipótesis Introducción Introducción UMSNH - UMSNH - FIE FIE La experiencia sobre el comportamiento de La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a del cumplimiento de alguna norma nos lleva a realizar realizar proposiciones sobre el valor de proposiciones sobre el valor de algún parámetro estadístico algún parámetro estadístico . . Estas proposiciones se deben contrastar con Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o para tomar una decisión entre aceptar o rechazar la proposición rechazar la proposición Estas proposiciones se denominan Estas proposiciones se denominan Hipótesis Hipótesis y y el procedimiento para decidir si se aceptan el procedimiento para decidir si se aceptan o se rechazan se denomina o se rechazan se denomina Prueba de Prueba de Hipótesis Hipótesis Una prueba de hipótesis es una herramienta Una prueba de hipótesis es una herramienta de análisis de datos que puede en general de análisis de datos que puede en general formar parte de un formar parte de un experimento comparativo experimento comparativo más completo más completo

description

La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadístico. Pruebas de Hipótesis. - PowerPoint PPT Presentation

Transcript of Pruebas de Hipótesis

Page 1: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción

UMSNH - FIEUMSNH - FIE

La experiencia sobre el comportamiento de algún índice de un proceso, La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadísticoproposiciones sobre el valor de algún parámetro estadístico. .

Estas proposiciones se deben contrastar con la realidad (mediante el Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposiciónproposición

Estas proposiciones se denominan Estas proposiciones se denominan HipótesisHipótesis y el procedimiento para y el procedimiento para decidir si se aceptan o se rechazan se denomina decidir si se aceptan o se rechazan se denomina Prueba de HipótesisPrueba de Hipótesis

Una prueba de hipótesis es una herramienta de análisis de datos que Una prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un puede en general formar parte de un experimento comparativoexperimento comparativo más más completocompleto

Page 2: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

IntroducciónIntroducción

UMSNH - FIEUMSNH - FIE

Una Una hipótesis Estadísticahipótesis Estadística es un proposición sobre los parámetros de una es un proposición sobre los parámetros de una población o sobre la distribución de probabilidad de una variable población o sobre la distribución de probabilidad de una variable aleatoriaaleatoria

EjemploEjemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los : Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión promedio (que es un parámetro (de combustión promedio (que es un parámetro () de dicha distribución). De manera ) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.

El planteamiento formal de la situación se realiza en términos de una El planteamiento formal de la situación se realiza en términos de una Hipótesis NulaHipótesis Nula (que es la proposición que se quiere poner a prueba) y una (que es la proposición que se quiere poner a prueba) y una Hipótesis AlternativaHipótesis Alternativa, la , la cual se aceptará si se rechaza la hipótesis nula:cual se aceptará si se rechaza la hipótesis nula:

Hipótesis Nula: Hipótesis Nula: HH00: : = 50 cm/seg = 50 cm/segHipótesis Alternativa:Hipótesis Alternativa: HH11: : 50 cm/seg 50 cm/seg

• En el ejemplo se tiene una En el ejemplo se tiene una Hipótesis Alternativa BilateralHipótesis Alternativa Bilateral, ya que se verifica para , ya que se verifica para valores de valores de a ambos lados de 50 cm/seg. a ambos lados de 50 cm/seg.

Page 3: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

IntroducciónIntroducción

UMSNH - FIEUMSNH - FIE

En ocasiones interesa una En ocasiones interesa una Hipótesis Alternativa UnilateralHipótesis Alternativa Unilateral, Por ejemplo:, Por ejemplo: HH00: : = 50 cm/seg = 50 cm/seg HH00: : = 50 cm/seg = 50 cm/seg HH11: : < 50 cm/seg < 50 cm/seg HH11: : > 50 cm/seg > 50 cm/seg

¿De donde puede surgir una Hipótesis Nula sobre un parámetro?¿De donde puede surgir una Hipótesis Nula sobre un parámetro?¿Cuál sería el interés dependiendo del origen de la hipótesis?¿Cuál sería el interés dependiendo del origen de la hipótesis?

1)1) OrigenOrigen: Experiencia, pruebas pasadas o conocimiento del proceso. : Experiencia, pruebas pasadas o conocimiento del proceso. InterésInterés: : averiguar si ha cambiado el parámetroaveriguar si ha cambiado el parámetro

2)2) OrigenOrigen: Alguna teoría o modelo sobre el funcionamiento del proceso. : Alguna teoría o modelo sobre el funcionamiento del proceso. InterésInterés: : Verificar la validés de dicha teoríaVerificar la validés de dicha teoría

3)3) Origen: Origen: Especificaciones de diseño, obligaciones contractuales, normas a cumplir Especificaciones de diseño, obligaciones contractuales, normas a cumplir o solicitudes del cliente.o solicitudes del cliente. Interés: Interés: probar el cumplimiento o incumplimiento de las probar el cumplimiento o incumplimiento de las especificaciones.especificaciones.

La verdad o falsedad de la hipótesis NO puede conocerse con total La verdad o falsedad de la hipótesis NO puede conocerse con total seguridad a menos que pueda examinarse toda la poblaciónseguridad a menos que pueda examinarse toda la población

óó

Page 4: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

IntroducciónIntroducción

UMSNH - FIEUMSNH - FIE

Procedimiento General para la prueba de una hipótesisProcedimiento General para la prueba de una hipótesis

Tomar un Tomar un muestramuestra aleatoriaaleatoria

Calcular un Calcular un estadísticoestadístico basado en la muestra basado en la muestra

Usar el estadístico y sus propiedades para tomar una Usar el estadístico y sus propiedades para tomar una decisióndecisión sobre la sobre la Hipótesis NulaHipótesis Nula

Page 5: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Consideremos el ejemplo anterior de la rapidez de combustión. : Consideremos el ejemplo anterior de la rapidez de combustión. Aquí se tenía:Aquí se tenía: HH00: : = 50 cm/seg = 50 cm/seg

HH11: : 50 cm/seg 50 cm/seg

Aceptación de HAceptación de H00.- Un valor de la media muestral .- Un valor de la media muestral xx “muy cercano” a 50 “muy cercano” a 50 cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo es es necesario introducir un criterionecesario introducir un criterio para decidir que tanto es muy cercano, para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: para el ejemplo este criterio pudiera ser: 48.5 48.5 x x 51.5, 51.5, si esto ocurre si esto ocurre se acepta Hse acepta H00 De lo contrario, es decir, si De lo contrario, es decir, si x <x < 48.5 o x >51.5, 48.5 o x >51.5, se acepta Hse acepta H11

__

__

__ __

48.548.5 50 50 51.5 51.5

Región Crítica Región Crítica Región de aceptaciónRegión de aceptación Región Crítica Región CríticaSe acepta HSe acepta H11 Se acepta HSe acepta H00 Se acepta H Se acepta H11 50 50 = 50 = 50 50 50

Valores CríticosValores Críticos

Page 6: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Errores Tipo I y Tipo IIErrores Tipo I y Tipo II

UMSNH - FIEUMSNH - FIE

El procedimiento anterior puede llevarnos a una de dos conclusiones El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:erróneas:

Error Tipo IError Tipo I.- Se rechaza H.- Se rechaza H00 cuando ésta es verdadera cuando ésta es verdadera

En el ejemploEn el ejemplo se cometerá un error de tipo I cuando se cometerá un error de tipo I cuando =50=50, pero , pero xx para para la muestra considerada cae en la región críticala muestra considerada cae en la región críticaY se cometerá un error de tipo II cuando Y se cometerá un error de tipo II cuando 50 50 pero pero xx para la muestra para la muestra considerada cae en la región de aceptación considerada cae en la región de aceptación

Error Tipo IIError Tipo II.- Se acepta H.- Se acepta H00 cuando ésta es falsa cuando ésta es falsa__

__

Condición realCondición real

DecisiónDecisiónHH00 verdadera verdadera HH00 falsa falsa

Rechazar HRechazar H00 Error Tipo IError Tipo I okok

Aceptar HAceptar H00 okok Error Tipo IIError Tipo II

Page 7: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error Tipo IError Tipo I

UMSNH - FIEUMSNH - FIE

A la probabilidad de cometer un error de Tipo I se denota por A la probabilidad de cometer un error de Tipo I se denota por , y se le , y se le llama el nivel o llama el nivel o tamaño de significanciatamaño de significancia de la prueba es decir de la prueba es decir

= P(error Tipo I)= P(rechazar H= P(error Tipo I)= P(rechazar H0 0 | H| H00 es verdadera) es verdadera)

EjemploEjemplo: Calcular : Calcular para el ejemplo de la rapidez de combustión para una muestra de para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es =2.5 cm/seg.=2.5 cm/seg.

__

= normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))= normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79)) = 0.288+ 0.288 = = 0.288+ 0.288 = 0.05760.0576

Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis Hla Hipótesis H00: : =50 cm/seg, cuando ésta es verdadera=50 cm/seg, cuando ésta es verdadera..

SoluciónSolución: en este caso : en este caso = P( x caiga en la región crítica | = P( x caiga en la región crítica | =50), es decir:=50), es decir: = P( x < 48.5) + P( x > 51.5)= P( x < 48.5) + P( x > 51.5)

RecordandoRecordando que La distribución de x es Normal con media que La distribución de x es Normal con media y desviación y desviación estándar estándar //N =0.79, por lo tanto, usando Matlab: N =0.79, por lo tanto, usando Matlab:

__ ____

Page 8: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error Tipo IError Tipo I

UMSNH - FIEUMSNH - FIE

Es claro que Es claro que se puede reducir de dos maneras: se puede reducir de dos maneras:- Aumentando la región de aceptación- Aumentando la región de aceptación- Aumentando el tamaño de la muestra- Aumentando el tamaño de la muestra

EjemploEjemplo: recalcular : recalcular del ejemplo anterior para a) los nuevos límites de la región de del ejemplo anterior para a) los nuevos límites de la región de aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificacionesmodificaciones

SoluciónSolución::a) a) = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = = 0.01140.0114b) b) = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = = 0.01640.0164c) c) = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = = 0.00140.0014

Page 9: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error tipo IIError tipo II

UMSNH - FIEUMSNH - FIE

Para evaluar un experimento de prueba de hipótesis también se requiere Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por calcular la probabilidad del error de Tipo II, denotada por , es decir, es decir

= P(error Tipo II) = P(aceptar H= P(error Tipo II) = P(aceptar H00 | H | H00 es falsa) es falsa)

Sin embargo, no es posible calcular Sin embargo, no es posible calcular si no se tiene una hipótesis si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valoresprueba en lugar de un rango de valores

Por ejemploPor ejemplo, supongamos que es importante rechazar H, supongamos que es importante rechazar H00 si la rapidez si la rapidez promedio de combustión promedio de combustión es mayor que 52 cm/seg o menor que 48 es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar Haceptar H00: : =50 cuando el valor verdadero es =50 cuando el valor verdadero es =52.=52.

Page 10: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error tipo IIError tipo II

UMSNH - FIEUMSNH - FIE

45 46 47 48 49 50 51 52 53 54 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

H0: H0: =50=50 H1: H1: =52=52

Usando Matlab:Usando Matlab: = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.26430.2643

De acuerdo a la figura: De acuerdo a la figura: = P(48.5 = P(48.5 x x 51.5 | 51.5 | =52)=52)__

Page 11: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error tipo IIError tipo II

UMSNH - FIEUMSNH - FIE

Usando Matlab:Usando Matlab: = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.89230.8923

La probabilidad de obtener un error de tipo II aumenta muy rápido a La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero medida que el valor verdadero tiende al valor hipotético, por ejemplo, tiende al valor hipotético, por ejemplo, si suponemos que si suponemos que =50.5, y recalculamos =50.5, y recalculamos , obtenemos, obtenemos

también depende del tamaño de la muestra, por ejemplo, si N=16 también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando obtenemos en el ejemplo cuando =52: =52: =0.625, por lo tanto=0.625, por lo tanto = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.21190.2119

Es decir, Es decir, disminuye cuando N aumenta, excepto si el valor real de disminuye cuando N aumenta, excepto si el valor real de está muy cerca del hipotéticoestá muy cerca del hipotético

Page 12: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Conclusiones Fuerte y DébilConclusiones Fuerte y Débil

UMSNH - FIEUMSNH - FIE

Es por eso que Es por eso que el rechazo de Hel rechazo de H00 siempre se considera como una siempre se considera como una Conclusión FuerteConclusión Fuerte. (los datos aportan fuerte evidencia de que H. (los datos aportan fuerte evidencia de que H00 es es falsa)falsa)

Como uno puede elegir los valores críticos del intervalo de aceptación Como uno puede elegir los valores críticos del intervalo de aceptación uno controla el valor de uno controla el valor de . Uno puede entonces controlar la probabilidad . Uno puede entonces controlar la probabilidad de rechazar de manera errónea Hde rechazar de manera errónea H00..

La decisión de La decisión de aceptar Haceptar H00 se considera una se considera una Conclusión DébilConclusión Débil, a menos , a menos que se sepa que que se sepa que es considerablemente pequeño. es considerablemente pequeño.

Por esto en lugar de decir “Por esto en lugar de decir “se acepta Hse acepta H00” se prefiere decir “” se prefiere decir “incapaz de incapaz de rechazar Hrechazar H00”, es decir, no se ha encontrado evidencia suficiente para ”, es decir, no se ha encontrado evidencia suficiente para rechazar Hrechazar H00. O sea, . O sea, no quiere decir que exista gran evidencia de que Hno quiere decir que exista gran evidencia de que H00 sea cierta sino que no hay gran evidencia de que sea falsasea cierta sino que no hay gran evidencia de que sea falsa..

Page 13: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Hipótesis UnilateralesHipótesis Unilaterales

UMSNH - FIEUMSNH - FIE

HH00: : =50 cm/seg=50 cm/segHH11: : <50 cm/seg<50 cm/seg

En el ejemplo supongamos que si la rapidez media de combustión es En el ejemplo supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿cómo deben plantearse las hipótesis?fuerte. ¿cómo deben plantearse las hipótesis?

Nótese que aunque HNótese que aunque H00 está planteada como una igualdad, se sobre- está planteada como una igualdad, se sobre-entiende que incluye cualquier valor de entiende que incluye cualquier valor de no especificado por H no especificado por H11, es , es decir, decir, la incapacidad de rechazar Hla incapacidad de rechazar H00 no significa que no significa que =50, sino que no =50, sino que no se tiene evidencia fuerte que apoye a Hse tiene evidencia fuerte que apoye a H11, , es decires decir, pudiera ser que , pudiera ser que =50=50 o que o que >50>50

Page 14: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Hipótesis UnilateralesHipótesis Unilaterales

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Un embotellador de refresco desea estar seguro de que las : Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de botellas que usa tienen en promedio un valor que supera el mínimo de présión de estallamiento de 200 psi. El embotellador puede formular una présión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:prueba de hipótesis de dos maneras:

Con el planteamiento (1) Como el rechazo de HCon el planteamiento (1) Como el rechazo de H00 es una conclusión es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psilas botellas soportan mayor presión que 200 psi

HH00: : =200 psi=200 psi HH00: : =200 psi=200 psiHH11: : >200 psi>200 psi HH11: : <200 psi<200 psi

(1)(1) (2)(2)

Con el planteamiento (2) si se rechaza HCon el planteamiento (2) si se rechaza H00 se concluye que las botellas se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que halla evidencia fuerte en sentido contrariosatisfactorias a menos que halla evidencia fuerte en sentido contrario

¿cuál planteamiento es el correcto?¿cuál planteamiento es el correcto?

Page 15: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Hipótesis UnilateralesHipótesis Unilaterales

UMSNH - FIEUMSNH - FIE

Es decir, en la Hipótesis alternativa se debe poner la Es decir, en la Hipótesis alternativa se debe poner la proposición sobre la cual es importante llegar a una proposición sobre la cual es importante llegar a una conclusión fuerte:conclusión fuerte:

HH00: : =200 psi=200 psi HH00: : =200 psi=200 psiHH11: : >200 psi>200 psi HH11: : <200 psi<200 psi

(1)(1) (2)(2)

Page 16: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Procedimiento general para la prueba de Procedimiento general para la prueba de HipótesisHipótesis

UMSNH - FIEUMSNH - FIE

Antes de Examinar los datos muestrales:Antes de Examinar los datos muestrales:1.1. Identificar el parámetro de interésIdentificar el parámetro de interés2.2. Establecer la Hipótesis Nula HEstablecer la Hipótesis Nula H00

3.3. Especificar una Hipótesis alternativa adecuada HEspecificar una Hipótesis alternativa adecuada H11

4.4. Seleccionar un nivel de significancia Seleccionar un nivel de significancia Usando los datos muestrales:Usando los datos muestrales:

5. 5. Establecer un estadístico de prueba adecuadoEstablecer un estadístico de prueba adecuado6. 6. Establecer una región de rechazoEstablecer una región de rechazo7. 7. Calcular todas las cantidades muestrales necesarias para el Calcular todas las cantidades muestrales necesarias para el

estadísticoestadístico8. 8. Decidir si debe o no rechazarse HDecidir si debe o no rechazarse H00

Page 17: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida

UMSNH - FIEUMSNH - FIE

Si se desea probar la Hipótesis:Si se desea probar la Hipótesis:HH00: : = = 00

HH11: : 00

Se puede usar el estadístico de prueba Z siguienteSe puede usar el estadístico de prueba Z siguiente

El cual tiene una distribución Normal con media cero y varianza 1 (si se El cual tiene una distribución Normal con media cero y varianza 1 (si se cumplen las suposiciones del teorema del límite central)cumplen las suposiciones del teorema del límite central)

Nσ/

μXZ 0

__

Page 18: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida

UMSNH - FIEUMSNH - FIE

Entonces, para una Entonces, para una dada podemos establecer las siguientes regiones dada podemos establecer las siguientes regiones de aceptación y crítica:de aceptación y crítica:

-z-z/2 /2 zz/2/2 Z Z

/2 /2 /2/2

Región de aceptaciónRegión de aceptaciónregión crítica región críticaregión crítica región crítica

ConclusionesConclusiones::

Rechazar HRechazar H00 si: si: z < -zz < -z/2/2 o z > z o z > z/2/2 No rechazar HNo rechazar H00 si: si: - z- z/2/2 z z z z/2/2

Page 19: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Se ilustrarán los 8 pasos del procedimiento general para el : Se ilustrarán los 8 pasos del procedimiento general para el ejemplo del combustible sólido para sistemas de escape de aeronaves. ejemplo del combustible sólido para sistemas de escape de aeronaves. En este caso se conoce En este caso se conoce =2 cm/seg, se desea probar si la media =2 cm/seg, se desea probar si la media es es de 50 cm/seg. Se selecciona una muestra aleatoria de tamaño N=25, de 50 cm/seg. Se selecciona una muestra aleatoria de tamaño N=25, obteniendo x=51.3 cm/seg. obteniendo x=51.3 cm/seg. Se especifica un nivel de sginificancia Se especifica un nivel de sginificancia =0.05=0.05 ¿A qué conclusiones se debe llegar? ¿A qué conclusiones se debe llegar?

1)1) El parámetro de interés es El parámetro de interés es (rapidez promedio de combustión) (rapidez promedio de combustión)2)2) HH00: : = 50 cm/seg = 50 cm/seg3)3) HH11: : 50 cm/seg 50 cm/seg4)4) = 0.05= 0.05

__

Page 20: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida

UMSNH - FIEUMSNH - FIE

5) La estadística de prueba es 5) La estadística de prueba es

6) Rechazar H6) Rechazar H00 si z>1.96 o si z<-1.96 si z>1.96 o si z<-1.96 (consecuencia del paso 4)(consecuencia del paso 4)7) cálculos7) cálculos

8) Conclusión como z = 3.25 > 1.96, 8) Conclusión como z = 3.25 > 1.96, se rechaza Hse rechaza H00: : = 50 cm/seg con = 50 cm/seg con un nivel de significancia un nivel de significancia = 0.05 = 0.05

8) Es decir, 8) Es decir, Se concluye que en base a una muestra de 25 mediciones la Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustión es diferente de 50 cm/segrapidez promedio de combustión es diferente de 50 cm/seg, de , de hecho, existe evidencia fuerte de que ésta es mayor.hecho, existe evidencia fuerte de que ésta es mayor.

Nσ/

μXZ 0

__

25.3252/

503.51Z

Page 21: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Valores PValores P

UMSNH - FIEUMSNH - FIE

Una manera de notificar los resultados de una prueba de hipótesis es Una manera de notificar los resultados de una prueba de hipótesis es establecer si la hipótesis nula fue o no rechazada con un establecer si la hipótesis nula fue o no rechazada con un nivel nivel especificado especificado de significancia de significancia

Una alternativa es especificar Una alternativa es especificar el nivel de significancia el nivel de significancia más pequeño más pequeño que conduce al rechazo de la hipótesis nulaque conduce al rechazo de la hipótesis nula. A este se le llama el . A este se le llama el Valor PValor P

Este valor P sólo depende de la muestra tomada, es decir, para una Este valor P sólo depende de la muestra tomada, es decir, para una muestra y un estadístico calculado se puede obtener su valor P y muestra y un estadístico calculado se puede obtener su valor P y comparar con un comparar con un especificado. Entonces, especificado. Entonces, si P<si P<, H, H00 se rechaza se rechaza..

Page 22: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Valores PValores P

UMSNH - FIEUMSNH - FIE

En el caso de la distribución normal para la pureba sobre la media es En el caso de la distribución normal para la pureba sobre la media es fácil calcular el valor P. Si zfácil calcular el valor P. Si z00 fue el valor calculado del estadístico de fue el valor calculado del estadístico de prueba, entonces:prueba, entonces:

Donde Donde (z) = P(Z(z) = P(Zz) (Función de distribución normal N(0,1))z) (Función de distribución normal N(0,1))

Para el ejemplo zPara el ejemplo z00= 3.25, entonces P=2(1-= 3.25, entonces P=2(1-(3.25))=0.0012. Es decir, H(3.25))=0.0012. Es decir, H00 será rechazada con cualquier nivel de significancia será rechazada con cualquier nivel de significancia 0.0012 0.0012

P = P =

2 [ 1- 2 [ 1- (|z(|z00|) ]|) ] Prueba de dos colas: HPrueba de dos colas: H00::==00, H, H11:: 00

1- 1- (z(z00)) Prueba de cola superior: HPrueba de cola superior: H00::==00, H, H11:: > > 00

(z(z00)) Prueba de cola inferior: HPrueba de cola inferior: H00::==00, H, H11:: < < 00

Si se usa el enfoque del valor P el paso 6 del procedimiento general de Si se usa el enfoque del valor P el paso 6 del procedimiento general de prueba de hipótesis ya no es necesario.prueba de hipótesis ya no es necesario.

Page 23: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra

UMSNH - FIEUMSNH - FIE

Consideremos la hipótesis bilateral Consideremos la hipótesis bilateral HH00::==00, H, H11:: 0.0.

Si HSi H00 es falsa y la media verdadera es es falsa y la media verdadera es = = 00 + + (con(con>0>0)). . El El estadístico de pruebaestadístico de prueba

se puede escribir como se puede escribir como

Es decir, Si HEs decir, Si H11 es verdadera Z tiene distribución Normal con media es verdadera Z tiene distribución Normal con media y varianza 1. y varianza 1.

Por lo tanto, el error Tipo 1 (Por lo tanto, el error Tipo 1 () se puede calcular como) se puede calcular como

Nσ/

μXZ 0

__

σNδ

Nσ/

δ)(μXZ 0

__

σNδ

σNδ

zβ α/2Φ

Y si definimos Y si definimos = = (-z(-z), obtenemos), obtenemosδ

)σz(zN βα/2

Page 24: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra

UMSNH - FIEUMSNH - FIE

Para el ejemplo del combustible sólido. Si al analista le interesa diseñar Para el ejemplo del combustible sólido. Si al analista le interesa diseñar la prueba de hipótesis de manera que si el valor verdadero de la prueba de hipótesis de manera que si el valor verdadero de es 51 es 51 cm/seg se rechace Hcm/seg se rechace H00 con una probabilidad alta (por ejemplo 90%) y con con una probabilidad alta (por ejemplo 90%) y con el mismo valor anterior de el mismo valor anterior de =0.05=0.05

En este caso En este caso =1, =1, =2, =2, =0.05 por lo tanto, mediante Matlab:=0.05 por lo tanto, mediante Matlab:

N= 4*(norminv(0.025) + norminv(0.1))^2 N= 4*(norminv(0.025) + norminv(0.1))^2 4242

ObservaciónObservación: Debe tenerse cuidado cuando se interpretan los resultados : Debe tenerse cuidado cuando se interpretan los resultados basados en una basados en una muestra muy grandemuestra muy grande, ya que es muy probable que se , ya que es muy probable que se detecte cualquier alejamiento (muy pequeño) respecto al valor hipotético detecte cualquier alejamiento (muy pequeño) respecto al valor hipotético oo . . Esta diferencia podría no tener ninguna importancia práctica pero Esta diferencia podría no tener ninguna importancia práctica pero conducir al rechazo de Hconducir al rechazo de H00

Page 25: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos

medias (varianzas conocidas)medias (varianzas conocidas)

UMSNH - FIEUMSNH - FIE

Se tienen Se tienen dos poblacionesdos poblaciones de interés. La primera con media de interés. La primera con media 11 y y varianza varianza 11

22 conocidas y la segunda con media conocidas y la segunda con media 22 y varianza y varianza 2222

conocidas. Interesa saber si las dos medias son iguales. Se plantean las conocidas. Interesa saber si las dos medias son iguales. Se plantean las hipótesishipótesis HH00: : = = 22

HH11: : 22

Por lo tanto el siguiente estadístico de pruebaPor lo tanto el siguiente estadístico de prueba

Es N(0,1) si HEs N(0,1) si H00 es verdadera. es verdadera.

Por lo tanto Por lo tanto se rechazará Hse rechazará H00 si z si z00>z>z/2/2 o z<z o z<z--/2/2

SuposicionesSuposiciones: Las dos poblaciones son normales o se cumplen las : Las dos poblaciones son normales o se cumplen las condiciones del teorema del límite central. condiciones del teorema del límite central. EntoncesEntonces el estadístico X el estadístico X11-X-X22 es una variable Normal con media es una variable Normal con media 1 1 - - 2 2 y varianza y varianza 11

22 /N /N11+ + 222/2//N/N22

__ __

2

22

1

21

2

___

1

___

XXZ

Page 26: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos

medias (varianzas conocidas)medias (varianzas conocidas)

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Un diseñador quiere reducir el tiempo de secado de una : Un diseñador quiere reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura. La fórmula 1 es la normal y pintura. Se prueban dos fórmulas de pintura. La fórmula 1 es la normal y la fórmula 2 posee un ingrediente secante que se espera reduzca el la fórmula 2 posee un ingrediente secante que se espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una tiempo de secado. Se sabe que el tiempo de secado tiene una desviación estándar de 8 min y que ésta no se afecta con la adición del desviación estándar de 8 min y que ésta no se afecta con la adición del nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1, y 10 con nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos promedio de secado de xla fórmula 2, obteniéndose tiempos promedio de secado de x11=121 min, =121 min, y xy x22=112 min. respectivamente. ¿A qué conclusión se llega sobre la =112 min. respectivamente. ¿A qué conclusión se llega sobre la eficacia del nuevo ingrediente utilizando eficacia del nuevo ingrediente utilizando =0.05.?=0.05.?

1)1) Cantidad de interés: Cantidad de interés: 1 1 - - 22

2)2) HH00: : = = 22 3)3) HH11: : > > 22 (se busca evidencia fuerte que indique que el tiempo de (se busca evidencia fuerte que indique que el tiempo de

secado promedio de la muestra 2 es menor)secado promedio de la muestra 2 es menor)

_ _ __

Page 27: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos

medias (varianzas conocidas)medias (varianzas conocidas)

UMSNH - FIEUMSNH - FIE

4)4) =0.05=0.055)5) El estadístico de prueba es El estadístico de prueba es

6)6) HH00 se rechazará si z>z se rechazará si z>z0.050.05 = 1.645 = 1.6457)7) Sustituyendo los datos, obtenemos z=(121-112)/(12.8)Sustituyendo los datos, obtenemos z=(121-112)/(12.8)1/21/2=2.52=2.528)8) Conclusión: Puesto que z = 2.52 > 1.645 se rechaza HConclusión: Puesto que z = 2.52 > 1.645 se rechaza H00 con un nivel con un nivel

de significancia de significancia =0.05 concluyéndose el nuevo ingrediente sí =0.05 concluyéndose el nuevo ingrediente sí disminuye el tiempo de secado.disminuye el tiempo de secado.

Alternativamente puede calcularse un valor P =1-Alternativamente puede calcularse un valor P =1-(2.52) = 0.0059, (2.52) = 0.0059, es decir, se rechazará Hes decir, se rechazará H00 para cualquier nivel de significancia para cualquier nivel de significancia 0.00590.0059

2

22

1

21

2

___

1

___

/)XX(Z

Page 28: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisIdentificación Causa - EfectoIdentificación Causa - Efecto

UMSNH - FIEUMSNH - FIE

En el ejemplo anterior se supone que fueron asignados En el ejemplo anterior se supone que fueron asignados de manera de manera aleatoriaaleatoria 10 especímenes a una fórmula ( 10 especímenes a una fórmula (tratamientotratamiento) y 10 especímenes ) y 10 especímenes a la otra luego se aplicó la pintura en un a la otra luego se aplicó la pintura en un orden aleatorioorden aleatorio a cada a cada especímen hasta pintar los 20. Este es un especímen hasta pintar los 20. Este es un Experimento Completamente Experimento Completamente AleatorizadoAleatorizado..

En un estudio estadístico sobre la incidencia del cáncer pulmonar entre En un estudio estadístico sobre la incidencia del cáncer pulmonar entre personas que fuman normalmente se hace un seguimiento en el tiempo personas que fuman normalmente se hace un seguimiento en el tiempo de los individuos a prueba. Este es un de los individuos a prueba. Este es un Experimento ObservacionalExperimento Observacional

En este caso no se puede asignar de manera aleatoria un tratamiento u En este caso no se puede asignar de manera aleatoria un tratamiento u otro (fumar o no fumar) a una porción de los individuos. Por otro lado, el otro (fumar o no fumar) a una porción de los individuos. Por otro lado, el hábito de fumar no es el único factor que influye en el desarrollo de hábito de fumar no es el único factor que influye en el desarrollo de cáncer pulmonar.cáncer pulmonar.

Page 29: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza

desconocidadesconocida

UMSNH - FIEUMSNH - FIE

Si la población tiene una distribución Normal con media Si la población tiene una distribución Normal con media y varianza y varianza 22 desconocidas pudiera utilizarse el estadístico Sdesconocidas pudiera utilizarse el estadístico S22 y el procedimiento y el procedimiento descrito anteriormente para varianza conocida (esto es válido para N descrito anteriormente para varianza conocida (esto es válido para N grande), pero si la muestra es pequeña, tendremos que usar el grande), pero si la muestra es pequeña, tendremos que usar el estadístico siguiente,estadístico siguiente,

el cual tiene una distribución t con N-1 grados de libertad,el cual tiene una distribución t con N-1 grados de libertad,

Así, para la prueba de Hipótesis bilateral Así, para la prueba de Hipótesis bilateral HH00: : = = 00

HH11: : 00

Se rechazará HSe rechazará H00 si t>t si t>t/2,N-1/2,N-1 o si t<t o si t<t--/2,N-1/2,N-1

NS/

μXT 0

__

Page 30: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza

desconocidadesconocida

UMSNH - FIEUMSNH - FIE

EjercicioEjercicio: Los siguientes son datos de pruebas de resistencia a la : Los siguientes son datos de pruebas de resistencia a la adhesión, los siguientes datos presentan la carga (en Mpa) a la cual 22 adhesión, los siguientes datos presentan la carga (en Mpa) a la cual 22 especímenes fallaron especímenes fallaron

¿Sugieren los datos que la carga promedio de falla es mayor que ¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga de falla tiene una distribución Normal y 10Mpa? Supóngase que la carga de falla tiene una distribución Normal y utilice utilice =0.05. Desarrolle los 8 pasos del procedimiento general y =0.05. Desarrolle los 8 pasos del procedimiento general y encuentre un valor P para la prueba.encuentre un valor P para la prueba.

19.8 18.5 17.6 16.7 15.8 15.4

14.1 13.6 11.9 11.4 11.4 8.8

7.5 15.4 15.4 19.5 14.9 12.7

11.9 11.4 10.1 7.9

Page 31: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Valor P de una prueba tValor P de una prueba t

UMSNH - FIEUMSNH - FIE

El valor P es el más pequeño nivel de significancia para el que HEl valor P es el más pequeño nivel de significancia para el que H00 debe debe rechazarse, esto es rechazarse, esto es el área de la colael área de la cola (de la curva de densidad de (de la curva de densidad de probabilidad) que está más allá del valor del estadístico (en este caso t). probabilidad) que está más allá del valor del estadístico (en este caso t). o el doble de esta área en pruebas bilaterales.o el doble de esta área en pruebas bilaterales.

Selección del Tamaño de la MuestraSelección del Tamaño de la Muestra

En todas las pruebas de hipótesis estadísticas se puede calcular el En todas las pruebas de hipótesis estadísticas se puede calcular el tamaño de la muestra (N) adecuada en función de la magnitud del error tamaño de la muestra (N) adecuada en función de la magnitud del error de tipo I que se permite. En cada tipo de prueba se encuentran fórmulas de tipo I que se permite. En cada tipo de prueba se encuentran fórmulas diferentes para N.diferentes para N.

Page 32: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Otras pruebas de HipótesisOtras pruebas de Hipótesis

UMSNH - FIEUMSNH - FIE

En forma similar a como se describió el caso de la media y la diferencia En forma similar a como se describió el caso de la media y la diferencia de medias, se pueden realizar diferentes pruebas de hipótesis para estos de medias, se pueden realizar diferentes pruebas de hipótesis para estos mismos u otros parámetros, lo único que cambia en cada caso es:mismos u otros parámetros, lo único que cambia en cada caso es:

- Las suposiciones sobre la distribución de la población- Las suposiciones sobre la distribución de la población- El estadístico elegido y por consiguiente- El estadístico elegido y por consiguiente- La distribución del estadístico.- La distribución del estadístico.

En la siguiente tabla se resumen algunas de las pruebas de hipótesis En la siguiente tabla se resumen algunas de las pruebas de hipótesis más utilizadasmás utilizadas

Page 33: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisOtras pruebas paramétricas de HipótesisOtras pruebas paramétricas de Hipótesis

UMSNH - FIEUMSNH - FIE

Prueba sobrePrueba sobre Hipótesis NulaHipótesis Nula SuposicionesSuposiciones Estadístico Estadístico de Pruebade Prueba

La mediaLa media= = 00 22 conocida conocida NormalNormal

= = 00 22 desconocida desconocida TT

Igualdad de Igualdad de mediasmedias

= = 22 22 = = 22 conocidas conocidas NormalNormal

= = 22 22 = = 22 desconocidas desconocidas TT

= = 22 22 22 conocidas conocidas TT

La varianzaLa varianza22 = = 22 dist. Normal, N pequeñadist. Normal, N pequeña JiJi22

22 = = 22 N grandeN grande NormalNormal

Igualdad de dos Igualdad de dos varianzasvarianzas

22 = = 22 FF

Una proporciónUna proporción p = pp = p00 NormalNormal

Igualdad de dos Igualdad de dos proporcionesproporciones

pp11 = p = p22 NormalNormal

Page 34: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Pruebas de Hipótesis No ParamétricasPruebas de Hipótesis No Paramétricas

UMSNH - FIEUMSNH - FIE

Las pruebas de hipótesis anteriores se llaman Las pruebas de hipótesis anteriores se llaman paramétricasparamétricas porque porque suponen conocida la distribución de la población y la hipótesis es acerca suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha distribución. de los parámetros de dicha distribución.

Otra clase de hipótesis es: No se sabe cual es la distribución de la Otra clase de hipótesis es: No se sabe cual es la distribución de la población y población y se desea probar la hipótesis de que cierta distribución en se desea probar la hipótesis de que cierta distribución en particular será un modelo satisfactorioparticular será un modelo satisfactorio. Por ejemplo, tal vez se requiera . Por ejemplo, tal vez se requiera probar si la distribución es Normalprobar si la distribución es Normal

Page 35: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Se parte de una Se parte de una muestra aleatoriamuestra aleatoria de tamaño N, proveniente de una de tamaño N, proveniente de una población cuya distribución de probabilidad es desconocida.población cuya distribución de probabilidad es desconocida.

Las N observaciones se acomodan en un Las N observaciones se acomodan en un HistogramaHistograma de frecuencia de frecuencia con k intervalos de clase. Sea con k intervalos de clase. Sea OOii la i-ésima frecuencia de clase la i-ésima frecuencia de clase

De la distribución de probabilidad propuesta se calcula la De la distribución de probabilidad propuesta se calcula la frecuencia frecuencia esperada Eesperada Eii en el i-ésimo intervalo de clase en el i-ésimo intervalo de clase

El El estadístico de prueba estadístico de prueba eses

El cual tiene una El cual tiene una distribución Jidistribución Ji22 con k-p-1 grados de libertad con k-p-1 grados de libertad si la si la población sigue la distribución propuesta. (donde p es el número de población sigue la distribución propuesta. (donde p es el número de parámetros de la población)parámetros de la población)

k

1i i

2ii2

E)E(O

χ

Page 36: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

La aproximación mejora a medida que N es más grandeLa aproximación mejora a medida que N es más grande

La hipótesis debe rechazarse si el valor del estadístico de prueba esLa hipótesis debe rechazarse si el valor del estadístico de prueba es2 2 > > 22

1-1-,k-p-1,k-p-1

PrecauciónPrecaución: Si las frecuencias esperadas son muy pequeñas el : Si las frecuencias esperadas son muy pequeñas el estadístico estadístico 22 no reflejará el alejamiento entre lo observado y lo no reflejará el alejamiento entre lo observado y lo esperado. (Se considera que valores menores de 5 son pequeños)esperado. (Se considera que valores menores de 5 son pequeños)

Si en una prueba resultan frecuencias esperadas pequeñas, se pueden Si en una prueba resultan frecuencias esperadas pequeñas, se pueden combinar intervalos de clase adyascentescombinar intervalos de clase adyascentes para aumentar estos valores, para aumentar estos valores, ya que no es necesario que los anchos de clase sean del mismo tamañoya que no es necesario que los anchos de clase sean del mismo tamaño

Page 37: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Ejemplo 1Ejemplo 1.- Un algoritmo para generar enteros pseudoealeatorios de 0 a .- Un algoritmo para generar enteros pseudoealeatorios de 0 a 9 ´se prueba para determinar si tiene una distribución uniforme, para ello 9 ´se prueba para determinar si tiene una distribución uniforme, para ello se generan 1000 números, obteniendo la siguiente tabla de frecuencia. se generan 1000 números, obteniendo la siguiente tabla de frecuencia. ¿Existe evidencia de que el generador funciona de manera correcta?. ¿Existe evidencia de que el generador funciona de manera correcta?. Utilice Utilice =0.05=0.05

Como EComo Eii se puede calcular sin estimar ningún parámetro a partir de la se puede calcular sin estimar ningún parámetro a partir de la muestra, entonces p=0 y el estadístico será jimuestra, entonces p=0 y el estadístico será ji22 con k-p-1=10-0-1=9 con k-p-1=10-0-1=9 grados de libertad.grados de libertad.

0 1 2 3 4 5 6 7 8 9

Oi 94 93 112 101 104 95 100 99 108 94

Ei 100 100 100 100 100 100 100 100 100 100

Page 38: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

1)1) Variable de interés: distribución de los números pseudoaleatoriosVariable de interés: distribución de los números pseudoaleatorios2)2) HH00: La distribución es uniforme en el intervalo de 0 a 9: La distribución es uniforme en el intervalo de 0 a 93)3) H1: La distribución No es uniforme en ese intervaloH1: La distribución No es uniforme en ese intervalo4)4) = 0.05= 0.055)5) El estadístico de prueba es El estadístico de prueba es 6)6) Se rechazará HSe rechazará H00 si si 22> > 22 0.05,90.05,9=16.92=16.927)7) CálculosCálculos

22= 0.01*( (94-100)= 0.01*( (94-100)22+(93-100)+(93-100)22+...+(94-100)+...+(94-100)22 )=3.72 )=3.728)8) Conclusiones: como 3.72 < 16.92 No es posible rechazar la Conclusiones: como 3.72 < 16.92 No es posible rechazar la

hipótesis. Por lo tanto parece ser que el generador de números hipótesis. Por lo tanto parece ser que el generador de números aleatorios trabaja bien. aleatorios trabaja bien.

¿Cual es el valor P de la prueba ?¿Cual es el valor P de la prueba ?

k

1i i

2ii2

E)E(O

χ

Page 39: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Ejemplo 2Ejemplo 2.- Se propone que el número de defectos en tarjetas de circuito .- Se propone que el número de defectos en tarjetas de circuito impreso sigue una impreso sigue una distribución de Poissondistribución de Poisson. Se obtiene una muestra de . Se obtiene una muestra de 60 tarjetas y se observa el número de defectos, con los siguientes 60 tarjetas y se observa el número de defectos, con los siguientes resultados:resultados:

defectosdefectos 00 11 22 33 4 o más4 o más

OOii 3232 1515 99 44 00

Distribución de PoissonDistribución de Poisson. Es una distribución discreta cuya función de . Es una distribución discreta cuya función de probabilidad es probabilidad es

Definida para x=0,1,2,3,...Definida para x=0,1,2,3,.... Donde . Donde es la media de X es la media de X

x!μe

f(x)x-μ

Page 40: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Cálculo de las frecuencias Esperadas ECálculo de las frecuencias Esperadas Eii::Un estimador para la media Un estimador para la media de la distribución de Poisson es la media de la distribución de Poisson es la media muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este valor de m obtenemos la siguiente tabla de frecuencias esperadas:este valor de m obtenemos la siguiente tabla de frecuencias esperadas:

xx 00 11 22 33 4 o más4 o másF(x)F(x) 0.4720.472 0.3540.354 0.1330.133 0.0330.033 0.00730.0073EEii 28.3228.32 21.2421.24 7.987.98 1.981.98 0.440.44

Para evitar que las últimas dos frecuencias esperadas sean menores Para evitar que las últimas dos frecuencias esperadas sean menores que 5 combinamos las últimas tres celdas para obtener:que 5 combinamos las últimas tres celdas para obtener:

xx 00 11 2 o más2 o másEEii 28.3228.32 21.2421.24 10.4410.44

OOii 3232 1515 1313

Page 41: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

1)1) Variable de interés: La forma de distribución de los defectos en Variable de interés: La forma de distribución de los defectos en tarjetas de circuito impresotarjetas de circuito impreso

2)2) HH00: La distribución es de Poisson : La distribución es de Poisson 3)3) H1: La distribución No es PoissonH1: La distribución No es Poisson4)4) = 0.05= 0.055)5) El estadístico de prueba es , el cual tiene una El estadístico de prueba es , el cual tiene una

distribución distribución 22 con k-p-1=3-1-1=1 grado de libertad con k-p-1=3-1-1=1 grado de libertad6)6) Se rechazará HSe rechazará H00 si si 22> > 22 0.05,10.05,1=3.84=3.847)7) CálculosCálculos

22= (94-100)= (94-100)22/28.32+(93-100)/28.32+(93-100)22/21.24+(94-100)/21.24+(94-100)22/10.44 = 2.94/10.44 = 2.948)8) Conclusiones: como 2.94 < 3.84. No es posible rechazar la hipótesis. Conclusiones: como 2.94 < 3.84. No es posible rechazar la hipótesis.

Por lo tanto parece ser que la distribución de defectos en las placas Por lo tanto parece ser que la distribución de defectos en las placas de circuito impreso es Poissonde circuito impreso es Poisson

El valor P de la prueba es P=0.9861El valor P de la prueba es P=0.9861

k

1i i

2ii2

E)E(O

χ

Page 42: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Ejemplo 3Ejemplo 3.- Se desea determinar con .- Se desea determinar con =0.05 si el voltaje de salida de =0.05 si el voltaje de salida de una fuente de alimentación está descrito por una distribución Normal. Se una fuente de alimentación está descrito por una distribución Normal. Se toma una muestra aleatoria de N=100 fuentes, determinándose los toma una muestra aleatoria de N=100 fuentes, determinándose los siguientes valores muestrales x = 5.04, s = 0.08.siguientes valores muestrales x = 5.04, s = 0.08.

Para evitar valores de frecuencias esperadas muy pequeños, de Para evitar valores de frecuencias esperadas muy pequeños, de antemano se elige el ancho de los intervalos de clase de manera que la antemano se elige el ancho de los intervalos de clase de manera que la frecuencia esperada sea constante frecuencia esperada sea constante FFi i = N / k= N / k..

Así, si k=8 clases, se buscarán 8 intervalos de clase que dividan la curva Así, si k=8 clases, se buscarán 8 intervalos de clase que dividan la curva de densidad normal en 8 áreas iguales, como se muestra en la siguiente de densidad normal en 8 áreas iguales, como se muestra en la siguiente figura para media 0 y varianza 1.figura para media 0 y varianza 1.

Page 43: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Para la distribución N(0,1) los límites de los 8 intervalos sonPara la distribución N(0,1) los límites de los 8 intervalos son – –, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+,,

por lo tanto para el ejemplo, los límites sonpor lo tanto para el ejemplo, los límites son – –, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+

Con esta elección se obtiene la siguiente tabla de frecuencias para la Con esta elección se obtiene la siguiente tabla de frecuencias para la muestramuestra

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Page 44: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

Intervalo de ClaseIntervalo de Clase OOii EEii

De –De – a 4.948a 4.948De 4.948 a 4.986De 4.948 a 4.986De 4.986 a 5.014De 4.986 a 5.014De 5.014 a 5.040De 5.014 a 5.040De 5.040 a 5.066De 5.040 a 5.066De 5.066 a 5.094De 5.066 a 5.094De 5.094 a 5.132De 5.094 a 5.132De 5.132 a + De 5.132 a +

12121414121213131212111112121414

12.512.512.512.512.512.512.512.512.512.512.512.512.512.512.512.5

Suma:Suma: 100100 100100

Page 45: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste

UMSNH - FIEUMSNH - FIE

1)1) La variable de interés es el tipo de distribución del voltaje dado por La variable de interés es el tipo de distribución del voltaje dado por una fuente de alimentaciónuna fuente de alimentación

2)2) HH00: El tipo de distribución es Normal: El tipo de distribución es Normal3)3) HH11: El tipo de distribución no es Normal: El tipo de distribución no es Normal4)4) = 0.05= 0.055)5) El estadístico de prueba esEl estadístico de prueba es6)6) Para determinar los intervalos de clase se requirió estimar Para determinar los intervalos de clase se requirió estimar y y , por , por

lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se rechazará Hrechazará H00 si si 2 2 > > 22

0.05,5 0.05,5 = 11.07= 11.077)7) Cálculos:Cálculos:2 2 = ( = ( 11//12.5 12.5 )[(12-12.5))[(12-12.5)22+(14-12.5)+(14-12.5)22+...+(14-12.5)+...+(14-12.5)22] = 0.64] = 0.648)8) Conclusiones: como 0.64<11.07, no es posible rechazar H0, por lo Conclusiones: como 0.64<11.07, no es posible rechazar H0, por lo

tanto no hay evidencia fuerte de que la distribución no sea Normal.tanto no hay evidencia fuerte de que la distribución no sea Normal.El valor P de la prueba (para El valor P de la prueba (para 2 2 = 0.64) es P=0.9861.= 0.64) es P=0.9861.

k

1i i

2ii2

E)E(O

χ

Page 46: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Gráfica de ProbabilidadGráfica de Probabilidad

UMSNH - FIEUMSNH - FIE

La gráfica de probabilidad es un La gráfica de probabilidad es un método gráficométodo gráfico que permite determinar que permite determinar si una muestra de datos se ajusta a una distribución propuesta en base a si una muestra de datos se ajusta a una distribución propuesta en base a una análisis visual subjetivo.una análisis visual subjetivo.

Originalmente esta gráfica se realizaba sobre un papel especial llamado Originalmente esta gráfica se realizaba sobre un papel especial llamado papel de probabilidadpapel de probabilidad diseñado con las escalas adecuadas para las diseñado con las escalas adecuadas para las diferentes distribuciones.diferentes distribuciones.

ProcedimientoProcedimiento:: Se ordena la muestra de menor a mayor: xSe ordena la muestra de menor a mayor: x11,x,x22,....,x,....,xNN Se grafica sobre el papel de probabilidad la frecuencia acumulada Se grafica sobre el papel de probabilidad la frecuencia acumulada

observada (i-0.5)/N contra el valor de los datos ordenadosobservada (i-0.5)/N contra el valor de los datos ordenados Si los puntos obtenidos se devían sif¿gnificativamente de una línea Si los puntos obtenidos se devían sif¿gnificativamente de una línea

recta, el modelo propuesto no será el apropiado.recta, el modelo propuesto no será el apropiado.

Page 47: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Gráfica de ProbabilidadGráfica de Probabilidad

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Las siguientes son diez observaciones sobre la duración en : Las siguientes son diez observaciones sobre la duración en minutos de las baterías de computadoras portátiles: minutos de las baterías de computadoras portátiles:

176, 183, 185, 190, 191, 192, 201, 205, 214, 220176, 183, 185, 190, 191, 192, 201, 205, 214, 220Utilizar la gráfica de probabilidad para determinar si la muestra Utilizar la gráfica de probabilidad para determinar si la muestra corresponde a una distribución Normal.corresponde a una distribución Normal.

i 1 2 3 4 5 6 7 8 9 10xi 176 183 185 190 191 192 201 205 214 220

(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95

ProcedimientoProcedimiento: Formamos la tabla de los datos ordenados y las : Formamos la tabla de los datos ordenados y las frecuencias acumuladas (i-0.5)/N siguiente:frecuencias acumuladas (i-0.5)/N siguiente:

Page 48: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Gráfica de ProbabilidadGráfica de Probabilidad

UMSNH - FIEUMSNH - FIE

175 180 185 190 195 200 205 210 215 220

0.05 0.05

0.10 0.10

0.25 0.25

0.50 0.50

0.75 0.75

0.90 0.90

0.95 0.95

Datos (XDatos (Xii))

Fre

cuen

cia

acu

mu

lad

a (i

-0.5

)/N

Fre

cuen

cia

acu

mu

lad

a (i

-0.5

)/N

Gráfica de Probabilidad NormalGráfica de Probabilidad Normal

00.0.0

1.01.0

195

0.0.8484

16

Page 49: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Gráfica de ProbabilidadGráfica de Probabilidad

UMSNH - FIEUMSNH - FIE

ObservacionesObservaciones: : Al analizar la gráfica debe recordarse que el eje vertical está Al analizar la gráfica debe recordarse que el eje vertical está

graduado en graduado en percentilespercentiles, por ello la media se encuentra en el , por ello la media se encuentra en el percentil 50.percentil 50.

Los puntos más confiables son los que están entre el percentil 25 y Los puntos más confiables son los que están entre el percentil 25 y el 75, de hecho, la linea trazada debe unir estos percentilesel 75, de hecho, la linea trazada debe unir estos percentiles

Se puede obtener una Se puede obtener una gráfica sobre papel normalgráfica sobre papel normal ajustando la ajustando la escala vertical de acuerdo a zescala vertical de acuerdo a zii, donde , donde (z(zii) = (i-0.5)/N, para el ) = (i-0.5)/N, para el ejemplo:ejemplo:

i 1 2 3 4 5 6 7 8 9 10

(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95

zi -1.64 -1.04 -0.67 -0.39 -0.13 0.13 0.39 0.67 1.04 1.64

4)4) En Matlab se puede usar la función En Matlab se puede usar la función normplotnormplot

Page 50: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

Una Una tabla de contingenciatabla de contingencia es una herramienta que nos permite poner a es una herramienta que nos permite poner a prueba si prueba si dos criterios de clasificación de una misma muestrados criterios de clasificación de una misma muestra son son independientes o no, por ejemplo:independientes o no, por ejemplo:

Población Criterio 1 Criterio 2

Ingenieros recién egresados Salario inicial Institución de origen

Estudiantes Nivel Socioeconómico Promedio académico

Número de fallas en un proceso Maquinaria utilizada Turno

Estudiantes Calif. en Materia 1 Calif. en Materia 2

Fallas en un transformador Tipo de falla Ubicación

Etc...

Page 51: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

ProcedimientoProcedimiento::Se forma una tabla de frecuencias observadas Oij, donde:Se forma una tabla de frecuencias observadas Oij, donde: i=No. de renglón= nivel de clasificación i del criterio 1 i=No. de renglón= nivel de clasificación i del criterio 1 (i=1,2,,3,...,r)(i=1,2,,3,...,r) j=No. de columna= nivel de clasificación j del Criterio 2 j=No. de columna= nivel de clasificación j del Criterio 2 (j=1,2,3,...,c)(j=1,2,3,...,c) Criterio2

Criterio1Nivel 1 Nivel 2 ... Nivel c

Nivel 1 O11 O12 O1c

Nivel 2 O21 O22 O2c

... ...

Nivel r Or1 Or1 ... Orc

Page 52: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

ConsideracionesConsideraciones: : Si los criterios son independientes Si los criterios son independientes (Hipótesis Nula)(Hipótesis Nula): La probabilidad de que un : La probabilidad de que un elemento elegido al azar caiga en la ij-ésima celda elemento elegido al azar caiga en la ij-ésima celda es es ppijij=u=uii v vjj,,donde donde uuii= probabilidad de que caiga en el = probabilidad de que caiga en el renglón irenglón i

uujj= probabilidad de que caiga en la columna j= probabilidad de que caiga en la columna jSon estimadores para Son estimadores para uuii, , vvjj : :

Por lo tanto, la frecuencia esperada en cada celda es Por lo tanto, la frecuencia esperada en cada celda es EEij ij = Np= Npij ij = Nu= Nuiivvjj, es decir, es decir

c

1jijN

1i Ou

r

1iijN

1j Ov

r

1iij

c

1jijN

1ij OOE

Page 53: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

Para N grande el siguiente estadísticoPara N grande el siguiente estadístico

Tiene una distribución JiTiene una distribución Ji22 con (r-1)(c-1) grados de con (r-1)(c-1) grados de libertad siempre que la Hipótesis nula sea libertad siempre que la Hipótesis nula sea verdadera.verdadera.

Por lo tanto, la Hipótesis de independencia se Por lo tanto, la Hipótesis de independencia se deberá rechazar si el estadístico deberá rechazar si el estadístico 22 > > 22

,(r-1)(c-1),(r-1)(c-1). .

r

1i ij

2ijij

c

1j

2

E

)E(Oχ

Page 54: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

EjemploEjemplo: Los empleados de una compañía eligen : Los empleados de una compañía eligen uno de tres posibles planes de pensión. La gerencia uno de tres posibles planes de pensión. La gerencia desea saber con desea saber con =0.05 si la preferencia en la =0.05 si la preferencia en la elección es independiente de la clasificación del elección es independiente de la clasificación del contrato (asalariados y por horas). De una muestra contrato (asalariados y por horas). De una muestra aleatoria de 500 empleados se obtiene la siguiente aleatoria de 500 empleados se obtiene la siguiente tabla de contingenciatabla de contingenciaTipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal

AsalariadosAsalariados 160160 140140 4040 340340

Por HorasPor Horas 4040 6060 6060 160160

TotalTotal 200200 200200 100100 500500

Page 55: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

SoluciónSolución: Necesitaremos las frecuencias esperadas, : Necesitaremos las frecuencias esperadas, para ello calculamos estimados de upara ello calculamos estimados de uii, v, vjj para i=1,2, para i=1,2, j=1,2,3:j=1,2,3:

uu11=0.68,=0.68, uu22=0.32,=0.32,vv11=0.4,=0.4, vv22=0.4,=0.4, vv33=0.2=0.2

Tipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal

AsalariadosAsalariados 136136 136136 6868 340340

Por HorasPor Horas 6464 6464 3232 160160

TotalTotal 200200 200200 100100 500500

Con esto calculamos las frecuencias esperadas, por Con esto calculamos las frecuencias esperadas, por ejemploejemplo

EE1111= Nu= Nu11vv11=500(0.68)(0.4)=136=500(0.68)(0.4)=136El resto se muestran en la siguiente tablaEl resto se muestran en la siguiente tabla

Page 56: Pruebas de Hipótesis

Pruebas de HipótesisPruebas de Hipótesis

Tablas de ContingenciaTablas de Contingencia

UMSNH - FIEUMSNH - FIE

1)1) La variable de interés es la preferencia de los La variable de interés es la preferencia de los empleados por los planes de pensiónempleados por los planes de pensión

2)2) HH00: La preferencia es independiente del tipo de : La preferencia es independiente del tipo de contratocontrato

3)3) HH11: La preferencia no es independiente del tipo : La preferencia no es independiente del tipo de contratode contrato

4)4) =0.05=0.055)5) El estadístico de prueba esEl estadístico de prueba es6)6) Como r=2, c=1, Como r=2, c=1, 22 tiene 2 grados de libertad, por tiene 2 grados de libertad, por

lo tanto H0 debe rechazarse si lo tanto H0 debe rechazarse si 22> > 220.05,20.05,2=5.99=5.99

7)7) Cálculos: Cálculos: 2 2 = 49.63= 49.638)8) Como 49.63>5.99, Se rechaza la hipótesis de Como 49.63>5.99, Se rechaza la hipótesis de

independencia. El valor P para independencia. El valor P para 2 2 = 49.63 es = 49.63 es P=1.671xP=1.671x10-1110-11

r

1i ij

2ijij

c

1j

2

E

)E(Oχ