PRUEBA DE HIPOTESIS.doc

19
GUIA RESUMIDA SOBRE PRUEBA DE HIPOTESIS DOCENTE Ing. JAVIER DE LA HOZ MAESTRE ESTADISTICA II UNIVERSIDAD DEL MAGDALENA Ing. Javier De la Hoz

Transcript of PRUEBA DE HIPOTESIS.doc

GUIA RESUMIDA SOBRE PRUEBA DE HIPOTESISDOCENTE

Ing. JAVIER DE LA HOZ MAESTRE

ESTADISTICA IIUNIVERSIDAD DEL MAGDALENA

TEMA2PRUEBAS DE HIPOTESISLos mtodos estudiados en el tema anterior usan la informacin proporcionada por los estadsticos muestrales para estimar con cierta probabilidad el valor de un parmetro poblacional. En ste captulo se introducir la prueba de hiptesis que es un enfoque diferente. En ste caso, se supone a priori el valor del parmetro y sobre la base de la informacin obtenida en una muestra se somete a prueba la suposicin, para luego tomar con cierta probabilidad, la decisin de rechazar o no rechazar la hiptesis. En ste punto es importante sealar que la expresin no rechazar pudiera ser sustituida por aceptar, sin embargo antes de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darn ms adelante. La prueba de hiptesis tambin conocida como docimasia o contrastacin de hiptesis es uno de los mtodos estadsticos ms usados en las ciencias e ingeniera por ser un procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones con base a un nmero limitado de observaciones. Frecuentemente un ingeniero tiene que decidir: a) al comparar magnitudes de propiedades fsicas, qumicas o biolgicas en dos o ms condiciones o categoras; b) al valorar los efectos de diferentes niveles de algn factor ambiental como la temperatura, la humedad, el contenido de oxgeno sobre algn proceso, ; y c) al relacionar dos o ms variables, . En ste captulo se trataran varios procedimientos para probar hiptesis que dan respuesta a este tipo de problemas o a otros similares.2.1 TERMINOS BSICOS2.1.1. Hiptesis estadsticas.

(a) Hiptesis estadstica: afirmacin sobre uno o ms parmetros de una o ms poblaciones.

(b) La hiptesis nula H0: la hiptesis que se debe comprobar.

(c) La hiptesis alternativa H1: se establece como el complemento de H0.

2.1.2. Comentarios.

(a) H0 siempre se refiere a un valor especfico del parmetro de poblacin (como, porejemplo, ), no al estadstico muestral (como ).

(b) H0 siempre debe contener un signo igual respecto al valor especificado del parmetro poblacional (por ejemplo, H0 : = 36, H0 : 36 o H0 : 36).

(c) H1 nunca debe contener un signo igual respecto al valor especificado de parmetro de poblacin.2.2 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS

Se pueden identificar varias etapas fundamentales, las cuales se pueden reordenar e identificar en la forma siguiente:

1. Formulacin de hiptesis

2. Especificacin de un valor de probabilidad crtico o nivel de significacin.

3. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las hiptesis.

4. Establecimiento de una zona de rechazo para Ho.

5. Cmputos necesarios.

6. Decisin.Formulacin de hiptesis. Por lo general toda investigacin en el campo de las ciencias se inicia a partir de una hiptesis la cual es una explicacin tentativa que se da a un hecho observado. La misma puede surgir a partir de una teora general que explica cierta realidad a la cual pertenece el fenmeno observado, o por la experiencia propia o de otros investigadores, o por simple intuicin. Ahora bien, en la formulacin de cualquier hiptesis est implcita una hiptesis alternativa. Estas hiptesis de investigacin para poderse someter a prueba deben concretarse en trminos cuantitativos, transformndose en hiptesis estadsticas. En forma general las hiptesis estadsticas son afirmaciones que involucran una propiedad de la distribucin probabilstica de la variable aleatoria que se est estudiando, propiedades como son la media (), la varianza (2), un valor de proporcin () o la forma de la distribucin. De modo que el primer paso en un proceso de decisin es formular las hiptesis estadstica, las cuales reciben el nombre de hiptesis nula (H0) e hiptesis alternativa (H1). La hiptesis nula se dice que es una hiptesis simple, porque es una afirmacin de igualdad con un valor especfico, mientras que las hiptesis alternativas se dicen que es compuesta porque puede asumir diferentes valores.Si se representa un parmetro poblacional por letra griega y con k un valor cualquiera del parmetro, la forma genrica de la hiptesis nula sera una igualdad entre el parmetro y un valor especfico del mismo,

H0 : = kPor su parte la hiptesis alternativa se puede representar con una de las tres posibilidades siguientes:

H1: > k < k kLa expresin > k se interpreta como que el parmetro puede asumir cualquier valor mayor a k y se dice que la prueba de hiptesis es de una cola a la derecha. Por su parte < k indica que el parmetro puede ser cualquier valor menor a k y la prueba de hiptesis se llama de una cola a la izquierda. Finalmente k representa la posibilidad que el parmetro asuma cualquier valor diferente (mayor o menor) al valor k y la prueba de hiptesis se denomina de dos colas. Ms adelante, cuando se trate lo referente al establecimiento de la zona de decisin, se aclarar la razn de esta nomenclatura. Como vimos existen tres formas distintas de planteamiento para la hiptesis alternativa. La seleccin de una de ellas depende de la naturaleza del problema que se quiere docimar. Algunos ejemplos pueden ayudar a entender la lgica para seleccionar una hiptesis alternativaEjemplo 2.1 Dada las siguientes situaciones, identifique las hiptesis nula y alternativa para la hiptesis estadstica formulada en cada situacin.

(a) Un empresario afirma que el peso medio poblacional (en gramos) de lapiceros por caja es de por lo menos 300 gramos

(b) Una empresa decide aceptar envos de piezas siempre y cuando no tenga evidencia para sospechar que ms del 4% son defectuosas.

(c) Supongamos que la conjetura de una profesor es que la utilizacin de la tecnologa no produce diferencias en el promedio de las calificaciones del examen final.

SOLUCION:

(a) Sea el peso medio poblacional (en gramos) de lapiceros por caja. Si la hiptesis es que esta media es por lo menos 300 gramos, entonces, la hiptesis nula es

H0 : 300.

La alternativa obvia es que el verdadero peso medio es inferior a 300 gramos, es decir,

H1 : < 300.

(b) Sea la proporcin poblacional de piezas defectuosas. En este caso, la hiptesis nula es que esta proporcin es cuando mucho 0,05, es decir,

H0 : 0, 05.

Basndose en la informacin muestral, se contrasta esta hiptesis frente a la alternativa unilateral

H1 : > 0, 05.

(c) Sea la diferencia entre las calificaciones medias poblacionales para las dos partes del curso, con y sin uso de la tecnologa. Entonces, la hiptesis nula es

H0 : = 0.

Sin embargo, el profesor puede sospechar que posiblemente el uso de la tecnologa produzca un incremento en el promedio y, en consecuencia, querr contrastar la hiptesis nula frente a la alternativa unilateral

H1 : > 0

Especificacin del nivel de significacin. Cualquier decisin dentro del proceso de prueba de hiptesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de tomar una decisin equivocada, slo que en este tipo de prueba se tiene la ventaja de conocer de antemano la probabilidad de equivocarse. En la Tabla 2.1 se muestran las posibles consecuencias de tomar una decisin con relacin a la hiptesis nula. Se dice que cometemos un error de tipo I si rechazamos la hiptesis nula cuando en realidad es verdadera y que cometemos un error de tipo II si aceptamos la hiptesis nula cuando es falsa. Tabla 2.1. Situaciones derivadas de una decisin estadstica

La probabilidad de cometer estos errores est dada porP(error de tipo I) = P(rechazar H0 |H0 es verdadera) = P(error de tipo II) = P(aceptar H0 |H0 es falsa) = La probabilidad se llama nivel de significancia, 1 es el llamado grado de confianza y la probabilidad 1 se llama potencia de la prueba. Comnmente los niveles de significacin usados son 0.05, 0.01 y 0.001. Tabla 2.2 Errores de tipo I y II y sus correspondientes probabilidades

Como se puede notar tanto como son probabilidades condicionadas. Los valores de ambos errores no pueden calcularse en un sentido absoluto. Para calcular es necesario asumir que H0 es cierta y para calcular se asume que H1 es cierta.

En cualquier prueba de hiptesis lo ms conveniente ser que ambos tipos de errores sean lo ms pequeo posible, pero esto no es fcil de lograr, porque al intentar disminuir uno el otro aumenta proporcionalmente como se muestra en la siguiente figura.

Seleccin del estadstico de prueba. Para poder someter a prueba las hiptesis formuladas, es necesario usar alguna propiedad o estadstico de las muestras que est relacionado con el parmetro objeto de la inferencia. Estas propiedades muestrales reciben el nombre genrico de estadsticos de prueba. En las Tablas 2.3; 2.4; 2.5 se muestra como se seleccionan segn los parmetros los estadsticos de prueba correspondienteTabla 2.3 Estadsticos de prueba para la media poblacional

Tabla 2.4 Estadsticos de prueba para la diferencia de medias poblacionales

Tabla 2.5 Estadsticos de prueba para la proporcin y diferencia de proporciones poblacionales

Tabla 2.5 Estadsticos de prueba para la varianza y razn de varianzas poblacionales

Establecer una zona de aceptacin para H0. Una vez conocido el estadstico de prueba a utilizar, as como su distribucin, es necesario definir en la distribucin del estadstico muestral una zona de aceptacin y una zona de rechazo de la hiptesis nula. La zona de aceptacin de H0 est formada por todos los valores del estadstico de prueba con una probabilidad de ocurrencia mayor al establecido en el nivel de significacin.. Por el contrario la zona de rechazo est formada por todos los valores del estadstico de prueba cuya probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significacin. La zona de rechazo a diferencia de la zona de aceptacin y dependiendo de la hiptesis alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de valores de la variable aleatoria.Zona de rechazo a la derecha: esta formada por todos los valores del estadstico de prueba ubicados a la derecha del parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin. Esta zona se especifica cuando H1: > 0 y la docimasia se llama prueba de una cola a la derecha (Figura 2.1 A)Zona de rechazo a la izquierda: esta formada por todos los valores del estadstico de prueba ubicados a la izquierda del parmetro cuya probabilidad de ocurrencia es menor a la del nivel de significacin. Esta zona se especifica cuando H1: 30).Un entomlogo sospecha que en cierta zona endmica para el dengue el valor de la tasa neta reproductiva (Ro) de una poblacin del mosquito Aedes aegypti vector de dicha enfermedad, ha cambiado en relacin con el valor determinado hace 5 aos el cual era igual a 205 individuos. Con tal propsito determin el valor de Ro a 40 hembras criadas en el laboratorio y pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada. Los resultados fueron los siguientes:

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su hiptesis no queriendo equivocarse en ms del 5% de las veces.SOLUCION:

a. Formulacin de hiptesis

Las hiptesis de investigacin son las siguientes: Ho : La tasa neta de reproduccin no ha cambiado H1 : La tasa neta de reproduccin de modific despus de cinco aos

Las hiptesis estadsticas Ho : = 205 H1 : 205 (Analice porque la hiptesis alternativa es de diferencia)b. Especificacin de un valor de probabilidad crtico o nivel de significacin.

El nivel de significacin especificado es = 0.05c. Eleccin de un estadstico de la muestra y de su distribucin.

Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se distribuye normalmente con varianza desconocida y el tamao de la muestra es grande lo ms conveniente es usar como estadstico a Z t (ver tabla 2.3)

d. Establecimiento de una zona de rechazoSe trata de una prueba de dos colas, siendo la zona de rechazo la siguiente:

e. Cmputos necesarios.e.1) Media: 202.9 e.2) Desviacin estndar: s = 36.17 e.3) Estadstico de prueba:

f. Decisin.Como z = -0.367, el valor del estadstico de prueba se encuentra dentro de la zona de no rechazo . Por lo tanto se concluye con una confianza del 95% que los datos no proporcionan suficiente evidencia para rechazar Ho.

A la luz de la informacin proporcionada por la muestra, con un 95% de confianza la sospecha del investigador de que la tasa de reproduccin de la poblacin de mosquito se haba modificado no es cierta.

Ejemplo 2.2 Prueba de hiptesis acerca de la media poblacional cuando la muestra proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de muestra pequeo (n < 30).Un ingeniero ambiental desea verificar si el contenido de nitrgeno en las hojas jvenes de la especie Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente protegida con relacin al de plantas que viven en una zona que est siendo afectada por la contaminacin con fertilizantes y cuyo valor promedio se cuantific en 14.6 mg/g de nitrgeno. El anlisis de 25 hojas jvenes provenientes de la zona protegida produjo los resultados siguientes:

Si la concentracin de nitrgeno se distribuye normalmente, apoya la evidencia proporcionada por la muestra la presuncin que las plantas de la zona protegida contienen menos nitrgeno?. El error tipo I no debe ser mayor al 1%.SOLUCION:

g. Formulacin de hiptesis

Las hiptesis de investigacin son las siguientes:

Ho : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es mayor o igual en la zona protegida.

H1 : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es menor en la regin protegida.Las hiptesis estadsticas

Ho : > 14.6

H1 : < 14.6h. Especificacin de un valor de probabilidad crtico o nivel de significacin.

El nivel de significacin especificado es = 0.01

i. Eleccin de un estadstico de la muestra y de su distribucin.

Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se distribuye normalmente con varianza desconocida y el tamao de la muestra es pequeo lo ms conveniente es usar como estadstico de la t (ver tabla 2.3))

d. Establecer una zona de aceptacin para Ho.Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona de aceptacin la siguiente:

ZA = {t / t > -t(1; n-1) }

e. Cmputos necesarios.

e.1) Media: = 10.48

e.2) Desviacin estndar: s = 2.41

e.3) Estadstico de prueba:

e.4) Zona de aceptacin:

ZA = {t / t > -t(; n-1) } = {t / t > -t(0.01; 24)} = {t/ t> -2.492}

f. Decisin.

Como t = - 8.55 < -t(0.01; 24) = -2.492 el valor del estadstico de prueba se encuentra dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para rechazar Ho

De acuerdo a la informacin obtenida de la muestra se puede afirmar con un 99% de confianza que la concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle en la regin ambientalmente protegida es menor al de la zona afectada.Ejemplo 2.3 Prueba de hiptesis acerca de una proporcinDe una muestra aleatoria de 802 clientes de supermercados, suponga que 378 pagaron sus artculos con tarjetas de crdito. Contrastar el nivel del 10%, la hiptesis nula de que al menos la mitad de los compradores pagan sus artculos con tarjetas de crdito frente a la alternativa de que la proporcin poblacional es menor de la mitad.SOLUCION:

a. Formulacin de hiptesisSea la proporcin poblacional de compradores que pagan sus artculos con tarjetas de crdito. Queremos probar la hiptesis

Las hiptesis estadsticas

Ho : > 0,5

H1 : 0se trata de una prueba de una cola hacia la izquierda, siendo la zona de rechazo la siguiente:

e. Cmputos necesarios.

e.1)

e.2) Estadstico de prueba:

Entonces, como Z = -1,64 es menor que Z = -1,28, con una confianza del 90% al nivel de se rechaza la hiptesis nula, lo que significa que la proporcin de compradores que pagan sus artculos con tarjetas de crdito es menor a la mitad.Ejemplo 2.4 Prueba de hiptesis para la diferencia de proporcionesUn rector de cierta universidad afirma que la proporcin de hombres que tienen auto en el campus es mayor a la proporcin de mujeres que tienen auto. Un profesor de estadstica se interesa en la afirmacin y entrevista aleatoriamente a 100 hombres y a 100 mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en el campus. Puede concluirse con un nivel del 5% que la afirmacin del rector es falsa?SOLUCION:

d. Formulacin de hiptesis

Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente, que tienen auto en el campus. Entonces, Las hiptesis estadsticas

Ho : p1 p2 0 H1 : p1 p2 > 0.e. Especificacin de un valor de probabilidad crtico o nivel de significacin.

El nivel de significacin especificado es = 0.05f. Eleccin de un estadstico de la muestra y de su distribucin. Puesto que el parmetro involucrado en la docimasia es una diferencia de proporciones lo mas conveniente es utilizar como estadstico Z(ver tabla 2.4)

donde

d. Establecer una zona de aceptacin para Ho.H1 : p1 p2 > 0se trata de una prueba de una cola hacia la dereha, siendo la zona de aceptacin la siguiente:

ZA = {Z/ Z < Z() }

e. Cmputos necesarios.

e.1) = 0,34 =0,27 0,305e.2) Estadstico de prueba:

e.4) Zona de aceptacin:

ZA = {Z/ Z < 1,64 }

Entonces, como

Z = 1, 075 es menor que Z = 1, 64, al nivel de significancia del 5%, no se rechaza la hiptesis nula

de que la proporcin de hombres que tienen auto en el campus es menor o igual a la proporcin de mujeres que tienen auto en el campus. Es decir, los datos muestran que la afirmacin del rector es falsa.Ing. Javier De la Hoz

_1487655663.unknown

_1487686145.unknown

_1487686686.unknown

_1487687085.unknown

_1487655978.unknown

_1267903981.unknown

_1267906220.unknown

_1267907403.unknown

_1267907514.unknown

_1267907617.unknown

_1267907422.unknown

_1267907052.unknown

_1267904019.unknown

_1267899802.unknown

_1267903692.unknown

_1267899481.unknown

_1267893040.unknown

_1267899109.unknown