5 estadística inferencial

55
INFERENCIA ESTADÍSTICA

Transcript of 5 estadística inferencial

Page 1: 5 estadística inferencial

INFERENCIA ESTADÍSTICA

Page 2: 5 estadística inferencial

INFERENCIA ESTADISTICA

INFERENCIA ESTADISTICA

1. CONCEPTO

METODOS

PROCEDIMIENTOS

PROPIEDADES

DEDUCIR INFERIR

CONCLUIR

POBLACION

DEMUESTRA

CIENCIA EXPERIMENTAL

INFORMACION INCOMPLETA

CONJUNTO OBSERVACIONES

GENERA MODELOS MUESTRA

ESTIMAN PARAMETROS

CONTRASTAN HIPOTESIS

DETERMINARMODELO

ES APROPIADO

NO APROPIADO

HAY DECISION

PREVENSION

Page 3: 5 estadística inferencial

Estimaciones puntuales e intervalos de confianza Estimación puntual: Estadístico calculado a

partir de la información obtenida de la muestra y que se usa para estimar el parámetro poblacional.

Intervalo de confianza: Un conjunto de valores obtenido a partir de los datos muestrales, en el que hay una determinada probabilidad de que se encuentre el parámetro. A esta probabilidad se le conoce como el nivel de confianza.

Page 4: 5 estadística inferencial

Estimación puntual y estimación por intervalos Los hechos que determinan la amplitud de un

intervalo de confianza son:1. El tamaño de la muestra, n2. La variabilidad de la población.

normalmente estimada por s.3. El nivel de confianza deseado.

Page 5: 5 estadística inferencial

Estimación puntual y estimación por intervalos Si la desviación estándar de la población es

conocida o la muestra es mayor que 30 utilizamos la distribución z.

nszX

Page 6: 5 estadística inferencial

Punto e intervalo de estimación

Si la desviación estándar de la población es desconocida y la muestra es menor que 30 utilizamos la distribución t

nstX

Page 7: 5 estadística inferencial

Intervalo de estimación

Un intervalo de estimación establece el rango en el cual se encuentra el parámetro de población.

Un intervalo en el cual se espera que ocurra el parámetro de población se llama intervalo de confianza.

Los dos intervalos de confianza que son más utilizados son de 95% y 99%.

Page 8: 5 estadística inferencial

Intervalo de estimación Para un 95% de intervalo de confianza,

aproximadamente 95% de los intervalos construidos igualmente contendrán el parámetro inicial. También el 95% de la muestra media para un tamaño de muestra específico se encontrará dentro del 1.96 de la desviación estándar de la media de la población.

Para el 99% de intervalo de confianza, 99% de la muestra media para un tamaño de muestra específico se encontrará dentro del 2.58 de la desviación estándar de la media de la población.

Page 9: 5 estadística inferencial

Error estándar de la media muestral

es el símbolo para el error estándar de la media

muestral. es la desviación estándar de la población. n es la magnitud de la muestra.

x n

x

El error estándar de la media muestral es la desviación estándar de la distribución de las medias muestrales.

Se calcula como:

Page 10: 5 estadística inferencial

Error estándar de la media muestral

Si σ no es conocido y n >= 30, la desviación estándar de la muestra, designada s, se aproxima a la desviación estándar de la población.

La fórmula para la desviación estándar es:

nss x

Page 11: 5 estadística inferencial

95% y 99% intervalos de confianza para µ El 95% y 99% intervalos de confianza:

95% CI para la media de la población es dada:

nsX 96.1

Xsn

2 58.

99% CI para la media de la población es dada como:

Page 12: 5 estadística inferencial

Construyendo intervalos generales de confianza para µ En general, un intervalo de confianza para la

media se calcula como:

nszX

Page 13: 5 estadística inferencial

Ejemplo 3 El director de una escuela de negocios quiere

estimar la cantidad media de horas que los estudiantes trabajan por semana. De una muestra de 49 estudiantes mostró una media de 24 horas con una desviación estándar de 4 horas. ¿Cuál es la media de la población?

El valor de la media de la población no es conocida. Nuestra mejor estimación de este valor es la muestra media de 24.0 horas. Este valor es llamado estimación puntual.

Page 14: 5 estadística inferencial

Ejemplo 3 (Continuación)

Encuentre el intervalo de confianza con el 95% para la media de la población.

El rango límite de confianza es de 22.88 a 25.12.

12.100.2449496.100.2496.1

nsX

Aproximadamente el 95% de los intervalos construidos incluyen el parámetro de población.

Page 15: 5 estadística inferencial

Intervalo de confianza para la proporción de la población El intervalo de confianza para la proporción de

la población se estima como:

npp

zp)1(

Page 16: 5 estadística inferencial

Ejemplo 4

De una muestra de 500 ejecutivos que tienen casa propia 175 revelaron planear vender sus casas y cambiarse a Arizona. Desarrolle un intervalo de confianza con el 98% para la proporción de ejecutivos que planean vender sus casas y cambiarse a Arizona.

0497.35. 500

)65)(.35(.33.235.

Page 17: 5 estadística inferencial

Factor de correcciónde la población-finita La población que ha sido establecida en líneas

anteriores se dice que es finita. Para una población finita, donde el número total de

objetos es N y la magnitud de la muestra es n, el siguiente arreglo está hecho para los errores estándar de la media muestral y la proporción:

Error estándar de la media muestral:

x nN nN

1

Page 18: 5 estadística inferencial

Factor de correcciónde la población-finita

Este arreglo es llamado factor de corrección de la población-finita.

Si n/N < .05,el factor de corrección de la población-finita se ignora.

1)1(

NnN

npp

p

Error estándar de las proporciones de la muestra:

Page 19: 5 estadística inferencial

Ejemplo 5 Dada la información del Ejemplo 4, construya un

intervalo de confianza del 95% para la cantidad media de horas que los estudiantes trabajan por semana si tan sólo son 500 estudiantes en el campus.

Porque n/N = 49/500 = .098 el cual es mayor que 05, utilizamos el factor de corrección de la población-finita

0648.100.24)150049500)(

494(96.124

Page 20: 5 estadística inferencial

Elección del tamaño de muestra apropiado Existen 3 factores que determinan el tamaño de

la muestra, ninguno de los cuales tiene relación con el tamaño de la población. Éstos son:El nivel de confianza deseado.El máximo error permisible.La variación en la población.

Page 21: 5 estadística inferencial

Variación en la población

Donde: E es el error permisible, z es el valor-z correspondiente al nivel de confianza seleccionado, y s es la desviación de la muestra del estudio piloto.

2

Eszn

Para encontrar el tamaño de la muestra para una variable:

Page 22: 5 estadística inferencial

Ejemplo 6 Un grupo de consumidores quiere estimar la

media del cargo mensual de energía de julio de una casa común dentro de $5 utilizando 99% de nivel de confianza. Basado en estudios similares, la desviación estándar se estima debe ser $20.00. ¿Cuántas muestras son requeridas?

1075

)20)(58.2( 2

n

Page 23: 5 estadística inferencial

Tamaño de la muestrapara proporciones La fórmula para determinar el tamaño de la

muestra en el caso de una proporción es:

n p pZE

( )1

2

Donde: p es la proporción estimada, basada en la experiencia anterior o de un estudio piloto, z es valor-z asociado con el grado de confianza seleccionado; E es el máximo error permisible que el investigador tolerará.

Page 24: 5 estadística inferencial

Ejemplo 7 Un club quiere estimar la proporción de niños

que tiene un perro como mascota. Si el club quisiera estimarlo dentro del 3% de la proporción de la población, ¿cuántos niños necesitarían contactar? Asuma 95% de nivel de confianza y que el club estima que un 30% de los niños tienen un perro como mascota.

89703.96.1)70)(.30(.

2

n

Page 25: 5 estadística inferencial

Pruebas de hipótesis para una muestra

Page 26: 5 estadística inferencial

¿Qué es una hipótesis?

Una hipótesis es una declaración sobre el valor de un parámetro de la población desarrollado con el fin de poner a prueba.

Ejemplos de hipótesis que se hicieron sobre un parámetro de la población: El ingreso mensual para los analistas de sistemas es

$3.625 Veinte por ciento de todos los clientes de La Majada

regresan para otra comida dentro de un mes.

Page 27: 5 estadística inferencial

¿Qué es una prueba de hipótesis?

La prueba de hipótesis es un procedimiento basado en la evidencia de la muestra y la teoría de las probabilidades, usadas para determinar si la hipótesis es una declaración razonable y no debe ser rechazada, o es irrazonable y debe ser rechazada.

Page 28: 5 estadística inferencial

Prueba de hipótesis

Paso 4: Se formula la regla de decisión

Paso 3: Se identifica el estadístico de prueba

Paso 5: Se toma una muestra y se decide: se

acepta H0 o se rechaza H0

Paso 2: Se selecciona el nivel de significancia

Paso 1: Se plantean las hipótesis nula y alternativa

Page 29: 5 estadística inferencial

Definiciones

Hipótesis nula H0: Una declaración sobre el valor de un parámetro de la población.

Hipótesis alternativa H1: Una declaración que se acepta si los datos de la muestra proporcionan evidencia de que la hipótesis nula es falsa.

Nivel de significancia: La probabilidad de rechazar la hipótesis nula cuando es verdadera.

Error tipo I: Rechazar la hipótesis nula cuando es verdadera.

Page 30: 5 estadística inferencial

Definiciones

Error tipo II: Aceptar la hipótesis nula cuando es falsa.

Estadístico de prueba: Un valor determinado a partir de la información muestral, usado para determinar si se rechaza la hipótesis nula.

Valor crítico: Punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no rechaza la hipótesis nula.

Page 31: 5 estadística inferencial

31

PRUEBAS DE HIPÓTESIS PARA LA MEDIA Y VARIANZA POBLACIONAL

Page 32: 5 estadística inferencial

TIPOS DE ERRORES EN PRUEBA DE HIPÓTESIS

32

Page 33: 5 estadística inferencial

Pruebas de significancia de una cola

Una prueba es de una cola cuando la hipótesis alternativa, H1 indica una dirección, como por ejemplo: H1: Las comisiones anuales ganadas por corredores de

bienes raíces a tiempo completo son más de $35.000. (µ>$35.000)

H1: La velocidad de los autos que viajan en la I-95 en Georgia es menos de (µ<60) millas por hora.

H1: Menos del 20% de los clientes pagan en efectivo su consumo de gasolina. (µ<.20)

Page 34: 5 estadística inferencial

Distribución muestral para el estadístico z para la prueba de una cola, con el .05 de nivel de significancia

0.95 de probabilidad0.05 región de rechazo

Valor críticoZ = 1.65

0 1 2 3

Page 35: 5 estadística inferencial

Pruebas de significancia de dos colas

Una prueba es con dos colas cuando no se especifica ninguna dirección en la hipótesis alterna H1, por ejemplo:

H1: La cantidad pagada por los clientes en el centro comercial en Georgetown no es igual a $25. (µ $25).

H1: El precio para un galón de gasolina no es igual a $1.54. (µ $1.54).

Page 36: 5 estadística inferencial

Distribución muestral para el estadístico z para la prueba de dos colas, con el .05 de nivel de significancia

0.95 de probabilidad0.025 región de rechazo

0 1-1 2-2

Valor críticoZ = 1.96, -1.96

Page 37: 5 estadística inferencial

Prueba para la media de la población: muestra grande, desviación estándar de la población conocida Cuando la prueba de la media poblacional

proviene de una muestra grande y la desviación estándar poblacional es conocida, el estadístico de la prueba se obtiene con la siguiente fórmula:

zX

/ n

Page 38: 5 estadística inferencial

Ejemplo1

Los procesadores de la salsa de tomate de los fritos indican en la etiqueta que la botella contiene 16 onzas de la salsa de tomate. La desviación estándar del proceso es 0.5 onza. Una muestra de 36 botellas de la producción de la hora anterior reveló un peso de 16.12 onzas por botella. ¿En un nivel de significancia del .05 el proceso está fuera de control? ¿Es decir, podemos concluir que la cantidad por botella es diferente a 16 onzas?

Page 39: 5 estadística inferencial

Ejemplo 1 (Continuación)

Paso 1: Indique las hipótesis nulas y alternativas:

H0: µ = 16; H1: µ = 16

Paso 2: Seleccione el nivel de significancia. En este caso seleccionamos el nivel de significancia del 0.05.

Paso 3: Identifique la estadística de la prueba. Porque conocemos la desviación estándar de la

población, la estadística de la prueba es z.

Page 40: 5 estadística inferencial

Ejemplo 1 (Continuación)

Paso 4: Indique la regla de decisión:Rechazo H0 si z > 1.96 o z < -1.96

Paso 5: Compruebe el valor del estadístico de la prueba y llegue a una decisión.

44.1365.0

00.1612.16

nXz

No rechazamos la hipótesis nula. No podemos concluir que la media sea diferente a 16 onzas.

Page 41: 5 estadística inferencial

Valor-p en la prueba de la hipótesis

Valor-p es la probabilidad de observar un valor muestral tan extremo, que el valor observado, dado que la hipótesis nula es verdadera.

Si el valor-p es más pequeño que el nivel de significancia, se rechaza H0.

Si el valor-p es más grande que el nivel de significancia, H0 no se rechaza.

Page 42: 5 estadística inferencial

Cálculo del Valor-p

Prueba de una cola: valor-p = P{z >= valor absoluto del estadístico de prueba}

Prueba de dos colas: valor-p = 2P{z >= valor absoluto del estadístico de prueba}

Del Ejemplo 1, z = 1.44, y porque era una prueba de dos colas, el valor-p = 2P{z >= 1.44} = 2(.5-.4251) = .1498. Porque .05>= .1498, no se rechaza H0.

Page 43: 5 estadística inferencial

Prueba para la media de la población: muestra grande, desviación estándar poblacional desconocida Aquí σ es desconocida, así que la estimamos

con la desviación estándar de la muestra s. Mientras el tamaño de muestra n > 30, z se

puede aproximar con:

zXs n

/

Page 44: 5 estadística inferencial

Ejemplo 2

La cadena de almacenes de descuento de Roder emite su propia tarjeta de crédito. Lisa, la gerente de crédito, desea descubrir si el promedio sin pagar mensual es más de $400. El nivel de significancia se fija en .05. Una verificación al azar de 172 balances sin pagar reveló que la media de la muestra fue $407 y la desviación estándar de la muestra fue $38. ¿Debe Lisa concluir que el medio de la población es mayor de $400, o es razonable asumir que la diferencia de $7 ($407-$400) es debido al azar?

Page 45: 5 estadística inferencial

Ejemplo 2 (Continuación)

Paso 1: H0: µ <= $400, H1: µ > $400 Paso 2: El nivel de significancia es .05 Paso 3: Porque la muestra es grande podemos utilizar la

distribución de z como el estadístico de la prueba. Paso 4: H0 es rechazada si z>1.65 Paso 5: Realice los cálculos y tome una decisión.

H0 es rechazada. Lisa puede concluir que la media sin pagar es mayor de $400.

42.217238$400$407$

ns

Xz

Page 46: 5 estadística inferencial

Prueba para la media de la población: muestra pequeña, desviación estándar poblacional desconocida El estadístico de la prueba es la distribución t.

El estadístico de la prueba para el caso de una muestra es:

nsXt

/

Page 47: 5 estadística inferencial

Ejemplo 3

La tasa de producción de los fusibles de 5 amperios en Neary Co. eléctrico es 250 por hora. Se ha comprado e instalado una máquina nueva que, según el proveedor, aumentará la tarifa de la producción. Una muestra de 10 horas seleccionadas al azar a partir del mes pasado reveló que la producción cada hora en la máquina nueva era 256 unidades, con una desviación estándar de 6 por hora. ¿En el nivel de significancia del .05. Neary puede concluir que la máquina nueva es más rápida?

Page 48: 5 estadística inferencial

Ejemplo 3 (Continuación)

Paso 1: Establezca la hipótesis nula y la hipótesis alternativa.

H0: µ <= 250; H1: µ > 250 Paso 2: Seleccione el nivel de significancia. Es .05. Paso 3: Encuentre un estadístico de prueba.

Es la distribución t porque la desviación estándar de la población no se conoce y el tamaño de muestra es menos de 30.

Page 49: 5 estadística inferencial

Ejemplo 3 (Continuación)

Paso 4: Indique la regla de la decisión.Hay 10 - 1 = 9 grados de libertad. Se rechaza la hipótesis nula si t > 1.833.

Paso 5: Tome una decisión e interprete los resultados.

162.3106250256

ns

Xt

Se rechaza la hipótesis nula. El número producido es más de 250 por hora.

Page 50: 5 estadística inferencial

Pruebas respecto a proporciones

Una proporción es la fracción o el porcentaje que indican la parte de la población o de la muestra que tiene un rasgo particular de interés.

La proporción de la muestra es denotada por p y calculada con:p = número de éxitos en la muestra / tamaño de la muestra

Page 51: 5 estadística inferencial

Prueba estadística para la proporción de la población

n

pz)1(

La proporción de la muestra es p y es la proporción de la población.

Page 52: 5 estadística inferencial

Ejemplo 4

En el pasado, el 15% de las solicitudes de pedidos por correo para cierta obra de caridad dio lugar a una contribución financiera. Un nuevo formato de solicitud se ha diseñado y se envía a una muestra de 200 personas y 45 respondieron con una contribución. ¿En el nivel de significación del .05 se puede concluir que la nueva solicitud es más eficaz?

Page 53: 5 estadística inferencial

Ejemplo 4 (Continuación)

Paso 1: Establezca la hipótesis nula y la hipótesis alternativa

H0: <= .15 H1: > .15 Paso 2: Seleccione el nivel de significancia.

Es .05.

Paso 3: Encuentre un estadístico de prueba.La distribución de z es el estadístico de prueba.

Page 54: 5 estadística inferencial

Ejemplo 4 (Continuación)

Paso 4: Indique la regla de decisión.Se rechaza la hipótesis nula si z es mayor que 1.65.

Paso 5: Tome una decisión e interprete los resultados.

97.2

200)15.1(15.

15.20045

)1(

n

pz

Se rechaza la hipótesis nula. Más de 15% de solicitudes responde con un compromiso. El nuevo formato es más eficaz.

Page 55: 5 estadística inferencial

REFERENCIAS

55

http://es.slideshare.net/aumcjoe/estadstica-inferencial-2012

http://es.slideshare.net/castilloasmat28/distribuciones-muestrales-diapositivas-6792646?from_action=save

http://es.slideshare.net/lexoruiz/estimacin-e-intervalos-de-confianza

http://es.slideshare.net/eraperez/estimacion-limiites-o-intervalos-de-confianza-para-la-media-y-para-las-proporciones?next_slideshow=1

http://blogs.ua.es/violeta/tag/diapositivas-teoria-estadistica/