Estadística Inferencial - UNID...Por ejemplo, la duración de una batería en horas que fabrica una...
Transcript of Estadística Inferencial - UNID...Por ejemplo, la duración de una batería en horas que fabrica una...
Estadística Inferencial
ESTADÍSTICA INFERENCIAL
1
Sesión No. 6
Nombre: Distribuciones de probabilidad para variables aleatorias. Parte II. Objetivos: Al finalizar la sesión, el estudiante conocerá cómo utilizar la
distribución normal para aproximar la distribución de probabilidad de Poisson.
Así mismo conocerá las características y cómo calcular las probabilidades
mediante la distribución exponencial. Conocerá además cómo identificar, aplicar
e implementar con una herramienta computacional algunas de las distribuciones
de variables aleatorias continuas.
Contextualización
Al igual que la distribución binomial, existe otra distribución de probabilidad
discreta que puede ser aproximada a la distribución normal que es continua, tal
es el caso de la distribución de Poisson.
La distribución normal forma la base sobre la cual descansa una gran cantidad
del trabajo en la inferencia estadística, pero existen también numerosas
situaciones que requieren de otros tipos de funciones de densidad de
probabilidad, una de estas funciones es la distribución exponencial que
proporciona modelos de probabilidad muy utilizados en diferentes disciplinas.
ESTADÍSTICA INFERENCIAL
2
Introducción al Tema
¿Qué distribución de probabilidad emplearías para describir el tiempo de espera de los clientes en un banco para ser atendidos?
Imagen recuperada de: counterest.net
En esta sesión, revisarás en primer lugar la aproximación normal de
probabilidades de Poisson. A continuación, se expone otra de las distribuciones
continuas, la distribución exponencial, que es utilizada en problemas donde nos
interesa la probabilidad de falla de algún componente, así como la ocurrencia de
eventos aleatorios en el tiempo.
Además, en el subtema de aplicaciones de cómputo, continuaremos utilizando la
hoja de cálculo Excel 2016, que también nos permite calcular las probabilidades
de distribuciones continuas.
ESTADÍSTICA INFERENCIAL
3
Explicación
3.4 Aproximación normal de probabilidades de Poisson
¿Cuándo una distribución de Poisson se aproxima a la distribución normal?
Dado que la distribución de Poisson es aproximadamente un caso particular de
la distribución binomial, y que esta se aproxima a la distribución normal en
ciertas condiciones, a la distribución de Poisson le sucederá otro tanto. La
siguiente imagen muestra como la distribución de Poisson se aproxima a la
distribución normal conforme aumenta el valor de 𝜆.
Una distribución de Poisson con parámetro 𝜆 suficientemente grande, es decir
𝜆 > 10 se aproxima a una distribución normal; y la distribución normal a la que
se aproxima habrá de tener la misma media y varianza que la distribución de
Poisson de la que proviene.
Si 𝑥 → 𝑃(𝜆) con 𝜆 > 10 ⇒ 𝑥 → 𝑁(𝜆, 𝜆)
Dado que una distribución de Poisson es discreta, la corrección por continuidad
puede, en principio, aplicarse cuando se utiliza la aproximación normal. Para las
áreas que incluyen la parte central de la curva, la corrección por continuidad
generalmente mejora la aproximación normal, pero para las áreas de las colas la
corrección por continuidad algunas veces empeora la aproximación (Navidi,
2006).
Ejemplo:
ESTADÍSTICA INFERENCIAL
4
El número de cuentahabientes que acuden a una sucursal bancaria sigue una
distribución de Poisson, con una media de 25 cuentahabientes por hora.
Encuentra la probabilidad de que haya 90 o más cuentahabientes durante tres
horas.
Solución:
Sea 𝑋 el número de cuentahabientes que acuden a una sucursal bancaria en
tres horas. La media del número de cuentahabientes es de 75, por lo que
𝑋~𝑃𝑃𝑃𝑃𝑃𝑃𝑃(75)
Empleando la aproximación normal 𝑋~𝑁(75, 75). Se desea encontrar 𝑃(𝑋 ≥ 90).
Se calcula 𝑧 de 90, que es
𝑧 =90 − 75√75
= 1.73
Haciendo uso de la tabla 𝑧 se determina que
𝑃(𝑋 ≥ 90) = 1 − 0.9582 = 0.0418
Como lo puedes observar en la siguiente imagen
Por lo tanto, la probabilidad de que haya 90 o más cuentahabientes durante tres
horas es de 4.18%.
ESTADÍSTICA INFERENCIAL
5
3.5 Distribución exponencial de probabilidad
¿En qué situaciones los modelos exponenciales pueden ser empleados?
El origen de esta función de probabilidad se halla en el proceso de Poisson; tal
probabilidad se relaciona con la posibilidad de ocurrencia de un número
específico de éxitos, donde este número es la variable aleatoria. Ahora bien, si
se invierten los papeles, el número de éxitos no será la variable aleatoria, sino el
tiempo; en otras palabras, una variable exponencial 𝑋, es el intervalo de tiempo,
o espacio requerido, para obtener un número específico de éxitos (Elorza Pérez-
Tejada, 2008).
La función de densidad de probabilidad exponencial está dada por (Anderson,
Sweeney, & Williams, Estadística para administración y economía, 2008):
𝑓(𝑥) =1𝜇𝑒−𝑥𝜇
Para 𝑥 ≥ 0, 𝜇 > 0
Donde 𝜇 = valor esperado o media
Como ocurre con cualquier distribución de probabilidad continua, el área bajo la
curva correspondiendo a un intervalo da la probabilidad de que la variable
aleatoria tome algún valor en ese intervalo.
ESTADÍSTICA INFERENCIAL
6
Para calcular probabilidades exponenciales se usa la siguiente fórmula, la cual
aporta la probabilidad acumulada de obtener un valor de la variable aleatoria
exponencial que sean menor o igual que algún valor específico denotado por 𝑥0
(Anderson, Sweeney, & Williams, Estadística para administración y economía,
2008).
𝑃(𝑥 ≤ 𝑥0) = 1 − 𝑒−𝑥0 𝜇⁄
La distribución exponencial tiene la propiedad de que la media y la desviación
estándar son iguales.
Ejemplo:
La vida de cierta marca de baterías está distribuida exponencialmente con
𝜇 = 1 000 horas.
a. ¿Cuál es la probabilidad de que la batería dure menos de 1 000 horas?
𝑃(𝑥 < 1000) = 1 − 𝑒−𝑥0 𝜇⁄ = 1 − 𝑒−(1000 1000⁄ ) = 1 − 𝑒−1
𝑃(𝑥 < 1000) = 0.63212
b. ¿Cuál es la probabilidad de que la batería dure más de 1 500 horas?
𝑃(𝑥 > 1500) = 1 − 𝑃(𝑥 ≤ 1500) = 1 − �1 − 𝑒−(1500 1000⁄ )� = 𝑒−1.5
ESTADÍSTICA INFERENCIAL
7
𝑃(𝑥 > 1500) = 0.223
Otra propiedad de la distribución exponencial es la carencia de memoria, es
decir es una que se olvida del pasado. Para intentar explicar esta propiedad,
supongamos que 𝑋 representa el tiempo de vida de un fusible. La probabilidad
de que el fusible no se queme en las primeras 𝑃 + 𝑡 unidades de tiempo,
habiéndose comprobado que no se había quemado en las primeras 𝑃 unidades
de tiempo es igual a la probabilidad de que el fusible no se queme en las
primeras 𝑡 unidades de tiempo. Dicho de otra manera, la probabilidad de que no
se queme en las próximas 𝑡 unidades de tiempo es la misma que la probabilidad
de que no se queme durante las primeras 𝑡 unidades de tiempo. El hecho de no
haberse quemado en las primeras 𝑃 unidades de tiempo, simplemente no cuenta
(Condor Espinoza, 1989).
3.6 Aplicaciones de cómputo
Si un programa es inútil habrá que demostrarlo
“Cuarta ley de la Programación”
La función de Excel para calcular probabilidades de una distribución normal con
media y desviación estándar especificadas es DISTR.NORM.N. Esta función
tiene los siguientes argumentos:
1. X: Es el valor cuya distribución se desea obtener (𝑥𝑖 = 𝑎)
2. Media: Es la media aritmética de la distribución (𝜇)
3. Desv_estándar: Es la desviación estándar de la distribución (𝜎)
4. Acumulado: Valor lógico que determina la forma de la función. Si el
argumento es VERDADERO, devuelve la función de distribución
acumulada. Si es FALSO, devuelve la función de masa de probabilidad.
ESTADÍSTICA INFERENCIAL
8
Por ejemplo, la duración de una batería en horas que fabrica una empresa se
describe mediante una distribución normal con media 𝜇 = 36 500 y 𝜎 = 5 000. Si
se desea conocer la probabilidad de que una batería dure más de 40 000 horas.
En este caso seleccionamos en la hoja de cálculo la función de Excel
DISTR.NORM.N.
Como se muestra en la imagen de abajo.
Se ingresa en el cuadro de dialogo los valores de los argumentos. En este caso
el acumulado será VERDADERO.
Obtenemos que la probabilidad de que una batería tenga una duración de 40
000 horas es de 0.7580. Por lo tanto, la probabilidad de que una batería dure
más de 40 000 horas es 1 – 0.7580 = 0.2420.
La función de Excel INV.NORM usa un cálculo inverso para hallar el valor de 𝑥
que corresponde a una probabilidad acumulada dada. Esta función tiene los
siguientes argumentos:
1. Probabilidad: Es la probabilidad correspondiente a la distribución normal
2. Media: Es la media aritmética de la distribución (𝜇)
3. Desv_estándar: Es la desviación estándar de la distribución (𝜎)
ESTADÍSTICA INFERENCIAL
9
Por ejemplo, si se quisiera conocer la duración que la empresa debe ofrecer en
su garantía de manera que no más del 10% de las baterías sean aptas para
solicitar la garantía. Se procederá de la siguiente forma: Seleccionamos en la
hoja de cálculo la función de Excel INV.NORM como se muestra en la imagen.
Se ingresa en el cuadro de dialogo los valores de los argumentos.
Se obtiene el valor de 30092, indicando la probabilidad de que una batería dure
30 092 horas es 0.10.
ESTADÍSTICA INFERENCIAL
10
La función de Excel para calcular probabilidades exponenciales es
DISTR.EXP.N, que cuenta con los siguientes argumentos.
1. X: Es el valor de la función.
2. Lambda: Es el valor del parámetro.
3. Acum: Es el valor lógico que indica la forma de la función exponencial
que va a aplicar. Si el valor de este argumento es VERDADERO,
DISTR.EXP.N devuelve la función de distribución acumulativa; si es
FALSO, devuelve la función de densidad de probabilidad.
Por ejemplo, el tiempo en minutos que una persona cualquiera se toma para
revisar su correo electrónico sigue una distribución exponencial con 𝜆 = 15
.
Calcula la probabilidad de que una persona cualquiera permanezca conectado al
servidor de correo menos de un minuto.
Se ingresan los valores de los argumentos en el cuadro de dialogo como se
muestra a continuación
ESTADÍSTICA INFERENCIAL
11
De esta forma se obtiene que la probabilidad de que una persona cualquiera
permanezca conectada al servidor de correo menos de un minuto es de 0.181.
Continuando con el mismo ejemplo, ahora se desea conocer la probabilidad de
que una persona cualquiera permanezca conectada al servidor de correo más de
una hora. Nuevamente ingresamos los valores de los argumentos que son los
siguientes:
Obtenemos el valor de 0.999993856 que corresponde a la probabilidad de que
una persona cualquiera permanezca conectada al servidor del correo una hora.
Por lo tanto, la probabilidad de que una persona cualquiera permanezca
conectada al servidor de correo más de una hora es, 𝑃(𝑋 > 60) = 1 − 𝑃(𝑋 =
60) = 0.0000061
ESTADÍSTICA INFERENCIAL
12
ESTADÍSTICA INFERENCIAL
13
Conclusión
En esta sesión viste que una distribución de Poisson con parámetro 𝜆
suficientemente grande se aproxima a una distribución normal y que la
distribución normal a la que se aproxima deberá tener la misma media y varianza
que la distribución de Poisson de la que proviene.
La distribución exponencial es una distribución continua que cuenta con una
propiedad conocida como falta de memoria y proporciona una amplia
aplicabilidad, como la descripción del tiempo requerido para completar una tarea.
Además, la hoja de cálculo de Excel resulta una herramienta fácil de usar y
accesible para calcular probabilidades de distribuciones continuas.
Sabías que una de las principales áreas de la inferencia estadística son las
pruebas de hipótesis, pero ¿en qué consisten éstas?
ESTADÍSTICA INFERENCIAL
14
Para aprender más
¿Qué es y para qué nos sirve la distribución exponencial?
• Ingeniat. (4 de abril de 2013). Distribución exponencial. [Archivo de video]
Recuperado de:
https://www.youtube.com/watch?v=06oeO43HES8
¿En qué casos podemos utilizar una aproximación de una distribución de probabilidad a otra?
• Morettini, M. (septiembre de 2013). Aproximaciones de distribuciones de
probabilidad: enfoque empírico. Documento obtenido de Portal de
Promoción y Difusión Pública del Conocimiento Académico y Científico:
http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf
ESTADÍSTICA INFERENCIAL
15
Actividad de Aprendizaje
Instrucciones:
Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta
sesión, ahora tendrás que realizar la siguiente actividad:
Resuelve los siguientes problemas empleando ya sea la hoja de cálculo de
Excel o algún otro software de estadística al cual tengas acceso.
1. En un hospital el promedio de pacientes con hipertensión arterial
atendidos por día es de 15. Calcula la probabilidad de que en un día
determinado haya más de 27 pacientes con hipertensión arterial.
2. En una cierta ciudad el número promedio de bloqueos de vialidades al día
debido a manifestaciones es 12. ¿Cuál es la probabilidad aproximada de
tener 17 o menos bloqueos de vialidades debido a manifestaciones en
cualquier día dado?
3. Suponiendo que el tiempo de recorrido de un camión repartidor sigue una
distribución exponencial. Si la media del tiempo recorrido es de 36.5
minutos. ¿Cuál es la probabilidad de que el tiempo de recorrido sea de 40
horas o menos?
4. El periodo de vida en años de un interruptor eléctrico tiene una
distribución exponencial con un promedio de falla de 𝜇 = 2 años. ¿Cuál es
la probabilidad de que un interruptor falle después del segundo año?
Inserta las capturas de pantalla en un procesador de textos y analiza los
resultados obtenidos, al final tendrás que guardarlo en formato PDF, y entregarlo
de acuerdo a las indicaciones de tu profesor.
ESTADÍSTICA INFERENCIAL
16
Recuerda que esta actividad te ayudará a familiarizarte con el software
estadístico para el cálculo de algunas de las probabilidades de las distribuciones
de variables continuas.
Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo
siguiente:
• Tus datos generales.
• Título de la actividad.
• Desarrollo completo y correcto de los ejercicios.
• Análisis y conclusiones.
• Ortografía y redacción.
• Capturas de pantalla visibles.
ESTADÍSTICA INFERENCIAL
17
Bibliografía
• Álvarez, C. R. (2007). Estadística aplicada a las ciencias de la salud.
España: Díaz de Santos.
• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística
para administración y economía (10 ed.). México: Cengage Learning.
• Anderson, D. R., Sweeney, D. J., Williams, T. A., & Martin, K. (2011).
Métodos cuantitativos para los negocios (11 ed.). México: Cengage
Learning.
• Berenson, M. L., & Levine, D. M. (1996). Estadística básica en
administración. Conceptos y aplicaciones. México: Pearson Educación.
• Cáceres, H. J. J. (2007). Conceptos básicos de estadística para ciencias
sociales. España: Delta.
• Cóndor, E. I. T. (1989). Teoría de las probabilidades y aplicaciones
estadísticas. San Marcos.
• Elorza, Pérez-Tejada, H. (2008). Estadística para las ciencias sociales,
del comportamiento y de la salud (3 ed.). México: Cengage Learning.
• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.
Una visión instrumental. España: Díaz de Santos.
• Hines, W. W., & Montgomery, D. C. (1996). Probabilidad y estadística
para ingeniería y administración (2 ed.). México: Compañía Editorial
Continental.
• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a
los negocios y economía (15 ed.). México: McGraw-Hill.
• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.
ESTADÍSTICA INFERENCIAL
18
• Render, B., Stair, R. M., & Hanna, M. E. (2012). Métodos cuantitativos
para los negocios (11 ed.). México: Pearson Educación.
• Rodríguez, F. J., Pierdant, R. A., & Rodríguez, J. E. C. (2014). Estadística
para administración. México: Grupo Editorial Patria.
Cibergrafía
• Ingeniat. (4 de abril de 2013). Distribución exponencial. [Archivo de video]
Recuperado de:
https://www.youtube.com/watch?v=06oeO43HES8
• Morettini, M. (septiembre de 2013). Aproximaciones de distribuciones de
probabilidad: enfoque empírico. Documento obtenido de Portal de
Promoción y Difusión Pública del Conocimiento Académico y Científico:
http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf
Te invito a que consultes la Biblioteca Digital UNID