01 - Repaso de Probabilidad y Estad-stica Semana 1

13
Formato Lectura LECTURA 1: Repaso de Probabilidad y Estadística En esta primera parte del curso y a manera de introducción se espera que el estudiante realice un repaso, con el cual se pueda crear una visión general de los aspectos básicos de probabilidad, específicamente en los temas relacionados con variables aleatorias y distribuciones de probabilidad, las cuales serán base fundamental para la construcción del conocimiento de modelos estocásticos. De igual manera se espera que el estudiante por medio de la siguiente lectura tenga claras las diferencias entre un espacio muestral discreto con sus respectivas distribuciones y un espacio muestral continuo con sus respectivas distribuciones. VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD Diferentes ciencias y disciplinas han querido hacer inferencias acerca de comportamientos en la población y el mundo en general. En el caso de los inventarios, es importante estar en capacidad de hacer inferencias del comportamiento de la demanda. Para tener noción de ese comportamiento, debemos conocer básicamente dos cosas: el conjunto de valores que puede tomar la demanda y la probabilidad asociada a cada uno de esos valores. A dicho conjunto de valores se le conoce como el espacio muestral. De esta manera, se va a definir una variable aleatoria como la función que asocia un número real (probabilidad) con cada uno de los valores del espacio muestral. Un ejemplo de definición de una variable aleatoria (“X”) relacionada con la demanda sería: X: Número de unidades a vender en el mes de enero. La siguiente tabla representa la distribución de probabilidades según el espacio muestral.

description

guia

Transcript of 01 - Repaso de Probabilidad y Estad-stica Semana 1

Page 1: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Formato Lectura

LECTURA 1: Repaso de Probabilidad y Estadística

En esta primera parte del curso y a manera de introducción se espera

que el estudiante realice un repaso, con el cual se pueda crear una

visión general de los aspectos básicos de probabilidad,

específicamente en los temas relacionados con variables aleatorias y

distribuciones de probabilidad, las cuales serán base fundamental para

la construcción del conocimiento de modelos estocásticos. De igual

manera se espera que el estudiante por medio de la siguiente lectura

tenga claras las diferencias entre un espacio muestral discreto con sus

respectivas distribuciones y un espacio muestral continuo con sus

respectivas distribuciones.

VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD

Diferentes ciencias y disciplinas han querido hacer inferencias acerca

de comportamientos en la población y el mundo en general. En el caso

de los inventarios, es importante estar en capacidad de hacer

inferencias del comportamiento de la demanda. Para tener noción de

ese comportamiento, debemos conocer básicamente dos cosas: el

conjunto de valores que puede tomar la demanda y la probabilidad

asociada a cada uno de esos valores. A dicho conjunto de valores se le

conoce como el espacio muestral. De esta manera, se va a definir una

variable aleatoria como la función que asocia un número real

(probabilidad) con cada uno de los valores del espacio muestral.

Un ejemplo de definición de una variable aleatoria (“X”) relacionada

con la demanda sería:

X: Número de unidades a vender en el mes de enero.

La siguiente tabla representa la distribución de probabilidades según el

espacio muestral.

Page 2: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Tabla 1: distribución de probabilidades según el espacio muestral

Espacio Muestral Probabilidad

100 35%

80 55%

60 10% Fuente: elaboración propia

Para definir de manera más fácil las variables aleatorias, se crearon

distribuciones de probabilidad, las cuales pueden describir el

comportamiento de una serie de valores determinados de forma clara y

resumida. Estos permiten calcular de manera más eficiente las

probabilidades asociadas a los diferentes valores y para fines de esta

lectura, se explicarán las tres distribuciones de probabilidad más usadas

en el campo de la administración de inventarios.

Antes de proceder con los tipos de distribuciones se debe aclarar la

diferencia fundamental entre un espacio muestral discreto, un espacio

muestral continuo y el respectivo comportamiento de las variables

aleatorias. Un espacio muestral discreto es aquel que contiene un

número finito de posibilidades o una serie interminable con tantos

elementos como números enteros existen, de acuerdo a lo anterior si en

la distribución se puede contar el conjunto de resultados posibles se le

conoce como variable aleatoria discreta. Un espacio muestral continuo

es aquel que contiene un número infinito de posibilidades igual al

número de puntos en un segmento de línea, es decir que cuando una

variable aleatoria puede tomar valores en una escala continua se le

conoce como variable aleatoria continua, en pocas palabras las

variables aleatorias continuas representan datos medidos, como lo

pueden ser todos los posibles pesos, temperaturas, distancias, etc.,

mientras que las variables aleatorias discretas representan datos

contados, como lo son el número de artículos defectuosos en una

muestra de n artículos, la cantidad de accidentes de autopista en cierto

estado, etc.

Con esta breve explicación, veremos a continuación los diferentes tipos

de distribuciones más utilizadas.

DISTRIBUCIONES DISCRETAS

Distribución Binomial

Está distribución se caracteriza por manejar los conocidos experimentos

de Bernoulli, en donde cada experimento de Bernoulli debe tener las

siguientes propiedades:

El experimento consiste en N pruebas que se repiten.

Page 3: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Cada prueba produce un resultado que se puede clasificar como

éxito o fracaso.

La probabilidad de éxito, que se denota con la letra p,

permanece constante en cada prueba.

Las pruebas que se repiten son independientes.

Entonces, si se hacen N experimentos independientes cuyo resultado en

cada ensayo puede ser únicamente Éxito (con probabilidad p) o

Fracaso (con probabilidad q = 1‐ p), a la Variable Aleatoria X: número

de éxitos en los N ensayos, se le conoce como la Variable Aleatoria

Binomial y su Función de Probabilidad es conocida como la Distribución

Binomial de parámetros N, p:

𝒈𝑿𝑩

= (𝒌; 𝑵, 𝒑) = 𝑷(𝑿𝑩 = 𝒌)

𝒈𝑿𝑩= (𝒌; 𝑵, 𝒑) = (

𝑵𝒌

) (𝒑)𝒌(𝟏 − 𝒑)𝑵−𝒌 , 𝒌 = 𝟏, 𝟐, … , 𝑵

𝑬(𝑿𝑩; 𝑵, 𝒑) = 𝑵𝒑

𝑽𝒂𝒓(𝑿𝑩; 𝑵, 𝒑) = 𝑵𝒑𝒒

Ejemplo:

La probabilidad de que cierta clase de componente sobreviva a una

prueba de choque dada es de ¾. Encuentre la probabilidad de que

sobrevivan exactamente dos de los siguientes cuatro componentes que

se prueben.

Lo primero que debemos suponer es que las pruebas son

independientes y como 𝑝 = 3 4⁄ para cada una de las cuatro

pruebas obtenemos:

𝑉𝑎𝑟 (2; 4; 3 4⁄ ) = (4

2) (

3

4)

2

(1 −3

4)

4−2

= 4!

2! 2!∗

32

44=

27

128= 𝟎. 𝟐𝟏𝟎𝟗

La probabilidad de que sobrevivan exactamente dos de los

siguientes cuatro componentes que se prueben es del 21%.

En algunos casos, nos interesaremos por solucionar problemas donde

conocer 𝑃(𝑋 < 𝑟) o 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) sea necesario. Para solucionar este tipo

de problemas disponemos de las sumas binomiales:

𝑩(𝒓; 𝒏, 𝒑) = ∑ 𝒃(𝒙; 𝒏, 𝒑)

𝒓

𝒙=𝟎

Page 4: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Las cuales pueden ser consultadas en tablas para solucionar los

problemas o con la herramienta de Excel, la cual directamente calcula

la probabilidad introduciendo previamente los datos pertinentes y el

tipo de distribución. Las tablas mencionadas anteriormente pueden ser

consultadas en el libro “Probabilidad y estadística para ingenieros-

Ronald Walpole – 6 Ed.” en la tabla A.1 del apéndice.

Ejemplo:

La probabilidad de que un paciente se recupere de una rara

enfermedad sanguínea es del 0.4 si se sabe que 15 personas contraen

esta enfermedad, ¿cuál es la probabilidad de que (a) sobrevivan al

menos 10, (b) sobrevivan de 3 a 8 y (c) sobrevivan exactamente 5?

X= Número de personas que sobreviven

(a) 𝑃(𝑋 ≥ 10) = 1 − 𝑃(𝑋 < 10) = 1 − ∑ 𝑏(𝑥; 15, 0.4) = 1 − 0.96629𝑥=0

= 𝟎. 𝟎𝟑𝟑𝟖

(b) 𝑃(3 ≤ 𝑋 ≤ 8) = ∑ 𝑏(𝑥; 15,0.4)8𝑥=3

∑ 𝑏(𝑥; 15,0.4)

8

𝑥=0

− ∑ 𝑏(𝑥; 15,0.4)

2

𝑥=0

= 0.9050 − 0.0271 = 𝟎. 𝟖𝟕𝟕𝟗

(c) 𝑃(𝑋 = 5) = 𝑏(5; 15, 0.4) = ∑ 𝑏(𝑥; 15, 0.4)5𝑥=0 − ∑ 𝑏(𝑥; 15, 0.4)4

𝑥=0

= 0.4032 – 0.2173 = 𝟎. 𝟏𝟖𝟓𝟗

Distribución Geométrica

Es aquella en donde sí se realizan sucesivamente experimentos

independientes de Bernoulli de parámetro p, a la variable aleatoria 𝑋𝐺:

“número de ensayos hasta obtener el primer éxito” se le conoce como

una variable aleatoria con Distribución Geométrica de parámetro p.

𝒈𝒙(𝒏) = (𝟏 − 𝒑)𝒏−𝟏𝒑

𝑬(𝑿𝑮; 𝑵, 𝒑) = 𝟏/𝒑

𝑽𝒂𝒓(𝑿𝑮; 𝒑) = (𝟏 − 𝒑)/𝒑𝟐

Page 5: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Gráfica 1: representación gráfica de una variable aleatoria geométrica.

Fuente: elaboración propia

Ejemplo:

Se sabe que cierto proceso de fabricación, en promedio, uno de cada

100 artículos está defectuoso. ¿Cuál es la probabilidad de que el quinto

artículo que se inspecciona sea el primer defectuoso que se encuentra?

Al usar la distribución geométrica con n=5 y p= 0.01, tenemos

𝑔(5; 0.01) = (0.01)(0.99)5−1 = 𝟎. 𝟎𝟎𝟗𝟔

La probabilidad de que el quinto artículo que se inspecciona sea

el primer defectuoso que se encuentra es del 0.96%.

Ejemplo:

En “tiempo ocupado” un conmutador telefónico está muy cerca de su

capacidad, por lo que los usuarios tienen dificultad al hacer sus

llamadas. Puede ser de interés conocer el número de intentos

necesarios a fin de conseguir un enlace telefónico. Suponga que p=

0.05 es la probabilidad de conseguir un enlace durante el tiempo

ocupado. Nos interesa conocer la probabilidad de que se necesiten

cinco intentos para una llamada exitosa.

El uso de la distribución geométrica con n= 5 y p= 0.05 nos da

𝑃(𝑋 = 𝑥) = 𝑔(5: 0.05) = (0.05)(0.95)5−1 = 𝟎. 𝟎𝟒𝟏

La probabilidad de que se necesiten cinco intentos para una

llamada exitosa es del 4.1%.

Page 6: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Distribución Binomial Negativa

La distribución binomial negativa es aquella en donde si pruebas

independientes repetidas pueden tener como resultado un éxito con

probabilidad p y un fracaso con probabilidad q = 1- p, entonces la

distribución de probabilidad de la variable aleatoria X, el número de la

prueba en la que ocurre el k-ésimo éxito, es

𝒃(𝒙; 𝒌, 𝒑) = (𝒙 − 𝟏

𝒌 − 𝟏) 𝒑𝒌𝒒𝒙−𝒌, 𝒙 = 𝒌, 𝒌 + 𝟏, 𝒌 + 𝟐, ….

Ejemplo:

Encuentre la probabilidad de que una persona que lanza tres monedas

obtenga sólo caras o sólo cruces por segunda vez en el quinto

lanzamiento.

Al utilizar la distribución binomial negativa con x= 5, k= 2, y p= ¼,

tenemos:

𝑏 (5; 2,1

4) = (

4

1) (

1

4)

2

(3

4)

3

= 4!

1! 3!∗

33

45=

27

256= 𝟎. 𝟏𝟎𝟓

La probabilidad de que la persona que lanza tres monedas

obtenga sólo caras o sólo cruces por segunda vez en el quinto

lanzamiento es del 10.5%.

Ejemplo:

Los registros de una compañía constructora de pozos, indican que la

probabilidad de que uno de sus pozos nuevos, requiera de reparaciones

en el término de un año es de 0.20. ¿Cuál es la probabilidad de que el

sexto pozo construido por esta compañía en un año dado sea el

segundo en requerir reparaciones en un año?

Al utilizar la distribución binomial negativa con x=6, k= 2, y p= 0.20,

tenemos

𝑏(6; 2, 0.20) = (5

1) (0.20)2(0.80)6−2 =

5!

1! 4!∗ (0.20)2(0.80)4 = 𝟎. 𝟎𝟖𝟏𝟗

Page 7: 01 - Repaso de Probabilidad y Estad-stica Semana 1

La probabilidad de que el sexto pozo construido por la compañía

en un año dado sea el segundo en requerir reparaciones en un

año es del 8.19%.

DISTRIBUCIONES CONTINUAS

Distribución Normal

Otra de las distribuciones de probabilidad más usadas es la distribución

normal. Esta función es denominada la más importante en el campo

estadístico gracias a que su aproximación puede describir la mayoría de

fenómenos de la naturaleza, la industria y la ciencia. Se caracteriza por

su simetría y su forma de campana. Su función de densidad, media,

varianza y gráfica son las siguientes:

Gráfica 2: función de densidad, media, varianza y gráfica de la variable aleatoria normal.

Fuente: tomado el 8 de febrero de 2013 de

http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/distribprobabil/distribnor

mal.htm

Consecuentemente su función de densidad acumulada sería:

Page 8: 01 - Repaso de Probabilidad y Estad-stica Semana 1

𝐹𝑥 = ∫ 𝑓(𝑥) = ∫1

√2𝜋𝜎2

𝑥′

−∞

𝑥′

−∞

𝑒−

(𝑥−𝜇)

2𝜎2 𝑑𝑥

Para facilitar la resolución de problemas se crearon tablas de la función

de densidad acumulada de una distribución de una variable aleatoria

normal con media 0 y varianza 1. Esta distribución se conoce como la

distribución normal estándar y su función acumulada es la siguiente:

𝑍 =𝑋 − 𝜇

𝜎

𝑍 = 𝑉𝑎𝑙𝑜𝑟 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝜎 𝑞𝑢𝑒 𝑠𝑒 𝑎𝑙𝑒𝑗𝑎 𝑑𝑒 𝜇)

Gráfica 3: tabla de la distribución normal estándar

Fuente: tomado el 8 de febrero de 2013 de

http://www.google.com.co/search?q=tabla+de+la+normal&hl=es-

419&tbo=u&biw=1366&bih=673&tbm=isch&source=univ&sa=X&ei=dA8YUdD9GqbX0QGho4D4C

Q&ved=0CCoQsAQ#imgrc=-sMTe-

Aztfi9cM%3A%3B4WbD6AAHuB6blM%3Bhttp%253A%252F%252Fwww.ieszaframagon.com%252Fma

tematicas%252Festadistica%252Fvar_aleatoria%252Ftabla_normal.png%3Bhttp%253A%252F%252F

www.ieszaframagon.com%252Fmatematicas%252Festadistica%252Fvar_aleatoria%252Ftema5_5.

html%3B513%3B681

Page 9: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Estas tablas de distribución normal Z se pueden encontrar fácilmente en

internet o en el libro mencionado anteriormente, “Probabilidad y

estadística para ingenieros- Ronald Walpole – 6 Ed.”

Ejemplo (Ubicación de áreas en la curva de la distribución normal):

Dada una distribución normal estándar, encuentre el área bajo la curva

que yace (a) a la derecha de z = 1.84 y (b) entre z = -1.97 y z = 0.86

(a) El área en la figura (a) a la derecha de z = 1.84 es igual a 1

menos el área en la tabla de la distribución normal para dicho

valor a la izquierda de z = 1.84 , entonces, 1 – (el valor de z=1.84

que según tablas es = 0.9671), tenemos, 1 – 0.9671 = 0.0329

(b) El área en la figura (b) entre z = -1.97 y z = 0.86 es igual al área a

la izquierda de z = 0.86 menos el área a la izquierda de z = -1.97.

De la tabla de la distribución normal, encontramos que para

dichos valores el parea deseada es 0.8051 – 0.0244 = 0.7807.

Ejemplo:

Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años,

con una desviación estándar de 0.5 años. Suponga que las duraciones

de la batería se distribuyen normalmente, encuentre la probabilidad de

que una batería dada dure menos de 2.3 años.

Primero debemos construir un diagrama como el que se muestra a

continuación, el cual muestra la distribución dada de duraciones

de las baterías y el área de se desea. Para encontrar la 𝑃(𝑋 < 2.3),

necesitamos evaluar el área bajo la curva normal a la izquierda

de 2.3. Esto se logra al encontrar el área a la izquierda del valor de

x correspondiente.

Page 10: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Gráfica 4: representación gráfica de una variable aleatoria normal con media 3 y

desviación estándar 0.5

Fuente: elaboración propia

De aquí encontramos que:

𝑍 = 2.3 − 3

0.5= −1.4

Y luego con el uso de las tablas de la distribución para Z tenemos:

𝑃(𝑋 < 2.3) = 𝑃(𝑍 < −1.4) = 𝟎. 𝟎𝟖𝟎𝟖

La probabilidad de que una batería dada, dure menos de 2.3

años es del 8.08%.

Ejemplo:

Una empresa eléctrica fabrica focos que tienen una duración, antes de

fundirse, que se distribuye normalmente con media igual a 800 horas y

una desviación estándar de 40 horas. Encuentre la probabilidad de que

un foco se funda entre 778 y 834 horas.

Primero debemos graficar la distribución de los focos, como se

muestra a continuación:

Gráfica 4: representación gráfica de una variable aleatoria normal con media 800 y

desviación estándar 40

Fuente: elaboración propia

Page 11: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Los valores Z que corresponden a 𝑋1 = 778 ℎ𝑜𝑟𝑎𝑠 𝑦 𝑋2 = 834 ℎ𝑜𝑟𝑎𝑠

son:

𝑍1 = 778 − 800

40= −𝟎. 𝟓𝟓 𝑦 𝑍2 =

834 − 800

40= 𝟎. 𝟖𝟓

Entonces,

𝑃(778 < 𝑋 < 834) = 𝑃(−0.55 < 𝑍 < 0.85)

= 𝑃(𝑍 < 0.85) − 𝑃(𝑍 < −0.55)

= 0.8023 − 0.2919 = 𝟎. 𝟓𝟏𝟏𝟏

La probabilidad de que un foco se funda entre 778 y 834 horas es

del 51.11%.

Distribución Exponencial

A pesar de que la distribución normal puede ser usada para resolver

varios problemas de cualquier tipo, existen numerosas situaciones que

requieren de otro tipo de distribuciones. La distribución exponencial se

caracteriza por modelar tiempos entre eventos, lo que la hace muy útil

en el campo de la ingeniería. Su función de densidad, media, varianza y

gráfica son las siguientes:

Page 12: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Gráfica 5: Su función de densidad, media, varianza y gráfica de una variable aleatoria

exponencial.

Fuente: tomado el 8 de febrero de 2013 de

http://www.monografias.com/trabajos84/distribucion-exponencial/distribucion-

exponencial.shtml

Recuerde que debido a la relación que tiene la distribución exponencial

con el proceso Poisson, la función de densidad se puede formular en

términos de la tasa λ de la siguiente forma:

𝒇(𝒙) = 𝝀𝒆−𝝀𝒙

Integrando, su función de densidad acumulada en términos de λ sería:

𝑭𝒙 = 𝟏 − 𝒆−𝝀𝒙

Page 13: 01 - Repaso de Probabilidad y Estad-stica Semana 1

Ejemplo:

Suponga que un sistema contiene cierto tipo de componente cuyos

tiempos de falla en años está dado por T. La variable T se modela bien

mediante la distribución exponencial con tiempo medio para la falla β =

5. Si se instalan cinco de estos componentes en diferentes sistemas,

¿Cuál es la probabilidad de que al menos dos aún funcionen al final del

día?

La probabilidad de que un componente dado aún funcione

después de ocho años está dada por:

𝑃(𝑇 > 8) =1

5 ∫ 𝑒

−𝑡

5

8

𝑑𝑡 = 𝑒−8

5 ≅ 𝟎. 𝟐

Represéntese con X el número de componentes que funcionan

después de ocho años. Entonces con el uso de la distribución

binomial tenemos:

𝑃(𝑋 ≥ 2) = ∑ 𝑏(𝑥; 5,0.2)

5

𝑥=2

= 1 − ∑ 𝑏(𝑥; 𝑏, 0.2) = 1 − 0.7373 = 𝟎. 𝟐𝟔𝟐𝟕

1

𝑥=0

La probabilidad de que un componente dado aún funciones

después de 8 años es del 26.2%.

Ejemplo:

Se ha comprobado que el tiempo de vida de cierto tipo de

marcapasos sigue una distribución exponencial con media de 16 años.

¿Cuál es la probabilidad de que a una persona a la que se le ha

implantado este marcapasos se le deba reimplantar otro antes de 20

años?

Recordemos la relación existente entre la distribución de Poisson y

la exponencial, por lo tanto tenemos lo siguiente:

𝑇~𝐸𝑥𝑝 (𝜆 =1

6) → 𝑓(𝑡) = 𝜆𝑒−𝜆𝑡 𝑦 𝐹(𝑡) = 1 − 𝑒−𝜆𝑡

Entonces,

𝑃(𝑇 ≤ 20) = ∫ 𝑓(𝑡)𝑑𝑡 = 𝐹(20) = 1 − 𝑒−20

16 = 0.713520

0

La probabilidad de que a la persona que se le ha implantado un

marcapasos se le deba reimplantar otro antes de 20 años es del

71.3%.