Notas de probabilidad

94
1 CONCEPTOS SICOS DE PROBABILI- DAD INTRODUCCIÓN En la naturaleza existen fenómenos que se denominan  aleatorios. Que sean aleatorios signi…ca simplemente que no es posible predecir con entera exactitud sus resultados. El que un fenómeno sea aleatorio no necesariamente es una propiedad del fenómeno mismo, sino de la posici ón rela tiv a del observ ador. Por ejemplo, un eclipse solar ha dejado de ser aleatorio porque con las leyes de la mecánica celeste hoy día se le puede predecir con entera certeza, pero para alguien que no conoce de mecánica celeste, el eclipse solar es esencialmente un fenómeno aleatorio; los números aleatorios generados por una computadora en el fondo no son aleatorios porque se producen en forma recursiva, pero al no conocerse explícitamente dicha función recursiva, sí resultan aleatorios en el sentido de que no podemos predecir la secuencia. Ejemplos de fenómenos aleatorios: 1. En Física: La resistencia a la tensión de una barra de acero. 2. En política: El número de integrantes del padrón electoral que va a votar por un cierto candidato. 3. En Economía: El índice de in‡ación al …nal del año. 4. En producción: El número de artículos defectuosos que se producirán en una jornada de trabajo. 5. En meteorología: La temperatura de mañana a las 8 de la mañana. 6. En Educación: El número de alumnos que aprobarán el curso de proba- bilidad. 7. En Medicina: El número de pacie nte s que resultarán curados cuando se les aplique un nuevo medicamento. Ante la presencia de un fenómeno aleatorio, hay dos actitudes posibles: (a)  Resignarse y decir “no hay nada que yo pueda hacer al respecto”. (b)  Reconocer que la aleatoriedad está presente, enfrentarla y proceder a cuan- ti…carla (actitud cientí…ca y racional). (b) se ab orda matemáticamen te a través de una abstracción llamada modelo de probabilidad, que se representa por  (;  A ; P ), donde    representa los resultados posibles del fenómeno aleatorio,  A  es un conjunto de subconjuntos de    llamados  eventos  cuyo azar es de interés cuanti…car y  P  es una función de A  en  R que asigna una magnitud a cada evento, así que, se hablará de  P (A), 8A 2 A; a  P  se le llama  medida de probabilidad. 1

description

Notas de Curso de Probabilidad

Transcript of Notas de probabilidad

Page 1: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 1/94

1 CONCEPTOS BÁSICOS DE PROBABILI-

DADINTRODUCCIÓN 

En la naturaleza existen fenómenos que se denominan  aleatorios. Que seanaleatorios signi…ca simplemente que no es posible predecir con entera exactitudsus resultados.

El que un fenómeno sea aleatorio no necesariamente es una propiedad delfenómeno mismo, sino de la posición relativa del observador. Por ejemplo, uneclipse solar ha dejado de ser aleatorio porque con las leyes de la mecánicaceleste hoy día se le puede predecir con entera certeza, pero para alguien queno conoce de mecánica celeste, el eclipse solar es esencialmente un fenómenoaleatorio; los números aleatorios generados por una computadora en el fondono son aleatorios porque se producen en forma recursiva, pero al no conocerse

explícitamente dicha función recursiva, sí resultan aleatorios en el sentido deque no podemos predecir la secuencia.

Ejemplos de fenómenos aleatorios:

1. En Física: La resistencia a la tensión de una barra de acero.

2. En política: El número de integrantes del padrón electoral que va a votarpor un cierto candidato.

3. En Economía: El índice de in‡ación al …nal del año.

4. En producción: El número de artículos defectuosos que se producirán enuna jornada de trabajo.

5. En meteorología: La temperatura de mañana a las 8 de la mañana.6. En Educación: El número de alumnos que aprobarán el curso de proba-

bilidad.

7. En Medicina: El número de pacientes que resultarán curados cuando seles aplique un nuevo medicamento.

Ante la presencia de un fenómeno aleatorio, hay dos actitudes posibles:

(a)  Resignarse y decir “no hay nada que yo pueda hacer al respecto”.

(b)  Reconocer que la aleatoriedad está presente, enfrentarla y proceder a cuan-ti…carla (actitud cientí…ca y racional).

(b) se aborda matemáticamente a través de una abstracción llamada modelode probabilidad, que se representa por   (; A; P ), donde     representa losresultados posibles del fenómeno aleatorio, A  es un conjunto de subconjuntosde    llamados  eventos  cuyo azar es de interés cuanti…car y  P  es una función deA  en  R que asigna una magnitud a cada evento, así que, se hablará de  P (A),8A 2 A; a  P  se le llama  medida de probabilidad.

1

Page 2: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 2/94

Este modelo de probabilidad realiza todo lo que un ser humano puede hacercon respecto a un fenómeno aleatorio, que es cuanti…car la incertidumbre a

través de la asignación de probabilidades a los eventos. Todo lo demás, es decir,la predicción de un resultado especí…co de un fenómeno aleatorio, solo puede serobra de un ser con poderes sobrenaturales. Hay que notar que en el momentoen que un fenómeno sea predecible, deja de ser útil el concepto de modelo deprobabilidad, ya que el fenómeno deja de ser aleatorio por de…nición.

La Teoría de Probabilidad  tiene por objeto estudiar las propiedades delmodelo (; A; P ); por ejemplo, si se conoce el valor de  P (A) para ciertos tiposde eventos  A, podemos estudiar cuáles son los valores de  P (B) para eventos  Bque son de estructura más compleja que  A.

EL CURSOEste curso es sólo una introducción a la probabilidad, consistiendo bási-

camente en identi…car cada uno de los elementos del modelo   (; A

; P )  y enconstruir procesos y estrategias que nos permitan aprender a asignar medidasde probabilidad a ciertos eventos en situaciones especí…cas, esto es lo que común-mente se denomina cálculo de probabilidades.

1.1 El espacio de Probabilidad (, A, PX )

1.1.1 Probabilidad a Priori, a Posteriori y Axiomática

El estudio de la probabilidad no es reciente, desde que surgieron los juegos deazar ha existido la necesidad de estudiar las probabilidades y es por esto que enun principio la teoría de probabilidad estuvo fuertemente asociada con juegosde azar. Su estudio formal se inició en el siglo XVII y estuvo motivado precisa-

mente por el interés de los jugadores por tratar de “anticipar” los resultados deun juego. El Caballero De Meré, un jugador profesional de ese tiempo, planteó asu amigo Pascal (sí, precisamente al matemático francés Pascal) muchos proble-mas cuya solución requería conocer para tener éxito en las mesas de juego. Pararesolver estos problemas Pascal introdujo importantes ideas que empezaron adarle forma a lo que podría llamarse una teoría de la probabilidad y que alcanzósu apogeo cuando Pascal inicia un intercambio de correspondencia con Fermat(quien en esa época era considerado uno de los mejores matemáticos) para dis-cutir la forma de resolverlos. Esta celebrada correspondencia es actualmenteconsiderada por muchos como el nacimiento de la Teoría de Probabilidad.

La Teoría de Probabilidad tal como hoy la conocemos no es exactamente lamisma que desarrollaron Pascal y Fermat. En realidad, actualmente se recono-cen tres tipos de probablidad:   la probabilidad clásica o a priori, la probabilidad 

de frecuencias o a posteriori y la probabilidad axiomática.

Probabilidad Clásica o a Priori    La asociación de la probabilidad a los juegos de azar, fue lo que dio lugar a la de…nición de probabilidad clásica.Veamos cómo fue esto.

2

Page 3: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 3/94

Aún cuando en los juegos de azar el resultado de un solo ensayo es incierto,los jugadores reconocían que en un número grande de ensayos el resultado es

predecible. Sabían por ejemplo, que en una gran cantidad de lanzamientosde una moneda legal, aproximadamente la mitad de las veces saldría “águila”.Es esta regularidad solo predecible en muchas corridas lo que hace que las casasde juego se embarquen en este tipo de negocio.

Actualmente se sabe que un tipo similar de incertidumbre y de regularidada largo plazo ocurre en las ciencias experimentales, por ejemplo,una compañíade seguros no puede predecir si una persona en particular va a morirse a los 50años, pero sí predecir muy satisfactoriamente cuántas gentes en el país morirána esa edad.

Pues bien, haciendo uso de esta “regularidad”, los jugadores procedían comosigue. Supongamos que queremos hallar la probabilidad de que al lanzar unamoneda legal salga “águila”. Como sólo hay dos maneras de que caiga unamoneda, águila o sol, y puesto que la moneda es legal, uno esperaría que sea tanprobable que salga  águila  como que salga  sol  (o sea, que en un número grandede tiradas sería tan frecuente que salga  águila  como que salga sol ); entonces, alevento de que salga   águila  debe asignársele el valor 1/2. La generalización deeste razonamiento es lo que dio lugar a la de…nición de probabilidad clásica.

De…nición (Probabilidad Clásica):  Si en un experimento aleatorio sepueden obtener n  resultados mutuamente excluyentes e igualmente probables ysi  nA  de estos resultados, tienen un atributo  A, entonces la probabilidad de  A

es la fracción  nA

n  .

Ejemplo:Se lanza un dado ordinario. Entonces, hay 6 resultados posibles. Estos 6

resultados son mutuamente excluyentes puesto que no pueden salir dos o máscaras simultáneamente. Como el dado es legal los 6 resultados son igualmente

probables, es decir, se espera que cada cara aparezca con aproximadamente lamisma frecuencia relativa a largo plazo. Ahora supongamos que queremos hallarla probabilidad de que el resultado del lanzamiento sea un número par. Tres delos 6 resultados posibles tienen esta propiedad. Por lo tanto, la probabilidad deque salga un número par cuando se lanza un dado es 3/6, o 1/2. Similarmente laprobabilidad de que salga el 5 es 1/6, y la probabilidad de que salga un númeromayor que 2 es 2/3.

Una de…nición como la dada tiene claramente muchas limitaciones:

!  No puede ser aplicada cuando el número de resultados posibles del exper-imento es in…nito: ejemplo, cuando el experimento consiste en lanzar unamoneda hasta que salga águila.

!  No puede ser aplicada cuando los resultados posibles no son igualmenteprobables: ejemplo, se lanza una moneda dos veces, hay tres resultadosposibles, dos águilas, dos soles o una águila y un sol; los diferentes resulta-dos no son igualmente probables. Tenemos el mismo problema si se lanzauna moneda desbalanceada una sola vez.

3

Page 4: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 4/94

!  La de…nición es circular: igualmente probables es un concepto relacionadocon lo que se quiere de…nir. Además, ¿cómo decidir que todos los eventos

son igualmente probables?

Ante esta situación requerimos alterar o extender nuestra de…nición de modoque podamos incluir dentro del marco de la teoría a este tipo de problemas.

 Esta más ampliamente aplicable probabilidad es la llamada  probabilidada posteriori,  o frecuentista:

Probabilidad Frecuentista o a Posteriori    Cuando en la probabilidadclásica establecemos que la probabilidad de que al lanzar una moneda salgaáguila  es 1/2, llegamos a ello mediante razonamientos puramente deductivos, ypor tanto no requerimos que sea lanzada alguna moneda ni que tengamos a lamano una moneda. En la probabilidad  a posteriori  es diferente.

Consideremos de nuevo el problema de hallar la probabilidad de que salgaáguila en el lanzamiento de una moneda. El procedimiento es, se lanza unamoneda muchas veces, digamos 200 veces, y se tabulan las frecuencia relativasobtenidas. De estas frecuencias relativas se obtendrá la probabilidad buscada.Por ejemplo si las tabulaciones son

Resultado Frecuencia Frecuencia RelativaA   nA   nA=200S   nS    nS =200

Total 200 1

La probabilidad de que salga águila es entonces su frecuencia relativa corre-spondiente, es decir,  P (A) =   nA

200 :Una probabilidad de este tipo ya no tiene los problemas que presentaba la

probabilidad clásica, pero, presenta otros:

!  ¿Qué tan grande debe ser el número de repeticiones?

!  Hay situaciones que legítimamente deben ser estudiadas bajo el enfoquede probabilidad pero que no es posible analizarlos en el marco de experi-mentos repetibles, por ejemplo si se quiere responder a la pregunta ¿cuáles la probabilidad de que yo me enferme en el próximo verano?

Probabilidad Axiomática    Actualmente existe una Teoría de probabilidad losu…cientemente rica para incluir la probabilidad  a priori , la   a posteriori  y queademás permite estudiar problemas que no quedan en el marco de la repetibil-idad, se denomina   P robabilidad Axiomatica, es la que estudiaremos en este

curso y es la que se desarrolla a partir del modelo  (; A; P ). Como su nom-bre lo indica, su estudio empieza con un conjunto de axiomas, a partir de loscuales se obtendrán nuevas proposiciones que son las que precisamente nos seránútiles para el cálculo de probabilidades. Empezaremos nuestro curso identi…-cando cada uno de los elementos del objeto (; A; P ) para luego desarrollar sucontenido trabajando con la terna completa:

4

Page 5: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 5/94

1.1.2 Conceptos Básicos: El Espacio Muestral, el Espacio de Eventosy la medida de probabilidad

El Espacio Muestral   De…nición:  Se llama espacio muestral al conjunto formado por todos los

resultados posibles de un experimento.

El espacio muestral será denotado con la letra griega  .

Ejemplos:

1. Lanzar una moneda.   = fa; sg (espacio muestral …nito)

2. Lanzar una moneda hasta que salga sol.   = fs; as; aas; aaas; :::g (espaciomuestral in…nito numerable).

3. ¿Hay experimentos que generan espacios in…nitos no numerables? Sí loshay, por ejemplo, se enciende una bombilla hasta que se queme y se anotael tiempo de duración. En este caso   = [0; 1) o, tal vez alguien diga quees [0;  500). De este modo, el espacio muestral no tiene porque ser único.

4. Observar el estado del tiempo del día de mañana.Este es un espacio mues-

tral muy complicado.

5. Una computadora genera de manera aleatoria pares de enteros. El primerentero está entre 1 y 5, inclusive, y el segundo está entre 1 y 4, inclusive.Representa el espacio muestral en un sistema de ejes coordenados, dondex es el primer número y  y  es el segundo.

Moraleja:  No siempre es fácil representar un espacio muestral.

El Espacio de Eventos ADe…nición: Un evento es un subconjunto del espacio muestral  :

Ejemplo: Considera el experimento de lanzar un dado, entonces  = f1; 2; 3; 4; 5; 6g:El subconjunto  A = f2; 4; 6g es un evento. Escrito de otra forma,  A: El resul-

tado de lanzar un dado es un número par,  es un evento.A menos que se establezca lo contrario, TODOS LOS SUBCONJUNTOS de

un espacio muestral estarán incluidos como posibles eventos.El espacio de eventos A es el conjunto conformado por todos los eventos

que provienen de  : A lo largo del curso sólo manejaremos dos tipos diferentesde espacios de eventos uno es A =2 cuando   es …nito o in…nito numerable.

De…nición: Un evento elemental o simple es un evento formado por unsolo elementode .

Ejemplo:

5

Page 6: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 6/94

1. Sean   = f1;  2;  3g, entonces, A = f;  ; f1g; {2}, {3}, {1, 2}, {1,3}, f2;3

ggEl f1g , {2} y {3} son eventos elementales.

El conjunto f2;  3g es un evento que no es elemental.

2. Sea   = f1; 2; 3; 4; 5; 6; 7g: Consideremos los eventos  E  = f1; 3; 5; 7g, F   =f4; 7; 6g,   G   = f1; 4g. Escribe con notación de conjunto los siguienteseventos: (a) E  [ (F  \ G); (b)  E c \ (F  [ G):

3. En el ejemplo 5 relativo a una computadora que genera aleatoriamentepares de enteros: (a) Escribe en foma de conjunto el evento A:  x < y ; (b)Proporciona un evento simple.

De…nición:   Sea  ! 2    el resultado de un experimento. Decimos que  unevento A  ocurre, si  ! 2 A.

Por ejemplo, supongamos que el experimento consiste en lanzar un dado.Sea el evento A:   Sale un número que es múltiplo de 3 , o sea,  A  = f3; 6g:

Se efectúa el experimento y sale el 4, como 4 =2  A;entonces diremos que elevento A  no ocurrió.

Teorema:  Sean  A  y  B  eventos.

a) Un evento  A  ocurre,  Ac no ocurre.

b) El evento  A [ B ocurre , ocurre  A  o bien ocurre  B .

c) El evento  A \ B ocurre , ocurren A  y  B  al mismo tiempo.

Ejercicios:

1. Se lanzan dos dados. Sea E el evento de que la suma de los dados sea unnúmero impar y F el evento de que el primer dado caiga en 1. Describelos eventos : (a) E  [ F ; (b)  E \ F c:

2. Sean E, F y G tres eventos. Encuentra las expresiones adecuadas entérminos de E, F y G para los siguientes eventos: (a) sólo E ocurre; (b)ocurren E y G pero no F.

Notar que:  Los subconjuntos  y ; de ;son siempre eventos sin importarcómo sea . Se llaman respectivamente, evento seguro y  evento imposible,pues   siempre ocurre y    nunca ocurre.

De…nición:   Dos eventos  A  y   B   se dice que son  ajenos  o  mutuamenteexcluyentes  si  A \ B  =  . Los eventos de una colección  A1; A2; ;::: ;  se dice

que son ajenos a pares o mutuamente excluyentes dos a dos, si se cumpleque Ai \ Aj  =  , 8i 6= j .

6

Page 7: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 7/94

La Medida o Función de Probabilidad 

De…nición:   Sea    un espacio muestral y A

 el correspondiente espacio de

eventos.  Una medida de probabilidad o  función de probabilidad  es unafunción P   : A ! R que cumple las siguientes condiciones:

i)  P () = 1

ii)  P (A) 0, 8A 2 Aiii) Si  A1; A2; :::;son ajenos a pares, entonces  P 

1Si=1

Ai

=

1Xi=1

P (Ai).

i), ii) y iii) son los llamados  axiomas de probabilidad.De…nición:  Llamamos espacio de probabilidad o modelo de proba-

bilidad a la terna  (; A; P ).

Ejemplo 1: Sea   = f1;  2;  3;  4;  5g, entonces A = 2

. De…namos  P (A) =#A5   8A 2 A. Entonces  (; A; P ) es un espacio de probabilidad.

Ejemplo 2: Sean  = f1;   2;   3; :::g, entonces A   = 2. Sea   B     un

conjunto …nito con  n  elementos. De…namos la función  P (A) = #(B \ A)

n  .

Entonces  (; A; P ) es un espacio de probabilidad.

1.1.3 Teoremas Básicos que se Derivan de los Axiomas de Probabil-idad

Sea (; A; P ) un espacio de probabilidad. Entonces1)  P (;) = 0

Demostración:Tomemos A1  = ;, A2  = ;; A3  = ;;:::

) ; =1S

i=1Ai

) P (;) =  P 

1Si=1

Ai

=

1Pi=1

P (Ai); por el axioma 3

) P (;) =1P

i=1P  (;)

)1P

i=2P  (;) = 0 y  P  (;)  >  0

) P  (;) = 0

2)  Si   A1,   A2;:::; An;   son eventos ajenos a pares, entonces   P    nSi=1

Ai   =

nPi=1

P (Ai)

Demostración:

Tomemos An+1 = ;, An+2 = ;; An+3 = ;;:::

7

Page 8: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 8/94

) P   n

Si=1Ai

= P 1

Si=1Ai

Pero, por el axioma 3,  P  1S

i=1Ai

=

1Pi=1

P (Ai)

) P 

  nSi=1

Ai

=

1Pi=1

P (Ai) =nP

i=1P (Ai) +

1Pi=n+1

P  (;)

Por la propiedad 1)  P  (;) = 0

) P 

  nSi=1

Ai

=

nPi=1

P (Ai)

3)  P (Ac) = 1 P (A)

Demostración:

P () = P (A[

Ac)

= P (A) + P (Ac)

) 1 =  P (A) + P (Ac); por lo tanto, P (Ac) = 1 P (A).

4)  0 P (A) 1

Demostración:

Por de…nición,   P (A)   0, si  P (A)   >   1, entonces   P (Ac) = 1 P (A)   <  0!!!contradicción.

Por lo tanto  0 P (A) 1.

5) Si  A B ) P (A) P (B).

Demostración:

B  =  A [ (B A), pero A \ (B A) =  ) P (B) =  P (A)+P (BA), pero P (BA) 0, por lo tanto, P (B) P (A):

6)  P (A [ B) =  P (A) + P (B) P (A \ B).

Demostración:

A [ B = (A \ B) [ (A B) [ (B A)

P (A[

B) = P (A\

B) + P (A

B) + P (B

A)

= P (A \ B) + P (A B) + P (B A) + P (A \ B) P (A \ B)

= P (A) + P (B) P (A \ B):

6’)

8

Page 9: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 9/94

P (A1 [ A2 [ A3) = P (A1) + P (A2) + P (A3) P (A1 \ A2) P (A1 \ A3)

P (A2 \ A3) + P (A1 \ A2 \ A3)En general:

P (nS

i=1Ai) =

nXi=1

P (Ai) Xi<j

P (Ai \ Aj ) +X

i<j<k

P (Ai \ Aj \ Ak)

+ (1)n+1P (A1 \ A2 \ \ An)

Ejemplos:

1.  Un estudiante seleccionado de una clase puede ser chico o chica. Si la prob-abilidad de que un chico sea seleccionado es 0.3, ¿cuál es la probabilidadde que sea seleccionada una chica?

Solución:

P (chica) = 1 P (chico)

= 1 0:3

= 0:7

2.  Se selecciona un punto  (x; y) del cuadrado  S  que contiene todos los puntos(x; y) tales que 0 x 1 y  0 y  1. Supóngase que la probabilidad deque el punto seleccionado pertenezca a cualquier subconjunto especí…code S  es igual al área de ese subconjunto. Determínese la probabilidad delsubconjunto de puntos tales que  (x   1

2)2 + (y   1

2)2   1

4 .

Solución:

P ((x; y) 2 A) =Área A, A S . Nos piden

B = f(x; y) j (x   12)2 + (y   1

2)2   14g

P (B) = 1 P ((x; y) j (x   12)2 + (y   1

2)2   14)

= 1 ( 14)

= 1   4

= 4

4

3.   Considérense dos eventos   A   y   B   tales que   P (A) = 1=3   y   P (B) = 1=2:Determínese el valor de  P (B \ Ac) si  A B:

Solución: De la fórmula para la unión tenemos que  P (B \ Ac) =  P (B) +P (Ac) P (B

SAc) = 1=2 + 2=3 P () = 1=2 + 2=3 1 = 1=6

9

Page 10: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 10/94

1.1.4 Espacios de Probabilidad Discretos y Continuos

La función indicadora De…nición:   Sea   A     un conjunto arbitrario.Denotaremos por  I A  a la función de    en  R de…nida por

I A(!) =

(  1; si ! 2 A

0; si ! =2 A

esta función recibe el nombre de   función indicadora del conjunto A.Ejemplos

1.   f (x) =  x2 I (2;  3)(x) =

(  x2; si x 2 (2;   3)

0; si x =2 (2;   3)

2.  f (x) =   1

x I (0; 1)

(x)=8<:

1

x; si x > 0

0; si x 0

Espacios …nitosTeorema de caracterización de probabilidad en un espacio …nito:  Sea

= f!1; !2; :::; !ng  un espacio muestral con un número …nito de elementos.Sea  p1; p2; :::; pn  números reales tales que  pi   0; i  = 1;  2; :::; n  y tales que

nPi=1

 pi = 1: Entonces

a)  La función  P   : 2 ! R de…nida por  P (A) =nP

i=1I A(!i) pi  es una medida

de probabilidad sobre 2:

b)  P (f

!i

g) =  pi,  i  = 1;  2; :::; n

Ejemplos:

1. Consideremos    como el conjunto de resultados posibles del lanzamientode un dado, esto es,   = f1; 2; 3; 4; 5; 6g:  Sea   P (fig) =   pi   = 1=6; 8i   =1; 2; 3; 4; 5; 6: Entonces, las  pi   cumplen las propiedades del teorema. Cal-cula ahora la probabilidad de que salga un número que esté en el intervalo[2, 5].

Sol.:   P (f2; 3; 4; 5g) =  P (f2g) + P (f3g) + P (f4g) + P (f5g) = 4=6

2. Las  pi  no tienen porque ser iguales, por ejemplo un espacio muestral quefrecuentemente aparece en la práctica es uno de la forma   = f0;   1;  2;

:::; ng; por ejemplo,    podría ser el número de artículos defectuosos enun lote de  n. Si de…nimos P (fig) =  pi   =

n

i

 pi(1  p)ni, donde  p  es

la probabilidad de que un artículo sea defectuoso, estas   pi   cumplen lascondiciones del teorema. Veremos más adelante que a P  se le denominadistribucion binomial:

10

Page 11: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 11/94

Espacios NumerablesTeorema de caracterización de probabilidad en un espacio numer-

able:Sea  = f!1; !2; :::; !ng un espacio muestral numerable, sean  p1; p2; p3;

:::;  una sucesión de números tales que  pi  0,  i  = 1; 2;::: y tales que1P

i=1 pi  = 1.

Entonces

a)  La función  P   : 2 ! R de…nida por  P (A) =1P

i=1I A(!i) pi  es una medida

de probabilidad sobre 2.

b)  P (f!ig) =  pi,  i  = 1;  2;  3; :::;

c) Si Q  es una medida de probabilidad tal que  Q(f!ig) =  P (f!ig), entoncesQ(A) =  P (A), 8A 2 2.

Ejemplos:

1.   Distribución Geométrica:  Supóngase que en un cierto proceso sólo seobservan dos resultados posibles,  1=éxito  o 0=fracaso . Supongamos queel experimento consiste en realizar una y otra vez el proceso hasta queocurra el primer éxito y se anota el número de realizaciones. Entonces = f1; 2; :::;g, si se sabe que probabilidad de éxito=p se puede determinarque   P (!i) =   pi   =   p(1  p)i1,   i   = 1;   2;:::  Notar:   Que el espacio noes uniforme, ya que   pi  6=   pj ,   i 6=   j. Hallar la probabilidad de que elexperimento concluya realizando el proceso a lo más tres veces.

2.  Distribución Poisson:   Se usa cuando se estudia la incertidumbre deeventos “raros” (por ejemplo, no. de accidentes de tránsito en una ciertaesquina), también juega un papel importante en la teoría de colas   = f0;

1;  2; :::; g,  pi  =  ei

i!  , i  = 0;  1;  2; :::;

Ambas distribuciones se verán con mucho detalle en el tema de variablesaleatorias.

Espacios ContinuosSe re…ere al caso en el que el espacio muestral    es un conjunto in…nito no

numerable y lo estudiaremos con detalle en la unidad de variables aleatorias.

1.1.5 Espacios Equiprobables

Sea  = f!1; !2; :::; !ng un espacio muestral …nito y sean  P (!1) =  p1; P (!2) =

 p2;   ...,   P (!n) =   pn:  Cuando se tiene que todas las   pi   son iguales, estaremoshablando de un espacio uniforme.De…nición:  Decimos que un modelo de probabilidad con espacio muestral

…nito   = f!1; !2; :::; !ng   es  equiprobable  o  uniforme, si la medida deprobabilidad P  cumple que  P (f!1g) =  P (f!2g) = = P (f!ng).

11

Page 12: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 12/94

Teorema:  En un modelo de probabilidad uniforme,  P (f!ig) =  1

n,   i  = 1;

2; :::; n   y   P (A) =  #A# ,  A 2 2.

Ejemplos

1)   Supóngase que una moneda equilibrada va a ser lanzada diez veces y se deseadeterminar (a) la probabilidad de obtener exactamente tres caras y (b) laprobabilidad de obtener a la más tres caras.

Solución: (a) Sea el evento  A: se obtienen exactamente tres caras en los

10 lanzamientos, entonces  P (A) = (103 )210

  = 0:1172

(b) Sea el evento B: salen a lo más 3 caras en los 10 lanzamientos, entonces

P (B) = (100 )+(101 )+(102 )+(103 )

210  =   176

210  = 0:1719

2)  Supóngase que en una clase hay 15 muchachos y 30 muchachas, y que se vana seleccionar al azar 10 estudiantes para una tarea especial. Calcular laprobabilidad de seleccionar exactamente 3 muchachos.

Solución: Sea el evento  A: Entre los 10 seleccionados hay exactamente 3

muchachos. Entonces, P (A) = (153 )(307 )

(4510)  = 0:2904

3)  Consideremos el experiment o de lanzar dos dados. Calcule la probabilidadde que la suma de los números que aparecen sea 7.

Solución:

=

f(x; y)

j1

x

6; x; y

 2N}

Es sensato suponer que es tan probable que salga una cierta pareja  (x; y)como cualquier

otra, así que trabajaremos con un modelo de probabilidad uniforme. En-tonces si de…nimos

A7  :La suma de los números que aparecen es 7, tenemos

P (A7) = #A7

#  ; pero  # = 36, por tanto

P (A7) =   636

=   16

4)  La Paradoja de De Meré (siglo XVII): Se cuenta que el problema se planteóen una mesa de juego y que en 1654 De Meré se lo propuso a Pascal. Sesupone que este incidente estimuló mucho el desarrollo de la probabilidad.

¿Cuál de los dos eventos es más probable?

12

Page 13: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 13/94

(a) En cuatro tiradas de un dado sacar al menos un as, o

(b) En 24 tiradas de dos dados sacar al menos un (1,1), i. e., un doble as.Nota: Los jugadores de juegos de azar creían que las probabilidades eraniguales. Llegaban a ello con el siguiente razonamiento: Si lanzo un dadouna vez, la probabilidad de que salga un as es 1/6, entonces si lo lanzo 4veces la probabilidad de tener al menos un as es 41

6  =   2

3;análogamente,

si lanzo dos dados una vez, la probabilidad de que salga un doble as es1/36, entonces si lo lanzo 24 veces la probabilidad de tener al menos undoble as es 24   1

36  =   23

Solución: (a)  # = 64; 54 elementos de  no muestran el 1. Entonces laprobabilidad es 1-5

4

64   =   6711296  = 0:5177

(b) La probabilidad es  1   3524

3624  = 0:491

4)   Se tira un dado. ¿Cuántas tiradas se necesitan para que la oportunidadde sacar al menos un 6 sea mejor que la de sacar un número par en unatirada?

Solución: Sea el evento  A: Se saca al menos un 6 en  r  tiradas. Tenemosentonces,

P (A) = 1 P (Ac) = 1 56

r> 1=2 ) r 4:

5)  ¿Cuál es la probabilidad de que entre  k  dígitos aleatorios por lo menos noaparezca uno de los dígitos 0 y 1?.

Solución:   2  910

k  810

k

6)  Quince nuevos estudiantes son igualmente distribuidos en 3 salones de clase.

Suponga que entre los 15 hay 3 estudiantes que son muy malos. ¿Cuál esla probabilidad de que cada salón de clase tenga uno?.

Solución:   3!  12!4!4!4!15!

5!5!5!

=  3!(124 )(84)(44)

(155 )(105 )(55)

7)  Un autobús recoge a 15 pasajeros y a lo largo de su ruta hará 4 paradas.¿Cuál es la probabilidad de que todos los pasajeros se bajen en la mismaparada?

Solución:   4

(nr1r1   )

 =   4

(183 )

9)  Supongamos que una urna contiene M  bolas numeradas de 1 a M , donde lasprimeras K  bolas son defectuosas y las restantes M K  son no defectuosas.El experimento consiste en extraer n bolas de la urna. De…namos  Ak comoel evento de que la muestra de n bolas contiene exactamente k defectuosas.Hay dos maneras de extraer la muestra:

(i) con reemplazo y

(ii) sin reemplazo.

13

Page 14: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 14/94

Hallar  P (Ak) para cada método de muestreo.

Bajo   (i),   ¿cuál es la probabilidad de que las   n

bolas extraídas tengannúmeros distintos?

Solución:

i) Con reemplazo 

El espacio de probabilidad va a ser considerado uniforme.

= f(x1; x2; :::; xn) j xi  = 1;  2; :::; M g# =  M n (ya que la prueba es con reemplazo)

#Ak  = n

kK k(M   K )nk, por tanto

P (Ak) =

n

k

K k(M   K )nk

M n

Tarea:  Si cambio el espacio muestral por   = f(x1; x2; :::; xn) j xi  = 1;2; ;:::; ng ¿será

que obtengamos el mismo resultado?

ii)   = f(x1; x2; ; :::; xn) j 1 xi  M , xi 6= xj , i 6= jg# =PM;n

#Ak  =n

k

PK;kPM K;nk, entonces

P (Ak) =

n

k

PK;kPM K;nk

PM;n

=

n!

k!(n k)!    k!

(K  k)!    (M   K )!

[(M   K ) (n_k)]!M !

(M   n)!n!

=

1

k!(n k)!    k!

(K  k)!    (M   K )!

[(M   K ) (n k)]!

n!

  M !

(M   n)!

=

k

M   K 

n k

n

14

Page 15: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 15/94

Bajo (i) ¿cuál es la probabilidad de que las n bolas extraídas tengan númerosdistintos?

= f(x1; x2; ;:::; xn) j 1 xi  M , xi 2 Ng# =  M n

B  :  Las  n  bolas extraídas son diferentes

P (B) = #B

#

= P M;n

M n

10)  Determinar la probabilidad de que al menos dos personas en un grupo dek   (2

  k

  365) tengan el mismo cumpleaños, esto es, que hayan nacido

el mismo día del mismo mes, pero no necesariamente del mismo año.

Solución:

Suponga que   = f(x1; x2; :::; xk) j xi 2 f1;  2; :::;  365gg

# = (365)k

#Bc =P365;k

P (B) = P (al menos 2)

= 1

P (Bc)

= 1  P365;k

(365)k

Notar:  Este problema es el mismo que el de las bolas de las cuales seextraen n  distintas.

11)  Considere un experimento que tiene   N   resultados posibles:   f!1; !2; :::;!ng. Se sabe que el resultado   !j+1   es dos veces más probable que elresultado   !j   donde   j   = 1;   2; :::; N   1, esto es,   pj+1   = 2 pj   en donde

 pi =  P (f!ig). Hallar la probabilidad de Ak, donde Ak  = f!1; !2; :::; !kg.

Solución:

El espacio de probabilidad es uniforme

15

Page 16: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 16/94

 p2   = 2 p1

 p3   = 2 p2  = 2(2 p1) = 2

2

 p1 p4   = 2 p3  = 2(22 p1) = 23 p1

... pj   = 2j1 p1

por tanto

P (Ak) =kP

i=1 pi

=kP

i=12i1 p1

= p1kP

i=12i1

= p11 2k

1 2

= p1(2k 1) (*)

ahora veamos a qué es igual  p1:

Sabemos queN P

i=1 pi = 1, pero pi = 2i1 p1 por (*), entonces

N Pi=1

2i1 p1  = 1,

por tanto

 p1   =  1N P

i=12i1

=  112N 

12

=  1

2N  1recordar que 1 + x + x2 + + xn =

 1 xn+1

1 x

;   por tanto   P (Ak) =

2k 1

2N  1:

1.2 El Teorema de Bayes

1.2.1 Eventos Condicionados

Sea   (, A,   P )   un espacio de probabilidad, y   B  un evento con probabilidadpositiva. Supongamos que sabemos que  B  ha ocurrido.

16

Page 17: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 17/94

Por ejemplo, supongamos que una urna contiene n  bolas de las cuales m sonrojas y  n

m son blancas y que el experimento consiste en extraer al azar de

la urna 2 bolas, una después de la otra.Pues bien, se extrajo la primera bola y se encontró que es roja. De este

modo, el evento   B:   la primera bola extraída es roja , es un evento que ya haocurrido.

Ante esta situación nuestra asignación original de probabilidades a través deP  ya no es apropiada. Sin duda alguna esto es así, porque ahora que sabemosque B  ha ocurrido, ¡es imposible que ocurra  B c! aunque originalmente pudimoshaberle asignado una probabilidad positiva. La cuestión ahora es, ¿cómo debennuestras probabilidades cambiar a la luz de la nueva información?

Por ejemplo, pensando de nuevo en la urna con las bolas rojas y blancas,¿cuál sería la probabilidad de que la segunda bola extraída sea roja, dado quela primera es roja?.

Veamos, queremos P (A dado que ya ocurrió B) donde A: la 2a. bola extraídaes roja. Denotemos esta probabilidad por  P (AjB):

Como   B   ha ocurrido, entonces se sabe que el resultado del experimentoes uno de los incluidos en  B. Por tanto, para evaluar la probabilidad de queA  ocurra, se debe considerar el conjunto de los resultados incluidos en  B  quetambién implican la ocurrencia de  A. Considerando probabilidad uniforme enB  tendremos entonces

P (A j B) = #(A \ B)

#B

= #(A \ B)=n(n 1)

#B=n(n 1)  =

 P (A \ B)

P (B)

Def.: Si  A  y  B  son eventos con  P (B)>0, la probabilidad condicional de  A

dado B , denotada por  P (AjB), se de…ne por  P (AjB) =  P (A

\B)

P (B)   :Ejercicios

1. Supóngase que se han lanzado 2 dados distinguibles y que se ha obser-vado que la suma   T   de los dos números ha sido impar. Determine laprobabilidad de que T  haya sido menor que 8.

Solución:

P (B) = 18

36 =

 1

2; P (A \ B) =

 12

36 =

 1

3

P (T < 8 j T   impar) = P (A \ B)

P (B)

= 1=3

1=2

= 2

3

17

Page 18: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 18/94

Page 19: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 19/94

Demostración:

P (A j B) + P (Ac j B) =  P (A \ B)P (B)

  +  P (Ac \ B)P (B)

= P ((A \ B) [ (Ac \ B))

P (B)

= P (B)

P (B)

= 1

6) Sean  A1; A2; A3; :::; eventos mutuamente excluyentes, entonces

P (1

Si=1Ai j B) =

1

Pi=1P (Ai j B)

Demostración:

P (1S

i=1Ai j B) =

1Si=1

Ai

\ B)

P (B)

=

1Si=1

(Ai \ B)

P (B)

=

1Pi=1

P (Ai \ B)

P (B)

=1P

i=1

P (Ai \ B)

P (B)

=1P

i=1P (Ai j B)

7) Si  A1; A2 2 A, entonces:

1.   P (A1 j B) =  P (A1 \ A2 j B) + P (A1 \ Ac2 j B)

2.   P (A1 [ A2 j B) =  P (A1 j B) + P (A2 j B) P (A1 \ A2 j B)

3. Si A1  A2,  P (A1 j B) P (A2 j B)

8) Si  A1; A2;:::;An 2 A, entoncesP (A1 [ A2 [ [ An j B)

nPi=1

P (Ai j B)

19

Page 20: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 20/94

1.2.2 Regla de la Multiplicación

Para una colección …nita de eventos   A1; A2; :::; An   tal que   P  mT

i=1Ai

  >   0;

8m < n, 8m 2 N, se tiene que:

  nTi=1

Ai

  = P (A1)P (A2 j A1)P (A3 j A1 \ A2)P (A4 j A1 \ A2 \ A3)

P (An j A1 \ A2 \ \ An1)Notar que es una generalización de la propiedad no. 1 de la probabilidad

condicional.

Demostración:

Partiendo del lado derecho de la igualdad:

P (A1) P (A2 \ A1)P (A1)

P (A1 \ A2 \ A3)P (A2 \ A1)

    P (A1 \ A2 \ \ An)P (A1 \ A2 \ \ An1)

  = P (A1 \ A2 \ \ An)

= P 

  nTi=1

Ai

Ejercicios

1. Supóngase que se van a extraer dos bolas aleatoriamente y sin reemplazode una urna que contiene  r  bolas rojas y  b azules. Determinar la proba-bilidad de que la primera bola sea roja y la segunda azul.

Solución:

De…namos los siguientes eventos:

Ri  :  La  i ésima bola extraída es roja.Ai  :  La  i ésima bola extraída es azul.

  i = 1; 2

P (R1 \ A2) = P (A2 j R1)P (R1)

=  b

r + b 1    r

r + b

2. Supóngase que se extraen cuatro bolas de una en una, sin reemplazo deuna caja que contiene  r  bolas rojas y  b  azules (r 2, b 2). Determinarla probabilidad de obtener la sucesión de resultados rojo, azul, rojo, azul.

Solución:

Queremos R, A, R, A.

De…namos los siguientes eventos:

20

Page 21: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 21/94

Ri  :  La  i ésima bola extraída es roja.Ai  :  La  i

ésima bola extraída es azul.   i = 1;  2;  3;  4

Queremos calcular  P (R1\R2\R3\A4 ) :

P (R1 \ R2 \ R3 \ A4 ) = P (R1 )P (A2 j R1 )P (R3 j R1 \ A2 )P (R4 j R1 \ A2 \ A3 )

=  r

r + b    b

r + b 1    r 1

r + b 2    b 1

r + b 3

1.2.3 Eventos Independientes

Dos eventos A y B ocurren independientemente uno del otro si la ocurrencia o noocurrencia de cualquiera de ellos, no tiene relación ni in‡uye sobre la ocurrenciao no del otro.

De…nición:  Decimos que dos eventos  A  y  B  son independientes si  P (A \B) =  P (A)P (B):

Notar:  que la de…nición no requiere que  P (A) o  P (B) >  0. De este modo es independiente de cualquier otro evento.

EjercicioSupóngase que dos máquinas 1 y 2 de una fábrica funcionan independien-

temente una de la otra. Sea  A el evento de que la máquina 2 se descompongadurante el mismo período y supóngase que  P (A) = 1=3 y  P (B) = 1=4. Deter-minar la probabilidad de que al menos una de las máquinas se descompongadurante ese período.

Solución:

Queremos hallar  P (A [ B):

P (A [ B) = P (A) + P (B) P (A \ B)

= P (A) + P (B) P (A)P (B)

= 1

3 +

 1

4    1

12

= 1

2

Teorema:  Si A  y  B  son eventos independientes, entonces

1.   A y  B c son independientes.

Demostración:

A = (A \ B) [ (A \ Bc), como (A \ B) \ (A \ Bc) =  

21

Page 22: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 22/94

) P (A) =  P  [(A \ B) [ (A \ Bc)] =  P (A \ B) + P (A \ Bc)

entoncesP (A \ Bc) = P (A) P (A \ B)

= P (A) P (A)P (B)

= P (A)[1 P (A)P (B)]

= P (A)P (Bc)

por tanto  A  y  B c son independientes.

2.   Ac y  B c son independientes.

Demostración:  Se deduce inmediatamente del anterior.

De…nición:  Decimos que los eventos en una colección in…nita numerable

de eventos  A1; A2; A3; :::;  son independientes si se cumple que   P (mT

i=1Aji) =

mQi=1

P (Aji) 8m 2 N, y cualquier colección de  m  índices distintos  j1; j2; :::; jm.

Teorema:   Si  A1; A2; :::; An  (colección …nita) son eventos independientes,entonces también lo son los eventos  B1; B2; :::; Bn donde Bj  es ya sea Ai o biénAc

i .

Ejercicios:

1. Sea un entero seleccionado del conjunto  S  = f1;  2;  3;  4g  de manera quecualquier otro entero es igualmente verosímil que sea escogido. Además,sea Ai = fi; 4g el evento de que  i  o  4  es seleccionado, i  = 1; 2; 3. Muestreque A1; A2; A3 son independientes por parejas, pero que no es una colec-ción de eventos independientes.

Solución:

Hay que mostrar que

P (A1 \ A2) =  P (A1)P (A2)

P (A2 \ A3) =  P (A2)P (A3)

P (A1 \ A3) =  P (A1)P (A3)

pero  P (A1 \ A2 \ A3) 6= P (A1)P (A2)P (A3).

Tenemos que

22

Page 23: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 23/94

P (Ai) = P (fi;   4g)

= P (fig) + P (f4g)= 1=4 + 1=4= 1=2

P (Ai \ Aj ) =  P (f4g) = 1=4

) P (Ai \ Aj ) = 1=2 1=2 =  P (Ai)P (Aj )

P (A1 \ A2 \ A3) =  P (f4g) = 1=4 6= 1=8 =  P (A1)P (A2)P (A3):

Concluímos que los eventos tomados por pares sí son independientes, peroque no es una colección de eventos independientes.

2. Sea s un punto seleccionado del intervalo unitario S  = [0; 1] de tal maneraque la probabilidad de que el punto pertenezca a un subintervalo  I   S  esla longitud de I . Escribamos a s en su expansión decimal como s = s1s2:::donde las  sk   son enteros entre 0 y 9 inclusive. Por ejemplo, si  s  = 1=8,entonces  s1   = 1,   s2   = 2,   s3   = 5  y   sk   = 0  para  k   4:  Sea  A  el eventode que   s1   = 0, y sea   B   el evento de que   s2   = 0, ¿son   A  y   B   eventosindependientes?

Solución:

s 2 S  = [0;  1]  y  s  es de la forma  s  = s1s2::: donde  sk 2 f0;  1; :::;  9g

si A  = [0;  0:1)

)P (A) = 0:1

B = [0;  0:1) [ [0:1;  0:11) [ [0:2;  0:21) [ [ [0:9;  0:91)

) P (B) = (10)(0:01) = 0:1

P (A \ B) = P (s 2 [0;   0:01))

= 0:01

= (0:1)(0:1)

= P (A)P (B)

por tanto  A  y  B  sí son independientes.

3. Un sistema conformado por  n  componentes separadas se dice que es unsistema en paralelo si funciona cuando funciona al menos una de las com-ponentes (ver …gura de abajo). Para el sistema, si la componente   i, in-dependientemente de las otras componentes funciona con probabilidad  pi,i = 1;  2; :::; n; ¿cuál es la probabilidad de que el sistema funcione?

23

Page 24: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 24/94

Solución:

De…namos E i  :  La  iésima componente funciona.   i = 1;  2; :::; n.)   P 

  nSi=1

E i

  = 1 P 

  nTi=1

E ci

= 1 nQ

i=1P (E ci )

= 1 nQ

i=1(1  pi)

1.2.4 Teorema de Probabilidad Total

Sea   A1; A2; :::; An   una partición de     y   B  un evento arbitrario, entoncesP (B) =  P (B j A1)P (A1) + P (B j A2)P (A2) + + P (B j An)P (An):

Demostración:P (B) = P [(B \ A1) [ (B \ A2) [ [ (B \ An)]

= P (B \ A1) + P (B \ A2) + + P (B \ An)]

= P (B j A1)P (A1) + P (B j A2)P (A2) + + P (B j An)P (An)

Corolario:  Si  P (Ac), P (A) >  0, entoncesP (B) =  P (B j A)P (A) + P (B j Ac)P (Ac).

Ejercicios:

1. njijiuhuhiuhiuhiuhiuoi2. Supóngase que en un juego, una persona puede obtener como puntuación

uno de los 50 números 1, 2, ..., 50 y que todos estos números son pun-tuaciones igualmente probables. La primera vez que juega, su puntuaciónes X , entonces continúa jugando hasta que obtiene otra puntuación  Y   talque  Y    X . Se puede suponer que todos los juegos son independientes.Determinar la probabilidad de que  Y   = 50.

Solución:

Nos piden calcular

P (Y   = 50) = P (Y   = 50 j X  = 1)P (X  = 1) + + P (Y   = 50 j X  = 50)P (X  = 50)

=50P

i=1P (Y   = 50 j X  = i)P (X  =  i)

El espacio muestral   = f(x; y) j y  xg

24

Page 25: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 25/94

Page 26: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 26/94

Solución:

De…namos los siguientes eventos:

A :  La prueba dió positivo

B :  La persona padece la enfermedad

P (A j B) = 0:9   P (B) =  1

10; 000  P (A j Bc) = 0:1

por el teorema de Bayes:

P (B j A) = P (B \ A)

P (A)

=  P (B

 jA)P (B)

P (B j A)P (B) + P (A j Bc)P (Bc)

=  (0:9)(1=10; 000)

0:9(1=10; 000) + 0:1(1 1=10; 000)

= 0:0003996

2. Un cierto estado agrupa a sus conductores con licencia de acuerdo a laedad dentro de las siguientes características:

Grupo 1: De 16 a 25 años

Grupo 2: De 26 a 45 años

Grupo 3: De 46 a 65 años y

Grupo 4: Arriba de 65 años.

La siguiente tabla enlista para cada grupo, la proporción de conductoresen el grupo que tuvieron accidentes

Grupo Tamaño Proporción de accidentes1 0:151 0:0982 0:356 0:0443 0:338 0:0564 0:155 0:086

(a) ¿Qué proporción de conductores con licencia tuvieron accidentes?

(b) ¿Qué proporción de conductores con licencia que tuvieron accidentes

estaban por arriba de 65 años?

Solución:  Tarea

26

Page 27: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 27/94

3. En una etapa de investigación criminal el inspector a cargo está 60% con-vencido de la culpabilidad de un cierto sospechoso. Supongamos ahora

que una nueva evidencia muestra que el criminal tiene ciertas caractarís-ticas (tales como que es zurdo, calvo y güero). Si el 20% de la poblaciónposee estas características, ¿que tan seguro estará ahora el inspector de laculpabilidad del sospechoso si resulta que éste tiene las características?.

Solución:

De…namos los siguientes eventos:

A :  El sospechoso es culpable

B :  El sospechoso tiene las características que señala la nueva evidencia.

Entonces:

P (A j B)  P (B j A)P (A)

P (B

 jA)P (A) + P (B

 jAc)P (Ac)

=  (1)(0:6)

(1)(0:6) + (0:2)(0:4)

= 0:88

4. Un médico se encuentra ante el siguiente dilema: “Si yo estuviese 80% se-guro de que mi paciente tiene la enfermedad, entonces le recomendaría unacirugía, mientras que si yo no tuviese la certeza, entonces le recomendaríapruebas adicionales que son costosas y algunas veces dolorosas. Ahora,inicialmente yo estaba únicamente 60% seguro de que el Sr. Pérez tienela enfermedad, así que ordené la serie de pruebas A, la cual siempre dapositivo cuando el paciente tiene la enfermedad y casi nunca cuando estásaludable. El resultado fue positivo y estaba a punto de recomendar la

cirugía cuando el Sr. Pérez me informó, por primera vez, que es diabético.Esta información complica la situación, porque aunque no cambia ni es-timado original de 60% de oportunidad de tener la enfermedad, si afectala interpretación de los resultados de la prueba A. Esto es así, porquemientras la prueba A casi nunca da positivo cuando el paciente está sano,desafortunadamente, en cambio, da positivo en el 30% de los casos de pa-cientes diabéticos que no sufren la enfermedad. ¿Qué habo? ¿Más pruebaso cirugía inmediata?”.

Solución:

De…namos los siguientes eventos:

C  :  El paciente tiene la enfermedad.

B :  La prueba A fue positiva.Entonces

27

Page 28: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 28/94

P (C  j B) =  P (B j C )P (C )

P (B

 jC )P (C ) + P (B

 jC c)P (C c)

=  (1)(0:6)

(1)(0:6) + (0:3)(0:4)

=  0:6

0:6 + 0:7

= 0:83

28

Page 29: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 29/94

2 Variables aleatorias

En muchos problemas, no estamos interesados en todos los aspectos del resultadode un experimento, sino únicamente en una característica numérica particulardel resultado, tal como el número de bolas rojas en una muestra, el número deáguilas al lanzar diez veces una moneda, el número de artículos defectuosos enuna línea de producción, la altura de un hombre seleccionado aleatoriamente,etcétera; en muchos otros aunque la característica de interés no sea numérica, elproblema puede ser analizado asignándole un número a los elementos del espaciomuestral, por ejemplo, defectuoso=0, no defectuoso=1. En tales situacionespodemos usar un modelo de probabilidad en donde es más cómodo trabajar envista de que los eventos son subconjuntos de los números reales. En esta Unidadestudiaremos este espacio de probabilidad.

De…nición:  Sea el espacio de probabilidad (; A; P ). Una variable aleatoria (v.a.)   X  es una función X  :

!R.

Ejemplo1.Considera el experimento de lanzar una moneda dos veces. Entonces   =

faa; sa; as; ssg:Sea X  la función de…nida por “número de águilas que aparecen”,

entonces  X (aa) = 2,  X (as) =  X (sa) = 1,  X (ss) = 0.

2. Considera el experimento de lanzar una moneda hasta que sale águila.Entonces   = fa; sa; ssa; sssa; :::g:Sea  X  la función de…nida por “número de

lanzamientos hasta que sale águila”, entonces,  X (a) = 1,  X (sa)2; X (ssa) = 3,X (sssa) = 4; ::.

3. Sea  (, A,  P ) un espacio de probabilidad y sea  A  un evento cualquiera.La función indicadora  I A es una v.a.

4. Sea  X   :  !

  R  de…nida por   X (!) =   c, 8

! 2

    . A   X   se le llamaVariable aleatoria constante o degenerada.

Si tenemos un espacio de probabilidad  (; A; P )  y de…nimos una variablealeatoria X , se genera un nuevo espacio de probabilidad (R; B; P X ); donde ahorael espacio muestral es el conjunto de números reales  R; el espacio de eventos Bes un conjunto denominado Conjunto de Borel o  Conjunto de Borelianosque se construye aplicándole operaciones de conjuntos (uniones, intersecciones ycomplementos) a los intervalos de la forma (-1,x]; y para cualquier subconjunto

B 2 B; P X (B) =  P (f! 2  j X (!) 2 Bg) Notacion

=   P (X  2 B):

Así, por ejemplo,

P X ((a; b)) = P (f

! 2

j

X (!)2

(a; b)g

)

= P (X  2 (a; b))

= P (a < X < b)

29

Page 30: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 30/94

P X (fag) = P (f! 2 j X (!) 2 fag)

= P (X  2 fag)= P (X  =  a)

P X ((1; a]) = P (f! 2 j X (!) ag)= P (X   a)

Ejemplo:  En el experimento de lanzar una moneda dos veces,   = faa; sa;as; ssg y la variable aleatoria  X =no. de águilas que aparecen, ¿a qué es igualP (X  = 1); P (2 < X < 3); P (X   2); P (X > 1); P (2 X < 10)?

Solución:P (X  = 1) =  P (f! 2 j X (!) 2 f1gg) = P (f! 2 j X (!) = 1g) = P (fsa;

asg) = 1=2P (2 < X < 3) = P (

f! 2

j

2 < X (!) <  3g

) =  P (?) = 0

P (X   2) =  P (f! 2 j X (!) 2g) =  P ( ) = 1P (X > 1) = P (f! 2 j X (!) >  1g) =  P (faa;sa;asg) = 3=4P (2 X < 10) = P (f! 2 j 2 X (!) <  10g) =  P (faag) = 1=4

De…nición:   Si   X   es una  v.a ., la  distribución de   X   es la función   P X   :B ! R.

Ejemplos:

1.-  En el de lanzar una moneda dos veces,   = faa; sa; as; ssg  y   X   lafunción de…nida por “número de águilas que aparecen ” es decir,   X (aa) = 2,X (as) =  X (sa) = 1, X (ss) = 0, ¿cuál es la distribución de  X ?

Solución:

Debemos hallar P X (B), 8 B 2 B. Ahora bien,

P X (f0g) =  P (X  = 0) = 1=4

P X (f1g) =  P (X  = 1) = 2=4 = 1=2

P X (f2g) =  P (X  = 2) = 1=4;

Nota ahora que una vez dada  P X  para los eventos “elementales” podemosdar P X  para cualquier evento  B 2 A como sigue:

P X (B) =  P (X  2 B) =  14I B(0) +

  12I B(1) +

  14I B(2)

2.- Sea  = fe; f g, es decir,  es el conjunto de resultados de un experimentoque solo tiene dos resultados posibles, llamados “éxito” y “ fracaso”. Sea

X (!) =

(  1; si ! =  e

0; si ! =  f 

30

Page 31: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 31/94

X  es la v.a . denominada “variable aleatoria Bernoulli”  y que estudiare-mos ampliamente en este curso.

Si se denota por  p a la probabilidad  P (X  = 1), esto es,  p es la probabilidadde “éxito ”, entonces P (X  = 0) = 1 p y la distribución de  X  se puede calcularcomo sigue

P X (B) =  pI B(1) + (1 p)I B(0):Esta distribución recibe el nombre de “Distribución Bernoulli” con parámetro

p. En lo sucesivo la denotaremos por  Bernoulli (p).

Comentarios sobre variables aleatorias:Tenemos entonces que un espacio de probabilidad (,  A; P ) y una variable

aleatoria X , juntos, dan lugar a un segundo espacio de probabilidad (R, B, P X ).Muchas veces el trabajar con el espacio (R, B,  P X ), no sólo es adecuado por elaspecto de los resultados del experimento en el que estamos interesados, sinoque muchas veces es a través de una v.a. como tenemos un camino posible paramedir la incertidumbre en espacios muestrales altamente complejos. Un ejemplode un espacio así, es el espacio    que describe las distintas formas en que puedesuceder el estado del tiempo, digamos, del día de mañana, de…nir una medidade probabilidad para los eventos de un espacio así es prácticamente imposible.Pero si pensamos no en los detalles del estado del tiempo sino solo en si va allover o no entonces el problema expresado mediante variables aleatorias resultaahora abordable.

2.1 Variables Aleatorias Discretas

De…nición:  Una variable aleatoria  X  se dice que es  discreta  si su rango es…nito o bien in…nito numerable.

Notar: si   X  una variable aleatoria tal que su rango es   RX   = f

x1; x2;x3;:::; g  y de…nimos  p  :  RX !  R  por  p(xi) =  P X (fxig) = P (X  =  xi), entonces secumple lo siguiente para  p:

a)  p(xi) 0, 8i = 1;  2;  3; :::

b)1P

i=1 p(xi) = 1 (Cuando  RX  es …nito, el simbolo

1Pi=1

se sustituye por una

suma …nita).

Por cumplir estas dos propiedades matemáticas a   p   se le llama   funciónde densidad discreta o función masa de probabilidad de la variablealeatoria X.

El caso es que si conocemos la función masa de probabilidad p de una variable

aleatoria discreta  X , o sea, si conocemos  p(x1) =  P (X  =  x1); p(x2) = P (X  =x2); p(x3) =  P (X  =  x3); :::; entonces 8B 2 BP X (B) =

1Pi=1

I B(xi) p(xi) =  P

x2B\RX

 p(x), 8B 2 B.

Esto es, si especi…camos  p  hemos especi…cado  P X (B), para cualquier  B 2B. De este modo, el papel que está jugando la función de densidad discreta

31

Page 32: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 32/94

es   proporcionarnos un instrumento para calcular la distribución deprobabilidades  P X  de la variable aleatoria  X .

Observación!!!  Si X  es una v.a . discreta,

i)  P X (RX ) =1P

i=1 p(xi) = 1

ii)  0  p(xi) 1.

Ejemplo:  La función masa de probabilidad de una  v.a .   X  está dada por

 p(i) =  ci

i!  , i  = 0;  1;  2; :::; donde   es algún valor positivo.

a)  Hallar c.

b)  Hallar  P (X  = 0)

c)  Hallar  P (X > 2)

Solución:

(a) Como1X

i=0

 p(i) = 1 )1X

i=0

ci

i!  =1 ) ce = 1 ) c =  e:

(b)  P (X  = 0) = e:0

0!  = e:

(c) P (X > 2) = 1 P (X   2)

= 1

P (X  = 0)

P (X  = 1)

P (X  = 2)

= 1 e e  2e

2  :

2.1.1 Variables aleatorias discretas especiales

Distribución BernoulliConsideremos un experimento donde sólo hay dos resultados posibles: “éxito”

o “fracaso”, con probabilidad de éxito  p. Si de…nimos la v.a .

X  =

  1;   cuando ocurre “éxito”0;   cuando ocurre “fracaso”

  ;

a  X  se le llama v.a. Bernoulli  con parámetro  p, denotado  Bernoulli(p).

La función masa de probabilidad (o función de densidad) de  X  está dadapor

 p(0) = P (X  = 0) = 1 p, p(1) = P (X  = 1) =  p, o bien, p(x) =  px(1 p)1x , x  = 0;  1

32

Page 33: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 33/94

También nos referimos a esta función masa de probabilidad como la “Dis-tribución Bernoulli”.

Ejercicio:Veri…car que  p es una función masa de probabilidad.

Distribución BinomialDe…nición:  Ensayos repetidos e independientes se llaman ensayos Bernoulli,

cuando en cada ensayo, solo hay dos resultados posibles y sus probabilidadesson las mismas en todos los ensayos.

Supongamos que se realiza una sucesión de   n  ensayos Bernoulli y que encada realización la probabilidad de “éxito” es  p y la de “ fracaso” es  1 p. Si X representa el número de “éxitos ” que ocurren en los  n  ensayos, entonces se dice

que X  es una variable aleatoria Binomial con parámetros   (n; p),  y queen lo sucesivo será denotado por  X  s  Binomial(n,  p).

Teorema:  Si X  s  Binomial(n,  p), entonces la función masa de probabili-dad de X  está dada por

 p(i) =  P (X  =  i) =

n

i

pi(1 p)ni; i  = 0;  1;  2; :::; n

Notar!!!  Una variable  Bernoulli(p) es una  Binomial(1,  p).

También nos referimos a la función masa de probabilidad de la variablealeatoria binomial como Distribución Binomial.

Ejercicio: Veri…car que  p  es una función masa de probabilidad.

Ejemplo:La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara

10 veces ¿cuál es la probabilidad de que acierte exactamente en tres ocasiones?¿Cuál es la probabilidad de que acierte por lo menos en una ocasión?

Distribución PoissonDe…nición:   Una v.a .   X , cuyo recorrido es  RX   = f0;  1;  2; :::; g  se dice que

es una v.a  Poisson con parámetro  , si para algun   > 0,

 p(i) =  P (X  =  i) = ei

i!  , i  = 0;  1;  2; :::;

A la función masa de probabilidad  p  se le llama Distribución Poisson.Si   X   es una variable aleatoria  Poisson   con parámetro     se escribirá   X   s

Poisson() que se lee “X  se distribuye  Poisson con parámetro  ”.

Notemos ahora lo siguiente:

33

Page 34: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 34/94

Si X  s Binomial(n,  p), donde  p = 

n, entonces

P (X  =  i) =

n

i

pi(1 p)ni

=  n!

(n i)!i!

n

i 1  

n

ni

= n(n 1) (n i + 1)

ni   i

i! 

1  

n

n

1  

n

i

ahora, cuando n ! 1

1)

  n(n

1):::(n

i + 1)

ni   ! 1

2)

1  

n

i

! 1

3)

1  

n

n

! e

9>>>>>>>>=>>>>>>>>;

) cuando n ! 1,  P (X  =  i) = ei

i!  .

Notar ahora que cuando   n ! 1  , entonces   p !   0   , así que, el resultadoanterior dice que podemos aproximar las probabilidades Binomiales con lasprobabilidades de la distribución   Poisson, siempre que   n   sea grande y   p   seapequeño.

Ejemplos de v.a. que usualmente obedecen a la Distribución Pois-son

1. El número de errores de impresión en una página (o en un libro). Si alescribir una pagina hay una probabilidad constante de que cualquier letrase escriba erróneamente, y si las condiciones de impresión permaneceninalterables, entonces tenemos tantos ensayos Bernoulli como letras hayaen la página. El número de errores tipográ…cos en la página se distribuyePoisson  (np), donde  n  =número de letras en la página, y   p =proporciónde que cualquier letra se escriba erróneamente.

2. El número de personas en una comunidad que han vivido 100 años. Cualquierpersona particular, al nacer, tiene una pequeña probabilidad de vivir 100años y, en una comunidad grande, el número  n  de nacimientos por año es

grande.El número de personas que vivirá 100 años de los nacidos este añoes una v.a . cuya distribución se puede aproximar con una  Poisson (n,  p).

3. El número de llamadas equivocadas al teléfono de la escuela en un díadado.

34

Page 35: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 35/94

4. El número de accidentes automovilísticos que ocurren por semana en eltramo del periférico que está frente a nuestra Facultad.

Ejemplos:1: ¿Cuál es la probabilidad de que en una cierta escuela haya  k   estudiantes

que cumplan años en el día de año nuevo, si se sabe que la escuela tiene 500alumnos?

Solución: P (un estudiante cumpla años en año nuevo) =  1

365,  = (500)(   1

365) =

1:3699

k   0 1 2 3 4 5 6Binomial   0:2537 0:3484 0:2388 0:1089 0:0372 0:0101 0:0023

Poisson   0:2541 0:3481 0:2385 0:1089:   0:0373 0:0102 0:0023

2. Supóngase que en una gran población la proporción de personas quetienen cierta enfermedad es 0.01. Determinar la probabilidad de que en ungrupo aleatorio de 200 personas, al menos 4 tengan la enfermedad.

Solución:  n = 200,  p = 0:01 )  =  np = 2

X  =  número de personas que tienen la enfermedad,por tanto, P (X   4) = 1P (X < 4) = 1[P (X  = 0) P (X  = 1) + P (X  = 2) + P (X  = 3)] =

0:1428:

Distribución GeométricaConsideremos una sucesión de ensayos Bernoulli con probabilidad de éxito  p.Sea la v.a .

X  =número de ensayos requeridos hasta que ocurra el primer éxito.Entonces  RX  = f1;  2;  3; :::; g.La distribución de X  está dada por  p(n) =  P (X  = n) = (1 p)n1p, n  = 1;

2;  3; :::;

A   X   se le llama  v.a .   Geometrica  y a   p(n) =   P (X   =   n)   se le denominadistribucion Geometrica con parametro  p. Denotado por (Geo( p)).

También se puede encontrar en la literatura que la variable aleatoria Geometricaes

X 1   =número de ensayos requeridos antes de que ocurra el primer éxito,en cuyo caso,   RX   = f0;   1;   2;   3; ;:::g   y la correspondiente función masa deprobabilidad es

 p(n) =  P (X  =  n) = (1 p)np;  n   = 0;  1;  2; ;:::

Ejemplos

35

Page 36: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 36/94

1. En cierta región la probabilidad de que una lluvia con truenos y relámpa-gos ocurra un día cualquiera durante el verano (digamos, julio y agosto)

es igual a 0.1. Suponiendo la independencia de un día con otro, ¿cuál es laprobabilidad de que la primera lluvia con truenos y relámpagos del veranoocurra el 3 de agosto?

Solución: Sea  X =No. de días transcurridos, a partir del 1 de julio, hastaque ocurre la primera lluvia con truenos y relámpagos.

Se Quiere hallar  P (X  = 34): X  s Geo(0:1); entonces,

P (X  = 34) = (1 0:1)33(0:1)

2. Supongamos que un mecanismo es inspeccionado al …nalizar cada día paraver si aún funciona regularmente. Sea p  la probabilidad de falla durantecualquier día dado. Hallar la probabilidad de que la primera falla seencuentre en la quinta inspección.

Solución: Sea X =No. de inspecciones realizadas al mecanismo hasta quese encuentra la primera falla.

Se Quiere hallar  P (X  = 5): X  s Geo(p); entonces,

P (X  = 5) = (1 p)4 p

Teorema: Supóngase que  X  tiene una distribución  Geo(p). Entonces parados enteros positivos cualesquiera  s  y  t,

P (X   s + t j X > s) =  P (X   t).

Dem.:   P (X    s  + t j X > s) =   P (Xs+t; X>s)P (X>s)   =   P (Xs+t)

P (  X >s)   =   (1 p)s+t1

(1 p)s   =

(1

 p)t

1 = P (X 

 t)

El teorema anterior indica que la distribución geométrica no tiene memoriaen el sentido siguiente: Supongamos que el evento A  no ha ocurrido durantelas primeras repeticiones del experimento. Entonces la probabilidad de queno ocurra durante las próximas t   repeticiones es la misma que la probabilidadde que no ocurra durante las primeras   t   repeticiones. En otras palabras, lainformación de ningún éxito es “olvidada” en lo que se re…ere a los cálculossubsecuentes.

Distribución Binomial NegativaEs una generalizacion de la  distribucion Geometrica, surge en la siguiente

situación: supongamos que se efectúa una sucesión de  experimentos Bernoulli

con probabilidad de éxito  p. Los ensayos se realizan hasta que ocurren  r  éxitos.Sea X  =número de ensayos requeridos hasta obtener el  résimo éxito.Entonces  RX  = fr; r + 1; r + 2; :::; g:

A X  se le denomina variable aleatoria Binomial Negativa.Hallemos su función masa de probabilidad:

36

Page 37: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 37/94

Obviamente si r  = 1, X  s Geo(p) y por tanto su distribución esP (X  =  k) = (1

p)k1p.

Si r 6= 1,X  = k  si y sólo si ocurre éxito en el  késimo ensayo y en los  k 1 ensayos

anteriores ocurrieron r 1 éxitos.

Ahora, el número de maneras en las que pueden ocurrir  r 1 éxitos en  k 1

ensayos es

k 1

r 1

:

Y, como los ensayos son  Bernoulli, la probabilidad de ocurrencia de cadauno de los arreglos de  r 1 éxitos y  k 1 (r 1) fracasos es  pr1(1 p)kr.

Por tanto,

 p(k) = P (X  =  k)

=  p

k 1

r 1

pr1(1 p)kr

=

k 1

r 1

pr(1 p)kr:

A  p  se le llama  distribucion Binomial Negativa, denotado por   (BinN (r;p)).

Ejemplo: Un estudio geológico de exploración petrolera indica que, en unaperforación, la probabilidad de encontrar petróleo en una zona particular es de0.2. Calcular la probabilidad de que en la quita perforación encontremos portercera vez petróleo en la zona.

Solución:

Sea  X   =No. de perforaciones requeridas hasta obtener 3 éxitos. Entonces

X  s BinN (3;  0:2): Se pideP (X  = 5) =

4

2

(0:2)3(0:8)2:

Se sabe que, en promedio, de cada 100 placas de rayos X que se realizan,una es defectuosa.

Distribución HipergeométricaSupongamos que de una urna conteniendo N  bolas, de las cuales b son blancas

y  N   b son negras, se extraen aleatoriamente y sin reemplazo  n  bolas.

Sea   X   =Número de bolas blancas seleccionadas de entre las   n  extraídas,entonces,RX  = f0;  1; ;:::; m{n(n; b)g.

A  X  se le llama variable aleatoria Hipergeométrica y su función masade probabilidad está dada por

37

Page 38: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 38/94

 p(k) = P (X  =  k)

=

bk

N   bn k

n

A p  se le llama distribución Hipergeométrica.Ejemplos1.  En un vagon de ferrocarril que acarrea a 60 reses el 20% de ellas tienen

la enfermedad de la vaca loca , si con propósito de inspeccion sanitaria se extraeuna muestra del 10% de las reses. Calcula la probabilidad de que hayan 2 resescon dicha enfermedad.

Solución: Sea X =No. de reses con la enfermedad entre el 10% seleccionado

P (X  = 2) = (122 )(484 )

(606 )

2.  Un comprador de componentes eléctricos los compra en lotes de tamaño10. Su política es inspeccionar 3 componentes aleatoriamente de un lote yaceptarlo únicamente si los 3 no son defectuosos. Si el 30% de los lotes tienen 4componentes defectuosos y el 70% tienen únicamente 1, ¿cuál es la proporcionde lotes que el comprador rechazará?

Solución:

Sea A  :  El comprador acepta el lote.Se pide

P (Ac) = 1 P (A)

= 1

P (A

j4D)P (4D)

P (A

j1D)P (1D)

= 1

4

0

6

3

10

3

  (0:3)

1

0

9

3

10

3

  (0:7)

= 1   54

100

=  46

100

Por lo tanto, el 46% de los lotes serán rechazado.3.   Para evitar que lo descubran en la aduana, un viajero ha colocado 6

tabletas de narcótico en una botella que contiene 9 píldoras de vitamina queson similares en apariencia. Si el o…cial de la aduana selecciona 3 tabletasaleatoriamente para analizarlas, ¿cuál es la probabilidad de que el viajero seaarrestado por posesión de narcóticos?

Solución: Sea  X =No. de tabletas de narcótico entre las tres seleccionadaspor el o…cial de aduanas.

38

Page 39: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 39/94

P (viajero sea arrestado por posesión de narcóticos) =  P (X    1)= (61)(92)(153 )

  +

(6

2)(9

1)(153 )

  + (6

3)(9

0)(153 )

  = 0:815:

4.  Un ensamblaje consta de 3 componentes mecánicos. Supón que las prob-abilidades de que el primero, el segundo y el tercer componentes cumplan conlas especi…caciones son 0.95, 0.98 y 0.99. Supón que las componentes son inde-pendientes. Determina la función distribución de X=No. de componentes delensamblaje que cumplen con las especi…caciones.

2.2 Variables aleatorias continuas

De…nición:  Una variable aleatoria  X   se dice que es continua si su rango esin…nito no numerable.

De…nición: Una función  f   : R ! R se llama función de densidad continua si

(a) f (x) 0, 8x 2 R y(b)

 R 11 f (x)dx = 1.

Ejemplos:1:  f (x) = I [0;  1](x)

=

(  1; si x 2 [0;   1]

0;   de otro modo

notemos que f (x) 0; 8x, y además

Z  11f (x)dx  =

Z   10

1dx  =   xj10   = 1:  Por tanto  f  es una función de densidadcontinua.

2.- Si consideramos ahora

g(x) = I [0;  1)(x)

=

(  1; si x 2 [0;   1)

0;   de otro modo

entonces  g  también es una densidad continua.

Teorema:   Si  X  es una variable aleatoria continua, existe una función dedensidad continua  f    tal que

P X (B) =  P (X  2 B) =

Z B

f (x)dx, 8B 2 B

a  f  se le llama  función de densidad de la variable aleatoria  X .

39

Page 40: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 40/94

Observaciones:

1.   Si  X  es una v.a . continua, su función de densidad   f  no tiene que ser una probabilidad , así que, no necesariamente se tiene que  0 f (x) 1.

Ejemplo:  Cuando  f   es

f (x) =

(  2; si x 2 [0;   1=2)

0;   de otro modo

2.  Del Teorema se tiene que

P (a X   b) = P (a < X   b)

= P (a X < b)

= P (a < X < b)

3.  La función de densidad  f  de…ne una medida de probabilidad P X (B) sobrelos borelianos.

4. Notar lo siguiente. Consideremos la función de densidad

f (x) =

(  1; si x 2 [0;   1]

0;   de otro modoLa medida de probabilidad que determina sobre los borelianos es

P X (B) =

Z B

f (x)dx

=

Z B\[0;  1]

dx =R 

B\(0;1)

dx =R B

g(x)dx

donde   g(x) =

  1; si x 2 (0;   1])0;   de otro modo

Entonces, g  es también una función de densidad para la v.a.   X !!!Concluyendo: A una v.a . continua le pueden corresponder varias funciones

de densidad (de hecho, in…nitas), lo común, es trabajar con una continua si esque la hay. Nota que cualquiera que sea la que usemos el valor de la probabilidadpara   B 2 B  es la misma es decir, las densidades   f   y   g   determinan la mismamedida de probabilidad sobre los borelianos B. En general, si dos densidadescontinuas di…eren en a lo más un conjunto numerable de puntos, entonces lasmedidas de probabilidades a que dan lugar son exactamente las mismas.

Ejemplos:1.- Supóngase que la función de densidad (f:d:) de una v.a .   X  es

f (x) =(

  cx; si   0 < x <  4

0;   de otro modo (donde  c  es una constante dada)

Determinar(a) el valor de  c,(b) calcular la probabilidad de que  P (1 X   2) y

40

Page 41: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 41/94

(c) P (X   2).

Solución:

(a) Z  11

f (x)dx = 1

)Z   40

cxdx = 1

)   cx2

2

4

0

= 1

)   c = 1=8

(b)

P (1 X   2) =

Z   21

1

8xdx

= 3=16

(c)

P (X   2) =

Z  12

f (x)dx

=

Z   42

1

8xdx

= 3=4

Observación:Si X  es una v.a . (continua o discreta), entonces  P (a X   b) =  P (X  

b) P (X < a).

Demostración:

P (X   b) = P (a X   bS

X < a)

= P (a X   b) + P (X < a)

por tanto

P (a X   b) =  P (X   b) P (X < a).

Notar:   Si  X  es una v.a. continua, entonces podemos escribir P (a 

 X  b) =  P (X   b) P (X   a).

41

Page 42: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 42/94

2.2.1 Variables aleatorias continuas especiales

Distribución Uniforme   Una v.a .  X  se dice que está uniformemente distribuidasobre un intervalo  (a; b) (o  [a; b] o  (a; b] o  [a; b)) si su función de densidad estádada por

f (x) =

8<:

1

b a; si x 2 (a; b)

0;   de otro modo

Si  X  es una variable aleatoria uniforme sobre  (a; b)  se denotará  X  s  U (a;b).

Esta distribución está asociada a problemas en los que se selecciona aleato-riamente un punto de un intervalo   (a; b)  y el interés está en determinar la

probabilidad de que el punto seleccionado  X  pertenezca a algún subintervalo  I de  (a; b);en cuyo caso  P (X  2 I ) =   Longitud de I ba   :

Ejemplos:1.  Un conmutador recibe una llamada telefónica al azar en un intervalo de

un minuto. El conmutador se satura por completo durante 15 segundos en esteperíodo de 1 minuto. ¿Cuál es la probabilidad de que la llamada entre cuandoel conmutador no esté completamente saturado?

Solución: Sea X =el tpo. en el intervalo de 60 segundos en que se realiza lallamada.

Entonces  X  s U (0; 60)

f (x) =

  160 ;   0 < x <  600;   de otro modo

P (0 < X < 15) =

15Z 0

160dx =   x60 j150   =   1560  = 0:25 que es la probabilidad de que

se haga la llamada durante el período de saturación.Por tanto, la probabilidad de que la llamada se realice cuando el conmutador

no está completamente saturado es 1-0.25=0.75.

2. El tiempo que tardan en ir y volver unos camiones que transportan con-creto a un lugar donde se construye una autopista está distribuida uniforme-mente en el intervalo de 50 a 70 minutos. ¿Cuál es la probabilidad de que eltiempo del viaje redondo rebase los 65 minutos si se sabe que hacerlo toma másde 55 minutos.

Solución: Sea X =tpo. en minutos que tarda en realizarse el viaje redondo.Entonces  X  s U (50; 70)

P (X > 65jX > 55) =   P (X>65; X>55)P (X>55)   =   P (X>65)

P (X>55)

P (X > 65) =

70Z 65

120

dx =   520

 = 0:25

42

Page 43: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 43/94

P (X > 55) =

70

Z 55

120dx =   15

20  = 0:75

Por tanto,  P (X > 65jX > 55) =   0:250:75  = 0:33

3. Los autobuses llegan a un paradero en intervalos de 15 minutos em-pezando a las 7 A.M. Esto es, llegan a las 7, 7:15, 7:30, 7:45, y así sucesiva-mente. Si un pasajero llega al paradero en un tiempo que está uniformementedistribuido entre las 7 y las 7:30, hallar la probabilidad de que el pasajero esperemenos de 5 minutos.

Solución:   Sea  X   =Tpo. de espera de un pasajero, que llega al paradero

entre las 7 y las 7:30, hasta que llega el autobús.De acuerdo con los datos, X  s U (0; 30).Para que el pasajero espere menos de 5 minutos, se requiere que 10 < X 

 15

ó  25  < X   30. Entonces la probabilidad pedida es:

P (10 < X   15) + P (25 < X   30) =

Z   1510

1

30dx +

Z   3025

1

30dx

= 1

3

Distribución Exponencial   Una variable aleatoria continua X  cuya funciónde densidad está dada por

f (x) = (  ex; si x 0

0; si x < 0

donde  > 0, se dice que es una variable aleatoria exponencial (o que sedistribuye exponencialmente) con parámetro  . Se denotará X  s exp().

La distribución exponencial aparece muy frecuentemente en situaciones dondese está estudiando el tiempo que transcurre hasta que ocurre algún evento es-pecí…co. Por ejemplo, el tiempo, a partir de hoy, hasta que empiece una guerramundial, o el tiempo hasta que alguien reciba una llamada telefónica con númeroequivocado. Bajo circunstancias muy especiales, la distribución exponencialpuede ser apropiada para tiempos entre fallas de un sistema, llegadas a unacola, ... etc.

Ejemplo:   Supongamos que el tiempo que dura una llamada telefónica (enminutos) es una variable aleatoria exponencial con parámetro     = 1=10. Sialguien llega inmediatamente antes que tú a un teléfono público, hallar la prob-abilidad de que tengas que esperar más de 10 minutos.

Solución:

43

Page 44: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 44/94

Sea  X   =tiempo (en minutos) que dura la llamada de la persona que llegóantes que tú. Se pide hallar  P (X > 10). Veamos:

P (X > 10) =

Z  110

1

10e

  x10 dx

= e  x10

110

= e1

0:368

La variable aleatoria exponencial, es una variable aleatoria que carece dememoria, este hecho se expresa en el siguiente

Teorema:   Sea X  s exp(). Para cualesquiera  s; t 0  P (X > s + t j X >t) =  P (X > s)().

Demostración:

P (X > s + t j X > t) = P (X > s + t \ X > t)

P (X > t)

= e(s+t)

et

= es

= P (X > s)

Corolario:   Si   X   s   exp(), para cualesquiera   s; t    0   P (X > s +  t) =P (X > s)P (X > t)

Si  X  es el tiempo de vida en horas de algún instrumento, la expresión (*)establece que la probabilidad de que el instrumento sobreviva por al menos  s + thoras, dado que ya sobrevivió   t  horas, es la misma que la probabilidad inicialde que sobreviva al menos  s  horas. En otras palabras, si el instrumento tieneedad t, la distribución del tiempo restante que va a sobrevivir  es la misma quela del tiempo de vida original, esto es, es como si el instrumento no recordaseque ya ha sido usado por un tiempo t.

Distribución Gamma   La función de densidad de la distribución Gamma

incluye la llamada f unción Gamma  cuya de…nición es   () =

1Z 0

x1exdx;

> 0:

Usando integración por partes se puede mostrar que () = (1)(1);para  > 1:Notar que  (1) = 1; lo cual conduce a que  (n) = (n 1) (n 1) =  :::  =

(n 1)!; cuando n  es un entero positivo.

44

Page 45: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 45/94

Page 46: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 46/94

Distribución Normal Estándar (o Distribución Normal Tipi…cada)Es la distribución normal con     = 0  y   2 = 1. Su función de densidad, de-

notada usualmente por  , está dada entonces por(x) =

  1p 2

exp

1

2x2

; 8x 2 R

Sólo se pueden determinar probabilidades para la distribución normal através de la normal estándar utilizando la tabla de valores de  (x). Hay tablasque solo proporcionan los valores de   (x)  cuando  x    0   , pero no representaningún inconveniente pues como  f  es simétrica respecto a  x  = 0,

P (X   x) =  P (X   x) = 1 P (X   x):Esperaremos hasta haber desarrollado los temas de esperanza y varianza

para mostrar cómo se calculan estas probabilidades.

Distribución GammaOtras distribuciones continuas especiales:

 Distribución  t

 Distribución  2 ( ji-cuadrada )

 Distribución  F 

 Distribución  Beta

2.2.2 La Función de Distribución Acumulada

De…nición:   La  función de distribución acumulada  de una  v.a .   X   (discreta o

continua), denotada por  f:d:a:; es una función con dominio  R y contradominio[0;  1]; de…nida como sigue:

F (x) =  P (X   x); 8x 2 R.

Ejemplos:

1.- Consideremos el experimento de tirar una moneda. Sea  X  el número deáguilas que aparecen. Entonces

F (x) =

8<:

0; si x < 01=2; si   0 x < 11; si x 1

o bien,

F (x) =   12I [0;  1](x) + I [1;

 1](x):

2.-  En el experimento de lanzar dos dados, sea   Y   el valor absoluto de ladiferencia de los puntos que aparecen. entonces

46

Page 47: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 47/94

F (x) =

8>>>>>>>><>>>>>>>>:

0; si x < 06=36; si   0

x <  1

16=36; si   1 x <  224=36; si   2 x <  330=36; si   3 x <  434=36; si   4 x <  51; si x 5

AQUI VA LA GRAFICA

Propiedades de la   f:d:a:. i)   F (1

  limx!1

F (x) = 0;  y   F (+1

limx!+1

F (x) = 1

ii)  F  es una función no decreciente, esto es, si  a < b, entonces F (a) < F (b).

iii) F  es continua desde la derecha, esto es   limh!0+

F (x + h) =  F (x):

Una f:d:a: está de…nida de manera única para cada  v.a . Su importancia re-side en que una vez conocida, puede ser usada para el cálculo de probabilidades.

En general, todas las cuestiones de probabilidad acerca de una  v.a .   X  puedenser respondidas en términos de la  f:d:a: F .

Veamos:

Teorema:a)  P (a < x b) =  F (b) F (a):

Demostración:

fX   bg   = fX   ag [ fa < X   bg) P (X   b) =  P (X   a) + P (a < X   b)

por lo tanto

P (a < X   b) = P (X   b) P (X   a)= F (b) F (a):

b)  P (X > a) = 1 F (a):

c)  P (X < a) = limy!a

F (y):

d)

47

Page 48: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 48/94

P (X  =  a) = limy!a+

F (y)   limy!a

F (y)

= F (a)   limy!a F (y):

Ejemplo:  La  f:d:a: de una v.a .   X  está dada por

F (x) =

8>>>><>>>>:

0; si x < 0x=2; si   0 x <  12=3; si   1 x <  211=12; si   2 x <  31; si   3 x

AQUI VA LA GRAFICA

Calcular

a)  P (X < 3)b)  P (X  = 1)

c)  P (X > 1=2)

d)  P (2 < X   4)

Solución:

a)  P (X < 3) = limy!3

F (y) = 11=12

b)P (X  = 1) = F (1)   lim

y!1F (y)

= 2=3 1=2= 1=6

c)P (X > 1=2) = 1 P (X   1=2)

= 1 1=4= 3=4

d)P (2 < X   4) = F (4) F (2)= 1 11=12= 1=12

48

Page 49: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 49/94

Relación entre la  f:d: y la  f:d:a:  cuando  X  es una   v.a . discreta. Teo-rema:  Si X  es una v.a., F  puede ser obtenida de  f  y viceversa.

Demostración: Se hará para uan variable aleatoria discreta.

Veamos que  F  puede ser obtenida de  f :Suponga que RX  = fx1; x2; ; :::g, entonces

F (x) = P (X   x)=  Pfjjxjxg

 p(xj )

=  Pfjjxjxg

f (xj )   y ya!!

Por lo tanto, F (x) =

  Pfjjxjxgf (xj ).

Veamos que  f  puede ser obtenida de  F :

f (xj ) = P (X  = xj )= lim

y!x+j

F (y)   limy!xj

F (y)

= F (xj )   limy!xj

F (y)

Ejemplo:En el experimento de lanzar un dado. Sea  X  =número de puntosque aparecen.

f (x) =  P (X  =  x) = 1=6, 8x = 1;  2; ;:::;  6  y

F (x) =

8>>>>>>>><>>>>>>>>:

0; si x < 11=6; si   1 x <  2

2=6; si   2 x <  33=6; si   3 x <  44=6; si   4 x <  55=6; si   5 x <  61; si x 6

=5P

i=1

i

6I [i; i+1](x) + I [6; 1](x):

Suponga dado  f , hallar  F (2:5)

Solución:

F (2:5) = P (X   2:5)= P (X  = 1) + P (X  = 2)

= 1=6 + 1=6= 1=3:

Suponga ahora dado  F  y calcule  f (3).

Solución:

49

Page 50: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 50/94

f (3) = F (3)   limy!3

F (y)

= 3=6 2=6= 1=6

2.2.3 Esperanza de una Variable Aleatoria

Cuando la variable aleatoria es discreta De…nición: Sea  X   una  v.a .

discreta con recorrido  RX  = fx1; x2; ;:::; g.El valor esperado de X  o  valor medio de X  o  esperanza de X , se de…ne

por

E (X ) =1P

i=1xi p(xi).

Notar!!!

  Si RX  fuese …nito y todas las p(x)   fuesen iguales, E (X ) no es más que elpromedio de todos los valores posibles de X .

  Con   RX  …nito o in…nito numerable, la expresión de   E (X )   es lo que seconoce como promedio ponderado de los valores posibles de  X .

 El valor esperado de una   v.a . no necesariamente existe, pues la seriein…nita podría no converger.

El concepto de esperanza es análogo al concepto físico de “centro de gravedad”.Si  X  es una v.a . discreta que toma los valores  x1; x2; ; :::; y en una barra ubi-camos los pesos p(x) que corresponden a cada uno de los valores  x, entonces elpunto en el que la barra logra el equilibrio, que en física se conoce como  centro

de gravedad, es la esperanza de la  v.a .   X .

AQUI VAN LAS GRAFICAS

Ejemplo 1:   Sea  X  una v.a . tal que  RX   = f2;  0;  1;  4g y tal que  P (X  =2) = 0:1,  P (X  = 0) = 0:4, P (X  = 1) = 0:3 y  P (X  = 4) = 0:2. Hallar  E (X ).

Solución:

E (X ) = (2)(0:1) + (0)(0:4) + (1)(0:3) + (4)(0:2)= 0:9

Ejemplo 2: Un trabajador recibirá un premio de 3000, 2000 o 1000 pesos,según el tiempo que tarde en realizar un trabajo en menos de 10 horas, entre

50

Page 51: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 51/94

10 y 15 horas y más de 15 horas, respectivamente. La probabilidad de realizarel trabajo en cada uno de estos casos es de 0.1, 0.4 y 0.5. 1.

(a) Determina la esperanza de la variable aleatoria X=premio recibido.(b) De…ne una nueva variable aleatoria, Y, con valor 1 si tarda menos de 10

horas y valor 0, en caso contrario. Calcula la esperanza de Y.

Ejemplo 3: Sea  X  s Bernoulli(p). Hallar  E (X )

Solución:

E (X ) = (1)P (X  = 1) + (0)P (X  = 0)

=p

Ejercicios:

1. Sea  X  s Binomial(n;  p). Demostrar que  E (X ) =  np.

2. Sea  X  s Poisson(). Demostrar que  E (X ) =  .

3. Sea  X  s Geo(p). Demostrar que  E (X ) = 1

p.

Cuando la variable aleatoria es continua De…nición: Sea  X   una  v.a .

continua con función de densidad  f .  El valor esperado de  X  o valor medio

de  X  o esperanza de  X , se de…ne por  E (X ) =

Z  11

xf (x)dx.

Al igual que en variables aleatorias discretas, si  X  es continua, su esperanzapuede ser interpretada como un centro de gravedad: Si una masa unitaria esdistribuida continuamente en una recta y  f (x) representa la densidad de masa

en   x, entoncesZ  11

xf (x)dx  es el centro de gravedad o punto donde la recta

alcanza el equilibrio. Si  f   es simétrica con respecto a un punto concreto  x0  enel eje  x, o sea, que   f (x0  +   ) =   f (x0   )  para todos los valores     y ademásE (X ) existe, entonces  E (X ) debe ser igual a x0  que es el punto de simetría.

AQUI VAN LAS GRAFICAS

51

Page 52: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 52/94

Ejemplo 1: Si X  es una v.a . continua con función de densidad

f (x) =

  2x; si   0 < x <  10;   de otro modo

entonces  E (X ) =

Z   10

x(2x)dx = 2

3.

Ejemplo 2: Supongamos que  X  es el tiempo (en minutos) durante el cualun dispositivo eléctrico se utiliza a su máxima carga cierto período de tiempodeterminado. Supongamos que  X  es una v.a. continua con la siguiente  f:d::

f (x) =

8>>><>>>:

1

(1500)2x; si   0 x 1500

  1

(1500)2(x 3000); si   1500 x 3000

0;   de otro modohallar E (X ).

Solucion:

E (X ) =

Z  11

xf (x)dx

=  1

(1500)2

Z   15000

x2dx Z   30001500

x(x 3000)dx

= 1500 minutos.

Ejemplo 4: Si X  s U (a; b), hallar  E (X ).

Solución:

E (X ) =

Z   b

a

x

b adx

=

  1

b a

b2 a2

2

= (b a)(b + a)

2(b a)

=  b + a

2Ejercicios:

1. Si X  s exp(), demostrar que  E (X ) =  1

.

2. Si X  s N (; 2), demostrar queE (X ) =  .

3. Si X  s t, hallar  E (X ).

4. Si X  s 2, hallar E (X ).

52

Page 53: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 53/94

Para lo que sigue considerar que si y  =  g(x) es una función sobre el conjuntode números reales y X  es una variable aleatoria, entonces Y   = g(X ) es también

una variable aleatoria, de hecho, es una variable aleatoria que es función de lavariable aleatoria X . Como tal, es posible hablar de la esperanza y la varianzade  Y  y para hallarlos no es necesario tener la función de densidad de  Y  , bastacon tener la de  X  como se establece en el siguiente Teorema.

Teorema:(a) Si  X  es una v.a . discreta con función masa de probabilidad  p, entonces

para cualquier función real g ,  E (g(X )) = Pxi2RX

g(xi) p(xi).

(b)  Si  X  es una v.a . continua con  f:d:;  f ; entonces para cualquier función

real g , E (g(X )) =

Z  11

g(x)f X (x)dx.

En la sección de  Funciones de Variables Aleatorias  de hablará más amplia-

mente de esto.

Algunas propiedades de los valores esperados 1.- Si  a  y  b son con-stantes, entonces  E (aX  + b) =  aE (X ) + b.

Demostración:

* Si X  es discreta,  RX  = fx1; x2; ;:::g

E (aX  + b) =1P

i=1(axi + b) p(xi)

= a1

Pi=1xi p(xi) + b

1

Pi=1 p(xi)

= aE (X ) + b

* Si X  es continua con  f:d:,  f ,

E (aX  + b) =

Z  11

(ax + b)f (x)dx

= a

Z  11

xf (x)dx + b

Z  11

f (x)dx

= aE (X ) + b

2.1.- Si existe una constante  a  tal que P (X   a) = 1; entoncesE (X ) a.2.2.- Si existe una constante  b  tal que  P (X   b) = 1, entonces  E (X ) b:

Demostración:

* de 2.1 cuando  X  es discreta

E (X ) =P

xi p(xi)= Pxia

xi p(xi)

53

Page 54: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 54/94

Page 55: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 55/94

Page 56: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 56/94

Demostración:

V ar(X  + c) = E f[(X  + c) E (X  + c)]2g= E f[X  + c E (X ) c)]2g= E f[X  E (X )]2g= V ar(X )

3.-  V ar(cX ) =  c2V ar(X )

Demostración:

V ar(cX ) = E f[(cX ) E (cX )]2g= E f[cX  cE (X )]2g= E f[c(X  [E (X )]2g= E 

fc2[(X 

[E (X )]2

g= c2V ar(X )

otra forma de demostrarlo:

V ar(cX ) = E (c2X 2) [E (cX )]2

= c2E (X 2) [cE (X )]2

= c2E (X 2) c2[E (X )]2

= c2(E (X 2) [E (X )]2)= c2V ar(X )

4.-  Si  X; Y   son v.a . independientes, entoncesV ar(X  + Y ) =  V ar(X ) + V ar(Y )

Demostración:

V ar(X  + Y ) = E f[X  + Y   E (X  + Y )]2g= E f[X  + Y   E (X ) E (Y )]2g= E f[(X  E (X )) + (Y   E (Y ))]2g= E f(X  E (X ))2 + 2(X  E (X ))(Y   E (Y )) + (Y   E (Y ))2g= E f[X  E (X )]2g + E f[Y   E (Y )]2g + 2E f[X  E (X )][Y   E (Y )]g= V ar(X ) + V ar(Y ) + 2E f[X  E (X )][Y   E (Y )]g

pero

E f[X  E (X )][Y   E (Y )]g   = E [XY   XE (Y ) Y E (X ) + E (X )E (Y )]g= E (XY ) E (X )E (Y ) E (Y )E (X ) + E (X )E (Y )

y como por la independencia de las v.a ., tenemos queE (X )E (Y ) E (X )E (Y ) = 0

entonces  E f[X  E (X )][Y   E (Y )]g = 0.por lo tantoV ar(X  + Y ) =  V ar(X ) + V ar(Y ):

En general, si X 1; X 2; ; :::; X n  son  v.a . independientes, entoncesV ar(X 1 + X 2 + + X n) =  V ar(X 1) + V ar(X 2) + + V ar(X n)

56

Page 57: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 57/94

5.-  V ar(aX  + b) =  a2V ar(X )

Ejemplos:1. Determinar la varianza de una  X  s Bernoulli( p):2. Determinar la media y la varianza de una variable aleatoria X  s Binomial(n; p)

Momentos de una variable aleatoria De…nición:   Para   k   = 1; 2;:::;   lacantidad  E (X k) se denomina el  k-ésimo momento de la v.a .   X:

Notación:   0

k  =  E (X k), así, 0

1  =  E (X ) =  .De…nición:   Para  k  = 1;  2; ;:::;  la cantidad  E f[X   E (X )]kg se denomina

el  k-ésimo momento central de la v.a .   X .Notación:

k  =  E f[X  E (X )]kg,

así,

1   = E fX  E (X )g= E (X ) E (X )= 0

2   = E f[X  E (X )]2g= V ar(X )

= E (X 2

) [E (X )]2

= 0

2 (0

1)2

3   = E f[X  E (X )]3g= E fX 3 3X 2E (X ) + 3X [E (X )]2] [E (X )]3g= E (X 3) 3E (X 2)E (X ) + 3[E (X )]3] [E (X )]3g= 

0

3 30

10

2 + 2(0

1)3

Nota:  Todo momento central, puede escribirse en términos de los momentos.

¿Para qué sirven los momentos de una variable aleatoria?El …n del curso es el cálculo de incertidumbres a través de probabilidades.

Para calcular probabilidades requerimos de la  f d  o de la   fda. Bueno, puededemostrarse que si se conocen todos los momentos de una variable aleatoria,puede conocerse la  f da de dicha variable. Sin embargo, difícilmente es posibletener todos los momentos de una variable aleatoria. Lo interesante es que sólonecesitamos unos cuantos para tener una buena idea de cómo es la   f d  de lavariable aleatoria.

57

Page 58: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 58/94

Page 59: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 59/94

Si   = 0, entonces la densidad es simétrica.

Si   <  0, se dice que hay asimetría hacia la izquierda (valores mayores deprobabilidad a la izquierda).

Si   >   0, se dice que hay asimetría hacia la derecha (valores mayores de

probabilidad a la derecha).

De…nición:   De…nimos el  coe…ciente de kurtosis  de una v.a ., denotadopor  k , como

  4

4 3, es decir, k  =

 E f[X  E (X )]4g4

  3:

Si k  = 0, entonces el pico es como la de la normal estándar.

59

Page 60: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 60/94

Page 61: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 61/94

Observación:

mX

(t) = E (etX )

= E 

1 + (tX ) +

 (tX )2

2!  +

 (tX )3

3!  +

= 1 + tE (X ) + t2

2!E (X 2) +

 t3

3!E (X 3) +

) m0

X (t) =  E (X ) + tE (X 2) + t2

2!E (X 3) +

) m0

X (0) = E (X ) =  0

1  (primer momento).

m00

X (t) =  E (X 2) + tE (X 3) +   t2

2!E (X 4) +

m00

X (0) = E (X 2) =  0

2 (segundo momento)

En general:

m(k)X  (0) = E (X k) =  

0

k.

Ejemplos 1.- Sea  X  una v.a . con f:d: f (x) =  exI [0; 1)(x),   > 0.Hallar la  f:g:m. de X .

Solución:

Por de…nición,

m(t) =  E (etX ), pero como la v.a . es continua, entonces

m(t) = Z  11

etxf (x)dx

=

Z  11

etxexI [0; 1)(x)dx

=

Z  10

e(t)xdx

t e(t)x

1

0

Ahora, ¿cuándo converge esta integral?, cuando   t <   0, en cuyo casoe(t)x converge cero, de donde queda que,

m(t) = 

t

, si t <  0, esto es, si  t < :

Que es lo mismo que escribir,

m(t) = 

t, si  > t:

2.- Sea  X  una v.a . con  f:d: f (x) = ex

x!  ,  x  = 0;  1;  2; :::;

61

Page 62: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 62/94

Hallar la  f:g:m: de  X .

Solución:

m(t) = E (etX )

=1P

i=0eti ei

i!

= e1P

i=0

(et)i

i!

= eeet

= e(et1); 8t 2 R

Hallar E (X ) y  V ar(X ) en el ejemplo anterior.

m0

(t) =  etexp[(et 1)] ) m0

(0) =    )   E (X ) =  

m00

(t) = et(et)(et)exp[(et 1)]

= et + (et)2exp[(et 1)]

)   m00

(0) =  + 2

= ( 1)   )   E (X 2) =  ( 1)

De donde,

V ar(X ) = E (X 2) [E (X )]2

= ( 1)

2

Teorema:   Sean   X   e   Y  dos variables aleatorias con densidades   f X   y   f Y 

respectivamente. Supongamos que  mX (t)  y  mY  (t)  existen y son iguales paratodos los valores de  t  en un intervalo h < t < h, para algún  h > 0. Entonceslas f:d:a: F X  y F Y   son iguales.

Ejemplo:  Supongamos que una  v.a .   X  tiene función generadora de mo-mentos

m(t) =  1

1 t; 1 < t <  1. ¿Cuál es la densidad de X ?.

Solución:

Su f. g. m. es de la forma 

t que corresponde a una variable aleatoria

exp()Por tanto,  X  s exp(1).

62

Page 63: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 63/94

Ejemplo:   Supongamos que la   f:g:m:  de una  v.a .   X   es   m(t) =   e3(et1),¿cuál es la probabilidad de que  X  = 0?

Solución:P (X  = 0) =  e3, pues  m  es la  f:g:m: de una v.a .  poisson(3).Ejercicio:   Si X  s N (; 2), hallar la  f:g:m: de  X .

Solución:

m(t) = E (etX )

=

Z  11

etx   1p 2

exp

1

2

x

2!

dx

=

Z  1

1

1p 2

exp

1

2 x

2

+ tx

!dx

=

Z  11

1p 2

exp

(x 2t)2

22  + t +

 2t2

2

dx

=

Z  11

1p 2

exp

(x 2t)2

22

exp

t +

 2t2

2

dx

= exp

t +

 2t2

2

Z  11

1p 2

exp

1

2

(x ( + 2t)

2!

dx

= exp

t +

 2t2

2

Notar:Z  11

1p 2 exp

1

2 (x

( + 2t)

2!

dx  es la  f:d:  de una v.a .

que se distribuye  N (t + 2; )  y es igual a 1 porque esta evaluada en   (1;1).

 Si en especial   X   s   N (0;   1)   entonces   mX (t) =   et2

2 , ya que   mX (t) =

e

t0+12t2

2

.

Notar:

m0X (t) = ( + 2t)exp(t +

 2t2

2  ), entonces  E (X ) =  m0

X (0) = .

También

m00X (t) =  ( + 2t)exp(t +  2t2

2   ) + 2exp(t +  2t2

2   ) + 2t( + 2t)exp(t +2t2

2   ):

por tanto,  m00X (t) =  2 + 2 = E (X 2),

63

Page 64: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 64/94

entonces, E (X 2) =  m00X (0) = 2 + 2; de donde

V ar(X ) =  E (X 2

) [E (X )]2

) V ar(X ) = E (X 2) [E (X )]2

= 2 + 2 2

= 2

Teorema:  Supongamos que X  s N (; 2) ) Z  = X 

  s N (0;  1).

Demostración:

mZ (t) = E (eX

  t)

= E (e

Xt

e

t

)

= et E (e

Xt )

= et e(

t + 2t2

22  )

= e(t  +t

 + t2

2 )

= et2

2

Notar:   que  mZ (t) = et2

2 es la  f:g:m: de una  N (0;  1), por tanto  Z  s N (0;1):

Teorema:  Supóngase que la  v.a .   X   tiene   f:g:m.   mX . Sea  Y   =  X  +  :

Entonces la  f:g:m. de Y  está dada por  mY  (t) =  etmX (t).

Demostración:

mY  (t) = E (etY )

= E (et(X+))

= E (e(t)X et )

= et E (e(t)X )

= et mX (t)

Cálculo de probabilidades cuando  X  s N (; 2)

1. Supóngase que la v. a. X tiene una distribución normal con media 1 yvarianza 4. Determinar el valor de cada una de las probabilidades sigu-ientes:

64

Page 65: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 65/94

(a)   P (X < 3)

(b)   P (X > 1:5)(c)   P (X  = 1)

(d)   P (X   0)

(e)   P (jX j 2)

(f)   P (2 < X < 5)

(g)   P (1 < X   0:5)

(h)   P (1 2X  + 3 8)

2. Supóngase que el voltaje medido en cierto circuito eléctrico tiene unadistribución normal con media 120 y desviación estándar 2. Si se tomantres medidas independientes del voltaje, ¿cuál es la probabilidad de que

las tres medidas están entre 116 y 118?3. Supóngase que la maestra de un grupo de alumnos dice que es necesario

obtener una nota ubicada en el 10% superior de la distribución de cal-i…caciones de la clase para sacar una A en un examen particular. Porexperiencia ella estima que la media y la desviación estándar de este ex-amen serán 72 y 13, respectivamente. ¿Cuál es la cali…cación mínimanecesaria para obtener una A? Supón que las cali…caciones tienen unadistribución normal.

Funciones de una variable aleatoria   Sea    un espacio muestral asociadoa un experimento y X  una variable aleatoria de…nida en  . Si y  =  H (x) es unafunción real de  X , entonces  Y   = H (X ) es una v.a .

Ejemplos1: Suponga que H (x) =  x2 ) Y   = H (X ) =  X 2 es una v.a .Si ahora suponemos que   X   es una   v.a . no negativa y que nos interesa

calcular P (Y >  4), tendremos que como el evento fY >  4g fX >  2g )P (Y >   4) =   P (X >   2);  esto es, la probabilidad con la v.a.   Y   se redujo alcálculo de una probabilidad con la v.a.   X .

2: Sea  X  una v.a . con  f:d:

f (x) =

(  ex; x >  0

0;   de otro modo

Suponga que H (x) = 2x + 1. Sea  Y   = H (X ), calcula  P (Y 

 5).

Solución:

65

Page 66: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 66/94

P (Y   5) = P (2X  + 1 5)

= P (X   2)

=

Z  12

exdx

=  1

e2:

Hagamos ahora un análisis general para cada uno de los tipos de v.a.Caso 1:   X  es una v.a .  discreta 

X  es una v.a . discreta )  Y   = H (X ) es una v.a . discreta. De hecho si  s1;s2; :::; sn; :::; es el  RX )  t1 =  H (s1); :::; tn =  H (sn); es el  RY  .

Si H  es  11 ) P (Y   = ti) =  P (X  =  si), o sea f Y  (ti) =  f X (si).

3: Si X  toma los valores 1,  0  y  1  con probabilidad 1/3, 1/2 y 1/6, respec-tivamente, entonces  Y   = 3X  + 1 toma los valores 2, 1 y 4, con probabilidad1/3, 1/2 y 1/6 respectivamente.

Pero  H  no siempre es  1 1.

Por ejemplo, tomemos X  de…nida como antes, y  Y   = X 2 ) RY   es f1;  0g yP (Y  = 0) =  P (X  = 0) = 1=2;

P (Y   = 1) =  P (X  = 1) + P (X   = 1) = 1=3 + 1=6 = 1=2, así que en estecaso,

f Y  (ti) =  P (Y   = ti) =  P

fs2RX j  H (s)=tigf X (s):

En resumen, para calcular  P (Y   = ti), solo tenemos que encontrar el evento

equivalente en función de  X  y calcular las probabilidades correspondientes.

4: Suponga que  X   toma los valores posibles  1;  2; :::; n; :::;  y suponga que

P (X  =  n) =

1

2

n

.

Sea Y   =

(  1; si X   es par

1; si X   es impar

)  RY   es f1; 1g y la distribución de probabilidades de  Y   es:

66

Page 67: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 67/94

P (Y   = 1) =1

Pi=11

22i

=1P

i=1

1

4

i

=  1

1  1

4

1

= 4

3  1

= 1

3:

P (Y   = 1) = 1 P (Y   = 1)

= 1  13

= 2

3:

Caso 2:   X  es una v.a . continua.

Subcaso 2.1 Si  X  es una v.a . continua, puede que  Y   sea discreta.Por ejemplo, suponga que  X  toma valores en  (1; 1) y

Y   =

(  1; X   0

1; X < 0

para obtener la distribución de probabilidades de  Y  procedemos igual que

antes, simplemente determinamos el evento equivalente en X .P (Y  = 1) =  P (X   0) =

Z  10

f X (x)dx

y

P (Y   = 1) =  P (X < 0) =

Z   01

f X (x)dx ,

si se conoce f X , estas probabilidades pueden ser calculadas.

Subcaso 2.2  El caso más frecuente es cuando   X   es una v.a. continua yY   =  H (X )  también lo es. Planteamos como meta en este caso hallar f Y  . Deacuerdo a lo que hemos hecho antes un procedimiento adecuado podría ser:

1.- Obtener la f:d:a:, G, de  Y .

2.- Derivar G  respecto de  y  para hallar la  f:d: de  Y , denotada por  g .

Ejemplo 1: Suponga que X  tiene  f:d:

f (x) =

(  2x; si   0 < x <  1

0;   de otro modo  :

67

Page 68: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 68/94

Sea H (x) = 3x + 1. Hallar la  f:d:; g ; de Y   = H (X ).

Solución:

G(y) = P (Y   y)

= P (3X  + 1 y)

= P 

X    y 1

3

=

8>>>>>>><

>>>>>>>:

0; si  y 1

3  0 , y  1

Z y1

3

0

2xdx; si   0 < y 1

3  < 1 , 1 < y < 4

1; si  y

1

3   1 , y  4

=

8>>>><>>>>:

0; si y  1y 1

3

2

; si   1 < y < 4

1; si y  4

g(y) = G0

(y)

=

8>>>><>>>>:

0; si y  1

2

9(y 1); si   1 < y < 4

0; si y  4

=

8<:

2

9(y 1); si   1 < y < 4

0;   de otro modo

Otra forma de proceder:

G(y) = P (Y   y)

= P 

X    y 1

3

= F y

1

3

= F (K (y))

donde K (y) = y 1

3  , entonces por la regla de la cadena:

68

Page 69: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 69/94

G0

(y) = F 0(K (y)) K 0

(y)

= f (K (y))  1

3

=

8<: 2K (y)  1

3; si   0 < K (y) <  1

0;   de otro modo

=

(   2

9(y 1); si   1 < y < 4

0;   de otro modo

Ejemplo 2: Considere la misma v.a.   X  del ejemplo 1.Sea H (x) =  ex: Hallar la f:d: de  Y   = H (X ):

Solución:

G(y) = P (Y   y)

= P (eX y)

= P (X   ln y)

= P (X   ln y)

=

8>>>><>>>>:

Z   1 ln y

2x dx; si   0 < ln y < 1

0; si   ln y  0

1; si   ln y  1

=

8>>>><>>>>:

1 (ln y)2; si   1 > y >  1e

0; si y  1

1; si y  1

e

g(y) =  G0

(y) =

8<: 2 ln y   1y ; si

  1

e < y < 1

0;   de otro modo

Otra forma:

G(y) = P (Y   y)

= 1 F ( ln y)

aplicando la regla de la cadena

69

Page 70: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 70/94

G0

(y) = F 0

( ln y) 1

y= f ( ln y)  1

y

=

8><>:

2 ln y  1

y; si   0 < ln y < 1

0;   de otro modo

=

8><>:

2 ln y  1

y  si

  1

e < y < 1

0;   de otro modo:

Nota: Que el paso clave, es cuando logramos sustituir el evento  fY    yg

por otro que está en términos de la  v.a .   X . Notemos que esto lo pudimoshacer porque las funciones  H  eran estríctamente crecientes o estríctamente de-crecientes. De hecho, como procedemos es así:

Si  Y   y , H (X )  y , X    H 1(y)  cuando  H  es monótona creciente yX    H 1(y)  cuando es monótona decreciente. Esto se puede generalizar en elsiguiente:

Teorema: Sea  X  una  v.a . continua con f:d:;   f ; en donde  f (x)  >  0  paraa < x < b. Supóngase que  y  =  H (x)  es una función estríctamente creciente oestríctamente decreciente. Suponga que esta función es derivable (y por tantocontinua) para toda  x, entonces la v.a .   Y   de…nida como  Y   = H (X ) tiene una

f:d:  denotada por   g  dada por   g(y) =   f (x)

dxdy

. En donde   x   se expresa en

términos de y . Si H  es creciente, entonces  g  es distinto de cero para los valoresde y que satisfacen H (a) < y < H (b). Si H  es decreciente, entonces g es distintade cero para los valores de  y  que satisfacen  H (b) < y < H (a):

Ejemplo 1: Sea  f (x) =

(  2x; si   0 < x <  1

0;   de otro modo  y H (x) = 3x + 1.

Entonces por el teorema anterior,  g(y) =  f (x)

dx

dy

y   x =  y 1

3  por tanto

g(y) = f 

y 1

3

 1

3

=8<:

2

9 (y 1); si   1 < y < 40;   de otro modo

Ejemplo 2: Sea  f (x) =

(  2x; si   0 < x <  1

0;   de otro modo  y H (x) =  ex:

70

Page 71: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 71/94

Nuevamente, por el teorema:

g(y) =  f (x)dxdy

y   x = ln y   por tanto

g(y) = f ( ln y)

1

y

=

8><>:

2 ln y

1

y

; si e1 < y < 1

0;   de otro modoEjemplo 3: Supongamos que  X  es una variable aleatoria con  f d dada por

f (x) =

  1=2;   1 < x <  1

0; otros

Sea Y   = X 2: Determinar la función de densidad de  Y .Solución: La función  y  =  x2 no es uno a uno. Así que, no queda más que

resolver el problema a “pie”.Hallemos primero la fda   G  de   Y , esto es, hallaremos   G(y) =   P (Y     y);

8y 2 R :Si y < 0; claramente  G(y) =  P (Y   y) =  P (X 2 y) = 0:Supongamos ahora que  y  0:

G(y) =   P (X 2 y)=   P (p 

y < X <p 

y)

=R p yp y f (x)dx

=

( R p yp y

12dx;   0 p 

y < 1

1;  p 

y  1

R p 

y

p y12dx =   1

2x p 

yp y   =   1

2(p 

y +p 

y) =p 

y:

Así,

G(y) =  P (Y   y) =

8<:

0; y < 0p y;   0 p 

y < 11;

  p y  1

  =

8<:

0; y < 0p y;   0 y < 1

1; y de donde la  f d de  Y   es,

g(y) =

  12p 

y ;   0 < y < 1

0; otros casos

Esperanza de una función de una variable aleatoriaTeorema: (a)  Si  X  es una  v.a . discreta con función masa de probabilidad

 p, entonces para cualquier función real g ,  E (g(X )) = Pxi2RX

g(xi) p(xi).

(b)  Si  X  es una v.a . continua con  f:d:;  f ; entonces para cualquier función

real g , E (g(X )) =Z  11

g(x)f X (x)dx.

Ejemplo 1:   Sea  X   el número de águilas que aparecen cuando se lanzandos monedas. Calcular  E (X 2).

71

Page 72: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 72/94

Solución:

Sabemos que   RX   = f0;   1;   2g   con   P (X   = 0) = 1=4,   P (X   = 1) = 1=2,P (X  = 2) = 1=4.

Sea Y   = X 2,entonces  RY   = f0; 1; 4gP (X  = 0) = 1=4,P (X  = 1) = 1=2,P (X  = 2) = 1=4,por el Teorema,

E (Y ) = 0  1

4 + 1  1

2 + 4  1

4

= 3

2

Ejemplo 2: Si   X   esta distribuida uniformemente sobre   (0;   1), calcularE (eX ).

Solución:

E (eX ) =

Z  11

exf (x)dx =

Z   10

exdx =  e 1.

Ejemplo 3: El tiempo semanal que un despacho de contabilidad usa unaunidad procesadora central (CPU) tiene una función de densidad (medidad en

horas) dada por  f (x) =

  364

x2(4 x);   0 x 40; otros

  Usar la CPU le cuesta al

despacho $200 la hora. Calcula el valor esperado del costo semanal del tiempode uso de la CPU.

Solución:X  =tiempo de uso semanal de la CPUC  =costo semanal de uso de la CPUC  = 2000X ) E (C ) =

R 11 2000xf (x)dx

=R 40

 (2000x)  364

x2(4 x)

dx

=   3754

R 40

  x3(4 x)dx

=   3754

x4   x5

5

40  = $4800

3 Variables aleatorias bidimensionales

Hay una gran cantidad de situaciones en la vida real en donde lo que se requierees estudiar variables aleatorias bidimensionales. Por ejemplo: 1) Cuando sequiere estudiar la relación entre el peso y la altura de los estudiantes de laUADY, 2) Cuando se administran diferentes cantidades de una droga para elcatarro a dos grupos de pacientes para estudiar la frecuencia de catarro durante

72

Page 73: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 73/94

el año, 3) Cuando se pretende analizar las cali…caciones en cálculo I y II de losalumnos de la facultad.

En todos los casos se tiene interés en una pareja (  X  ,  Y ) de variables aleato-rias. Esta pareja es también una variable aleatoria que se denomina variablealeatoria bidimensional  o   bivariada  y la densidad que le corresponde sele llama   densidad conjunta. Su distribución, es denominada distribuciónconjunta.

3.1 Distribuciones conjuntas discretas

De…nición:   Sean  X; Y   v.a . discretas. La función masa de probabilidadconjunta de la v.a .   (X; Y ), es una función  p  : R2 ! R tal que:

a)   p(x; y) 0; 8(x; y) 2 R2.

b)   Existe un conjunto …nito o in…nito numerable C  tal que p(x; y) = 0 si (x; y)  =2C  y

XC 

 p(x; y) = 1.

Sean X; Y   v.a . discretas tales que el rango X  Y   es RXY   = f(x1; y1); (x2;

y2); (x3; y3); :::; gde…nimos p  :  R2 ! R por

 p((x; y)) =  P (X  = x; Y   = y), si  (x; y) 2 RXY  , y p((x; y)) = 0 si  (x; y)  =2 RXY 

entonces p cumple las propiedades para ser una función masa de probabilidadconjunta de la v. a. discreta  (X; Y ):

¿Cómo se calculan las probabilidades para cualquier  B   R2? A partir dela función masa de probabilidad conjunta:

Si B  R2

P  ((X; Y ) 2 B) =  P(xi;yi)2B

 p(xi; yi)

 p(xi; yi) =  P (X  = xi; Y   = yi) =  P  ((X; Y ) = (xi; yi))Ejemplo:   Supongamos que  X  es una v.a . con recorrido  RX   = f1;  2;  3g  y

que  Y   es una v.a . con recorrido  RY   = f1;  2;  3;  4g. La  f d conjunta de  X   e  Y está dada por:

x  y 1 2 3 4

1 0:1 0 0:1 02 0:3 0 0:1 0:23 0 0:2 0 0

Determinar:a)  P (X   2; Y   2)b)  P (X  = 1).Solución:

a)

73

Page 74: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 74/94

P (X   2; Y   2) = P (2;   2) + P (2;   3) + P (2;   4) + P (3;   2) + P (3;   3) + P (3;   4)

= 0 + 0:1 + 0:2 + 0:2 + 0 + 0= 0:5

b)P (X  = 1) = P (X  = 1; Y  = 1) + P (X  = 1; Y  = 2) + P (X  = 1; Y  = 3) + P (X  = 1; Y   = 4)

= 0:1 + 0 + 0:1 + 0

= 0:2

3.2 Distribuciones conjuntas continuas

De…nición:   Sean  X; Y   v.a . continuas. La  función de densidad conjuntade  X   e  Y  es una función  f   : R2

!R tal que:

a)  f (x; y) 0; 8(x; y) 2 R2:

b)Z  11

Z  11

f (x; y)dxdy = 1:

A partir de la función de densidad conjunta se calcula la probabilidad paratoda  B 2 R2 :

P ((X; Y ) 2 B) =

ZZ B

f (x; y)dxdy.

Notar!!P ((X; Y ) 2 f(x; y)g   = P (X  =  x; Y   = y)

= Z Z f(x; y)g

f (x; y)dxdy

= 0En general, cualquier punto o cualquier conjunto …nito o in…nito numerable

en el plano tiene probabilidad cero.

* También, cualquier curva unidimensional en el plano xy tiene probabilidadcero. Por lo tanto la probabilidad de que  (X; Y ) pertenezca a cualquier recta ocircunferencia en el plano, es cero.

Ejemplo 1:  Suponga que la  f d conjunta de  X  e Y   es

f (x; y)=

(  cx2y; si x2 y < 1

0;   de otro modo

a) Determinar la constante c.b) Hallar P (X   Y ).

Solución:

a)

74

Page 75: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 75/94

Z  1

1Z  1

1

f (x; y)dxdy   = 1

=

Z   11

Z   1x2

cx2ydydx

=  4

21c ) c =

 21

4

b)

P (X   Y ) =

Z   10

Z   x

x2

21

4 x2ydydx

=  3

20Ejemplo 2:  Supóngase que la variable aleatoria bidimensional  (X; Y ) tiene

f d conjunta dada por f (x; y) =   x2 +   xy3   0 x 1;   0 y  2

0;   para cualquier otro punto

  :

Sea B  = fX  + Y   1g : Calcular  P (B):Solución:Puede ser calculado así P (B) =

R 21

R 10

x2 +   xy

3

dxdy +

R 10

R 11y

x2 +   xy

3

dxdy =   65

72  = 0:90277o bien,1 P (B) =

R 10

R 1y

0

x2 +   xy

3

dxdy  = 1   7

72  =   6572

De…nición:  Decimos que una v.a . continua bidimensional está distribuidauniformemente en una región R  si:

f (x; y) =8><>:

1

area(R); si   (x; y) 2 R

0;   de otro modo

Ejemplo:   Un punto   (X; Y )  se selecciona aleatoriamente del interior delcírculo x2 + y2 = 9. Determinar la  f:d: conjunta de X  e  Y .

Solución:

f (x; y) =

(   1

area de C   para (x; y) 2 C 

0   en otro caso:

pero el área de  C  = 9;entonces

f (x; y) =8<:

1

9

; si   (x; y)

2C 

0;   de otro modo:

75

Page 76: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 76/94

3.3 La  f:d:a: de una variable aleatoria bivariada

De…nición:  La  función de distribución acumulada conjunta  de dos  v.a .X  e  Y , se de…ne como la función  F  tal que para todo valor  x; y;F (x; y) =  P (X   x; Y   y), 1 < x; y < 1.

Notar  que si  X   e  Y   son v.a . continuas con  f d conjunta  f   y  f da conjunta

F , entonces,F (x; y) = P (X   x; Y   y)

=

Z   x

1

Z   y

1f (u; v)dvdu

de donde, la  f  se puede obtener de  F  mediante la relación

) f (x; y) = @ 2F (x; y)

@y@x  , en todos los (x; y) donde exista la derivada.

Ejemplo:  Suponga que X  e  Y   son v.a . que solamente pueden tomar valoresen los intervalos 0 X   2, 0 Y   2. Suponga también que la f:d:a: conjuntade  X  e  Y   para  0 X   2, 0 Y   2 es la siguiente:

F (x; y) =  1

16xy(x + y).

Determinar la f:d: conjunta de  X  e Y  .

Solución:

f (x; y) =

8>><>>:

@ 2

 1

16xy(x + y)

@y@x  ;   0

x; y

 2

0   otros

=   18(x + y);   0 x; y  2

0;   otros

3.4 Distribuciones marginales

Con cada variable aleatoria bidimensional  (X; Y ) están asociadas dos variablesaleatorias unidimensionales: la v. a.   X  y la v. a.   Y . De este modo, podemos in-teresarnos por la distribución de probabilidades de X  o por la de Y , únicamente.Veamos cómo a partir de la conjunta  f   se pueden obtener estas distribucionesf X  y f Y ; a las cuales se les denomina marginales de  X  e Y , respectivamente.

  Con  X , Y   v.a. discretas:

f X (x) = P (X  = x)= Py2RY 

P (X  =  x; Y   = y)

= Py2RY 

 p(x; y)

análogamente

76

Page 77: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 77/94

f Y  (y) = P (Y   = y)

= Px2RX P (X  =  x; Y   = y)

= Px2RX

 p(x; y)

  Con  X , Y  v.a. continuas:

f X (x) =

Z  11

f (x; y)dy

f Y  (y) =

Z  11

f (x; y)dx:

Ejemplo 1:  Supongamos que la  f:d: conjunta de  X  e  Y   es:

f (x; y) =8<:

21

4  x2

y; si x2

y  1

0;   de otro modo

Determinar las marginales de  X  y de Y , es decir,  f X , y f Y  .

Solución:

f X (x) =

Z  11

f (x; y)dy

=

Z   1x2

21

4 x2ydy;   1 < x <  1

= 21

4

 x2Z   1

x2

ydy;

  1 < x <  1

= 21x2 21x6

8  ;   1 < x < 1

f Y  (y) =

Z  11

f (x; y)dx

=

Z p yp y

214

 x2ydx;   0 < y < 1

=   214

 y

Z p yp y

x2dx;   0 < y < 1

=   72y5=2;   0 < y < 1

Si se conocen  f X   y  f Y  no necesariamente es posible reconstruir a partir deellas a la conjunta de  X  e  Y , pues solas no necesariamente proporcionan algunainformación acerca de la relación entre  X  e  Y .

También es cierto que si se conoce la  f da conjunta F  de dos variables aleato-rias   X ,   Y , se pueden obtener   las   f da   marginales   F X   y   F Y ;   para   X   e   Y respectivamente. Veamos cómo:

77

Page 78: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 78/94

Para 1 < x < 1;F X (x) = P (X 

 x)

= limy!1

P (X   x; Y   y)

= limy!1

F (x; y)

Análogamente, si 1 < y < 1F Y  (y) = lim

x!1P (X   x; Y   y)

= limx!1

F (x; y)

3.5 Propiedades de las distribuciones bidimensionales cuandoX   e  Y   son independientes

Ya hemos visto que dos variables aleatoria X  e  Y  son independientes , P (X  2A,  Y  2 B) =  P (X  2 A) P (Y  2 B).

Así que, si  X   e  Y   son variables aleatorias independientes, en particular setiene queF (X; Y ) =  P (X   x; Y   y) =  P (X   x)  P (Y   y) =  F X (x) F Y  (y)   (*)

Pues bien, se puede demostrar el recíproco, esto es, que si (*) se satisfacepara todos los valores de  x  e  y , entonces  X  e Y   son independientes.

Entonces tenemos queX  e  Y   son independientes , F (X; Y ) =  F X (x) F Y  (y)

Pero,  F (X; Y ) =  F X (x) F Y  (y) , f (x; y) =  f X (x)f Y  (y); 8x;y:Así en resumen, se tiene que

X   e   Y   son independientes ,   F (X; Y ) =   F X (x)   F Y  (y)  ,   f (x; y) =f X (x)f Y  (y); 8x;y:

Ejemplo 1:  Supóngase que se toman dos medidas independientes  X   e  Y de la lluvia durante un período de tiempo en una localidad, y que la   f:d:  decada medida (es una v.a .) es la siguiente:

g(x) =

(  2x; si   0 x 1

0;   de otro modo

Determinar P (X  + Y   1).

Solución:

Como las medidas son independientes, entonces la conjunta de  X  e  Y   es

f (x; y) =

(  4xy ; si   0 x; y  1

0;   de otro modo

78

Page 79: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 79/94

)   P (X  + Y   1) = ZZ R

f (x; y)dxdy

)   P (X  + Y   1) =

Z   10

Z   1x

0

4xydydx = 1

6Ejemplo 2:  Usando las v.a .   X  e Y   con f (x; y) dado por la siguiente tabla,

¿las v.a .   X  e  Y   son independientes?.

x  y 1 2 3 4

1 0:1 0 0:1 02 0:3 0 0:1 0:23 0 0:2 0 0

Solución:

Sólo tenemos que checar si   p(x; y) =   pX (x)  pY  (y)   para cualquier pareja(x; y): Veamos.

 p(1; 3) = 0:1;  pX (1) = 0:2;  pY  (3) = 0:3)  p(1; 3) 6= pX (1)  pY  (3):Por tanto, las v.a . no son independientes.

Teorema:   Si   X   e   Y   son  v.a . que tienen una distribución bidimensionalcontinua con f:d: conjunta f , entonces X  e  Y  serán independientes , se puederepresentar en la siguiente forma para 1 < x; y < 1:

f (x; y) =  g1(x)g2(y)Donde g1 es una función no negativa de  x  solamente, y g2 es una función no

negativa de y   solamente.

Notar!!!  Que si f (x; y) =  g1(x)g2(y))   f X (x) =

R 11 f (x; y)dy   =

R 11 g1(x)g2(y)dy   =   g1(x)

R 11 g2(y)dy   =

cg1(x)esto es, la marginal de X  es un múltiplo de g1(x): Análogamente, la marginal

de  Y  es un múltiplo de  g2(y):

Ejemplo 3: Supóngase que la función de densidad conjunta de dos  v.a .   X e  Y  es la siguiente:

f (x; y) =

(  ke(x+y); si x 0, y  0

0;   de otro modo

a) Determinar si las v.a . son independientes.

b) Determinar las f:d: marginales.

Solución:

a) De…namos las siguientes funciones

79

Page 80: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 80/94

g1(x) = (  kex; si x 0

0;   de otro modoy

g2(y) =

(  ey; si y  0

0;   de otro modo

) g1(x)g2(y) =

(  ke(x+y); si x 0, y  0

0;   de otro modo

= f (x; y)

Por lo tanto, las v.a.   X  e  Y   son independientes.

b) Ahora hallemos las marginales:

f X (x) = cg1(x)

=

(  ckex; si x 0

0;   de otro modo

ComoZ  11

f X (x)dx  = 1 )Z  10

ckexdx  = 1 )= ckexj10   = 1 )  ck  =

1 ) c =   1k

) f X (x) =

(  ex; si x 0

0;   de otro modo  ; esto es X  s exp(1)

Análogamente se halla la marginal de  Y .

3.6 Distribuciones Condicionales

* Supongamos que   X   e  Y   son  v.a . discretas, con   fd   conjunta  p. Sean  pX   y

 pY  , sus respectivas marginales. Si ya se ha observado el valor y  de la variablealeatoria Y , entonces,

P (X  =  x j Y   = y) = P (X  =  x; Y   = y)

P (Y   = y)

= p(x; y)

 pY  (y)

análogamente

P (Y   = y j X  = x) = P (X  =  x; Y   = y)

P (X  =  x)

= p(x; y)

 pX (x)

80

Page 81: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 81/94

Teorema:  Sea p1(x j y) = p(x; y)

 pY  (y)  ,  p1  es la  f:d: de la v.a .   X  j Y   = y.

Sea p2(y j x) = p(x; y)

 pX (x)  , p2  es la  f:d: de la v.a .   Y  j X  =  x

Ejemplo: En la siguiente tabla, hallar la  f:d: condicional de  Y  j X  = 2.

x  y 1 2 3 4

1 0:1 0 0:1 02 0:3 0 0:1 0:23 0 0:2 0 0

Solución:

 p2(y j 2) =  p(2; y) pX (2)

  =  p(2; y)0:6

  ,   y = 1;  2;  3;  4

P (Y   = 1 j X  = 2) =  p2(1 j 2) = p(2;   1)

0:6  =

 0:3

0:6 = 0:5

P (Y   = 2 j X  = 2) =  p2(2 j 2) = p(2;   2)

0:6  =

  0

0:6 = 0

P (Y   = 3 j X  = 2) =  p2(3 j 2) = p(2;   3)

0:6  =

 0:1

0:6 = 0: 16667

P (Y   = 4 j X  = 2) =  p2(4 j 2) = p(2;   4)

0:6  =

 0:2

0:6 = 0:333:

* Sean ahora  X  e Y  v.a. continuas con f d conjunta f  y marginales  f X ; f Y ;

respectivamente.Supongamos que ya se observó  Y   = y. No podemos aplicar la de…nición de

la condicional como en el caso discreto porque  P (Y   = y) = 0:Lo que se hace es extender la expresión que ya se tiene para el caso discreto.Def.: Sea  y  un valor tal que   f Y  (y)  >  0:  Entonces la  f d  condicional de

X   dado   Y   =   y   se de…ne como   g1(x j   y) =  f (x; y)

f Y  (y)  para 1   < x < 1:

Análogamente,  g2(y j x) = f (x; y)

f X (x)  es la f:d: condicional de la v.a .   Y  j X  = x.

Ejemplo:  Suponga que la  f:d: conjunta de X  e  Y   es

f (x; y) =8<:

21

4

 x2y; si x2

y

 1

0;   de otro modo

a) Determinar la  f:d: condicional de  Y  j X  = x:

b) Determinar  P 

Y    3

4 j X  =

 1

2

.

81

Page 82: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 82/94

Solución:

a)  g2(y j x) =  f (x; y)f X (x)

  ; calculando  f X (x) obtenemos:

f X (x) =

8<:

21

8 x2(1 x4); si x2 1

0;   de otro modo

por tanto g2(y j x) =

8<:

2y

1 x4; si x2 y  1

0;   de otro modo:

b)

P Y 

  3

4 jX  =

 1

2   = Z 

 1

1g2(y

 j  12)dy

=

Z   134

2y

15=16dy

=  7

15

3.7 Funciones de dos variables aleatorias

A partir de la f d conjunta de variables aleatorias  X  e  Y; pretenderemos en estasección determinar la distribución de una función de esa dos variables, o sea, ladistribución de una variable aleatoria de la forma  Z  =  H (X; Y ).

En particular se pondrá especial interés en la distribución de las variablesaleatorias, X  + Y , X  Y , max(X; Y ) y  m{n(X; Y ).*Cuando X  e  Y  son variables aleatorias discretas.Ejemplo 1: Dos líneas de producción manufacturan cierto tipo de artículos.

Supóngase que la capacidad en cualquier día dado es de 5 artículos para la línea1 y 3 artículos para la línea 2. Supóngase que el número verdadero de artículosproducidos por cada una de las líneas es una  v.a . bidimensional  (X; Y ) dondeX   =número de artículos producidos por la línea 1 y  Y   =número de artículosproducidos por la línea 2. La siguiente tabla proporciona la conjunta de  X  y  Y :

Y  X 0 1 2 3 4 5

0 0 0:01 0:03 0:05 0:07 0:091 0:01 0:02 0:04 0:05 0:06 0:08

2 0:01 0:03 0:05 0:05 0:05 0:063 0:01 0:02 0:06 0:06 0:06 0:05

a) Sea  U  = min(X; Y ). Hallar la distribución de  U .

b) Sea  Z  =  X  + Y . Hallar la distribución de  Z .

82

Page 83: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 83/94

Solución:

a)  RU  = f0;  1;  2;  3gP (U  = 0) = P (min(X; Y ) = 0)

= P (X  = 0 o  Y   = 0)

= P (X  = 0) + P (Y   = 0) P (X  = 0; Y   = 0)

= 0:3 + 0:25 0

= 0:28

P (U  = 1) = P (min(X; Y ) = 1)

=3

Pi=1P (X  = 1, Y   = i) +

5

Pj=1P (X  = j; Y   = 1) P (X  = 1; Y   = 1)

= 0:07 + 0:25 0:02

= 0:3

análogamente obtenemosP (U  = 2) = 0:25P (U  = 3) = 0:17.

b)  Z  =  X  + Y , RZ  = f0;  1;  2;  3;  4;  5;  6;  7;  8gP (Z  = 0) = P (X  + Y   = 0)

= P (X  = 0; Y   = 0)

= 0

P (Z  = 1) = P (X  + Y   = 1)

= P (X  = 0; Y  = 1) + P (X  = 1; Y   = 0)

= 0:02

P (Z  = 2) = P (X  + Y   = 2)

=2P

i=0P (X  = i; Y   = 2 i)

En general

P (Z  =  k) =k

Pi=0P (X  = i; Y   = k i),   k  = 0;  1; :::;  8

La función generadora de momentos también puede ser usada para deter-minar la distribución de una función de dos variables aleatroria. Se mostrarácómo a través de los siguientes ejemplos.

Ejemplos:1. Sean X , Y  variables aleatorias independientes tales que X  s Binomial(n1; p)

y  Y   s Binomial(n2; p): ¿Cómo se distribuye  X  + Y ?

83

Page 84: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 84/94

Page 85: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 85/94

La idea general es la siguiente.Sean X  e Y  variables aleatorias continuas.

*Se tiene  Z  =  H 1(X; Y ). Lo que se quiere es determinar  f Z :*Se introduce una segunda variable  W  = H 2(X; Y ):*Se obtiene la conjunta  f Z;W :*Se calcula  f Z (z) =

R 11 f Z;W (z; w)dw

Dos preguntas que surgen inmediatamente del proceso anterior son:¿Cómo se elige la v.a.   W ? ¿Cómo encontrar la conjunta de  Z  y  W ?Bueno, la v.a.   W  la escogemos de la manera más sencilla posible pues a …nal

de cuentas sólo es un intermediario para llegar a  f Z : Frecuentemente resulta útiltomar W   = X  o  W  = Y .

La segunda pregunta es bastante razonable pues en apariencia un problemade hallar la f d de una variable aleatoria unidimensional lo estamos convirtiendoen uno de hallar la  f d de una bivariada!! Efectivamente, es mucho más difícilhallar el de una bivariada, afortunadamente el Cálculo nos proporciona resul-tados al respecto que eliminan la di…cultad. Estos resultados se expresan en elsiguiente teorema.

Teorema:   Suponga que   (X; Y )  es una  v.a . bidimensional continua conf:d:   conjunta  f . Sea  Z   =  H 1(X; Y )  y  W   =  H 2(X; Y ), y supongamos que lasfunciones H 1  y  H 2  satisfacen las condiciones siguientes:

a)  Las ecuaciones  z  =  H 1(x; y) y  w  = H 2(x; y)  tienen solución única parax e  y  en función de  z  y  w, digamos que  x  =  G1(z; w), y  =  G2(z; w).

b)Las derivadas parciales  @x

@z,

  @x

@w,

  @y

@z,

  @y

@w, existen y son continuas. En-

tonces la función de densidad conjunta  f Z;W   de  (Z; W ) está dada por

f Z; W (Z; W ) =  f (G1(z; w); G2(z; w))

jJ (z; w)

j

en donde  J (z; w) =

@x

@z

@x

@w

@y

@z

@y

@w

Ejemplo:  Supóngase que tenemos un circuito en el cual varian de un modo

aleatorio la corriente I  y la resistencia  R. Supóngase especí…camente que  I  y Rson variables aleatorias continuas independientes con la siguiente  f d

I :   g(i) = 2i; 0 i 1

R:   h(r) =   r2

9 ;  0 r 3Es de interés la variable aleatoria  E  =  I R (el voltaje en el circuito), deter-

mina su densidad.

Solución:E  =  I RSea W   = I Tenemos entonces las ecuaciones

e =  irw =  i

)   i =  w

r =   ew

85

Page 86: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 86/94

jJ (e; w)j = abs @r@e

@r@w

@i@e

@i@w = abs

1w

ew2

0 1 = 1w

Entoncesf E;W (e; w) =   g(w)h(  ew )

1w

;   0 w 1; 0   ew  3

= (2w)(   e2

9w2 )( 1w );   0 w 1; 0 e 3w

=   29

e2

w2 ;   0 w 1; 0 e 3wDe donde,

f E (e) =

1Z e=3

29

e2

w2 dw;   0 e 3

=   29

e21Z 

e=3

1w2 dw;   0 e 3

=   29e2 w1

1 1e=3  ;   0

e

3

=   29e2(1   3

e );   0 e 3=   2

9e(3 e);   0 e 3

3.7.1 Suma de dos variables aleatorias

Suponga que  X  e Y   son dos v.a . con  f:d: conjunta f . Determinar la  f:d: de lav.a .   Z  =  X  + Y .

Solución:

Sea W   = X   entoncesZ  =  X  + Y 

W   = X 

z  =  x + y

w =  x)

x =  w

y =  z wy  J (z; w) =

0 1

1   1

= 1

entonces, la  f:d: es  f Z; W   = f (w; z w)

por tanto

f Z (z) =

Z  11

f (w; z w)dw.

Ahora, si hacemos W   = Y   entonces

Z  =  X  + Y 

W   = Y 

z  =  x + y

y  =  x

)x =  z w

y =  w

y  J (z; w) = 0   1

1 1 = 1

entonces, la  f:d: es  f Z; W   = f (z w; w)

por tanto

f Z (z) =

Z  11

f (z w; w)dw.

86

Page 87: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 87/94

Fórmulas de Convolución   Si  Z  = X  + Y   y  X  e  Y   son independientes confunciones de densidad   f X   y   f Y   respectivamente, entonces   f (x; y) =   f X (x)

f Y  (y); de donde

f Z (z) =

Z  11

f X (w)f Y  (z w)dw

f Z (z) =

Z  11

f X (z w)f Y  (w)dw

A estas fórmulas se les llama Convolución de  f X  y f Y   respectivamente.

Ejemplo 1:   Sean   X 1   y   X 2   v.a . independientes, ambas distribuidas uni-formemente en el intervalo  (0;  1).

(a) Hallar la función de densidad de X 1 + X 2:

Solución:  Sea Z  =  X 1 + X 2

Por las fórmulas de convolución

f z(z) =

Z  11

f X (w)f Y  (z w)dw;   0 < w < 1; 0 < z w < 1

=

8<:

Z   z

0

dwR 1z1

dw;

  0 < z < 11 < z < 2

=

  z;2 z;

0 < z < 11 < z < 2

(b) Sean Y 1  =  X 1+X 2, Y 2  =  X 1X 2. Hallar la función de densidad conjunta

de Y 1  y Y 2.

Solución:Tenemos que

y1  =  x1 + x2; y2  =  x1 x2

)   x1  = y1 + y2

2  ; x2  =

 y1 y22

) jJ (y1; y2)j = abs

12

12

12   1

2

= abs1

2

=

12

) f Y 1; Y 2(y1; y2) = f 

y1 + y2

2  ;

  y1 y22

 1

2

=8<:

1

2 ; si   0  y1 + y2

2   1;   0  y1

y2

2   10;   de otro modo

=

8<:

1

2; si   0 y1 + y2  2;   0 y1 y2  2

0;   de otro modo

87

Page 88: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 88/94

Ejemplo 2: Sean  X  e  Y   v.a . independientes e idénticamente distribuidas,con f:d: común dada por

f (x) =

(  ex; si x 0

0;   de otro modo

Determinar la función de densidad de la  v.a .   X  + Y .

Solución:

1. Sea  f  la conjunta de  X  e Y : Entonces,

f (x; y) =

  e(x+y); x 0; y  0

0; otros casos

Sea W  = X   entonces

Z  =  X  + yW  = X 

z =  x + yw =  x

  ) x =  w

y =  z wy  J (z; w) =

0 1

1   1

= 1

entonces, la f:d: es  f Z; W   = f (w; z w) =  ez; w 0; z w 0

Por tanto

f Z (z) =

Z   z

0

ezdw =  zez,  z  0

Como en el caso de dos variables aleatorias discretas, la función generadorade momentos también puede ser usada para determinar la distribución de unasuma de dos (o más) variables aleatorias continuas. Se mostrará cómo a travésde los siguientes ejemplos.

Ejemplos:1. Si   X   s   N (1; 2

1)   y   Y    s   N (2; 22)   y   X; Y   son variables aleatorias

independientes, hallar la distribución de  X  + Y:2. Si X  s N (1; 2

1) , hallar la distribución de  aX; donde a 2 R:3. Si   X   s   N (1; 2

1)   y   Y    s   N (2; 22)   y   X; Y   son variables aleatorias

independientes, hallar la distribución de  aX  + bY , donde a; b 2 R:4.   X  s exp() y Y   s exp() y X; Y   son variables aleatorias independientes,

hallar la distribución de  X  + Y:5.   X  s k1  y  Y   s k2  y  X; Y   son variables aleatorias independientes, hallar

la distribución de X  + Y:

3.8 Vector de Medias y Matriz de Covarianzas3.8.1 Vector de Medias

La media de la variable aleatoria bidimensional  (X; Y ), también llamado vectoraleatorio, está dado por:

88

Page 89: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 89/94

XY 

=

E(X)E(Y )Ejemplos:

1. Para la variable aleatoria (X   ,   Y )  cuya función masa de probabilidadconjunta está dada por:

Y  X 0 1 2 3 4 5

0 0 0:01 0:03 0:05 0:07 0:081 0:01 0:02 0:04 0:05 0:06 0:072 0:01 0:03 0:05 0:05 0:05 0:063 0:01 0:02 0:06 0:06 0:06 0:05

determinar el vector de medias.Solución:Hallemos  E (X ) y  E (Y ):E (X ) = 0 P (X  = 0)+ 1 P (X  = 1)+ 2 P (X  = 2)+ 3 P (X  = 3)+4 P (X  =

4) = 0:08 + (2)(0:18) + (3)(0:21) + (4)(0:24) + (5)(0:26) = 3:33

E (Y ) = 0 P (Y   = 0) + 1 P (Y   = 1) + 2 P (Y   = 2) + 3 P (Y   = 3) =0:25 + (2)(0:25) + (3)(0:26) = 1:53Por tanto el vector de medias esE 

XY 

=3:331:53

2. Para la variable aleatoria (X   ,  Y ) cuya función de densidad de conjunta

está dada por:

f (x; y) =

8<:

21

4 x2y; si x2 y  1

0;   de otro modo

Determinar el vector de medias.

3.8.2 La Covarianza

La covarianza entre dos variables aleatorias X  e  Y  es una medida numérica dela variación conjunta entre las dos v.a. Se de…ne por

Cov(X; Y ) =  E [(X  X )(Y   Y  )]

en donde  X  = E (X ) y  Y   = E (Y ).Intuitivamente decimos que X  e  Y  varían en la misma dirección, si es alta la

probabilidad de que valores grandes de  X  estén asociados con valores grandesde   Y  y de que valores pequeños de   X  estén asociados con valores pequeñosde  Y . En tales casos, ambos valores de las desviaciones  X   X ,  Y   Y   sonpositivos o negativos con probabilidad alta, entonces   (X 

  X )(Y 

  Y  )   es

predominantemente positivo de donde se obtendría que C ov(X; Y ) es positivo.Análogamente, si X  e Y  varían en direcciones opuestas, valores de  X  X  vana estar frecuentemente asociados con valores negativos de  Y   Y  . El productoes entonces predominantemente negativo y el valor esperado correspondientees negativo. En este sentido, el signo de  Cov(X; Y )  re‡eja la dirección de la

89

Page 90: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 90/94

relación entre  X   e   Y . También, la magnitud de   Cov(X; Y )  puede ser usadocomo indicador de la fuerza de la relación entre  X  e Y  .

Como la C ov(X; Y ) es una esperanza no necesariamente existe, sin embargose puede probar que si  2

X  < 1 y  2Y   < 1, entonces existe C ov(X; Y ).

Algunas propiedades relacionadas con la Covarianza

1. Para cualesquiera v.a.   X   e   Y   tal que   2X   < 1   y   2

X   < 1,   Cov(X;Y ) =  E (XY ) E (X )E (Y ).

Demostración:

Cov(X; Y ) = E [(X  X )(Y   Y  )]

= E [(XY   XY   Y X + X Y  )]

= E (XY ) X Y   X Y   + X 6Y 

= E (XY ) E (X )E (Y )

Notar:   Si   X   e   Y   son   v.a . independientes con varianza …nita, entoncesE (XY ) =  E (X )E (Y ), y por tanto  C ov(X; Y ) = 0.

2.   Si X  e  Y   son v.a . con varianza …nita, entoncesV ar(X  + Y ) =  V ar(X ) + V ar(Y ) + 2Cov(X; Y ).

Demostración:

V ar(X  + Y ) = E f[(X  + Y ) (X + /Y  )]2g= E f[(X  X ) + (Y   /Y  )]2g= E [(X  X )2 + (Y   /Y  )

2 2(X  X )(Y   /Y  )]

= V ar(X ) + V ar(Y ) 2Cov(X; Y )3.   Cov(X; Y ) =  C ov(Y; X )4.   Cov(X; X ) =  V ar(X )5.   Cov(aX; bY ) =  abCov(X; Y )

3.8.3 El Coe…ciente de Correlación

La correlación o coe…ciente de correlación, permite medir la asociación linealentre dos variables aleatorias. La diferencia entre correlación y covarianza, esque el valor de  C ov(X; Y ) depende de las unidades de medición asociadas conX  e  Y , en tanto que la correlación no depende de éstas unidades de medición.

90

Page 91: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 91/94

De…nición:   Sean   X   e   Y   v.a . con varianza …nita,   2X   < 1  y   2

Y    < 1,entonces  el coe…ciente de correlación entre  X   e  Y  está dado por:

Corr(X; Y ) =  (X; Y ) =  Cov(X; Y )X Y 

,

donde  X  es la desviación estándar de  X  y   Y  es la desviación estándar deY .

Teorema: 1 (X; Y ) 1.

Comentarios:

 Se dice que  X  e  Y  están correlacionados positivamente si  (X; Y ) >  0.

 Se dice que  X  e  Y  están correlacionados negativamente si  (X; Y ) <  0.

 Se dice que  X  e  Y  no están correlacionados si  (X; Y ) = 0.

 Notar que  C ov(X; Y ) y  (X; Y ) deben tener el mismo signo.

El valor de  (X; Y ) proporciona una medida del grado en que dos v.a .   X  eY  están linealmente relacionadas.

Si la distribución conjunta de   X   e   Y   en el plano   xy   está relativamenteconcentrada alrededor de una recta que tiene pendiente positiva, entonces  (X;Y ) generalmente estará cerca de  1.

Si está concentrada alrededor de una recta que tiene pendiente negativa,entonces  (X; Y ) generalmente estará cerca de 1.

Si  X  e  Y   son v.a . independientes, entonces (X; Y ) = 0, pero lo contrario

no necesariamente es cierto.Ejemplo:   Si   X   es una  v.a . que puede tomar únicamente los tres valores1, 0 y 1 y cada uno de éstos tres valores tiene la misma probabilidad cuandoconsideramos la v.a .   Y   = X 2, es claro que  X  e  Y  no son independientes, perocumplen que:

E (XY ) =  E (X 3) =  E (X ) = 0

)   Cov(X; Y ) =  E (XY ) E (X )E (Y ) = 0

)   (X; Y ) = 0

Nota:    mide la relación lineal entre   X   e   Y . Si    t   1  ó    t 1 )   larelación entre X  e  Y  es muy fuerte, esto es, los valores están más cerca de unalínea recta.

91

Page 92: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 92/94

3.8.4 La matriz de covarianzas

De…nición: Sea  (X; Y )  una variable aleatoria bidimensional tal que  V ar(X ) <1 y  V ar(Y ) < 1:La matriz de covarianzas de (X,Y)  E f[X  E (X )] [X  E (X )]g   E f[X  E (X )] [Y   E (Y )]g

E f[Y   E (Y )] [X  E (X )]g   E f[Y   E (Y )] [Y   E (Y )]g

=

  Cov(X; X )   Cov(X; Y )

Cov(Y; X )   Cov(Y; Y )

  V ar(X )   Cov(X; Y )Cov(Y; X )   V ar(Y )

Notar: la matriz de covarianzas es una matriz simétrica

3.8.5 La Normal Bivariada

Sea   (X; Y )   una variable bidimensional continua. Decimos que   (X; Y )   tienedistribución normal bivariada si su función conjunta está dada por:

f (x; y) =   1

2 X   Y p 12

exp  1

2(1

2) xXX

2

2 (xX)(yY  )

X   Y + yY 

Y  2

Donde

X  es la media de la variable aleatoria  X  y   X  es su desviación estándarY  es la media de la variable aleatoria  Y   y   Y  es su desviación estándar

 es el coe…ciente de correlación de  X  e  Y 

Se denota (X; Y ) s N (! ; ), donde !   =

XY 

y  =

  V ar(X )   Cov(X; Y )Cov(Y; X )   V ar(Y )

:

También se cumple lo siguiente:

  X  s N (X ; 2X )

  Y   s N (Y ; 2Y  )

  Si   = 0; entonces X  e Y   son independientes.   X jY   = y  s N 

X + X

Y (y Y  ) ; 2

X (1 2)

  Y jX  =  x s N 

Y   + Y X

(x X ) ; 2Y  (1 2)

4 Descripción de Datos Mediante Métodos Grá-…cos y Numéricos

La estadística es el lenguaje universal de la ciencia. Como usuarios potenciales

de la estadística, es necesario dominar la "ciencia" y el "arte" de utilizar cor-rectamente su metodología. El empleo cuidadoso de los métodos estadísticospermite obtener información precisa de los datos. Estos métodos incluyen:

1. De…nir cuidadosamente la situación.

2. Recolectar datos.

92

Page 93: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 93/94

3. Resumir con precisión los datos. Y,

4. Obtener y comunicar las conclusiones importantes.En el curso principalmente se hablará de 3 y un poco de 4.La estadística implica información, números y grá…cas para resumir la infor-

mación recolectada y para su interpretación.El terreno de la estadística puede dividirse a grandes rasgos en dos áreas: la

estadística descriptiva y la estadística inferencial.La estadística descriptiva es en lo que piensa la mayoría de las personas

al escuchar l apalabra estadística.   La estadística descriptiva incluye larecolección, presentación y descripción de datos muestrales.

La estadística inferencial se re…ere a la interpretación de los valoresresultantes de las técnicas descriptivasy a la toma de decisiones yobtención de conclusiones sobre la población.

Def.:  Estadística  es la ciencia de recolectar, describir e interpretar datos.El uso de la estadística es ilimitado. Es mucho más difícil mencionatr un

campo en el que no se utilice la estadística que uno en el que ésta sea parteintegral.

Ejemplos de uso de la estadística:

 En educación se utiliza a menudo la estadística descriptiva para describirlos resultados de los exámenes.

 En la ciencia es necesario recolectar y analizar los datos que se obtienende los experimentos.

 En el gobierno siempre se recolectan muchos tipos de datos estadísticos,para mostrar los avances o falta de avance en la economía del país.

Una parte muy importante del proceso estadístico es la que corresponde alestudio de los resultados estadísticos y al planteamiento de concluisones idóneas.Estas conclusiones deben comunicarse a otras personas. Nada se obtiene de lainvestigación a menos que los descubrimientos se compartan con la demás gente.En todas partes se reportan estadísticas: periódicos, revistas, televisión. Leemosy escuchamos sobre todo tipo de nuevos resultados de investigación.

4.1 Introducción a los términos básicos

Población:  Es la colección o conjunto de individuos, objetos o eventos cuyaspropiedades serán analizadas.La población es la colección completa de individuos u objetos de interés

para el recolector de la muestra. La idea más importante en estadística es elconcepto de población. La población de interés debe de…nirse cuidadosamentey se considera que está completamente de…nida sólo cuando se especi…ca la lista

93

Page 94: Notas de probabilidad

7/18/2019 Notas de probabilidad

http://slidepdf.com/reader/full/notas-de-probabilidad 94/94

de elementos que pertenecen a ella. Un ejemplo de población es el conjunto de"todos los mexicanos que han asistido alguna vez a una universidad".

Hay dos tipos de poblaciones: …nitas e in…nitas.Ejemplo: Los libros de la biblioteca del campus constituyen una población

…nita; El conjunto de todos los de 40 watts que serán fabricados en el país, esuna población in…nita.

Es difícil estudiar grandes poblaciones por eso se acostumbra seleccionar unamuestra  y estudiar los datos de ésta.

Muestra: Es un subconjunto de la población. Consta de los individuos,objetos o medidas seleccionados de la población de modo que representen ade-cuadamente a la población.

Variable: Característica de interés sobre cada elemento individual de unapoblación o muestra.

Ejemplo: la edad de un estudiante que ingresa a la universidad, el color desu cabello, su estatura y su peso son cuatro variables.

Dato: Valor de la variable asociada a un elemento de una población omuestra. Este valor puede ser un número, una palabra o un símbolo.

Por ejemplo, Juan Pérez ingresó a la universidad a la edad de "23" años,su cabello es "café", mide "1.80" metros y pesa "83" kilogramos. Estas cuatropiezas de datos son los valores de las cuatro variables aplicadas a Juan Pérez.

Básicamente hay dos clases de variables: 1) variables de las que se obtienendatos cualitativos y 2) variables de las que se obtiene datos cuantitativos.

Variable cualitativa, de atributos o categórica: variable que clasi…ca

o describe un elemento de la población.Ejemplo: Una muestra de clientes de un salón de belleza fue cuestionadaen cuanto al "color del cabello", "la colonia en la que viven" y el "nivel desatisfacción" respecto a los resultados del salón de belleza. Las tres variables sonejemplo de variables cualitativas, ya que describe características de la persona.

Algunas operaciones aritméticas como promediar, no tienen sentido paradatos que resultan de una variable cualitativa.