Apuntes Proba

96
´ Indice I Estad´ ıstica Descriptiva 4 1. Introducci´ on 4 1.1. Estad´ ıstica Descriptiva e Inferencial ........................... 4 1.2. Conceptos B´ asicos .................................... 4 1.3. Etapas de una Investigaci´on Estad´ ıstica ......................... 5 2. Muestreo 6 2.1. Conceptos b´ asicos ..................................... 6 2.2. El Muestreo ........................................ 6 2.3. Muestreo Aleatorio Simple ................................ 6 2.4. Muestreo Estratificado .................................. 7 3. Clasificaci´ on de variables 8 3.1. Nominales ......................................... 8 3.2. Ordinales ......................................... 8 3.3. Intervalares ........................................ 8 4. Organizaci´ on de la Informaci´on 9 5. Medidas de Tendencia Central y Dispersi´on 12 5.1. Medidas de Tendencia Central .............................. 12 5.2. Medidas de Tendencia Central y Dispersi´ on para el Nivel Intervalar ......... 12 5.2.1. Datos no agrupados ................................ 12 5.2.2. Datos agrupados ................................. 13 6. Estad´ ısitica Bivariada 15 6.1. Frecuencia Absoluta y Frecuencia Relativa ....................... 15 6.2. Tablas de Contingencia .................................. 15 6.3. Distribuciones Marginales ................................ 15 6.4. Distribuciones Condicionales ............................... 16 6.5. Independencia ....................................... 17 6.6. Asociaci´ on, Dependencia o Correlaci´on ......................... 17 6.6.1. Indicadores de Asociaci´on: Covarianza ..................... 17 6.6.2. Indicadores de Asociaci´on: Correlaci´ on ..................... 18 6.7. Ajuste de Curvas ..................................... 20 6.7.1. Regresi´on Lineal Simple ............................. 20 6.7.2. Ajuste Exponencial ................................ 21 6.7.3. Ajuste Polinomial ................................. 21 6.7.4. Otros Ajustes ................................... 21 II Probabilidades 22 1

description

apuntes proba

Transcript of Apuntes Proba

Page 1: Apuntes Proba

Indice

I Estadıstica Descriptiva 4

1. Introduccion 41.1. Estadıstica Descriptiva e Inferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2. Conceptos Basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3. Etapas de una Investigacion Estadıstica . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Muestreo 62.1. Conceptos basicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2. El Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.3. Muestreo Aleatorio Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.4. Muestreo Estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3. Clasificacion de variables 83.1. Nominales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.2. Ordinales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.3. Intervalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4. Organizacion de la Informacion 9

5. Medidas de Tendencia Central y Dispersion 125.1. Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.2. Medidas de Tendencia Central y Dispersion para el Nivel Intervalar . . . . . . . . . 12

5.2.1. Datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.2.2. Datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

6. Estadısitica Bivariada 156.1. Frecuencia Absoluta y Frecuencia Relativa . . . . . . . . . . . . . . . . . . . . . . . 156.2. Tablas de Contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156.3. Distribuciones Marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156.4. Distribuciones Condicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176.6. Asociacion, Dependencia o Correlacion . . . . . . . . . . . . . . . . . . . . . . . . . 17

6.6.1. Indicadores de Asociacion: Covarianza . . . . . . . . . . . . . . . . . . . . . 176.6.2. Indicadores de Asociacion: Correlacion . . . . . . . . . . . . . . . . . . . . . 18

6.7. Ajuste de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206.7.1. Regresion Lineal Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206.7.2. Ajuste Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216.7.3. Ajuste Polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216.7.4. Otros Ajustes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

II Probabilidades 22

1

Page 2: Apuntes Proba

7. Introduccion 22

8. Modelo de Probabilidad 268.1. Espacio Muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268.2. Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268.3. Medida de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288.4. Espacios Probabilısticos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

9. Probabilidad Condicionada e Independencia 329.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329.2. Probabilidad Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

10.Variables Aleatorias 3810.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3810.2. Variables Aleatorias Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4010.3. Variables Aleatorias Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4110.4. Localizacion y dispersion de una variable aleatoria . . . . . . . . . . . . . . . . . . . 4210.5. Casos especiales de distribuciones probabilidad . . . . . . . . . . . . . . . . . . . . . 44

10.5.1. Distribucion Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4410.5.2. Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4410.5.3. Distribucion Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4510.5.4. Distribucion Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . . 4510.5.5. Distribucion Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4610.5.6. Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4610.5.7. Distribucion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4710.5.8. Distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

10.6. Funciones de Variables Aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5310.6.1. Momentos y funciones generadoras de momentos . . . . . . . . . . . . . . . . 5310.6.2. Transformacion de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

10.7. Aproximacion de distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5810.7.1. Aproximacion Poisson a la distribucion Binomial . . . . . . . . . . . . . . . 5810.7.2. Aproximacion Normal a la distribucion Binomial . . . . . . . . . . . . . . . . 58

11.Vectores Aleatorios 5911.1. Distribucion Conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5911.2. Distribuciones Conjuntas Especiales . . . . . . . . . . . . . . . . . . . . . . . . . . . 6111.3. Distribucion Marginal y Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 6311.4. Esperanza y Varianza Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

12.Nociones de Convergencia 69

III Inferencia Estadistica 71

13.Introduccion 71

2

Page 3: Apuntes Proba

14.Estimacion Puntual 7314.1. Metodo de Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7314.2. Metodo de Maxima Verosimilitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

15.Insesgamiento y eficiencia 76

16.Pruebas de Hipotesis 7916.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7916.2. Prueba de Hipotesis para la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8116.3. Prueba de Hipotesis para la proporcion . . . . . . . . . . . . . . . . . . . . . . . . . 8216.4. Prueba de Hipotesis para la varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 8216.5. Prueba de Hipotesis para la diferencia de medias . . . . . . . . . . . . . . . . . . . . 83

16.5.1. Varianzas conocidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8316.5.2. Varianzas desconocidas pero iguales.σ2

X = σ2Y = σ . . . . . . . . . . . . . . . 84

16.5.3. Varianzas desconocidas y distintas. . . . . . . . . . . . . . . . . . . . . . . . 8416.6. Prueba de Hipotesis para la diferencia de proporciones . . . . . . . . . . . . . . . . 8516.7. Prueba de Hipotesis para la comparacion de varianzas . . . . . . . . . . . . . . . . . 85

17.Estimacion Intervalar 8817.1. Intervalo de Confianza para la media . . . . . . . . . . . . . . . . . . . . . . . . . . 8817.2. Intervalo de Confianza para una proporcion . . . . . . . . . . . . . . . . . . . . . . 8917.3. Intervalo de Confianza para la varianza . . . . . . . . . . . . . . . . . . . . . . . . . 8917.4. Intervalo de Confianza para la diferencia de medias . . . . . . . . . . . . . . . . . . 9017.5. Intervalo de Confianza para la comparacion de varianzas . . . . . . . . . . . . . . . 92

3

Page 4: Apuntes Proba

Parte I

Estadıstica Descriptiva

1. Introduccion

Por estadıstica entendemos los metodos cientıficos por medio de los cuales podemos recolectar,organizar, resumir, presentar y analizar los datos numericos relativos a un conjunto de individuos uobservaciones y que nos permiten extraer conclusiones validas y efectuar decisiones logicas basadasen dichos analisis. Utilizamos la estadıstica para aquellos casos en los que tenemos una gran canti-dad de observaciones y cuya aparicion se rigen solo por las leyes del azar o aleatorias.

1.1. Estadıstica Descriptiva e Inferencial

La estadıstica puede subdividirse en dos amplias ramas: la estadıstica inductiva o inferencial yla estadıstica deductiva o descriptiva.

Estadıstica Inductiva o Inferencial

Entendemos por estadıstica inductiva si a partir de una m.a., suficientemente representativa deluniverso, podemos inferir (inducir) conclusiones estadısticamente validas para todo el universo. Es-to obliga a plantear simultaneamente las condiciones bajo las cuales dichas conclusiones son validas.

Estadıstica Descriptiva o Deductiva

Entendemos por estadıstica descriptiva si al analizar una m.a., solo se pueden obtener conclusio-nes validas para la muestra, sin que se puedan o se requieran generalizar sus resultados para todoel universo.

1.2. Conceptos Basicos

Universo: Es el conjunto de todos los datos u observaciones de un suceso. El universo se desig-na usualmente con la letra U. El universo puede ser finito, infinito contable e infinito no contable(dependiendo del tipo de universo es el tipo de analisis del problema).

Poblacion: Elementos del universo que tienen una caracterıstica comun y es la que tratamosde estudiar.

Muestra Aleatoria (m.a.): Es un subconjunto de la poblacion, donde sus elementos sonescogidos al azar (no existe relacion en la eleccion de los elementos).

4

Page 5: Apuntes Proba

1.3. Etapas de una Investigacion Estadıstica

Aun cuando los tipos de problemas a los cuales puede aplicarse la estadıstica matematica sonbastante heterogeneos, en muchos casos los pasos de una investigacion estadıstica son similares.

a) Formulacion del problema. Para investigar con exito un problema dado, primero tenemosque crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas alproblema, tomando en cuenta el tiempo y dinero disponible y la habilidad de los investigadores.Algunos conceptos tales como: Artıculo defectuoso, servicio satisfactorio a la clientela, observa-ciones demograficas, grados de pureza de un mineral, tipo de trafico, etc., pueden variar decaso en caso, y en cada situacion especıfica, necesitamos coincidir en definiciones apropiadaspara los terminos que se incluyen.

b) Diseno del experimento. Es deseable obtener un maximo de informacion empleando unmınimo de costo y tiempo. Esto implica determinar el tamano de la muestra o la cantidad ytipo de datos.

c) Experimentacion o coleccion de datos. En toda investigacion esta etapa es la que consumemas tiempo. Esta debe aplicarse con reglas estrictas y con pautas preestablecidas.

d) Tabulacion y descripcion de los resultados. Los datos experimentales se ilustran endiagramas, graficos, pictogramas, etc. Obteniendose ademas, medidas descriptivas que repre-senten el proceso efectuado.

e) Inferencia estadıstica y formulacion de la respuesta. Al aplicar el metodo estadısticoseleccionado en la etapa b), podemos inferir conclusiones obtenidas de la muestra acerca dela poblacion respectiva.

5

Page 6: Apuntes Proba

2. Muestreo

2.1. Conceptos basicos

Marco Muestral: El Marco Muestral es el conjunto de unidades del cual se seleccionara unamuestra.

Unidades de Muestreo: Las unidades del Marco Muestral se llaman Unidades de Muestreo.Es importante notar que toda unidad de la poblacion debe estar asociada a una y solo una unidad delMarco Muestral. Esto nos permitira disenar mecanismos de seleccion de la muestra de tal forma quetoda unidad de la poblacion se encontrara en, al menos, una de las posibles muestras seleccionadasy en el caso del Muesteo Probabilıstico nos permitira inducir una probabilidad de seleccion a cadaelemento de la poblacion.

2.2. El Muestreo

El Muestreo es la disciplina que trata con el conjunto de metodos, tecnicas y procedimientospara tomar u obtener una particular muestra a efectos de realizar inferencias inductivas a partir dela misma. Existen dos grandes categorıas de muestreo: el Muestreo Probabilıstico y el Muestreo NoProbabilıstico.

En el Muestreo No Probabilıstico, pueden existir unidades de la poblacion que no pueden serseleccionadas en ninguna de las muestras posibles, o bien, aunque exista una probabilidad de selec-cion positiva para cada una de estas unidades de la Poblacion, esta probabilidad es desconocida.Un ejemplo de este tipo de Muestreo No Probabilıstico es el Muestreo por Cuotas, muy utilizadoen los estudios de mercadeo y en algunas encuestas de opinion.

Con el Muestreo No Probabilıstico, en general, las observaciones para una muestra particularse obtienen mas rapidamente y a menor costo que en el Muestreo Probabilıstico. Por otra parte,los errores “ajenos al muestreo” (errores en las operaciones de recoleccion y procesamiento dela informacion), son mas faciles de controlar cuando se utiliza Muestreo Probabilıstico. En todocaso, solo con el Muestreo Probabilıstico es posible obtener indicadores de confiabilidad del errorinferencial de cada estimacion obtenida a traves de la muestra.

2.3. Muestreo Aleatorio Simple

Es un diseno muestral bastante utilizado cuando se cuenta con una lista o directorio para usarcomo Marco Muestral. Se distinguen dos casos de m.a.s.: Muestreo sin Reemplazo y Muestreo conReemplazo. De las N unidades de la poblacion se selecciona “al azar” (igual probabilidad para cadaunidad) una unidad. Esta se separa (sin reposicion) y de las N-1 restantes unidades de la poblacionse selecciona, tambien al azar, una segunda unidad. De las N-2 unidades restantes se vuelve aseleccionar al azar una tercera unidad y ası sucesivamente hasta completar las n unidades de lamuestra.

6

Page 7: Apuntes Proba

2.4. Muestreo Estratificado

El Muestreo Estratificado se presenta cuando la Poblacion se encuentra particionada en L gru-pos y en todos y cada uno de estos grupos se aplica en forma independiente un diseno muestral, nonecesariamente igual en todos ellos. En tal caso, los grupos de la particion se llaman Estratos y laparticion de dice que es una Estratificacion.La Estratificacion puede tener su origen en los propios objetivos del Estudio o en la intencion decontar con Estratos homogeneos que pueden hacer mas eficiente el Diseno Muestral.

Ejemplos de Estratificaciones en funcion de los objetivos del estudio son, por ejemplo, las di-visiones polıtico administrativas (los Estratos pueden ser Regiones, Provincias, Departamentos oDistritos, etc.) en una Encuesta Nacional, Ramas de Actividad Economica en una Encuesta Indus-trial; Publico y Privado en una Encuesta sobre Educacion, etc.

Ejemplos de Estratos creados para obtener una mayor homogeneidad en cada uno de ellos son:Empresas Grandes, Medianas, Pequenas y Micro, en una Encuesta Industrial: Manzanas con hoga-res de ingresos mayoritariamente altos, medios y bajos, etc.

7

Page 8: Apuntes Proba

3. Clasificacion de variables

Hay que hacer notar que toda variable puede clasificarse en uno de los niveles de medicion, losque se daran en orden creciente en cuanto a la riqueza de los datos.

3.1. Nominales

La variable induce en la poblacion una subdivision y los datos s e pueden clasificar en clases,donde cada clase esta completamente definida y diferenciada de las demas.

La recopilacion se reduce a contar el numero de individuos de la muestra que pertenecen a cadaclase.

3.2. Ordinales

En este nivel la variable de clasificacion tiene un orden implıcito (admite grados de calidad uordenamiento) entre grupos o clases, esto significa que existe una relacion de orden entre las clases.No es posible cuantificar la diferencia entre los individuos pertenecientes a una misma clase.

3.3. Intervalares

La informacion obtenida en este caso es de tipo cuantitativo o numerico y es posible agruparlaen intervalos. En este nivel se considera no solo la informacion perteneciente al orden, sino ademas,el tamano relativo de los intervalos a que pertenece cada uno de los individuos. En este nivel esposible cuantificar la diferencia de dos individuos pertenecientes al mismo intervalo y tambien aintervalos distintos. En esta escala esta involucrado el concepto de unidad de distancia y la distanciaentre dos medidas puede ser expresada en funcion de esta unidad.

8

Page 9: Apuntes Proba

4. Organizacion de la Informacion

Una coleccion de datos tomados de un suceso (sometido a estudio) nada nos dice si no lo orde-namos convenientemente para extraer ası la informacion que se desea.

Los conceptos mas usuales se detallan a continuacion:

a.- El numero de clases o intervalosEs una subdivision del rango en varios grupos o intervalos (se designa por la letra k),

Numero de clases = 1 + 3.3·log(n)

donde n es el numero total de datos. Como el numero de clases debe ser un numero entero,este se aproxima al entero superior, identificandolo con la letra k.

b.- Intervalo o ClaseUna subdivision del rango en componentes (de acuerdo a la magnitud, atributos, etc.) sellaman clases, categorıas, intervalos o celdas. Se designan por la letra C con un subındice queindica la clase a que pertenecen, por ejemplo C1, C2, . . . , Ck.

c.- Ancho del IntervaloEl ancho de la clase es la diferencia entre el lımite superior e inferior de la clase. Se designapor la letra . En general, el ancho de cada clase puede o no ser del mismo tamano. En el casode que todos sean iguales el valor de se define como:

I =R + 1

k

donde R = Dato mayor en la muestra - dato menor de la muestraEl valor de I se aproxima al entero superior (cuando los datos son enteros).

d.- Marca de la ClaseLa marca de clase es el punto medio de la clase o intervalo. Se designa por las letras MCi (elsubındice indica la clase a la que le corresponde).

e.- Frecuencia AbsolutaEl numero de datos que pertenecen a una clase se llama frecuencia absoluta de la clase. Sedesigna por la letra n con un subındice (que indica la clase a que pertenece) por ejemplo:n1, n2, . . . , nk.

Nota:La suma de todas las frecuencias absolutas debe ser igual al numero total de datos ”n”.

f.- Frecuencia RelativaA la proporcion de datos que pertenecen a una clase con respecto al total se llama frecuenciarelativa. Se designa por la letra f con un subındice (que indica la clase a que pertenece). Porejemplo: f1, f2, . . . , fk.

Notas:

9

Page 10: Apuntes Proba

i. La suma de todas las frecuencias relativas debe ser igual a 1.

ii. Frecuencia relativa = frecuencia absoluta/numero total de datos = nin

g.- Frecuencia Absoluta AcumuladaEl numero de datos que estan desde la primera clase hasta la clase i-esima, se llama frecuenciaabsoluta acumulada de la clase i-esima. Se designa por la letra N con un subındice (que indicala clase a que pertenece) por ejemplo: N1, N2, . . . , Nk.

Nota:N1 = n1

N2 = n1 + n2 = N1 + n2...Ni = n1 + n2 + . . .+ ni = Ni−1 + ni ∀ i = 1, 2, . . . , k.

y debe verificarse que Nk = n (numero total de datos)

h.- Frecuencia Relativa AcumuladaEl numero de datos que estan desde la primera clase hasta la clase i-esima con respecto altotal de datos, se llama frecuencia relativa acumulada de la clase i-esima. Se designa por laletra F con un subındice (que indica la clase a que pertenece) por ejemplo: F1, F2, . . . , Fk.

Nota:F1 = f1 = N1

n

F2 = f1 + f2 = F1 + f2 = N2

n...Fi = f1 + f2 + . . .+ fi = Fi−1 + fi = Ni

n∀ i = 1, 2, . . . , k.

y debe verificarse que Fk = 1 (numero total de datos).

Ejemplo 4.1 Las notas obtenidas en un certamen, en escala 1 a 7 fueron:

3, 5, 6, 3, 4, 4, 7, 2, 1, 2, 3, 3, 4, 4, 6, 2, 7, 5, 3, 4, 4, 1, 2, 2, 3, 5, 4, 6, 5, 5.

Lo que se puede tabular como:

Clase Nota ni fi Ni FiC1 1 2 0.067 2 0.067C2 2 5 0.167 7 0.233C3 3 6 0.200 13 0.233C4 4 7 0.233 20 0.667C5 5 5 0.167 25 0.833C6 6 3 0.100 28 0.933C7 7 2 0.067 30 1

Suma 30 1

10

Page 11: Apuntes Proba

Ejercicios 1 En una empresa se considera la siguiente muestra correspondiente a la resistencia de50 lotes de algodon medidas en libras necesarias hasta romper una madeja.

74 87 99 88 90 101 91 83 97 94105 110 99 94 104 97 90 88 89 9079 105 96 93 93 90 91 102 94 106

101 96 97 103 108 90 102 91 76 109110 94 101 97 106 86 88 97 107 107

1. Encuentre el numero de clases y el rango de la muestra

2. Determine la amplitud de la clase

3. Construya un cuadro resumen indicando intervalos, marca de clase, frecuencias absoluta, re-lativa, absoluta acumulada y relativa acumulada.

4. Grafique las frecuencias absolutas. Comente.

11

Page 12: Apuntes Proba

5. Medidas de Tendencia Central y Dispersion

5.1. Medidas de Tendencia Central

La idea es resumir los datos en un solo valor; un valor que represente a todo un conjuntode datos, este tiene que ser un numero o una clase hacia el cual tienen tendencia a concentrarsemayoritariamente el conjunto de datos, usualmente este se ubica en las clases mas o menos centrales,o sea, que es un valor central o de posicion central a cuyo alrededor se distribuyen todos los datosdel conjunto, de allı el nombre de Medidas de Tendencia Central (M.T.C.). Las mas comunes sonla mediana, moda, media o promedio, media geometrica, etc.

Estas y otras medidas nos sirven para resumir la informacion presentada en cuadros y poderrelacionar y comparar entre sı, de una manera sencilla, un conjunto de distribuciones de frecuencias.

Una vez determinadas las Medidas de Tendencia Central de una distribucion, nos interesa de-terminar como se reparten (dispersan, desvıan) los datos a uno y otro lado de la medida central. 0sea, es necesario cuantificar la representatividad de la medida de tendencia para poder caracterizarla distribucion. Si la dispersion es pequena indica gran uniformidad y la informacion tiende a con-centrarse en torno a la medida central, por el contrario, una gran dispersion indica que los datosestan alejados de ella.

Las medidas de dispersion mas usuales son: desviacion media, desviacion tıpica o estandar,rango, rango semi-intercuartılico, rango percentil, etc.

5.2. Medidas de Tendencia Central y Dispersion para el Nivel Interva-lar

5.2.1. Datos no agrupados

En este nivel la medida central mas representativa es la media o promedio. Un promedio es unvalor, que es tıpico o representativo de un conjunto de datos. Como tales valores tienden a situarseen el centro del conjunto de los datos ordenados segun su magnitud, los promedios se conocentambien como medidas de centralizacion.

a. MediaLa media aritmetica o media de un conjunto de n numeros X1, X2, . . . , Xn se denota por Xy se define como

X =1

n

n∑i=1

Xi

b. ModaLa moda cruda de una serie de numeros es aquel que se presenta con la mayor frecuencia, esdecir, es el valor mas comun.

Una distribucion que tiene una sola moda se llama unimodal (caso mas usual). Es posibleencontrar variables bimodales, trimodales, etc.

12

Page 13: Apuntes Proba

Propiedades de la Moda:- Puede no existir y cuando existe no es necesariamente unica.- No se ve afectada por valores extremos.

c. MedianaEs el valor de la variable que ocupa la posicion central , en un conjunto de datos ordenados.Si el numero de observaciones es impar, es la observacion central de los valores, una vez queestos han sido ordenados en orden creciente o decreciente. Si el numero de las observacioneses par, se calcula como el promedio de las dos observaciones centrales.

Propiedades de la Mediana:- La mediana en un conjunto de datos es unica- No es sensible a la presencia de datos extremos- En un conjunto de datos, la mitad de ellos son iguales o menores que la mediana, y la otramitad, iguales o mayores que la mediana.

d. PercentilesEl percentil q es un valor de la variable tal que el q % de los datos es menor que el y, por lotanto, el (1-q) % es mayor. Son una medida de posicion que no reflejan la tendencia central.

Si X1, X2, . . . , Xn es una secuencia ordenada de datos, el percentil q se encuentra en la posicion

q(n+ 1)

100

e. VarianzaEs una constante que representa una medida de dispersion media de una variable aleatoria X, respecto a su valor medio. Puede interpretarse como medida de “variabilidad” de la variable.Se define la varianza de una serie de observaciones X1, . . . , Xn como

s2 =1

n

n∑i=1

(Xi −X)2

o equivalentemente

s2 =1

n

n∑i=1

X2i −X

2

5.2.2. Datos agrupados

a. MediaSi los datos estan ordenados en una tabla (datos agrupados) en las que se conocen las res-pectivas marcas de clase MCi, y ellas se presentan con frecuencias absolutas ni, la mediaaritmetica es:

X =1

n

k∑i=1

niMCi

13

Page 14: Apuntes Proba

b. ModaLa moda puede obtenerse mediante el numero dado por:

Moda = lmo +∆1

∆1 + ∆2

I

donde:mo = clase modal (clase con mayor frecuencia absoluta)lmo = lımite inferior del intervalo de la clase modal∆1 = nmo - n−mo∆2 = nmo - n+

mo

nmo = es la frecuencia de la clase modaln+mo = es la frecuencia de la clase posterior a la clase modaln−mo = es la frecuencia de la clase anterior a la clase modalI = ancho del intervalo de la clase modal.

c. MedianaPara datos agrupados, el numero mediana viene dada por:

Me = lMe +n2−N−Me

nMe

I

donde:lMe = lımite inferior del intervalo de la clase medianan = numero total de datosNMe = frecuencia absoluta acumulada hasta la clase anterior a la clase mediananMe = es la frecuencia de la clase medianaI = ancho del intervalo de la clase mediana.

d. PercentilesPara datos agrupados, nos referimos a la clase en el cual se encuentra al menos el q % de losdatos, digamos Ci, por lo que

Pq = li +n · q/100−Ni−1

ni· I

donde:li = lımite inferior de la clase a la cual pertenece el percentil qI = ancho del intervalo Ci.

e. VarianzaLa desviacion estandar o tıpica de datos contenidos para datos agrupados con sus respectivasfrecuencias absolutas ni, y las marcas de clase MCi, se representa por:

s2 =1

n

k∑i=1

ni(MCi −X)2

o equivalentemente

s2 =1

n

k∑i=1

niMC2i −X

2

14

Page 15: Apuntes Proba

6. Estadısitica Bivariada

Ahora, supongamos que queremos estudiar el comportamiento de la variable de clasificacionbidimensional (X, Y ), asociada a dos variables de clasificacion unidimensionales X e Y , respectiva-mente, en una muestra de tamano n de la poblacion. Entonces dividimos la muestra en r clases Ai,segun la variable X, y en s clases Bj, segun Y .

Llamamos nij al numero de elementos de la muestra que pertenecen simultaneamente a la claseAi y la clase Bj. Podemos luego considerar una clase o modalidad AiBj formada por elementos dela muestra que pertenecen simultaneamente a Ai y a Bj. Se observa que hay r ·s modalidades AiBj.

6.1. Frecuencia Absoluta y Frecuencia Relativa

Definiciones de interes:

nij: frecuencia absoluta del numero de elementos pertenecientes a Ai ∩Bj

fij: frecuencia relativa del numero de elementos en Ai ∩Bj con respecto al total n, donde

fij =nijn, ∀ i = 1, . . . , r; ∀ j = 1, . . . , s

6.2. Tablas de Contingencia

Cuadro de doble entrada donde se puede resumir la informacion acerca de las frecuencias, yasean absolutas o relativas, como se muestra a continuacion:

YB1 B2 . . . Bs

X A1 n11 n12 . . . n1s n1+

A2 n21 n22 . . . n2s n2+...

......

......

...Ar nr1 nr2 . . . nrs nr+

n+1 n+2 . . . n+s n

6.3. Distribuciones Marginales

ni+: es el numero de elementos de la muestra que pertenecen a la clase Ai, sin importar la claseBj a la que esten asociados (suma de los valores de la fila i-esima de la tabla de contingencia defrecuencias)

ni+ =s∑j=1

nij, ∀ i = 1, . . . , r

n+j: es el numero de elementos de la muestra que pertenecen a la clase Bj segun Y, sin importarla clase Ai a la que esten asociados (suma de los valores de la columna j-esima de la tabla decontin-gencia de frecuencias)

n+j =r∑i=1

nij, ∀ j = 1, . . . , s

15

Page 16: Apuntes Proba

fi+: frecuencia relativa de las clases Ai sin importar las clases Bj.

fi+ =ni+n, ∀ i = 1, . . . , r

f+j: frecuencia relativa de las clases Bj sin importar las clases Ai.

f+j =n+j

n, ∀ j = 1, . . . , s

6.4. Distribuciones Condicionales

La distribucion condicional consiste en estudiar las frecuencias asociadas a las clases de unavariable cuando nos restringimos a los elementos de una clase dada segun la otra variable, esto es,estudiar el comportamiento de una variable dado un valor fijo de la otra. Para calcular la proporcionde individuos muestrales que segun Y caen en B, conociendo que segun X ya pertenecıan a A, sedebe evaluar:

fB/A =nB/An

donde fB/A es la frecuencia relativa condicional del subconjunto B de Y dado que X perteneceal subconjunto A.

La distribucion de X condicionada a Y se define como

fi/j =fi/jf+j

=nijn+j

∀ i = 1, . . . , r

yr∑i=1

fi/j = 1

La distribucion de Y condicionada a X se define como

fj/i =fj/ifi+

=nijni+

∀ j = 1, . . . , s

ys∑j=1

fj/i = 1

Ejemplo 6.1 Sea X la edad e Y la categorıa correspondiente al puesto de trabajo. Dada la siguientetabla de contingencia, calcular la distribucion condicional de Y, dado que X es 25-30 y 35-45.

X\Y I II III ni+15-20 20 20 5 4520-25 15 12 8 3525-30 10 15 10 3530-35 5 20 25 5035-40 5 10 30 45n+j 55 77 78 210

16

Page 17: Apuntes Proba

6.5. Independencia

Dada una informacion en una Tabla de Contingencia, se dice que las variables X e Y sonindependientes, sı y solo sı, la frecuencia relativa conjunta es igual al producto de las frecuenciasrelativas marginales.

fij = fi+ · f+j ∀i = 1, . . . , r ∀ j = 1, . . . , s

Si las variables X e Y no son independientes entre sı, se dice que existe una asociacion entreellas. De modo que el conocimiento de una de las variables presente alguna informacion respecto dela otra. Nuestro objetivo es medir de alguna forma esta relacion existente y poder ademas describirde que forma (lineal, exponencial, potencial, etc.) estan relacionadas.

6.6. Asociacion, Dependencia o Correlacion

En estadıstica Descriptiva se dice que dos variables cuantitativas “estan asociadas”, “son depen-dientes”, o “estan correlacionadas” si cuando se aumentan los valores de una variable, los valoresde la otra tienden a:

i) o bien a aumentar (y se dice que la asociacion dependencia es directa o que la correlacion espositiva)

ii) o bien a disminuir (y se dice que la asociacion o dependencia es inversa o que la correlaciones negativa)

Cuando no se presenta esta tendencia se dice que las variables no estan asociadas o no son depen-dientes o no estan correlacionadas.

La asociacion, correlacion o dependencia en Estadıstica Descriptiva, no implica relacion causa-efecto. En otras palabras, si cuando una variable aumenta la otra tiende a aumentar (o a disminuir)no es posible afirmar que esta ultima aumenta (o disminuye) PORQUE la primera variable aumenta.

6.6.1. Indicadores de Asociacion: Covarianza

La covarianza entre dos variables, X e Y esta dada por:

cov(X, Y ) =n∑i=1

(xi − x)(yi − y)

n

o equvalentemente

cov(X, Y ) =1

n

n∑i=1

xiyi − xy

La covarianza es una medida de asociacion lineal, pero tiene la desventaja que su interpretaciondepende de las unidades de medicion.

Si cov(X,Y)> 0, la asociacion o correlacion es directa o positiva.

Si cov(X,Y)< 0, la asociacion o correlacion es inversa o negativa.

Si cov(X,Y)≈ 0, no hay asociacion o correlacion lineal.

17

Page 18: Apuntes Proba

6.6.2. Indicadores de Asociacion: Correlacion

La correlacion lineal entre dos variables se define como

corr(X, Y ) =

n∑i=1

(xi − x)(yi − y)√√√√ n∑i=1

(xi − x)2

n∑i=1

(yi − y)2

Si corr(X, Y ) = 1, la correlacion es la maxima correlacion positiva o directa.

Si corr(X, Y ) = −1, la correlacion es la maxima correlacion negativa o inversa.

Si corr(X, Y ) ≈ 0, no existe correlacion o dependencia.

Una formula alternativa para calcular ρX,Y es

corr(X, Y ) =sXYsXsY

donde sX y sY son las desviaciones estandar de X e Y , respectivamente, y donde sXY es la covarianzaentre X e Y .

Otra formula alternativa es

ρ(X, Y ) =

∑xiyi −

(∑xi

)(∑yi

)/n√∑

x2i −

(∑xi

)2

/n

√∑y2i −

(∑yi

)2

/n

Si bien no existe una regla general para decir si una correlacion es alta media o baja, en estecurso podemos adoptar el siguiente criterio:

18

Page 19: Apuntes Proba

Ejemplo 6.2 .

1. Consideremos los siguientes datos, donde X indica la temperatura media diaria en gradosFarenheit e Y , el consumo diario correspondiente de gas natural en pies cubicos.

X,F 50 45 40 38 32 40 55Y,ft3 2.5 5.0 6.2 7.4 8.3 4.7 1.8

Realice un diagrama de dispersion y calcule el coeficiente de correlacion ρX,Y , si ademas cuentacon las siguientes medidas de resumen:∑

xi = 300;∑

yi = 35,9;∑

x2i = 13,218;

∑y2i = 218,67;

∑xiyi = 1431,8

2. Considere los siguientes datos donde X, representa el numero de sucursales que 10 bancos di-ferentes tienen en un area metropolitana, e Y es la correspondiente cuota del total de depositosmantenidos por los bancos.

X 198 186 116 89 120 109 28 58 34 31Y 22.7 16.6 15.9 12.5 10.2 6.8 6.8 4.0 2.7 2.8

a) Construya un diagrama de dispersion entre X e Y.

b) Calcule covarianza y correlacion.

19

Page 20: Apuntes Proba

6.7. Ajuste de Curvas

En el problema de ajuste a curvas se desea que dado un par de variables (X, Y ) encontrar unacurva que se ajuste de la mejor manera a los datos. La curva esta definida en forma parametrica, y sedeben encontrar los valores de sus parametros para hacer que alguna medida de error se minimice.

6.7.1. Regresion Lineal Simple

Con la regresion lineal simple se pretende ir mas alla de ver la asociacion entre dos variables.En concreto se quiere:

(i) Investigar la naturaleza de la asociacion.

(ii) Construir un modelo que describa la relacion entre ambas variables.

(iii) Predecir

Supongamos que un diagrama de dispersion de los datos de los puntos (xi, yi) indica una relacionlineal entre las variables X eY o, alternativamente, que el coeficiente de correlacion es cercano a 1o -1. Entonces el siguiente paso es encontrar la recta L que en lagunsentido ajuste los datos.

En general, el modelo de regresion lineal simple lo podemos plantear como la recta :

yi = a+ bxi, i = 1, . . . , n. (1)

dondeyi: es la variable respuesta o dependiente para el individuo i;xi: es la variable esplicativa o independiente para el individuo i, i = 1, . . ., n.a: representa el intercepto con el eje Y, y se interpreta como el valor que toma y cuando x=0.b: representa la pendiente de la recta, y se interpreta como la cantidad que aumenta(disminuye) ycuando x aumenta(disminuye) en una unidad.

La pendiente y el intercepto pueden calcularse de la siguiente manera:

b =rsysx

=cov(X, Y )

s2X

y a = y − bx

Ejemplo 6.3 Considere los datos de los ejemplo 6.2 y 6.3, y encuentre la recta que se ajusta a losdatos.

Algunas veces el diagrama de puntos no indica una relacion lineal entre las variables X e Y perose podra observar alguna otra curva tıpica y bien conocida Y = f(X) que puede aproximar los datos;se le llama curva de aproximacion. Algunas de esas curvas tıpicas son las siguientes analizamos larelacion entres X e Y y determinamos que esta no se ajusta auna recta podemos analizar, entreotros, los dos siguientes casos:

20

Page 21: Apuntes Proba

6.7.2. Ajuste Exponencial

Si entre log(y) y x observamos una relacion lineal, usaremos la curva exponencial:

yi = aebxi , i = 1, . . . , n.

Este ajuste se puede reducir a una regresion lineal de la siguiente forma

log(yi) = a′ + b′xi, i = 1, . . . , n.

donde

a′ =log(a)

b′ =b

6.7.3. Ajuste Polinomial

En este caso lo que hacemos es ajustar la relacion entre x e y a traves de un polinomio de gradop:

yi = β0 + β1xi + β2x2i + β3x

3i , . . . , βpx

pi i = 1, . . . , n.

Al incluir potencias de X logramos mayor flexibilidad en el modelo.Si p=1, estamos en el caso de regresion lineal.Si p=2, la regresion se llama cuadratica.

6.7.4. Otros Ajustes

HiperbolaSi entre 1/y y x observamos un relacion lineal usaremos la hiperbola:

y =1

a+ bxo

1

y= a+ bx

Curva GeometricaSi entre log(y) y log(x) observamos una relacion lineal usaremos la curva potencial:

y = axb o log(y) = log(a) + b · log(x)

21

Page 22: Apuntes Proba

Parte II

Probabilidades

7. Introduccion

Uno de los problemas que deberemos considerar e intentar evaluar, es el elemento de aleatoriedadque se asocia a la ocurrencia de ciertos eventos cuando se lleva a cabo un experimento. En muchoscasos debe tenerse la capacidad de resolver un problema de probabilidad mediante el conteo delnumero de casos posibles sin realmente anotar cada uno de ellos.

Teorema 7.1 Si una operacion puede realizarse de n1 formas, y si por cada una de estas unasegunda operacion puede llevarse a cabo de n2 formas, entonces las dos operaciones pueden realizarsejuntas de n1n2 formas.

Ejemplo 7.1 ¿Cuantos son los resultados posibles cuando se lanza un dado dos veces?

Teorema 7.2 (Principio Multiplicativo) Si una operacion puede realizarse de n1 formas, y sipor cada una de estas puede efectuarse una segunda en n2 formas, y para cada una de las dosprimeras se puede efectuar una tercera de n3 formas, y ası sucesivamente, entonces la secuencia dek operaciones pueden realizarse de n1n2 . . . nk formas.

Ejemplo 7.2 ¿Cuantos menus que consisten de sopa, postre y bebida existen si se puede seleccionarentre 4 sopas diferentes, 5 clases de postres y 4 bebidas?

Ejemplo 7.3 ¿Cuantos numeros pares de tres dıgitos pueden formarse con los dıgitos 1, 2, 5, 6 y9?

Con frecuencia interesa un conjunto que contiene como elmentos todos los posibles ordenes oarreglos de un grupo de objetos. Por ejemplo, se puede desear conocer cuantos arreglos diferentesson posibles para sentar a 6 personas alrededor de una mesa, o bien, cuantas formas diferentesexiten de tomar 5 ramos de un total de 8.

Definicion 7.1 Una permutacion es un arreglo de todos, o parte de, un conjunto de objetos.

Considerense las tres letras a, b y c. Las permutaciones posibles son abc, acb, bca, cab, bac ycba. Se puede ver que hay 6 distintos arreglos. Con el principio multiplicativo se pueded llegar aque la respuesta es 6 sin escribir todas las posibles combinaciones. Hay n1 = 3 posibilidades para laprimera posicion, despues n2 = 2 para la segunda y unicamente n3 = 1 posibilidades para la ultima,lo que da un total de n1n2n3 = 3 · 2 · 1 = 6 permutaciones.

En general, se pueden acomodar n objetos distintos en n · (n − 1) · (n − 2) · . . . · (3) · (2) · (1)formas. Este producto se representa por el sımbolo n!, que se lee “n factorial”. Por definicion, 1! =1 y 0! = 1.

Teorema 7.3 El numero de permutaciones de n distintos objetos es n!

22

Page 23: Apuntes Proba

El numero de permutaciones de las cuatro letras a, b, c y d sera de 4! = 24. Considerese ahorael numero posible de ellas al tomar las cuatro letras, pero de dos a la vez. Serıan ab, ad, ac, ba, ca,bc, cb, bd, db, cd, dc. De una nueva cuenta con el Teorema 7.1, se tiene dos posiciones para llenarcon laa n1 = 4 posibilidades para la primera y, por lo tanto, n2 = 3 posibilidades para la segunda,para un total de n1n2 = 4 · 3 = 12 permutaciones. En general, n objetos distintos, si se toman r ala vez, pueden acomodarse en n · (n− 1) · (n2) · · · (n− r + 1) formas.

Teorema 7.4 El numero de permutaciones de n objetos distintos tomando r a la vez, es:

nPr =n!

(n− r)!

Ejemplo 7.4 ¿De cuantas maneras se puede programar 3 ayudantıas en 3 distintos horarios, si losalumnos tienen 5 modulos disponibles?

Las permutaciones que se dan al acomodar objetos en un cırculo se llaman permutacionescirculares. Dos de estas no se consideran diferentes a menos que a los objetos correspondientes enlos dos arreglos les preceda o les siga un objeto diferente al avanzar en el sentido de las manecillasdel reloj. Por ejemplo, si 4 personas juegan a las cartas, no se tiene una nueva permutacion si todasse mueven una posicion en esa direccion. Al considerar a una en un lugar fijo y acomodar a las otrastre en 3! formas diferentes, se encuentra que hay 6 acomodos dsitintos para el juego de cartas.

Teorema 7.5 El numero de permutaciones de n objetos distintos agregados en un cırculo es (n-1)!

Hasta ahora se han considerado permutaciones de objetos diferentes. Esto es, todos los objetoseran distintos o totalmente distinguibles. Si consideramos la palabra OSO, entonces las 6 permuta-ciones de las letras de esta palabra son O1SO2, O1O2S, SO1O2, O2SO1, O2O1S, SO2O1, por lo queunicamente tres son distintas. Por lo tanto, con tres letras, siendo dos iguales, se tienen 3!/2! = 3diferentes permutaciones.

Teorema 7.6 El numero de permutaciones diferentes de n objetos de los cuales n1 son de un tipo,n2 son de un tipo, . . ., nk de un k- esimo tipo, es:

n!

n1!n2! · · ·nk!Ejemplo 7.5 ¿De cuantas formas diferentes pueden acomodarse 3 ampolletas rojas, 4 amarillas y2 azules en un panel con 9 espacio para 9 luces?

Con frecuencia interesa el numero de formas en que se pueden repartir n objetos en r subconjun-tos llamados celdas. La particion se logra si la interseccion de cada par posible de r subconjuntoses el conjunto vacıo y si la union de todos los subconjuntos da como resultado el conjunto original.No importa el orden de los objetos dentro de una celda.

Teorema 7.7 El numero de formas de partir un conjunto de n objetos en r celdas con n1 elementosen la primera celda, n2 elementos en la segunda, y ası sucesivamente, es:(

n

n1n2 · · ·nr

)=

n!

n1!n2! · · ·nr!

donde n1 + n2 + · · ·+ nr = n

23

Page 24: Apuntes Proba

Ejemplo 7.6 ¿De cuantas formas distintas pueden 7 cientıficos acomodarse en un laboratorio paratres personas y dos laboratorios para dos personas?

En muchos problemas interesa el numero de formas posibles de seleccionar r objetos de untotal de n sin importar el orden. Estas selecciones se llaman combinaciones. Una combinacion esrealmente una particion en dos celdas, una de las cuales contiene los r objetos que se seleccionarony la otra, los (n− r) objetos restantes.

Teorema 7.8 El numero de combinacioines de n objetos distintos, tomando r a la vez es(n

r

)=

n!

r!(n− r)!

Ejemplo 7.7 Encuentre el numero de comites que pueden formarse con 4 quımicos y 3 fısicos yque comprendan 2 quımicos y 1 fısico.

Ejercicios 2 .

1. A los participantes de una convencion se les ofrecen 6 recorridos por dıa para visitar lugaresde interes durante los 3 dıas de duracion del evento. ¿De cuantas formas puede una personaacomodarse para hacer alguno de ellos?

2. En un estudio medico, los pacientes se clasifican en 8 formas diferentes de acuerdo con sutipo de sangre, AB+, AB−, A+, A−, B+, B−, O+, u O−, y su presion sanguınea (baja, alta onormal). Encuentre el numero de formas posibles para clasificar un paciente.

3. Si un experimento consiste en lanzar un dado y despues seleccionar aleatoriamente una letradel alfabeto, ¿cuales son los posibles resultados?

4. Un estudiante de primer ano debe tomar un curso de Ciencia, uno de Humanidades y otro deMatematicas. Si puede escoger entre cualquiera de 6 cursos de Ciencia, 4 de Humanidades y4 de Matematicas, ¿de cuantas formas puede acomodar su horario?

5. Si una prueba de seleccion multiple consta de 5 preguntas, cada una con 4 alternativas, de lascuales una es al correcta,

a) ¿de cuantas formas diferentes puede un estudiante escoger una respuesta para cada pre-gunta?

b) ¿de cuantas maneras puede un estudiante escoger una alternativa para cada pregunta ytener todas las respuestas incorrectas?

6. Un constructor desea edificar 9 casas, cada una con diferente diseno. ¿De cuantas formaspuede colocar estas casas si 6 terrenos estan en un lado de la calle y 3 estan en el opuesto?

7. a) ¿Cuantos numeros de tres dıgitos pueden formarse con los dıgitos 0, 1, 2, 3, 4, 5 y 6, sicada uno puede utilizarse solo una vez?

b) ¿Cuantos de estos numeros son impares?

c) ¿Cuantos son mayores a 330?

24

Page 25: Apuntes Proba

8. ¿De cuantas formas puedens sentarse en una lınea 4 ninos y 5 ninas, si deben colocarsealternadamente?

9. Cuatro matrimonios compraron 8 lugares para un concierto. ¿De cuantas formas diferentespuedens sentarse

a) sin restricciones?

b) si se sientan por parejas?

c) si todos los hombres se sientasn juntos a las derecha de todas las mujeres?

10. ¿En cuantas formas pueden plantarse en cırculo 5 arboles diferentes?

11. ¿Cuantas permutaciones distintas pueden hacerse con las letras de la palabra infinito?

12. ¿De cuantas formas pueden plantarse, a lo largo de la lınea divisoria de una propiedad, 3robles, 4 pinos y 2 arces, si uno no distingue entre los arboles de la misma clase?

13. Un colegio participa en 12 partidos de futbol en una temporada. ¿De cuantas maneras puedeel equipo terminar la temporada con 7 victorias, 3 derrotas y 2 empates?

14. Nueve personas salen de viaje para esquiar en 3 vehıculos cuyas capacidades son 2, 4 y 5pasajeros, respectivamente. ¿De cuantas formas es posible transportar a las 9 personas hastael albergue con todos los vehıculos?

15. Hay 12 maneras de la cuales un artıculo manufacturado puede tener un pequeno defecto y 10maneras en las cuales puede tener un defecto mayor. ¿De cuantas maneras puede ocurrir undefecto menor y uno mayor? ¿2 defectos mayores y 2 menores?

16. Una clase se compone de 6 alumnos. Hallar el numero n de muestras ordenadas de tamano 4:

a) con reemplazamiento,

b) sin reemplazamiento.

17. Una clase se compone de 9 ninos y 3 ninas. Hallar el numero de posibilidades que tiene unprofesor de elegir un comite de 4 alumnos

a) sin restricciones,

b) tiene que haber dos ninos y dos ninas,

c) tiene que haber exactamente una nina,

d) tiene que haber al menos una nina.

18. Los equipos A y B juegan en un campeonato de futbol, donde el equipo que primero ganecuatro juegos gana el campeonato. Hallar el numero n de posibilidades que se pueden dar enel campeonato sabiendo que A gana el primer juego y que el equipo que gane el segundo juegotambien gana el cuarto. Enumerar las n posibilidades que se pueden dar.

25

Page 26: Apuntes Proba

8. Modelo de Probabilidad

En el estudio de la estadıstica interesa, basicamente, la presentacion e interpretacion de resul-tados aleatorios que se dan en un estudio planeado o en una investigacion cientıfica. Por ejemplo,es posible registrar el numero de accidentes que ocurren mensualmente en una determinada inter-seccion de calles, con el proposito de justificar la instalcion de un semaforo; clasificar los artıculosque salen de una lınea de ensamble como “defectuosos” o “no defectuosos”; o bien, tener interes enconocer el volumen de gas que se libera durante una reaccion quımica cuando la concentracion deun acido varıa. De aquı que se manejen datos experimentales, que representan conteos o mediciones,o tal vez datos categoricos que puedan clasificarse de acuerdo con algun criterio.Necesitamos entonces una forma matematica para cuantificar la incertidumbre.

Utilizaremos la palabra experimento, E, para describir cualquier proceso que genere un conjun-to de datos. Un ejemplo muy simple de un experimento consiste en el lanzamiento de una monedala aire. En este caso solo existen dos resultados posibles: cara o sello. Otro experimento podrıaser el lanzamiento de un proyectil y la observacion de su velocidad en un perıodo de tiempo. Lasopiniones de los votantes respecto de un candidato a alcalde tambien pueden considerarse comoobservaciones de un experimento. Aquı interesan particularmente las observaciones que se obtienenen la repeticion de un experimento. En la mayor parte de los casos los resultados dependeran delazar y, por lo tanto, no pueden pronosticarse con certidumbre. Si un quımico realiza varias vecesun analisis bajo las mismas condiciones y obtiene diferentes mediciones, ello indica la existenciade un elemento de aleatoriedad en el procedimiento experimental. Incluso cuando una moneda selanza al azar repetidamente, no es posible garantizar que en un lanzamiento dado se obtendra co-mo resultado una cara. No obstante, sı se conoce el conjunto completo de posibilidades para cadalanzamiento.

8.1. Espacio Muestral

Definicion 8.1 Al conjunto de todos los resultados posibles de un experimento estadıstico se lellama espacio muestral y se representa por la letra S.

A cada resultado en un espacio muestral se le llama elemento del espacio muestral o simple-mente punto muestral.

Ejemplo 8.1 Determine el espacio muestral del siguiente experimento: se lanza una moneda y sisale cara, se lanza un dado; si sale sello, se vuelve a lanzar.

8.2. Eventos

Definicion 8.2 Un evento A, respecto a un espacio muestral S, asociado a un experimento E,esun subconjunto de resultados posibles.

Es claro que S en sı mismo es un evento y tambien lo es el conjunto vacıo. Cualquier resultadoindividual tambien puede considerarse como un evento.

26

Page 27: Apuntes Proba

Definicion 8.3 El complemento de un evento A con respecto a S es el conjunto de todos loselementos de S que no estan en A, es decir, es el suceso que se da si A no ocurre. Denotamos elcomplemento de A por el sımbolo Ac, tambien escrito A.

Definicion 8.4 La interseccion de dos eventos A y B, A∩B, es el evento que contiene a todoslos elementos comunes a A y a B, es decir, es el evento que ocurre si A y B ocurren.

Definicion 8.5 Dos eventos A y B son mutuamente excluyentes o disjuntos si A∩B = ∅, estoes, si A y B no tienen elemento comunes.

Definicion 8.6 La union de los dos eventos A y B, A∪B es el evento que contiene a todos loselementos que pertenecen a A, o a B o a ambos.

Ejemplo 8.2 Sea el experimento

E: lanzar un dado y observar el numero que sale,

y sean los eventos:

A: sale un numero par,

B: sale un numero impar,

C: sale un numero primo.

Determinar el espacio muestral y los elementos de los siguientes conjuntos:

a) A ∪ C

b) B ∩ C

c) Cc

Definicion 8.7 Sea A la clase de eventos (aleatorios) de S. A es un σ- algebra de subconjuntosde S (no vacıo) si:

i) S ∈ A

ii) A ∈ A → Ac ∈ A

iii) A1, A2, . . . ∈ A →⋃∞i=1Ai ∈ A

Nota: (S,A) se llama espacio medible.

Ejercicios 3 Demuestre las siguientes propiedades:

i) ∅ ∈ A

ii) A1, A2, . . . , An ∈ A →⋂ni=1Ai ∈ A,

⋃ni=1Ai ∈ A

iii) A1, A2, . . . ∈ A →⋂∞i=1Ai ∈ A

27

Page 28: Apuntes Proba

8.3. Medida de Probabilidad

Finalmente, dado un σ- algebra A de eventos de S, para concretar nuestro modelo debemosintroducir una medida de probabilidad sobre (S,A).

Definicion 8.8 Una medida de probabilidad P sobre (S,A) es una funcion

P : A → [0, 1]

tal que cumple con los siguientes tres axiomas de Kolmogorov:

A1 P(A) > 0 ∀ A ∈ A

A2 P(S) = 1

A3 Si A1, A2, . . . ∈ A son disjuntos dos a dos, entonces

P( ∞⋃i=1

Ai)

=∞∑i=1

P (Ai)

(S, A, P)se llama modelo de probabilidad.

Lema 1 Sea (S, A, P) un modelo de probabilidad. Entonces valen las siguientes propiedades:

a) P(∅) = 0

b) Si A1, . . . , An ∈ A son disjuntos dos a dos, entonces

P( n⋃i=1

Ai)

=n∑i=1

P (Ai)

Propiedades de P

Dado un modelo de probabilidad (S, A, P) se desprende de A1, A2 y A3 que:

P1) P(Ac) = 1−P(A)

P2) A ⊆ B → P(A) ≤ P(B)

P3) P(A ∪B) = P(A) + P(B)−P(A ∩B)

P4) P(⋃∞i=1Ai) ≤

∑∞i=1 P(Ai)

P5) (i) Si An es una secuencia creciente de eventos, tal que

A =∞⋃i=1

Ai = lımAn

entonces

28

Page 29: Apuntes Proba

P(A) = lım P(An)

(P es continua por abajo)

(ii) Si An es una secuencia decreciente de eventos, tal que

A =∞⋂i=1

Ai = lımAn

entonces

P(A) = lım P(An)

(P es continua por arriba)

Ejercicios 4 .

1. Un espacio muestral S se compone de cuatro elementos, es decir, S = a1, a2, a3, a4. ¿Bajocuales de las siguientes funciones S llega a ser un espacio probabilıstico?

a)P(a1) = 1/2 P(a2) = 1/3 P(a3) = 1/4 P(a4) = 1/5

b)P(a1) = 1/2 P(a2) = 1/4 P(a3) = 1/4 P(a4) = 1/2

c)P(a1) = 1/2 P(a2) = 1/4 P(a3) = 1/8 P(a4) = 1/8

d)P(a1) = 1/2 P(a2) = −1/4 P(a3) = 1/4 P(a4) = 0

2. Sean tres sucesos A, B y C. Encuentre expresiones para los siguientes sucesos en lenguaje deconjuntos.

a) Solo ocurre A.

b) Ocurren tanto B como C, pero no ası A.

c) Los tres sucesos ocurren.

d) Ninguno de los tres sucesos ocurre.

e) A lo mas dos de ellos ocurren.

f) Al menos dos de los sucesos ocurren.

g) Al menos uno de los sucesos ocurre.

h) Exactamente dos de ellos ocurren.

29

Page 30: Apuntes Proba

8.4. Espacios Probabilısticos Finitos

Consideremos un espacio muestral S y la clase A de todos los sucesos. S se convierte en unespacio probabilıstico asignando probabilidades a los sucesos de A de tal forma que satisfaga losaxiomas de probabilidad.

Espacios finitos equiprobablesSupongamos que S es un espacio muestral finito con n elementos y supongamos que las caracterısti-cas fısicas del experimento sugieren que a varios de los resultados se les asignen probabilidaes iguales.Entonces S se convierte en un espacio probabilıstico, llamado espacio finito equiprobable, si a ca-da punto se le asigna probabilidad 1/n y si a cada suceso A que contiene r puntos, probabilidad r/n.

Por lo tanto,

P(A) =n(A)

n(S)

Teorema 8.1 Sea S un espacio muestral finito, y para cualquier A∈ S sea

P(A) =n(A)

n(S)

Entonces P cumple los axiomas A1, A2 y A3.

Ejemplo 8.3 Supongamos que se elige aleatoriamente a un estudiante entre 80, de los cuales 30estudian matematicas, 20 quımica y 10, ambas. Hallar la probabilidad p de uqe un estudiante esta es-tudiando matematicas o quımica.

Sea S un espacio muestral finito, digamos S =a1, a2, . . . , an un espacio probabilıstico finito, omodelo probabilıstico finito, se obtiene asinando a cada punto ai de S un numero real pi llamadoprobabilidad de ai, que cumple con las siguientes propiedades:

a) cada pi es no negativo, pi ≥ 0

b)∑n

i=1 pi = 1

Ejercicios 5 .

1. Tres caballos estan en una carrera: A tiene el doble de posibilidades de ganar que B, y este,el doble de C. Hallar sus respectivas probabilidades de ganar.

2. Supongamos que A y B son sucesos con

P(A) = 0,6; P(B) = 0,3 y P(A ∩B) = 0,2

Hallar la probabilidad de

a) A no ocurra.

b) B no ocurra.

c) A o B ocurran

30

Page 31: Apuntes Proba

d) Ni A ni B ocurran

3. Una caja contiene dos calcetines blancos y dos azules. Se sacan dos aleatoriamente. Hallar laprobabilidad p de que sean del mismo color.

4. Un naipe ingles consta de 52 cartas agrupadas en cuatro pintas (corazon, pique, trebol ydiamante) y 13 “numeros” (As, 2, . . ., 9, 10, J, Q K). Se elige consecutivamente al azar ysin reemplazo cinco cartas de este naipe. Calcule las probabilidades de los siguientes eventoso sucesos:

a) Las primeras tres cartas son diamantes y las dos ultimas son pique.

b) Hay exactamente cuatro cartas del mismo “numero”.

c) Hay tres cartas de un mismo “nuumero” y dos de otro.

31

Page 32: Apuntes Proba

9. Probabilidad Condicionada e Independencia

9.1. Probabilidad Condicional

Definicion 9.1 Supongamos que A, B son sucesos de un espacio muestral S. La probabilidadcondicional que A ocurra dado que B ha ocurrido, P(A | B) se define y denota como

P(A | B) =P(A ∩B)

P(B), P(B) > 0

yP(A | B) = 0, si P(B) = 0.

P(A | B) mide en cierto modo la probabilidad relativa de A con respecto al espacio reducido deB.

Ejemplo 9.1 Hallar P(B | A) si:

1. A es un subconjunto de B.

2. A y B son mutuamente excluyentes. (Asumimos que P(A) > 0)

Teorema 9.1 Supongamos que S es un espacio equiprobable, y que A y B son sucesos. Entonces

P(A | B) =n(A ∩B)

n(B)

es una medida de probabilidad

Ejemplo 9.2 Se tiran un par de dados y se define

A: salga 2 en al menos uno de los dados

B: la suma es 6.

Encontrar P(A | B) y P(A)

Teorema 9.2 (Multiplicacion para la probabilidad condicional)

P(A ∩B) = P(B | A)P(A)

Corolario 1 P(A ∩B ∩ C) = P(C | A ∩B) ·P(B | A) ·P(A)

Ejemplo 9.3 Un lote contiene 12 objetos de los cuales 4 son defectuosos. Se sacan tres objetos alazar del lote, uno detras de otro. Hallar la probabilidad de los tres no sean defectuosos.

32

Page 33: Apuntes Proba

Definicion 9.2 Los sucesos A y B son independientes si P(A ∩ B) = P(A)P(B), de cualquierotra forma serıan dependientes.

Esta definicion nos lleva a concluir que A y B son sucesos independientes si

P(A | B) = P(A) y P(B | A) = P(B)

Nota:

1.- Se dice que A1, A2, . . . , An ∈ A son dos a dos independientes ssi

P(Ai ∩ Aj) = P(Ai) ·P(Aj) ∀ i < j

2.- Independencia dos a dos no implica independencia completa.

3.- La complementacion de uno o mas eventos no destruye la independencia.

4.- Sea C ∈ A un evento tal que P(C) > 0. Entonces A y B son condicionalmente independientesdado C,

A⊥B | C ⇔ P(A ∩B | C) = P(A | C) ·P(B | C)

5.- Observemos que los eventos disjuntos no son independientes a menos que uno de ellos tengaprobabilidad cero. Es decir, supongamos A ∩B = ∅ y A y B son independientes. Entonces

P(A)P(B) = P(A ∩B) = 0

y por lo tantoP(A) = 0 o P(B) = 0

Ejemplo 9.4 .

1. Consideremos los siguientes sucesos para una familia con ninos:

A = ninos de ambos sexos B= al menos un nino

a) Demostrar que A y B son sucesos independientes si la familia tiene tres hijos.

b) Demostrar que A y B son dependientes si la familia tiene solo dos hijos.

2. Consideremos un espacio equiprobable S = a, b, c, d, de ahı cada suceso elemental tiene lamisma probabilidad p = 1/4. Consideremos los sucesos

A = a, d B=b, d C=c, d

a) Demostrar que A, B, C son independientes dos a dos.

b) Demostrar que A, B, C no son independientes.

3. Demostrar que si A y B son sucesos independientes, entonces A y B son sucesos indepen-dientes.

33

Page 34: Apuntes Proba

4. Un equipo de futbol gana (G) con probabilidad 0.6, pierde (P) con una probabilidad 0.3 yempata (E) con probabilidad de 0.1. El equipo juega tres partidos en el fin de semana.

a) Determinar los elementos del suceso A, que el equipo gane al menos dos partidos y queno pierda, hallar P(A)

b) Determinar los elementos del suceso B, que el equipo gane, pierda y empate en algunorden; hallar P(B)

5. Urna de PolyaUna urna contiene a fichas azules y r fichas rojas. El experimento consiste en:

(i) Extraer una ficha y observar su color.

(ii) Devolver la ficha con t fichas adicionales del mismo color.

(iii) Seguir iterando

Para tres ectracciones defina:

Ai : la i-esima ficha es azul, i= 1, 2, 3.

Calcule P(A1 ∩ A2 ∩ A3)

34

Page 35: Apuntes Proba

9.2. Probabilidad Total

Definicion 9.3 Una familia de eventos B1, . . . , Bn ∈ A se llama particion de S si:

k⋃i=1

Ai = S y Ai ∩ Aj = ∅ ∀ i 6= j.

Teorema 9.3 Supongamos que los sucesos A1, A2, . . . , Ak forman una particion de S. Entoncespara cualquier evento B se tiene que

P(B) =k∑i=1

P(B | Ai)P(Ai)

9.3. Teorema de Bayes

Teorema 9.4 Bajo las mismas condiciones del teorema anterior se tiene que

P(Ai | B) =P(B | Ai)P(Ai)∑kj=1 P(Aj)P(B | Aj)

Ejercicios 6 .

1. El director de personal de una empresa que emplea vendedores a tiempo parcial ensaya unaprueba de aptitudes para las ventas con cientos de aspirantes. Como la prueba es nueva, losresultados no se utilizan para dar el empleo. El 40 % de los aspirantes muestra gran aptitudsegun la prueba, y el 12 % de los contratados muestra gran aptitud y alcanza buenas cuotasde ventas. La experiencia de la empresa indica que el 30 % del personal de ventas consiguebuenos niveles en las ventas.

a) Encuentre P(A), P(A∩B) y P(A/B)

b) ¿Son A y B eventos independientes?

c) ¿Es util la prueba para predecir buenos niveles en las ventas? ¿Que tanto?

d) ¿Cual es la probabilidad de que no ocurran ni A ni B?

2. Una companıa encuentra que el 46 % de sus jovenes directores esta casado con un(a) profe-sional, el 37 % esta casado, pero no con un(a) profesional y el 17 % son solteros.La companıa considera que el 40 % de los directores casados con profesionales rehusarıan sertransferidos a otra oficina, al igual que el 10 % de los solteros y el 15 % de los que no estancasados con profesionales.

a) Defina los cuatro eventos de interes. ¿Cual es la probabilidad de que un director seacasado? ¿y de que sea soltero?

b) Si a un director seleccionado al azar se le propone ser transferido, ¿cual es la probabilidadde que rechace la oferta?

c) Si un profesional rechaza ser trasladado, ¿cual es la probabilidad de que sea soltero?

35

Page 36: Apuntes Proba

d) ¿A que profesional usted no le ofrecerıa traslado, ya que cree que es muy probable querechace la oferta?

3. Supongamos que tenemos las tres cajas siguientes:

La caja A tiene 3 fichas rojas y 5 blancas.

La caja B tiene 2 rojas y una blanca.

La caja C tiene 2 rojas y 3 blancas.

Se escoge una caja al azar, y una ficha de dicha caja. Si la ficha es roja, hallar la probabilidadde que sea de la caja A.

4. En una ciudad el 40 % de la gente se considera conservadora (C), el 35 % liberales (L), y el25 % independientes (I). Durante las elecciones votaron el 45 % de los conservadores, el 45 %de los liberales y el 60 % de los independientes tambien. Si se elige un votante al azar, hallarla probabilidad de que el votante sea conservador, liberal e independiente.

5. En una universidad, el 4 % de los chicos y el 1 % de las chicas tienen una altura superior a180 cm. El 60 % de los alumnos son chicas. Supongamos que escogemos al azar un alumnoque mide mas de 180 cm. Hallar la probabilidad de que el alumno sea chica.

6. El gerente de una empresa regional dispone de dos autos; uno proporcionado por la empresa yel otro de su propiedad. La probabilidad que utilice su auto es 2/5 y la probabilidad que utiliceel auto de la empresa es 3/5. Ademas se sabe que le gerente llega a tiempo a las reunionesde la empresa con probabilidad 1/5 y que, si utiliza el auto de la empresa, la probabilidad dellegar a tiempo a esas reuniones es 1/4.¿Cual es la probabilidad que llegue a tiempo a una reunion, dado que utilizo su propio auto?Dado que el gerente llego a tiempo a la reunion, ¿cual es la probabilidad que haya utilizado elauto de la empresa?

7. Suponga que se ha elaborado un nuevo tipo de examen para detectar si una persona padece deun determinado tipo de cancer. Si una persona que padece de este tipo de cancer se somete alexamen, la probabilidad de observar una reaccion positiva es 0.95. En cambio, la probabilidadde observar reaccion positiva en una persona sana es 0.07. Se sabe ademas que el tipo especıficode cancer en cuestion afecta a solo 1 de cada 100.000 personas. Si una persona seleccionadaal azar reacciona positivamente al examen, ¿cual es la probabilidad de que esta persona tengael cancer en cuestion?

8. En la empresa Coca-Cola el llenado de las botellas con bebida es realizado automaticamentepor una maquina que funciona a distintas velocidades. La probabilidad de que el llenado seaincorrecto es de 0.001 cuando el proceso se realiza a baja velocidad. Cuando el proceso dellenado se realiza a alta velocidad, la probabilidad de llenado incorrecto es de 0.01. Supongaque el 25 % de las botellas son llenadas cuando el proceso se realiza a alta velocidad, mientrasque el resto de botellas son llenadas a una baja velocidad.

a) ¿Cual es la probabilidad de encontrar una botella con un volumen incorrecto en su inte-rior?

36

Page 37: Apuntes Proba

b) ¿Cual es la probabilidad de encontrar una botella llena con un volumen incorrecto y quehaya sido llenada cuando el proceso se realiza a baja velocidad?

c) ¿Cual es la probabilidad de que el proceso de llenado de las botellas haya sido a bajavelocidad, si se sabe que la botella esta efectivamente con un volumen incorrecto?

d) Si se encuentra una botella llenada con un volumen incorrecto, ¿Cual es la probabilidadde que haya sido llenada cuando el proceso se realiza a alta velocidad?

37

Page 38: Apuntes Proba

10. Variables Aleatorias

10.1. Introduccion

Informalmente una variable aleatoria puede definirse como una funcion numerica sobre Ω, elespacio muestral:

X : Ω→ R

X es una funcion tal que asigna a cada ω ∈ Ω un numero.

Nota: Usualmente, el recorrido de X, Rec(X), es un subconjunto de R.

Ejemplo 10.1 Sea Ω = CC, CS, SC, SS y sea la variable aleatoria definida por

X(ω) = numero de caras, ω ∈ Ω

¿Cual es el recorrido de la variable aleatoria X?

Formalmente:

Definicion 10.1 Dado un modelo de probabilidad (Ω,A,P), diremos que una funcion

X : Ω→ R

es una variable aleatoria ssi

ω ∈ Ω : X(ω) ≤ x ∈ A,∀x ∈ R

∴ X es una variable aleatoria en (Ω,A,P) ssi ω ∈ Ω : X(ω) ≤ x es un evento (aleatorio) enA,∀ x ∈ R

Notacion: Si el valor de la variable aleatoria se denota por una letra minuscula , la variablese denota por la letra mayuscula correspondiente. Normalmente se utilizan las ultimas letras delalfabeto.El suceso “el valor x de X pertenece al conjunto B”se denota por X ∈ B. Cuando B = x sesimplifica la notacion a X = x.

Definicion 10.2 Dada una variable aleatoria X definida en (Ω,A,P), la distribucion de pro-babilidad inducida por X en R se define, para un evento B ⊂ R como:

PX(B) = P(X−1(B))

donde X−1(B) = ω ∈ Ω : X(ω) ∈ B es un evento en Ω.

Conocer la distribucion de probabilidad para un subconjunto B implica que podemos PX paracualquier B ⊂ R (medible).

En general, cada B ⊂ R medible puede generarse a partir de uniones y/o intersecciones deintervalos de la forma [an, bn]. La coleccion de estos intervalos de la forma (a, b] genera una σ-algebra en R, llamada σ-algebra de Borel y denotada por B. Los elementos de B se llamanBorelianos y son subconjuntos medibles de R.

38

Page 39: Apuntes Proba

Proposicion 1 PX es una medida de probabilidad en (R,B) → (R,B,PX) es una medida deprobabilidad (inducida por la variable aleatoria X).

Definicion 10.3 La funcion definida por

FX(x) = PX((−∞, x])

= P(X ≤ x), x ∈ R

se llama funcion de distribucion acumulada, f.d.a, de la variable aleatoria X.

Propiedades

Sea FX(x), x ∈ R, la funcion distribucion de X,

P1)lım

x→−∞FX(x) = 0 y lım

x→∞FX(x) = 1

(0 ≤ FX(x) ≤ 1 ∀ x)

P2) Si x1 < x2, entonces FX(x1) ≤ FX(x2)

(FX es no decreciente en R)

P3)lımx→x0

FX(x) = FX(x0) ∀ x0 ∈ R

(FX es continua por la derecha)

39

Page 40: Apuntes Proba

10.2. Variables Aleatorias Discretas

FX(x), x ∈ R, es discreta ssi la variable aleatoria X es discreta, es decir, X asume valores enun subconjunto contable de R.

X(ω) ∈ x1, x2, . . . ∀ ω ∈ R

En tal caso, FX(x), x ∈ R, puede representarse como:

FX(x) =∑t≤x

P(X = t), x ∈ S,

dondeP(X = x), x ∈ R, se llama funcion de probabilidad.

Sigue de la definicion de P(X = x), x ∈ R, que:

i)P(X = x) ≥ 0 ∀ x ∈ R

ii) ∑x∈R

P(X = x) = 1

iii)

PX(B) = P(X ∈ B) =∑x∈B

P(X = x)

Ejemplo 10.2

Un dado no equilibrado asigna a la cara con el numero x probabilidades dadas por

p(x) = c× 0, 7x × 0, 36−x, x = 1, . . . , 6

1. Calcule el valor de c.

2. Haga una tabla con los valores de la funcion de distribucion F.

3. Utilice la tabla para calcular la probabilidad que

(i) El numero este entre 2 y 4.

(ii) El numero sea mayor que 2.

Ejemplo 10.3 Un embarque de 8 computadores similares se envıa a un distribuidor contiene 3 apa-ratos defectuosos. Si una escuela realiza una compra aleatoria de 2 de estos computadores, enceuntrela distribucion de probabilidad y la f.d.a del numero de computadores defectuosos.

Ejemplo 10.4 Si 50 % de los automoviles extranjeros que vende una agencia esta equipado paratrabajar con diesel, encuentre una formula para la distribucion de probabilidad del numero de modelosdiesel entre los proximos 4 automoviles que venda esta agencia. Determine la f.d.a de la variablede interes.

40

Page 41: Apuntes Proba

10.3. Variables Aleatorias Continuas

FX(x), x ∈ R es continua ssi existe una funcion no negativa fX(x), x ∈ R, tal que:

FX(x) =

∫ x

−∞fX(t)dt, ∀ x ∈ R

fX(x) =dFX(x)

dxdonde fX(x) se denomina funcion de densidad de la variable aleatoria X.

Note que:

i)fX(x) ≥ 0 ∀ x

ii) ∫ ∞−∞

fX(x) dx = 1

iii)

PX(B) = P(X ∈ B) =

∫B

fX(x)dx

Si B es un intervalo, por ejemplo, B = (a, b), entonces se tiene lo siguiente:

PX(B) = P(a < X < b)

= P(a < X < b)

= P(a < X ≤ b) pues P(X = b) = 0,

= FX(b)− FX(a)

=

∫ b

−∞fX(x) dx−

∫ a

−∞fX(x) dx =

∫B

fX(x) dx

Ejemplo 10.5 Suponga que el error de la temperatura de reaccion, en C, para un experimentocontrolado de laboratorio es una variable aleatoria continua X, que tiene funcion de densidad deprobabilidad:

fX(x) =

x2

3, -1 < x < 2

0, e.o.c.

a) Verifique la condicion (ii).

b) Encuentre P(0 < X ≤ 1)

Definicion 10.4 La distribucion acumulada FX(x) de una variable aleatoria continua X condensidad fX es:

FX(x) = P(X ≤ x) =

∫ x

−∞fX(t) dt x ∈ R

Ejemplo 10.6 Para la funcion de densidad del ejemplo anterior, encuentre FX y utilıcela paracalcular P(0 < X ≤ 1)

41

Page 42: Apuntes Proba

10.4. Localizacion y dispersion de una variable aleatoria

Definicion 10.5 La esperanza de una variable aleatoria X se define como:

E(X) =

∞∑i=1

xifx(xi), X discreta∫ ∞−∞

xfX(x)dx, X continua

Notacion: µX = E(X)

Propiedades

1.- La esperanza matematica es un operador lineal, esto es, si E(X) esta bien definida, entonces

E(aX + b) = aE(X) + b

2.- Si X e Y son variables aleatorias, entonces

E(X + Y ) = E(X) + E(Y )

3.- Si X e Y son variables aleatorias con esperanzas bien definidas y tales que

X(ω) ≤ Y (ω) ∀ ω

entonces E(X) ≤ E(Y )

Definicion 10.6 La mediana de una variable aleatoria X es algun numero m tal que:

P(X ≥ m) ≥ 1/2 y P(X ≤ m) = 1/2

Notas:

i) Si X tiene distribucion simetrica y E(X) <∞, entonces E(X) es una mediana para X.

ii) Si X tiene distribucion asimetrica, la mediana de X puede ser una mejor medida de localiza-cion.

Dos distribuciones pueden tener la misma localizacion y ser completamente diferentes, por loque hay que considerar una medida de dispersion de la variable, la mas comun, es la varianza.

Definicion 10.7 La varianza de una variable aleatoria X se define como

V (X) = E[(X − E(X))2]

V (X) =

∞∑i=1

(xi − E(X))2P(X = xi)∫ ∞−∞

(x− E(X))2fX(x)dx

Notacion: σ2X = V (X)

42

Page 43: Apuntes Proba

Propiedades

1.- V (X) = E(X2)− (E(X)2)

2.- V (X) ≥ 0, V (X) = 0↔ X = c

3.- V (aX + b) = a2V (X)

4.- Si X e Y son variables aleatorias, entonces

V(X + Y ) = V(X) + V(Y )− 2 · Cov(X, Y )

Solo en el caso en que X e Y son variables aleatorias independientes, entonces

V(X + Y ) = V(X) + V(Y )

Ejemplo 10.7 Sea X la variable aleatoria que cuenta el numero de caras en tres lanzamientos deuna moneda honesta. Determine el recorrido, la funcion de distribucion, valor esperado y varianzade X.

Ejemplo 10.8 Sea A un evento en (Ω,A,P), con P(A) = p, con 0 ≤ p ≤ 1. Usted paga $1 se Aocurre y $0 si A ocurre.Sea X la ganancia obtenida en un ensayo de este experimento. Determine esperanza y varianza deX.

43

Page 44: Apuntes Proba

10.5. Casos especiales de distribuciones probabilidad

10.5.1. Distribucion Bernoulli

Consideremos un experimento con solo dos resultados posibles, uno que se llame exito (E) yotro, fracaso (F). Los resultados sucesivos e independientes de tal experimento se llaman pruebaso experimentos Bernoulli.En realidad, cualquier experiemnto puede ser usado para definir un ensayo Bernoulli simplementedenotando algun evento de interes, A, como exito y su complemento, A, como fracaso.

Notacion: X ∼ Bernoulli(p) y su funcion de probabilidad esta dada por

P(X = x) = px(1− p)1−x, x = 0, 1

donde

E(X) = p

V (X) = p(1− p)

10.5.2. Distribucion Binomial

Un experimento que consiste de n ensayos Bernoulli independientes, cada uno con probabilidadde exito p, se llama un experimento Binomial con n ensayos y parametro p.Al decir “ensayos independientes”significa que los ensayos son eventos indeoendientes esto es, loque ocurra en un ensayo no tiene efecto en el resultado observado para cualquier otro ensayo.

Definicion 10.8 Sea X el numero total de exitos observados en un experimento Binomial con nensayos y parametro p. Entonces X se llama variable aletoria Binomial con parametros n y py se denota

X ∼ Bin(n, p)

y su funcion de probabilidad esta dada por

P(X = x) =

(n

x

)px(1− p)n−x, x = 0, 1, . . . , n

Teorema 10.1 La esperanza y varianza de la distribucion Binomial estan dadas por:

E(X) = n · pV (X) = n · p · (1− p)

Ejemplo 10.9 Se sabe que el numero de pacientes graves en una urgencia es una variable aleatoriaBinomial con una media de 12 pacientes graves y una varianza de 3. Determine la probabilidad queen un dıa haya a lo menos 2 pacientes en estado grave.

44

Page 45: Apuntes Proba

10.5.3. Distribucion Geometrica

Definicion 10.9 Si se realizan repetidos experimentos Bernoulli independientes con probabilidad deexito p, entonces la distribucion de la variable aleatoria X, el numero de experimentos necesarioshasta encontrar el primer exito sigue una distribucion geometrica de parametro p y se denotapor:

X ∼ Geo(p)

con funcion de probabilidad dada por

P(X = x) = (1− p)x−1p, x = 1, 2, 3, . . .

Teorema 10.2 La esperanza y varianza de la distribucion geometrica estan dadas por:

E(X) =1

p

V (X) =1− pp2

Ejemplo 10.10 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hastaobtener un 5.

10.5.4. Distribucion Binomial Negativa

Definicion 10.10 Consideremos ensayos Bernoulli independientes con probabilidad de exito p encada ensayo. Si X es el numero de ensayos necesarios para observar el r-esimo exito, entonces Xse llama variable aleatoria Binomial negativa con parametros r, y p su funcion de probabilidadesta dada por

P(X = x) =

(x− 1

r − 1

)pr (1− p)x−r, x ∈ r, r + 1, . . .

y se denota porX ∼ BinNeg(r, p)

Teorema 10.3 La esperanza y varianza de la distribucion Binomial Negativa estan dadas por:

E(X) =r

p

V (X) =r(1− p)p2

Ejemplo 10.11 Cacule la probabilidad de que deba lanzar un dado por lo menos 6 veces hastaobtener 5 tres veces.

45

Page 46: Apuntes Proba

10.5.5. Distribucion Poisson

Definicion 10.11 Una variable aleatoria X que cuenta el numero de eventos que ocurren en unperıodo de tiempo tiene distribucion Poisson de parametro λ > 0, y su funcion de probabilidadesta dada por

P(X = x) =e−λλx

x!, x = 0, 1, . . .

y se denota porX ∼ Poisson(λ)

Teorema 10.4 La esperanza y varianza de la distribucion Poisson estan dadas por:

E(X) = λ

V (X) = λ

Ejemplo 10.12 Se sabe que los pacientes llegan de acuerdo a una distribucion Poisson con λ = 3pacientes/minuto. Cuando llegan mas de 4 pacientes por minuto la secretaria se ve sobrepasada yel servivio de atencion es calificado como deficiente. ¿Cual es la probabilidad de que el sistema seacalificado como no deficiente?

10.5.6. Distribucion Uniforme

Definicion 10.12 Una variable aleatoria X tiene distribucion uniforme si su densidad se dis-tribuye por igual entre dos valores cualquiera a y b. Su funcion de densidad esta dada por

fX(x) =

1b−a , a < x < b,

0, e.o.c.

Notacion: X ∼ U(a, b)

Teorema 10.5 La esperanza y varianza de la distribucion Uniforme estan dadas por:

E(X) =a+ b

2

V (X) =(b− a)2

12

Ejemplo 10.13 En los dıas del verano, X, el tiempo de retraso de un tren del Metro, se puedemodelar como distribuida uniformemente entre 0 y 20 minutos.

1. Calcule la probabilidad de que el tren llegue por lo menos con 8 minutos de retraso.

2. Calcule la desviacion estandar del tiempo de retraso del tren.

46

Page 47: Apuntes Proba

10.5.7. Distribucion Exponencial

Definicion 10.13 Suponga que los eventos suceden aleatoriamente a lo largo del tiempo, con untiempo esperado entre eventos β. Sea X, la variable aleatoria que cuenta el tiempo para el siguienteevento, entonces X tiene distribucion exponencial y su funcion densidad esta dada por

fX(x) =

e−x/β, x > 0,

0, e.o.c.

donde β > 0 y se denota por

X ∼ exp(β)

Teorema 10.6 La esperanza y varianza de la distribucion Exponencial estan dadas por:

E(X) = β

V (X) = β2

Ejemplo 10.14

En un centro rural para la atencion de emergencias el tiempo entre llegadas sigue una distribucionexponencial con un tiempo media de llegadas de 1.25 horas. Encuentre la probabilidad de que eltiempo entre llegadas sea mayor a 1 hora. Encuentre la probabilidad de que el tiempo entre llegadassea mayor a 2 horas.

10.5.8. Distribucion Normal

Definicion 10.14 La variable aleatoria X tiene distribucion normal con media µ y varianza σ2

si su funcion de densidad esta dada por

fX(x) =1√

2πσ2e−

(x−µ)2

2σ2 , −∞ < x <∞

Notacion: X ∼ N(µ, σ2)

Definicion 10.15 Si Z es una variable aleatoria normal con media 0 y varianza 1, entonces Z sellama variable aleatoria normal estandar.

Cualquier variable aleatoria normal X se puede transformar en una variable aleatoria normalestandarizada Z, sustrayendo el valor esperado µ y dividiendo el resultado por σ.

Ejemplo 10.15 Considere la distribucion normal estandar con media µ = 0 y desviacion σ = 1.

1. ¿Cual es la probabilidad que z sea mayor que 2,6?

2. ¿Cual es la probabilidad que z sea menor que 1,3?

3. ¿Cual es la probabilidad que z este entre -1.7 y 3.1?

4. ¿Cual es el valor de z que corta el 15 % menor de la distribucion?

47

Page 48: Apuntes Proba

Ejercicios 7 .

1. Clasifique las siguientes variables como discretas o continuas.

X : el numero de accidentes de automovil por ano en la ciudad de Santiago.

Y : el tiempo que toma jugar 18 hoyos de golf.

M : la cantidad de leche producida anualmente por una vaca en particular.

N : el numero de huevos que pone mensualmente una gallina.

P : el numero de permisos para la construccion de edificios que otorga mensualmente unamunicipalidad.

Q : la cantidad de kilos de manzanas que exporta una empresa.

2. Sea X = numero de sustancias nocivas en un material de trabajo escogido al azar.

x 0 1 2 3 4p(x) 0.3 0.2 0.1 0.05 0.05p(x) 0.4 0.1 0.1 0.1 0.3p(x) 0.4 0.2 -0.3 0.5 0.2

a) ¿Cual de las siguientes tres funciones de probabilidad es una funcion de probabilidadlegitima para X, ¿Por que no se permiten las otras 2?

b) Para la funcion de probabilidad legitima de la parte anterior. Calcule P(2 ≤ X ≤ 4),P(X ≤ 2) y P(X 6= 0)

c) Escriba la funcion de probabilidad acumulada.

d) Si p(x) = c · (5− x) para x = 0, 1, 2, 3. ¿Cual es el valor de c?

3. Una firma de inversiones ofrece a sus clientes bonos municipales que vencen despues de di-ferente numero de anos. Dada la distribucion acumulada de T , el numero de anos para elvencimiento de un bono seleccionado aleatoriamente es

FT (t) =

0, t < 1,14, 1 ≤ x < 3

12, 3 ≤ x < 5

34, 5 ≤ x < 7

1, t ≥ 7.

Encuentre

a) P(T = 5)

b) P(T > 5)

c) P(1,4 < T < 6)

48

Page 49: Apuntes Proba

4. Ciertos ıtemes son producidos por una maquina, cada item es clasificado como de primera osegunda calidad; los ıtemes de segunda calidad representan al 5 % de la produccion total. Si seinspeccionan ıtemes hasta que se encuentra el quinto de segunda calidad,

a) Determine la variable aleatoria y su funcion de probabilidad.

b) ¿Cual es el numero esperado de ıtemes que se deben inspeccionar para detectar el quintode segunda calidad?

c) ¿Cual es la probabilidad de que se tengan que inspeccionar 7 artıculos?

5. Se sabe que el 60 % de estudiantes de la Universidad son fumadores. En una muestra aleatoriade 12 alumnos,

a) ¿Cual es la probabilidad que haya exactamente dos fumadores?

b) ¿Cual es la probabilidad que sean fumadores solo los dos primeros alumnos entrevistados?

c) ¿Cual es el numero esperado de fumadores?

6. Ocasionalmente aplicaciones de laser se usan para destruir celulas cancerıgenas. El exito deuna aplicacion se evalua con un examen histologico. Suponga que una aplicacion es exitosacon probabilidad p. En caso cuya gravedad lo amerita, aplicaciones se repiten hasta contrartres examenes que indiquen exito.

a) Calcule la probabilidad de que un paciente dado requiera seis aplicaciones

b) Calcule la probabilidad que un paciente dado requiera menos de seis aplicaciones

7. Suponga que se realizan n lanzamientos independientes de una moneda sesgada, con probabi-lidad de cara α, 0 < α < 1.

a) Determine la probabilidad de obtener exactamente n− 1 caras, dado que se obtienen a lomenos dos caras en total.

b) Determine la probabilidad de obtener exactamente n− 1 caras, dado que se obtiene caraen cada uno de los primeros n− 2 lanzamientos.

8. Usted recibe correos electronicos durante una jornada que se define como el perıodo de tiempoque va desde las 8 de la manana a las 20 horas. Solo en este perıodo ustede puede leer suscorreos. Suponga que los correos se reciben de acuerdo a un proceso de Poisson a un tasa (orazon) de 0,2 mensajes por hora.

a) Usted lee sus correos cada hora durante una jornada. ¿Cual es la probabilidad de que enuna hora dada no encuentre mensajes nuevos? ¿Y cual es la probabilidad de encontrar alo mas un mensaje nuevo en esa hora?

b) Suponga que debido a un viaje usted no ha leıdo su correo durante toda una jornada.¿Cual es la probabilidad de que haya recibido exactamente 2 mensajes?

c) Dado que en la ultima jornada usted ha recibido 7 correos en total, calcule la probabilidadde que entre las 8 y 10 de la manana usted haya recibido exactamente 3 mensajes?Verifique que esta probabilidad es igual a P(X = 3) cuando X ∼ Binomial(n, p), eidentifique los parametros.

49

Page 50: Apuntes Proba

9. Un peaje cobra $2000 por cada autobus de pasajeros y $3500 por otros vehıculos particulares.Supongamos que durante las horas diurnas, el 60 % de todos los vehıculos son autobuses depasajeros.

a) Si 25 vehıculos cruzan el peaje durante un perıodo particular diurno, ¿cual es el ingresoesperado en el peaje?; ¿cual es la varianza del ingreso del peaje?

b) Suponga que los vehıculos de pasajeros llevan un promedio de 15 pasajeros y los parti-culares un promedio de 3 pasajeros. ¿Cual es la probabilidad de que un vehıculo que sedetiene en el peaje lleve cuatro pasajeros?

c) Un vehıculo es detenido en el peaje y lleva tres pasajeros, ¿cual es la probabilidad de quesea de tipo particular?

10. Una fabrica de motores cerrara si tiene mas de dos fallas en un dıa durante los proximos 15dias. La probabilidad de que alguno de estos tenga fallas en cada intento es de 0,03 y cada dıase producen 10 motores.

a) ¿Cual es la probabilidad de que la fabrica cierre?

b) ¿Cual es la probabilidad de que la fabrica no cierre?

c) ¿Cual es la probabilidad de que ocurran 2 o mas fallas todos los dıas?

d) ¿Cuantos dıas tendrıa que haber fallas para que la probabilidad de cierre sea de 0,5?

11. Si el 90 % de todos los solicitantes para cierto tipo de hipoteca no llenan correctamente elformato de solicitud en la primera remision, ¿Cual es la probabilidad de que entre 15 de estossolicitantes seleccionados al azar:

a) Por lo menos 12 no la llenen a la primera remision.

b) Entre 10 y 13 inclusive no la llenen a la primera remision.

c) A lo sumo 2 llenen correctamente sus formatos en la primera remision.

12. Una companıa de seguros esta considerando incluir la cobertura de una enfermedad extrana enel campo de seguros medicos. La probabilidad de que un individuo seleccionado aleatoriamentetenga esta enfermedad es 0,001 y se incluyen 3000 individuos en el grupo asegurado. Se pidedeterminar:

a) ¿Cual es el numero esperado de personas del grupo que padecen dicha enfermedad?

b) ¿Cual es la probabilidad de que ninguna persona del grupo de 3000 padezca la enfermedad?

13. Una variable aleatoria continua X que puede tomar valores entre x=2 y x=5 tiene una funcionde densidad

fX(x) =2(1 + x)

27

Calcule

a) P(X < 4)

b) P(3 < X < 4)

50

Page 51: Apuntes Proba

14. Considere la funcion de densidad

fX(x) =

k√x, 0 < x < 1

0, e.o.c.

a) Encuentre el valor de k.

b) Encuentre FX(x) y utlıcela para calcular

P(0,3 < X < 0,6)

15. Un individuo dispara dardos sobre un blanco circular de radio r > 0. Suponga que la probabili-dad de que el dardo caiga en un circulo concentrico (centrado en el origen) es proporcional alarea de dicho cırculo. Sea X la distancia desde la posicion en que el dardo impacta el tableroy su centro.

a) Obtenga la funcion de distribucion acumulada, funcion de densidad y valor esperado deX.

b) Calcule la probabilidad de que el dardo aterrice a una distancia (j − 1)r/4 y jr/4 delorigen j = 1, 2, 3, 4.

c) Si se sabe que el dardo aterrizo a una distancia inferior a r/2 del centro ¿Cual es laprobabilidad de que haya caıdo a una distancia menor que d, con 0 < d < r/2?

16. Una maquina que marca numeros telefonicos al azar selecciona aleatoriamente cuatro dıgitosentre 0000 y 9999 (incluido ambos). Trate a la variable Y, el numero seleccionado, comosi fuese continua (aun cuando hay solo hay 10000 posibilidades discretas) y uniformementedistribuida.

a) Encuentre P(0300 < Y < 1300)

b) P(Y > 5555)

c) Encuentre la varianza de Y

17. En una central nuclear ocurren aleatoriamente a lo largo del tiempo “eventos poco comunes”(problemas menores de operacion). El tiempo medio entre dos eventos es 40 dıas.

a) ¿Cual es la probabilidad de que el tiempo para el siguiente “evento poco comun” se en-cuentre entre 20 y 60 dıas?

b) ¿Cual es la probabilidad de que pasen mas de 60 dıas sin probemas?

c) Encuentre la desviacion estandar del tiempo para el siguiente “evento poco comun”.

d) Un analisis de los archivos de la central nuclear muestra que los “eventos poco comu-nes” suceden con mayor frecuencia los fines de semana, ¿que hipotesis subyacente a lasrespuestas de las preguntas anteriores se pone en duda?

18. Sea Z una variable aleatoria normal estandarizada. Calcule:

a) P(0 ≤ Z ≤ 1,96)

51

Page 52: Apuntes Proba

b) P(Z > 1,96)

c) P(−1,96 ≤ Z ≤ 1,96)

d) P(0 ≤ Z ≤ 1,96)

19. Los ingresos anuales de los profesores de la universidad siguen una distribucion normal conmedia 18600 dolares y una desviacion estandar de 27000 dolares. Encuentre la probabilidadde que un profesor seleccionado al azar tenga

a) un ingreso anual inferior a 15000 dolares.

b) un ingreso mayor a 21000 dolares.

c) un ingreso mayor a 25000 y de a lo mas 30000 dolares.

20. La presion de aire de un neumatico seleccionado al azar, instalado en un automovil nuevo,esta normalmente distribuida con valor medio 31 lb / pulg y desviacion estandar de 0,2 lb /pulg

a) ¿Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, excedade 30.5 lb/ pulg?

b) ¿Cual es la probabilidad de que la presion de un neumatico, seleccionado al azar, seencuentre entre 30.5 y 31.5 lb/ pulg?

c) Suponga que un neumatico se considera con presion baja si esta debajo de 30.4 lb/ pulg .¿Cual es la probabilidad de que al menos uno de los cuatro neumaticos de un automovilse encuentre con presion baja?

21. La dureza Rockwell de un metal se determina al golpear con un punto acerado (herramienta) lasuperficie del metal y despues medir la profundidad de penetracion del punto. Suponga que ladureza Rockwell de cierta aleacion esta normalmente distribuida con media de 70 y desviacionestandar de 3.

a) Si un especimen es aceptable solo si su dureza esta entre 67 y 75, ¿Cual es la probabilidadque un especimen seleccionado al azar tenga una dureza aceptable?

b) Si la escala aceptable de dureza es (70−c; 70+c) ¿Para que valores de c tendrıan el 95 %de los especimenes una dureza considerada aceptable?

c) ¿Cual es la probabilidad de que a lo sumo ocho de diez especimenes, seleccionados inde-pendientemente, tengan una dureza menor a 73, 84?

22. Suponga que los niveles de colesterol para los adultos entre 20 y 74 anos de edad tienen mediaµ = 211mg/dl y desviacion estandar σ = 46mg/dl. Se asume que por debajo de 200 mg/dllos niveles son normales, entre 200 y 240 mg/dl el nivel es normal-alto y mas de 240 es alto.

a) ¿Cual es la probabilidad de estar en cualquiera de las tres categorıas?

b) Si se eligen 10 adultos al azar, cual es la probabilidad que a lo mas tres de ellos tengancolesterol alto?

52

Page 53: Apuntes Proba

10.6. Funciones de Variables Aleatorias

Definicion 10.16 Sea X una variable aleatoria y sea g una funcion con dominio en S y valores enR. El valor esperado de g(X) esta dado por

E(g(X)) =

∞∑i=1

g(xi)P(X = xi), X discreta∫ ∞−∞

g(x)f(x)dx, X continua

10.6.1. Momentos y funciones generadoras de momentos

Definicion 10.17 Dada una variable aleatoria X se definen:

(i)

E(Xk) =

∞∑i=1

xki fx(xi), X discreta∫ ∞−∞

xkfX(x)dx, X continua

como el k-esimo momento (no centrado) de X.

(ii)

E((X − µ)k) =

∞∑i=1

(xi − µ)kfx(xi), X discreta∫ ∞−∞

(x− µ)kfX(x)dx, X continua

como el k-esimo momento centrado de X.

Definicion 10.18 La funcion generadora de momentos (f.g.m.) de una variable aleatoria Xse define como

MX(t) =

∞∑i=1

etxifx(xi),∫ ∞−∞

etxfX(x)dx,

con t ∈ R.

Ejemplo 10.16 Determine su funcion generadora de momentos para las siguientes distribuciones:

a) X ∼ Bin(n, p)

b) X ∼ N(0, 1)

Teorema 10.7 Sea X una variable aleatoria con funcion generadora de momentos MX(t). Entonces

E(Xk) =dkMX(t)

dtk

∣∣∣∣t=0

53

Page 54: Apuntes Proba

Ejemplo 10.17 Utilizando las respectivas f.g.m calcule la media de X si

a) X ∼ Bin(n, p)

b) X ∼ N(0, 1)

Teorema 10.8 (Teorema de Unicidad)Sean X e Y dos avriables aleatorias con funciones generadoras de momentos MX(t) y MY (t), res-pectivamente. Si MX(t) = MY (t) para todos los valores de t, entonces X e Y tienen la mismadistribucion de probabilidad.

Teorema 10.9 Si Y = cX + d, entonces MY (t) = etdMX(t)

Ejemplo 10.18 Sea X una variable aleatoria con distribucion normal estandar. Determine laf.g.m. de Y = µ+ σX.

10.6.2. Transformacion de variables

Frecuentemente, en estadıstica, se presenta la necesidad de deducir la distribucion de probabili-dad de una funcion de una o mas variables aleatorias. Por ejemplo supongamos que X es una variablealeatoria discreta con distribucion de probabilidad f(x) y supongamos ademas que Y = g(X) de-fine una transformacion uno a uno entre los valores de X e Y . Se desea encontrar la distribucionde probabilidad de Y . Es importante resaltar el hecho que la transformacion uno a uno implicaque cada valor de x esta relacionado con un, y solo un valor de y = g(x) y que cada valor de yesta relacionado con un, y solo un valor de x = g−1(y).

Teorema 10.10 Sea X una variable aleatoria discreta con distribucion de probabilidad f(x). SiY = g(X) define una transformacion uno a unn entre los valores de X e Y de tal forma que laecuacion y = g(x) pueda resolverse unicamente para x en terminos de y. Entonces la distribucionde probabilidad de Y es

fY (y) = fX(g−1(y))

Ejemplo 10.19 Sea X una variable aleatoria geometrica con distribucion de probabilidad

fX(x) =3

4

(1

4

)x−1

, x = 1, 2, . . .

a) Encuentre al distribucion de la variable aleatoria de Y = X2

b) Encuentre la distribucion para la variable aleatoria Z = 4− 5X

Teorema 10.11 Suponga que X es una variable aleatoria continua con distribucion de probabilidadf(x). Sea Y = g(X), con g una funcion uno a uno entre los valores de X e Y . Entonces ladistribucion de probabilidad de Y esta dada por

fY (y) = fX(g−1(y))|J |

donde J = (g−1(y))′ y recibe el nombre de Jacobiano de la tranformacion.

54

Page 55: Apuntes Proba

Ejemplo 10.20 .

a) Sea X una variable aleatoria continua con funcion densidad

fX(x) =x

12, 1 < x < 5

Encuentre la distribucion de probabilidad de la variable aleatoria Y = 2X − 3.

b) Sea X una variable aleatoria con densidad Beta(a,b), es decir,

fX(x) =Γ(a+ b)

Γ(a)Γ(b)xa−1(1− x)b−1, 0 < x < 1.

Determinar la distribucion de Y = 1 - X.

Teorema 10.12 Sea X una variable aleatoria continua con funcion densidad fX(x). Si Y = g(X)es una transfromacion entre los valores de X e Y que no es uno a uno, es decir, para cada y ∈ Rexisten k inversas, xi = g−1

i (y), i = 1, . . . , k, entonces la distribucion de probabilidad de Y es

fY (y) =k∑i=1

fX(g−1i (y))|Ji|

donde

|Ji| =d

dyg−1i (y) i = 1, . . . , k.

Ejemplo 10.21 . Sea X una variable aleatoria con densidad

fX(x) =1

2e−|x|, −∞ < x <∞.

Determinar la distribucion de Y = |X|.

Ejercicios 8 .

1. Si X ∼ U(0, 1), encontrar al funcion densidad de Y = eX

R: fY (t) = 1t

1 < t < e.

2. Si Y ∼ U(0, 5), ¿cual es la probabilidad de que las raıces de la ecuacion 4x2 +4xY +Y +2 = 0sean ambas reales?R: 3

5

3. Un entero positivo I es seleccionado con P(I = n) = 12n

para n = 1, 2, . . . Si el entero es n, selanza la moneda al aire y la probabilidad de obtener una cara es e−n. ¿Cual es la probabilidadque al lanzar la moneda obtengamos cara?R: 1

2e−1

55

Page 56: Apuntes Proba

4. Se dice que X tiene distribucio Weibull si

fX(x) =

λαxα−1exp(−λxα), x > 0;0, e.o.c.

Se asume que α > 0 y λ > 0. Determine E(X). ¿Cual es la distribucion de Y = Xα?

5. Encuentre la funcion generadora de momentos de una variable aleatoria X ∼ U(a, b). Useeste resultado para calcular E(X) y V (X).

6. Sea X un variable aleatoria que sigue cada una de las siguientes distribuciones:

a) Bin(n,p)

b) Poisson(λ)

c) Geom(p)

d) U(m,n), m < n.

Para cada distribucion calcule

a) E(X)

b) E(X(X-1))

c) E(X2)

d) V(X)

e) E(zX), donde z es un numero real.

7. A traves de experimentos estadısticos se determino que la duracion de un cierto tipo de llamadatelefonica satisface la relacion P(T > t) = ae−λt + (1 - a)e−ξt, t ≥ 0, donde 0 ≤ a ≤ 1,λ, ξ > 0. Hallar la media y la varianza de T.

8. Suponga que X tiene funcion densidad

g(x) = ce−cx, x ≥ 0.

a) Encuentre la distribucion de X1+X

b) Encuentre la distribucionde X + c

9. Suponiendo que X tienen la siguiente funcion de densidad

f(x) = λe−λ(x−a), x ≤ a.

a) Encuentre MX(t).

b) Calcular E(X) y V(X).

10. Sea X una variable aleatoria que satisface

P(X > t) = e−t2

t > 0.

56

Page 57: Apuntes Proba

a) Calcule P(1 < X < 2)

b) Encuentre la funcion densidad de probabilidad de X.

c) Calcule E(X2)

d) Calcule el percentil 90 de la distribucion de X.

e) Encuentre la funcion distribucion acumulada de 1X

11. Sea X una variable aleatoria con funcion densidad dada por

fX(x) =|x|16, si |x| < 4.

a) Determine E(X).

b) Encuentre la funcion de distribucion acumulada de Y = |X|.c) Determine E(Y).

12. Suponga que el numero de horas X que funcionara una maquina antes de fallar es una varia-ble aleatoria con distribucion Normal de parametros µ = 720 y σ2 = 482.

Suponga que en el momento en que la maquina comienza a funcionar Ud. debe decidir cuandoel inspector regresara a revisarla. Si el vuelve antes de que la maquina falle, se ocasiona uncosto de a dolares por haber desperdiciado una inspeccion. Si vuelve despues de que la maquinahaya fallado, se ocasiona un costo de b dolares por el no funcionamiento de la maquina.

a) Determine una expresion para el costo esperado, considerando que el tiempo hasta que elinspector vuelve a inspeccionar la maquina es de t horas.

b) Suponga que el inspector decide volver en un tiempo de t = 816 hrs. Calcule la probabi-lidad de que el inspector llegue tarde a la inspeccion, es decir, la maquina ya ha dejadode funcionar.

c) Se observa este proceso durante 15 perıodos. Determine la probabilidad de que el inspectorllegue tarde mas de 12 veces.

57

Page 58: Apuntes Proba

10.7. Aproximacion de distribuciones

Sea una variable aleatoria X ∼ Bin(n, p), por ejemplo, suponga que recoge la opinion de unamuestra de 1000 electores para saber su sentir en pro del fortalecimiento del gobierno de la ciudad.¿Cual es la probabilidad de encontrar 460 o menos electores a favor del fortalecimiento si suponemosque el 50 % de la poblacion esta a favor de el?En este caso, sea X el numero de electores en pro del fortalecimiento, con X ∼ Bin(1000, 1/2),entonces para calcular la probabilidad pedida P(X ≤ 460) debemos sumar 461 terminos, lo que noparece una tarea facil.

En este tipo de situaciones, donde el numero de ensayos es demasiado grande (≥ 20), aproxi-maremos nuestra distribucion de probabilidad a otro distribucion, dependiendo del valor de p, laprobabilidad de exito.

10.7.1. Aproximacion Poisson a la distribucion Binomial

Se sugiere aproximar a la distribucion Poisson una distribucion binomial para valores de n “muygrandes” y de p “muy pequena”. La regla es aproximar si p < 0,05 y n ≥ 20. Si n ≥ 100 la aproxi-macion es buena siempre y cuando np > 10.

En ambos casos λ = np y en vez de utilizar X ∼ Bin(n, p) usamos X ∼ P (np).

Ejemplo 10.22 Se sabe que el 5 % de los libros encuadernados en cierto taller tienen encuaderna-ciones defectuosas. Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller,tengan encuadernaciones defectuosas, usando,

a) la formula de la distribucion Binomial,

b) la aproximacion de Poisson a la distribucion Binomial.

10.7.2. Aproximacion Normal a la distribucion Binomial

Se sugiere aproximar la distribucion Normal a una distribucion binomial cuando n es “muygrande” y los valores de p son cercanos a 0.5.En tal caso, µ = np y σ2 = np(1 − p). Esta aproximacion deberıa utilizarse solo si np ≥ 5 yn(1− p) ≥ 5.

Ejemplo 10.23 Se considera un sindicato laboral en el cual el 40 % miembros esta a favor de lahuelga. Si se seleccionan 15 miembros de manera aleatoria, ¿cual es la probabilidad de que 10 apoyenun paro? Calcule dicha probabilidad utilizando las distribuciones Binomial y Normal por separadoy compare.

Ejercicios 9 El 45 % de todos los empleados del centro de capacitacion gerencial tiene tıtulos uni-versitarios. ¿Cual es la probabilidad de que de los 150 empleados seleccionados aleatoriamente, 72tengan un tıtulo univeristario?

58

Page 59: Apuntes Proba

11. Vectores Aleatorios

Definicion 11.1 X = (X1, X2, . . . , Xn) es un vector aleatorio definido en (Ω,A,P) ssi X1, X2, . . . , Xn

son variables aleatorias definidas en el mismo modelo (Ω,A,P).

11.1. Distribucion Conjunta

Definicion 11.2 La funcion definida por

FX1,X2,...,Xn(x1, x2, . . . , xn) = P(X1 = x1, X2 = x2, . . . , Xn = xn), x ∈ R

se llama funcion distribucion conjunta de X1, X2, . . . , Xn

Definicion 11.3 Sea X = (X1, X2, . . . , Xn) un vector aleatorio en (Ω,A,P). Diremos que:

a) X = (X1, X2, . . . , Xn) es discreto ssi

Rec(X)= Rec(X1, X2, . . . , Xn)

es un subconjunto contable (finito o no) de Rn.

En tal caso, la distribucion de probabilidad puede representarse mediante

P(X1 = x1, X2 = x2, . . . , Xn = xn) = P

( n⋂i=1

Xi = xi)

Ası,

(i) P(X = x) ≥ 0 ∀ x ∈ Rn

(ii)∑

P(X = xi) = 1

b) X = (X1, X2, . . . , Xn) es continuo ssi existe una funcion

fX1...Xn : Rn → R

no negativa tal que

FX1...Xn(x1, . . . , xn) =

∫ x1

−∞· · ·∫ xn

−∞fX1...Xn(t1, . . . , tn)dtn · · · dt1, ∀ x ∈ R

En tal caso

fX1...Xn(x1, . . . , xn) =∂n

∂x1 · · · ∂xnFX1...Xn(x1, . . . , xn)

Ejemplo 11.1 Sean X e Y variables aleatorias con funcion distribucion conjunta dada por

FXY (x, y) =

(1− e−x)(1− e−y), x >0, y > 0;0, e.o.c.

Determine fXY .

59

Page 60: Apuntes Proba

Definicion 11.4 La distribucion de probabilidad de X = (X1, X2, . . . , Xn) se define como:

PX(B) = P(X ∈ B) ∀ B ⊂ Bn

Ası, PX(B), B ⊂ Bn, es una medida de probabilidad.

⇒ (PX ,Bn,Rn) es una medida de probabilidad.

Proposicion 2 ∀ B ∈ Bn

PX(B) = P(X ∈ B) =

∑x∈B

P(X = x), X discreta∫x∈B

fX(x)dx, X continua

Teorema 11.1 Sea X un vector aleatorio continuo n- dimensional con densidad fX(x). Sea g =(g1, g2, . . . , gn) una funcion. Considere el vector aleatorio Y = g(X). Esto significa que se considerala transformacion

y1 = g1(x1, . . . , xn)

y2 = g2(x1, . . . , xn)

...

yn = gn(x1, . . . , xn)

Finalamente supongase que g y g−1 son continuas y dieferenciables. Entonces la densidad de Y es

fY (y) = |J |fX(g−1(y), g−12 (y), . . . , g−1

n (y)) y ∈ Rn

Ejemplo 11.2 Sean X e Y dos variables aleatorias continuas con distribucion de probabilidadconjunta

f(x, y) =

4xy, 0 < x < 1, 0 < y < 1;0, e.o.c.

Encuentre la densidad conjunta de W = X2 y Z = XY .

60

Page 61: Apuntes Proba

11.2. Distribuciones Conjuntas Especiales

Algunas distribuciones multivariadas conocidas se enuncian a continuacion:

Suponga que realiza N experimentos inpedendientes, en cada uno de los cuales puede obteneruno de los k resultados posibles, cada uno con probabilidad p1, p2, . . . , pk, respectivamente, y deseacontar cuantas repeticiones de cada resultado obtuvo.

Definicion 11.5 Las variables aleatorias X1, X2, . . . , Xk tienen una distribucion multinomialsi y solo si su distribucion de probabilidad conjunta esta dada por

P(X1 = x1, Xk = xk, . . . , Xk = xk, ) =

(n

n1 n2 · · · nk

)px1

1 px22 . . . pxkk

donder∑j=1

nj = n yk∑i=1

pi = 1

Lo que se denota como(X1, . . . , Xk) ∼Mult(n, p1, p2, . . . , pk)

Ejemplo 11.3 Suponga que los errores de cierto procedimiento de medicion tienen distribucionnormal de media 0 y desviacion estandar 2, en milımetros. Suponga que se toman 10 medicionesindependientes. Calcule la probabilidad que: por lo menos 9 mediciones tengan errores menores alos 2 milımetros y que no mas de una medicion tenga error mayor a los 3 milımetros.

Considere un conjunto de N elementos, de los cuales M1 son de la primera clases, M2 de lasegunda clase, y ası sucesivamente, hasta Mk de la k-esima clase, donde

∑Mi = N .

Definicion 11.6 Las variables aleatorias X1, . . . , Xk tienen una distribucion hipergeometricamultivariada si y solo si su distribucion de probabilidad conjunta esta dada por

P(X1 = x1, . . . , Xk = xk) =

(M1

x1

). . .(Mk

xk

)(Mn

)donde

k∑i=1

xi = n, yk∑i=1

Mi = N

Ejemplo 11.4 En un panel de presuntos jurados participan 6 hombres casados, tres hombres solte-ros, siete mujeres casadas y cuatro mujeres solteras. Si la seleccion es al azar, ¿cual es la probabilidadde que el jurado consita de 4 hombres casados, un soltero, cinco mujeres casadas y dos solteras?

61

Page 62: Apuntes Proba

Entre las distribuciones multivariadas continuas, la distribucion normal multivariada es de es-pecial importancia, ya que es una generalizacion de la distribucion normal en una variable.

Definicion 11.7 El vector aleatorio (X, Y ) tiene una distribucion normal bivariada si y solo sisu funcion densidad conjunta esta dada por

f(x, y) =1

2πσ1σ2

√1− ρ2

exp

− 1

2(1− ρ2)

[(x− µ1

σ1

)2

+

(y − µ2

σ2

)2

− 2ρ

(x− µ1

σ1

)(y − µ2

σ2

)]para x ∈ R, y ∈ R, σ1, σ2 > 0, y −1 < ρ < 1.

Teorema 11.2 Si dos variables aleatorias tienen una distribucion normal bivariada, son inpeden-dientes si y solo si ρ = 0.

62

Page 63: Apuntes Proba

11.3. Distribucion Marginal y Condicional

Dada la distribucion de probabilidad conjunta f(x, y) de las variables aleatorias X e Y , ladistribucion de probabilidad f(x) de X se obtiene al sumar f(x, y) sobre todos los valores de Y .De la misma forma, la distribucion de probabilidad f(y) se obtiene al sumar f(x, y) sobre todoslos valores de X. Cuando X e Y son variables aleatorias continuas, las sumas se reemplazan porintegrales.

Definicion 11.8 Las distribuciones marginales de X e Y estan dadas por

pX(x) =∑y

fXY (x, y) y pY (y) =∑x

fXY (x, y)

para el caso discreto y

fX(x) =

∫y

fXY (x, y)dy y fY (y) =

∫x

fXY (x, y)dx

para el caso continuo.

Definicion 11.9 Sean X e Y dos variables aleatorias discretas o continuas. La distribucion con-dicional de la variable aleatoria Y, dado que X=x, esta dada por:

fY |X(y) =fXY (x, y)

fX(y), fX(x) > 0

Ejemplo 11.5 Suponga que la fraccion X de atletas hombres y la fraccion Y de atletas mujeres queterminan la carrera del maraton puede describirse por la funcion densidad conjunta

fXY (x, y) = 8xy, 0 ≤ x ≤ 1, 0 ≤ y ≤ x.

Encuentre fX , fY y fY |X y determine la probabilidad de que menos de 1/8 de las mujeres que seinscribieron para un maraton en particular la finalicen, si se sabe que exactamente 1/2 de los atletashombres terminaron la carrera.

Definicion 11.10 Sean X e Y dos variables aleatorias, discretas o continuas, con distribucionde probabilidad conjunta fXY y distribuciones marginales fX y fY , respectivamente. Las variablesaleatorias X e Y se dice que son independientes estadısticamente, ssi

fXY (x, y) = fX(x)fY (y), ∀ x, y ∈ R

63

Page 64: Apuntes Proba

Ejercicios 10 .

1. Usted tiene una urna con r fichas rojas y n fichas negras, con r ≥ 2 y n ≥ 2. Usted extrae2 fichas al azar, sucesivamente y sin reemplazo. Para cada i ∈ 1, 2, defina: Xi = 1, si lai-esima bolita extraida es roja, y Xi = 0, si no.

a) Determine la funcion de probabilidad conjunta del vector (X1, X2).

b) Determine las distribuciones marginales de X1 y X2.

c) Obtenga la funcion de distribucion acumulada FX1X2(x1, x2) con (x1, x2 ∈ R2)

2. Sean X1, X2 variables aleatorias con distribucion exponencial de parametro λ1 y λ2 respecti-vamente. Suponga ademas que los eventos del tipo (X1 < c1) y (X2 < c2) son independientesentre sı para cualquier c1, c2 ∈ R+, de lo que se desprende que los eventos del tipo (X1 > c1)y (X2 > c2) tambien lo son. Considere las siguientes variables aleatorias

Z = maxX1, X2 y W = mınX1, X2.

a) Exprese FZ(z) en funcion de FX1(z) y FX2(z).

b) Calcule fZ(z).

c) Demuestre que W sigue una distribucion exponencial e identifique su parametro.

3. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta

fX,Y (x, y) = cxy, 0 ≤ x ≤ 1; 0 ≤ y ≤ 1

a) Calcule P(X ≤ t, Y ≤ t) para cualquier t ∈ (0,1).

b) Calcule P(X + Y ≥ 1).

4. Sean X e Y variables aleatorias con funcion de densidad de probabilidad conjunta

fX,Y (x, y) =

3x, 0 < y < x < 1;0, e.o.c.

a) Calcule fX , fY

b) Encuentre FX,Y (x, y) para 0 < y < x < 1.

c) Calcule P(Y > x/2)

5. Suponga que X e Y son variables aleatorias con densidad conjunta dada por:

fX,Y (x, y) = 120x(y − x)(1− y) 0 ≤ x ≤ y ≤ 1 ,

y 0 en otro caso.

a) Verifique que Y tiene distribucion Beta(α, β) e indique el valor exacto de α y β

b) Muestre que para todo 0 < t < 1, P (X ≤ t · Y ) = 3t2 − 2t3.

64

Page 65: Apuntes Proba

6. Suponga que X e Y son variables aleatorias con densidad conjunta dada por:

fX,Y (x, y) = 2x; 0 ≤ x ≤ 1, 0 ≤ y ≤ 1

a) Calcule P(X + Y ≤ t) para 0 ≤ t ≤ 2.Indicacion: Analice separadamente los casos 0 ≤ t ≤ 1 y 1 < t ≤ 2.

b) Obtenga la funcion de densidad de la variable aleatoria Z = X + Y.

c) Demuestre que sen(X) y ln(Y )2 son independientes.

7. Sean X e Y variables aleatorias independientes con distribucion Normal(0, σ2). Encuentre lasfunciones de densidad margina de U = X2 + Y 2 y V = X

Yy vea que estas son independientes.

8. Sea X e Y variables aleatorias independientes con funciones densidades marginales

fX(x) = xe−x, x > 0 y fY (y) = ey y > 0

Sean

Z = X + Y, y W =X

X + Y

a) Determine las respectivas densidades marginales de Z y W .

b) ¿Son Z y W variables aleatorias independientes?

c) Obtenga la funcion generadora de momentos de Z, MZ(t).

9. Sea (X, Y ) un vector bivariado discreto con funcion de probabilidad conjunta,

pX,Y (x, y) =cy

x+ 1, 1 ≤ x ≤ 3; 1 ≤ y ≤ x

Calcule pX(x) en funcion de la constante c y determınela.

10. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta

fX,Y (x, y) = c|y|e−x, 0 ≤ x ≤ ∞;−x ≤ y ≤ x

a) Encuentre la densidad marginal de X en termino de la constante c. Demuestre que c =1/2.

b) Encuentre la densidad marginal de Y y obtenga E(Y ).

c) Encuentre la densidad condicional de Y dado X = 1.

65

Page 66: Apuntes Proba

11.4. Esperanza y Varianza Condicional

Definicion 11.11 Dado un vector aleatorio (X,Y) la esperanza condicional de Y dado X=x sedefine como

E(Y |X = x) =

∑y

y P(Y = y|X = x), X discreta∫ ∞−∞

y fY |X(y)dy, X continua

Mas generalmente, si g : R −→ R

E(g(Y )|X = x) =

∑y

g(y)P(Y = y|X = x), X discreta∫ ∞−∞

g(y)fY |X(y)dy, X continua

Proposicion 3 Si E(|Y |) <∞

E[E(Y | X)] = E(Y )

Ejemplo 11.6 Sea Y |X = x ∼ U(0, 1− x) y fX(x) = 2(1− x), si 0 < x < 1. Determine E(Y ).

Propiedades:

i) E(c|X = x) = c

ii) E(Y1 + Y2|X = x) = E(Y1|X = x) + E(Y2|X = x)

iii) E(cY |X = x) = c · E(Y |X = x)

iv) E(g(X, Y )|X = x) = E(g(x, Y ))

En particular,E(g1(X)g2(Y )|X = x) = g1(x)E(g2(Y )|X = x)

v) E(g(Y )|X = x) = E(g(Y ))⇔ X es independiente de Y.

Definicion 11.12 La varianza condicional de Y dado X=x se define como

V(Y |X = x) = E[(Y − E(Y |X = x))2|X = x]

=

∑y

(y − E(Y |X = x))2P(Y = y|X = x), X discreta∫ ∞−∞

(y − E(Y |X = x))2fY |X(y)dy, X continua

Teorema 11.3 Suponga que E(Y 2) <∞

V(Y ) = E(V(Y |X)) + V(E(Y |X))

66

Page 67: Apuntes Proba

Ejemplo 11.7 Sean X e Y variables aleatorias continuas tales que X ∼ U(0, 1) e Y |X = x ∼U(x, x+ 1).

Calcule:

a) E(Y |X = x) y V(Y |X = x).

b) E(Y ) y V(Y ).

c) La densidad condicional de X dado Y = y.

d) E(X|Y = y) y E(Y |X = x).

e) Considere las funciones de variables aleatorias h(Y ) = E(X|Y ) y k(X) = E(Y |X). Calcule lafuncion de densidad de h(Y ) y la funcion de densidad de k(X).

Ejercicios 11 .

1. Sean X e Y variables aleatorias independientes con X ∼ Poisson(λ1), Y ∼ Poisson(λ2).

a) Muestre que Z = X +Y sigue una distribucion Poisson. Determine el parametro de estadistribucion.

b) Encuentre la funcion distribucion del vector (X,Z).

2. Sea X una variable aleatoria positiva con media α y varianza β. Condicional en el valorobservado x de X se generan variables aleatorias Y1, Y2, . . . , Yn independientes e identicamentedistribuidas Poisson(cx).

a) Calcule E(Y1) y V(Y2)

b) Sea Tn = 1n

∑Yi. Calcule E(Tn) y V(Tn).

3. Sean S y T variables aleatorias independientes con densidades marginales

fS(s) =1

2s2e−s, s > 0 y fT (t9 = 2t, 0 < t < 1.

a) Sea X=ST. Encuentre la densidad de probabilidad conjunta de X y S.

b) Calcule E(X|T = t) y obtenga E(X).

4. Sean N,X1, X2, . . . variables aleatorias independientes donde N ∼ Poisson(λ) y Xi ∼ U(0, θ),i = 1, 2, . . .Sea

T =N∑i=1

Xi

a) Encuentre E(T ) y V(T ).

b) Sea Z = maxX1, . . . , Xn. Encuentre E(Z).

67

Page 68: Apuntes Proba

5. Sean (X1, Y1), (X2, Y2), . . . vectores aleatorios tales iid donde X1 sigue una distribucion U(0,1)y la densidad condicional de Y1 dado X=x es

fY1|X1(y) =1

x2ye−y/x, y > 0

Sea

T =n∑k=1

Yk

a) Calcule E(T )

b) Calcule V(Tn

)

6. Sean X e Y variables aleatorias tales que Y |X = x ∼ Bin(x, p) y X ∼ Poisson(λ). Determinela distribucion de Y y calcule su esperanza.

68

Page 69: Apuntes Proba

12. Nociones de Convergencia

El objetivo de esta seccion es estudiar el comportamiento de una secuencia de variables aleatorias,Z1, Z2, . . . , Zn, cuando n→∞.

Definicion 12.1 Sea Zn, n ≥ 1 una secuencia de variables aleatorias en (Ω,A,P) y sea θ ∈ Runa constante.Diremos que Zn converge en probabilidad para θ ssi

∀ ε > 0, P(|Zn − θ| ≥ ε)→ 0, cuando n→∞

Notacion: ZnP→ θ

Ademas, note que ZnP→ θ ⇔ (Zn − θ)

P→ 0

Definicion 12.2 Sea Zn, n ≥ 1 una secuencia de variables aleatorias definidas en (Ω,A,P) ysea Z otra variable aleatoria, cuya distribucion no depende de n, la cual no necesita estar definidasobre el mismo espacio de probabilidad donde se encuentran definidas las Zn’s.Diremos que Zn converge en distribucion para Z ssi

FZn(z) = P(Zn ≤ z)→ P(Z ≤ z) = FZ(z)

cuando n→∞, ∀ z donde FZ es continua.

Notacion: ZnD→ Z o FZn → FZ

Las definiciones anteriores motivan el siguiente teorema:

Teorema 12.1 (del Lımite Central)Sean X1, X2, . . . , Xn una secuencia de variables aleatorias independientes con media µ y varianzaσ2 <∞. Entonces,

√nXn − µ

σ

D→ N(0, 1)

donde

Xn =n∑i=1

Xi

n

Aplicacion:Para n “suficientemente grande”

Xn → N(µ, σ2/n)

69

Page 70: Apuntes Proba

Ejercicios 12 .

1. La distribucion de las perdidas mensuales de una empresa en unidades monetarias (u.m.) esaproximadamente normal, con una media de µ = 3500 y una varianza de σ2 = 184900.

a) ¿Cual es al probabilidad de que las perdidas mensuales sean inferiores a 2500 u.m.?

b) ¿Que valor separa el 5 % inferior de la distribucion de las perdidas mensuales?

c) Describa la distribucion de medias muestrales de tamano 5 tomadas de esta poblacion.

d) ¿Que valor separa el 5 % inferior de la distribucion muestral de tamano 5?

e) Dada una muestra de las perdidas de 5 meses, ¿cual es la probabilidad de que las perdidasmensuales sean inferiores a 2500 u.m.?

f) ¿Cual es al probabilidad de que solo uno de los cinco meses se tenga una perdida menora 2500 u.m.?

2. Entre los adultos, la distribucion de niveles de albumina en el fluido cerebroespinal es apro-ximadamente simetrica con media µ = 29,5mg/100ml y una varianza σ2 = 85,56mg/100ml.Suponga que usted elige muestras repetidas de tamano 20 de esta poblacion y calcula la mediade cada muestra.

a) Si usted seleccionara una gran cantidad de muestras aleatorias de tamano 20, ¿Cual serıala media de las medias muestrales?

b) ¿Como se compara la desviacion estandar de las medias muestrales con al desviacionestandar de los niveles de albumina mismos?

c) Si usted toma todas las diferentes medias muestrales y las utiliza para construir un his-tograma, ¿Cual serıa la forma de su distribucion?

d) ¿Que proporcion de las medias muestrales de tamano 20 son mayores de 33 mg/100ml?

e) ¿Que proporcion de las medias son menores que 28 mg/100ml?

f) ¿Que proporcion de las medias se localizan entre 29 y 31 mg/100ml?

3. Para la poblacion de hombres adultos, la distribucion de pesos es aproximadamente normal,con media µ = 172,2 libras y una desviacion estandar de σ = 29,8 libras. Suponga que eligeuna sola muestra aleatoria de tamano 25 y encuentra que el peso medio de los hombres de lamuestra es = 190 libras. ¿Cuan probable es este resultado? ¿Que concluirıa usted?

70

Page 71: Apuntes Proba

Parte III

Inferencia Estadistica

13. Introduccion

La teorıa de la inferencia estadıstica consiste en aquellos metodos por los que se realizan in-ferencias o generalizaciones acerca de una poblacion. La tendencia actual es la distincion entre elmetodo clasico de estimacion de un parametro en la poblacion, por medio del cual las inferencias sebasan de manera estricta en informacion que se obtiene de una muestra aleatoria seleccionada de lapoblacion, y el metodo bayesiano, que utiliza el conocimiento subjetivo previo sobre la distribucionde probabilidad de los parametros desconocidos junto con la informacion que proporcionan los datosde la muestra. En este curso desarrollaremos los metodos clasicos para estimar los parametros dela poblacion desconocidos como la media, proporcion y varianza mediante el calculo de estadısticasde muestras aleatorias.

La inferencia estadıstica se puede dividir en doa areas principales: estimacion y pruebas dehipotesis. La estimacion de un parametro poblacional θ puede ser puntual, es decir, por algunmetodo deteminamos una formula en funcion de los datos para calcular el valor de este en la mues-tra, o intervalar, donde ademas de calcular el valor del parametro en la muestra establecemos ungrado de precision de nuestra estimacion. Con las pruebas de hipotesis lo que queremos es llegar ala decision correcta acerca de una hipotesis preestablecida, con alguna medicion de la precision denuestra decision.

Algunos conceptos de interes se definen a continuacion.

Definicion 13.1 Las variables aleatorias X1, . . . , Xn corresponden a una muestra aleatoria detamana n de una poblacion con funcion densidad f(x) si

X1, . . . , Xn son mutuamente independientes

X1, . . . , Xn tienen funcion densidad marginal f(x)

las variables X1, . . . , Xn se denominan independientes e identicamente distribuidas, iid, y escribi-mos

Xiiid∼ f(x), i = 1, . . . , n.

Definicion 13.2 Sean X1, . . . , Xn una muestra aleatoria de tamano n de una poblacion, y seaT (x1, . . . , xn) una funcion real o vectorial- valorada. Entonces, la variable (vector) aleatoria(o)

Y = T(X1, . . . , Xn)

se denomina estadıstico.

Definicion 13.3 Sea Z1, . . . , Zk un muestra aleatoria de la distribucion N(0, 1). Sea Y =∑k

i=1 Z2i .

Entonces Y tiene distribucion chi-cuadrado de Pearson con k grados de libertad y se denotapor

Y =k∑i=1

Z2i ∼ χ2

k

71

Page 72: Apuntes Proba

Teorema 13.1 La esperanza y varianza de una distribucion χ2 estan dadas por

E(Y ) = k

V(Y ) = 2k

Definicion 13.4 Sea Z0, Z1, . . . , Zk una muestra aleatoria de la distribucion N(0, 1) y sea Y =∑ki=1 Z

2i . Entonces

X =Z0√Y/k

tiene distribucion t-Student con n grados de libertad y se denota por

X ∼ tn

Teorema 13.2 Si X1, . . . , Xn es una muestra aleatoria de X ∼ N(µ, σ2) entonces:

a)

X =1

n

n∑i=1

Xi y

s2 =1

n− 1

n∑i=1

(Xi −X)2

son independientes.

b)(n− 1)s2

σ2∼ χ2

n−1

Definicion 13.5 Sean X, Y dos variables aleatorias independientes que tienen distribucion χ2 conn y m grados de libertad, respectivamente, es decir,

X ∼ χ2n e Y ∼ χ2

m

Entonces la variable aleatoria

Z =X/n

Y/m

se tiene distribucion F con n y m grados de libertad y se denota por

Z ∼ Fn,m

72

Page 73: Apuntes Proba

14. Estimacion Puntual

Definicion 14.1 Un estimador puntual corresponde a cualquier funcion de la muestra

g(X1, X2, . . . , Xn)

14.1. Metodo de Momentos

Definicion 14.2 Sea X1, X2, . . . , Xn una muestra aleatoria de una variable X, proveniente de unapoblacion con funcion de densidad fθ, con

θ = (θ1, θ2, . . . , θk)

El estimador de momentos θ de θ corresponde a la solucion del sistema de ecuaciones

E(X1) =1

n

n∑i=1

X1i

E(X2) =1

n

n∑i=1

X2i

=...

E(Xk) =1

n

n∑i=1

Xki

Debiendose plantear tantas ecuaciones como parametros se desea estimar.

Ejercicios 13 Si X1, X2, . . . , Xniid∼ f , encuentre los estimadores de momentos si f es

1. U(θ, 2θ)

2. N(µ, σ2)

73

Page 74: Apuntes Proba

14.2. Metodo de Maxima Verosimilitud

Definicion 14.3 Sea X1, . . . , Xn una muestra aleatoria proveniente de una poblacion con funciondensidad fθ. Se define la funcion de verosimilitud como la funcion densidad conjunta del vectorX1, . . . , Xn y esta dada por

L(θ, x) =n∏i=1

fθ(xi)

Ejercicios 14 Si X1, X2, . . . , Xniid∼ f , encuentre una expresion simplificada para la funcion de

verosimilitud si f es

1. exp(λ)

2. Γ(α, β), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 14.4 Un estimador maximo verosımil, EMV, de θ, basado en una muestra Xcorresponde a

θ(X)

el cual se obtiene al resolver

∂θjlog(L(θ, x)) = 0 j = 1, . . . , k

Ejercicios 15 Si X1, X2, . . . , Xniid∼ f , encuentre los estimadores de maxima verosimilitud si f es

1. exp(λ)

2. Γ(α, β), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 14.5 Consideremos una familia de distribuciones con parametro θ ∈ Θ para una va-riable aleatoria X y con funcion de verosimilitud asociada L(θ, x). Se dice que la log- verosimiltudde X pertenece a una familia exponencial ssi existen funciones ω1, . . . , ωk ∈ Θ y t1, . . . , tk ∈ R,tales que

logL(θ, x) = log h(x) + log c(θ) +k∑j=1

ωj(θ)tj(x)

con h y c funciones positivas definidas en R

74

Page 75: Apuntes Proba

Ejemplo 14.1 Sea la variable aleatoria X con funcion densidad

f(x) =

θ(1− θ)x−1, x = 1, 2, . . . , θ ∈ (0,1);0, e.o.c.

Determine si f(x) pertenece a la familia exponencial.

Ejemplo 14.2 Sea X1, . . . , Xn una muestra aleatoria de X cuya densidad es

f(x) =1√

2πσ2exp

− 1

2σ2(x− µ)2

con x ∈ R, θ = (µ, σ2),∞ < µ <∞, σ2 > 0, desconocidos. Determine si esta distribucion pertenecea la familia exponencial.

75

Page 76: Apuntes Proba

15. Insesgamiento y eficiencia

Definicion 15.1 Un estimador puntual θ de θ es insesgado si

E(θ) = θ ∀ θ

Si θ no es insesgado , se denomina sesgo de θ a

b(θ) = E(θ)− θ

Por lo tanto, un estimador es insesgado si su distribucion tiene como valor esperado al parametroque se desea estimar.

Ejercicios 16 Si X1, X2, . . . , Xniid∼ f , determine si los estimadores de momentos y maxima vero-

similitud son insesgados para f

1. exp(λ)

2. Γ(α, β), con α conocido.

3. Bin(n, p) con n conocido.

4. Poisson(λ)

Definicion 15.2 El error cuadratico medio de un estimador θ de θ corresponde a

ECM(θ) = E(θ − θ)2

= V(θ) + (b(θ))2

Ejemplo 15.1 Sea X1, . . . , Xniid∼ exp(θ) y consideremos θ = 1/x. Calcule el ECM(θ).

Definicion 15.3 Se define la matriz de informacion de Fisher como

I(θ) = E

(∂

∂θlogL(θ, x)

)2

Lema 2 Sea la funcion fθ tal que

d

dθE

(∂

∂θlogL(θ, x)

)=

∫∂

∂θ

[(∂

∂θlogfθ(x)

)fθ(x)

]dx,

entonces,

E

(∂

∂θlogL(θ, x)

)2

= −E

(∂2

∂θ2logL(θ, x)

)

76

Page 77: Apuntes Proba

Teorema 15.1 Cramer - Rao.Sea X1, . . . , Xn una muestra con funcion densidad fθ que satisface la conmutatividad entre el opera-dor integral y diferencial y sea g(X) = g(X1, . . . , Xn) un estimador donde E(g(X)) es diferenciablecomo funcion de θ. Entonces

V(g(X)) ≥( d

dθE(g(X))2

E(∂∂θ

log L(θ, x))2

Observacion: La cantidad( d

dθE(g(X))2

E(∂∂θ

log L(θ, x))2

se llama cota de Cramer-Rao y todo estimador que alcance esta cota sera llamado eficiente.

Es claro que si g(X) es un estimador insesgado para θ entonces se cumple que

V(g(X)) ≥ 1

E(∂∂θ

log L(θ, x))2

es decir, la cota de Cramer- Rao es igual a I(θ)−1.

Definicion 15.4 Un estimador g(X) de θ se dice eficiente si

I(θ)−1

V(θ)= 1

Teorema 15.2 Si θ es el EMV de θ, entonces para cualquier funcion g(θ), el EMV de g(θ) es g(θ)

Ejercicios 17 .

1. Si X1, X2, . . . , Xniid∼ f , encuntre los estimadores de momentos si f es

a) exp(λ)

b) Γ(α, β)

c) U(0, θ)

d) U(−θ, θ)

2. Sea X1, . . . , Xn una muestra aleatorio con funcion densidad

fX(x) =x

θ2e−x/θ x > 0, θ > 0

a) Determine el estimador de momentos y el EMV de θ.

b) Determine si θ es insesgado, calcule su varianza y comparela con la cota de Cramer-Rao. ¿Es este estimador eficiente?

77

Page 78: Apuntes Proba

3. Sea X1, . . . , Xniid∼ N(θ, σ2). Calcule el ECM(θ) si θ = x.

4. Suponga que el tiempo de duracion X de un cierto componente electronico posee distribucionRayleigh de parametro θ, con funcion densidad dada por

fX(x) =2

θxex

2/θ, x > 0 θ > 0

Para realizar la inferencia acerca de θ se considera una muestra aleatoria X = (X1, . . . , Xn)que representa los tiempos de duracion de n de esos componentes.

a) Determine la funcion de verosimilitud.

b) Determine el estimador de maxima verosimilitud θ de θ.

c) Determine si el EMV es insesgado.

d) Calcule el ECM(θ).

5. Sea X1, . . . , Xniid∼ N(µ, σ2) y consideremos los estimadores para σ2

s21 =

1

n− 1

n∑i=1

(Xi −X)2 y s22 =

n− 1

ns21

Determine el ECM de ambos estimadores.

78

Page 79: Apuntes Proba

16. Pruebas de Hipotesis

16.1. Introduccion

A menudo los datos muestrales sugieren que algo relevante esta sucediendo en la poblacion oproceso subyacente. Como suponemos que los datos provienen de una muestra aleatorio y por lomismo, estan sujetos a cierto grado de variacion aleatoria, la pregunta es si el resultado o el efectoaparente en la muestra es una indicacion de que algo esta sucediendo en la pobalcion (o proceso)subyacente o si el resultado observado es posiblemente una casualidad, producto de la variacionaleatoria.

Por esta razon es que postulamos una conjetura (o varias) que nos permita estimar si los resul-tados aparentes en una muestra indican que en realidad algo esta pasando. De manera formal, laconjetura puede postular en forma de hipotesis estadıstica.

Definicion 16.1 Una hipotesis estadıstica es una aseveracion o conjetura con respecto a unao mas poblaciones.

En nuestro caso en particular, una hipotesis es una afirmacion sobre un parametro poblacional.La verdad o falsedad de una hipotesis estadıstica nunca se sabe con albosuta certeza a menos

que examinemos toda la poblacion. Esto, por supuesto, serıa poco practico en la mayorıa de lassituaciones. En su lugar, tomamos una muestra aleatoria de la poblacion de interes y utilizamoslos datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipotesis. Laevidencia de la muestra que es inconsistente con la hipotesis que se establece conduce al rechazo deesta, mientras que la evidencia que la apoya conduce a su aceptacion.

La estructura de la prueba de hipotesis se formulara con el uso del termino hipotesis nula (H0),hipotesis que deseamos probar como verdadera. En caso contrario, es decir, si la rechazamos, esta-mos aceptando como verdadera la hipotesis alternativa (H1), que en general escribimos como

H0 : θ ∈ Θ0 vs H1 : θ ∈ Θ0

Definicion 16.2 Una prueba de hipotesis es una regla de decision que especifıca para que valoresde la muestra la decision es aceptar H0 como verdadera y para que valores de la muestra la decisiones aceptar H1 como verdadera.

Para verificar si H0 es verdadera debemos resumir la informacion de los datos en un estadısti-co de prueba. Dicho estadıstico se calcula para ver si la informacion que entregan los datos esrazonablemente compatible con la hipotesis nula.

Para decidir a favor de la hipotesis nula debemos establecer una region de aceptacion, la cualidentificara los valores del estadıstico de prueba que son relativamente probables dada la hipotesisnula y los valores que no lo son. ¿En que valor del estadıstico de la prueba comenzamos a decir quelos datos apoyan a a la hipotesis alternativa? Para contestar esta pregunta se requiere conocer ladistribucion muestral del estadıstico de prueba. Los valores del estadıstico de prueba que son suma-mente improbables bajo la hipotesis nula forman una region de rechazo para la prueba estadıstica.

79

Page 80: Apuntes Proba

Cuando realizamos una prueba, podemos tomar dos decisiones. Por tanto, podemos cometer dostipos de error:

Error de tipo I: rechazar la hipotesis nula, H0 dado que esta es verdadera.

Error de tipo II: no rechazar la hipotesis nulaH0, dado que la hipotesis alternativaH1 es correcta.

Las consecuencias de estos tipos de error son diferentes y generalmente intentaremos minimizar elerror de tipo I.

Ejemplo 16.1 Determine los errores de tipo I y II.

1. H0: el acusado es culpable

H1: el acusado es inocente

2. H0: el paciente esta enfermo

H1: el paciente esta sano

La prueba adecuada serıa aquella que minimizara la probabilidad de cometer los dos tipos deerror simultaneamente, lo cual, con estadıstica clasica, es imposible.

En consecuencia, se trata de minimizar la probabilidad de cometer Error tipo II, sujeto a quela probabilidad de cometer Error tipo I no exceda un valor predeterminado α. Este ultimo error estambien llamado nivel de significancia.

Algunas propiedades importantes respecto de estos errores son:

Los errores de tipo I y tipo II estan relacionados. Una disminucion en la probabilidad de unopor lo general tiene como resultado un aumento en la probabilidad del otro.

El tamano de la region de rechazo, y por tanto la probabilidad de cometer error tipo I, siemprese puede reducir al ajustar el o los valores crıticos.

Un aumento en el tamano muestral n reducira α y β (error tipo II) de forma simultanea.

Si la hipotesis nula es falsa, β es un maximo cuando el valor real de un parametro se aproximaal valor hipotetico . Entre mas grande sea la distancia entre el valor real y el valor hipotetico,sera menor β.

Definicion 16.3 La potencia de una prueba es la probabilidad de rechazar H0 dado que unaalternativa especıfica es verdadera, y se puede calcular como 1− β.

Diferentes tipos de pruebas se comparan al contrastar propiedades de potencia.

A pesar de estar fijo, la probabilidad de cometer error de tipo I puede ser calculada y recibe elnombre de valor-p.

80

Page 81: Apuntes Proba

Definicion 16.4 El valor-p de una prueba de hipotesis es el menor valor de α para el cual recha-zamos la hipotesis nula.

Calculado este valor, la regla sera rechazar la hipotesis nula si valor − p < α.

En este curso estudiaremos pruebas de hipotesis para tres parametros poblacionales: media,varianza y proporcion.

16.2. Prueba de Hipotesis para la media

Sea X1, . . . , Xn una muestra aleatoria de una distribucion con media µ y varianza σ2 > 0.Considere las hipotesis generales

H0 : µ ∈ Θ0 vs H1 : µ ∈ Θ0

Es decir, queremos probar algun valor o rango de valores para la media, cuando la varianza esconocida. La estadıstica de prueba apropiada se basa en la variable X, que por TCL sabemosdistribuye N(µ, σ2/n) y que si estandarizamos obtenemos

Z =X − µσ/√n∼ N(0, 1)

Entonces distinguiremos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siµ = µ0 µ 6= µ0 |z0| ≥ z1−α/2µ ≤ µ0 µ > µ0 z0 ≥ z1−αµ ≥ µ0 µ < µ0 z0 ≤ −z1−α

donde

z0 =x− µ0

σ/√n

Ejemplo 16.2 Una muestra aleatoria de 100 muertes registradas en un servicio el ano pasadomuestra una vida promedio de 71.8 anos. Suponga una desviacion estandar poblacional de 8.9 anos.¿esto parece indicar que la vida media hoy en dıa es mayor a 70 anos? Utilice un nivel de signifi-cancia de 5 %.

Sea X1, . . . , Xn una muestra aleatoria de una distribucion con media µ, desconocida y varianzas2 > 0, esto quiere decir que la varianza es estimada en la muestra. Considere las hipotesis generales

H0 : µ ∈ Θ0 vs H1 : µ ∈ Θ0

Es decir, queremos probar algun valor o rango de valores para la media, cuando la varianza esdesconocida, por lo que la reemplazamos por s2, el estimador insesgado de la varianza. La estadısticade prueba apropiada se basa en la variable X, que por TCL sabemos distribuye N(µ, σ2/n) y ademasn−1σ2 s

2 ∼ χ2 , con las que podemos construir el estadıstico

Z =X − µs/√n∼ t(n− 1)

Entonces distinguiremos tres casos:

81

Page 82: Apuntes Proba

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siµ = µ0 µ 6= µ0 |t0| ≥ t1−α/2µ ≤ µ0 µ > µ0 t0 ≥ t1−αµ ≥ µ0 µ < µ0 t0 ≤ −t1−α

donde

t0 =x− µ0

s/√n

Ejemplo 16.3 Se afirma que una aspiradora gasta en promedio 46 kilowatt-hora al ano. Se tomauna muestra aleatoria de 12 hogares indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al ano con una desviacion estandar de 11.9 kilowatt-hora, ¿esto sugiere que las aspiradorasgastan, en promedio, menos de 46 kilowatt-hora anualmente con 5 % de significancia?

16.3. Prueba de Hipotesis para la proporcion

Es de interes probar la hipotesis que la proporcion de exitos de un experimento binomial esigual a un valor especıfico o esta en un rango de valores. Sea X la variable aleatoria que cuenta elnumero de exitos y sea p = X/n la estimacion del parametro p. Entonces, para n grande, podemosestablecer que

Z =x− np√np(1− p)

=p− p√p−(1−p)

n

∼ N(0, 1)

Entonces distinguiremos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 sip = p0 p 6= p0 |z0| ≥ z1−α/2p ≤ p0 p > p0 z0 ≥ z1−αp ≥ p0 p < p0 z0 ≤ −z1−α

donde

z0 =p− p0√

p0(1− p0)/n

Ejemplo 16.4 Un medicamento que se prescribe actualmente se considera efectivo en un 60 %.Resultados experimentales con un nuevo farmaco se asministar a una muestra aleatoria de 100personas, de las cuales 70 se aliviaron. ¿Esta es evidencia suficiente para concluir que el nuevomedicamento es superior al que se receta actualmente? Use α = 5 %

16.4. Prueba de Hipotesis para la varianza

Sean X1, . . . , Xn una muestra de una variable aleatoria con distribucion N(µ, σ2), ambos parame-tros desconocidos. Sabemos que si s2 es el estimador insesgado de σ2, es decir,

s2 =1

n− 1

∑(xi − x)2

entonces(n− 1)s2

σ2∼ χ2

(n−1)

82

Page 83: Apuntes Proba

Entonces, si es de interes probar que la varianza poblacional esta en un intervalo dado, distinguire-mos tres casos:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siσ2 = σ2

0 σ2 6= σ20 Q0 ≥ χ2

n−1,1−α/2 o Q0 ≤ χ2n−1,α/2

σ2 ≤ σ20 σ2 > σ2

0 Q0 ≥ χ2n−1,1−α

σ2 ≥ σ20 σ2 < σ2

0 Q0 ≤ χ2n−1,α

donde

Q0 =(n− 1)s2

σ20

Ejemplo 16.5 Se tienen los pesos de 10 paquetes de semillas de pasto distribuidas por cierta com-panıa, de la cuales se obtuvo x = 46,12 y s2 = 0,286. La empresa desea saber si los pesos registradospresentan evidencia para asegurar que la varianza poblacional es mayor a 0.2, con un nivel designificancia de 5 %.

16.5. Prueba de Hipotesis para la diferencia de medias

Si tenemos dos muestras de tamano n y m de poblaciones independientes, X e Y, con mediasµX y µY , estas pueden ser comparadas usando la diferencia µ1 − µ2, cuyo estimador es x − y. Ladistribucion de esta diferencia dependera de la informacion respecto de la relacion entre las varianzaspoblacionales σ2

X y σ2Y , de los cuales podemos identificar tres casos.

16.5.1. Varianzas conocidas.

El estadıstico de prueba es(X − Y )− d√

σ2X

n+

σ2Y

m

∼ N(0, 1)

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siµX − µY = d µX − µY 6= d |z0| ≥ z1−α/2µX − µY ≤ d µX − µY > d z0 ≥ z1−αµX − µY ≥ d µX − µY < d z0 ≤ −z1−α

donde

Z0 =(x− y)− d√

σ2X

n+

σ2Y

m

Ejemplo 16.6 Una muestra aleatoria de tamano n1 = 25, que se toma de una poblacion normalcon una desviacion estandar σ1 = 5,2, tiene una media x1 = 81. Una segunda muestra aleatoriade tamano n2 = 36, que se toma de una poblacion normal diferente con una desviacion estandarσ = 3,4, tiene una media x2 = 76. Pruebe la hipotesis de las medias son iguales con un nivel designificancia del 5 %.

83

Page 84: Apuntes Proba

16.5.2. Varianzas desconocidas pero iguales.σ2X = σ2

Y = σ

Si las varianzas desconocidas, debemos estimarlas, incorporando el hecho que sean iguales. En-tonces, dados s2

X y s2Y , los estimadores insesgados de σ2

X y σ2Y , respectivamente, definimos

s2p =

(n− 1)s2X + (m− 1)s2

Y

n+m− 2

El estadıstico de prueba es(X − Y )− d

sp

√1n

+ 1m

∼ tν

con ν = n+m− 2.

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siµX − µY = d µX − µY 6= d T0 ≥ tν,1−α/2µX − µY ≤ d µX − µY > d T0 ≥ tν,1−αµX − µY ≥ d µX − µY < d T0 ≤ −tν,1−α

donde

T0 =(x− y)− d

sp

√1n

+ 1m

Ejemplo 16.7 Una companıa armadora de automoviles grande trata de decidir si compra llantasde la marca A o de la B para sus nuevos modelos. Se lleva a cabo un experimento, para ayudar allegar a una decision, en el que se usan 12 llantas de cada marca. Las llantas se utilizan hasta quese acaban. Los resultados son

Marca A :x1 = 37900km s1 = 5100km

Marca B :x2 = 39800km s2 = 5900km

Pruebe la hipotesis que no hay diferencias entre las dos marcas de llantas con un nivel de signifi-cancia del 5 %, suponiendo que las varianzas poblacionales son iguales.

16.5.3. Varianzas desconocidas y distintas.

Si las varianzas desconocidas y distintas, el estimador de la varianza de µX − µY es

s2p =

s2X

n+s2Y

m

El estadıstico de prueba es(X − Y )− d

sp∼ tν

con

ν =

( s2Xn

+s2Ym

)2[(s2X/n)2

n−1+ (

(s2Y /m)2

m−1

]Las hipotesis a contrastar son:

84

Page 85: Apuntes Proba

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siµX − µY = d µX − µY 6= d |T0| ≥ tν,1−α/2µX − µY ≤ d µX − µY > d T0 ≥ tν,1−αµX − µY ≥ d µX − µY < d T0 ≤ −tν,1−α

donde

T0 =(x− y)− d

sp∼ tν

Ejemplo 16.8 Para el ejemplo anterior, realice la prueba para la hipotesis que las llantas de lamarca A son mejores que las de B, suponiendo que las varianzas poblacionales son distintas.

16.6. Prueba de Hipotesis para la diferencia de proporciones

Si tenemos dos muestras independientes X1, . . . , Xn y Y1, . . . , Ym de poblaciones Bernoulli deparametros p1 y p2, respectivamente, estas pueden ser comparadas usando la diferencia p1 − p2

utilizando que(p1 − p2)− d√p1(1−p1)

n+ p2(1−p2)

m

∼ N(0, 1)

Las hipotesis a contrastar son:

Hipotesis Nula Hipotesis Alternativa Rechazo H0 sip1 − p2 = d p1 − p2 6= d |z0| ≥ z1−α/2p1 − p2 ≤ d p1 − p2 > d z0 ≥ z1−αp1 − p2 ≥ d p1 − p2 < d z0 ≤ −z1−α

donde

z0 =(p1 − p2)− d√p1(1−p1)

n+ p2(1−p2)

m

Ejemplo 16.9 En un estudio para estimar la proporcion de residentes de cierta ciudad y sus subur-bios que estan a favor de la construccion de una planta de energıa nuclear, se encuentra que 63de 100 residentes urbanos estan a favor de la construccion mientras que solo 59 de 125 residentessuburbanos la favorecen. ¿Hay una diferencia significativa entre las proporcion de residentes urbanosy suburbanos que favorecen la construccion de la planta nuclear? Use α = 0,05.

16.7. Prueba de Hipotesis para la comparacion de varianzas

SeanX1, . . . , Xn una muestra aleatoria de la distribucionN(µX , σ2X), independiente de Y1, . . . , Ym

una muestra aleatoria de una distribucion N(µY , σ2Y ), con todos los parametros son desconocidos.

Las varianzas poblacionales pueden ser comparadas usando el cuociente σ2X/σ

2Y cuyo estimador es

s2X/s

2Y . Entonces

σ2X

σ2Y

k ∼ Fn−1,m−1

Entonces, si es de interes probar que las varianzas poblacionales estan en una razon dada es

85

Page 86: Apuntes Proba

Hipotesis Nula Hipotesis Alternativa Rechazo H0 siσ2X

σ2Y

= 1k

σ2X

σ2Y6= 1

kF0 ≥ Fn−1,n−2,1−α/2 o F0 ≤ Fn−1,n−2,α/2

σ2X

σ2Y≤ 1

k

σ2X

σ2Y> 1

kF0 ≥ Fn−1,n−2,1−α

σ2X

σ2Y≥ 1

k

σ2X

σ2Y< 1

kF0 ≤ Fn−1,n−2,α

donde

F0 =s2X

s2Y

k

Ejemplo 16.10 Para el ejemplo 16.9, determine si las varianzas son iguales o distintas con 2.5 %de confianza.

Ejercicios 18 .

1. Un profesor ha registrado las calificaciones de sus alumnos durante varios semestres, siendola media de aquellas igual a 72. Su grupo actual de 36 estudiantes parece tener una aptitudpromedio superior, por lo que el profesor desea mostrar que de acuerdo con su media ”el grupoactual es mejor que los anteriores´´. ¿Constituye el promedio del grupo x = 75,2 suficienteevidencia para respaldar la afirmacion del profesor?. Utilizar α = 0,05 y σ = 12.

2. Una determinada companıa que produce una parte maquinada para un motor, afirma quetiene una varianza de diametro no mayor que 0.0002 pulgadas. Una muestra aleatoria de10 de dichas partes dio una varianza de muestra s2 = 0,0003. Si se supone que las medidasdel diametro se distribuyen en forma normal, ¿Hay evidencia para refutar lo que afirma elproveedor?. Usar α = 0,05.

3. Se supone que en una localidad de Santiago, el 90 % de los productores cultivan maız. De110 productores de la zona que se encuestaron, 95 cultivan maız. ¿Esta este resultado enconformidad con el valor supuesto? Use α = 0,05.

4. Para estimar el rendimiento de parcelas plantadas con papa de una cierta variedad, se cose-charon 8 de ellas, obteniendose la siguiente informacion expresada en kg/parcela:

4.5 5.3 5.4 4.9 5.3 5.7 6.2 4.8

¿Se puede asegurar, con α = 0,05 que esta variedad de papas tiene un rendimiento promediode 5.25 kg?

5. Se llevo a cabo un estudio para comparar el tiempo que toma a los hombres y mujeres efectuardeterminada maniobra en una lınea de ensamble. Se utilizaron muestras independientes de 50hombres y 50 mujeres en un experimento en el cual se tomaba a cada persona el tiempo parahacer tareas identicas. Los resultados fueron los siguientes:

Datos x σ2

Hombres 42 18Mujeres 28 14

86

Page 87: Apuntes Proba

¿Presentaron estos datos la evidencia suficiente como para decir que hay una diferencia entrelos verdaderos tiempos de terminacion para hombres y mujeres, a un nivel de significancia del5 %?

6. El disenador de una troqueladora nueva de lamina afirma que su maquina puede trabajar condeterminado producto con mas rapidez que la maquina que esta en uso. Se hicieron nueveensayos independientes troquelando el mismo artıculo en cada maquina y se obtuvieron lossiguientes resultados de tiempos(en segundos) de terminacion:

Maquina normal Maquina nuevax1 = 35.22 x2 = 31.56

(n1 − 1)s21 =195.5 (n2 − 1)s2

2 =160.22

El nivel de significancia del 5 %, ¿puede respaldar la afirmacion del disenador?. Asuma quelas varianzas poblacionales son desconocidas, pero iguales.

7. Muchos estudiantes se han quejado de que la maquina vendedora de refrescos A despachamenos bebidas que la maquina B. Los siguientes son los datos de las muestras:

Maquina A n1 = 10 x1=5.38 s21=1.59

Maquina B n1 = 12 x2=5.92 s22=0.83

Con α = 0,05, ¿Respalda la evidencia la hipotesis de que la cantidad media despachada por lamaquina A es menor que la despachada por la maquina B?

8. Un vendedor de una nueva marca de radio comunicadores afirma que el numero de aparatosdefectuosos en sus lotes de produccion sera no mayor que el de un competidor. Se tomanmuestras aleatorias de ambos productos para contrastar esta aseveracion.

Producto N defectuosos N revisadosVendedor 8 100

Competidos 2 100

¿Puede rechazarse la afirmacion del vendedor al nivel de significacion 0.05?

87

Page 88: Apuntes Proba

17. Estimacion Intervalar

Ademas de las estimaciones puntuales de un parametro, hay estimaciones por intervalos queestipulan, con un cierto grado de confianza, que el parametro se encuentra entre dos valores delestadıstico estimado. Supongamos una variable aleatoria poblacional X que tiene media µ cuyovalor es desconocido. De una muestra aleatoria de tamanno n, el valor x de la media muestral Xse puede usar para estimar µ al 95 % de confianza como sigue:Definido E, el margen de error y la significancia α, tal que

P(µ− E ≤ x ≤ µ+ E) = 1− α

lo que es equivalente a la ecuacion

P(x− E ≤ µ ≤ x+ E) = 1− α

Entonces (x− E, x+ E) se llama intervalo de confianza del 100(1− α) % para µ.

Formalmente:

Definicion 17.1 Un estimador intervalar para un parametro θ, dados los valores x = (x1, . . . , xn)de una variable aleatoria X, es cualquier par de funciones L(x1, . . . , xn) y U(x1, . . . , xn) que satisfaceL(x) ≤ U(x) para todo x. El intervalo aleatorio [L(X), U(X)] se denomina un estimador intervalar.

Definicion 17.2 Para un parametro cualquiera θ, se define un conjunto de confianza 1 − αcomo un conjunto C(x) tal que

P(θ ∈ C(X)) = 1− α

Definicion 17.3 Una variable aleatoria Q(X, θ) corresponde a un pivote si su distribucion nodepende de ningun parametro. Es decir, la distribucion de Q(X, θ) es la misma, para todo θ.

Ejemplo 17.1 Encuentre una cantidad pivotal si X1, . . . , Xn son una muestra aleatoria N(µ, σ2)y a partir de esta construya un conjunto o intervalo de confianza para la media poblacional.

17.1. Intervalo de Confianza para la media

Sea X1, . . . , Xniid∼ N(µ, σ2). Un intervalo de confianza para la media poblacional µ cuando la

varianza poblacional es conocida esx± E

donde E = z1−α/2 · σ/√n.

Ejemplo 17.2 Una aerolınea necesita estimar el numero medio de pasajeros en un vuelo de re-ciente apertura. Para ello, toma una muestra de 40 dıas y encuentra una media muestral de 112.0pasajeros y una desvaicion estandar de 25. Encuentre un intervalo de confianza al 95 % para lamedia poblacional.

88

Page 89: Apuntes Proba

Sea X1, . . . , Xniid∼ N(µ, σ2). Un intervalo de confianza para la media poblacional µ cuando la

varianza poblacional es desconocida esx± E

donde E = t(n−1,1−α/2) · s/√n.

Ejemplo 17.3 En una aerolınea se resgistran los tiempos de espera promedio de atencion en mesonde 14 dıas, obteniendo los siguientes resultados:

4.3 5.2 2.1 6.2 5.8 4.7 3.8 9.3 5.0 4.1 6.0 8.7 0.5 4.9

Encuentre un intervalo de confianza al 95 % para el tiempo de espera medio.

17.2. Intervalo de Confianza para una proporcion

Sea Y ∼ Bin(n, p). Por teorema del lımite central sabemos que

p ∼ (E(p),V(p))

Se puede mostrar que E(p) = p y V(p) = p(1−p)n

.

Ası, el intervalo de confianza al (1− α)100 % para una proporcion esta dado por

p± E

donde E = z1−α/2 ·√

p(1−p)n

.

Ejemplo 17.4 En un colegio de Ensenanza Media hay matriculados 800 alumnos. A una muestraseleccionada aleatoriamente de un 15 % de ellos, se les pregunto si utilizaban la cafeterıa del colegio.Contestaron negativamente un total de 24 alumnos.

a) Estime el porcentaje de alumnos que utilizan la cafeterıa del colegio.

b) Determine, con una confianza del 99 %, el error maximo cometido con dicha estimacion.

17.3. Intervalo de Confianza para la varianza

Sea X1, . . . , Xn una muestra aleatoria de una poblacion normal con media µ y varianza σ2. Unintervalo de confianza para la varianza poblacional σ2 esta dado por[

(n− 1)s2

χ2(n−1,1−α/2)

,(n− 1)s2

χ2n−1,α/2

]donde s2 = 1

n−1

∑ni=1(Xi −X)2.

89

Page 90: Apuntes Proba

Ejemplo 17.5 Un vendedor de muebles de madera para armar (desarmados) importa las piezasdesde el norte de Europa para abaratar costos. En cierto modelo, el cliente debe insertar cuatropatas redondas en hoyos ya perforados. Para un ajuste adecuado, el diametro de las patas debe serligeramente menor que un centımetro. Inevitablemente, hay cierta variacion en los diametros delas patas. El vendedor compra patas a un proveedor bajo la especificacion de que el diametro mediodebe ser de 0.995 cm y desviacion estandar menor que 0.03 cm. Como parte del control de calidadse obtuvo una muestra aleatoria de 121 patas la cual arrojo una media de 0.99516 y desviacionestandar de 0.01825. Calcule un IC al 95 % para la desviacion estandar del lote.

En caso de contar dos muestras aleatorias, puede ser de interes comparar los siguientes parame-tros :

17.4. Intervalo de Confianza para la diferencia de medias

Sean X1, . . . , Xniid∼ N(µX , σ

2X) e Y1, . . . , Ym

iid∼ N(µY , σ2Y ), ambas muestras independientes. Un

intervalo de confianza para la diferencia de media entre poblaciones esta dado por

(x− y)± E

donde E cambiara de acuerdo a la informacion con respecto a la varianza.

Podemos identificar 3 casos:

a) σ2X y σ2

Y conocidas.

E = z1−α/2 ·√σ2X

n+σ2Y

m

es decir

(µX − µY ) ∈(

(x− y)± z1−α/2 ·√σ2X

n+σ2Y

m

)b) σ2

X y σ2Y desconocidas pero iguales (σ2

X = σ2Y = σ2).

Se utiliza el estimador de σ2 dado por

s2p =

(n− 1)s2X + (m− 1)s2

Y

n+m− 2

con

s2X =

1

n− 1

∑(Xi −X)2 y s2

Y =1

m− 1

∑(Yi − Y )2

El margen de error esta dado por

E = t(n+m−2,1−α/2) · sp

√1

n+

1

m

90

Page 91: Apuntes Proba

Por lo tanto, el IC para la diferncia de medias cuando las varianzas son iguales pero descono-cidas esta dado por

(µX − µY ) ∈(

(x− y)± t(n+m−2,1−α/2) · sp

√1

n+

1

m

)c) σ2

X y σ2Y desconocidas y distintas.

Se define

E = t(ν,1−α/2) ·√s2X

n+s2Y

m

donde

ν =

( s2xn

+s2ym

)2(s2x/n)2

n−1+

(s2y/m)2

m−1

Ası, el IC para la diferncia de medias cuando las varianzas son desconocidas y distintasesta dado por

(µX − µY ) ∈(

(x− y)± t(ν,1−α/2) ·√s2X

n+s2Y

m

)Ejemplo 17.6 .

a) Se realiza un estudio para comparar los contenidos de nicotina de dos marcas de cigarrillos.10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, con unadesviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenidopromedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que losdatos son muestras aleatorias provenientes de dos poblaciones normales con varianzas iguales.Encuentre un IC del 95 % para la verdadera diferencia en el contenido de nicotina de las dosmarcas.

b) Una companıa tiene dos departamentos que producen identicos productos. Se sospecha que lasproducciones por hora son diferentes en los dos departamentos. Para averiguar esto se consi-deran muestras aleatorias de horas de produccion que proporcionan la siguiente informacion:

Departamento 1 n1 = 64 x1 = 100 σ21 = 256

Departamento 2 n2 = 49 x2 = 90 σ22 = 196

Hallar un IC del 95 % para la diferencia verdadera entre las producciones medias de los de-partamentos. Comente.

91

Page 92: Apuntes Proba

17.5. Intervalo de Confianza para la comparacion de varianzas

Sean X1, . . . , Xniid∼ N(µX , σ

2X) e Y1, . . . , Ym

iid∼ N(µY , σ2Y ), ambas muestras independientes y de

media desconocida. Para comparar las varianzas de ambas muestras podemos utilizar el intervalode confianza para la diferencia para el cuociente σ2

x/σ2y dado por[

s2x

s2y

· F(n−1,m−1,α/2),s2x

s2y

· F(n−1,m−1,1−α/2)

]Ejemplo 17.7 Se realiza un estudio para comparar los contenidos de nicotina de dos marcas decigarrillos. 10 cigarrillos de la marca A dieron un contenido promedio de nicotina de 3,1ml/gr, conuna desviacion estandar de 0,5ml/gr, mientras que 8 cigarrillos de la marca B dieron un contenidopromedio de nicotina 2,7ml/gr, con una desviacion estandar de 0,7ml/gr. Suponiendo que los datosson todos independientes, encuentre un IC del 95 % para la diferencia de varainzas.

92

Page 93: Apuntes Proba

Ejercicios 19 .

1. Se ha tomado una muestra aleatoria de 100 individuos a los que se ha medido el nivel deglucosa en sangre, obteniedose una media muestral de 110 mg/cc. Se sabe que la desviaciontıpica de la poblacion es de 20 mg/cc.

a) Obtenga un intervalo de confianza, al 90 %, para el nivel de glucosa en sangre en lapoblacion

b) ¿Que error maximo se comete con la estimacion anterior?

2. La media de edad de los alumnos que se presentan a pruebas de acceso a la Universidad es de18.1 anos, y la desviacion estandar 0.6 anos.

a) De los alumnos anteriores se elige, al azar, una muestra de 100. ¿ Cual es la probabilidadde que la media de la edad de la muestra este comprendida entre 17.9 y 18.2 anos?.

b) ¿Que tamano debe tener una muestra de dicha poblacion para que su media este com-prendida entre 17.9 y 18.3 anos, con una confianza del 99.5 %?

3. Las medidas de los diametros de una muestra tomada al azar, de 200 canerıas, hechas poruna determinada maquina, dieron una media de 2 cm y una desviacion estandar de 0,1 cm.Hallar los intervalos de confianza del:- 68,26 %- 95,44 %- 99,73 %para el diametro de todas las canerıas.

4. La longitud de las barras producidas por una cadena de produccion es una variable aleatoriacon distribucion normal y desviacion estandar 1.8 mm. Se extrae una muestra aleatoria simplede 9 observaciones y se obtiene el siguiente intervalo de confianza al nivel del 99 % para lalongitud media poblacional: [194.65,197.75]. El director cree que el intervalo es demasiadoamplio y exige uno con el mismo nivel de confianza pero cuya longitud no sea superior a1mm. ¿Cuantas observaciones debe tener la muestra para construir dicho intervalo?

5. Un fabricante de vehıculos sabe que el consumo de gasolina de sus vehıculos se distribuye nor-malmente. Se selecciona una muestra aleatoria simple de coches y se observa el consumo cadacien kilometros obteniendo las siguientes observaciones: (19.2, 19.4, 18.4, 18.6, 20.5, 20.8).Obtenga el intervalo de confianza para el consumo medio de gasolina de todos los vehıculos deeste fabricante, al nivel de confianza del 99 %.

6. Para estimar la proporcion de familias de una determinada ciudad que pseen microondas,se quiere realizar una muestra aleatoria de tamano n. Calcula el valor mınimo de n paragarantizar que, a un nivel de confianza del 95 %, el error en la estimacion sea menor que 0,05.(Como se desconoce la proporcion, se ha de tomar el caso mas desfavorable, que sera 0,5)

7. Se selecciona una muestra aleatoria simple de 600 familias a las que se les pregunta si tienencomputador en casa, resultando que 240 contestan afirmativamente. Obtener un intervalo deconfianza al nivel del 95 % para estimar la proporcion real de familias que poseen computador.

93

Page 94: Apuntes Proba

8. Se realizo un experimento considerando 64 pacientes varones de similares caracterısticas quellegan a un servicio de urgencia con fuertes dolores producidos por calculos renales. Se lessuministro una dosis de 5 ml. de un nuevo farmaco para calcular tales dolores, midiendose eltiempo transcurrido hasta que el dolor desaparece completamente. Los resultados del experi-mento entregaron los siguientes resultados: x=20 minutos, s = 5 minutos. Ademas 7 pacientesreaccionaron negativamente por la dosis.

a) Mediante un intervalo de confianza del 95 %, encuentre los lımites que permitan estimar,el tiempo que tarda el medicamento en eliminar el dolor. (Asuma que el tiempo mediotranscurrido hasta que el dolor desaparezca completamente tiene una distribucion normal)

b) Estime mediante un intervalo de confianza del 90 %, la proporcion de pacientes que reac-cionaran de manera negativa ante la suministracion de la dosis.

9. Un constructor civil debe seleccionar de entre dos tipos de hormigon, aquel que le ofrezca unamayor resistencia compresiva. Para ello selecciona una muestra de 8 probetas de hormigon tipo1 obteniendo una resistencia compresiva media de 312 kg/cm2 con una desviacion estandarde 23 kg/cm2 y una muestra de 10 probetas de hormigon tipo 2, obteniendo una resistenciacompresiva media de 298 kg/cm2 con una desviacion estandar de 8.2 kg/cm2. Mediante unIntervalo del 95 % de confianza, podrıa concluir si existe evidencia para determinar que untipo de hormigon es mejor que el otro en lo referente a la resistencia compresiva promedio?

10. Se esta realizando un estudio para determinar el nivel educacional en la parte obrera de lasconstrucciones de viviendas en el gran Santiago. Para ello, se seleccionan dos constructorasy se toma una muestra de 130 obreros de la Constructora E, de los cuales 98 tenıan cursadohasta cuarto medio y 32 solo habıan llegado hasta tercero medio. Por otro lado de la Cons-tructora D, se seleccionaron 165 obreros, de los cuales 50 tenıan cursado hasta cuarto medioy 115 solo llegaron hasta tercero medio. Por medio de un intervalo de confianza adecuado al99 % de confianza, ¿Puede determinar que constructora es mas exigente en cuanto el nivel deestudio de sus obreros?

11. Un fabricante produce anillos para los pistones de un motor de automovil. Se sabe que eldiametro del anillo esta distribuido aproximadamente de manera normal, y que tiene unadesviacion estandar σ = 0,001mm. Una muestra aleatoria de 15 anillos tiene un diametropromedio de x = 74,036mm.

a) Construya un IC bilateral del 99 % para el diametro promedio del anillo.

b) Construya un lımite inferior de confianza del 95 % para el diametro promedio del anillo.

12. Se utilizan dos maquinas para llenar botellas de plastico con detergente para maquinas lava-platos. Se sabe que las desviaciones estandar del volumen de llenado son σ1 = 0,10 onzas delıquido y σ2 = 0,15 onzas de lıquido para las dos maquinas, respectivamente.Se toman dos muestras aleatorias, n1 = 12 botellas de la maquina 1 y n2 = 10 botellas de lamaquina 2. Los volumenes promedio de llenado son x1 = 30,87 onzas de lıquido y x2 = 30,68onzas de lıquido.

a) Construya un IC bilateral del 90 % para la diferencia entre las medias del volumen dellenado.

94

Page 95: Apuntes Proba

b) Construya un IC bilateral del 95 % para la diferencia entre las medias del volumen dellenado. Compare el ancho de este interfvalo con el ancho del calculo en el inciso a).

c) Construya un IC superior del 95 % para la diferencia de medias del volumen del llenado.

13. Se prueban dos formulas diferentes de un combustible oxigenado para motor en cuanto aloctanaje. La varianza del octanaje para la formula 1 es σ2

1 = 1,5; mientras que para la formula2 es σ2

2 = 1,2. Se prueban dos muestras aleatorias del tamano n1 = 15 y n2 = 20. Los octanajespromedios observados son x1 = 89,6 y x2 = 92,5. Construya un IC bilateral del 95 % para ladiferencia en el octanaje promedio.

14. Considere la situacion sobre pruebas de octanaje descrita en el ejercicio anterior. ¿Que tamanode muestra se requiere para cada poblacion si se desea tener una confianza del 95 % de que elerror al estimar la diferencia entre las medias de octanaje sea menor que 1?

15. Supongamos que un fabricante necesita cierta pieza que puede ser proporcionada por dos abas-tecedores A y B, a un mismo precio. Las piezas de A son defectuosas con probabilidad p1 y lasde B con probabilidad p2. Supongamos ademas que de 100 piezas del proveedor A se encon-traron 10 piezas defectuosas, mientras que de 150 del proveedor B se encontro 11 defectuosas.¿Cual es el provedor con menor proporcion de piezas defectuosas?.

16. Una madererıa minorista inspecciona los embarques de madera que llegan de sus proveedores.Para los embarques de pino de calidad selecta, de 8 pies (2 por 4) el supervisor escoge aleato-riamente una gruesa (12 docenas o 144 hojas) de un embarque de varias decenas de miles dehojas. En la muestra 18 hojas no pueden venderse como calidad selecta.

a) Calcule un IC al 95 % para la proporcion de hojas de todo el embarque que no puedenvenderse como calidad selecta.

b) Si el 20 % o mas del embarque no pueden venderse como madera de calidad selecta, elembarque no es rentable. ¿Indica el IC que hay razones para pensar que el embarque noes rentable?

17. El metodo usual para tratar la leucemia mieloblastica aguda es tratar al paciente intensamentecon quimioterapia en el momento del diagnostico. Historicamente esto ha producido una tasade remision del 70 %. Estudiando un nuevo metodo de tratamiento, se utilizaron 50 volunta-rios. ¿Cuantos de los pacientes deberıan haber remitido para que los investigadores pudiesenafirmar con α=0.025, que el nuevo metodo produce emisiones mas altas que el antiguo?.

18. Se desea estimar la diferencia entre el ciclo medio de vida util de dos marcas de focos en elmercado. En relacion con una muestra aleatoria para la primera marca de n1=10 focos, elciclo medio de vida de los focos es x1= 4600 horas, con s1=250 hr. El ciclo medio de viday la desviacion estandar para la segunda marca con una muestra de n2=8 focos es x2=4000hr y s2=200 hr, respectivamente. Se supone que el ciclo de vida de ambas marcas tiene unadistribucion normal. Determine la relacion entre las varianzas (si son iguales o distintas) ycon est informacion calcule un IC para la diferencia en los ciclos de vida medios de los focos.Use α = 0,05.

95

Page 96: Apuntes Proba

19. Una industria dedicada a la fabricacion de harina, para llenar los paquetes usa dos maquinas.Se considera que el contenido de harina (kilos) en los paquetes tiene una distribucion normal.Para estudiar el contenido de estos paquetes, se toma una muestra aleatoria de cada maquinaobteniendo los siguientes resultados:

Maquina A 1.03 1.05 1.08 0.9 1.1 1.2 1.09 1.13Maquina B 1.04 1.08 0.9 1 1.06 1.08 1.15 0.92 1.07

a) Se considera que un paquete no cumple con las normas, si su contenido es inferior a unkilo. En base a la muestra total (17 paquetes) y usando un nivel de significancia del 8 %,estime la proporcion de paquetes que cumplan con la norma. ¿Que sucede con el tamanodel intervalo anterior si el nivel de significancia es del 5 %?

b) La persona encargada de la mantencion de la maquina A, sospecha que esta no esta fun-cionando correctamente y que existirıa una diferencia, respecto del contenido medio de lospaquetes llenados por la maquina B. Basandose en la muestra aceptarıa Ud. la sospechadel encargado. Use un nivel de confianza del 99 %.

20. Una empresa embotelladora lo contrata a Ud. para realizar algunos analisis estadısticos parasu lınea de produccion, debido a varios reclamos sobre la cantidad de lıquido en cada botella.Si la maquina embotelladora sigue una distribucion normal con media µ y desviacion estandar10c.c.

a) ¿En cuanto debe ser regulado el llenado medio para que solo el 25 % de las botellas tengamenos de 300 c.c.?

b) Construya un I.C. de nivel α = 0,04 para el llenado medio(µ), si en una muestra de 4botellas se observa un promedio de 350 c.c. ¿Este intervalo contiene a µ?

c) ¿Cual deberıa ser el tamano mınimo necesario para estimar µ con un error no mayor a5 c.c. y con una confianza del 90 %?Si la confianza sube al 99.9 % ¿Que sucede con el tamano muestral?

96