Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

41
4.1 INTRODUCCION En el capitulo anterior se presentaron los conceptos basicos de probabilidad y los metodos para ca1cular la probabilidad de un eventQ. En este capitulo se amplla,n estos conceptos y se exploran form as para calcular las probabilidades de un evento bajo condiciones un poco mas complicadas. En este capitulo se estudian las relaciones entre los valores de la variable aleatoria y las probabilidades de que su ocurrencia pueda resumirse por medio de un mecanismo Hamado dislt"ibuci6n de probabilidad. La distribucion de probabilidad se puede expresar forma de tabla, grafica 0 formula. Conocer la distribucion de probabilidades para la variable aleatoria proporciona al medico y al investigador herramientas podero- sas para simplificar y describir un con junto de datos, y para llegar a conclusiones acerca de la poblacion de datos sobre la base de una muestra de datos extraidos de lapoblacion. 4.2 DISTRIBUCION DE PROBABllIDAD DE VARIABLES DISCRETAS Para iniciar el estudio de las distribuciones de probabilidad, se cbnsidera en primer lugar la distribucion de probabilidad de una variable discreta, ·la cual se define comosigue: 83

Transcript of Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel...

Page 1: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

41 INTRODUCCION

En el capitulo anterior se presentaron los conceptos basicos de probabilidad y los metodos para ca1cular la probabilidad de un eventQ En este capitulo se ampllan estos conceptos y se exploran form as para calcular las probabilidades de un evento bajo condiciones un poco mas complicadas En este capitulo se estudian las relaciones entre los valores de la variable aleatoria y las probabilidades de que su ocurrencia pueda resumirse por medio de un mecanismo Hamado disltibuci6n de probabilidad La distribucion de probabilidad se puede expresar forma de tabla grafica 0 formula Conocer la distribucion de probabilidades para la variable aleatoria proporciona al medico y al investigador herramientas poderoshysas para simplificar y describir un conjunto de datos y para llegar a conclusiones acerca de la poblacion de datos sobre la base de una muestra de datos extraidos de lapoblacion

42 DISTRIBUCION DE PROBABllIDAD DE VARIABLES DISCRETAS

Para iniciar el estudio de las distribuciones de probabilidad se cbnsidera en primer lugar la distribucion de probabilidad de una variable discreta middotla cual se define comosigue

83

-----

CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

DEFINICION La distribucion de probabilidad de una variable aleatoria discreta es una tabla unagratica una fannula u otro sistelDa utilizado para especificar todos losvalores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas

EJEMPLO 421 --~

En un articulo de la revistaAmericanJournal oObstetrics and Gynecology Buitendijk y Bracken (A-I) aseguran que durante 25 afios se ha tornado mayor conciencia de los efectos potencialmente dafiinos de los medicamentos y quimicos en el desarrollo de los fetos En una poblaci6n de mujeres dadas de alta en maternidad en un hospital del este de EUA entre 1980 y 1982 los autores valoraron y estudiaron la asociaci6n del uso d~ medicamentos con varias caracteristicas de la madre por ejemplo uso de alcohol tabaco y adicci6n a farmacos Sus hallazgos sugieren quela

TABIA421 Prevalenciadel CODSUIDO de medicmnentos prescritos y no prescritos durante el embarazo enUelllujeres dadas de alta depues del parto en un hospital del este de EUA

middotN6mero de medicamentos Frecuencia

o 1425 1 1351 2 793 3 348 4 156 5 58 6 28 7 15 8 6 9 3

FUENTE Simone Buitendijk y Michael B Bracshy10 ken Medication in Early Pregnancy Prevalence

12 of Use and Relationship to Maternal Characteshyristics AmericanJournal ofObstetrics and GynecoshyTotal 4185 logy 16533-40

mujer que muestra un comportamiento mas propenso a correr riesgos durante e1 embarazo tambien esta mas propensa a utilizar medicamentos durante el mismo La tabla 421 muestra la prevalencia del consurno de medicamentos prescritos y no prescritos durante el embarazo entre las mujeres estudiadas

42 DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS 85

TABlA 422 Distribucion de probabilldad del nUrnero de medicamentos consumidos con y sin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 42 t

Numero de medicamentos (x) P(X =x)

0 3405 I 3228 2 1895 3 0832 4 0373 5 0139 6 0067 7 0036 8 0014 9 0007

10 0002 12 0002

Total 10000

Se pretende construir la distribuci6n de probabilidad de la variable discreta X donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados

Soluci6n Los valores de X son XI = 0 x2 1 XlI = lOy X 12 = 12 Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total 4185 Asl porejemplo P(X x) = 14254185 = 3405 EI resultado se rnuestra en la tabla 422 que representa la distribuci6n de probabilidades deseada bull

Altemativarnente se puede presentar esta distribuci6n de probabilidad en forma grafica como en la figura 421 En dicha figura la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x

En la tabla 422 se observa que los valores de P(X = x) son todos positivos rnenores que 1 y la surna de los rnismos es igual a 1 Estas no son caracterfsticas particulares de este ejernplo sino que son caracterfsticas para todas las distribushyciones de probabilidad de variable discreta Por 10 tanto se dan las siguientes propiedades indispensables en unadistribuci6n de probabilidad para una variashyble discreta

1) 0 P(X = x) 1

2) LP(X= x) = 1

86 CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD

35

34

33

32

31

30

29

28

27

26

25

24

23

22

21

20

0 19 Jl 18 0

~ 17

a 16

15

14

13

12

11

10

09

08

07

06

05

04

03

02

01

o 2 3 4

x (numero de medicamentos)

FIGURA 421 Representaci6n grafica de la distribuci6n de probabilidad de la tabla 421

Tambien se observa que cada una de las probabilidades de la tabla 422 es la frecuencia relativa de ocurrencia de cada valor de X

Cuando se tiene disponible la distribuci6n de probabilidad es posible hacer afirshymaciones acerca de la variable aleatoria X Se muestra con los siguientes ejemplos

42 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 422 ~

~Cual esla probabilipad d~ que una mujer seleqionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin prescripci6n

Solucion Se puede escribir la probabilidad deseada comoP(X = 3) En la tabla 422 se puede ver que la respuesta es 0832 bull

EJEMPLO 423

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido uno 0 dos medicamentos

Solucion Para responder a la pregunta se utiliza la regIa de adici6n para eventos mutuamente excluyentes Mediante el uso de la notaci6n de probabilishydad y los resultados de la tabla 4221a respuesta se escribe como P(l u 2) P(l) + P(2) 3228 + 1895 = 5123 bull

lJiStrihuciOlles acumulqdas AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 422 puede obtenerse sumando sucesivamente las probabilishydades P(X = x) que aparecen en la ultima columna La probabilidad acumulada para Xi se escribe como F(x) P(Xlt x) Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 423 La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 422 A una grafica de este tipo se Ie llama ojiva La grafica de F(x) consiste solamente en las lineas horizontales Las lfneas verticales s610 Ie dan una aparienshycia conectada La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 421 Por ejemplo la longitud de la lfnea vertical en X 3 de la figura 422 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 421 0 0832 en la escala vertical

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes

EJEMPLO 424

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos

Solucion La probahilidad buscadase puede locaJizar directamente en la tabla 423 en ellado opuesto a x = 2 donde se observa que es 8528 Es decir P(x lt 2) = 8528 Tambien se puede localizar la respuesta examinando la figura 422 y determinando la altura de la grafica (medida sobre el eje vertical) arriba delvalor deJ = 2 bull

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 2: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

-----

CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

DEFINICION La distribucion de probabilidad de una variable aleatoria discreta es una tabla unagratica una fannula u otro sistelDa utilizado para especificar todos losvalores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas

EJEMPLO 421 --~

En un articulo de la revistaAmericanJournal oObstetrics and Gynecology Buitendijk y Bracken (A-I) aseguran que durante 25 afios se ha tornado mayor conciencia de los efectos potencialmente dafiinos de los medicamentos y quimicos en el desarrollo de los fetos En una poblaci6n de mujeres dadas de alta en maternidad en un hospital del este de EUA entre 1980 y 1982 los autores valoraron y estudiaron la asociaci6n del uso d~ medicamentos con varias caracteristicas de la madre por ejemplo uso de alcohol tabaco y adicci6n a farmacos Sus hallazgos sugieren quela

TABIA421 Prevalenciadel CODSUIDO de medicmnentos prescritos y no prescritos durante el embarazo enUelllujeres dadas de alta depues del parto en un hospital del este de EUA

middotN6mero de medicamentos Frecuencia

o 1425 1 1351 2 793 3 348 4 156 5 58 6 28 7 15 8 6 9 3

FUENTE Simone Buitendijk y Michael B Bracshy10 ken Medication in Early Pregnancy Prevalence

12 of Use and Relationship to Maternal Characteshyristics AmericanJournal ofObstetrics and GynecoshyTotal 4185 logy 16533-40

mujer que muestra un comportamiento mas propenso a correr riesgos durante e1 embarazo tambien esta mas propensa a utilizar medicamentos durante el mismo La tabla 421 muestra la prevalencia del consurno de medicamentos prescritos y no prescritos durante el embarazo entre las mujeres estudiadas

42 DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS 85

TABlA 422 Distribucion de probabilldad del nUrnero de medicamentos consumidos con y sin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 42 t

Numero de medicamentos (x) P(X =x)

0 3405 I 3228 2 1895 3 0832 4 0373 5 0139 6 0067 7 0036 8 0014 9 0007

10 0002 12 0002

Total 10000

Se pretende construir la distribuci6n de probabilidad de la variable discreta X donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados

Soluci6n Los valores de X son XI = 0 x2 1 XlI = lOy X 12 = 12 Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total 4185 Asl porejemplo P(X x) = 14254185 = 3405 EI resultado se rnuestra en la tabla 422 que representa la distribuci6n de probabilidades deseada bull

Altemativarnente se puede presentar esta distribuci6n de probabilidad en forma grafica como en la figura 421 En dicha figura la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x

En la tabla 422 se observa que los valores de P(X = x) son todos positivos rnenores que 1 y la surna de los rnismos es igual a 1 Estas no son caracterfsticas particulares de este ejernplo sino que son caracterfsticas para todas las distribushyciones de probabilidad de variable discreta Por 10 tanto se dan las siguientes propiedades indispensables en unadistribuci6n de probabilidad para una variashyble discreta

1) 0 P(X = x) 1

2) LP(X= x) = 1

86 CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD

35

34

33

32

31

30

29

28

27

26

25

24

23

22

21

20

0 19 Jl 18 0

~ 17

a 16

15

14

13

12

11

10

09

08

07

06

05

04

03

02

01

o 2 3 4

x (numero de medicamentos)

FIGURA 421 Representaci6n grafica de la distribuci6n de probabilidad de la tabla 421

Tambien se observa que cada una de las probabilidades de la tabla 422 es la frecuencia relativa de ocurrencia de cada valor de X

Cuando se tiene disponible la distribuci6n de probabilidad es posible hacer afirshymaciones acerca de la variable aleatoria X Se muestra con los siguientes ejemplos

42 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 422 ~

~Cual esla probabilipad d~ que una mujer seleqionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin prescripci6n

Solucion Se puede escribir la probabilidad deseada comoP(X = 3) En la tabla 422 se puede ver que la respuesta es 0832 bull

EJEMPLO 423

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido uno 0 dos medicamentos

Solucion Para responder a la pregunta se utiliza la regIa de adici6n para eventos mutuamente excluyentes Mediante el uso de la notaci6n de probabilishydad y los resultados de la tabla 4221a respuesta se escribe como P(l u 2) P(l) + P(2) 3228 + 1895 = 5123 bull

lJiStrihuciOlles acumulqdas AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 422 puede obtenerse sumando sucesivamente las probabilishydades P(X = x) que aparecen en la ultima columna La probabilidad acumulada para Xi se escribe como F(x) P(Xlt x) Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 423 La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 422 A una grafica de este tipo se Ie llama ojiva La grafica de F(x) consiste solamente en las lineas horizontales Las lfneas verticales s610 Ie dan una aparienshycia conectada La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 421 Por ejemplo la longitud de la lfnea vertical en X 3 de la figura 422 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 421 0 0832 en la escala vertical

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes

EJEMPLO 424

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos

Solucion La probahilidad buscadase puede locaJizar directamente en la tabla 423 en ellado opuesto a x = 2 donde se observa que es 8528 Es decir P(x lt 2) = 8528 Tambien se puede localizar la respuesta examinando la figura 422 y determinando la altura de la grafica (medida sobre el eje vertical) arriba delvalor deJ = 2 bull

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 3: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

42 DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS 85

TABlA 422 Distribucion de probabilldad del nUrnero de medicamentos consumidos con y sin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 42 t

Numero de medicamentos (x) P(X =x)

0 3405 I 3228 2 1895 3 0832 4 0373 5 0139 6 0067 7 0036 8 0014 9 0007

10 0002 12 0002

Total 10000

Se pretende construir la distribuci6n de probabilidad de la variable discreta X donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados

Soluci6n Los valores de X son XI = 0 x2 1 XlI = lOy X 12 = 12 Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total 4185 Asl porejemplo P(X x) = 14254185 = 3405 EI resultado se rnuestra en la tabla 422 que representa la distribuci6n de probabilidades deseada bull

Altemativarnente se puede presentar esta distribuci6n de probabilidad en forma grafica como en la figura 421 En dicha figura la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x

En la tabla 422 se observa que los valores de P(X = x) son todos positivos rnenores que 1 y la surna de los rnismos es igual a 1 Estas no son caracterfsticas particulares de este ejernplo sino que son caracterfsticas para todas las distribushyciones de probabilidad de variable discreta Por 10 tanto se dan las siguientes propiedades indispensables en unadistribuci6n de probabilidad para una variashyble discreta

1) 0 P(X = x) 1

2) LP(X= x) = 1

86 CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD

35

34

33

32

31

30

29

28

27

26

25

24

23

22

21

20

0 19 Jl 18 0

~ 17

a 16

15

14

13

12

11

10

09

08

07

06

05

04

03

02

01

o 2 3 4

x (numero de medicamentos)

FIGURA 421 Representaci6n grafica de la distribuci6n de probabilidad de la tabla 421

Tambien se observa que cada una de las probabilidades de la tabla 422 es la frecuencia relativa de ocurrencia de cada valor de X

Cuando se tiene disponible la distribuci6n de probabilidad es posible hacer afirshymaciones acerca de la variable aleatoria X Se muestra con los siguientes ejemplos

42 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 422 ~

~Cual esla probabilipad d~ que una mujer seleqionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin prescripci6n

Solucion Se puede escribir la probabilidad deseada comoP(X = 3) En la tabla 422 se puede ver que la respuesta es 0832 bull

EJEMPLO 423

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido uno 0 dos medicamentos

Solucion Para responder a la pregunta se utiliza la regIa de adici6n para eventos mutuamente excluyentes Mediante el uso de la notaci6n de probabilishydad y los resultados de la tabla 4221a respuesta se escribe como P(l u 2) P(l) + P(2) 3228 + 1895 = 5123 bull

lJiStrihuciOlles acumulqdas AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 422 puede obtenerse sumando sucesivamente las probabilishydades P(X = x) que aparecen en la ultima columna La probabilidad acumulada para Xi se escribe como F(x) P(Xlt x) Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 423 La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 422 A una grafica de este tipo se Ie llama ojiva La grafica de F(x) consiste solamente en las lineas horizontales Las lfneas verticales s610 Ie dan una aparienshycia conectada La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 421 Por ejemplo la longitud de la lfnea vertical en X 3 de la figura 422 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 421 0 0832 en la escala vertical

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes

EJEMPLO 424

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos

Solucion La probahilidad buscadase puede locaJizar directamente en la tabla 423 en ellado opuesto a x = 2 donde se observa que es 8528 Es decir P(x lt 2) = 8528 Tambien se puede localizar la respuesta examinando la figura 422 y determinando la altura de la grafica (medida sobre el eje vertical) arriba delvalor deJ = 2 bull

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 4: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

86 CAPiTULO 4DISTRIBUCIONES DE PROBABILIDAD

35

34

33

32

31

30

29

28

27

26

25

24

23

22

21

20

0 19 Jl 18 0

~ 17

a 16

15

14

13

12

11

10

09

08

07

06

05

04

03

02

01

o 2 3 4

x (numero de medicamentos)

FIGURA 421 Representaci6n grafica de la distribuci6n de probabilidad de la tabla 421

Tambien se observa que cada una de las probabilidades de la tabla 422 es la frecuencia relativa de ocurrencia de cada valor de X

Cuando se tiene disponible la distribuci6n de probabilidad es posible hacer afirshymaciones acerca de la variable aleatoria X Se muestra con los siguientes ejemplos

42 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 422 ~

~Cual esla probabilipad d~ que una mujer seleqionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin prescripci6n

Solucion Se puede escribir la probabilidad deseada comoP(X = 3) En la tabla 422 se puede ver que la respuesta es 0832 bull

EJEMPLO 423

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido uno 0 dos medicamentos

Solucion Para responder a la pregunta se utiliza la regIa de adici6n para eventos mutuamente excluyentes Mediante el uso de la notaci6n de probabilishydad y los resultados de la tabla 4221a respuesta se escribe como P(l u 2) P(l) + P(2) 3228 + 1895 = 5123 bull

lJiStrihuciOlles acumulqdas AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 422 puede obtenerse sumando sucesivamente las probabilishydades P(X = x) que aparecen en la ultima columna La probabilidad acumulada para Xi se escribe como F(x) P(Xlt x) Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 423 La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 422 A una grafica de este tipo se Ie llama ojiva La grafica de F(x) consiste solamente en las lineas horizontales Las lfneas verticales s610 Ie dan una aparienshycia conectada La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 421 Por ejemplo la longitud de la lfnea vertical en X 3 de la figura 422 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 421 0 0832 en la escala vertical

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes

EJEMPLO 424

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos

Solucion La probahilidad buscadase puede locaJizar directamente en la tabla 423 en ellado opuesto a x = 2 donde se observa que es 8528 Es decir P(x lt 2) = 8528 Tambien se puede localizar la respuesta examinando la figura 422 y determinando la altura de la grafica (medida sobre el eje vertical) arriba delvalor deJ = 2 bull

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 5: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

42 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 422 ~

~Cual esla probabilipad d~ que una mujer seleqionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin prescripci6n

Solucion Se puede escribir la probabilidad deseada comoP(X = 3) En la tabla 422 se puede ver que la respuesta es 0832 bull

EJEMPLO 423

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido uno 0 dos medicamentos

Solucion Para responder a la pregunta se utiliza la regIa de adici6n para eventos mutuamente excluyentes Mediante el uso de la notaci6n de probabilishydad y los resultados de la tabla 4221a respuesta se escribe como P(l u 2) P(l) + P(2) 3228 + 1895 = 5123 bull

lJiStrihuciOlles acumulqdas AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 422 puede obtenerse sumando sucesivamente las probabilishydades P(X = x) que aparecen en la ultima columna La probabilidad acumulada para Xi se escribe como F(x) P(Xlt x) Estoda la probabilidad de que X sea menor o igual a un valor espedfico xi

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 423 La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 422 A una grafica de este tipo se Ie llama ojiva La grafica de F(x) consiste solamente en las lineas horizontales Las lfneas verticales s610 Ie dan una aparienshycia conectada La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 421 Por ejemplo la longitud de la lfnea vertical en X 3 de la figura 422 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 421 0 0832 en la escala vertical

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes

EJEMPLO 424

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron dos 0 menos medicamentos

Solucion La probahilidad buscadase puede locaJizar directamente en la tabla 423 en ellado opuesto a x = 2 donde se observa que es 8528 Es decir P(x lt 2) = 8528 Tambien se puede localizar la respuesta examinando la figura 422 y determinando la altura de la grafica (medida sobre el eje vertical) arriba delvalor deJ = 2 bull

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 6: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

88 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

TABlA 423 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el embanno entre las mujeres descritas en el ejetUplo 421

Numero de medicamentos (x) Frecuencia acumulada P(X 2)

o 1

2

3

4

5

6

7 8

9

10

12

3405

6633

8528

9360

9733

9872

9939

9975

9989

9996

9998

10000

100

95

90

85

80

75

70

65

60

55

50~ r

45

40

35

30

25

20

15

10

05

2 3 4 5 7o 8 9 10 11 12

x (numero de medicamenlos)

FIGURA 422 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

sin prescripci6n utilizados durante el embaraZo entre las mujeres descritas en el ejemplo 421

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 7: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

39 43 DISTRIBUCION BINOMIAL

EJEMPIJO 425

~GuaJ es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron menos de dos medicamentos

SoIudonPuesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno la respuesta es la probabilidad acumulada para 1 esdecir P(x lt 2) = P(x S 1) == 6633 bull

EJEMPLO 426

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya conshysumido cinco 0 mas medicamentos

Soludon Para encontrar la respuesta se utiliza el conceptode probabilidad comshyplementaria EI conjunto de mujeres que consumen cinco 0 mas medishycltlmentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir cuatro 0 menos) La suma de las probabilidashydes asociadas coneste conjunto es igual a 1 Esta relacion escrita en notacion de probabilidad es P(x 2 5) + P(x s 4) == 1 Por 10 tanto P(x 2 5) = 1 - P(x s 4) = 1- 9733 = 0267 bull

EJEIUPLO 427

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos inclusive

Soludon P(x s 5) = 9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos inclusive Para obtener la probabilidad de entre 3 y 5 se resta de 9872 la probabilidad de 2 0 menos La respuesta escrita en notacion de probabilidad queda como P(3 S x s 5) P(x s 5) - P(x s 2) = 9872 - 8528 = 1344 bull

La distribuci6n de probabilidad dada en la tabla 421 esta desarrollada a partir de la experiencia real asi que de encontrar otra variable siguiendo esta distributi6n

seria s6lo por casualidad Sin embargo las distribuciones de probabilidad de mushychas variables de interes pueden determinarse 0 asumirse sobre la base de consideshyraciones te6ricas En las siguientes secciones se estudian con detalle tres de estas distribuciones te6ricas de probabilidad binomial Poisson y normal

43 DISTRIBUCION BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli nombrado as en honor del matematico suizo James Bernoulli (1654-1705) quien realiz6 contribuciones importantes en el campo de la probabishylidad induyehdo particularmente la distribucion binomial Guanda en un proceshyso aleatorio 0 experimento llamado ensayo puedeocurrir solo uno de dos resultados mutuamente excluyentes como vida 0 muerte enfermo 0 sano masculino 0 femeshynino el ensayo se llama ensayo de Bernoulli

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 8: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

90 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proceshyso de Bernoulli si se cumplen las siguientes condiciones

1 En cada ensayo ocurre uno de dos posibles resultados IIiuWamente excluyentes Uno delos posibles resultadossedenota (arbitrariamente) como un exito y el otro como fracaso

2 La probabilidad de un exito denotado porp permanece constante de un ensayo a otro y la probabilidad de fracaso 1 - p se denota con q

3 Los ensayos son independientes es decir el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo

EJEMPLO 431

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli Por ejemshyplo suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones La interpretacion de esto es que la probabilidad del nacishymiento de un varon registrado es de 52 Si aleatoriamente se escogen cinco regisshytros de nacimiento dentro de esa poblacion ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones

Solucion Designe la ocurrencia de un registro para el nacimiento de un varon como exito y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a mujeres La ocushyrrencia de un registro de nacimiento para un varon se designa como exito puesto que 10 que se busca son registros de nacimientos de varoshynes Sise buscasen registros denacimientos de mujeres estos sedan deshysignados como exitos y el registro de nacimientos de varones sedan designados como fracasos

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de nacishymiento de una mujer)

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli

Suponga que de los cinco registros de nacimiento seleccionados resulta esta secuencia de sexos

VMVVM

En forma codificada se escribe de la siguiente forma

10110

Puesto que la probabilidad de un exito ~e denota conpyla probabishylidad de un fracaso se denota con q la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion

P(l 0 1 1 0) = pqppq = q2p3

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 9: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

91 43 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta probashybilidad puesto que sebusca la probabilidad de un varon una mujer un varon un varon y una mujer en ese orden En otras palabras se requieshyre la probabilidad con junta de cinco eventos Por razones de sencillez se utili zan las comas en lugar de la notacion de interseccion para separar 10s resultados de los eventos en la expresion de la probabilidad

La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran Sin embargo el interes no esta en el orden de ocurrencia de los registros del nacimiento de varones y mujeshyres sino como se ha manifestado previamente en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamenteEn lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I) los tres exishytos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta

Numero Secuencia

2 11100 3 10011 4 11010 5 11001 6 10101 7 01110 8 00111 9 01011

10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocushyrrir yes igual a q2p3 probabilidad calculada para laprimera secuencia mencionada

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica solo se obtiene una secuencia de exitos 0 frashycasos La pregunta ahora es cual es la probabilidad de obtener la secuencia numero 1 la secuencia numero 2 0 la secuencia numero 10 Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales En este ejemplo se requiere sumar las 10 q2p3 10 que equivale a multiplicar q2p3 por 10 Ahora se puede responder a la pregunta original ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada Puesto que en Ia poblacion p =

52 Y q = (l - P) (1 - 52) 48 la respuesta a la pregunta es

10(48)2(52)310(2304)(140608) 32 bull

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 10: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

92 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Uso de la combinaci6n como procedimiento en maestros grandes Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra por 10 cual es necesario un metodo sencillo para contar el numero de secuencias Este metoshydo es proporcionado por la formula de conteo que permite determinar rapidashymente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen Cuando el orden de los objetos dentro de un subconjunto es inmaterial el subconjunto se llama combinacion de objetos Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos sin ver el orden de los objetos dentro del subconjunto el resultado se llama combinaci6n Por ejemplo se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por

n GN =---- (431)

x(n-x)

donde x que se lee x factorial es el producto de todos los numeros enteros de x hasta 1 Es decir xl = x(x - l)(x 2) (1) Observe que por definicion 01 1

En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 431 como sigue

120 10

12 En el ejemplo x = 3 es el numero de exitos as que n - x 2 representa el

numero de fracasos Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos

j(x) =nGxqn-xpx = nGjrqn-N para x = 0 1 2 n = 0 en caso contrario (432)

A esta expresion se Ie llama distribudon binomial En la ecuacion 432fix) P(X = x) donde X es la variable aleatoria el numero de exitos es n ensayos Se

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 11: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

93 43 DISTRIBUCION BINOMIAL

TABlA 431 Distribucion binomial

Numero de exitos x Probabilidad f(x)

o Coq-0pO 1 C1qn-lpl 2 nC2qn-2p2

x

n

Total 1

utilizajx) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal

La distribuci6n binomial se puede presentar en forma tabular como se muesshytra en la tabla 431

Se establece que Ia ecuacion 432 es una distribuci6n de probabilidad al mostrar 10 siguiente

1 jx) ~ 0 para todos los valores reales de x Esto proviene del hecho de que n y p no son nfuneros negativos por 10 que nex px y (1-p) -xtampoco 10 son por 10 tanto sus productos son mayores 0 iguales a cero

2 2jx) = 1 Esto se considera cierto al reconocer que 2Cxq -x px es igual a [(1 shyp) + p] = I = 1 que es la expresi6n binomial familiar Si el binomio (q + p)n es desarrollado se tiene

+ +nqlpn-l +pn

Si los terminos de la expansion son comparados termino a termino con los fix) de la tabla 431 se aprecia que son equivalentes termino a termino porque

f(O) c~n-O pO fl) C q-l pt nqn-lpl

n 1

n(n 1)

2

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 12: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

94 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FJEJtIPLO 432

Otro ejemplo del uso de la distribucion binomial Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad Si se escoge una muesshytra aleatoria de 10 elementos de entre esta poblacion ~cultil es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes

Solucion Se tiene que la probabilidad de elegir una persona inmune es de 3 AI utilizar la ecuacion 431 se encuentra que

f(4) =IOC4 (7)6(3)4

= 10 (1l7649)(0081) 416

=2001 bull Tabla binomial El calculo de una probabilidad empleando la ecuacion 431 puede ser una labor tediosa si el tamafio de la muestra es grande Por fortuna las probabilidades para diferentes valores de n pyx ya estan tabuladas por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad deshyseada La tabla B del apendice es una de muchas tab las disponibles Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico Es decir la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos

El uso de la tabla se muestra utilizando el ejemplo 432 en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y P=3 De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior se sabe que P(x

4) puede calcularse restando P(X ~ 3) de P(X ~ 4) Si en la tabla B se localiza a p 3 para n = 10 se encuentra que P(X ~ 4) 8497 y P(X ~ 3) = 6496 La resta del

primero menos el segundo es igual a 8497 6496 = 2001 10 cual coincide con el calculo manual

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X sino para intervalos donde la probabilidad de X este entre digamos 5 y 10 Con el siguiente ejemplo se muestra 10 anterior

rJEJtIPLO 433

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica Si se extrae una muestra aleatoria de 25 personas de esa poblacion con la tabla B del apendice encuentre la probabilidad de que

a) Existan cinco 0 menos daltonicos

Solucion La probabilidad esta en una de las entradas de la tabla Sin la necesidad de sumar ni res tar la probabilidad P(X ~ 5) = 9666

b) Existan seis 0 mas daltonicos

Soluci6n Esta probabilidad no se puede encontrar directamente en la tabla Para encontrar la respuesta se utiliza el concepto de probabilidades compleshymentarias La probabilidad de que existan seis 0 mas daltonicos es el

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 13: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

95 43DISTRIBUCION BINOMIAL

complemento de la probabilidad de que existan cinco 0 menos Es decir este con junto es el complemento del con junto especificado en el inciso a por 10 tanto

P(X 1 - P(X 5) == I 9666 0334

c) Existan entre seis y nueve daltonicos inclusive

Soludon Esta probabilidad se encuentra restando la probabilidad de que X sea meshy nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9 Es decir

P(6 X 9) P(X 9) - P(X 5) 9999 9666 0333

d) Existandos tres 0 cuatro daltonicos

Soludou Esta es la probabilidad de que X este entre 2 y 4 inclusive

P(X X 4) P(X 4)-P(X 1) 9020-2712 = 6308 bull

Ulilizar la labia B cuandop gt 5 La tabla B no da las probabilidades para valores de p mayores a 5 Sin embargo pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de frashycaso I -p en lugar de en terminos de probabilidadde exito p Como parte del rep~anttamiento se debe pensar tambien en terrninos del numero de fracasos n x mas que en terrninos de exitos x Esta idea se resume de lasiguiente manera

P(X xlnpgt 50) = P(X n-xlnI-p) (433)

Puesta en palabras la ecuacion 433 dice que La probabilidad de que X sea igual a algun valor especffico dado el tamano de la muestra y una probabilidad mayor que 5 es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p Con la finalidad de utilizar la tabla binomial la probabilidad de un fracaso se trato como la probabilidad de un exito

_Cuando pes mayor que 5 las probabilidades acumuladas pueden obtenerse a parshytir de la tabla B empleando la siguiente relacion

P(X x In p gt 5) = P(X n - x In 1 - p) (434)

Finalmente al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0

igual a alguna x cuando P gt 5 se utiliza la siguiente relacion

P(X xlnp gt 5) P(X n-xln I-P) (435)

EJEMPLO 434

Encierta comunidad en una tarde dada en 85 por cientode las farnilias alguno de los miembros esta en casa Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica Con la tabla B calcule la probabilidad de que

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 14: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

96 CAPITUL04 DISTRIBUCIONES DE PROBABILIDAD

a) EI equipo encuentre a alguien en casa en 7 familias exactamente

Soluci6n EI replanteamiento del problema es como sigue Si en 15 por ciento de las familias no hay nadie en casa ~cual es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llamashydas La respuesta se calcula como sigue

P(X = 51n= 12 15) P(Xs 5)-P(Xs 4) =9954 - 9761 0193

b) EI equipo encuentre a alguien en casa en 5 familias 0 menos

Soluci6n La probabilidad que se busca es

P(X S 51n = 12p =85) = P(X 212 51n = 12p =15) P(X271n 12p 15)

= 1 P(Xs 61n 12p =15) = 1 - 9993 0007

c) EI equipo encuentre a alguien en casa en 80 mas familias

Soluci6n La probabilidad que se busca es

P(X 2 81n = 12p =85) = P(X S 41n = 12p =15) = 9761 bull

La figura 431 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 434

N6mero posible Numero posible de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x Condici6n de P(JtxITo) = 85 prohabilidad P(FRACASO) =15 probabilidad

Inciso b P(X ~ 5112 ~5)

6 6 Inciso a CD P(X == 7112 85) reg

Inciso c P(X ~ 8112 85) 11

12reg 0

P(X~ 7112 15)

P(X == 7112 15 )

p(X~4112 15)

FIGURA 431 Representaci6n esquematica de la soluci6n del ejemplo 434 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 15: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros n y p Son parametros en el sentido de que son suficientes para especificar una distrishybucion binomial La distribucion binomial es en realidad una familia de distribushyciones con cada uno de los valores posibles de n y p designando a un miembro diferente de la familia La media y la variancia de la distribucion binomial son Jl = np y ()2 = np(1 - P) respectivamente

La distribucion binomial formalmente hablando es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita logicashymente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de p de un ensayo a otro Normalmente se considera que ruando n es pequeno en relacion con N el modelo binomial es aderuado Algunos autores coinciden en que n es pequeshyno en relacion con N si N es al menos 10 veces mas grande que n

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales Por ejemplo MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x n y p Suponga que se pretende encontrar las probabilishydades individuales desde x = 0 hasta x = 6 cuando n = 6 Y P 3 Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 432 Si la pretension es encontrar las probabilidades acumuladas se procede como en la figura 433

En cada uno de los siguientes ejercicios suponga que N es suficientemente grande con relashyci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden

431 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics Najjar y Rowland (A-2) informaron que 257 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso Si se extrae una muesshytra aleatoria simple de 20 adultos encuentre la probabilidad de que el numero de personas con sobrepeso dentro de la muestra sean

a) Exactamente tres personas b) Tres 0 mas personas

c) Menos de tres d) Entre tres y siete inclusive

432 Consulte el ejercicio 431 ~Cuantos adultos con sobrepeso se espera encontrar en la muesshytra de 20

433 Consulte el ejercicio 431 Suponga que se extrae una muestra aleatoria simple de cinco adultos Con la ecuaci6n 432 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea

a) Cero b) Mas de una c) Entre uno y tres inclusive d) Dos 0 menos e) Cinco

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 16: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

98 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Binomial

MTB gt SUBCgt

PDF C1 BINOMIAL 6 03

Seleccionar Probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seshyleccionar Input column y teclear Cl Clic OK

Resultados

Probability Density Function

Binomial with n = 6 and p

x P(X = x) 000 01176 100 03025 200 03241 300 01852 400 00595 500 00102 600 00007

= 0300000

FIGURA 432 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6 cuando n 6 y P 3

434 Un informe del National Center for Health Statistics bas ado en los datos de 1985 afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3) Considere una muesshytra aleatoria simple de 15 adultos seleccionados en ese momento Encuentre la probabilidad de que el numero de fumadores en la muestra sean

a) Tres b) Menos de cinco c) Entre cinco y nueve inclusive d) Mas de cinco pero menos de 10

e) Seis 0 mas

435 Consulte el ejercicio 434 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15

436 En referencia al ejercicio 434 suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985 iPor que sf 0 por que no

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 17: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 99

Datos

C1 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt MTB gt CDF C1Binomial SUBCgt BINOMIAL 6 0 bull 3 bull

Seleccionar Cumulative probability Teclear 6 en Number of trials Teclear 03 en Probability of success Seleccionar Input column y teclear CI Clic OK

Resultados

Cumulative Distribution Function

Binomial with n = 6 and p = 0300000

x P(X = x) 000 01176 100 04202 200 07443 300 09295 400 09891 500 09993 600 10000

FIGURA 433 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x = 0 hasta x = 6 cuando n = 6 Y P = 3

437 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-9 Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco Encuentre la probabilidad de que el numero de personas que logran alivio sean

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

438 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maesshytria 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado Si este porcentaje representa a toda la poblaci6n encontrar para una muestra de 15 la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve inclusive

439 Dado el parametro binomial p = 8 Yn = 3 muestre mediante el desarrollo binomial dado en la tabla 431 que if(x) = 1

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 18: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

100 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

44 DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840) quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837 Esta distrishybud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad Haight (1) en el capitulo 7 de sulibro presenta un repertorio muy amplio de aplicaciones

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia) la probabilidad de que x ocurra es dada por

e-l) f(x)=-- x=012 (441 )

x

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen) EI sfmbolo e es la constante (con cuatro decimales) 27183

Se puede mostrar que fix) ~ 0 para cada x y que r x f (x) 1 por 10 tanto la distribuci6n satisface los requerimientos para la distribuci6n de probabilidad

Proceso tk Poisson Como se ha visto la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas Lo mismo ocurre en el caso de la distribuci6n de Poisson Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson

1 Las ocurrencias de los eventos son independientes La ocurrencia de un evenshyto en un intervalo l de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo 0 en algiin otro intervalo

2 Te6ricamente debe ser posible la ocurrencia de un evento en un numero infinito de veces dentro del intervalo

3 La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo

4 En cualquier fracci6n infinitesimal del intervalo la probabilidad de mas de una ocurrencia del eVfnto es insignificante

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades distribuidos al azar en espacio 0

tiempo Es facil intuir cuando cierto proceso obedece a la ley de Poisson y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad la distribuci6n de Poisson se estudia en terminos de intervalos aunque tambien intershyvienen otras unidades como volumen

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 19: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

101 44 DISTRIBUCION DE POISSON

de espacio 0 tiempo Por ejemplo suponiendo que la distribuci6n de alglin parasishyto entre miembros individuales huespedes sigue la ley de Poisson y conociendo el parametro A se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos En el siguiente capitushylo se aprendera c6mo decidir si es recomendable suponer que un proceso especffishyco obedece la ley de Poisson

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades

FJEMPLO 441

En un estudio de suicidas Gibbons et al (A-4) encontraron que la distribuci6n menshysual de adolescentes suicidas en el condado de Cook Illinois entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 275 Encuentre la probabilishydad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suicishydio de tres adolescentes

Solucion Con la ecuaci6n 441 se encuentra que la respuesta es

e-275 275 3 (063928)(20796875)P(X=3)= 221584 bull3 6

FJEMPLO 442

En referencia al ejemplo 441 suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0

cuatro suicidios Solucion Puesto que los dos eventos son mutuamente exduyentes se utiliza la

regIa de la adici6n

e-275 275 4

P(X =3) +P(X =4) = 221584+--shy4

bull221584 + 152338 = 373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecuashyci6n Sin embargo se puede utilizar la tabla C del apendice en ella se encuentran las probabilidades acumuladas para varios valores de A y X

FJEMPLO 443

Durante eI estudio de cierto organismo acuatico se tom6 un gran numero de muesshytras de una laguna y se cont6 eI numero de organismos en cada muestra EI numeshyro promedio de organismos encontrados por muestra fue de dos Suponga que el numero de organismos sigue una distribuci6n de Poisson y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos

Solucion En la tabla C se aprecia que cuando A = 2 la probabilidad de que X S 1 es 406 Es decir P(X S 112) = 406 bull

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 20: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

102 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

EJEMPLO 444

Consulte el ejemplo 443 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos

Solucion P(X ~ 312) P(X ~ 3) - P(X ~ 2) 857 - 677 = 180 bull EJEMPLO 445

Consulte el ejemplo 443 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos

Solucion Puesto que el conjunto de mas de cinco organismos no inc1uye cinco la pregunta se refiere a la probabilidad de observar seis 0 mas organismos La respuesta se obtiene al restar la probabilidad de observar cinco 0 meshynos (organismos) de 1 Esto es

P(Xgt 512)= 1 P(X~ 5)= 1 983= 017 bull Datos

Cl 0 1 2 3 4 5 6

Gaja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt SUBCgt

PDF Cl Poisson 70

Seleccionar Probability Tec1ear 70 en Mean Seleccionar Input column y teclear Cl Clk OK

Resultados

Probability Density Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 03476 200 01217 300 00284 400 00050 500 00007 600 00001

FIGURA 441 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson individual para x = 0 hasta x 6 y A = 7

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 21: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 103

Muchos paquetes de software estadisticos calculan las probabilidades de Poisson y para este prop6sito se utiliz6 el paquete MINITAB Suponga que se quiere enconshytrar la probabilidad individual para x desde x 0 hasta x = 6 cuando A = 7 Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 441 Se obtienen las probabilidades acumuladas para los mismos valores de x y A como se muestra en la figura 442

EJERCICIOS

441 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por manzana es de cinco Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson y calcule la probabilidad de que en una manzana elegida aleatoriamente

a) Existan exactamente cinco ratas

b) Existan mas de cinco ratas

c) Existan menos de cinco ratas

d) Existan entre cinco y siete ratas inclusive

Datos

Cl 0 1 2 3 4 5 6

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Poisson MTB gt CDF Cl

Seleccionar Cumulative probability Teclear 70 SUBCgt Poisson 70

en Mean Seleccionar Input column y teclear Cl Clic OK

Resultados

Probability Distribution Function

Poisson with mu = 0700000

x P(X = x) 000 04966 100 08442 200 09659 300 09942 400 09992 500 09999 600 10000

FIGURA 442 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson acumulada para x = 0 hasta x 6 y Ie = 7

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 22: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

104 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

442 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfershymedad no contagiosa es de 10 Si el numero de muertes por esa enfermedad sigue la distrishybuci6n de Poisson emil es la probabilidad de que durante el ano en curso

a) Exactamente siete personas mueran por esa enfermedad

b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

443 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco calcule la probabilidad de que en el ano en curso haya

a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

444 En un estudio sobre a la efectividad de un insecticida contra cierto insecto se fumig6 una gran area de tierra que mas tarde se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n Experiencias previas han demostrashydo que el numero promedio de insectos vivos por cuadrante despues de fumigar es de 5 Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson emil es la probabishylidad de que cierto cuadrante elegido tenga

a) Exactamente un insecto vivo b) Cero insectos vivos

c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

445 En cierta poblaci6n cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnostishycados de cancer sea

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS inclusive e) Menos de siete

45 DISmmUCIONES DE PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui binomial y de Poisson son distribuciones de variable discreta Ahora se consideran las distribuciones de variable aleatoria continua En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores Consecuentemente entre cualesquiera dos valores asumidos por la variable contishynua existe un m1mero infinito de valores

Para comprender la naturaleza de la distribuci6n de una variable aleatoria continua considere los datos presentados en la tabla 141 yen la figura 232 En la tabla hay 169 valores para la variable aleatoria edad EI histograma de la figura 232 esta construido con puntos espedficos localizados sobre una linea que represhysenta la medici6n de interes y que forma una serie de rectangulos cuyas bases son las distancias entre dos puntos espedficos sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 23: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

105 45 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 451 Histograma resultante de un gran numero de valoshyres y c1ases de intervalos pequenos

Como se estudi6 en el capitulo 2 las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas Esto proporciona un metodo para calcular la frecuenshycia relativa de ocurrencia de valores entre dos puntos especfficos tan s610 es neceshysario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 232

Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia EI histograma resultante seria como el que se muestra en la figura 451

Si se conectan los puntos medios de las celdas del histograma en la figura 451 para formar un poligono de frecuencia se obtendra una figura mas suave que el polfgono de frecuencia de la figura 234

En general cuanto mas se aproximan a infinito el numero de n observacioshynes y la amplitud de los intervalos de clase se aproximan acero el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 452 Estas curvas suaves se utili zan para representar gnlficamente las distribucioshy

fIx)

FIGURA 452 Representaci6n grafica de una distribuci6n continua

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 24: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

106 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

fIx)

a x FIGURA 453 Gratica de una distribuci6n continua que muestra el area entre a y b

nes de las variables aleatorias continuas Esto tiene algunas consecuencias imp orshytantes cuando se trabaja con distribuciones de probabilidad Primero el area total bajo la curva es igual a uno como 10 es para el histograma y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera sobre el eje de las x es igual al area total delimitada por la curva el eje de las x y las rectas perpenshydiculares levantadas sobre ambos puntos del eje de las x tal como 10 muestra la figura 453 La probabilidad de cualquier valor especifico de la variable aleatoria es cera Esto es logico puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero

COIRO encontrar el area bajo la curva En un histograma seg(tn se ha visto las subareas de interes se calculan sumando areas representadas por las coshylumnas (celdas) En el caso de una curva esta no presenta celdas por 10 que se debe buscar un metodo para calcular las subareas Este metodo es suministrado por el cileushy10 integral Para calcular el area bajo la curva entre dos puntos cualesquiera a y b se integra lafunci6n de densidad de a a b Unafunci6n de densidad es una formula emshypleada para representar la distribuci6n de una variable aleatoria continua La inteshygracion es el caso lfmite de la sumatoria aunque aqui no se efectua ninguna integracion puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro Tambien como se ve mas adelante para todas las distribuciones contishynuas a considerar existe una forma mas fadl para calcular el area bajo la curva

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior a modo de resumen se premiddot senta como sigue en forma mas concreta

DEFINICION

A una funci6n no negativa f(x) se Ie llama distribucion de probabilidad (tambien llamada algunas veces funci6n de densidad de probabilidad) para la variable aleatoria continua X si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva el eje de las x y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 25: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

46 DISTRIBUCI6N NORMAL 107

46 DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica la distribucwn normal La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733 Muchos otros matemhicos destacan en la historia de la distribuci6n normal induyendo a Carl Friedrich Gauss (1777-1855) A esta distribuci6n frecuentemente se Ie llama distribuciOn de Gauss como reconocimiento a las contribuciones de este matematico

La densidad normal esta dada por

20) ooltXltoof(X) = (461)

En la ecuaci6n 461 1t Ye son constantes conocidas 314159 y 271828 respectivamente que se utilizan con frecuencia en matematicas Los dos parametros de la distribuci6n son ~ la media y (J la desviaci6n estindar Para el objetivo de esta secci6n se puede pensar que ~ y (J son medidas de tendencia central y dispershysi6n para la distribuci6n normal respectivamente tal como se estudia en el capitushylo 2 Sin embargo debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y + su media y desviaci6n estandar se pueden definir de manera mas rigurosa aunque estas definiciones no pueden darse sin utilizar el calculo La grafica de la distribuci6n normal produce la ya conocida curshyva en forma de campana tal como se muestra en la figura 461

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal

1 Es simetrica respecto a su media)1 Tal como se muestra en la figura 461 la curva hacia cualquiera de los lados de ~ es una imagen de espejo de la del otro lado

2 La media la mediana y la moda son todas iguales

3 EI area total bajo la curva sobre el de las x es una unidad de area Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distrishybuci6n de probabilidad Debido a la simetria mencionada anteriormente 50

xJL

FIGURA 461 Grifica de la distribud6n normaL

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 26: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

108 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia media y el otro 50 por ciento dellado izquierdo

4 Si se levantan perpendiculares a una distancia de una desviaci6n estltindar desshyde la media hacia ambos lados el area de1imitada por esas perpendiculares eI eje de las x y la curva sera de 68 por ciento del area total aproximadamente Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media estara induido aproximadamente 95 por ciento del area y extendiendolos a una distancia de tres desviaciones esrandar aproximadashymente 997 del area total estara englobada Las areas aludidas se muestran en la figura 462

u-1uuu+1u x

(a)

025

u

025

x

(b)

0015 0015

u-3u u u+ 30 x

el

FIGURA 462 Subdivision del area bajo la curva normal (las areas son aproximadas)

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 27: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

109 46 DISTRIBUCION NORMAL

x

FIGURA 463 Tres distribuciones normales con diferente media pero con la misma vashyriabilidad

5 Los parametros Jl y cr determinan completamente la distribuci6n normal En otras palabras por cada valor diferente de Jl y cr se especifica una distribuci6n normal distinta Los valores diferentes de Jl desplazan la grafica de la distribushyci6n a 10 largo del eje de las x tal como se muestra en la figura 463 Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n tal como se muestra en la figura 464

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de disshytribuciones en la que un miembro se distingue de otro seglin los valores de Jl y cr EI miembro mas importante de esta familia es la distribucion normal estdndar 0

distribucion normal unitaria Hamada as en ocasiones porque tiene una media igual a cero y una desviaci6n estandar igual a 1 Esta distribuci6n se puede obtener a partir de la ecuaci6n 461 creando una variable aleatoria z = (x - Jl )cr La ecuaci6n para la distribuci6n normal estandar se escribe

2 _ 00 lt z lt 00 (462)

x

FIGURA 464 Tres distribuciones normales con diferente desviaci6n estandar pero con la misma media

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 28: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

110 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

FIGllRA 465 Distribuci6n normal estindar

La grafica de la distribuci6n normal estandar se muestra en la figura 465 Para calcular la probabilidad de que z tome un valor entre dos puntos cualesshy

quiera sobre el eje de las z por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos la curva y el eje horizontal Tal como se mendon6 anteriormente las areas bajo la curva de una distribuci6n contishynua se calculan integrando la funci6n entre dos valores de la variable Entonces en el caso de la normal estandar para calcular directamente el area entre Zo Yz es necesario calcular la siguiente integral

r~-Zf2dzzoamp Afortunadamente no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse La tabla D del apendice es un ejemplo de estas tashybIas En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre OltJ y los valores de z mostrados en Ia columna izquierda de la tabla EI area sombreada de Ia figura 466 representa el area que aparece como Iista en la tabla para los valores entre OltJ y zo donde Zo es el valor espedfico de z

Ahora con los siguientes ejemplos se muestra el uso de la tabla D

FIGURA 466 Area dada por la tabla D del apendice

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 29: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

111 46 DISTRIBUCION NORMAL

EJEMPLO 461

Dada la distribucion normal estandar calcular el area bajo la curva arriba del eje z entre z = - 00 y z = 2

Soluci6n Resulta utH dibujar la grafica de la distribudon normal estandar y somshybrear el area que se pide tal como se muestra en la figura 467 Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla se encuentra que el area solicitada es 9772 Esta area se puede interpretar de diferentes formas como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2 como la frecuencia relativa de ocurrenda (0 proshypordon) de valores de z entre -ooy 2 0 bien se puede decir que 9772 por ciento de los valores de z estan entre 00 y 2 bull

o 2 z

FIGUR- 467 Distribuci6n normal estandar que muestra el areaentrez = coy z = 2

EJEMPLO 462

~Cual es la probabilidad de que una z tomada al azar de entre los valores de z este entre -255 y +255

Soluci6n La figura 468 muestra e 1 area que se pide En la tabla D se da el area entre 00 y 255 que se obtiene localizando el valor de 25 en la primeshyra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o 255 x

Curva normal estandar para mostrar P(-255 lt z lt 255)

-255

HGUKA 468

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 30: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

112 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

eneontrar la entrada de la columna eneabezada por 005 EI area es de 9946 Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide por 10 que es neeesario restar de 9946 el area a la izquierda de -255 AI consultar la tabla D esta muestra que el area a la izquierda de -255 es 0054 Porlo tanto la probabilidad que se busea es

P(-255 lt z lt 255) = 9946 - 0054 9892 bull Suponga que se pide calcular la probabilidad de que z esta entre -255 y 255 inclushysive La probabilidad que se pide se expresa como P(-255 s z ~ 255) Como se mencion6 en la seeei6n 45 P(z = zo) = 0 entonees P(-255 s z s 255) = P(-255 lt z lt 255) = 9892

EJEMPLO 463

~Cuantos valores de z estan entre -274 y 153

Soindon La figura 469 muestra e1 area que se pide En la tabla D se encuentra que el area que esta entre 00 y 153 es 9370 y el area entre - 00 y -274 es 0031 Para obtener la probabilidad se resta 0031 a 9370 Esto es

P(-274S zs 2153) 9370 - 0031 = 9339

-274 o 153 z

FlGUR469 CUIva normal estfuldar para mostrar la proshyporci6n de los valores de z entre z -274 y z 153 bull EJEMPLO 464

Dada la distribuci6n normal estandar calcular P(z 271)

Soindon EI area deseada se muestra en la figura 4610 Para obtener el area a la derecha de z 271 se resta el area entre y 271 de 1 Asi

P(z 271) = I-P(zS 271) = 1- 9966

0034

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 31: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 113

o 271 z

FIGUM 4610 Distribuci6n normal estindar para mostrar P(z ~ 271) bull

EJEMPLO 465

Dada la distribuci6n normal estandar calcule P(84 S z s245)

Soluci6n EI area que se desea calcular se muestra en la figura 4611 Primero se obtiene el area entre 00 y 245 a Ia que se Ie resta el area entre - 00 y 84 En otras pa]abras

P(84 s z s 245) = P(z s 245) P(z s 84) = 9929 - 7995 = 1934

bull FJERCICIOS

Curva normal esUindar para mostrar P(84 z 245)FIGUM 4611

Dada la distribuci6n normal estandar calcule

461

462

463

EI area bajo la curva entre z 0 y z 143

La probabilidad de que una z sacada al azar tenga un valor entre z = -287 Yz

P(z ~ 55) 464 pez 2 - 55)

264

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 32: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

114 CAPiTULO 4 DlSTRIBUCIONES DE PROBABILIDAD

465 P(Z lt -233) 466 P(z lt 233)

467 P(-196S Z S lJ) 468 P(-258 $ Z S 258)

469 P(-165 Z S 165) 4610 P(z = 74)

Dadas las siguientes probabilidades calcule Zj

4611 P(z S Zj) 0055 4612 P(-267 S Z S Zl) =9718 4613 P(zgtZj) =0384 4614P(zjSz$298)=11l7

4615 P(-Zj$ Z SZj) 8132

47 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza Sin embargo es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente norshymal En consecuencia aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes Al utilizar la distribucion normal como modelo es posible establecer afirmaciones de probashybilidad mas utiles y mucho mas convenientes para algunas variables que si se utilishyzara un modelo mas complicado _

La estatura yla inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal En otras palabras muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normalSin embargo si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0 en el caso de ignorarlo se considera razonable hacer esta suposicion la distribushycion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver proshyblemas practicos relativos a esa variable Sin embargo se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud

Existen varias razonesmas pot las que la distribuci6n normal es muy imporshytante en estadfstica las cuales seran consideradas a su debido tiempo Por ahora se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe 0 es razonable suponer que estas presentan una distribuci6n aproximadamente normal

FJElIPLO 471

Como parte de un estudio de la enfermedad de Alzheimer Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal A partir de los datos develados se puede calcular la media de 107680 gramos con una desviaci6n estandar de 10576 gramos Si se asume que estos resultados son aplicables a todas

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 33: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

47 APLICACIONES DE DISTRIBUCION NORMAL t15

FIGURA 4 71 De una distribuci6n normal a una distribushyci6n aproximada de pesos de los cerebros de pacientes enfershymos de Alzheimer (con estimaci6n de media y desviaci6n estandar)

las vfctimas de Alzheimer encuentre la probabilidad de que una victima selecciQnashyda al azar tengaun c~rebro que pese menos de 800 gramus

Soludom En la figura 471 se puede apreciar la gnifita que describe la distribushyci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada

Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1 serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQAfQrtunadamente es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facilishydad en una distribuci6n nQrmal estandar EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z EstQ significa que la media deX se puedevolver 0 la media de z Enla figura 472 se muestran ambas distribuciQnes Se puede determinar que e1 valor de z

z -262 0

FIGURA 472 Distrihuci6n normal del peso de los cerebros (x) y la distribuci6n normal estandar (z)

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 34: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

116 CAPiTULO 4 DISTRIBUCIONES DE PROBABILIDAD

por decir ZO corresponde a una x de 800 Esto se hace con la siguiente formula

x z=

(j (471)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en ladistribucion normal estandar Para este ejemplo se tiene

z = 800 -107680 = -262 10576

Entonces el valor buscado para Zo es -262 bull AI ex~ullinar esta relacion minuciosamente se observa que la distancia de la media 107680 hasta el valor de x 800 es 800 107680 -27680 que representa una distancia de 262 unidades de desviacion estltindar Cuando se transforman los valoshyres correspondientes al peso del cerebro la distancia del valor de z desde su media Oes igual a la distancia del valor x correspondiente desde su media 107680 en unidades de desviacion estltindar A esto se refiere la distancia anterior de 262 unishydadesdedesviaci6n estltindar En la distribuci6n z uI)adesviacion estandar es igual a 1 y en consecuencia el punto en la escala dez se localiza a una distancia de 262 unidades de desviaci6n estandar antes de 0 es decir z -262 resultado que se obtiene con la formula AI consultar la tabla D se encuentra que el area a la izquiershyda de z= -262 es 0044 Se puede resumir este analisis como sigue

P(x lt 800) =p(z lt 800 107680) =P(z lt -262) 0044 10576

Para responder a la pregunta original se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de 0044

EJEMPLO 472

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas

Solucion En la figura 473 se muestra la distribuci6n de las estaturas y la distribushycion z que resulta de transformar los valores originales para determinar las probabilidades deseadas Se encuentra que el valor z correspondienshyte para una x de 65 es

65-70 =-167 bullz 3

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 35: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

117 47 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-167 o 133 z

FIGURA 473 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z)

AnaIogamente para x = 74 se tiene

74-70 =133z 3

En la tabla D se encuentra que el area entre - 00 y -167 es de 0475 y el area entre - 00 y 133 es 9082 El area deseada es la diferencia entre 9082 0475 = 8607 En resumen

74P(65 x 74 p(6570lt z 3

7deg) P(- 167 z 133) P(- 00 z 133) -P(- 00 z 167) 9082 0475 8607

Por 10 tanto la probabilidad 8607 responde a la pregunta original bull

EJEMPLO 473

En una poblacion de 10000 de las personas descritas en el ejemplo 472 ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 36: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

118 CAPITULO 4 DISTRIBUCIONES DE PROBABIUDAD

Soluci6n Primero se calcula la probabilidad de que una persona elegida al azar entre esa poblacion tenga una estatura de 6 pies y 5 pulgadas esto es

P(x 77) p[z 7770) =P(z 233) =1- 9901 =0099

Se puede esperar que de las 10000 personas 10000(0099) = 99 tenshygan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas bull

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z -3 -2 -1 02 Y 3 Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 474

Datos

C1 -3 -2 -I 0 1 2 3

Caja de dialogo Comandos de la sesi6n

Calcgt Probability Distributionsgt Normal MTB gt PDF Cl

SUBCgt Normal o 1 Seleccionar Cumulative probability Seleccionar Input column y teclear Cl Clic OK

Resultados

Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 100000

x PX = x -30000 00013 -20000 00228 -10000 01587

00000 05000 LoOOO 08413 20000 09772 30000 09987

FIGURA 4t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 37: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

EJERCICIOS 119

FJERCICIOS

471 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal con una media de 115 anos y una desviaci6n estandar de 3 anos Un nino contrae recientemente la enfermedad Cual es la probabilidad de que la edad del nino sea

a) Entre 85 y 145 anos b) Mas de 10 afios c) Menos de 12

472 En un estudio de dactilografia unacaracteristica cuantitativamuy importante es el total de surcos en los 10 dedos de unindividuo Suponga que el total de surcos en los dedos de los individuoSen determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50 Calcule la probabilidad de que un individuo

elegido al azar entre esa poblaci6n tenga un total de surcos en los dedos

a) De 200 0 mas b) Menos de 100 c) Entre 100 y 200 d) Entre 200 y 250 e) En una poblacion de 10000 personas~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas

473 Si la capacidad de la cavidad craneana de una poblacion tiene una distribuci6n aproximadashymente normal con una media de 1400 cc y una desviacion estandar de 125 cc calcule la probabilidad de que una persona elegida al azar entre esa poblaci6n tenga una capacidad de cavidad craneana

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

474 Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias con una desviaci6n esmndar de 15 Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospitashylizacion calcule la probabilidad de que un paciente elegido aleatoriamente entre ese grupo tenga una hospitalizacion

a) Mayor que 50 dias b) Menor que 30 dias c) Entre 30 y 60 dias d) De mas de 90 dias

475 Si el nive total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal con una media de 200 mgl100 m y una desviaci6n estandar de 20 mglOO m calcule la probabilidad de que un individuo elegido al azar de entre esa poblaci6n tenga un nivel de colestero

a) Entre 180 y 200 mg100 mi b) Mayor que 225 mglOO m c) Menor que 150 mglOO ml d) Entre 190 y 210 mgIOO mi

476 Dada una poblacion con distribuci6n normal con una media de75 y una variancia de 625 calcule

a) P(50 xs 100) b) P(x gt 90) c) P(x lt 60) d) P(x ~ 85) e) P(30 x 110)

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 38: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

120 CAPITULO 4 DISTRIBUCIONES DE PROBABILIDAD

477 Los pesos de una poblaci6n de mujeres j6venes tienen una distribuci6n aproximadamente normal con una media de 132 libras y una desviaci6n estandar de 15 Calcule la probabilishydad de que unajoven elegida al azar entre esa poblaci6n pese

a) Mas de 155 libras b) 100 libras 0 menos c) Entre 105 y 1451ibras

48 RESllMEN

En este capitulo los conceptos de probabilidad descritos en el capitulo anterior se abordan con mas profundidad Se analizan los conceptos de variables aleatoria discreta y continua asi como las distribuciones de probabilidad Se examinan detashylladamente en especial dos distribuciones de probabilidad discreta la binomial y la de Poisson y una distribucion de probabilidad continua la normal Tambien se estudia como esas distribuciones teoricas permiten formar enunciados de probabishylidad para las variables aleatorias que son de interes para e1profesional de la salud

PREGUNTAS YEJERCICIOS DE REPASO

1 ~Que es una variable aleatoria discreta De tres ejemplos que sean de iriteres para el profeshysional de la salud

2 ~Que es una variable aleatoria continua De tres ejemplos que sean de interes para el profeshysional de la salud

3 Defina la distribuci6n de probabilidad para una variable aleatoria discreta

4 Defina la distribuci6n de probabilidad para una variable aleatoria continua

5 ~Que es la distribuci6n de probabilidad acumulada

6 ~Que es un ensayo de Bernoulli

7 Describa la distribuci6n binomial

8 De un ejemplo de variable aleatoria que pueda seguir una distribuci6n binomial

9 Describa la distribuci6n de Poisson

10 De un ejemplo de variable aleatoria que pueda distribuirse de acuerdo con la ley de Poisson

11 Describa la distribuci6n normal

12 Describa la distribuci6n normal estandar y diga c6mo se utiliza en estadfstica

13 De un ejemplo de variable aleatoria que pueda seguir al menos aproximadamente una distribuci6n normal

14 Utilice los datos de la respuesta a la pregunta 13 para demostrar el uso de la distribuci6n normal estandar para responder a preguntas de probabilidad relacionadas con la variable seleccionada

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 39: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

121 PREGUNTAS Y EJERCICIOS DE REPASO

15 El metodo usual para ensenar una habilidad de cuidado personal a gente con retraso menshytal es efectivo en 50 por ciento de los casos Un nuevo metodo es ensayado con 10 personas Si el nuevo metodo no es mejor que el habitual 2cuM es la probabilidad de que siete 0 mas individuos 10 aprendan

16 Los registros del personal de un gran hospital muestra que 10 por ciento de los empleados de mantenimiento y aseo renuncian un ano despues de ser contratados Si 10 nuevos emshypleados son contratados

a) -Cual es la probabilidad de que exactamente la mitad de ellos se encuentren trabajando un ano despues

b) (Cual es la probabilidad de que ninguno renuncie un ano despues

c) 2Cual es la probabilidad de que 3 de los 10 renuncien antes de terminar el ano

17 En cierto pais en desarrollo 30 por ciento de los ninos estan desnutridos En una muestra aleatoria de 25 ninos de esa area cual es la probabilidad de que el mimero de ninos desnushytridos sea

a) Exactamente 10 b) Menos de cinco

c) Cinco 0 mas d) Entre tres y cinco inclusive

e) Menos de siete pero mas de cuatro

18 En promedio dos estudiantes por hora son enviados para tratamiento en la sala de primeros auxilios en una gran escuela primaria

a) 2Cual es la probabilidad de que durante una hora dada tres estudiantes lleguen a la sala de primeros auxilios para tratamiento

b) 2Cuat es la probabilidad de que durante una hora dada dos 0 menos estudiantes sean enviados a la sala de primeros auxilios

c) (Cual es la probabilidad de que entre tres y cinco estudiantes inclusive sean enviados a la sala de primeros auxilios durante una hora dada

19 En promedio cinco fumadores pasan por la esquina de cierta calle cada 10 minutos Cual es la probabilidad de que durante un periodo dado de 10 minutos el numero de fumadores que pasen sea de a) Seis 0 menos b) Siete 0 mas c) Exactamente ocho

20 En cierta area de la ciudad sucede en promedio un suicidio por meso Encuentre la probabishylidad de que durante un mes dado el numero de suicidios sea a) Mas de uno b) Menos de uno c) Mas de tres

21 Los I Qde individuos intemados en una escuela del estado para retrasados mentales tiene una distribuci6naproximadamente normal con una media de 60 y una desviaci6n estandar de 10

a) Calcule la cantidad de individuos con un IQ mayor a 75 b) 2Cmil es la probabilidad de que un individuo elegido al azar tenga un IQ entre 55 y 75 c) Calcule P(50 ~ Xmiddot~ 70)

22 EI supervisor de enfermeria encontr6 que el personal de enfermeria en promedio termina cierta tarea en 10 minutos Si el tiempo requerido para completar la tarea sigue una distribushyci6n aproximadamente normal con una desviaci6n estandar de 3 minutos calcule

a) La cantidad proporcional de enfermeras que terminan esa tarea en menos de 4 minutos

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 40: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

122 CAPITULO 4 DlSTRIBUCIONES DE PROBABILIDAD

b) La cantidad proporcional de enfermeras que necesitan mas de 5 minutos para terminar dicha tarea c) La probabilidad de que una enfermera ala que recientemente se Ie asign6 la tarea termine en 3 minutos

23 Las calificaciones de una prueba de aptitud aplicada a estudiantes de enfermerfa sigue una distribuci6n aproximadamente normal con una media de 500 y una variancia de 10000

a) (Que proporci6n de los individuos examinados lograra menos de 200 puntos b) Una persona esta por resolver el examen(Cual es la probabilidad de que logre una calificaci6n de 650 0 mas puntos c) (Que proporci6n lograra calificaciones entre 350 y 675 (puntos)

24 Dada una variable binomial con media de 20 y variancia de 16 calcule n y p 25 Suponga que una variable X se distribuye normalmente con una desviaci6n estandar de 10

Dado que 0985 de los valores de X son mayores que 70 (cual es valor de la media de X

26 Dada una variable aleatoria X distribuida normalmente calcule el valor numerico de k tal que P(1l kcr 5 X 5 l +- kcr) = 754

27 Dada la variable aleatoria X distribuida normaImente con una media de 100 y una desviashyci6n estandar de 15 calcule el valor numerico de k tal que

a) P(X 5 k) = 0094 b)P(Xzk)= 1093

c) P(100 5 X ~ k) = 4778

d) P(k X 5 k) = 9660 donde k Y k son equidistantes de IL

28 Dada una variable aleatoria X distribuida normalmente con cr 10 y P(X 5 40) 0080 calcule 11

29 Dada una variable aleatoria X distribuida normalmente con cr = 15 Y P(X ~ 50) =9904 calcule 11

30 Dada unavariable aleatoriaX distribuida normalmente con cr = P(X z 25) = 0526 calcule 11

31 Dada una variable aleatoria X distribuida normalmente con l = 25y P(X 5 10) = 0778 calcule cr

32 Dada una variable aleatoria X distribuida normalmente con 11 30y P(X 5 50) 9772 calculecr

33 Explique por que cada una de las siguientes mediciones es 0 no el resultado de ensayos de Bernoulli

a) EI sexo de recien nacidos b) Lq dasificaci6n de la condici6n de los pacientes hospitalizados estable en condiciones criticas regular buena mala c) EI peso en gramos de bebes recien nacidos

34 Explique por que cada una de las siguientes mediciones es 0 noel resultado de ensayos de Bernoulli

a) EI numero de procedimientos quirfugicos aplicados en un hospitalen una semana b) La temperatura de pacientes hospitalizados en grados Celsius

c) El registro de los signos vitalesmiddotde pacientes hospitalizados normaIes 0 inestables

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY

Page 41: Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

BIBLIOGRAFIA 123

35 Explique por que cada una de las siguientes distribuciones es 0 no una distribuci6n de proshybabilidad

a) x P(X =x) b) x P(X= x)

0 1 2 3 4

015 025 010 025 030

0 1 2 3

015 020 030 010

c) x P(X =x) d) x P(X =x)

0 1 2 3 4

015 -020

030 020 015

-1 0 1 2 3 4

015 030 020 015 010 010

BmllOGRAFIA

Bibliografia de metodologia

1 Frank A Haight Handbook ofthe Poisson Distribution Wiley New York

Bibliografia de aplicaciones

AmiddotI Simone Buitendijk y Michael B Bracken Medication in Early Pregnancy Prevalence of Used and Relationship to Maternal Characteristics American Journal of Obstfftrics and GynecolofJ 165 33-40

A-2 National Center for Health Statistics M F Najjar y M Rowland Anthropometric Reference Data and Prevalence of Overweight United States 1976-80 Vital and Health Statistics Serie II No 238 DHHS Pub No (PHS) 87-1688 Public Health Service US Government Printing Office Washington DC

bull Amiddot3 National Center for Health StatisticsO T Thornberry R W Wilson y P M Golden Health Promotion Data for the 1990 Qbjectives Estimates from the National Health Interview Survey of Health Promotion ljnd Disease Prevention UnitedStates 1985 Advance Data From Vital and Health Statistics No 126 DHHS Pub No (PHS) 86-1250 Public Health Service Hyattsville MD

A-4 Robert D Gibbons David C Clarky Jan1iawcett A Statistical Method for Evaluating Suicishyde Clusters and Implementing Cluster Surveillance American Journal ofEpidemiolofJ 132 (Suplemento No I) SI83-S191

Amiddot5 S D Dusheiko Some Questions Concerning the Pathological Anatomy of Alzheimers Disease Soviet Neurological Psychiatry 7 56-64 Publicada por Internacional Arts and Sciences Press White Plains NY