ejercicios bioestadistica

25
EJERCICIOS DE BIOESTAD ´ ISTICA Asignatura: Bioestad´ ıstica Curso: 1 o de Grado en Enfermer´ ıa Universidad San Pablo CEU Santiago Angulo D´ ıaz-Parre˜ no Jos´ e Miguel C´ardenas Rebollo Anselmo Romero Lim´on Alfredo S´anchez Alberca Curso 2013-2014

description

ejercicios bioestadística

Transcript of ejercicios bioestadistica

  • EJERCICIOS DE BIOESTADISTICA

    Asignatura: Bioestadstica

    Curso: 1o de Grado en Enfermera

    Universidad San Pablo CEU

    Santiago Angulo Daz-Parreno Jose Miguel Cardenas RebolloAnselmo Romero Limon Alfredo Sanchez Alberca

    Curso 2013-2014

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    Estadstica Descriptiva

    1. Se realizo una encuesta a 40 personas de mas de 70 anos sobre el numero de medicamentos distintosque tomaban habitualmente. El resultado de dicha encuesta fue el siguiente:

    3 1 2 2 0 1 4 2 3 5 1 3 2 3 1 4 2 4 3 23 5 0 1 2 0 2 3 0 1 1 5 3 4 2 3 0 1 2 3

    Se pide:

    a) Obtener la distribucion de frecuencias de la muestra.

    b) Dibujar el diagrama de barras de las frecuencias absolutas y su correspondiente polgono defrecuencias.

    c) Dibujar el diagrama de barras de las frecuencias relativas acumuladas.

    d) Calcular la media aritmetica, la mediana y la moda.

    e) Calcular la varianza y la desviacion tpica.

    f ) Calcular el coeficiente de variacion de Pearson.

    2. La siguiente tabla expresa la distribucion de las puntuaciones obtenidas por un grupo de alumnos.

    0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-1007 8 13 6 7 6 6 5 6 2

    Se pide:

    a) Dibujar el histograma y polgono de frecuencias.

    b) Calcular la media aritmetica, la mediana y la moda.

    c) Calcular el percentil 92.

    d) Calcular la desviacion tpica.

    e) Calcular el coeficiente de asimetra.

    f ) Calcular del coeficiente de curtosis.

    3. Dada la grafica correspondiente a un polgono acumulativo de frecuencias relativas de una variableestadstica agrupada en intervalos de una muestra de tamano 20

    0 20 40 60 80 100

    0.85

    0.15

    0.45

    1

    X

    Fi

    se pide:

    a) Construir la tabla de frecuencias.

    b) Dibujar el histograma correspondiente.

    c) Calcular la mediana y la moda.

    1

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    d) Calcular la media aritmetica y la desviacion tpica.

    *4. El numero de lesiones padecidas durante una temporada por cada jugador de un equipo de futbolfue el siguiente:

    0 1 2 1 3 0 1 0 1 2 0 11 1 2 0 1 3 2 1 2 1 0 1

    Se pide:

    a) Construir la tabla de frecuencias.

    b) Dibujar el polgono de frecuencias.

    c) Calcular los cuartiles y el rango intercuartlico e interpretarlo.

    d) Calcular el coeficiente de asimetra e interpretarlo.

    *5. En un estudio sobre el crecimiento se tomaron dos muestras, una de ninos recien nacidos y otra deninos con un ano de edad. Las estaturas observadas en cada muestra fueron:

    Recien nacidos: 51-50-51-53-49-50-53-50-47-50.Ninos de un ano: 62-65-69-71-65-66-68-69.

    Segun el coeficiente de variacion, en cual de las dos muestras es mas representativa la media?

    *6. El siguiente diagrama refleja el porcentaje de calificaciones obtenidas en un examen realizado a 80alumnos:

    Suspensos 40%

    Aprobados 30%

    Notables 25%

    Sobresalientes 5%

    Se pide:

    a) Construir la tabla de frecuencias para las calificaciones.

    b) Dibujar el polgono de frecuencias acumuladas.

    c) Calcular todos los estadsticos de tendencia central que sean posibles.

    d) A partir de la variable calificacion, construir la variable nota con los siguientes intervalos:Suspenso [0, 5), Aprobado [5, 7), Notable [7, 9) y Sobresaliente [9, 10], y calcular la nota mediay estudiar su representatividad.

    Nota: En los tres primeros apartados se debe trabajar con la variable calificacion, mientras que enel ultimo debe utilizarse la variable nota.

    *7. Sea la variable estadstica agrupada en intervalos cuya distribucion de frecuencias viene dada porla siguiente tabla:

    Intervalos ni fi Ni Fi[0, 10) 10 0.25[10, 20) 22[20, 30) 0.30[30, 40)

    a) Completar la tabla y hallar la desviacion tpica.

    2

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    b) Calcular la mediana.

    *8. Dada la siguiente tabla de frecuencias:

    Intervalos ni fi Ni Fi[0, 5) 2[5, 10) 8[10, 15) 0.7[15, 20) 6

    a) Completar la tabla.b) Calcular el coeficiente de variacion y el rango intercuartlico e interpretar los resultados.

    *9. Si a todos los datos de una muestra se les suma una misma cantidad positiva, como se ve afectadala representatividad de la media? Y si se multiplican por un mismo numero distinto de 0? Razonarla respuesta.

    *10. Se ha llevado a cabo un estudio sobre el numero de radiografas realizadas durante el ultimo ano aun grupo de 200 personas, y la informacion se presenta en la siguiente tabla incompleta:

    Radiografas Personas fi Fi0 0,21 842 0,7234 245 0,02

    a) Completar tabla.b) Calcular media, mediana, desviacion tpica y coeficiente de variacion e interpretar los resulta-

    dos.

    *11. Al realizar un estudio sobre el peso de las mujeres mayores de 30 anos en una determinada poblacion,se obtuvieron los siguientes datos:

    72 66 51 87 65 57 73 84 67 7858 62 75 56 68 74 57 65 73 67

    Realizar un estudio descriptivo agrupando los datos en 4 clases de amplitud 10 comenzando en el50, que incluya:

    a) Histograma de frecuencias absolutas y frecuencias absolutas acumuladas y los correspondientespolgonos.

    b) Rango intercuartlico e interpretacion.c) Estudiar la representatividad de la media.

    *12. En un estudio estadstico realizado en la comunidad valenciana, aparece la siguiente tabla con losdatos referidos al numero de embarazos, abortos e hijos en una muestra de 999 mujeres:

    n Embarazos Abortos Hijos nacidos0 61 751 671 64 183 802 328 51 4003 301 10 3004 122 2 905 81 2 626 297 118 2

    Total 999 999 999

    3

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) En que variable de las tres estudiadas es mas representativa la media?

    b) Calcular la mediana del numero de hijos nacidos.

    c) Que valor es relativamente mas alto, el de una mujer que ha tenido 4 abortos, o el de otraque ha tenido 7 embarazos?. Justificar adecuadamente la respuesta.

    *13. En un estudio sobre la relacion entre la curacion de la Hepatitis B mediante cierta terapia y laedad de los pacientes, al cabo de dos meses de aplicacion se obtuvieron los siguientes datos quemuestran el total de pacientes analizados y los que curaron en cada uno de los intervalos de edadconsiderados:

    Edad Pacientes Curados[0, 5) 80 4[5, 10) 72 4[10, 15) 116 20[15, 20) 64 16[20, 25) 68 20

    a) Representar el polgono de frecuencias relativas acumuladas de los pacientes que no curaron.

    b) Que media de edad es mas representativa, la de los pacientes que curaron o la de los que nocuraron? Justificar adecuadamente la respuesta.

    c) Calcular el rango intercuartlico y el decil 8 de la edad para el total de pacientes e interpretarlos.

    d) Calcular el coeficiente de asimetra de la edad para el total de pacientes e interpretarlo.

    e) Que porcentaje de pacientes no curados tendran una edad superior a 18 anos?

    *14. Se ha sometido a dos grupos de 1o de enfermera, a un test de 90 preguntas de estadstica parasaber si dominan la materia, correspondiente al primer parcial de la asignatura. Los resultadosobtenidos fueron:

    No de respuestas acertadas Grupo 01 Grupo 02[0, 15) 2 5[15, 30) 6 12[30, 45) 10 15[45, 60) 7 18[60, 75) 10 8[75, 90) 5 2

    a) En cual de los dos grupos podemos afirmar que es mas representativa la media del numerode respuestas acertadas? Justificar adecuadamente la respuesta.

    b) Calcular el rango intercuartlico del numero de respuestas acertadas del grupo 01 e interpre-tarlo.

    c) De que alumno podramos afirmar que tiene un numero de aciertos relativamente mas alto,uno del grupo 01 que ha acertado 66 preguntas o uno del grupo 02 que ha acertado 59?Justificar adecuadamente la respuesta.

    d) Considerando en conjunto a los alumnos de ambos grupos, que tipo de asimetra presentarael numero de respuestas acertadas? Justificar adecuadamente la respuesta.

    e) Si se considera que un alumno tiene dominada la materia cuando responde correctamente almenos a 70 preguntas, que porcentaje de los alumnos del grupo 01 podemos afirmar que tienedominada la materia?

    *15. En una ciudad espanola se esta realizando un estudio de la edad de la madre en el momento delprimer parto segmentando segun si la madre es espanola o extranjera. Los datos obtenidos fueron:

    4

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    Edad (anos) Frecuencia Espanolas Frecuencia Extranjeras[15, 20) 8 6[20, 25) 65 30[25, 30) 253 21[30, 35) 362 16[35, 40) 125 4[40, 45) 41

    a) En que colectivo es mas representativa la media de edad en el momento del primer parto?Justificar adecuadamente la respuesta.

    b) Calcular la mediana de la edad en el momento del primer parto en el grupo de espanolas.c) Calcular la media de edad global en el momento del primer parto considerando conjuntamente

    espanolas y extranjeras.d) Teniendo en cuenta solo las espanolas, en que percentil de edad se encuentra una mujer que

    ha tenido su primer parto a los 32 anos?

    *16. Se desea realizar un estudio sobre los das de hospitalizacion necesarios para tratar una lesionhepatica. Se utilizan para ello dos tratamiento diferentes y se obtuvieron los siguientes resultados:

    Das de Hospitalizacion Pacientes A Pacientes B[10, 20) 25 14[20, 30) 15 18[30, 40) 12 25[40, 50) 10 10[50, 60) 5

    a) En que tratamiento es mas representativa la media del numero de das de hospitalizacion?Justificar adecuadamente la respuesta.

    b) Calcular e interpretar el apuntamiento de la distribucion de das de hospitalizacion con eltratamiento A.

    c) Cuantos das de hospitalizacion tienen que transcurrir para que sean dados de alta el 75%de los pacientes que siguen el tratamiento B?

    d) Que porcentaje de lesiones se tratan en menos de 36 das con el tratamiento A?e) Que tiempo de recuperacion es relativamente mas alto, el de un individuo que habiendo

    seguido el tratamiento A ha tardado 25 das u otro que habiendo seguido el tratamiento B hatardado 34? Justificar adecuadamente la respuesta.

    *17. La siguiente tabla expresa la edad, en anos, a la que fue diagnosticada cirrosis hepatica en 1000pacientes de los hospitales de Madrid, anotando tambien en los que la enfermedad ha sido producidapor consumo abusivo de alcohol:

    Edad nAlcohol ntotal[0 , 20) 55 76[20 , 40) 130 195[40 , 60) 203 307[60 , 80) 162 292[80 , 100) 40 130

    a) En que colectivo es mas representativa la media, en los que la cirrosis proviene del cosumoexcesivo de alcohol o de otras causas? Justificar adecuadamente la respuesta.

    b) Considerando los 1000 individuos, calcular el valor de la edad de diagnostico tal que solo un30% estan por arriba de dicha edad.

    c) Considerando los 1000 individuos, cuanto vale el coeficiente de asimetra de la edad dediagnostico?

    d) En cada una de las 6 clases de edad consideradas, cuanto vale la proporcion de individuoscon cirrosis que no se debe al consumo de alcohol? Cual es la proporcion media de individuoscon cirrosis que no se debe al consumo de alcohol?

    5

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    Regresion y Correlacion

    18. Dada la siguiente tabla de correlacion:

    X \ Y 1 2 3[2, 2) 3 6 1[2, 6) 4 7 3[6, 10) 5 3 0

    Determinar:

    a) Las distribuciones marginales. Media, Moda y Mediana.

    b) Rectas de Regresion.

    c) Coeficiente de correlacion lineal. Interpretar el resultado.

    19. Se ha realizado un estudio comparativo de las puntuaciones obtenidas por los alumnos en un testde ingreso en la universidad (X), y el numero de asignaturas aprobadas en el primer curso (Y ).Los resultados obtenidos se expresan en la siguiente tabla:

    X \ Y 0 1 2 3 4[0, 10) 2 2 1 0 0[10, 20) 1 1 2 2 0[20, 30) 0 1 3 4 1[30, 40) 0 0 2 2 6

    Se desea calcular:

    a) Recta de regresion de X sobre Y.

    b) Coeficiente de correlacion e interpretacion del mismo.

    c) Si la universidad en cuestion solo contara con alumnos que al menos logren aprobar dosasignaturas, que numero de preguntas respondidas correctamente exigira en el test?.

    *20. En una poblacion se ha realizado un estudio sobre el nivel de colesterol en sangre (X) y la tensionarterial maxima (Y ) obteniendo. Para ello se ha tomado una muestra de 80 individuos que ha dadolugar a la siguiente tabla de frecuencias:

    X \ Y [110, 130) [130, 150) [150, 170) nx[170, 190) 4 12[190, 210) 10 12 4[210, 230) 7 8[230, 250) 1 18

    ny 30 24

    Se pide:

    a) Completar la tabla.

    b) Recta de regresion del nivel de colesterol sobre la tension.

    c) Coeficiente de determinacion e interpretacion.

    d) La tension arterial maxima esperada para una persona cuyo nivel de colesterol es 270.

    *21. Al realizar un estudio sobre la dosificacion de un cierto medicamento, se trataron 6 pacientes condosis diarias de 2 mg, 7 pacientes con 3 mg y otros 7 pacientes con 4 mg. De los pacientes tratadoscon 2 mg, 2 curaron al cabo de 5 das, y 4 al cabo de 6 das. De los pacientes tratados con 3 mgdiarios, 2 curaron al cabo de 3 das, 4 al cabo de 5 das y 1 al cabo de 6 das. Y de los pacientestratados con 4 mg diarios, 5 curaron al cabo de 3 das y 2 al cabo de 5 das. Se pide:

    6

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) Dar el coeficiente de correlacion e interpretacion.

    b) Determinar el tiempo esperado de curacion para una dosis de 5 mg diarios.

    22. Se consideran dos variables aleatorias X e Y tales que:

    La recta de regresion de Y sobre X viene dada por la ecuacion: y x 2 = 0.La recta de regresion de X sobre Y viene dada por la ecuacion: y 4x+ 22 = 0.Calcular:

    a) Valores de x e y.

    b) Coeficiente de correlacion lineal.

    23. En el ajuste rectilneo a una distribucion bidimensional se sabe que x = 2, y = 1, y el coeficientede correlacion lineal es 0 (r = 0).

    a) Si x = 10, cual sera el valor interpolado para y?.

    b) Si y = 5, cual sera el valor interpolado para x?.

    c) Dibuja las rectas de regresion de Y sobreX, y la de X sobre Y .

    *24. Despues de tomar un litro de vino se ha medido la concentracion de alcohol en la sangre en distintosinstantes, obteniendo:

    Tiempo despues (minutos) 30 60 90 120 150 180Concentracion (gramos/litro) 1.6 1.7 1.5 1.1 0.7 0.2

    Se pide:

    a) Calcular la recta de regresion de la concentracion en funcion del tiempo.

    b) Que concentracion de alcohol habra a los 100 minutos?

    c) Si la concentracion maxima de alcohol en la sangre que permite la ley para poder conducires 0.8 g/l, cuanto tiempo habra que esperar despues de tomarse un litro de vino para poderconducir sin infringir la ley?

    *25. En un estudio para relacionar la longitud de la lnea de la vida de la mano izquierda y la duracionde la vida de una persona se han obtenido datos de 50 personas con los siguientes resultados(X=longitud de la lnea en cm, Y=edad al morir en anos):

    y = 3333

    y2 = 231933

    x = 459,9

    x2 = 4308,57

    xy = 30949.

    A la vista de estos resultados, cuanto vivira, por termino medio, una persona con una lnea delongitud 7.5 cm? Es fiable esta estimacion?

    *26. Se han medido dos variables S y T en 10 individuos, obteniendose los siguientes resultados:

    (-1.5 , 2.25), (0.8 , 0.64), (-0.2 , 0.04), (-0.8 , 0.64), (0.4 , 0.16),(0.2 , 0.04), (-2.1 , 4.41), (-0.4 , 0.16), (1.5 , 2.25), (2.1 , 4.41).

    Se pide:

    a) Calcular la covarianza de S y T .

    b) Se puede afirmar que S y T son independientes? Justificar la respuesta.

    c) Que valor predice la correspondiente recta de regresion para t = 2?

    *27. En un estudio medico se afirma que existe una fuerte relacion lineal entre la presion sistolicasangunea media durante una intervencion quirurgica, P en milmetros Hg, y el volumen de sangreperdido en la intervencion, S en mililitros. Para ver si es cierto, otro equipo medico mide ambasvariables en una muestra de 10 pacientes obteniendo:

    7

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    P (mm Hg) 90 105 110 95 80 110 100 90 95 105S (ml) 250 350 320 280 170 290 300 240 280 310

    Se pide:

    a) Calcular la recta de regresion de la perdida de sangre en funcion de la presion sistolica.

    b) Calcular el coeficiente de determinacion e interpretarlo.

    c) Cual es el valor de la presion sistolica que esperamos que tenga un paciente cuya perdida desangre ha sido de 0,5 litros? Es fiable dicha prediccion? Por que?.

    *28. Al realizar un estudio de las calificaciones de Estadstica Aplicada (EA) y Biofsica (BF) de ungrupo de alumnos de la Diplomatura de Fisioterapia, se obtuvieron los siguientes resultados:

    EA \ BF SS AP NT SBSS 6 2 0 0AP 3 5 2 0NT 1 3 3 1SB 0 0 1 1

    donde SS representa la calificacion de suspenso, cuya nota correspondiente esta en el intervalo [0, 5);AP aprobado, con nota en [5, 7); NT notable, con nota en [7, 9); y SB sobresaliente, con nota en[9, 10].

    a) Calcular el rango intercuartlico de la nota de Estadstica Aplicada.

    b) Calcular el coeficiente de asimetra de la nota de Estadstica Aplicada e interpretarlo.

    c) En que asignatura es mas representativa la media? Razonar la respuesta.

    d) Si un alumno tiene un 4 en Biofsica, que nota se espera que tenga en Estadstica Aplicada?.

    e) Razonar si es fiable la prediccion anterior.

    *29. La artrosis reumatoide es una enfermedad reumatica que aparece con frecuencia en las personasmayores. Uno de los ndices mas utilizados para ver el grado de actividad de la enfermedad es elRADAI (Rheumatoid Arthritis Disease Activity Index), que mide el grado de actividad en unaescala de 0 (mnima actividad) a 3 (maxima actividad). Para ver de que manera influye la edad enel grado de actividad de la enfermedad se ha seleccionado un grupo de personas mayores y se hamedido el ndice RADAI en ellos, obteniendo la siguiente tabla de frecuencias:

    RADAI\Edad 40-50 50-60 60-70 70-800-1 8 6 2 11-2 4 7 5 22-3 0 2 6 7

    Se pide:

    a) Estudiar si existe relacion lineal entre la edad y el RADAI.

    b) Calcular la recta de regresion del RADAI sobre la edad. Segun la recta, cuanto aumentarael grado de actividad de la enfermedad por cada ano que pasa?

    c) Si se considera que los pacientes don un RADAI de 2 o superior necesitan ayuda en susactividades diarias, a que edad se empezara a necesitar esta ayuda?

    *30. Se realiza un estudio para establecer una ecuacion mediante la cual se pueda utilizar la concentra-cion de estrona en saliva para predecir la concentracion del esteroide en plasma libre. Se extrajeronlos siguientes datos de 10 varones sanos:

    Estrona 1,4 7,5 8,5 9 9 11 13 14 14,5 16Esteroide 30 25 31,5 27,5 39,5 38 43 49 55 48,5

    8

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) Comprobar la idoneidad del modelo lineal de regresion. Si el modelo es apropiado, hallar larecta de regresion de la concentracion de estrona en funcion de la concentracion de esteroide.

    b) Si un individuo presenta una concentracion de estrona en saliva de 10, que concentracion deesteroide en plasma libre predecira el modelo de regresion lineal?

    c) Para los dos primeros individuos, calcular los errores que se comenten al utilizar el modelode regresion lineal para predecir la concentracion de estrona. Razonar a que se deben estoserrores.

    *31. En un experimento se ha medido el numero de bacterias por unidad de volumen en un cultivo,cada hora transcurrida, obteniendo los siguientes resultados:

    Horas 0 1 2 3 4 5 6 7 8No de Bacterias 25 28 47 65 86 121 190 290 362

    Se pide:

    a) Dibujar el diagrama de dispersion. Segun este diagrama, que tipo de modelo explicara mejorla relacion entre el numero de bacterias y las horas transcurridas?

    b) Segun el modelo anterior, cuantas bacterias tendramos al cabo de 3 horas y media? Y alcabo de 10 horas? Son fiables estas predicciones?

    c) Cuanto tiempo tendra que transcurrir para que en el cultivo hubiese 100 bacterias?

    *32. La concentracion de un farmaco en sangre, C en mg/dl, es funcion del tiempo, t en horas, y vienedada por la siguiente tabla:

    t 2 3 4 5 6 7 8C 25 36 48 64 86 114 168

    a) Segun el modelo exponencial, que concentracion de farmaco habra a las 4, 8 horas? Es fiablela prediccion? Justificar adecuadamente la respuesta.

    b) Segun el modelo lineal, que tiempo tendra que transcurrir para que la concentracion defarmaco fuese de 100 mg/de? Es fiable la prediccion? Justificar adecuadamente la respuesta.

    *33. En un estudio se pretende ver si existe o no relacion entre la cantidad total inyectada de unadeterminada sustancia durante un mes, en cm3, y el aumento de peso provocado en las personassometidas al tratamiento, en kg. Para el estudio se tomaron paciente de unas caractersticas simi-lares en edad, peso y altura, y los resultados obtenidos en una muestra de 6 personas fueron lossiguientes:

    Aumento Peso (kg) 1,9 2,4 2,8 3,1 3,3 3,4Sustancia (cm3) 15 20 25 30 35 40

    a) Calcular el modelo logartmico del Aumento de Peso en funcion de la Cantidad de Sustanciaadministrada.

    b) Es bueno o malo el modelo logartmico calculado? Justificar adecuadamente la respuesta.

    c) Que cantidad de sustancia tendramos que administrar a una persona que queremos queaumente su peso en 3, 2 kg?

    *34. Supongamos dos variables biologicas, X e Y , que se piensa que estan relacionadas. Para compro-barlo se miden las 2 variables en 10 individuos y se obtienen los siguientes sumatorios:

    10i=1

    xi = 55 ,10i=1

    yi = 478 ,10i=1

    lnxi = 15,104 ,10i=1

    ln yi = 36,028 ,10i=1

    x2i = 385 ,10i=1

    y2i = 33148

    9

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    10i=1

    (lnxi)2 = 27,650 ,10i=1

    (ln yi)2 = 135,667 ,10i=1

    xiyi = 3527 ,10i=1

    xi ln yi = 220,055 ,10i=1

    yi lnxi = 914,932

    Con ello:

    a) Calcular la ecuacion de la recta de regresion de Y como funcion de X.

    b) Calcular la ecuacion del modelo exponencial de Y como funcion de X.

    c) Calcular la ecuacion del modelo logartmico de Y como funcion de X.

    d) Que tanto por ciento de la variabilidad de la nube de puntos se explica con cada uno de losmodelos anteriores? Cual de ellos sera mejor para realizar el ajuste? Justificar la respuesta.

    35. En un estudio en el que participaron las 8 universidades de una region se ha valorado la excelenciadocente e investigadora, estableciendo los siguientes rankings (de mejor a peor):

    Ranking Docencia 3 4 8 5 2 1 6 7Ranking Investigacion 6 5 4 3 7 8 1 2

    Se puede decir que existe relacion entre la excelencia docente y la investigadora? Justificar larespuesta.

    Calculo de Probabilidades

    36. En un laboratorio hay 4 frascos de acido sulfurico y 2 de acido ntrico, y en otro hay 1 frascosde acido sulfurico y 3 de acido ntrico. Se saca al azar un frasco de cada laboratorio. Hallar laprobabilidad de que:

    a) Los dos frascos sean de acido sulfurico.

    b) Los dos sean de acido ntrico.

    c) Uno sea de acido sulfurico y otro de acido ntrico.

    37. Sean A y B sucesos de un mismo espacio muestral tales que: P(A)=3/8, P(B)=1/2, P(AB)=1/4.Calcular:

    a) P(A B).b) P(A) y P(B).

    c) P(A B).d) P(A B).e) P(A/B).

    f ) P(A/B).

    38. La probabilidad de contraer hepatitis a partir de una unidad de sangre es 001. Un paciente recibedos unidades de sangre durante su estancia en el hospital. Cual es la probabilidad de que contraigahepatitis como consecuencia de ello?

    39. Sean A y B sucesos de un mismo espacio muestral, tales que P(A)=06 y P(A B)=09. CalcularP(B) si:

    a) A y B son independientes.

    b) A y B son incompatibles.

    40. El tetanos es mortal en el 70% de los casos. Si tres personas contraen el tetanos, Cual es laprobabilidad de que mueran al menos dos de los tres?

    10

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    *41. El 60% de los individuos de una poblacion estan vacunados contra una cierta enfermedad. Duranteuna epidemia se sabe que el 20% la ha contrado y que 2 de cada 100 individuos estan vacunadosy son enfermos. Calcular el porcentaje de vacunados que enferma y el de vacunados entre los queestan enfermos.

    42. A partir de una investigacion realizada, se sabe que el 10% de las personas de 50 anos sufren untipo particular de artritis. Se ha desarrollado un procedimiento para detectar esta enfermedad, ypor las pruebas realizadas se observa que si se aplica el procedimiento a individuos que padecen laenfermedad, da positivo en el 85% de los casos, mientras que si se aplica a individuos sanos, dapositivo en el 4% de los casos. Se pide:

    a) Calcular la probabilidad de que realizado el procedimiento a una persona, el resultado seapositivo.

    b) Si el resultado de aplicar el procedimiento a una persona ha sido positivo, Cual es la proba-bilidad de que padezca la enfermedad?

    43. En un servicio clnico digestivo se sabe que, de cada 1000 pacientes con dolor de estomago, 700presentan gastritis, 200 presentan ulcera y 100 presentan cancer. En el analisis de la sintomatologagastrica, se ha comprobado que las probabilidades de presentar vomitos son 03 en el caso degastritis, 06 en el caso de ulcera y 09 en el caso de cancer. Llega un nuevo paciente con dolor deestomago que, ademas, presenta vomitos. Que diagnosticaramos?

    *44. En un estudio sobre el tabaco, se informa que el 40% de los fumadores tiene un padre fumador,el 25% tiene una madre fumadora, y el 52% tiene al menos uno de los dos padres fumadores. Seelige una persona fumadora al azar. Calcular:

    a) Probabilidad de que la madre sea fumadora si lo es el padre.

    b) Probabilidad de que la madre sea fumadora si no lo es el padre.

    c) Son independientes el tener padre fumador y el tener madre fumadora.

    *45. Un equipo de atencion primaria de salud realiza un estudio de la poblacion, para evaluar la inciden-cia de hipertension e hipercolesterolemia. Para ello analizan a 1000 personas de dicha poblacion,seleccionadas aleatoriamente, encontrandose que 180 presentan hipertension, 140 hipercolestero-lemia y 800 ninguna de ambas. Se pide calcular la probabilidad de que una persona tomada alazar

    a) Presente ambas enfermedades.

    b) Presente hipertension si no presenta hipercolesterolemia.

    *46. En una poblacion se sabe que hay un 15% de personas que sufren trastornos de sueno, un 12%que presentan ansiedad, y un 80% que no presentan ninguna de estas alteraciones. Se pide:

    a) Que porcentaje de personas presentan ambas alteraciones?.

    b) Que porcentaje de las personas con trastorno de sueno presentan tambien ansiedad?.

    c) Son independientes el trastorno del sueno y la ansiedad?.

    d) Si se toma una muestra de 20 personas de la poblacion, Cual es la probabilidad de que hayaalguna con trastorno del sueno? y de que haya alguna con ansiedad?.

    *47. Se ha desarrollado un nuevo test diagnostico para detectar el sndrome de Down en ninos reciennacidos, con un sensibilidad del 80% y una especificidad del 90%. Si en una determinada poblacionen la que hay un 1% de recien nacidos con el sndrome, al aplicarle el test a un nino, da positivo,cual es la probabilidad de que tenga el sndrome? le diagnosticaras la enfermedad? Cual deberaser la especificidad mnima del test para diagnosticar el sndrome en el caso de dar positivo?

    Nota: La sensibilidad de un test diagnostico es la proporcion de personas con la enfermedad quetienen un resultado positivo en el test, mientras que la especificidad del test es la proporcion depersonas sin la enfermedad que tienen un resultado negativo en el test.

    11

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    *48. En un estudio se han probado tres tipos de tratamientos A, B y C contra una determinada enfer-medad. De los pacientes participantes en el estudio, el 50% fueron tratados con el tratamiento A,el 30% con el B y el 20% con el C. Posteriormente se observaron los pacientes que sanaron y losque tuvieron algun efecto secundario, segun se muestra en la siguiente tabla:

    Tratamiento Sanados Con efectos secundariosA 86% 12%B 92% 14%C 81% 6%

    Se pide:

    a) Si se selecciona un enfermo al azar, cual es la probabilidad de que haya sanado? Y de quehaya tenido algun efecto secundario?

    b) Si un enfermo ha sanado, que tratamiento es mas probable que haya recibido? Y si en vezde decirnos que ha sanado nos dicen que no ha tenido efectos secundarios?

    c) Si en total hay un 8% pacientes que no sanaron pero que tampoco tuvieron efectos secundarios,cual es la probabilidad de que un enfermo se haya curado sin tener efectos secundarios?

    *49. La sensibilidad de determinar la tuberculosis con una radiografa del torax es del 90%. Por contra,la probabilidad de que un individuo sano quede reconocido equivocadamente como tuberculoso esdel 1%. Se realizan radiografas de un grupo de individuos en el cual el porcentaje de enfermos detuberculosis es del 1%, y se pide:

    a) Cual es la probabilidad de que un individuo que sea diagnosticado como tuberculoso a partirde la radiografa lo sea verdaderamente?.

    b) Cual debera ser la fiabilidad mnima en la determinacion de la tuberculosis para que laprobabilidad del apartado anterior fuera superior a 0,5?.

    *50. Para comprobar la eficacia de un test diagnostico se lleva a cabo una experiencia cuyos resultadosse recogen en la siguiente tabla:

    Test + Test Enfermos 4680 120No Enfermos 80 2020

    Calcular para dicho test:

    a) Las probabilidades de Verdadero Negativo, Verdadero Positivo, Falso Negativo y Falso Posi-tivo.

    b) Los Valores Predictivos, tanto el Positivo como el Negativo.

    c) La probabilidad de Diagnostico Acertado.

    *51. Supongamos dos test diagnostico, A y B, completamente independientes, que se utilizan paradiagnosticar una misma enfermedad. Si la prevalencia de la enfermedad en una poblacion es de un2%, la sensibilidad de A es de un 95%, la sensibilidad de B es de un 97%, la especificidad de A esde un 90%, y la de B de un 85%, calcular:

    a) El valor predictivo positivo del test A.

    b) La probabilidad de que, aplicados ambos a un individuo cualquiera de la poblacion, algunode los test de positivo.

    c) La probabilidad de que, aplicados ambos a un individuo cualquiera de la poblacion, los dosden diagnostico erroneo.

    12

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    *52. El suero de una mujer embarazada puede ser analizado por medio de un procedimiento llamadoelectroforesis en gel de almidon. Este procedimiento permite detectar la presencia de una zonaprotenica llamada zona de embarazo, la cual se supone que es un indicador de que el feto es unahembra. Para investigar las propiedades de este test se seleccionaron a 300 mujeres embarazadasde una poblacion. Los resultados del test y los sexos de los ninos fueron:

    Test + Test Varon 72 75Hembra 78 75

    Se sabe que en esta poblacion, la probabilidad de nacer hombre es de 0,48.

    a) Calcular la sensibilidad y la especificidad del test, basandose en el estudio de las 300 mujeres.

    b) Supuesto realizada la prueba a una mujer cuyo resultado ha sido positivo, cual es la proba-bilidad de que este sea correcto?

    c) Se le aplica el test a una mujer embarazada. Calcular la probabilidad de que el test de unresultado correcto. Que opinas sobre la calidad del test?

    d) Cual debera ser la especificidad mnima del procedimiento para predecir que es hembra enel caso de dar positivo?

    *53. Supongamos una poblacion y una enfermedad en la misma cuya prevalencia es 0, 2. Para detectarla enfermedad se utilizan 2 test diagnostico independientes, A y B, con sensibilidades respectivasde 0, 95 y 0, 97, y probabilidades de diagnostico acertado respectivas de 0, 85 y 0, 90. Se pide:

    a) Cual es la especificidad del test A?

    b) Que probabilidad hay de que el test B de positivo?

    c) Cual es el valor predictivo positivo del test A? Y el valor predictivo negativo del B?

    d) Que probabilidad hay de que en un individuo el test A de positivo y negativo el B?

    e) Si un individuo esta enfermo, cual es la probabilidad de que los dos tests den resultadoserroneos?

    *54. Supongamos una enfermedad que se piensa que es causada por un unico gen con dos alelos posibles:A y B; que se combinan de 4 formas diferentes: AA, AB, BA y BB. Estas formas diferentesde combinacion de los alelos reciben el nombre de genotipos, y en este caso hay dos genotiposhomocigoticos, formados por dos alelos iguales: AA y BB, y uno heterocigotico, formado por las doscombinaciones de alelos diferentes, AB y BA. Supongamos ademas que la probabilidad del alelo Aen la poblacion vale 0,95, la del B 0.05, y que se heredan de forma completamente independiente.Tambien se sabe que la probabilidad de tener la enfermedad si se tiene un doble alelo B en elgenotipo es del 90%, del 50% si se tiene un unico alelo B y solo del 10% si no se tiene ningun aleloB. Con todo ello:

    a) Cual es la probabilidad de cada uno de los 3 genotipos diferentes?

    b) Cual es la probabilidad de tener la enfermedad en la poblacion?

    c) Si se sabe que un individuo tiene la enfermedad, cual es el genotipo mas probable? Justificaradecuadamente la respuesta.

    Variables Aleatorias

    55. Sea X una variable aleatoria discreta cuya ley de probabilidad es

    X 4 5 6 7 8P (X = x) 0,15 0,35 0,10 0,25 0,15

    a) Calcular y representar graficamente la funcion de distribucion.

    13

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    b) Obtener:

    1) P (X < 7,5).2) P (X > 8).3) P (4 X 6,5).4) P (5 < X < 6).

    56. Sea la variable aleatoria X con la siguiente funcion de distribucion:

    F (x) =

    0 si x < 11/5 si 1 x < 43/4 si 4 x < 61 si x 6

    Se pide:

    a) Distribucion de probabilidad.

    b) Obtener:

    1) P (X = 6).2) P (X = 5).3) P (2 < X < 5,5).4) P (0 X < 4).

    57. La probabilidad de curacion de un paciente al ser sometido a un determinado tratamiento es 0,85.Calcular la probabilidad de que en un grupo de 6 enfermos sometidos a tratamiento:

    a) se curen la mitad.

    b) se curen al menos 4.

    58. Diez individuos entran en contacto con un portador de tuberculosis. La probabilidad de que laenfermedad se contagie del portador a un sujeto cualquiera es 010.

    a) Que probabilidad hay de que ninguno se contagie?

    b) Que probabilidad hay de que al menos dos se contagien?

    c) Cuantos se espera que contraigan la enfermedad?

    59. La probabilidad de que al administrar una vacuna de una determinada reaccion es 0001. Si sevacunan 2000 personas, Cual es la probabilidad de que aparezca una reaccion adversa?

    *60. Se desarrolla un compuesto para aliviar las migranas. El fabricante afirma que es efectivo en un90% de los casos. Se prueba sobre 4 pacientes. Sea X el numero de pacientes que obtiene alivio.

    a) Construir la funcion de probabilidad, suponiendo que la afirmacion del fabricante sea correcta.

    b) Calcular la probabilidad de que el numero de pacientes que obtienen alivio sea como maximouno.

    c) Si el compuesto no alivia a ninguno de los pacientes. Es esa una razon para poner en dudala eficacia afirmada por el fabricante? Razonar sobre la base de la probabilidad calculada.

    d) Calcular la media. Que significado tiene la media en este ejemplo?

    61. Un examen de tipo test consta de 10 preguntas con tres respuestas posibles para cada una deellas. Se obtiene un punto por cada respuesta acertada y se pierde medio punto por cada preguntafallada. Un alumno sabe tres de las preguntas del test y las contesta correctamente, pero no sabelas otras siete y las contesta al azar. Que probabilidad tiene de aprobar el examen?

    *62. El numero medio de llamadas por minuto que llegan a una centralita telefonica es igual a 120.Hallar las probabilidades de los sucesos siguientes:

    14

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) A={durante 2 segundos lleguen a la centralita menos de 4 llamadas}b) B={durante 3 segundos lleguen a la centralita 3 llamadas como mnimo}

    *63. Se realiza un experimento aleatorio consistente en inyectar un virus a tres tipos de ratas y observarsi sobreviven o no. Se comprueba que las probabilidades asociadas a los elementos del espaciomuestral son:

    E V V V V VM VMV VMM MV V MVM MMV MMMP 0,1 0,1 0,1 0,15 0,15 0,1 0,1 0,2

    donde V es vivir y M es morir. Se pide:

    a) Construir la variable aleatoria que mida el numero de ratas vivas y su funcion de probabilidad.

    b) Calcular la funcion de distribucion.

    c) Calcular P (X 1), P (X 2) y P (X = 1,5).d) Calcular la media y la desviacion tpica.

    *64. En una determinada ciudad, se ha detectado un caso de gripe A por cada 2000 habitantes. Ademasse sabe que una de cada diez personas afectadas por la gripe A, como consecuencia de la misma,acaba por padecer una neumona grave:

    a) Si tomamos un grupo de 4000 personas, cual es la probabilidad de que haya mas de 3 afectadospor la gripe A? Y de que haya alguno que padezca una neumona grave como consecuenciade la gripe?

    b) En un grupo de 20 personas con gripe A, cual es la probabilidad de que menos de tres acabenpadeciendo la posterior neumona grave?

    c) Si queremos hacer una estimacion de los medios con los que deben contar los hospitales, ysabemos que la ciudad tiene 60000 habitantes, cuantos esperamos que acaben padeciendouna neumona grave?

    *65. Se ha comprobado experimentalmente que una de cada 20 billones de celulas expuestas a undeterminado tipo de radiacion muta volviendose cancergena. Sabiendo que el cuerpo humano tieneaproximadamente 1 billon de celulas por kilogramo de tejido, calcular la probabilidad de que unapersona de 60 kg expuesta a dicha radiacion desarrolle cancer. Si la radiacion ha afectado a 3personas de 60 kg, cual es la probabilidad de que desarrolle el cancer mas de una?.

    *66. En un servicio de urgencias de cierto hospital se sabe que, en media, llegan 2 pacientes a la hora.Calcular:

    a) Si los turnos en urgencias son de 8 horas, cual sera la probabilidad de que en un turno lleguenmas de 5 pacientes?.

    b) Si el servicio de urgencias tiene capacidad para atender adecuadamente como mucho a 4pacientes a la hora, cual es la probabilidad de que a lo largo de un turno de 8 horas elservicio de urgencias se vea desbordado en alguna de las horas del turno?.

    *67. En la consulta de un medico se sabe que por termino medio uno de cada 4 pacientes citados noacude a la consulta. El tiempo del que dispone el medico para utilizar la sala en la que pasa consultaes de 2 horas y media, y dedica a cada paciente 10 minutos. Si cada da cita a 17 pacientes:

    a) Calcular la probabilidad de que un da no pueda atender a todos los que acudan.

    b) Si tiene 180 das de consulta al ano, calcular la probabilidad de que mas de 6 das no puedaatender a todos los que acudan a su consulta.

    *68. La probabilidad de que en un grupo de 5 individuos mayores de 70 anos todos padezcan arterioes-clerosis cerebral es de 12,5 por mil.

    a) Cual es la probabilidad de padecer la enfermedad entre los mayores de 70 anos?.

    15

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    b) En un grupo de 1000 personas, cual es la probabilidad de que padezcan la enfermedad masde 450?.

    *69. Un test diagnostico para detectar la adiccion a la nicotina en fumadores tiene una sensibilidad del98% y una especificidad del 80%. Si en la poblacion de fumadores hay un 30% con adiccion a lanicotina. Se pide:

    a) Si un fumador da positivo en el test, cual es la probabilidad de que tenga adiccion a lanicotina?.

    b) Si un fumador da negativo en el test, cual es la probabilidad de que no tenga adiccion a lanicotina?.

    c) Si se aplica el test a 8 personas cual es la probabilidad de que haya algun falso positivo?.

    d) Si se aplica el test a 200 personas cual es la probabilidad de que haya mas de un falsonegativo?.

    *70. Se sabe que un individuo ha sufrido los siguientes ataques epilepticos durante los ultimos 12 meses(desglosados mes a mes):

    3 5 1 4 5 2 2 2 3 6 4 3

    Suponiendo que el numero de ataques epilepticos que sufre dicho individuo sigue una distribucionde Poisson, calcular:

    a) Probabilidad de que el proximo mes tenga al menos 2 ataques.

    b) Probabilidad de que el proximo trimestre tenga 9 ataques.

    *71. Durante sus practicas en los hospitales de la Comunidad de Madrid, los estudiantes del Grado enEnfermera cometen 6 fallos considerados como graves o muy graves al cabo de un mes, en media.Suponiendo que todos los meses tienen 30 das:

    a) Cual es la probabilidad de que al cabo de un mes cometan mas de 4 fallos graves o muygraves?

    b) Cual es la probabilidad de que un da cometan algun fallo grave o muy grave?

    c) Si habitualmente muere uno de cada 50 pacientes como consecuencia del fallo grave o muygrave cometido por los estudiantes, cual es la probabilidad de que al cabo de un ano se hayanproducido al menos 2 muertes de este tipo?

    d) Al cabo de un ano, cual es la probabilidad de que haya al menos 10 meses con mas de 4 fallosgraves o muy graves?

    *72. Recientes estudios sobre la incidencia del cancer de testculo en varones de la poblacion espanolahan llegado a la conclusion de que 1 de cada 250 varones acabara padeciendolo a lo largo de suvida. No obstante, se cura en un 92% de los casos.

    a) Si en un hospital se estan tratando 20 varones con cancer de testculo, que probabilidad hayde que no curen al menos 3?

    b) Si tenemos un grupo 500 varones de la poblacion espanola, que probabilidad hay de quemenos de 4 tengan cancer de testculo en algun momento de su vida?

    c) Si tenemos una ciudad hay 10000 varones, que probabilidad hay de que tengan cancer detestculo y no cure en mas de 2?

    73. Una variable aleatoria continua X tiene una funcion de densidad dada por:

    f(x) ={

    k(6 3x) si 0 x 20 si x < 0 o x > 2

    16

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) Determinar el valor de k.

    b) Hallar P (X 1); P (X > 2); P (X = 1/4); P (1/3 X 2/3).c) Calcular y .

    d) Hallar la funcion de distribucion F (x).

    74. Sea Z una variable aleatoria que sigue una distribucion N(0, 1). Determinar el valor de t en cadauno de los siguientes casos:

    a) El area entre 0 y t es 0,4783.

    b) El area a la izquierda de t es 0,6406.

    c) El area entre 1,5 y t es 0,2313.

    75. Hallar las siguientes probabilidades:

    a) P (2,4 Z 1,2) si Z es N(0, 1).b) P (|Z| > 1,2) si Z es N(0, 1).c) P (1,3 X 3,3) si X es N(2, 1).d) P (|X 3| > 2) si Xes N(3, 4).

    76. Entre los diabeticos, el nivel de glucosa en la sangre en ayunas, puede suponerse de distribucionaproximadamente normal, con media 106 mg/100 ml y desviacion tpica 8 mg/100 ml.

    a) Hallar P (X 120 mg/ 100 ml).b) Que porcentaje de diabeticos tendra niveles entre 90 y 120 mg/100 ml?

    c) Encontrar un valor que tenga la propiedad de que el 25% de los diabeticos tenga un nivel deglucosa X por debajo de dicho valor.

    77. Se sabe que el nivel de colesterol en varones de mas de 30 anos sigue una distribucion normal, demedia 220 y desviacion tpica 30. Realizando un estudio sobre 20000 varones mayores de 30 anos,

    a) Cuantos se espera que tengan su nivel de colesterol entre 210 y 240?

    b) Cuantos se espera que tengan su nivel de colesterol por encima de 250?

    c) Cual sera el nivel de colesterol, por encima del cual se espera que este el 20% de la poblacion?

    *78. Dada la funcion de densidad dada por la siguiente grafica,

    X

    f(x)

    1 3/2

    1

    calcular:

    a) P (X < 1), P (X > 0), P (X = 1/4), P (1/2 X 3/2).b) Media y desviacion tpica.

    17

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    *79. En una poblacion con 40000 personas, se sabe que 2276 tienen entre 0.80 y 0.84 miligramos debilirrubina por decilitro de sangre, y que 11508 tienen mas de 0.84. Suponiendo que la concentracionde bilirrubina en sangre sigue una distribucion normal, se pide:

    a) Calcular su media y su desviacion tpica.Nota: En caso de no conseguir calcular la media y la desviacion tpica, tomar los valores = 0,8 y = 0,1 y continuar con el ejercicio.

    b) Calcular el numero de personas con mas de 1 miligramo de bilirrubina por decilitro de sangre.

    *80. Se supone que la tension arterial de los habitantes de una poblacion de 20000 habitantes sigue unadistribucion normal, cuya media es 13 y su rango intercuartlico 4. Se pide:

    a) Cuantas personas tienen una tension por encima de 16?.

    b) Cuanto tendra que disminuir la tension de una persona que tiene 16 para situarse en el 40%de la poblacion con tension mas baja?.

    *81. Se consideran las variables aleatorias X1 y X2. La variable X1 sigue una distribucion normal demedia y desviacion tpica , mientras que la variable X2 sigue tambien una distribucion normalde media + 1 y desviacion tpica . Si la probabilidad de que X1 tome valores superiores a 14, 2es 0, 5636, y la de que X2 tome valores inferiores a 17, 4 es 0, 6103:

    a) Hallar los valores de y .

    b) Si se rechazan los individuos que estan fuera del intervalo (12, 18), hallar los porcentajes derechazo correspondientes a X1 y X2.

    c) Si se desea seleccionar el 20% de individuos que tengan los valores mas altos de X1, cualsera el valor de X1 a partir del cual se seleccionaran?.

    *82. En un estudio sobre la osteoporosis asociada a la diabetes de tipo I, se selecciono una muestrade 20000 pacientes, de las que 12856 tienen entre 15 y 18 anos y 16482 tienen menos de 18 anos,suponiendo que la edad de los participantes en la muestra sigue una distribucion normal, calcular:

    a) La media y la desviacion tpica de la edad de los pacientes.

    b) El numero de pacientes con una edad comprendida entre 17 y 20 anos.

    c) La edad por encima de la cual hay 2500 pacientes.

    d) La mediana y el coeficiente de variacion.

    *83. El peso de los recien nacidos no prematuros en una ciudad sigue una distribucion normal de mediay desviacion tpica desconocidas. Teniendo en cuenta que, de un total de 200 recien nacidos noprematuros, 15 han pesado mas de 4 kg y 25 menos de 2, 5 kg:

    a) Cuales son la media y la desviacion tpica del peso?.

    b) Cuantos ninos no prematuros habran nacido con un peso entre 3 y 3, 5 kg?.

    c) Si los medicos consideran peligrosos los pesos por debajo del percentil 10, cual sera dichopeso?, cuantos ninos habran nacido con un peso por debajo de dicho percentil?.

    *84. De una determinada sustancia producida por el organismo humano se sabe que el percentil 80 de suconcentracion en sangre vale 3,4 microgramos por decilitro y su percentil 30 vale 2,3 microgramospor decilitro. Suponiendo que la concentracion sigue una distribucion normal:

    a) Calcular y .Nota: Si no se sabe calcular la media y la desviacion tpica, para los siguientes apartados sepuede tomar como alternativa una media de 3 y una desviacion tpica de 0,9

    b) Si se considera que dicha sustancia tambien puede utilizarse como dopante si se inyecta porva intravenosa, y se pone como valor lmite para considerar que un individuo va dopado 4 mi-crogramos por decilitro de sangre, entonces despues de analizar un grupo de 10000 individuosno dopados, cuantos se concluira que s que lo estan?.

    18

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    c) Si la concentracion de la sustancia en los individuos dopados sigue una distribucion normalde media 4,5 y desviacion tpica 0,3 microgramos por decilitro y se sabe que el 10% de losindividuos analizados se dopan, cual sera la probabilidad de que se diagnostique adecuada-mente a una persona como dopada o no dopada al considerar los 4 microgramos por decilitrocomo punto de corte.

    *85. Para el estudio de los niveles de hemoglobina en los hombres de una cierta poblacion, se ha selec-cionado una muestra de tamano 15500. Se sabe que niveles bajos de hemoglobina describen unaanemia que puede ser originada por enfermedades renales, hemorragias, cancer, problemas de ali-mentacion, etc. y que los niveles altos pueden deberse a cardiopatas, deshidratacion, enfermedadespulmonares cronicas etc.

    En el estudio de la muestra se ha visto que 10385 hombres tienen unos niveles de hemoglobinasuperiores a 14 gr/dl, mientras que 11005 tienen menos de 17 gr/dl. Suponiendo que los valores dehemoglobina en los hombres siguen una distribucion normal de media y desviacion tpica , sepide:

    a) Calcular y .Nota: En caso de no haber podido calcular los valores de y del apartado anterior, continuarel ejercicio con = 15, 12 y = 3, 47.

    b) Sabemos que los niveles mas extremos de hemoglobina pueden ser indicativos de diferentesenfermedades. Calcular los valores de hemoglobina que marcaran el 30% de los hombres masalejados de la media.

    c) Si en un estudio similar con la poblacion de mujeres, se obtiene que la hemoglobina sigue unadistribucion normal de media 13,5 gr/dl y de desviacion tpica 3,6 gr/dl y se consideran nivelesaceptables de hemoglobina entre 13,8 y 17,2 gr/dl para los hombres y entre 12,1 y 15,2 gr/dlpara las mujeres. En que colectivo, hombres o mujeres, hay mas proporcion de personas conniveles no aceptables de hemoglobina? Razonar la respuesta.

    d) En que colectivo, hombres o mujeres, podemos afirmar que es mas representativa la media?Razonar la respuesta.

    *86. Se tienen datos de los anos 2003 y 2004 de los resultados de unos examenes para ingreso en la sanidadpublica de una comunidad autonoma en los que se pide el ttulo de Diplomado en Fisioterapia. En elano 2003 haba 150 plazas y se presentaron 600 aspirantes, de los cuales, el ultimo que obtuvo plazatena una calificacion de 7,6. En el ano 2004 haba 100 plazas a las que optaron 500 aspirantes, delos que el ultimo que obtuvo plaza tena una calificacion de 7,4. Si se supone que las calificacionesde ambos anos siguen distribuciones normales de la misma desviacion tpica, y que la media de2004 es 0,5 puntos menor que la de 2003, se pide, referidas a las calificaciones de 2004:

    a) Calcular la media y la desviacion tpica de la distribucion de calificaciones.

    b) Cuantas personas obtuvieron una calificacion superior a 5?.

    c) Si hubiera habido 200 plazas, que nota hubiera sacado el ultimo que obtuviera plaza?.

    *87. Los individuos de una poblacion se clasifican como hipertensos si su PAS (presion arterial sistolicaen mm Hg) es mayor que un nivel establecido para cada grupo de edad. Teniendo en cuenta tresgrupos de edad diferentes: A de 0 a 17 anos, B de 18 a 55 anos y C de 56 o mas anos, y considerandoque la PAS sigue una distribucion normal dentro de cada grupo de edad con media y desviaciontpica las que aparecen en la siguiente tabla:

    Grupo de Edad Nivel de hipertensionA 105 6 115B 125 9 135C 140 12 155

    Se pide:

    19

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    a) En la poblacion considerada, que porcentaje del grupo A seran hipertensos? Y que porcen-taje del grupo C no lo seran?

    b) Si tenemos 10000 individuos en el grupo A, cual sera la probabilidad de que al menos haya400 hipertensos?

    c) Cual sera el nivel de PAS tal que solo el 10% de individuos del grupo B esta por arriba dedicho nivel?

    d) Dentro del grupo C y considerando invariables la media y el nivel de hipertension, cuantodebera valer la desviacion tpica para que solo hubiese un 8% de hipertensos?

    88. Calcular:

    a) P (T 1,476) si T T (5).b) P (T 0,69) si T T (16).c) El valor t0 tal que P (T < t0) = 0,995, con T T (12).d) El valor t0 tal que P (T > t0) = 0,01, con T T (8).

    89. Calcular:

    a) P (X 5,23) si X 2(12).b) P (X 1,65) si X 2(8).c) El valor x0 tal que P (X < x0) = 0,995, con X 2(18).d) El valor x0 tal que P (X > x0) = 0,25, con X 2(7).

    90. Calcular:

    a) El valor f0 tal que P (F < f0) = 0,9, con F F (12, 8).b) El valor f0 tal que P (F > f0) = 0,025, con F F (5, 7).

    Intervalos de Confianza

    91. Una muestra aleatoria de tamano 81 extrada de una poblacion normal con 2 = 64, tiene unax = 78. Calcular el intervalo de confianza del 95% para .

    92. Para determinar si un pescado es o no apto para el consumo por su contenido en Hg (mercurio),se realizan 15 valoraciones obteniendo una media de 0,44 ppm (partes por millon) de Hg, y unadesviacion tpica de 0,08 ppm. Calcular los lmites de confianza para la media, a un nivel designificacion = 0,1.

    93. Se obtuvieron cinco determinaciones del pH de una solucion con los siguientes resultados: 7.90,7.85, 7.89, 7.86, 7.87. Hallar unos lmites de confianza de la media de todas las determinaciones delpH de la misma solucion, al nivel de significacion = 0,01.

    94. Se desea saber cual debe ser el tamano muestral mnimo de una muestra para poder realizar laestimacion de la tasa media de glucosa plasmatica de una determinada poblacion, con un nivel deconfianza 095 y pretendiendo una amplitud de 25 mg.

    NOTA: En una muestra previa de tamano 10 se obtuvo una desviacion tpica de 10 mg.

    95. Para que un farmaco sea efectivo, la concentracion de un determinado principio activo debe ser20 mg/mm3. Se recibe un lote de dicho farmaco y se analizan 10 para medir la concentracion delprincipio activo, obteniendo los resultados siguientes:

    17,6 19,2 21,3 15,1 17,6 18,9 16,2 18,3 19 16,4.

    En vista de los resultados, podremos rechazar el lote con una confianza 095 de no equivocarnos?

    20

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    96. Para determinar la concentracion media de albumina en la sangre se realizaron mediciones sobre ungrupo experimental obteniendose los siguientes resultados, expresados en g/l: 38-42-46-37-49-42-40-36. Obtener un intervalo de confianza para la varianza de la poblacion con un nivel de significacion0.05.

    97. Se desea obtener un intervalo de confianza del 95% para la diferencia de marcas obtenidas porchicos y chicas en una prueba fsica. Se toma una muestra de 50 chicas y 75 chicos, obteniendo laschicas una marca media de 76 y los chicos de 82. Ademas, se conocen las desviaciones tpicas delas marcas obtenidas en las poblaciones de chicas y chicos, que son 6 y 8 respectivamente.

    98. Se esta ensayando un nuevo procedimiento de rehabilitacion para una cierta lesion. Para ello setrataron nueve pacientes con el procedimiento tradicional y otros nueve con el nuevo, y se midieronlos das que tardaron en recuperase, obteniendose los siguientes resultados:

    Metodo tradicional: 32-37-35-28-41-44-35-31-34Metodo nuevo: 35-31-29-25-34-40-27-32-31

    Se desea obtener un intervalo de confianza del 95% para la diferencia de las medias del tiempode recuperacion obtenido con ambos procedimientos. Se supone que los tiempos de recuperacionsiguen una distribucion normal, y que las varianzas son aproximadamente iguales para los dosprocedimientos.

    99. En un hospital pediatrico se comprobo que de 200 ninos con un determinado sndrome, 48 murieronantes de cumplir un ano de edad, mientras que solo 25 de 125 ninas con el mismo sndrome murieron.Se puede afirmar con cierta seguridad que el sndrome es mas letal en los ninos que en las ninas?

    100. Se ha realizado un estudio para investigar el efecto del ejercicio fsico en el nivel de colesterol en lasangre. En el estudio participaron once personas, a las que se les midio el nivel de colesterol antesy despues de desarrollar un programa de ejercicios. Los resultados obtenidos fueron los siguientes

    Persona Nivel previo Nivel posterior1 182 1982 232 2103 191 1944 200 2205 148 1386 249 2207 276 2198 213 1619 241 21010 280 21311 262 226

    Hallar un intervalo de confianza del 90% para la diferencia del nivel medio de colesterol antes ydespues del ejercicio.

    *101. En un estudio sobre el consumo anual de litros de cerveza entre la poblacion de menores de 18 anosde una ciudad se obtuvo la siguiente muestra:

    42, 16, 60, 29, 7, 20, 30, 25, 38, 5.

    Se pide:

    a) Calcular el intervalo de confianza del 95% para la media. Si se considera que un consumomedio por encima de 40 litros es peligroso, existen pruebas significativas para afirmar que lapoblacion de partida no esta en peligro?

    b) Que tamano muestral mnimo hubiese sido necesario para conseguir un intervalo de confianzade amplitud 5?

    21

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    *102. Para determinar el nivel medio de colesterol en la sangre de una poblacion, se realizaron analisissobre una muestra de 8 personas, obteniendose los siguientes resultados:

    196 212 188 206 203 210 201 198

    Hallar intervalos de confianza para la media y la varianza de nivel de colesterol con un nivel designificacion 0.1, suponiendo que el nivel de colesterol en la poblacion sigue una distribucion normal.

    *103. Un equipo de investigacion esta interesado en ver si una droga reduce el colesterol en la sangre. Contal fin toma una muestra de 10 pacientes y determina el contenido de colesterol antes y despues deltratamiento. Los resultados expresados en miligramos por cada 100 mililitros son los siguientes:

    Paciente 1 2 3 4 5 6 7 8 9 10Antes 217 252 229 200 209 213 215 260 232 216Despues 209 241 230 208 206 211 209 228 224 203

    Se pide:

    a) Construir la variable Diferencia que recoja la diferencia entre los niveles de colesterol antesy despues del tratamiento, y calcular el intervalo de confianza con 1 = 0,95 para dichavariable.

    b) A la vista del intervalo anterior, se concluye que la aplicacion de la droga ha disminuido elnivel de colesterol en la sangre?

    *104. Se midieron los niveles de colesterol LDL en sangre en dos muestras de personas que siguen unosregmenes A y B respectivamente, obteniendose los siguientes resultados expresados en mg/dl desangre:

    A: 113 - 162 - 136 - 128 -150 -122 -142 - 124

    B: 106 - 99 - 124 - 112 - 134 - 121

    Suponiendo que las concentraciones de colesterol LDL siguen distribuciones normales:

    a) Hallar un intervalo de confianza para la concentracion media de colesterol LDL en las personasque siguen el regimen A con un nivel de confianza del 95% e interpretar el resultado.

    b) Calcular el tamano muestral mnimo necesario para obtener un intervalo de confianza deamplitud 8 mg/dl para la concentracion media de colesterol LDL en las personas que siguenel regimen A con un nivel de confianza del 95%.

    c) Hallar un intervalo de confianza del cociente de varianzas de la concentracion de colesterolLDL entre las personas que siguen los regmenes A y B con un nivel de confianza del 98% einterpretar el resultado.

    d) Podemos afirmar con un 98% de confianza que existen diferencias de las concentracionesmedias de colesterol LDL entre las personas que siguen los regmenes A y B?. Razonar larespuesta a partir del intervalo de confianza para la diferencia de medias.

    *105. Para comparar los resultados que obtienen las estudiantes de 1o de enfermera en las asignaturasde Bioestadstica y Biologa se tomo una muestra, en la que de 125 alumnos matriculados enBioestadstica aprobaron 44 mientras que de 104 alumnos matriculados en Biologa aprobaron 65.

    a) Hallar un intervalo de confianza para la proporcion de aprobados en Bioestadstica con unnivel de confianza del 92% e interpretar el resultado.

    b) Calcular el tamano muestral mnimo que sera necesario tomar para que el intervalo de con-fianza anterior tuviera una amplitud de 0,08.

    c) Podemos afirmar con nivel de confianza del 96% que existen diferencias en la proporcion deaprobados en ambas asignaturas. Justificar adecuadamente la respuesta.

    22

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    d) Suponiendo que se tomara el mismo tamano muestral en ambas asignaturas, calcular el tamanomuestral mnimo en cada asignatura para que el intervalo anterior tuviera una amplitud de0,10.

    *106. Se esta ensayando un nuevo procedimiento de rehabilitacion para una cierta lesion. Se sabe que de80 deportistas tratados con el procedimiento tradicional, se recuperaron perfectamente 26, mientrasque de los 20 tratados con el nuevo procedimiento se han recuperado 11. Se puede afirmar conuna confianza del 95% que el nuevo procedimiento es mejor que el tradicional?

    *107. Para comparar la eficacia de dos tratamientos A y B en la prevencion de repeticiones de infarto demiocardio, se aplico el tratamiento A a 80 pacientes y el B a 60. Al cabo de dos anos se observo quehaban sufrido un nuevo infarto 14 pacientes de los sometidos al tratamiento A y 15 de los del B.Se pide:

    a) Construir un intervalo de confianza del 95% para la diferencia entre las proporciones depersonas sometidas a los tratamientos A y B que no vuelven a sufrir un infarto.

    b) A la vista del resultado obtenido, razonar si con ese nivel de confianza puede afirmarse queuno de los tratamientos es mas eficaz que el otro.

    *108. En una asignatura hay 2 grupos de clase y se han obtenido los resultados que se recogen en la tablasiguiente con el numero de alumnos, la nota media y la desviacion tpica en cada grupo:

    Grupo n x s01 15 6,3 0,802 17 5,2 1,4

    Considerando que las notas en ambos grupos siguen distribuciones normales, se pide:

    a) Calcular el intervalo de confianza para la nota media de la asignatura en el grupo 01 con unnivel de confianza del 90%.

    b) Suponiendo varianzas poblacionales desconocidas pero iguales, calcular el intervalo de con-fianza para la diferencia de medias entre los 2 grupos con un nivel de confianza del 95%. A lavista del intervalo, hay diferencias significativas entre la nota de los 2 grupos? Justificar larespuesta.

    c) Considerando que para aprobar hay que sacar una nota igual o superior a 5 y teniendo encuenta medias y desviaciones tpicas poblacionales iguales a las presentes en las muestras,cuantos alumnos aproximadamente han aprobado la asignatura?

    *109. En una poblacion se esta realizando un estudio genetico para analizar si se tiene o no un gen quepuede resultar beneficioso ya que codifica la produccion de protenas que sirven como factores deproteccion contra el infarto de miocardio. Para ello, se han escogido 500 individuos al azar y se hacomprobado que 100 presentan el gen que se esta estudiando. Por otra parte, para determinar si esegen esta presente se ha disenado un test diagnostico mucho mas barato que el metodo tradicionalpero con el que se pueden cometer errores en la determinacion. Los resultados obtenidos medianteel test diagnostico aparecen en la siguiente tabla:

    Test Positivo Test negativoTienen el gen 90 10

    No tienen el gen 20 380

    Se pide:

    a) Con un nivel de significacion 0,01, dar el intervalo de confianza para la sensibilidad de dichotest.

    b) Con un nivel de significacion 0,05, dar el intervalo de confianza para la probabilidad dediagnostico acertado con el test.

    23

  • Universidad San Pablo CEU Departamento de Metodos Cuantitativos e Informaticos

    c) Con un 95% de confianza, se puede concluir que hay diferencia significativas entre la sensi-bilidad y la especificidad del test? Justificar adecuadamente la respuesta.

    *110. Se dispone de 2 grupos de personas, unos sanos y otros enfermos de gota, y se les realiza un analisisde sangre para cuantificar el acido urico en mg/dl, obteniendo los resultados que aparecen en lasiguiente tabla:

    Grupo n x sSanos 15 5,1 0,9

    Con gota 27 6,2 0,5

    a) Suponiendo que el contenido de acido urico en personas sanas sigue una distribucion normaly trabajando con un 99% de confianza, cuanto vale la media poblacional del contenido deacido urico en sangre en las personas sanas? Se puede concluir que dicho contenido es inferiora 5,8 mg/dl?

    b) Con un 95% de confianza, hay diferencias significativas entre las medias de sanos y enfer-mos de gota? Suponer que el acido urico en sangre sigue distribuciones normales en los doscolectivos y que las varianzas poblaciones, aunque desconocidas, pueden suponerse iguales.

    c) Suponiendo invariables el resto de datos de la tabla del enunciado y de nuevo suponiendonormalidad e igualdad de varianzas poblacionales, que desviacion tpica muestral mnimadebera haber en el grupo de sanos para que no hubiese diferencias significativas con un 95%de confianza?

    Nota: Los problemas marcados con un asterisco (*) son problemas de examenes de otros anos.

    24