1415 Problemas 1

12
PROBLEMAS DE ESTADÍSTICA 2014/15

description

problemas recopilados de estadística uniovi

Transcript of 1415 Problemas 1

  • PROBLEMAS

    DE

    ESTADSTICA

    2014/15

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 1

    1. Lo nico legible de una tabla con las distribuciones de frecuencias absolutas y relativas de una variable estadstica es

    1 12 2 0.125 3 18 4 0.175 8 20 0.25 9 0.075

    a) Completa la tabla. b) Halla la mediana y la moda.

    2. Para la siguiente distribucin, obtn la tabla de frecuencias completa, indicando la variable con la que se

    trabaja, los distintos tipos de frecuencia que pueden definirse para esa variable y, en caso de datos agrupados, los elementos que la caracterizan. Comenta la representacin grfica ms adecuada y calcula el recorrido intercuartlico. a) 10 agentes hacen 2 visitas en un da

    23 agentes hacen 3 o menos visitas en un da 30 agentes hacen 4 o menos visitas en un da 32 agentes hacen 5 o menos visitas en un da

    b) Importe de los gneros devueltos a almacn: 1/10 devoluciones por importe mximo de 1000 1/4 devoluciones por importe mximo de 2000 1/2 devoluciones por importe mximo de 3000 8/10 devoluciones por importe mximo de 5000 todas las devoluciones por importe mximo de 8000

    3. Se considera una variable estadstica X a cuya distribucin de frecuencias relativas le corresponde el

    diagrama de barras siguiente:

    a) Halla la media y la varianza de X. b) Halla el porcentaje de las observaciones que son menores o iguales a 2.5 (llamado rango percentil del

    valor 2.5). c) Halla el menor valor de X en la muestra tal que al menos el 25 % de las observaciones son menores o

    iguales a l (llamado percentil de orden 25 o primer cuartil de la distribucin de X).

    4. Preguntadas 50 personas sobre su tiempo de espera en una parada de autobs se obtuvieron los siguientes resultados expresados en minutos: 2, 5, 3, 1, 0, 4, 6, 0, 3, 7, 8, 4, 6, 6, 9, 1, 2, 10, 8, 3, 0, 7, 1, 5, 2, 10, 1, 5, 4, 7, 9, 6, 2, 4, 8, 9, 3, 5, 6, 0, 7, 8, 1, 3, 7, 2, 10, 3, 6, 7. a) Construye la tabla de frecuencias absolutas y relativas (acumuladas y sin acumular). b) Calcula el tiempo medio de espera. c) Qu porcentaje de individuos espera entre 3 y 5 minutos inclusive?

    5. Dadas una variable estadstica X y una constante :

    a) calcula + , y

    b) calcula el valor de que minimiza ( )2 c) calcula +

    2 y 2

    d) demuestra que 2 = 2 2

    6. Se realizan 12 mediciones del pH de cierto compuesto qumico, resultando un pH medio de 5.5. Se realiza

    una nueva medicin del pH, siendo sta de 5.6. Determina razonadamente el pH medio de las 13 mediciones.

    7. Sea X una variable estadstica que sobre una muestra de 8 individuos toma los valores 1, 2 y 3. Si el

    nmero de individuos con 2 es 4 y = 17/8, define y calcula la mediana y la desviacin tpica de X.

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 2

    8. La media de una variable estadstica para una primera muestra es 3 y la varianza es 5. La media de esa variable estadstica para una segunda muestra es 6 con una varianza de 8. Si la primera muestra consta de 15 individuos y la segunda muestra consta de 25, halla razonadamente la media y la desviacin tpica de esa variable para la muestra obtenida al unir las dos anteriores.

    9. Los datos siguientes corresponden al nmero de averas diarias en los ordenadores de una sala durante 30 das. 1 1 3 1 0 1 0 1 0 1 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0 a) Construye la distribucin de frecuencias y represntala grficamente. b) Calcula la media, mediana y desviacin tpica. Cmo se vera afectada la media si todos los das hay

    dos averas ms? Y la mediana? c) Calcula el recorrido y el menor valor de la variable que deja por debajo al menos el 25 % de los datos. d) Cmo se modifican las respuestas anteriores si la observacin igual a 6 es un error de transcripcin y,

    en realidad, es un 0? Interpreta los resultados.

    10. Se han tomado 8 mediciones de la temperatura (en grados Farenheit) de diferentes hornos usados en la fabricacin de semiconductores, con los siguientes resultados:

    953 955 957 950 951 954 948 955 Cunto podra aumentar la temperatura mxima sin que cambie la mediana?

    11. Propn, si existen, dos conjuntos de 5 datos que tengan:

    a) la misma media y diferente desviacin tpica b) distinta media y la misma desviacin tpica c) la misma mediana y diferente recorrido d) distinta mediana y el mismo recorrido

    12. Una muestra de individuos se divide en dos grupos de tamaos 1 y 2, respectivamente (1 + 2 = )

    para estudiar cierta caracterstica. a) Si la media en el primer grupo es y en el segundo grupo es , cul es la media en dicha muestra? b) Si las medias de ambos grupos son iguales y las varianzas de cada grupo son respectivamente y ,

    cul es la varianza en la muestra global?

    13. En una empresa 4 personas tienen un sueldo semanal entre 200 y 300 , 7 cobran entre 300 y 400 , 15 cobran entre 400 y 500 , 12 cobran entre 500 y 600 , 9 cobran entre 600 y 700 , 5 cobran entre 700 y 800 , 2 cobran entre 800 y 900 y otras 2 cobran entre 900 y 1000 . Calcula la tabla de frecuencias, indicando las marcas de clase, y construye una representacin grfica adecuada.

    14. Un coche parte de Barcelona hacia Madrid efectuando el recorrido de ida a una media de 70 km/h, mientras que el de regreso lo hace a una velocidad media de 80 km/h. Halla la velocidad media del viaje completo.

    15. En una empresa hay dos clases de trabajo: A y B. El sueldo medio es de 800 . El sueldo medio de los que realizan el trabajo A es de 900 y el de los de la clase B es de 750 . Qu porcentaje de empleados hay de cada clase?

    16. Se hacen 360 observaciones de cierto proceso que pueden arrojar los siguientes resultados: A, B, C y D. Se sabe que las frecuencias relativas de A, B y C son respectivamente 1/3, 2/9 y . Halla todas las frecuencias absolutas y relativas.

    17. Una empresa de butano quiere colocar en una red viaria un depsito para abastecer a los pueblos que estn situados en los kilmetros 10, 50, 80, 140, 290 y 450. Suponiendo que todos los pueblos consumen la misma cantidad, en qu punto kilomtrico deben colocar el depsito de forma que los gastos de abastecimiento sean mnimos?

    18. Los datos siguientes corresponden a aumentos de peso en mg/cm3 en muestras de aleacin Ti-Cr debido a la oxidacin cuando se exponen a CO2 durante una hora a 1000C.

    Aumento de peso () 5.8 5.9 6 6.1 6.2 6.6 1 6 12 25 49 7

    a) Calcula la media, mediana y desviacin tpica de los datos. b) Qu porcentaje de muestras observadas aumentan menos de 6 mg/cm3? Qu porcentaje tienen un

    aumento de peso mayor de 6.5 mg/cm3? Qu porcentaje tiene un aumento entre 5.8 y 6.1 mg/cm3? c) Posteriormente se aplican dos tipos de substancias A y B a dichas muestras. La substancia A produce

    un aumento de 0.2 mg/cm3 en el peso de las muestras a las que se aplica. La substancia B hace que el aumento de peso sea el doble del obtenido experimentalmente. Cul de los dos tipos de substancias produce una menor desviacin tpica en el peso? Por qu?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 3

    19. En una empresa los empleados se encuentran clasificados en tres categoras A, B y C, de forma que se tienen los siguientes datos:

    Categora Nmero de empleados Salario mensual (en euros) A 130 1450 B 50 2000 C 20 3000

    a) Calcula el salario medio para el conjunto de la empresa. b) Estudia cmo se modificara el salario medio si:

    1) se elevan todos los salarios un 5 % 2) se incrementan todos los salarios en 40 euros 3) se aumentan un 10 % en la categora A, un 8 % en la B y un 4 % en la C.

    20. Una persona compra 5 kg de caf a 15 el kg, otros 5 kg a 19 el kilo y otros 5 kg a 21 el kg. Cul es el

    precio medio del caf comprado?

    21. Cierto tipo de instrumento electrnico ha sido fabricado simultneamente por dos empresas A y B. En una muestra de 75 instrumentos fabricados por A la duracin media result ser de 4.5 aos, mientras que en una muestra de 90 instrumentos de B la duracin media fue de 5 aos. Cul fue la duracin media en la muestra de los 165 instrumentos?

    22. El nmero de empleados de las 30 oficinas que una entidad bancaria posee en una ciudad presenta la siguiente distribucin:

    N empleados N oficinas 4 o menos 3 8 o menos 14 14 o menos 26 35 o menos 30

    a) Obtn el nmero medio de empleados de esas oficinas. b) Cul es el nmero mnimo de empleados que tiene el 15 % de las oficinas con ms empleados? c) Cuntas oficinas tienen como mximo 15 empleados? Tiene este valor alguna relacin con el

    calculado en el apartado anterior? d) Si en otras dos ciudades esa entidad bancaria tiene 16 y 33 oficinas, siendo el nmero medio de

    empleados por oficina de 10 y 14 respectivamente, cul es el nmero medio de empleados de las oficinas de esa entidad bancaria en el conjunto de las tres ciudades?

    23. Una empresa decide aumentar su plantilla en 80 personas. Para su seleccin organiza una prueba a la que se presentan 200 aspirantes. Los seleccionados obtuvieron los siguientes resultados:

    Puntuacin N aspirantes 50-65 21 65-75 29 75-90 18

    90-100 12 La empresa determina que el 30 % de los seleccionados con mayores puntuaciones sean destinados a la oficina principal y el resto a las sucursales. Suponiendo que la distribucin de las puntuaciones dentro de cada intervalo es uniforme, se pide: a) puntuacin mnima que se necesita para trabajar en la oficina principal. b) Porcentaje de seleccionados que han obtenido puntuacin entre 82 y 95.

    24. Se sabe que, en una clase, el nmero de alumnos que estudia como mximo media hora en casa es 5, el nmero de alumnos que estudian de media hora a una hora en casa es 8, 13 alumnos estudian entre una hora y una hora y media en casa, el nmero de alumnos que estudia entre una hora y media y dos horas en casa es 8, 5 alumnos estudian entre dos horas y dos horas y media en casa y un alumno estudia en casa entre dos horas y media y tres horas. a) Calcula la tabla de frecuencias y haz una representacin grfica adecuada. b) Qu porcentaje de alumnos estudia en casa ms de una hora y cuarto? c) Qu tiempo medio dedican a estudiar en casa los alumnos de esta clase? d) Cunto tiempo estudian como mnimo el 18 % de los alumnos de esta clase que ms tiempo dedican al

    estudio en casa? e) Cunto tiempo dedican al estudio en casa el 18 % de los alumnos de esta clase que menos tiempo

    dedican a esa actividad?

    25. El departamento de contabilidad de una determinada empresa registr los siguientes datos relativos a la percepcin anual de sueldos en miles de euros para sus empleados:

    Haberes netos 9 12 15 18 21 24 30 N de empleados 2 14 31 22 15 4 2

    Calcula el sueldo medio, el sueldo mnimo que reciben el 40 % de los empleados que ms cobran, el sueldo que reciben como mximo el 50 % de los empleados y el sueldo ms frecuente.

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 4

    26. Se ha obtenido la siguiente informacin sobre el nmero de anlisis realizado en un mes por 65

    empleados de cierta empresa multinacional N de anlisis N de empleados

    250-260 8 260-270 10 270-280 16 280-290 14 290-300 10 300-310 5 310-320 2

    a) Calcula las marcas de clase e interpreta la del cuarto intervalo. b) Obtn la amplitud de cada intervalo y la altura del rectngulo que correspondera a cada clase al

    dibujar el correspondiente histograma. c) Realiza una representacin grfica adecuada. d) Calcula la media y la mediana, e interpreta los valores obtenidos. e) Obtn el primer cuartil y el percentil 64. f) Cuntos empleados de la empresa realizan al menos 295 anlisis al mes? g) Qu porcentaje de empleados de la empresa realiza como mucho 277 anlisis al mes? h) Calcula la varianza y la desviacin tpica de la distribucin. i) Calcula el momento de orden tres respecto al origen y respecto a la media.

    27. Una empresa inmobiliaria ofrece apartamentos en rgimen de alquiler, en la Costa del Sol, cuyos precios

    mensuales son Precio de alquiler (en euros) Nmero de apartamentos

    De 700 a 1000 21 De 1000 a 1100 27 De 1100 a 1300 34 De 1300 a 1500 14 De 1500 a 2100 29

    a) Obtn el alquiler medio por apartamento, el precio ms frecuente y el precio que se sita en mitad de la oferta.

    b) Si una persona quiere gastar en alquiler entre 1250 y 1375 euros, a qu porcentaje del total de apartamentos tiene opcin?

    28. Las edades de los empleados de una determinada empresa son las que aparecen en la tabla adjunta:

    Edad N empleados Menos de 25 22 Menos de 35 70 Menos de 45 121 Menos de 55 157 Menos de 65 184

    Sabiendo que el empleado ms joven tiene 18 aos, a) obtn una tabla en la que aparecen las frecuencias absolutas y relativas, tanto acumuladas como sin

    acumular. b) Calcula la edad media de los empleados. c) Cul es la edad que, como mximo, tiene el 70 % de los que tienen menos edad? d) Qu porcentaje de empleados tienen entre 40 y 50 aos?

    29. Los alumnos de una facultad acuden a consultar libros a la biblioteca segn la siguiente distribucin de

    frecuencias para la variable X (nmero de libros consultados en un mes por un alumno): N consultas 0-1 1-2 2-4 4-6 6-10 N alumnos 50 25 100 200 125

    a) Qu porcentaje de alumnos realiza al menos tres consultas en un mes? b) Cuntas consultas realizan como mnimo en un mes el 75 % de los alumnos de esa facultad? c) Cuntas consultas realizan como mnimo el 50 % de los alumnos de esa facultad?

    30. Una empresa de distribucin de productos farmacuticos posee varios agentes comerciales para vender

    un nuevo producto. Las ventas del ao pasado (nmero de unidades vendidas del producto por agente comercial) se resumen en la siguiente tabla

    Ventas 25 30 32 34 45 47 59 N agentes 2 1 2 3 2 2 4

    a) La empresa premia con un viaje al 30 % de agentes comerciales con mayores ventas. Cul es el nmero mnimo de ventas del producto que han hecho los agentes premiados?

    b) Si cada agente se ha llevado una comisin de 10 euros por cada unidad de producto vendida, ms una comisin fija de 150 euros al final del ao, cul es la comisin media por agente que ha tenido que pagar la empresa?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 5

    31. Los desplazamientos de los operarios de una factora para llegar a su puesto de trabajo son, en km, los

    siguientes: n de km n empleados Ms de 1 91

    Ms de 15 30 Ms de 30 13 Ms de 45 6 Ms de 60 5 Ms de 75 3 Ms de 90 1

    a) Sabiendo que el operario ms distante realiza 93 km de viaje, obtn la distribucin de frecuencias absolutas, acumuladas y sin acumular.

    b) Indica cuntos operarios realizan un desplazamiento comprendido entre 30y 60 km. c) Indica cuntos operarios realizan un desplazamiento comprendido entre 20 y 70 km. d) Calcula el desplazamiento medio de los operarios de esa factora. e) Cul es el desplazamiento ms frecuente?

    32. Con el fin de hacer un estudio de aceptacin sobre dos modelos de automviles de reciente fabricacin (A

    y B), se han considerado las ventas efectuadas por un concesionario durante los das no festivos el mes de marzo ltimo, que han sido las de la tabla adjunta.

    Ventas de A 0 1 2 2 3 3 4 4 Ventas de B 2 3 1 2 1 2 0 1 N de das 1 1 3 8 5 4 1 2

    Para cada apartado, calcula las distribuciones correspondientes y responde a la pregunta formulada. a) Cuntos coches del modelo B ha vendido el concesionario durante ese mes de marzo? b) Qu nmero medio de coches del modelo A ha vendido el concesionario cada da? c) En los das en que el concesionario haba vendido como mnimo dos coches del modelo A, cul es el

    nmero ms frecuente de coches del modelo B que ha vendido? d) Sin tener en cuenta el modelo, cuntos coches ha vendido como mnimo ese concesionario el 85 % de

    los das?

    33. Una gran superficie ha preguntado a los clientes que han comprado un decodificador de TDT para Navidad si tienen pensado cambiar su televisor por uno de pantalla plana antes de un ao, obtenindose los siguientes resultados:

    Comprar pantalla plana? Si No No sabe

    Nivel de renta

    Bajo 10 22 3 Medio-bajo 12 16 2 Medio-alto 22 37 1

    Alto 27 13 0

    a) Cuntas personas compraron el decodificador para Navidad en esa gran superficie? b) Cmo se distribuye la intencin de compra de los que tienen un nivel medio de renta? c) Es la intencin de compra independiente del nivel de renta? d) Cmo se distribuyen los clientes de esa gran superficie en funcin de sus rentas?

    34. Dada la siguiente distribucin conjunta Y \ X 1 3 5 2 3 5 8 4 4 2 1 7 5 3 2

    a) calcula las distribuciones de frecuencias marginales de las variables X e Y. b) Calcula la distribucin de X/Y=4 c) Calcula la distribucin de Y cuando X toma el valor 1. d) Son X e Y variables independientes? e) Halla la covarianza entre X e Y.

    35. Dada la distribucin de frecuencias bidimensional X \ Y 10 15 20 25 6 1 3 3 2 9 0 3 3 4 12 4 0 2 0

    a) calcula las distribuciones marginales. b) Calcula la media y la varianza de la variable X. c) Calcula la covarianza entre X e Y.

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 6

    36. Se pregunt a 10 empresarios sobre su antigedad en aos y su sueldo mensual en euros, obtenindose los siguientes datos: 3 empresarios cobran 18000 y tienen 4 aos de antigedad 2 empresarios cobran 25000 y tienen 7 aos de antigedad 4 empresarios cobran 30000 y tienen 6 aos de antigedad 1 empresario cobra 50000 y tiene 7 aos de antigedad a) Obtn una tabla con la distribucin conjunta de estas variables. b) Calcula el sueldo medio mensual de esos empresarios. c) Cul es la dispersin de los sueldos? d) Es una distribucin simtrica? Por qu? e) Cul es el rango de la distribucin? f) Determina la distribucin de los sueldos para los empresarios con 7 aos de antigedad. g) Calcula la antigedad ms frecuente entre los empresarios que cobran ms de 20000. h) Calcula el sueldo mximo que cobra el 50 % de los empresarios con ms de 5 aos de antigedad. i) Calcula la antigedad mnima que tiene el 30 % de los empresarios que cobran ms de 28000. j) Qu antigedad tienen como mnimo el 45 % de esos empresarios? k) Qu antigedad es ms frecuente entre esos empresarios? l) De existir relacin lineal entre esas variables, sera directa o inversa? Por qu?

    37. Se han examinado una serie de soluciones patrn de fluorescencia en un espectrmetro de fluorescencia que han conducido a las siguientes intensidades de fluorescencia (Y) para distintas concentraciones (X):

    Y 2 5 9 13 17 21 25 X 0 2 4 6 8 10 12

    a) Calcula la intensidad media de fluorescencia de los experimentos realizados con concentraciones superiores a 7 unidades.

    b) Para cul de estas caractersticas es ms representativa la media? c) Encuentra la mejor relacin lineal entre X e Y. Qu valor se prev para la intensidad de fluorescencia

    cuando se trabaja con una concentracin de 11? Cul es la fiabilidad de esta previsin?

    38. Dados los datos correspondientes a la variable estadstica bidimensional (X,Y) X -2 -1 -1 0 0 1 1 2 Y 0 -1 1 -2 2 -1 1 0

    a) calcula la covarianza entre ambas variables y la varianza de la variable suma. b) Estudia la independencia estadstica entre las variables X e Y.

    39. Sobre una muestra de cuatro individuos se han observado los valores (1,4), (0,1), (3,28) y (2,12) de una

    variable estadstica bidimensional (X,Y). Si nos piden escoger entre las relaciones 23xy e

    xy 32 , cul es mejor y por qu?

    40. Sea una variable estadstica que toma los valores -1, 0 y 1, todos ellos con la misma frecuencia. Demuestra que y 2 son incorreladas pero son estadsticamente dependientes.

    41. Se han recogido los datos siguientes sobre nmero de trabajadores (X) y superficie cultivada en acres (Y) para un conjunto de 100 cooperativas agrarias en Espaa.

    X \ Y 0-100 100-500 500-1500 5 20 10 10 5 15 15 10 20 10 30

    a) Cmo se distribuyen las cooperativas con menos de 100 acres cultivados? b) Cul es la superficie media cultivada en las cooperativas que tienen menos de 13 trabajadores? c) Cul es el nmero de trabajadores ms frecuente en las cooperativas que cultivan ms de 500 acres? d) Qu porcentaje de cooperativas cultiva entre 150 y 900 acres?

    42. Sabiendo que se verifica la relacin 5 = 4 en una distribucin bidimensional de medias aritmticas

    = 16 e = 12, y que la medida de la dependencia lineal entre las variables es 2 = 9/16, halla la recta de regresin de X sobre Y y, a partir de ella, predice el valor que debe esperarse para la variable X en el caso en que Y tome el valor 4.

    43. Estudia en qu casos los resultados que se ofrecen son incompatibles: a) = 0.3 y la recta de regresin de Y respecto de X tiene por ecuacin = 4 + 5 b) = 100, = 5, = 20,

    2 = 5 (varianza de los errores) c) Las dos rectas de regresin tienen ecuaciones = 5 + 8 e = 5 + 9, y = 0.2. d) La recta de regresin de Y sobre X tiene por ecuacin = 2 + 4, la recta de regresin de X sobre Y

    tiene por ecuacin = + 4, y adems = 16, = 12.

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 7

    44. La siguiente tabla presenta la informacin relativa al nmero semanal de coches vendidos (X) y al nmero de accesorios opcionales incorporados (Y) en 44 concesionarios de automviles:

    Y \ X 2-8 8-12 12-28 .

    1 12 2 16 2 8 13 4 2 12

    . 14 44 a) Completa los datos que faltan en la tabla. b) Cul es el nmero medio de accesorios incorporados? c) Cul es el nmero medio de coches vendidos en los concesionarios donde se incorporan dos

    accesorios opcionales? d) Da una relacin entre el nmero de accesorios y el nmero de coches vendidos semanalmente.

    Cuntos accesorios se prev que incorpore un concesionario que vende 11 coches en una semana? Comenta el resultado obtenido.

    45. Determina si es posible que las rectas y=3x+2, x=4y-7 sean rectas de regresin de una variable estadstica

    bidimensional (X,Y). En caso afirmativo, calcula las medias de las variables X e Y y el coeficiente de correlacin lineal.

    46. Las estaturas (X) y los pesos (Y) de seis individuos fueron las siguientes 1.70 1.65 1.69 1.70 1.75 1.72

    68 60 65 80 85 70

    a) Calcula una recta que permita explicar la evolucin de los pesos en funcin de la estatura. b) Qu peso se prev tenga un individuo de 1.73? Y uno de 1.89? Comenta los resultados obtenidos.

    47. Dada una variable estadstica (X, Y) se sabe que la media de X es 24, la varianza de Y es 90 veces la de X y

    que = 6 9x es una recta de regresin. Calcula la media de X, la otra recta de regresin, el coeficiente de correlacin lineal e interpreta el resultado.

    48. Pueden ser 3 + 2 = 7 y + = 2 rectas de regresin de una variable estadstica bidimensional (X,Y)? En caso afirmativo, calcula sus medias, el coeficiente de determinacin, el coeficiente de correlacin lineal e interpreta los resultados.

    49. Sea y+3x-2=0 una recta de regresin para una variable estadstica bidimensional (X,Y). a) Sabiendo que la media de Y es 4, calcula la media de X. b) Sabiendo que adems

    2 = 32, determina qu recta de regresin es y calcula la otra. Adems:

    1) Dibuja las rectas y seala cul es cada una. 2) Calcula la pendiente de la RR X/Y. 3) Calcula la pendiente de la RR Y/X. 4) Calcula el coeficiente de correlacin lineal e interpreta el resultado. 5) Interpreta el valor del coeficiente de determinacin. 6) Estima el valor de Y cuando X=3. Es buena esta previsin? Por qu? 7) Estima el valor de X cuando Y=20. Es buena esta previsin? Por qu?

    50. Sea 20 + 38 = 96 una recta de regresin asociada a una variable estadstica bidimensional (X,Y). a) Si nos dicen que la media de X es 2, podemos deducir el valor de la media de Y? Por qu? En caso

    afirmativo, calclala. b) Si adems nos dicen que

    2 = 42, cmo podemos deducir cul de las rectas de regresin es? Por

    qu? c) Si queremos predecir el valor de Y para X=3, qu recta utilizaremos? Por qu? Qu prediccin nos

    sale? Es buena esa prediccin? d) Podra considerarse igual de fiable una prediccin para X cuando Y=20? Por qu? Qu recta

    utilizaramos en este caso? Por qu?

    51. Se han estudiado las calificaciones de cien alumnos en dos asignaturas: Matemticas (X) y Estadstica (Y), obtenindose los datos: = 110, = 2.5, = 10, = 0.5. Adems se sabe que el coeficiente de

    correlacin lineal entre ambas variables es 0.85. a) Se puede decir que aquellos alumnos que obtienen mayor calificacin en Matemticas son los mismos

    que obtienen mayor calificacin en Estadstica? Por qu? b) Cunto valen los momentos 20 y 02? c) Cul es la ecuacin de las rectas de regresin? d) Qu nota puede predecirse que sacar en Estadstica un alumno que ha obtenido 125 puntos en

    Matemticas? Es fiable dicha previsin? e) Qu nota puede predecirse que sacar en Matemticas un alumno que ha obtenido 5 puntos en

    Estadstica? Es fiable dicha previsin?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 8

    52. Sea X la variable nmero de anlisis clnicos realizados durante una semana en el servicio de hematologa de un hospital e Y la variable nmero de analistas disponibles durante una semana en el servicio de hematologa del mismo hospital. Observados los archivos del hospital de los ltimos seis meses, se han encontrado los siguientes datos:

    N anlisis 200 140 180 210 180 140

    N analistas 5 4 5 5 4 3

    N semanas 7 3 6 3 5 2

    a) Estn relacionadas estadsticamente estas variables? b) Para qu variable es ms representativa la media de la distribucin? c) Cul es el nmero de anlisis ms frecuente? d) Cmo se distribuye el nmero de anlisis realizados las semanas en las que se dispona como mucho

    de 4 analistas? e) Qu nmero de anlisis se espera hacer en una semana en la que se dispone exactamente de 2

    analistas? Es fiable dicha previsin? f) Sin realizar clculos numricos, cmo calcularas el nmero de analistas del que se dispona en una

    semana en la que se realizaron 400 anlisis? Qu puedes decir de la fiabilidad de esta previsin?

    53. Dada una variable estadstica bidimensional (X, Y), se supone que las rectas de regresin son la de Y sobre X: y=3x+1 la de X sobre Y: x=2y-3 Determina las medias de X e Y e indica si el ajuste es bueno. Era cierta la suposicin inicial? Por qu?

    54. Los siguientes datos se reunieron para determinar la relacin entre presin y la correspondiente lectura en la escala, con el propsito de calibracin.

    Presin 0.2 0.4 0.45 0.6 5 Lectura 0.3 0.3 0.45 0.65 5.1

    a) Halla el coeficiente de correlacin lineal entre estas dos variables. Qu lectura cabe esperar para una presin de 3.5?

    b) Cul sera la respuesta del apartado anterior si se elimina el punto (5, 5.1)? Debe eliminarse ese punto? Justifica la respuesta.

    55. Se desea llevar a cabo un estudio para analizar la viscosidad de la glicerina en funcin de la temperatura.

    Para ello se han seleccionado 8 muestras de un jabn y se ha medido la viscosidad de la glicerina (en centipoises) que la compone a diferentes temperaturas (en C). Los datos obtenidos son los siguientes:

    Temperatura (C) 15 20 30 40 45 50 55 60 Viscosidad (centipoises) 6.5 5.6 5.4 6 5 4.6 3 2.4

    a) Qu porcentaje de muestras de jabn tiene una viscosidad inferior a 5.8 centipoises? b) Si una muestra de jabn est entre el 65 % de las menos viscosas y el 70 % de las ms viscosas, entre

    qu valores est su viscosidad? c) Halla la recta de regresin adecuada para el estudio que se desea realizar. d) Explica, justificando la respuesta, qu tipo y qu grado de relacin lineal existe entre la viscosidad de la

    glicerina y la temperatura a la que se encuentra. e) Predice, si es posible, qu viscosidad tendrn las muestras de jabn de un establecimiento cuya

    temperatura ambiente suele estar en torno a los 22C. Ser fiable la prediccin? f) Si se mete una muestra de jabn en un congelador y se baja la temperatura hasta 0C, qu viscosidad

    tendr? Ser fiable la prediccin? g) A qu temperatura media se han tomado las muestras de jabn que tienen una viscosidad superior a 5

    centipoises? h) Qu viscosidad tienen como mnimo el 50 % de los jabones que se han observado a una temperatura

    inferior a 47 C?

    56. En estudios recientes se utilizan las bacterias para luchar contra la contaminacin del subsuelo pues, aunque las bacterias no degradan directamente los metales ni los elementos radioactivos, s pueden fijarlos formando revestimientos salinos sobre los granos de roca, lo que impide que la contaminacin se extienda. Los estudios geoqumicos sugieren que la cantidad de hierro fijada crece cuando el tamao de los granos decrece. Los datos obtenidos tras varias mediciones en diferentes puntos del subsuelo son:

    Tamao del grano de roca (en mm) 0.10 0.01 0.18 0.05 0.08 Cantidad de compuesto de hierro (en ppm) 350 590 220 460 390

    N de puntos del subsuelo 4 5 6 2 3 a) Cul es el tamao del grano de roca ms frecuente entre aquellos puntos del subsuelo que tienen ms

    de 300 ppm de compuesto de hierro? b) Si slo tenemos en cuenta los puntos del subsuelo cuyo grano de roca tiene un tamao de al menos

    0.04 mm, qu cantidad de hierro tienen como mnimo el 30 % de esos puntos con grano grueso? c) Determina el ajuste lineal de la cantidad de hierro en funcin del tamao de los granos. Es acorde

    dicho ajuste con los estudios geoqumicos previos? d) Qu cantidad de hierro es previsible obtener en un grano de roca de 0.075 mm? Y en uno de 0.35

    mm? Son fiables dichas previsiones?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 9

    57. En una gran compaa se ha constatado que, por trmino medio, el 65 % de sus pedidos se entrega con

    retraso. La distribucin de los retrasos de los pedidos entregados con retraso en los ltimos 6 meses es: Tiempo de retraso (en das) 0-1 1-2 2-3 3-5 5-10

    N de pedidos 2000 3000 2500 2000 500 a) Determina el retraso medio y la desviacin tpica del tiempo de retraso de los pedidos que no han sido

    entregados a tiempo. Interpreta los resultados obtenidos. b) Cuntos das se han retrasado como mnimo el 10 % de los pedidos con retraso que ms tardaron en

    entregarse? c) La compaa ha calculada que, por cada pedido con retraso, se producen unas prdidas fijas de 114

    euros y una prdidas variables de 60 euros por cada da de retraso. Cunto le cuesta, por trmino medio, el retraso de un pedido a la compaa? Qu prdidas totales tuvo la compaa en los ltimos 6 meses debido a los retrasos producidos?

    58. El consumo semanal de materia prima (X) y energa (Y) que ha tenido una empresa en un periodo de diez semanas viene dado por la siguiente tabla.

    X 1600 1650 1800 1650 1400 1250 1200 1300 1350 1700 Y 570 540 480 450 390 450 510 510 570 540

    a) Suponiendo que existe una relacin lineal entre ambas variables, calcula la ecuacin que la representa y explica qu tipo y grado de relacin lineal expresa.

    b) Obtn el consumo de energa previsible para una semana en la que el consumo de materia prima es de 1680 unidades. Es fiable dicha previsin?

    c) Qu cantidad de materia prima se utiliza una semana en la que el consumo de energa es de 780 unidades? Es fiable dicha previsin?

    59. Se est tratando de obtener empricamente una frmula para predecir la cantidad de carcter inico Y de

    un enlace en funcin de la diferencia de electronegatividad X de los tomos que lo constituyen. En seis experimentos se han observado los siguientes valores:

    X 2 6 8 7 10 9 Y 6 8 9 9 10 12

    a) Se pretende predecir el valor de Y cuando X vale 5 mediante una recta de regresin. Ajusta una recta al diagrama de dispersin y calcula la prediccin pedida.

    b) Ajusta al diagrama de dispersin una funcin exponencial del tipo = y halla la prediccin en ese caso. Cul de las dos predicciones resulta ms fiable en la muestra?

    60. Un eclogo desea predecir el cambio de temperatura del agua (Y) que tiene lugar en un punto situado una milla por debajo de una planta industrial, tras el vertido de aguas residuales calientes en la corriente. La prediccin se basar en la cantidad de agua liberada (X). La respuesta es el cambio de la temperatura del agua; el nico regresor es la cantidad de agua liberada. Puesto que la cantidad de agua caliente liberada vara dependiendo del nivel de actividad de la planta, el experimentador no controla los valores del regresor utilizado para desarrollar la ecuacin de prediccin, sino ms bien los valores medidos simplemente en el momento de liberacin del agua. Los datos recogidos fueron los siguientes:

    X 1.0 1.1 1.5 1.7 2.0 2.5 3.0 3.0 3.0 3.1 3.2 3.5 3.6 4.0 Y 3.0 3.2 4.1 4.2 5.0 6.2 7.3 7.0 7.1 7.4 6.0 8.1 8.0 9.0

    a) Dibuja la nube de puntos a que dan lugar estos datos. Parece lgica la relacin lineal? b) Calcula una ecuacin que explique el comportamiento del efecto en funcin de la causa. c) Podemos predecir cul es el cambio de temperatura despus de liberar 5 unidades de agua? Es

    buena esa prediccin? Por qu?

    61. Contabilizados los goles marcados en ocho partidos de ftbol y observada la temperatura media en los estadios a lo largo de los encuentros, se obtuvo la tabla adjunta:

    Nmero de goles 0 1 1 2 3 3 4 5 Temperatura 18 18 21 16 21 23 21 16

    Utilizando la representacin grfica, decide si existe algn tipo de dependencia entre las variables.

    62. Dada la distribucin conjunta de la variable estadstica bidimensional (X,Y) con la siguiente tabla, calcula X \ Y 1 2 0 0.3 0.1 1 0.2 0.4

    a) la distribucin de la variable Z=X+Y b) la distribucin de Z cuando X=0. c) Son X e Y variables estadsticamente independientes? d) Si estos datos provienen de una muestra de 50 individuos

    1) cuntos individuos se observaron para X=1? 2) cuntos nos proporcionaran un valor de T igual a 1 si T=X-Y?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 10

    63. Dos qumicos estudian los efectos de la utilizacin de un equipo depurador en la eliminacin de partculas contaminantes en muestras de aire de determinado volumen. Para ello observan las variables X (peso de las partculas contaminantes por muestra cuando no trabaja el equipo depurador) e Y (peso de las partculas contaminantes por muestra cuando s trabaja el equipo depurador), ambas en las mismas unidades. Los datos recogidos son los siguientes:

    X 50 45 47 55 60 65 40 Y 35 30 40 45 55 55 45

    Uno de los qumicos estima que la utilizacin del equipo depurador hace disminuir el peso de las partculas contaminantes aproximadamente en 10 unidades de peso. El otro qumico estima que la utilizacin del equipo depurador disminuye el peso de las partculas contaminantes en un 20 %. a) A la vista de los datos, puede afirmarse que existe relacin lineal entre estas caractersticas? b) Cul de las variables se considerara la causa y cul el efecto? c) Calcula la recta de regresin adecuada e indica cul de los qumicos se acerc ms a la realidad

    ofrecida por los datos. d) Crees que sera mejor otro tipo de relacin? Cul? Por qu?

    64. Se han examinado 64 soluciones patrn en un espectrmetro de fluorescencia que han conducido a los

    siguientes valores de las intensidades de fluorescencia (Y) para diferentes concentraciones (X): X 4 4 5 5 5 6 6 7 7 9 9 Y 0-5 5-10 5-10 10-15 15-20 10-15 15-20 10-15 15-20 15-20 20-25 n 7 5 5 9 1 8 1 7 5 15 1

    a) Calcula la concentracin media de los experimentos realizados con intensidades de fluorescencia superiores a 15 unidades. Especifca la distribucin utilizada.

    b) Qu intensidad de fluorescencia tiene como mnimo el 20 % de los experimentos realizados con una concentracin inferior a 5.5? Especifca la distribucin utilizada.

    c) Qu fluorescencia se obtendr para una concentracin de 8 unidades? Es buena dicha previsin? Por qu?

    d) Cul sera el valor previsto para la fluorescencia si se usara una concentracin de 15 unidades? Es esta previsin igual de fiable que la anterior? Por qu?

    65. La edad en aos (X) y la altura en metros (Y) de un grupo de rboles de una especie concreta seleccionados en un bosque vienen dadas en la siguiente tabla:

    X 3 3 4 4 4 5 5 6 6 7 7 Y 0-5 5-10 5-10 10-15 15-20 10-15 15-20 10-15 15-20 15-20 20-25

    N rboles 2 4 2 10 1 9 2 7 8 14 1 Calcula una ecuacin que explique el comportamiento del efecto en funcin de la causa. a) Cul es la altura de un rbol de 8 aos? Es buena dicha previsin? Por qu? b) Con la misma ecuacin del apartado anterior, podemos predecir la altura de un rbol de 15 aos?

    Por qu? c) Qu edad tendr un rbol de 17 metros?

    66. Los datos siguientes corresponden a la evolucin del peso celular (en mg/ml) y la cantidad de nitrato en

    un cultivo de algas durante tres das: Tiempo Peso Nitrato Inicio 0.07 12.5 1 da 0.19 10.4

    2 das 0.52 7.8 3 das 1.07 4.5

    a) Ajusta una recta y una curva exponencial a la relacin entre el peso y el nitrato. b) Ajusta una curva a la evolucin temporal del peso. c) Mediante lo obtenido en los apartados anteriores, predice la cantidad de nitrato que habra en el

    cultivo al cabo de 36 horas.

    67. La presin y el volumen de un gas estn relacionados por una ecuacin del tipo = , donde y son constantes que dependen de la naturaleza del gas. En un experimento realizado con cierto gas, se obtuvieron los siguientes resultados:

    Presin () 0.50 1.00 1.50 2.00 2.50 3.00 Volumen () 1.65 1.03 0.74 0.61 0.53 0.45

    Estima los valores de y de acuerdo con los datos del experimento, expresando en funcin de .

    68. Los resultados de un experimento para el estudio de la velocidad de una reaccin enzimtica han sido: X (concentracin del sustrato) 2.5 5 10 20 40

    Y (velocidad observada) 5.6 7.3 12.5 16.1 23.2 Se supone que la velocidad de la reaccin est regida por la ecuacin de Michaelis-Menten que es de la

    forma 1

    = +

    con A y B constantes. Estima, a partir de los datos anteriores, los valores de A y B. Es

    adecuada la suposicin realizada para los datos obtenidos?

  • Estadstica PROBLEMAS 2014/2015

    Enunciados para pensar y/o resolver Pgina 11

    69. Segn la ley de Boyle-Mariotte de los gases perfectos, si una masa de gas se comprime o se dilata a

    temperatura constante, el producto de la presin por el volumen permanece constante, es decir, = , siendo la presin, el volumen y la constante caracterstica de la naturaleza del gas. Utilizando el mtodo de mnimos cuadrados, estima la constante para un gas del que se observaron los datos:

    (kg/cm2) 0.10 0.15 0.20 0.25 (litros) 2.24 1.50 1.13 0.92

    Qu volumen de gas corresponder a un valor de la presin de 0.17 kg/cm2? Es adecuada la utilizacin de la ley de Boyle-Mariotte para los datos del ejercicio?

    70. Se han tomado cinco muestras de glucgeno, de una cantidad fija cada una. Se les ha aplicado una

    cantidad X de glucogenasa (en mmol/l) anotando en cada caso la velocidad de reaccin Y, medida en -mol/min, obtenindose as la siguiente tabla:

    X 1 2 3 0.2 0.5 Y 18 35 60 8 10

    Sabiendo que la reaccin no se ajusta al modelo de Michaelis-Menton, se pide: a) Justifica detalladamente si se desprende de estos datos que la velocidad de la reaccin aumenta con la

    concentracin de glucogenasa. b) Si a una de las muestras le hubisemos aplicado una concentracin de glucogenasa de 5 mmol/l, cul

    habra sido la velocidad de reaccin? Con qu grado de fiabilidad se obtiene esa prediccin?

    71. Dada una muestra y una variable estadstica bidimensional (X, Y) sobre ella, a) obtn mediante el mtodo de mnimos cuadrados el mejor ajuste del tipo = + .

    b) Se sospecha que la relacin entre dos variables estadsticas es del tipo =1

    + . Mediante un cambio

    de variable, y aplicando el apartado anterior, estudia cmo debe ser cuando la muestra proporciona la siguiente tabla de frecuencias.

    X -1 1.25 2 1 0.25 1.5 1.75 -0.5 -0.75 -0.5 Y 2 3.8 3.5 4 7 3.7 3.6 1 1.5 0.75

    Se puede dar por buena la suposicin de que la relacin entre ambas variables es del tipo =1

    + ?

    72. Se ha medido el contenido en oxgeno Y en mg/l de cierto lago a una profundidad X en m, obtenindose

    los siguientes datos: X 15 20 30 40 50 60 Y 6.5 5.6 5.4 6 4.6 1.4

    a) Obtn, mediante el mtodo de mnimos cuadrados, el mejor ajuste lineal de Y en funcin de X.

    b) Estudios posteriores hacen sospechar que la relacin entre X e Y es del tipo =

    10+ . Aplicando el

    apartado anterior, cul debera ser el valor de ? c) Para una profundidad de 25 m, qu contenido de oxgeno se podra predecir a partir de los dos

    modelos anteriores? Cul de las dos previsiones se considera ms fiable en la muestra?

    73. Dos mdicos estudian los efectos de cierto rgimen alimenticio en pacientes con sobrepeso. Para ello se observan las variables X=peso (en kg) antes del tratamiento e Y=peso (en kg) despus del tratamiento en una muestra de 7 pacientes, obtenindose los datos:

    X 100 90 90 110 120 125 85 Y 85 75 79 93 100 100 73

    a) El primero de los mdicos estima que el tratamiento hace disminuir el peso de cada paciente en 30 kg. El otro mdico estima que, con el tratamiento, el peso disminuye en un 15 %. 1) A la vista de estos datos, cul de las dos afirmaciones parece ms fiable? 2) Calcula la recta de regresin de Y sobre X. Sin realizar operaciones, compara la bondad de este

    ajuste con la de los dos anteriores. b) Cul sera el peso estimado tras el tratamiento para los que pesan 95 kg antes del tratamiento? Es

    fiable esa prediccin? En caso afirmativo, cmo de fiable? En caso negativo, por qu? c) Por debajo de qu peso estn el 25 % de los que menos pesan antes del tratamiento? y por encima de

    que peso estn el 25 % de los que ms pesan antes del tratamiento? d) Cul es el porcentaje de los que pesan menos de 95 kg antes del tratamiento? y el porcentaje de los

    que pesan menos de 95 kg despus del tratamiento?

    74. Dada la distribucin bidimensional 1 1.5 2 2.5 3 4 2.2 6 16 44.5 121 895

    ajusta una funcin del tipo = .

    75. Cada uno de los componentes de un equipo de relevos 4 100 metros alcanz en una competicin la siguiente velocidad: 10.16 m/s, 10.35 m/s, 10.40 m/s y 10.52 m/s. Cul fue la velocidad media desarrollada por el testigo que se entrega a los corredores?