Guía de Estadística Descriptiva

download Guía de Estadística Descriptiva

of 11

Transcript of Guía de Estadística Descriptiva

  • Gua N 1: Estadstica Descriptiva

    Profesor: Gonzalo Cruz R.

    1.-Determine si las siguientes variables son discretas o continuas:

    a) Nmero de habitantes por kilmetro cuadrado

    b) Nmero de bacterias de cierto tipo, por mililitro

    c) Densidad de diferentes muestras de un mismo lquido

    d) Nmero de frutos de un rbol de la misma especie

    e) Velocidad de un vehculo al pasar por un determinado punto

    f) Puntuaciones obtenidas en un test por un grupo de personas

    g) Superficie dedicada a cierto cultivo, por hectreas, en un municipio

    h) Peso de un nio al cumplir 3 aos

    2. Determine si las siguientes afirmaciones son verdaderas o falsas, justificando su

    aseveracin:

    a) Cuando las variables son medidas a nivel intervalar pueden recategorizarse para

    expresarlas en una escala ordinal, sin embargo no se puede hacer a la inversa

    b) Es imposible graficar cuando los datos estn medidos en nivel nominal ya que no hay

    registros de frecuencia para construir los grficos.

    3. Comente: "La mejor medida de tendencia central es la media aritmtica, por eso la

    utilizaremos siempre salvo que no se conozcan los valores extremos de la variable"

    4. El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio mdico, es

    el que se muestra en la siguiente tabla:

    Tiempo de espera (minutos)

    Nmero de pacientes

    [0, 5) 3

    [5, 10) 35

    [10, 15) 98

    [15, 20) 63

    [20, 25) 55

  • [25, 30) 44

    [30, 35) 12

    [35, 40) 6

    [40, 45) 5

    [45, 50] 1

    a) Calcule los cuartiles y deciles 2 y 7

    b) Si consideramos a los pacientes que esperan media hora o ms, Qu porcentaje

    representan del total?

    c) Cuntos pacientes esperan entre 7 y 23 minutos?, Qu porcentaje representan del total?

    5. Los siguientes datos corresponden a los pesos de los bebs nacidos durante un cierto

    intervalo de tiempo en un hospital:

    1,814 3,629 1,814 2,722 3,629 2,722 3,175 3,175 3,175 3,629

    4,536 4,082 3,175 2,722 4,536 3,629 2,268 4,082 2,722 1,361

    3,175 2,722 1,814 3,175 2,722 4,082 3,175 1,814 3,175 2,722

    3,629 3,629 4,082 4,99 3,629 3,175 4,536 3,629 2,268 3,175

    3,175 2,722 2,268 4,536 3,629 4,082 3,175 2,268 2,722 2,268

    (a) Construir una distribucin de frecuencias de estos pesos.

    (b) Encontrar las frecuencias relativas.

    (c) Encontrar las frecuencias acumuladas.

    (d) Encontrar las frecuencias relativas acumuladas.

    (e) Dibujar un histograma con los datos.

    (f) Calcular las medidas de tendencia central.

    (g) Encontrar el percentil 24.

    6. A continuacin se dan los resultados obtenidos con una muestra de 50 universitarios. la

    caracterstica es el tiempo de reaccin ante un estmulo auditivo:

    0,111 0,111 0,11 0,113 0,118 0,112 0,136 0,107 0,122

    0,112 0,097 0,098 0,106 0,102 0,12 0,1 0,118 0,113

    0,123 0,119 0,117 0,109 0,116 0,12 0,106 0,124 0,109

    0,117 0,112 0,111 0,1 0,111 0,111 0,119 0,103 0,1

    0,107 0,121 0,119 0,102 0,128 0,115 0,121 0,129 0,133

    0,117 0,105 0,106 0,095 0,1114

  • (a) Cul es la amplitud total de la distribucin de los datos?

    (b) Obtenga la distribucin de frecuencias absolutas y relativas.

    (c) Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas.

    (d) Calcular la media, varianza y coeficiente de variacin.

    (e) Dibuje el polgono de frecuencias relativas.

    (f) Dibuje el polgono de frecuencias relativas acumuladas.

    7. Con el fin de observar la relacin entre la inteligencia y el nivel socioeconmico (medido por

    el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente

    Intelectual inferior a 95 y otro formado por los dems; De cada sujeto se anot el salario

    mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:

    Nivel Socioeconmico CI

  • (a) Las medias aritmticas de ambos grupos.

    (b) Las medianas de ambos grupos.

    (c) El porcentaje de sujetos dislxicos que superaron la mediana de los normales.

    (d) Compare la variabilidad relativa de ambos grupos.

    9. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas

    con tuberculosis pulmonar en una provincia:

    Edad Trabajadores No Trabajadores Totales

    Varn Mujer Total Varn Mujer Total Varn Mujer Total

    1419 2 1 3 25 40 65 27 41 68

    1924 10 4 14 20 36 56 30 40 70

    2429 32 10 42 15 50 65 47 60 107

    2934 47 12 59 13 34 47 60 46 106

    3439 38 8 46 10 25 35 48 33 81

    3944 22 4 26 7 18 25 29 22 51

    (a) Representar grficamente la distribucin de frecuencias de aquellas personas trabajadoras

    que padecen tuberculosis.

    (b) Representar grficamente la distribucin de frecuencias de los varones no trabajadores que

    padecen tuberculosis.

    (c) Representar grficamente la distribucin de frecuencias del nmero total de mujeres que

    padecen tuberculosis.

    (d) Por debajo de qu edad est el 50 % de los varones?

    (e) Por encima de qu edad se encuentra el 80 % de las mujeres?

    (f) Obtener la media, mediana y desviacin estndar de la distribucin de las edades de la

    muestra total.

    10. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un

    pas, obtenindose la siguiente tabla:

    Decesos 0 1 2 3 4 5 6 7

    Ciudades 7 11 10 7 1 2 1 1

    (a) Representar grficamente estos datos.

    (b) Obtener la distribucin acumulada y representarla.

    (c) Calcular media, mediana y moda.

    (d) Calcular la varianza y la desviacin estndar.

  • (e) Porcentaje de ciudades con al menos 2 muertos.

    (f) Porcentaje de ciudades con ms de 3 muertos.

    (g) Porcentaje de ciudades con a lo sumo 5 muertos.

    11. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con

    los resultados siguientes:

    Temperatura (C) 37 37,2 37,5 38 38,1 38,5 39

    N pacientes 1 5 15 6 10 5 2

    Calcule:

    (a) Media aritmtica.

    (b) Moda y mediana.

    (c) Coeficiente de variacin de Pearson. ( se calcula dividiendo la Desv. Estndar por la Media)

    12. Un eclogo est interesado en el tamao de la hoja de una determinada especie vegetal.

    Para ello recoge una muestra con los siguientes resultados:

    centmetros 2,5 3,2 4 5,5 5,8 6,1 N hojas 2 4 9 6 6 3

    Determine los valores de:

    (a) Primer y tercer cuartiles.

    (b) Moda y mediana.

    (c) Percentiles 42 y 86

    13. La siguiente distribucin de frecuencias se refiere a las edades de los empleados de una

    empresa:

    Edad (aos) ni

    16-22 11

    22-28 15

    28-34 32

    34-40 28

    40-46 16

    46-52 25

    52-58 14

    58-64 10

    64-70 6

    Calcule:

  • (a) Media aritmtica, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer

    orden, percentiles 32 y 81.

    (b) Desviacin estndar, coeficiente de variacin (= S/Media) y rango intercuartilico.

    14. Dadas las observaciones siguientes:

    11 23 26 20 20 27 15 26 21 31

    15 13 20 24 10 33 29 25 16 27

    19 25 27 22 28 29 29 20 18 20

    (a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10.

    (b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo

    modal,

    (c) cuartiles de primer y tercer orden y el percentil 82.

    (d) desviacin estndar, coeficiente de variacin y rango intercuartlico.

    15. Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias seguidas por

    estos pacientes, resultando el conjunto de datos:

    C : Corticoides

    DQ : Descomprensin quirrgica

    ET : Electroterapia

    NT : Ningn tratamiento

    OT : Otras modalidades

    Tratamiento C DQ ET NT OT

    N de pacientes 73 36 19 21 9

    (a) Obtenga la tabla de frecuencias e indique qu porcentaje de pacientes toma corticoides.

    (b) Construya el diagrama de sectores.

    16. Los siguientes datos representan el nmero de das de hospitalizacin por una

    apendicectoma:

    N de das 3 4 5 6 7 8 ms de 8

    N de casos 15 58 43 22 8 3 1

    (a) Obtener la media y la varianza, as como los coeficientes de asimetra, curtosis y variacin.

    (b) Representar el correspondiente diagrama de barras.

  • 17. La siguiente tabla muestra la distribucin de edades de 75 casos de una determinada

    enfermedad durante un ao y en un hospital determinado:

    Edad ni

    5-15 5

    15-25 10

    25-35 20

    35-45 22

    45-55 13

    55-65 5

    (a) Calcular la media, mediana, varianza, desviacin estndar y coeficiente de variacin.

    18. Como parte de un proyecto de investigacin, cierto investigador obtuvo los siguientes

    niveles de SLP de una muestra de 10 individuos adultos bajo tratamiento de Diabetes Mellitus:

    5,85 6,17 6,09 7,7 3,17 3,83 5,17 4,31 3,09 5,24

    (a) Calcular la media, mediana, varianza y desviacin estndar.

    (b) Qu puede concluir respecto de la media y la mediana?

    19. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar

    anticonceptivos orales.

    Los datos, agrupados en clases, estn en el siguiente cuadro:

    Consumo [0,50] [50,100) [100,150) [150,200) [200,250]

    Ni 25 60 90 98 100

    (a) Calcule el porcentaje de mujeres que consume ms de 120 mg

    (b) Calcule la media, la mediana y la moda

    20. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol

    en suero. Para ello, se ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100

    sujetos, obtenindose la siguiente tabla de frecuencias absolutas acumuladas:

    Clases ni Ni fi 13-25 23

    25-37 33 37-49

    72

    49-61

    90 61-73 10

  • (a) Calcular el porcentaje de sujetos que consumen entre 20 y 40 gr. de alcohol a la semana.

    (b) Calcular el consumo medio.

    (c) Calcular el nmero de sujetos que hay entre el percentil 15 y el cuartil tercero.

    (d) Obtener la mediana de la distribucin de frecuencias.

    21. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos

    agrupados en 7 intervalos de amplitud 10 mg /100 ml se presentan en la siguiente tabla:

    Intervalos n

    65-75 14

    75-85 42

    85-95 63

    95-105 84

    105-115 70

    115-125 56

    125-135 21

    (a) Calcular la desviacin estndar de los datos, sabiendo que la media es 101, 6 mg/100 ml.

    (b) Qu valor de tasa de glucosa es superado por el 40 % de los datos?

    22. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 nios de

    edad similar, se ha utilizado el ndice de masa corporal (IMC = kg/m2). Los datos agrupados en 6

    intervalos junto con la mayora de sus frecuencias relativas ( fi ), se presentan en la siguiente

    tabla:

    Peso Intervalos fi

    Bajo [1518) 0,04

    Normal-Bajo [1820) 0,12

    Normal [2025) 0,4

    Normal-Alto [2527) Sobrepeso [2730) 0,16

    Obesidad [3035] 0,12

    (a) Cul es el IMC que superan el 50 % de los nios de este estudio?

    (b) Qu% de nios tienen un IMC superior a 22 kg/m2?

    23. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se

    midieron los valores de hemoglobina (gr/dl) al final del primer trimestre en un grupo de 200

    embarazadas que no seguan ningn tratamiento paralelo.

    La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de

    las categoras:

  • Hemoglobina (g/dl) fi

    [9,09,8) 10%

    [9,810,6) 40%

    [10,611,4) 30%

    [11,412,2) 15%

    [12,213,0) 5%

    A partir de estos datos:

    (a) El porcentaje de mujeres que presentaban anemia es decir, que tenan valores de

    hemoglobina por debajo de 11 gr/dl

    (b) Determinar la media, la mediana y la desviacin estndar de los datos. Es la media un

    buen representante de los datos?

    24. La siguiente tabla nos muestra (en miles) el nmero de embarazos registrados en un pas a

    lo largo del ao 1996, segn los diferentes grupos de edad:

    Edad

  • 27. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la

    Amantadina. En un estudio sobre este medicamento se han administrado por va oral dosis

    nicas de 100 mg a 60 individuos adultos sanos. La variable estudiada (Tmax) es el tiempo

    requerido en minutos para alcanzar la concentracin mxima de plasma. La siguiente tabla

    recoge frecuencia relativas acumuladas (Fi ) de los datos del estudio:

    [100 120] 0,25

    [120 140] 0,75

    [140 160] 0,90

    [160 180] 0,95

    [180 200]

    (a) Determinar media, mediana y desviacin estndar de esta distribucin.

    (b) Determinar todas las medidas de dispersin y comente.

    28. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio

    transitorio entre la produccin y eliminacin de la bilirrubina. En el curso de una investigacin,

    se determinaron los niveles de bilirrubina a travs de bilirrubinometra transcutnea (BTc) de

    una muestra de neonatos con ictericia, obtenindose los siguientes resultados:

    (a) Entre qu valores se encuentran el 30 % central de los datos de esta distribucin?

    (b) Calcular todas las medidas de tendencia central.

    29. En 50 nios de 12 aos de edad se anot el nmero de dientes permanentes cariados u

    obturados, obtenindose que 8, 12, 10, 6, 4, 4, 4, 0 y 2 nios tenan 0, 1, 2, . . ., 7 y 8 dientes en

    esas condiciones. Calcular la media, mediana y desviacin estndar de la distribucin.

    30. Se determin 20 veces el contenido de glucosa en sangre de una misma muestra por medio

    de dos mtodos, A y B, de determinacin rpida de la misma. Comparar la dispersin de ambos

    mtodos.

    Mtodo A 140 141 142 127 138 136 135 142 126 148 139 142 141 151 144 146 145 148 147 136

    Mtodo B 130 132 146 138 145 148 147 135 136 137 141 146 138 131 134 146 139 140 148 146

  • 31. Los siguientes datos corresponden a observaciones del nmero de camas diarias

    disponibles en el servicio de Ginecologa durante 30 das.

    1 3 1 1 0 1 0 1 1 0

    2 2 0 0 0 1 2 1 2 0

    0 1 6 4 3 3 1 2 4 0

    a) Construir la tabla de distribucin de frecuencias, absolutas y relativas, y un grfico de barras

    b) Calcular la mediana, las desviaciones respecto a la Media y la Mediana.

    d) Calcular el rango y el rango intercuartlico.

    e) Cmo cambian las respuestas anteriores si la observacin igual a 6 es un error de

    transcripcin y es en realidad igual a cero?

    f) Calcular la media y la desviacin estndar en cada uno de los casos (con el 6 y sin el 6).

    32. A un grupo de 30 personas se les ha tomado el nmero de pulsaciones por minuto (ritmo

    cardiaco) obtenindose los siguientes resultados:

    87 85 61 51 64 75 80 70 69 82

    80 79 82 74 90 76 72 73 63 65

    67 71 88 76 68 73 70 76 71 86

    a) Agrupa los datos en cinco intervalos y construye la tabla de frecuencias.

    b) Representa grficamente esta distribucin.

    c) Calcula la media, mediana y moda.

    d) Calcula la desviacin estndar.

    33. Dada las siguientes escalas:

    i. Escala Nominal

    ii. Escala Ordinal

    iii. Cuantitativa Discreta

    iv. Cuantitativa Continua (Escala de Razn)

    Clasifique las variables :

    a) Nmero de accidentes de trnsito ocurridos en Santiago durante 1 ao

    b) Colesterol en Sangre (mg/dl)

    c) Grado funcional de un paciente cardipata (I/II/III/IV)

    d) Grupo de tratamiento con 4 frmacos distintos (A/B/C/D)

    e) Grupo de tratamiento para perder peso

    (control/dieta/dieta+ejercicio/dieta+ejercicio+frmaco)