Hoja de Trabajo Estadistica

download Hoja de Trabajo Estadistica

of 14

Transcript of Hoja de Trabajo Estadistica

  • Universidad de San Carlos de Guatemala

    Facultad de Ingeniera

    Escuela de Ciencias

    Departamento de Estadstica

    Estadstica 1

    Ing. Alba Maritza Guerrero

    Aux. ngel Navarro

    Seccin: D, Grupo #23

    HOJA DE TRABAJO

    NOMBRES : CARN

    Monica Sofia Cruz Carrillo 2010-15623

    Mariela Esther Say Suruy 2011-14298

    Otto Saul Molina Gonzlez 2011-14303

    Ingrid Maribel Suriano Marroqun 2011-14297 Eduardo Joaquin Lopez Sierra 2008-42158

    Guatemala, 14 de febrero de 2012.

  • EJERCICIO No.1

    Los datos que se muestran a continuacin representan el costo de la energa elctrica

    durante el mes de enero del 2012 para una muestra aleatoria de 50 departamentos

    con dos recamaras en una ciudad grande. Costo de energa elctrica en dlares:

    96 171 202 178 147 102 153 197 127 82

    157 185 90 116 172 111 148 213 130 165

    141 149 206 175 123 128 144 168 109 167

    95 163 206 175 130 143 187 166 139 149

    108 119 150 154 114 135 191 137 129 158

    A.- Determine una tabla de frecuencias

    Intervalo LRi LRs fi Fia Fr Fra Xi Xi*fi

    82 100 81.5 100.5 4 4 0.08 0.08 91 364

    101 119 100.5 119.5 7 11 0.14 0.22 110 770

    120 138 119.5 138.5 8 19 0.16 0.38 129 1,032

    139 157 138.5 157.5 12 31 0.24 0.62 148 1,776

    158 176 157.5 176.5 10 41 0.20 0.82 167 1,070

    177 195 176.5 195.5 4 45 0.08 0.90 186 744

    196 214 195.5 214.5 5 50 0.10 1.00 205 1,025

    B.- Elabore un histograma de frecuencias y polgono de frecuencias con los datos.

    0,00%

    50,00%

    100,00%

    150,00%

    0

    1

    2

    3

    4

    8 4 y mayor...

    Fre

    cue

    nci

    a

    Clase

    Histograma

    Frecuencia

    % acumulado

  • C.- Alrededor de qu cantidad parece concentrarse el costo mensual de energa elctrica.

    R// El costo mensual de energa elctrica parece concentrarse en Q.147.62.

    EJERCICIO No.2

    Se identific una muestra de estudiantes que posea automviles producidos por la

    General Motors y se registr la marca de cada automvil. A continuacin se presenta

    la muestra que se obtuvo (Ch = Chevrolet, P = Pontiac, O = Oldsmobile, B = Buick, Ca =

    Cadillac):

    Ch B Ch P Ch O B Ch Ca Ch

    B Ca P O P P Ch P O O

    Ch B Ch B Ch P O Ca P Ch

    O Ch Ch B P Ch Ca O Ch B

    B O Ch Ch O Ch Ch B Ch B

    A.- Encuentre el nmero de automviles de cada marca que hay en la muestra.

    CH 19

    P 8

    O 9

    B 10

    Ca 4

    0

    2

    4

    6

    8

    10

    12

    14

    82 100 101 119 120 138 139 157 158 176 177 195 196 214

    Series1

  • B.- Qu porcentaje de estos automviles son Chevrolet, Pontiac, Oldsmobile, Buick,

    Cadillac?

    F Fa Fr Fr%

    CH 19 19 0.38 38%

    P 8 27 0.16 16%

    O 9 36 0.18 18%

    B 10 46 0.20 20%

    Ca 4 50 0.08 8%

    50

    100%

    38% son Chevrolet, 16% Pontiac, 18% Oldsmobile, 20% Buick y 8% Cadillac.

    C.- Trace una grafica de barras que muestre los porcentajes encontrados en el inciso

    b).

    EJERCICIO No.3

    Un polica de una ciudad, usando radar, verific la velocidad de los automviles que

    circulaban por una calle de la ciudad:

    A.- Elabore una grfica de puntos para estos datos.

    0%

    5%

    10%

    15%

    20%

    25%

    30%

    35%

    40%

    CH P O B Ca

    F%

    F%

  • B.- Cul fue la velocidad promedio de los automviles?

    R// 29.375 unidades lineales.

    C.- Calcule e interprete el sesgo intercuartlico a partir de una tabla de distribucin

    de frecuencias.

    Intervalo Limites reales F Fa

    18-23 17.5-23.5 8 8

    24-29 23.5-29.5 14 22

    30-35 29.5-35.5 3 25

    36-41 35.5-41.5 1 26

    42-47 41.5-47.5 1 27

    48-53 47.5-53.5 1 28

    Q1=22.75

    Q2=26.07

    Q3=29.07

    Sk3= 29.07-2(26.07)+22.75 = -0.051

    29.07-22.75

    R// La distribucin es asimtrica negativa, esto indica que las velocidades de los

    automviles en su mayora estn por debajo de la media de los datos o del porcentaje

    de velocidades. Esto se puede confirmar a travs de la tabla de frecuencias.

    0

    1

    2

    3

    4

    5

    0 10 20 30 40 50 60

    No. de automoviles

    No. de automoviles

  • EJERCICIO No.4

    Los siguientes son los nmeros de torsiones que se requirieron para cortar 12 barras

    de aleacin forjada: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 27. Determine:

    X = 23, 24, 26, 27, 29, 33, 34, 35, 38, 39, 48, 54. = 410

    A.- Media

    =

    = 34.1667

    R// El nmero de torsiones promedio fue de 34.17

    B.- Mediana

    Me = 33.5

    R// El nmero central de los datos anteriores es 33.50.

    C.- Rango

    Rango = 54 23 = 31

    R// Lo que indica que es menos homognea ya que sus datos estn dispersos en un

    mayor rango.

    EJERCICIO No.5

    Por un error, un profesor borr la calificacin obtenida por uno de diez alumnos. Si los

    otros nueve estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de

    las diez calificaciones es 67, Qu calificacin borr el profesor?

    R// la calificacin borrada por el profesor fue 65.

  • EJERCICIO No.6

    En los siguientes ejercicios, calcule el rango, el rango intercuartilico, la varianza y la

    desviacin estndar para los datos que se dan.

    A.- Los valores que se dan son pesos (en onzas) de carnes listadas en el men de un

    restaurante como cortes Porterhouse de 20 onzas (basados en datos recolectados

    por un estudiante).

    Rango:

    R// El Rango entre las onzas (peso de carne) es de 4onzas.

    Rango Intercuartilico:

    R// Las carnes que se venden, pueden ser 1.25 menores que 19.5 onzas (que es el valor

    medio de los datos), o 1.25 mayores que 19.5 onzas.

    Varianza:

    R// La variacin del los pesos en las carnes es de 1.168421053 onzas a partir del la

    mediana (19.5 onzas).

    Desviacin Estndar:

    R// La desviacin estndar como es menor nos indica que, los datos no estn tan

    dispersos. Que los pesos de las carnes estn muy cercanos unos a los otros, lo que

    quiere decir que las carnes estn en el rango para poder venderlas como de 20 onzas,

    aunque no lo sean.

    B.- Dgitos seleccionados en la lotera Maryland Pick Three:

    0 7 3 6 2 7 6 6 6 3 8 1 7 8 7

    1 6 8 6 9 5 2 1 5 0 3 9 9 0 7

    17 20 21 18 20 20 20 18 19 19

    20 19 21 20 18 20 20 19 18 19

  • Rango:

    R// El rango entre los dgitos seleccionados de la lotera ser de 9.

    Rango intercuartilico:

    R// los nmeros que pueden salir en la lotera estn entre el rango de 6, que es la

    mediana, (+-) 5, que es el rango intercuartilico.

    Varianza:

    R// La diferencia promedio que existe entre cada uno de los datos de la lotera y su

    media es de 4.9.

    Desviacin Estandar:

    R// la desviacin es menor eso quiere decir que los datos de la lotera no estn tan

    separados, son datos casi continuos.

    C.- Concentraciones de alcohol en la sangre de 15 conductores implicados en

    accidentes mortales y luego condenados a prisin (basados en datos del departamento

    de Justicia de Estados Unidos).

    0.27 0.17 0.17 0.16 0.13 0.24 0.29 0.24

    0.14 0.16 0.12 0.16 0.21 0.17 0.18 -----

    Rango:

    R// El nivel de alcohol en la sangre tiene un aumento de 0.17.

    Rango intercuartilico:

  • R// los niveles de alcohol pueden ser 0.100625 respecto a la media de los niveles de

    alcohol.

    Varianza:

    R// El nivel de alcohol puede variar 0.19 en cada valor.

    Desviacin Estandar:

    R// Los valores de de alcohol en la sangre estn casi unidos, lo que quiere decir que los

    conductores casi todos tienen el mismo estado de ebriedad.

    EJERCICIO No.7

    La concentracin de slidos suspendidos en agua de un ro es una caracterstica

    ambiental importante. Un artculo cientfico report sobre la concentracin (en partes

    por milln, o ppm) para varios ros diferentes. Supongamos que se obtuvieron las

    siguientes 50 observaciones para un ro en particular:

    55.8 60.9 37.0 91.3 65.8

    42.3 33.8 60.6 76.0 69.0

    45.9 39.1 35.5 56.0 44.6

    71.7 61.2 61.5 47.2 74.5

    83.2 40.0 31.7 36.7 62.3

    47.3 94.6 56.3 30.0 68.2

    75.3 71.4 65.2 52.6 58.2

    48.0 61.8 78.8 39.8 65.0

    60.7 77.1 59.1 49.5 69.3

    69.8 64.9 27.1 87.1 66.3

    A.- Calcule la media

    Media = 57.10

    R// con las observaciones se obtuvo que hay aproximadamente 57 ppm de slidos en

    el rio estudiado.

    B.- Calcule la varianza y la desviacin estndar.

  • Varianza = 15.83

    R// la cantidad de solido en el rio puede variar entre 58.93, que es la mediana.

    Desviacin = 15.99

    R// como la desviacin es muy grande nos quiere decir que los slidos en el rio varan

    mucho, pueden haber cantidades muy distintas en el rio.

    C.- Calcule e interprete el coeficiente de variacin a partir de una tabla de

    distribucin de frecuencias

    k= 1+3.333 log (50)=6.66

    k=7

    Amplitud (=94.6-27.1)/7 = 9.64

    a= 10

    clases F fa fr fr%

    limites

    reales Xi f*Xi

    27.1-36.1 5 5 0.1 10% 27.05-36.15 31.6 158

    36.2-45.2 7 12 0.14 14% 36.15-45.25 40.7 284.9

    45.3-54.3 6 18 0.12 12% 45.25-54.35 34.8 208.8

    54.4-63.4 12 30 0.24 24% 54.35-63.45 58.9 706.8

    63.5-72.5 11 41 0.22 22% 63.45-72.55 68 748

    72.6-81.6 5 46 0.1 10% 72.55-81.65 77.1 385.5

    81.7-90.7 2 48 0.04 4% 81.65-90.75 86.2 172.4

    90.8-99.8 2 50 0.04 4% 90.75-99.85 95.3 190.6

    50

    1 100%

    492.6 2855

    F Xi (Xi-X)^2 F(Xi-X)^2

    5 31.6 729 3645

    7 40.7 320.41 2242.87

    6 34.8 566.44 3398.64

    12 58.9 0.09 1.08

    11 68 88.36 971.96

    5 77.1 342.25 1711.25

    2 86.2 761.76 1523.52

    2 95.3 1346.89 2693.78

    12543.1

  • Coeficiente de variacin =27.73%

    R// Las tablas anteriores sirvieron para calcular el coeficiente de variacin = 27.73%

    que expresa la desviacin estndar como porcentaje de la media aritmtica,

    mostrando una mejor interpretacin porcentual del grado de variabilidad. En este caso

    EL 27.73% nos indica que tiene una dispersin mayor lo cual indica la alta frecuencia

    de slidos suspendidos en el agua del rio.

    EJERCICIO No.8

    Use los datos del ejercicio 7 (50 observaciones de un rio) calcule e intrprete lo

    siguiente:

    Intervalos F Fa Limites reales

    27.1-36.1 5 5 27.05-36.15

    36.2-45.2 7 12 36.15-45.25

    45.3-54.3 6 18 45.25-54.35

    54.4-63.4 12 30 54.35-63.45

    63.5-72.5 11 41 63.45-72.55

    72.6-81.6 5 46 72.55-81.65

    81.7-90.7 2 48 81.65-90.75

    90.8-99.8 2 50 90.75-99.85

    A.- Q1, Q2 y Q3

    Q1= 46.08

    R// Este representa el 25% de los datos agrupados. Quiere decir, que 25% de las

    observaciones es igual o menor a 46.08.

    Q2= 60.18

    R// Representa tambin a la media de los datos, el Q2 es el dato central de toda la

    distribucin. Un 50% de las observaciones es menor a 60.18 y el otro 50% es mayor al

    mismo.

    Q3= 70.27

    R// 75% de las observaciones es menor o igual a 70.27y un 25% es mayor o igual al

    mismo.

  • B.- P15, P20, P25

    P15=39.7

    R// El 15% de las observaciones es igual o menor a 39.7

    P20= 43.3

    R// El 20% de las observaciones es menor o igual a 43.3 de. Y el 80% restante es

    mayor o igual al mismo.

    P25= 46.08

    R// Un 25% de las observaciones es igual o menor a 46.08, el P25=Q1.

    EJERCICIO No.9

    Los siguientes son los nmeros de los minutos durante los cuales una persona debi

    esperar el autobs hacia su trabajo en 15 das laborales: 10, 1, 13, 9, 5, 2, 10, 3, 8, 6,

    17, 2, 10 y 15. Determine:

    K = 1 + 3.3 Log N = 4.78 ~ 5

    A = dato mayor dato menor = 3.2 ~ 4

    K

    Intervalos de clase f Limites reales Xi F*Xi fa

    1-4 4 0.5 4.5 2.5 10 4

    5-8 3 4.5 8.5 6.5 19.5 7

    9-12 4 8.5 12.5 10.5 42 11

    13-16 2 12.5 16.5 14.5 29 13

    17-20 1 16.5 20.5 18.5 18.5 14

    = 14 = 119

    A.- La media

    =

    R// El tiempo medio durante los cuales una persona debi esperar el autobs hacia su

    trabajo en 15 das laborales fue de 8.5 minutos

  • B.- La mediana

    =

    R// El valor que ocupa el lugar central de todos los datos es de 76.37

    C.- Graficar la informacin

    0

    0,5

    1

    1,5

    2

    2,5

    3

    3,5

    4

    4,5

    0.5 4.5 4.5 8.5 8.5 12.5 12.5 16.5 16.5 20.5

    Tiempo de espera de un autobus

    Tiempo de espera de un autobus

    0

    0,5

    1

    1,5

    2

    2,5

    3

    3,5

    4

    4,5

    0.5 4.5 4.5 8.5 8.5 12.5 12.5 16.5 16.5 20.5

    Tiempo de espera de un autobus

    Tiempo de espera de un autobus

  • 0

    2

    4

    6

    8

    10

    12

    14

    16

    0,5 4,5 8,5 12,5 16,5

    Tiempo de espera de un autobus

    Tiempo de espera de un autobus