Ejercicios de Estadistica Base de Datos Computacional

download Ejercicios de Estadistica Base de Datos Computacional

of 8

Transcript of Ejercicios de Estadistica Base de Datos Computacional

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    1/8

    GERENCIA DE INFRAESTRUCTURA

    Sub Gerencia de PreinversinMEJORAMIENTO DEL SERVICIO DE TRANSITABILIDAD EN LA AV. ARGENTINA, ENTRE JR.ALFONSO

    UGARTE Y AV. SAN MARTIN DE PORRES SECTOR 18 LA FLORIDA, PROVINCIA CAJAMARCACAJAMARCA

    Pg. 1

    TRABAJO GRUPAL

    EJERCICIOS DE BASE DE DATOS COMPUTACIONAL

    Universidad Nacional de CajamarcaNORTE DE LA UNIVERSIDAD PERUANA

    Fundada por Ley 14015 del 13 de febrero de 1962

    Escuela de Post GradoCAJAMARCA PER

    Cajamarca, Diciembre del 2015

    MENCION: ADMINISTRACIN Y GERENCIA PBLICA

    CURSO: ESTADSTICA APLICADA

    DOCENTE: MS. CS. LUIS A. ALCNTARA ZRATE

    MAESTRANTES:

    BALDERA FERNANDEZ MANUEL CABANILLAS CELIS ALARIO MEJA ANAYA, ADELMO PAREDES TORIBIO JOHAN RUIZ ALVAREZ, WLTER OMAR VELSQUEZ TERN, FREDDY OSCAR

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    2/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 2

    EJERCICIO I

    1. Construya histogramas y distribuciones de frecuencias relativas para el tamao promedio de

    pedidos por da (ventas totales divididas entre el total de pedidos) para los ltimos cuatro

    trimestres. En cada uno utilice anchos de intervalo de 20 y tome el primer intervalo de cero a20.

    Clase Frecuencia

    0-20 0

    21-40 0

    41-60 0

    61-80 8

    81-100 29

    101-120 76

    121-140 76141-160 38

    161-180 18

    181-200 6

    >200 2

    Total 253

    2. Construya diagramas parecidos, por trimestre, para el nmero total de pedidos por da. Utilice

    anchos de intervalo de 10 con el primer intervalo de 100 a 110.

    ClaseTrimestre

    Total1 2 3 4

    100-109 1 1 2

    110-119 1 2 3

    120-129 1 3 1 5

    130-139 2 3 2 7

    140-149 3 1 10 3 17

    150-159 9 7 17 13 46

    160-169 11 8 14 15 48170-179 14 17 11 9 51

    180-189 8 14 2 7 31

    190-200 5 10 1 9 25

    >200 7 6 5 18

    Total 62 64 63 64 253

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    3/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 3

    3. Qu patrones de cambio se hacen notorios en los datos de un trimestre a otro? Cul sera

    la explicacin posible de tal comportamiento?

    No hay diferencia significativa en frecuencia de los pedidos totales, en los diferentes

    trimestres.

    HH Industries mantiene una cartera de clientes uniforme.

    Sin embargo, tomando los patrones de frecuencia como patrones de comportamiento

    existen algunas ligeras diferencias entre los pedidos.

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    4/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 4

    EJERCICIO II

    1. Calcule la media, la mediana y la moda de los datos trimestrales con respecto al nmero

    y tamao promedio de los pedidos, tomando en cuenta los datos del ejercicio

    correspondiente del captulo 2. Los resultados hallados apoyan lo que Laurel encontrde manera intuitiva a partir de los histogramas? Qu medida de tendencia central parece

    ms apropiada en esta situacin? Calcule ahora las ventas totales de la compaa en

    dlares para los ltimos cuatro trimestres. Tiene razn Stan al afirmar que las ventas

    totales estn bien?

    Estadsticos

    Total Pedidos

    Tamao

    Prom.de

    pedidos/dia

    N Vlido 253 253

    Perdidos 0 0

    Media 169,18 125,10

    Mediana 169,00 123,00

    Moda 175 121a

    a. Existen mltiples modos. Se muestra el valor ms

    pequeo.

    Se observa que tiene una distribucin normal en los trimestres, ya que no hay una

    desviacin significativa entre media, mediana y moda; y esto tambin se observ en los

    histogramas anteriores.

    Resumen de ventas por trimestre:

    TrimVentas Totales

    $

    1 1 346 084

    2 1 368 181

    3 1 310 7884 1 327 508

    Total 5 352 561

    Aparentemente las ventas estn bien, ya que no se observa una variacin

    significativamente entre los trimestres, lo que nos indica que la empresa tiene una cartera

    de clientes bien definida y estable.

    2. Calcule la media del nmero de pedidos diarios y el tamao de stos para el centro de

    distribucin 3 (Pennsylvania) durante el periodo que abarca los ltimos cuatro trimestres.

    Este centro de distribucin muestra tendencias parecidas a las de la compaa en total?

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    5/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 5

    Los planes de Laurel de hacer una investigacin sobre el desempeo de cada centro de

    distribucin son una buena idea?

    Laurel encontr a Hal en su oficina el jueves ya tarde y le dio una breve descripcin desus hallazgos.

    Todo esto es muy interesanterespondi Hal. Me gustara saber qu opina el restode la directiva en la reunin del lunes. Crees que podrs montar una pequeaexposicin? Tendra que ser muy clara en cuanto a las conclusiones y no quedarse muchoen las estadsticas.Seguro acord Laurel. Todava quiero hacer algunas pruebas de variabilidad,luego ya estar en condiciones de armar todo el rompecabezas. Nos vemos el lunes.

    Estadsticos descriptivos

    N Media

    Pedidos 3 253 28,17

    T. Prom.de pedidos3/dia 253 88,09

    N vlido (por lista) 253

    Observamos que el centro de distribucin 3 no tiene una distribucin parecida al del totalde la compaa tal como se observa en los histogramas anteriores.

    Por lo tanto sera una mejor idea realizar una buena idea realizar los estudios y anlisispor cada centro de distribucin y no en total ya que nos puede conducir a un error mayor al tomar

    las decisiones.

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    6/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 6

    3. Determine los alcances intercuartiles del tamao promedio de los pedidos en cada

    trimestre. Comprelos con el alcance total en cada caso.

    Se pude determinar que los tamaos promedios de pedido/da son prcticamente

    homogneo en los 4 trimestres, pero en el segundo y cuarto trimestre existen casos

    atpicos que escapan a lo normal.

    4. Utilizando los datos sin procesar, calcule la varianza y la desviacin estndar de la

    muestra por cada trimestre, para el nmero de pedidos y el tamao promedio de stos.

    Calcule el coeficiente de variacin para cada trimestre.

    Cubos OLAP

    Variable VarianzaDesviacin

    estndarMedia

    Coficientede

    Variacin

    Total

    Total Pedidos 469,282 21,663 169,18 12,80Tamao Prom.de pedidos/dia 686,701 26,205 125,10 20,95

    Trimestre: 1Total Pedidos 548,391 23,418 171,26 13,67Tamao Prom.de pedidos/dia 702,786 26,510 126,03 21,03

    Trimestre: 2

    Total Pedidos 336,948 18,356 177,81 10,32Tamao Prom.de pedidos/dia 597,470 24,443 119,92 20,38

    Trimestre: 3Total Pedidos 281,340 16,773 155,83 10,76Tamao Prom.de pedidos/dia 774,442 27,829 133,90 20,78

    Trimestre: 4

    Total Pedidos 467,716 21,627 171,67 12,60Tamao Prom.de pedidos/dia 581,450 24,113 120,70 19,98

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    7/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 7

    5. a) Utilice el teorema de Chebyshev para determinar el alcance del nmero diario de

    pedidos y del tamao promedio de stos para el segundo trimestre de 1989 que incluir

    al menos 75% de los datos.

    VariableTotal

    Pedidos

    Tamao

    Prom.de

    pedidos/dia

    Media 177,8125 119,930856

    Error tpico 2,29451933 3,05440579

    Mediana 177 116,714873

    Moda 191 #N/A

    Desviacin estndar 18,3561546 24,4352463

    Varianza de la muestra 336,948413 597,081263Curtosis 2,75478188 1,17534596

    Cuenta 64 64

    Debemos determinar los lmites inferior y superior dentro de los cuales caera el nmerode pedidos y el tamao promedio de pedidos/dia (para lo cual aplicamos la reglaemprica): solo para el caso del 75% k=2

    + = 177.8 + 2(18.36) = 215

    = 177.8 2(18.36) = 141

    Aplicando el teorema de Chebyshev tenemos:

    () = 1 1

    (2) = 1 1

    2= 1

    1

    4=

    3

    4

    (2) = 0,75 75 %

    INCLUIR PEDIDOSTAMAO

    PROMEDIO/DIA

    LI LS LI LS

    K=1, AL MENOS 0% 159 196 95 144

    K=2 AL MENOS 75% 141 215 71 169

    K=3 AL MENOS EL 88.89% 123 233 47 193

    Interpretacin: Con una probabilidad del 75% los pedidos estarn en el rango de 141-

    215 y su tamao promedio en el rango 71 - 169.

  • 7/24/2019 Ejercicios de Estadistica Base de Datos Computacional

    8/8

    Estadstica Aplicada ADMINISTRACIN Y GERENCIA PBLICA UNC 2015

    Pg. 8

    b) Examine los histogramas representados grficamente en el ejercicio correspondientedel captulo 2 y comprelos con los alcances de Chebyshev calculados en el inciso a).Qu tan preciso es el teorema de Chebyshev para establecer el alcance en cada caso?

    Como se observa en el histograma del 2do Trimestre concuerda con laprobabilidad del 75% los pedidos estarn en el rango de 141-215 que se obtuvo

    en el ejercicio anterior lo que nos indica que el teorema es una opcin para realizar

    los anlisis.

    6. Considerando cada centro de distribucin por separado, calcule el coeficiente de variacin

    para el nmero de pedidos y el tamao promedio de stos en el periodo completo de doce

    meses. Existen diferencias significativas entre las dispersiones relativas experimentadas

    por cada centro de distribucin?

    Cubos OLAP

    Centro de Distribucin Varianza Desviacinestndar

    Media Coficiente deVariacin

    Pedidos 1 250,832 15,838 95,42 16,60T. Prom.de pedidos1/dia 1917,349 43,788 151,00 29,00

    Pedidos 2 99,346 9,967 45,59 21,86T. Prom.de pedidos2/dia 1107,438 33,278 88,29 37,69

    Pedidos 3 141,356 11,889 28,17 42,21T. Prom.de pedidos3/dia 1895,650 43,539 88,09 49,42

    Segn la informacin obtenida en cada centro de distribucin se observa que existen

    significativas respecto a Varianza, Desviacin Estndar, Media, y se tiene un alto

    coeficiente de variacin de cada centro.

    7. De qu manera presentara lo encontrado a la junta directiva? Qu recomendaciones

    podra hacer con respecto a las promociones, a las futuras recolecciones de datos,

    etctera?

    La presentacin sera mediante un informe tcnico detallado, pero realizara una

    exposicin que sera muy clara respecto a las conclusiones encontradas (respecto a

    las tendencias de los diferentes centros de distribucin) y no tener que detenerse en

    detallar las estadsticas que confundiran a la junta.

    Que los datos sean mucho ms especficos, ya que en la data indican trimestre, pero

    no se sabe a qu mes pertenece la informacin, incluso debera ser por da, para

    poder ms claro los gastos de almacn que se tendran que realizar por mes o

    temporada.