Manual 2014-I 03 Análisis Probabilístico (1351)

download Manual 2014-I 03 Análisis Probabilístico (1351)

of 108

Transcript of Manual 2014-I 03 Análisis Probabilístico (1351)

  • Anlisis Probabilstico

  • 2

    CARRERAS PROFESIONALES CIBERTEC

  • Anl is is Probabi l s t ico 3

    CIBERTEC CARRERAS PROFESIONALES

    NDICE

    Presentacin 5

    Red de contenidos 6

    UNIDAD DE APRENDIZAJE 1 Estadstica descriptiva

    La estadstica 10

    Poblacin y muestra 11

    Variables 11

    Tablas de distribucin de frecuencias 12

    Medidas de tendencia central 15

    Medidas de Posicin 18

    Medidas de dispersin 20

    Clculo de Estadsticos Descriptivos con Excel 21

    Ejercicios propuestos 26

    UNIDAD DE APRENDIZAJE 2 Probabilidades

    Anlisis combinatorio 44

    Permutaciones 44

    Combinaciones 44

    Probabilidad clsica 45

    Probabilidad condicional 46

    Ejercicios Propuestos 47

    Distribucin Binomial 56

    Distribucin de Poisson 58

    Relacin entre la Distribucin Binomial y la Distribucin Normal 59

    Distribucin normal 60

    Distribucin normal estndar 62

    Distribucin muestral de medias 63

    Distribucin muestral de proporciones 64

    Ejercicios Propuestos 65

    UNIDAD DE APRENDIZAJE 3 Anlisis de regresin y correlacin

    Anlisis de regresin 82

    Regresin lineal simple 83

    Mtodo de mnimos cuadrados 84

  • 4

    CARRERAS PROFESIONALES CIBERTEC

    Anlisis de correlacin 84

    Ejemplo de Aplicacin 85

    Anlisis de Regresin con Excel 87

    Ejercicios Propuestos 90

    Tabla de distribucin binomial 95

    Tabla de distribucin de Poisson 99

    Tabla de distribucin normal estndar 101

  • Anl is is Probabi l s t ico 5

    CIBERTEC CARRERAS PROFESIONALES

    Presentacin

    El avance de las Tecnologas de Informacin y Comunicacin (TICs) ha hecho que, en la

    actualidad, todo profesional est en constante contacto con informacin de naturaleza

    estadstica. Es ms, muchas veces es necesario que cualquier profesional de cualquier rea

    tenga que realizar alguna medicin estadstica para poder tener una idea acerca de la

    marcha de una empresa, o para tomar una decisin organizacional o, finalmente, para

    proyectar datos a futuro. El presente curso ofrece, al futuro profesional, las herramientas

    estadsticas necesarias para organizar, calcular, evaluar e interpretar informacin

    estadstica, haciendo nfasis en los fundamentos para realizar dichos procesos.

    As, se estudian los fundamentos tericos y prcticos de la Estadstica Descriptiva e

    Inferencial, haciendo nfasis en la lgica de sus diferentes mtodos y tcnicas de trabajo y

    los recursos de los que disponen para calcular y obtener las soluciones a los problemas

    planteados. Adems, se adquiere destreza en la interpretacin y manejo de las definiciones,

    teoremas y frmulas estadsticas.

    En la primera parte del curso, se exponen las herramientas metodolgicas para el anlisis

    de cuadros estadsticos. La segunda parte comprende la aplicacin de la teora de

    probabilidades y de los modelos de distribucin probabilstica. Finalmente, en la tercera

    etapa, se desarrollan modelos predictivos de regresin lineal simple que permiten contar con

    una herramienta, estadsticamente confiable, para la toma de decisiones.

    En las sesiones de clase, el curso se desarrolla en forma terico prctica; por lo que las

    mismas tendrn exposiciones dialogadas sobre los fundamentos de los temas que se

    tratarn y la resolucin de ejercicios, dndole mayor nfasis a esta ltima parte y al anlisis

    e interpretacin de resultados.

  • 6

    CARRERAS PROFESIONALES CIBERTEC

    Red de Contenidos

    Regresin

    Lineal SimpleCorrelacin

    ProbabilidadEstadstica

    Descriptiva

    Regresin y

    Correlacin

    Distribuciones

    de Probabilidad

    Probabilidades

    Probabilidad simple

    y condicional

    Muestras

    AnlisisTablas

    Tendencias

    Centrales

    Posicin y

    Dispersin

    Estadstica I

  • Anl is is Probabi l s t ico 7

    CIBERTEC CARRERAS PROFESIONALES

    La estadstica como ciencia nos proporciona un conjunto de

    mtodos, tcnicas o procedimientos para:

    1. RECOPILAR 2. ORGANIZAR

    3. PRESENTAR 4. ANALIZAR

    Un conjunto de datos con el fin de describirlos o de realizar

    generalizaciones vlidas con una medida de confiabilidad

    (probabilidad) para tomar decisiones.

  • 8

    CARRERAS PROFESIONALES CIBERTEC

  • Anl is is Probabi l s t ico 9

    CIBERTEC CARRERAS PROFESIONALES

    ESTADSTICA DESCRIPTIVA

    LOGRO DE LA UNIDAD DE APRENDIZAJE

    Al trmino de la unidad, el alumno, trabajando de manera individual, calcula e interpreta estadsticas de tendencia central, de posicin y de dispersin, sobre la base de un conjunto de datos no agrupados o agrupados en una Tabla de Distribucin de Frecuencias.

    TEMARIO

    La Estadstica

    Poblacin y muestra

    Variables y sus tipos

    Tablas de distribucin de frecuencias

    Medidas de tendencia central

    Medidas de posicin

    Medidas de dispersin

    ACTIVIDADES PROPUESTAS

    Los alumnos, trabajando de manera individual, construyen, calculan e interpretan tablas de distribuciones de frecuencias, medidas de tendencia central, medidas de posicin y medidas de dispersin, tanto para datos discretos como para datos continuos.

    UNIDAD DE APRENDIZAJE

    1

  • 10

    CARRERAS PROFESIONALES CIBERTEC

    1. LA ESTADSTICA

    La Estadstica es una ciencia, parte de la matemtica aplicada, que trata acerca de la recoleccin, organizacin, presentacin, anlisis e interpretacin de datos obtenidos en un estudio; con la finalidad de facilitar la toma de decisiones. La Estadstica se aplica a cualquier campo de la ciencia. Asimismo, se divide en dos grandes grupos de trabajo:

    Estadstica Descriptiva

    Estadstica Inferencial

    1.1. Estadstica Descriptiva Es la rama de la Estadstica que se dedica a establecer diferentes mtodos y procedimientos que permitan la recoleccin, organizacin, descripcin, visualizacin y resumen de un conjunto de datos. Los datos pueden ser resumidos numrica o grficamente.

    1.2. Estadstica Inferencial Es la rama de la Estadstica que proporciona tcnicas para estimar (predecir o hacer inferencia) alguna caracterstica de una poblacin a partir de los resultados obtenidos en una muestra. La inferencia estadstica siempre tiene cierto grado de incertidumbre.

    En el recuadro adjunto, proporcione tres ejemplos de aplicacin de la Estadstica Descriptiva y tres ejemplos de aplicacin de la Estadstica Inferencial.

  • Anl is is Probabi l s t ico 11

    CIBERTEC CARRERAS PROFESIONALES

    2. POBLACIN Y MUESTRA Definimos la POBLACIN o UNIVERSO de un proceso estadstico a la totalidad de

    elementos entre los cuales se presenta determinada caracterstica susceptible de ser estudiada. Estos elementos pueden ser personas, objetos, etc.

    Definimos la MUESTRA como una parte o un subconjunto de la poblacin que se est estudiando. Esta muestra se selecciona con el propsito de obtener informacin, acerca de toda la poblacin, utilizando tcnicas de inferencia estadstica.

    En el recuadro adjunto, proporcione tres ejemplos de poblacin con su respectiva muestra.

    3. VARIABLES Es todo valor o caracterstica (magnitud, nmero, vector, etc.) de un elemento que

    forma parte de la muestra y/o poblacin, que es susceptible de ser medido, utilizando algn instrumento de medicin. La determinacin de la(s) variables(s) contesta a la pregunta: QU ESTOY ESTUDIANDO?

    3.1. Variables cuantitativas Son aquellas variables que son susceptibles de ser representadas numricamente

    (indican cantidad).

    Las variables cuantitativas se denominan DISCRETAS cuando la cantidad de valores posibles que puede tomar la variable es finita; es decir, cuando estn formadas solamente por una parte entera.

    Las variables cuantitativas se denominan CONTINUAS cuando la cantidad de valores posibles que puede tomar la variable es infinita; es decir, cuando estn formadas por una parte entera y una parte decimal.

  • 12

    CARRERAS PROFESIONALES CIBERTEC

    3.2. Variables cualitativas Son aquellas variables que indican alguna cualidad, atributo o categora del

    elemento estudiado. Se caracterizan porque por s mismos no proporcionan valores numricos.

    Las variables cualitativas se denominan ORDINALES cuando los datos proporcionados por la variable son susceptibles de ser ordenados a travs de una jerarqua.

    Las variables cualitativas se denominan NOMINALES cuando no es posible ordenar los datos bajo una determinada regla.

    4. TABLAS DE DISTRIBUCIN DE FRECUENCIAS Cuando los datos son recolectados, estos se deben ordenar y clasificar. Para realizar

    esta tarea, los datos se pueden clasificar utilizando cuadros estadsticos y grficos estadsticos.

    Las Tablas de Distribucin de Frecuencias permiten la organizacin y presentacin de un conjunto de datos de acuerdo con la variable estudiada. Se utilizan principalmente cuando los datos son cualitativos o uno de los datos es cualitativo y el otro es cuantitativo.

    En estas tablas, el ordenamiento de los datos se realiza en funcin a algunos parmetros bsicos que forman parte del contenido. Estos parmetros son las Frecuencias Absolutas (fi); Frecuencias Absolutas Acumuladas (Fi); Frecuencias Relativas (hi) y Frecuencias Relativas Acumuladas (Hi).

  • Anl is is Probabi l s t ico 13

    CIBERTEC CARRERAS PROFESIONALES

    4.1. Tabla de Distribucin de Frecuencias para datos discretos

    Se utilizan cuando la variable es cuantitativa discreta. Se caracteriza porque no hay que formar intervalos (no es necesario agrupar los datos) EJEMPLO: A continuacin, se muestra el nmero de hijos de 36 familias de Lima:

    2 3 4 5 1 2 3 2 1

    0 2 1 5 3 1 2 3 2

    2 4 3 5 2 0 2 1 3

    1 1 4 2 3 4 5 1 0

    SOLUCIN: La variable de estudio (X) es el nmero de hijos de 36 familiares. Luego, construyendo la Tabla de Distribucin de Frecuencias, se tiene lo siguiente:

    X fi Fi hi Hi

    0 3 3 0,0833 0,0833

    1 8 11 0,2222 0,3055

    2 10 21 0,2778 0,5833

    3 7 28 0,1944 0,7777

    4 4 32 0,1111 0,8888

    5 4 36 0,1111 0,9999

    36

    1

    4.2. Tabla de Distribucin de Frecuencias para datos continuos

    Se utilizan cuando la variable es cuantitativa continua. Se caracteriza porque se requieren formar intervalos. Estas tablas introducen un nuevo parmetro denominado MARCA DE CLASE (mi) que permite agrupar los datos en intervalos.

    Para formar los intervalos, se sigue la Regla de Sturges:

    a) Determinar el nmero de intervalos (K): K 1 + 3.3Log(n)

    b) Hallar el rango (R) de los datos: R = Xmx - Xmn

    c) Determinar la amplitud (A) de los intervalos: A = R / K

    d) Construir los intervalos: Li Ls

    1er. Intervalo: Li : Xmin Ls : Xmin + A

    2do. Intervalo: Li : Xmin + A Ls : Xmin + 2A

  • 14

    CARRERAS PROFESIONALES CIBERTEC

    3er. Intervalo: Li : Xmin + 2A Ls : Xmin + 3A

    4to. Intervalo: Li : Xmin + 3A Ls : Xmin + 4A

    Y as, sucesivamente, hasta llegar al ltimo intervalo.

    e) Determinar la Marca de clase (mi) de cada intervalo: mi = (LI + LS)/2. La marca de clase es el valor representativo del intervalo (Valor medio).

    f) Hallar las frecuencias absolutas (fi) de cada intervalo, contabilizando el nmero de datos de la muestra que pertenecen a cada intervalo.

    g) Las frecuencias absolutas acumuladas (Fi), as como las frecuencias relativas (hi y Hi) se hallan de la misma forma que para una distribucin de frecuencias de variables cuantitativas discretas.

    EJEMPLO:

    Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen:

    33 50 61 69 80 35 52 64 71 81

    35 53 65 73 84 39 54 65 73 85

    41 55 65 74 85 41 55 66 74 88

    42 57 66 76 89 45 59 66 77 91

    47 48 60 68 78 97 60 67 77 94

    En el ejercicio, construir la tabla de frecuencias.

    SOLUCIN:

    Aplicando la Regla de Sturges, encontramos que K 6,61 K = 7 El rango de los datos est dado por R = 97 33 = 64 Luego, la amplitud de los intervalos est dado por A = (64/7) = 9,143 Finalmente, construyendo la Tabla de Distribucin de Frecuencias, se tiene lo siguiente:

    Intervalos mi fi Fi hi Hi

    [ 33 42,143 > 37,5715 7 7 0,14 0,14

    [ 42,143 51,286 > 46,7145 4 11 0,08 0,22

    [ 51,286 60,429 > 55,8575 9 20 0,18 0,40

    [ 60,429 69,572 > 65,0005 11 31 0,22 0,62

    [ 69,572 78,715 > 74,1435 9 40 0,18 0,80

    [ 78,715 87,858 > 83,2865 5 45 0,10 0,90

    [ 87,858 97 ] 92,4295 5 50 0,10 1

    Total 50 XXX 1 XXX

  • Anl is is Probabi l s t ico 15

    CIBERTEC CARRERAS PROFESIONALES

    4.3 Cmo interpretar los datos de una tabla?

    Cada uno de los datos de la tabla permite obtener cierta informacin, dependiendo de su ubicacin.

    De acuerdo a la tabla mostrada extraemos algunos datos que se pueden interpretar como ejemplo:

    f5: Existen 16 trabajadores cuyo sueldo est entre los 58 y 66 soles diarios

    f5: Existen 16 trabajadores cuyo sueldo promedio es de 62 soles diarios

    F3: Hay 7 trabajadores que tienen un sueldo promedio menor o igual a 46 soles

    F3: Existen 38 trabajadores cuyo sueldo es mayor a 46 soles en promedio

    h2: El 4,4% de los trabajadores tiene un sueldo promedio de 38 soles diarios

    h4: El 22,2% de los trabajadores tiene un sueldo que oscila entre 50 y 58 soles

    H6: El 91% de los trabajadores tiene un sueldo menor a 74 soles diarios

    H6: El 9% de los trabajadores gana de 74 soles diarios a ms.

    5. MEDIDAS DE TENDENCIA CENTRAL

    Los valores determinados como medidas de tendencia central son aquellos valores que se toman como referencia para sealar y/o analizar el comportamiento de un conjunto de datos. Estos valores tienen por objetivo reemplazar a todo un conjunto de datos dentro de los anlisis y clculos estadsticos. Los ms utilizados son la Media Aritmtica, la Mediana y la Moda

    5.1. Media Aritmtica Es la medida de tendencia central ms usada y la ms conocida. Se define como la suma de todas las observaciones (datos) dividida entre el nmero de observaciones. Constituye el valor representativo de los datos si es que entre ellas no hay valores extremos que influyen negativamente, sucediendo lo mismo si los datos son muy dispersos. En algunos casos, la Media Aritmtica o Promedio se suele interpretar como aquel valor que se atribuira a cada trmino, si la suma de

  • 16

    CARRERAS PROFESIONALES CIBERTEC

    todos los valores de las observaciones estuviera dividida en partes iguales entre todos los elementos de la muestra.

    El clculo de la Media Aritmtica se muestra en el siguiente cuadro:

    Para datos no agrupados (sin tabla)

    Para datos agrupados (en tablas)

    Discretos Continuos

    n

    xX

    i

    n

    f.xX

    ii

    ii h.xX

    n

    f.mX

    ii

    ii h.mX

    Donde: xi : Valor observado mi : Marca de clase fi : Frecuencia absoluta hi : Frecuencia relativa

    Adems, hay que tener en cuenta la siguiente propiedad de la Media Aritmtica: Cuando se tiene un conjunto p formado por r subconjuntos, los cuales tienen una media X1, X2, X3, ., Xr y una cantidad de elementos igual a n1, n2, n3, , nr respectivamente; entonces, la medida aritmtica de todo el conjunto p se puede calcular de la siguiente manera:

    r321

    rr332211p

    n...nnn

    nX...nXnXnXX

    5.2. Mediana Es el valor que divide a un conjunto de datos ordenados en dos partes iguales.

    Para datos no agrupados, el clculo de la mediana se realiza mediante la siguiente regla:

    Si el nmero de datos es impar, la mediana es el valor central del conjunto de datos.

    Si el nmero de datos es par, la mediana es el promedio aritmtico de los datos centrales.

    Para datos agrupados, el clculo de la Mediana se realiza de la siguiente manera:

    j

    1jjj

    f

    F2/nALMe

  • Anl is is Probabi l s t ico 17

    CIBERTEC CARRERAS PROFESIONALES

    Donde: Lj : Lmite inferior del intervalo que contiene a la mediana Fj : Frecuencia absoluta del intervalo que contiene a la mediana Fj-1 : Frecuencia absoluta acumulada del intervalo anterior al que

    contiene a la mediana Aj : Amplitud del intervalo que contiene a la mediana

    5.3. Moda Es el valor que ms se repite (ms frecuente) dentro de un conjunto de datos. La desventaja de la moda radica en que en un conjunto de datos puede existir ms de un valor que indique la moda.

    Para datos no agrupados, el clculo de la moda se realiza con un conteo de los datos y analizando cul de ellos es el que ms se repite (presenta una fi ms alta)

    Para datos agrupados, el clculo de la Moda se realiza de la siguiente manera:

    )ff()ff(

    ffALMo

    1jj1jj

    1jjjj

    Donde: Lj : Lmite inferior del intervalo modal fj : Frecuencia absoluta del intervalo modal

    fj 1 : Frecuencia absoluta del intervalo anterior al intervalo modal fj + 1 : Frecuencia absoluta del intervalo siguiente al intervalo modal

    EJEMPLO DE APLICACIN Los datos que a continuacin se muestran son las edades de las personas que han

    acudido a un policlnico solicitando exmenes de despistaje de cncer.

    63 89 36 49 56 64 59 35 78

    43 53 70 57 62 43 68 62 26

    64 72 52 51 62 60 71 61 55

    59 60 67 57 67 61 67 51 81

    53 64 76 44 73 56 62 63 60

    Construir la tabla de distribucin de frecuencias y calcular las medidas de tendencia

    central.

    SOLUCIN:

    Los datos requieren ser agrupados en una Tabla de Distribucin de Frecuencias. Escogemos una agrupacin en 8 intervalos iguales. Entonces, la siguiente tabla resultante es la siguiente:

  • 18

    CARRERAS PROFESIONALES CIBERTEC

    Intervalos mi fi Fi hi Hi

    [ 26 34 > 30 1 1 0,022 0,022

    [ 34 42 > 38 2 3 0,044 0,066

    [ 42 50 > 46 4 7 0,089 0,154

    [ 50 58 > 54 10 17 0,222 0,376

    [ 58 66 > 62 16 33 0,356 0,732

    [ 66 74 > 70 8 41 0,178 0,910

    [ 74 82 > 78 3 44 0,067 0,977

    [ 82 90 ] 86 1 45 0,022 1

    Total 45 1

    Luego, calculamos las medidas de tendencia central. a) Para el clculo de la Media Aritmtica, se tiene lo siguiente:

    044,60X

    45

    )1x86()3x78()8x70()16x62()10x54()4x46()2x38()1x30(X

    Este resultado indica que hay 60 personas en promedio que acuden a un policlnico solicitando exmenes de despistaje de cncer.

    b) Para la Mediana, observamos que sta se encuentra en el quinto intervalo, por lo que el clculo es el siguiente:

    750,6016

    172/45858Me

    Este resultado indica que el 50% de las personas acuden a solicitar exmenes de despistaje de cncer es de 60,7 a menos.

    c) Para la Moda, observamos que esta se encuentra en el quinto intervalo, por lo que

    el clculo es el siguiente:

    429,61)816()1016(

    1016858Mo

    Este resultado indica que la frecuencia con que ms solicitan exmenes de despistaje de cncer es 61 personas.

    6. MEDIDAS DE POSICIN

    Se denomina PERCENTIL k (k = 1,2,3,...,99) a la medida de posicin que determina un valor numrico que denotaremos por Pk, que deja por debajo de s el k por 100 de los datos ordenados. As, el percentil 25 (P25) deja por debajo de s el 25% de datos de la serie que se trate; el percentil 50 (P50) deja por debajo de s el 50% de datos; el percentil 85 (P85) deja por debajo de s el 85% de datos de la serie que se trate o que es lo mismo, deja por encima el 15% de los datos de la serie.

  • Anl is is Probabi l s t ico 19

    CIBERTEC CARRERAS PROFESIONALES

    El clculo de percentil se realiza por interpolacin de la siguiente manera:

    j

    1j

    PkKf

    F100

    knALP

    Donde: LPk : Lmite inferior del intervalo que contiene a Pk fi : Frecuencia absoluta del intervalo que contiene a Pk Fi-1 : Frecuencia acumulada absoluta del intervalo inmediatamente anterior

    al intervalo que contiene a Pk A : Amplitud del intervalo

    Se denomina CUARTIL a cada uno de los tres percentiles P25, P50, P75. El cuartil uno (denotado por Q1) es igual a P25; el cuartil dos (denotado por Q2) es igual al percentil P50 (que es la mediana); y el cuartil tres (denotado por Q3) es igual al percentil P75.

    Se denomina DECIL a cada uno de los nueve percentiles P10, P20, P30, P40, P50, P60, P70, P80, P90 que dividen a todo el conjunto de datos en 10 partes iguales.

    EJEMPLO DE CLCULO DE PERCENTIL Para los 45 ingresos (en dlares) quincenales por horas extras tabulados en la

    distribucin de frecuencias de 8 intervalos, los datos recopilados fueron los siguientes:

    63 89 36 49 56 64 59 35 78

    43 53 70 57 62 43 68 62 26

    64 72 52 51 62 60 71 61 55

    59 60 67 57 67 61 67 51 81

    53 64 76 44 73 56 62 63 60

    Calcule los siguientes percentiles: P10, P25, P50, P75 y P90. SOLUCIN: En este caso, primero vamos a construir la tabla de distribucin de frecuencias y luego calcularemos los percentiles solicitados La Tabla de Distribucin de Frecuencias resultante es la siguiente:

    Intervalos mi fi Fi hi Hi

    [ 26 34 > 30 1 1 0,022 0,022

    [ 34 42 > 38 2 3 0,044 0,066

    [ 42 50 > 46 4 7 0,089 0,154

    [ 50 58 > 54 10 17 0,222 0,376

    [ 58 66 > 62 16 33 0,356 0,732

    [ 66 74 > 70 8 41 0,178 0,910

    [ 74 82 > 78 3 44 0,067 0,977

    [ 82 90 ] 86 1 45 0,022 1

    Total 45 ---- 1 ----

  • 20

    CARRERAS PROFESIONALES CIBERTEC

    Luego, calculamos los percentiles solicitados:

    a)

    45

    4

    3100

    1045842P10

    Este resultado indica que hay un 10% de personas que perciben un ingreso quincenal por horas extras de 45 dlares o menos.

    b)

    4,53

    10

    7100

    2545850P25

    Este resultado indica que hay un 25% de personas que perciben un ingreso quincenal por horas extras de hasta 53,4 dlares

    c)

    75,60

    16

    17100

    5045858P50

    Este resultado indica que hay un 50% de personas que perciben un ingreso quincenal por horas extras de 0,75 dlares o menos.

    d)

    75,66

    8

    33100

    7545866P75

    Este resultado indica que hay un 75% de personas que perciben un ingreso quincenal por horas extras de 66,75 dlares o menos. Tambin puede indicar que hay un 25% de personas que ganan ms de 66,75 dlares por ingresos quincenales en horas extras.

    e)

    5,73

    8

    33100

    9045866P90

    Este resultado indica que hay un 90% de personas que perciben un ingreso quincenal por horas extras de 73,5 dlares o menos. Tambin puede indicar que hay un 10% de personas que ganan ms de 73,5 dlares por ingresos quincenales en horas extras.

    7. MEDIDAS DE DISPERSIN O VARIABILIDAD Son aquellas medidas que se utilizan para analizar el grado de heterogeneidad de un

    conjunto de datos. El grado de variabilidad de la informacin disponible es muy importante en todo anlisis estadstico, pues de esto depende el grado de confiabilidad de las estimaciones que se puedan establecer.

  • Anl is is Probabi l s t ico 21

    CIBERTEC CARRERAS PROFESIONALES

    Las medidas de variabilidad que estudiaremos son la varianza o variancia, la desviacin estndar y el coeficiente de variacin.

    Cabe mencionar que para comparar la dispersin de dos conjuntos de datos es

    preferible utilizar el coeficiente de variacin.

    7.1. Varianza o Variancia

    Es una medida de dispersin que se define como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media. La varianza se calcula de acuerdo con la siguiente tabla:

    Para datos no agrupados (sin tablas)

    Para datos agrupados (en tablas)

    Discretos Continuos

    Donde: n* = n 1 si se trata de una muestra (n: tamao de la muestra) n* = n si se trata de una poblacin (n: tamao de la poblacin)

    7.2. Desviacin Estndar

    Es la medida de dispersin ms utilizada en Estadstica Descriptiva, ya que para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin respecto de la media aritmtica de dicha distribucin.

    La Desviacin Estndar es una medida de dispersin que nos indica cunto tienden a alejarse los valores concretos del promedio de una distribucin, es decir, la Desviacin Estndar de un conjunto de datos es una medida de cunto se desvan los datos con respecto a su media.

    La Desviacin Estndar se calcula como la raz cuadrada de la varianza.

    7.3. Coeficiente de Variacin Es una medida de dispersin til para comparar dispersiones que se encuentran

    en distintas distribuciones, pues es una medida invariante ante cambios de escala.

    El Coeficiente de Variacin siempre es menor que 1 pero mayor que 0 y se suele expresarse como porcentaje.

    Para calcular el Coeficiente de Variacin, se emplea la siguiente frmula:

    *n

    XnXV

    22

    i

    *n

    Xnf.XV

    2

    i

    2

    i

    *n

    Xnf.mV

    2

    i

    2

    i

    VS

    100xX

    SCV

  • 22

    CARRERAS PROFESIONALES CIBERTEC

    EJEMPLO DE CLCULO DE DISPERSIN

    Si en una empresa A de 100 trabajadores el sueldo promedio es 500 soles, con una varianza de 900 soles, y en la empresa B el coeficiente de variacin de los sueldos es del 5.6%, qu podra afirmar acerca de la dispersin de los sueldos de las empresas A y B?

    SOLUCIN: Como se trata de dos poblaciones diferentes, entonces requerimos el coeficiente de variacin para poder compararlas.

    Para la empresa A: 30S 900 V 500X

    Entonces: %6100x500

    30CV

    Para la empresa B: %6,5CV

    Por lo tanto, podemos afirmar que, en la empresa A, los sueldos son ms dispersos que en la empresa B. Igualmente, podemos afirmar que en la empresa B los sueldos son ms homogneos que en la empresa A.

    8. DIAGRAMAS BOXPLOT (DIAGRAMAS DE CAJA)

    El nombre original del grfico introducido por Jhon Tukey en 1977 es Box and whisker plot, es decir, diagrama de caja y bigote. Esta grfica consiste en un rectngulo (caja) de cuyos lados superior e inferior se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes). La caja y los bigotes estn ubicados paralelos a un eje rotulado. Para conocer las partes de un diagrama boxplot consideremos la grfica siguiente, la cual muestra la opinin de los estudiantes que llenaron el instrumento de opinin.

  • Anl is is Probabi l s t ico 23

    CIBERTEC CARRERAS PROFESIONALES

    1. Lmite superior: Es el extremo superior del bigote. Las opiniones por encima de

    este lmite se consideran atpicas. 2. Tercer cuartil (Q3): Es el percentil 75. Por debajo de este valor se encentran como

    mximo el 75% de las opiniones de los estudiantes. 3. Mediana: Coincide con el segundo cuartil. Divide a la distribucin en dos partes

    iguales. De este modo, 50% de las observaciones estn por debajo de la mediana y 50% est por encima (es el percentil 50).

    4. Primer cuartil (Q1): Es el percentil 25. Por debajo de este valor se encuentra como mximo el 25% de las opiniones de los estudiantes.

    5. Lmite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor se consideran atpicas.

    6. Valores atpicos: Opiniones que estn apartadas del cuerpo principal de datos. Pueden representar efectos de causas extraas, opiniones extremas o en el caso de la tabulacin manual, errores de medicin o registro.

    Se colocan en la grfica con asteriscos (*) o puntos (.) segn se alejan menos o ms del conjunto de datos.

    7. Media aritmtica: Originalmente no forma parte del boxplot, sin embargo, se suele considerar su inclusin para dar una idea del valor general representativo.

    Para la determinacin de los valores caractersticos del diagrama, se deben tomar las siguientes consideraciones:

    Rango Intercuartlico = Q3 Q1 Lmite interior inferior = Lmite del bigote inferior = Q1 - 1,5RI Lmite interior superior = Lmite del bigote superior = Q3 + 1,5RI Lmite exterior inferior = Q1 - 3RI Lmite exterior superior = Q3 + 3RI

    Los lmites interiores son barreras hasta las cuales se permiten datos de la muestra (en la grfica son los puntos 1 y 5), por estar muy cerca del resto. Estos son los lmites que definen los extremos de los bigotes. De sobrepasar esta barrera se le considera valor atpico. Los lmites exteriores indican cundo un dato se aleja en exceso del resto y, siendo tambin atpico, se le considera fuera del lmite exterior permitido y se dice que es an ms atpico.

  • 24

    CARRERAS PROFESIONALES CIBERTEC

    Para la interpretacin de los diagramas boxplot se deben tener las siguientes consideraciones: - Mientras ms larga la caja y los bigotes, ms dispersa es la distribucin de datos. - La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media

    aritmtica) puede variar, sin embargo, hay que recordar que la cantidad de elementos entre una y otra es aproximadamente la misma. Entre el lmite inferior y Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de sta a Q3 y de Q3 al lmite superior. Se considera aproximado porque pudiera haber valores atpicos, en cuyo caso la cantidad de elementos se ve levemente modificada.

    - La lnea que representa la mediana indica la simetra. Si est relativamente en el centro de la caja la distribucin es simtrica. Si por el contrario se acerca al primer o tercer cuartil, la distribucin pudiera ser sesgada a la derecha (asimtrica positiva) o sesgada a la izquierda (asimtrica negativa respectivamente. Esto suele suceder cuando las opiniones de los estudiantes tienden a concentrase ms hacia un punto de la escala.

    - La mediana puede inclusive coincidir con los cuartiles o con los lmites de los bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto. Pudiera ser este un caso particular de una distribucin sesgada o el caso de una distribucin muy homognea.

    Finalmente, consideremos el siguiente ejemplo: La siguiente tabla muestra los resultados de un ensayo clnico en dos grupos de pacientes: grupo de tratamiento y grupo de control. Estos datos constituyen los niveles de concentracin de medicamente segn sexo, concentracin inicial del medicamento y concentracin final.

  • Anl is is Probabi l s t ico 25

    CIBERTEC CARRERAS PROFESIONALES

    En esta primera grfica observamos los valores iniciales de concentracin de medicamento en los dos grupos de estudio. De esta grfica podemos sealar que las dos distribuciones son similares aunque, debido a que la caja de control es ms pequea, podemos afirmar que los datos del grupo de control estn ms concentrados, mientras que en el grupo de tratamiento los datos son ms dispersos; adems de que en el grupo de control se identific un dato atpico.

    En la segunda grfica observamos los valores iniciales de concentracin de medicamento en los dos grupos de estudio pero desagregado por sexo. De esta grfica podemos sealar que en el grupo de control las mujeres presentan una mayor dispersin que los hombres. Tambin se observa que tanto en hombres como en mujeres, la distribucin es ms simtrica en el grupo de control. Adems se identificaron tres casos extremos: en el grupo control se encontraron dos datos atpicos para el caso de los hombres y en el grupo de tratamiento se encontr un dato atpico para el caso de las mujeres.

  • 26

    CARRERAS PROFESIONALES CIBERTEC

    En la tercera grfica observamos los valores de concentracin de medicamento en cada grupo de estudio pero desagregado por niveles inicial y final. De esta grfica podemos sealar que el grupo de control tiene una distribucin ms asimtrica que el grupo de tratamiento en ambas fases del estudio (inicial y final). Tambin se puede observar que en el grupo de control se aprecia cierta evolucin en la concentracin del medicamento, pero la evolucin es mayor en el grupo de tratamiento. Adems se identificaron tres casos extremos: en el grupo control se encontr un dato atpico para el caso de la fase inicial y en el grupo de tratamiento se encontr dos datos atpicos para el caso de la fase final.

    En la cuarta y ltima grfica observamos los valores de concentracin de medicamento en cada grupo y fase pero dividido por gnero (hombres y mujeres). De esta grfica podemos sealar que en los hombres la dispersin ha aumentado en el grupo de control, mientras que en el grupo de tratamiento ha disminuido desde la fase inicial hacia la fase final del estudio; sin embargo en el grupo de las mujeres la dispersin ha disminuido en el grupo de control, mientras que en el grupo de tratamiento ha variado ligeramente. Tambin se puede observar que comparativamente entre la fase inicial y la fase final, la simetra se ha mantenido solamente en el grupo de control de las mujeres, mientras que en el grupo de control de los hombres la distribucin se ha vuelto ms asimtrica al igual que en el grupo de tratamiento de las mujeres.

  • Anl is is Probabi l s t ico 27

    CIBERTEC CARRERAS PROFESIONALES

    9. CLCULO DE ESTADSTICOS DESCRIPTIVOS CON EXCEL

    En el software Microsoft Excel se tienen herramientas para poder calcular todos los estadsticos estudiados. Aqu mostraremos un conjunto de pantallas con su respectiva explicacin, que permitir mostrar cmo se realiza este proceso.

    En la pantalla mostrada se aprecia un conjunto de datos clasificados en 4 variables.

    El primer paso que se debe realizar es activar la opcin de anlisis de datos en Excel ya que al momento de la instalacin esta opcin no aparece habilitada. Este proceso se realiza en la pestaa Archivo del men principal.

    Men Archivo Variables Datos

  • 28

    CARRERAS PROFESIONALES CIBERTEC

    Cuando seleccionamos el men archivo, nos aparecer la siguiente pantalla. Luego nos dirigimos a la pestaa Opciones

    Pestaa Opciones Seguidamente se abrir la pantalla de Opciones de Excel en donde seleccionaremos la opcin Complementos Herramientas para Anlisis y Complementos de Excel. Luego nos dirigimos a la opcin Ir y nos aparecer un panel. 1 2 3 4

  • Anl is is Probabi l s t ico 29

    CIBERTEC CARRERAS PROFESIONALES

    En ese panel seleccionamos la opcin Herramientas para anlisis y nos dirigimos a Aceptar.

    1 2 Cuando aceptamos esta configuracin, regresamos a la pantalla principal de Excel y nos debe aparecer, en el men de Datos la herramienta Anlisis de Datos. Seleccionamos esta opcin y en la pantalla que se apertura elegimos la opcin de Estadstica Descriptiva. 1 2 3 4

  • 30

    CARRERAS PROFESIONALES CIBERTEC

    En la pantalla de Estadstica Descriptiva seleccionamos el rango de datos que queremos analizar, luego elegimos la opcin Resumen de estadsticas,

    1 3 2 Finalmente, obtendremos los resultados de los estadsticos descriptivos para cada una de las variables analizadas.

    Queda como ejercicio para cada alumno investigar con mayor detalle, el significado de los estadsticos: Error tpico, Curtosis y Coeficiente de Asimetra.

  • Anl is is Probabi l s t ico 31

    CIBERTEC CARRERAS PROFESIONALES

    Actividades propuestas

    A.- Conceptos bsicos de estadstica 1. Ud. es el encargado de realizar un estudio de mercado para la empresa de

    comercializacin de zapatos para bebe PUJLLAY SAC en la ciudad de TOWN CENTER para conocer las preferencias en el calzado de bebe de la poblacin, as como el precio que estaran dispuestos a pagar por el producto. Para el efecto, Usted tom una muestra aleatoria de 800 mujeres con hijos menores de 3 aos en diferentes distritos de la ciudad y aplic una encuesta de opinin. Algunos de los resultados que se obtuvieron son los siguientes: a) El 75% de los encuestados prefiere adquirir zapatillas para beb. b) Los encuestados, en promedio, pueden pagar 47 soles por un calzado para beb. c) El color que ms prefieren los encuestados para el calzado de bebe es el blanco. d) Al menos un tercio de las encuestadas compra zapatos de bebe dos veces al ao. De acuerdo al enunciado identifique la poblacin, la muestra, las variables y sus respectivos tipos.

    2. La empresa de estudios de mercado BestDate SAC se encarg de realizar un estudio

    sobre las preferencias de los adolescentes del Cono Norte de Lima acerca de sus preferencias musicales y el tiempo que dedican a escuchar radio. Para el estudio se aplic una encuesta a 500 adolescentes y se obtuvo lo siguiente: a) EL 30% de los encuestados prefiere escuchar el gnero Salsa y el 35% prefiere

    escuchar Reguetn. b) El 50% de los encuestados escucha radio por lo menos 1 hora al da. Determine la poblacin y la muestra e identifique las variables de estudio.

    3. Se realiz un estudio para establecer las posibilidades que tena el candidato X de ganar las elecciones municipales en el distrito A. Se encuestaron a 200 personas y se obtuvo lo siguiente: a) El 40% de los habitantes del distrito X no ha decidido an su voto. b) El 23,5% indic que votara por el candidato X. c) El principal problema a resolver por el nuevo alcalde es el de la delincuencia, tal como lo

    indicaron el 75% de los encuestados. d) El 25% de los habitantes del distrito vive hace ms de 5 aos en dicha zona. Determinar: la poblacin, la muestra, las variables y los tipos de variables.

    4. Una popular cadena de comida peruana Pacha Mama ubicada en 10 estados del sur de Estados Unidos, con un total de 356 establecimientos; recientemente ha experimentado un marcado cambio en sus ventas, como consecuencia de una campaa publicitaria bastante exitosa. Para saber con certeza cul de los cambios realizados influyen en los incrementos de sus ventas, contrata los servicios de una empresa de estudios de mercado que toma una muestra de 60 establecimientos y encuentra los siguientes resultados: - El 98.5% asegura que la sazn del pukapicante ha mejorado. - El 60% afirma que la atencin es ms rpida en el pedido de los juanes. - El 95% cambi la entrada por ceviche. - Al 5% no le agrada los picantes mexicanos. - El 100% consume picantes peruanos. - El 96% de las personas consume lomo saltado a pesar que su precio se increment

    en $5.00. - El promedio de consumo personal en estos establecimientos fue de $82.00.

  • 32

    CARRERAS PROFESIONALES CIBERTEC

    De acuerdo a los datos anteriores determine la poblacin, la muestra y las variables con sus respectivos tipos y adems indique el tipo de estimacin utilizada.

    5. Aceros Arequipa ha estado buscando los factores que influyen en las ventas de varas

    de acero (en millones de toneladas) que realiza en la ciudad de Lima. Tomo una muestra de 300 establecimientos en diferentes partes de Lima y Callao y despus de realizar un estudio de mercado, la administracin de la empresa obtuvo los siguientes resultados: - Del total de encuestados el 27% dejo de comprar dicho producto. - El 90% de encuestados afirman que el producto mantiene su calidad. - El 32% no consume solamente el producto. - El 56% afirma que el producto se encuentra escaso en el mercado, y de los que

    afirman esto el 84% compran otro producto. - El 95% de los consumidores paga por las varillas de pulgadas entre $ 6.20 y $

    7.05 dlares. - Adems se encontr que el precio fijado en la ciudad de Lima de $ 6.10 no se

    respeta, y por esta razn, existe un desabastecimiento del 90% en la ciudad del Callao.

    De acuerdo a los datos anteriores determine la poblacin, la muestra y las variables con sus respectivos tipos y adems indique el tipo de estimacin utilizada.

    6. Una empresa dedicada a la fabricacin de conservas de pescado tiene planeado

    introducir al mercado conservas de trucha. Para ello, le encarg a una empresa investigadora de mercado la realizacin de un estudio mediante el que le interesaba averiguar, entre otras cosas, la aceptacin del nuevo producto y el precio que las personas estaran dispuestas a pagar. La encuesta fue realizada en Lima y se entrevistaron a 250 personas. De los encuestados, el 67% estaran dispuestos a consumir el nuevo producto. Adems, se concluy que el precio del producto debera oscilar entre S/. 3,50 y S/. 5,50. Determine lo siguiente: 1.1. La poblacin y la muestra del estudio. 1.2. Las variables y sus respectivos tipos.

    7. Un empresario tiene la idea de implementar la venta de chicha morada en envase no retornable. Piensa, en un principio que debe analizar la posibilidad de lanzar su producto en lugares que sean clidos durante gran parte del ao. Para ello, realiza un estudio de factibilidad en Piura e Iquitos. En Piura, el 90% de los 250 encuestados est dispuesto a consumir el nuevo producto. En cambio, en Iquitos, el 85% de los 300 encuestados muestra esta disposicin. Tambin, obtuvo informacin acerca de la utilidad que conseguira. En Piura, lograra un promedio de S/. 1,5 de utilidad por producto y; en Iquitos, un promedio de S/. 2. Determine lo siguiente: a) La poblacin y la muestra del estudio. b) Las variables y sus respectivos tipos. c) Si tuviese que elegir entre una de las dos ciudades para llevar a cabo su proyecto,

    cul debera elegir? Justifique.

    8. La empresa XYZ realiz un estudio en la ciudad de Lima sobre las principales marcas de cerveza vendidas por el consorcio ABC, compuesto por los supermercados S y W. El estudio se realiz en Julio del 2012 y se entrevistaron a un total de 1200 consumidores elegidos al azar, 500 en el supermercado S y 700 en el supermercado W. Algunas de las informaciones se proporcionan a continuacin:

    Las marcas de cerveza que se vendieron en el mes de agosto en estos supermercados fueron Cristal, Pilsen, Cuzquea, y Bremen.

    El 30% de los consumidores son de condicin media alta.

    Tres personas que consumen no tienen preferencia por una marca en particular.

    El 10% consume slo la marca Bremen.

    El 15% de los que prefieren Pilsen viven en el Callao o en zonas aledaas.

    El 45% afirm no tener problemas en consumir cualquier marca de cerveza.

  • Anl is is Probabi l s t ico 33

    CIBERTEC CARRERAS PROFESIONALES

    Uno de los entrevistados pertenece a la clase media baja y prefiere cerveza en lata.

    Doscientos consumidores del mercado S y 80 del supermercado W afirmaron que la cerveza en lata presenta mejor sabor que en Six pack y que en envase retornable.

    Uno de los objetivos del estudio era estimar la verdadera cantidad de dinero promedio que los consumidores gastan mensualmente en cerveza.

    De acuerdo con el enunciado identifique la poblacin, la muestra del estudio y las variables del estudio con su respectiva tipificacin. Adems indiqu qu otro tem se podra considerar como consulta a los entrevistados para mejorar el estudio.

    9. La empresa XXX produce, entre otros productos, aceites y mantequilla para consumo

    humano. Dicha empresa encarg realizar un estudio sobre las preferencias de las personas de clase media de la ciudad de Lima acerca de dichos productos. Para el estudio se tom una muestra aleatoria de 600 personas, y se obtuvo lo siguiente: 9.1. El 35% de los encuestados prefiere los productos diet. 9.2. El 55% de los encuestados prefera los aceites vegetales. 9.3. El 13% de los encuestados no supo diferenciar la mantequilla de la margarina. 9.4. Una persona dijo que no consuma ningn tipo de mantequilla. De acuerdo con el enunciado identifique la poblacin, la muestra del estudio y las variables del estudio con su respectiva tipificacin. Adems indiqu qu otro tem se podra considerar como consulta a los entrevistados para mejorar el estudio.

    10. Se realiz un estudio en el distrito XXX donde el principal objetivo era establecer la

    viabilidad de emprender un negocio de alquiler de computadoras. Era importante determinar si los habitantes del distrito posean computadoras personales en casa o utilizaban las cabinas de Internet. El estudio arroj, entre otros resultados, lo siguiente: a) El 80% de los 400 encuestados no poseen computadoras personales. b) El 20% afirm que le interesara alquilar por das alguna computadora personal. c) El 35% de los habitantes del distrito XXX tienen conocimientos de Microsoft Office. De acuerdo con el enunciado identifique la poblacin, la muestra del estudio y las variables del estudio con su respectiva tipificacin. Adems indiqu qu otro tem se podra considerar como consulta a los entrevistados para mejorar el estudio.

    11. Una empresa realiza una encuesta sobre el uso de cajeros automticos en un distrito con una poblacin de 50000 personas. De las 1200 personas encuestadas se tiene la siguiente informacin: a) El 60% de los habitantes del distrito usa la red de cajeros Unibanca. b) La edad promedio de los encuestados fue 38 aos. c) El 72% de los usuarios afirm que nicamente los utiliza para retirar dinero. d) El 5% de los encuestados afirm haber sido asaltado al utilizar el cajero. De acuerdo con el enunciado identifique la poblacin, la muestra del estudio y las variables del estudio con su respectiva tipificacin.

    12. Se realiz un estudio para establecer las posibilidades que tena el candidato X de ganar las

    elecciones municipales en el distrito A. Se encuestaron a 200 personas y se obtuvo lo siguiente: a) El 40% de los habitantes del distrito X no ha decidido an su voto. b) El 23,5% indic que votara por el candidato X. c) El principal problema a resolver por el nuevo alcalde es el de la delincuencia, tal como lo

    indicaron el 75% de los encuestados. d) El 25% de los habitantes del distrito vive hace ms de 5 aos en dicha zona. De acuerdo con el enunciado identifique la poblacin, la muestra del estudio y las variables del estudio con su respectiva tipificacin.

  • 34

    CARRERAS PROFESIONALES CIBERTEC

    B.- Construccin de Tablas de Frecuencia

    1. A continuacin se muestra el nmero de artculos defectuosos producidos durante los 30 das de un mes por una fbrica:

    2 4 3 1 2 0 4 3 1 2

    1 2 3 0 2 0 1 2 3 2

    1 2 3 2 1 2 2 4 3 2

    Construya el cuadro de distribucin de frecuencias correspondiente. 2. El peso en gramos de 30 objetos de un mismo tipo son los siguientes:

    21,3 15,8 18,4 22,7 19,6 15,8 26,4 17,3 11,2 23,9

    26,8 22.7 18,0 20,5 11,0 18,5 23,0 24,6 20,1 16,2

    18,3 21,9 12,3 22,3 13,4 17,9 12,2 13,4 15,1 19,1

    Construye una distribucin de frecuencias de 6 intervalos de clase.

    3. En una compaa el sueldo mnimo de 200 empleados es de $ 150. Si se sabe que 20

    empleados ganan al menos $150, pero menos de $180, 60 ganan menos de $210, 110 gana menos de $240, 180 ganan menos de $270 y el 10% restante de empleados ganan a lo ms $300; reconstruir la distribucin y graficar su polgono de frecuencias.

    4. El consumo mensual de agua (en metros cbicos) de ochenta familias, se tabul en una

    distribucin de frecuencias simtricas de 7 intervalos de amplitud iguales a 3, siendo las marcas de clase del cuarto intervalo igual 19. Si las frecuencias del primer y tercer intervalo son iguales al 5% y 15% del total respectivamente, y adems, la quinta frecuencia porcentual acumulada es 85% del total. Reconstruya la distribucin.

    5. Los puntajes de una prueba de aptitud se tabularon en una distribucin de frecuencias de 6 intervalos de igual amplitud. Se tienen las marcas de clase: m2 = 40 y m4 = 80. Adems, las frecuencias obtenidas fueron: h1 = h6 ; h3 = h5 ; h4 = 0,25; h2 = h4 - h1 ; h3 = h1 +0,10 y F6 = 60. Complete la distribucin de frecuencias.

    6. Los datos que se muestran a continuacin corresponden a las edades de 50 beneficiarios de un programa de asistencia social del gobierno:

    81 53 67 60 80 64 56 54 91 61

    66 88 67 65 97 72 74 65 73 69

    43 54 76 70 86 68 82 75 79 60

    41 87 76 97 70 45 60 45 65 56

    92 72 82 80 52 65 50 58 70 76

    Construir una tabla de distribucin de frecuencias.

    7. En una compaa, el sueldo mnimo de 200 empleados es de $ 150. Si se sabe que 20

    empleados ganan al menos 150$, pero menos de $ 180; 60 ganan menos de 210$; 110 gana menos de $240; 180 ganan menos de $270; y el 10% restante de empleados ganan a lo ms $ 300. Reconstruya la tabla de distribucin.

  • Anl is is Probabi l s t ico 35

    CIBERTEC CARRERAS PROFESIONALES

    8. A continuacin se muestran los tiempos (en segundos) que una mquina transportadora se demora en trasladar 40 paquetes:

    44.0 56.8 46.5 48.7 36.3 42.5 32.4 46.6 35.5 39.3

    45.3 56.6 43.7 37.6 42.3 45.6 33.5 47.8 32.8 42.6

    57.0 43.9 36.8 45.7 34.9 48.6 35.7 43.2 39.1 38.8

    440 33.4 35.8 46.0 36.8 32.7 38.2 37.1 45.2 39.2

    Construya un cuadro de distribucin de frecuencias de 5 intervalos de igual amplitud.

    9. El siguiente conjunto de datos se refiere a los sueldos mensuales (en dlares) de 40 empleados de una empresa:

    440 560 335 587 613 400 424 466 565 393

    453 650 407 376 470 560 321 500 528 526

    570 430 618 537 409 600 557 432 591 428

    440 340 558 460 560 607 382 671 512 492

    Construya una tabla de distribucin de frecuencias pertinente.

    10. A fin de decidir cuntos mostradores de servicio se necesitarn en las tiendas, una cadena de supermercados quiso obtener informacin acerca del tiempo (en minutos) requerido para atender a los clientes. Se registraron los siguientes tiempos:

    3,6 1,3 0,8 1,3 1,1 0,8 1,0

    0,3 0,9 0,7 3,1 2,2 1,6 1,9

    0,4 5,1 1,8 0,3 1,1 0,6 0,7

    1,1 1,9 2,1 0,3 0,8 1,0 1,4

    1,1 0,5 1,2 0,6 0,8 1,7 0,2

    Construya una tabla de frecuencias e interprete los valores de f2, m3 y H4. 11. El tiempo en minutos que demoran 30 alumnos de la seccin en terminar de contestar

    esta pregunta es como se ve en la tabla:

    3,36 4,28 2,32 3,12 3,86 2,92

    2,08 3,26 2,42 4,00 2,12 2,68

    2,18 4,28 2,22 3,96 3,36 2,12

    4,14 2,02 2,82 3,96 2,42 4,24

    3,22 4,02 2,68 3,86 2,92 3,56

    Construya una tabla de distribucin de frecuencias donde se clasifiquen estos datos e interprete los resultados obtenidos en m4, f1, F2, h4, H3.

  • 36

    CARRERAS PROFESIONALES CIBERTEC

    12. Ud. realiz un estudio del rendimiento de 20 estudiantes de ingls frente al examen de

    suficiencia TOEFL. Las notas que alcanzaron los estudiantes fueron:

    104 86 108 95 102

    70 98 78 96 110

    100 102 80 92 98

    94 82 89 100 75

    Elabore la Tabla de Distribucin de Frecuencias adecuada e interprete f4; F3; H2; h2

    13. En la empresa proveedora de computadoras MICOMPU, Ud. es el encargado de llevar

    el control diario de la produccin del rea de ensamblaje. La Gerencia Tcnica le solicita un informe sobre la cantidad de computadoras diarias ensambladas por los 20 tcnicos a su cargo. Esta cantidad (por cada trabajador) se muestra en la siguiente tabla:

    4 4 2 5 2 3 5 4 5 4

    6 2 3 4 4 5 4 6 5 4

    Construya la Tabla de Distribucin de Frecuencias adecuada. Si la empresa decide dar

    una bonificacin de 10% de su salario a los tcnicos que hayan ensamblado 5 o ms computadoras diarias, qu porcentaje de trabajadores se vern beneficiados?

    14. La siguiente Tabla muestra la cantidad de hijos que tienen una muestra de 50 pacientes en

    edad frtil que han recurrido a la consultora psicolgica para controlar el stress post operatorio en el Hospital 2 de Mayo de Lima Metropolitana.

    xi fi Fi hi Hi

    0 8

    1 13

    2 0,4

    3 7 0,8

    4 46

    5 0,04

    6 1

    TOTAL

    Reconstruya la Tabla de Distribucin de Frecuencias.

  • Anl is is Probabi l s t ico 37

    CIBERTEC CARRERAS PROFESIONALES

    15. En la siguiente tabla de frecuencias de amplitudes iguales, se observa el promedio del curso de Estadstica (sobre 20) de 400 ALUMNOS menores de 20 aos.

    Puntajes mi fi Fi hi Hi

    [ 02 - > 24

    [ 05 - > 40%

    [ - > 74%

    [ - > 60

    [ - >

    [ - ] 20

    Total

    Complete la siguiente tabla de frecuencias.

    16. Ripgam S.A., fabricante de componentes electrnicos desea estudiar las horas de vida

    de cierto tipo de batera que fabrica en una de sus lneas de produccin. A continuacin se presenta las horas de vida registradas de una muestra aleatoria representativa de 50 bateras de una de sus lneas de produccin.

    Horas de Vida mi f F hi Hi

    [ 115 - > 3

    [ - > 130 12

    [ - > 0.28

    [ - > 17

    [ - > 49

    [ - ]

    Totales

    Reconstruya la Tabla de Distribucin de Frecuencias. C.- Clculo de Medidas de Tendencia Central

    1. El sueldo promedio de 200 empleados de una empresa es S/1200. Se proponen dos

    alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a cada uno. Si la empresa dispone a lo ms de S/. 94 000 para pagar sueldos, cul alternativa es ms conveniente?

  • 38

    CARRERAS PROFESIONALES CIBERTEC

    2. Un proveedor de servicios de Internet, en una Universidad, ha llevado a cabo un estudio para evaluar la frecuencia de uso de este servicio en las dos facultades que existen. Se realiz una encuesta a fines de julio de 2012 en ambas facultades evalundose el nmero de horas de uso del servicio de Internet y el gasto (nuevos soles) por el uso de dicho servicio. Se obtuvo los siguientes resultados:

    Minutos/da de Internet

    Facultad A Facultad B

    Estudiantes Gasto Estudiantes Gasto

    Menos de 20 20 2,5 7 2,6

    [ 20 - 40> 30 3,8 10 3,5

    [ 40 - 60> 140 6,0 20 6,4

    [ 60 - 80> 150 7,8 35 8,1

    [ 80 - 100> 50 9,6 65 10,1

    [100 - 120] 10 11,5 23 12,3

    Total 400 160

    Efecte un anlisis comparativo sobre el tiempo de uso del servicio de Internet de los

    estudiantes de ambas facultades. Utilice las medidas estadsticas necesarias. 3. En la siguiente tabla se muestra la distribucin de frecuencias de las edades de

    personas que asisten a los eventos deportivos los fines de semana en la ciudad de Lima. Si los intervalos tienen amplitudes iguales y adems f1 = f4 , halle e interprete la media, mediana y la moda.

    Intervalos mi fi hi pi Fi Hi Pi

    [ - >

    [ - 24 > 0.40

    [ - > 32 0.80

    [ - 42 ]

    Total

    4. En la siguiente tabla se muestra la distribucin del consumo de snacks que se realiza

    los fines de semana en los multi-cines del centro de Lima. Si los intervalos tienen amplitudes iguales; y adems se cumple que: f3 =2(f1 +2) y 3f3 =2f2 = 6f5. Halle la media, mediana y la moda.

    Intervalos (soles) mi fi hi pi Fi Hi Pi mifi

    [ 4 - > 70

    [ - >

    [ - 22 >

    [ - > 450

    [ - ]

  • Anl is is Probabi l s t ico 39

    CIBERTEC CARRERAS PROFESIONALES

    5. Las ganancias diarias de los establecimientos de un Centro Comercial se presentan en una tabla de frecuencias con 6 intervalos de amplitudes iguales a 36. La ganancia mnima es de $6, el 50% de los establecimientos ganan ms de $25.58 diarios. Calcule las medidas de tendencia central. Interprete sus resultados.

    Ganancias (en miles de Soles)

    mi fi hi Fi Hi

    [ 6 - > a

    [ - > 2a 120 0.15

    [ - > 0.25

    [ - > 304

    [ - > 0.93

    [ - ]

    6. En el restaurante 5 tenedores LA OLIVA Ud, se encuentra haciendo un anlisis

    estadstico para determinar cunto dinero estn dispuestos a gastar los clientes en una Cena Navidea familiar para 4 personas con el fin de realizar sus proyecciones para las prximas fiestas de fin de ao. La Tabla de Distribucin de Frecuencias que se ha construido es una tabla de 6 intervalos de igual amplitud, como se muestra a continuacin:

    Gastos (en Soles) mi fi hi Fi Hi

    [ - > 20 a

    [ - > 0.3

    [ - > 97.5 0.6

    [ - > a+0.15

    [ - > 127.5

    [ - ] 200

    Totales

    Halle el valor de la mediana y la moda. 7. Con el fin de disear estrategias de mejora en la enseanza, el Consorcio Educativo

    EDUCATEL se propone realizar un estudio sobre el rendimiento acadmico en el rea de matemtica. Para ello, selecciona a 100 estudiantes los cuales los divide en 4 grupos: X, Y, Z y W. Despus de realizar los exmenes respectivos, se encuentra que el promedio general es de 72 (calificacin sobre 100). Los puntajes medios de los grupos Y, Z y W, fueron 75, 62 y 80, respectivamente. Por un descuido administrativo, las calificaciones del grupo X se extraviaron; pero se sabe que en el grupo Y est el 40% del total de alumnos, en el grupo Z el 25% del total y en el grupo W haban 15 alumnos ms que en el grupo X. En base a esta informacin, determine la nota promedio del grupo X.

  • 40

    CARRERAS PROFESIONALES CIBERTEC

    8. Una tabla de distribucin simtrica de frecuencias de 5 intervalos contiene la siguiente informacin: El valor mnimo es 45. La marca de clase del segundo intervalo es 59. Adems se determin que F5 = 60; H4 = 0,90; h3 = 0,40. Determine e interprete la media, la mediana y la moda de la distribucin.

    9. Las bonificaciones semanales (en dlares) obtenidas por un grupo de vendedores de

    una empresa de seguros se tabularon en una Tabla de Distribucin de Frecuencias Simtrica de 5 intervalos de la cual se tiene la siguiente informacin: F5 = 200; h3 = 0.35 y f1 = 35. Si la menor bonificacin es de 20 dlares y la mayor es de 60 dlares. Construya la Tabla de Distribucin de Frecuencias adecuada con todos sus indicadores y calcule e interprete la mediana y la moda de la distribucin de frecuencias.

    10. La siguiente tabla muestra los resultados de una encuesta de sondeo realizada por un

    operador de telefona celular a los adolescentes de los distritos de Los Olivos y San Miguel referente al uso del sistema prepago de telefona celular. El estudio se refiri al tiempo de uso del sistema telefnico y al gasto de los adolescentes en tarjetas prepago.

    Tiempo de Uso (en minutos)

    Los Olivos San Miguel

    Adolescentes Gastos en

    tarjetas (S/.) Adolescentes

    Gastos en tarjetas (S/.)

    [0 40> 30 10 25 12

    [40 80> 50 15 20 20

    [80 120> 85 20 40 25

    [120 60> 25 30 55 30

    [160 200> 10 50 15 55

    [200 240] 10 60 5 80

    Total 210 160

    a) En cul de los distritos el gasto de los adolescentes en tarjetas prepago es mayor? b) En qu distrito el tiempo que los adolescentes hacen uso del sistema de telefona

    celular es menor? 11. El 40% de los sueldos de los empleados de una empresa es mayor o igual a 50 soles

    pero menor de 60 soles; el 30% mayor o iguales a 60 soles pero menor de 70 soles; el 15% de los empleados tienen como mnimo sueldos de 70 soles pero menores de 80 soles; y los sueldos del 15% restante son mayores o iguales a 80 soles pero como mximo 100 soles. Halle la media aritmtica de los sueldos de los empleados.

    12. El quinto ciclo de una facultad de ingeniera tiene tres secciones. La seccin A tiene 45

    alumnos y la nota promedio en el curso de matemtica fue de 13. La seccin B tiene 40 alumnos y la nota promedio en el mismo curso fue de 12. Por ltimo, la seccin C tiene 35 alumnos y la media aritmtica de las notas en el curso de matemtica fue de 15. Halle el promedio final del quinto ciclo de la mencionada facultad de ingeniera.

    13. Una institucin educativa tiene 20 profesores. La edad promedio de los profesores

    casados, que son 12, es de 36 aos. La edad promedio de todos los profesores de la institucin es 30 aos. Calcule la edad promedio de los profesores solteros.

    14. En una empresa el sueldo promedio de 60 trabajadores administrativos es 1200 soles.

    Por incremento del costo de vida se presentan dos alternativas de aumento. La primera propuesta es un aumento de 180 soles a cada trabajador y la segunda es un aumento de 10% de sus sueldos ms 12 soles. Cul de las dos propuestas conviene ms a los trabajadores a fin de mejorar su ingreso promedio? Justifique su respuesta.

  • Anl is is Probabi l s t ico 41

    CIBERTEC CARRERAS PROFESIONALES

    D.- Clculo de Medidas de Posicin y Dispersin

    1. La siguiente Tabla de Distribucin de Frecuencias muestra los resultados (sobre 100

    puntos) de las evaluaciones para un puesto de trabajo.

    Intervalos (puntos)

    mi fi Fi hi Hi

    [ 26 34 > 30 1 1 0,022 0,022

    [ 34 42 > 38 2 3 0,044 0,066

    [ 42 50 > 46 4 7 0,089 0,154

    [ 50 58 > 54 10 17 0,222 0,376

    [ 58 66 > 62 16 33 0,356 0,732

    [ 66 74 > 70 8 41 0,178 0,910

    [ 74 82 > 78 3 44 0,067 0,977

    [ 82 90 ] 86 1 45 0,022 1

    Total 45 1

    a) Qu porcentaje de datos est por debajo de 71? b) Qu porcentaje de datos est por encima de 38? c) Por debajo de que valor se encuentra el 27% de los datos? d) Por encima de qu valor se encuentra el 65% de los datos? e) Qu porcentaje de datos se tiene entre 52 y 75?

    2. Un encargado de compras ha obtenido muestras de lmparas incandescentes de dos

    proveedores. En su propio laboratorio ha probado ambas muestras con respecto a la duracin de su vida til, obteniendo los siguientes resultados:

    Vida til en horas Muestra

    Empresa A Empresa B

    [ 700 900 > [ 900 1100 > [ 1100 1300 > [ 1300 1500 ]

    10 16 26 8

    3 36 12 3

    a) Cul de las Empresas proveen mejores lmparas. b) En cul de las Empresas se presenta una mayor homogeneidad en su duracin?

    3. Los sueldos en soles de los ejecutivos de dos empresas A y B se dan en la siguiente

    tabla de frecuencias.

    Sueldos (en miles de Soles) Empresa A Empresa B

    1 3 6 8

    3 5 7 10

    5 7 9 12

    7 9 4 6

    9 11 2 1

    a) Qu porcentaje de los empleados gana por encima de la media en la empresa A? b) En qu empresa los sueldos son ms homogneos? c) Si todos los trabajadores de la empresa A reciben un aumento del 25% de sus

    sueldos, Cul ser el nuevo sueldo promedio?

  • 42

    CARRERAS PROFESIONALES CIBERTEC

    4. Ud. es contratado por la compaa artstica REQUIEM, para analizar los costos de los

    vestuarios de las dos reas con que cuenta la compaa:

    Msica: Formada por 8 msicos cuyos gastos en soles son: 42, 48, 48, 50, 56, 62, 65, 70

    Teatro: Formada por 12 actores cuyos consumos se muestran en la siguiente tabla:

    Consumo en soles N de actores

    [40 , 45[ 2

    [45 , 50[ 3

    [50 , 55[ 5

    [55 , 60] 1

    a) Cul de las reas tiene el mayor consumo promedio? Justifique su respuesta. b) Cul de las reas tiene el consumo ms disperso? Justifique su respuesta.

    5. El Centro de Idiomas NOW tiene dos secciones A y B para el ciclo introductorio formadas por cinco estudiantes cada una. La seccin A tiene un promedio de notas de 89.8 con una varianza de 24. En la seccin B, las notas de los estudiantes son las siguientes: 84, 86, 86, 92, 95. En qu seccin las notas son ms dispersas?

    6. Clasificaron los sueldos en soles de los obreros de las empresas, obtenindose los siguientes resultados:

    EMPRESA A

    EMPRESA B

    Sueldos Nro. de Obreros Sueldos Nro. de Obreros

    [110 , 120> 20 [105 , 115> 30

    [120 , 130> 30 [115 , 125> 50

    [130 , 140> 20 [125 , 135> 30

    [140 , 150> 10 [135 , 145> 10

    En cul de las empresas los sueldos son ms homogneos?

    7. La empresa comercializadora de equipamiento minero EL SOL SAC cuenta con 4 departamentos dentro de su estructura interna: Ventas, Sistemas, Ingeniera y Contabilidad. Las remuneraciones semanales (en nuevos soles) en cada departamento son las siguientes:

    Ventas Sistemas Ingeniera Contabilidad

    Media 750 693 550 720

    Desviacin estndar 50 72 44 36

    N empleados 150 110 140 100

    a) Calcule el promedio de remuneraciones de toda la empresa. b) En cul de los departamentos las remuneraciones son ms homogneas?

    8. El Ministerio de Transportes y Comunicaciones realiz una serie de mediciones de ruido en las calles ms congestionadas de Lima. En la Av. Alfonso Ugarte se obtuvo un promedio de 75 decibeles de ruido con una varianza de 125. En la Av. Tacna, los niveles de ruido (en decibeles) medidos en 5 determinadas horas fueron 68; 79; 82; 76 y 83. En qu avenida el nivel de ruido es ms disperso?

  • Anl is is Probabi l s t ico 43

    CIBERTEC CARRERAS PROFESIONALES

    9. Se ha medido las calificaciones de un grupo de estudiantes de estadstica (poblacin)

    clasificados por gnero. Los resultados se dan en la tabla que sigue:

    Calificaciones Hombres Mujeres

    [05, 08[ 4 10

    [08, 11[ 10 19

    [11, 14[ 26 50

    [14, 17[ 40 15

    [17, 20] 20 6

    a) En qu grupo se tiene a personas con calificacin ms heterognea? b) Aquellas personas con calificaciones mayores a 16.5 se exonerarn de la siguiente

    prctica calificada, Cuntas personas en cada grupo se beneficiarn?

    10. A continuacin se muestra las calificaciones que obtuvieron en dicha evaluacin dos colegios del mismo grado. Colegio A (de Piura) y Colegio B (de Cusco).

    Calificaciones Colegio A Colegio B

    [ 05 08 > 4 10

    [ 08 11 > 10 19

    [ 11 14 > 26 50

    [ 14 17 > 40 15

    [ 17 20 ] 20 6

    A continuacin se muestran algunos resultados estadsticos acerca de ambos grupos:

    Colegio A Colegio B

    Promedio 14.36

    Mediana 14.75

    Varianza 9.6804 8.6904

    a) Cul de los colegios tiene calificaciones ms homogneas? b) Cul de los colegios tiene mayor rendimiento? c) Qu porcentaje de alumnos de cada colegio tienen un puntaje mnimo de 15?

    11. Dos empresas A y B se disputan la buena pro de un proyecto de construccin. Para determinar al postor, estas empresas presentan los puntajes obtenidos en licitaciones anteriores. La empresa A presenta los puntajes obtenidos en 6 licitaciones, sobre 20 puntos: 17, 14, 15, 16, 18 y 15. La empresa B presenta la siguiente tabla calificada sobre 100 puntos:

    NOTA CANTIDAD DE LICITACIONES

    [ 70 74 [ 1

    [ 74 78 [ 2

    [ 78 82 [ 3

    [ 82 86 [ 1

    Determine cul de las empresas tiene el puntaje ms homogneo

  • 44

    CARRERAS PROFESIONALES CIBERTEC

    12. Una ONG dedicada a la investigacin de problemas sociales tiene 4 reas de trabajo: Contabilidad, Relaciones Internacionales, Proyectos y Proyeccin Social. Las remuneraciones mensuales (en nuevos soles) en cada rea son las siguientes:

    Contabilidad Relaciones

    Internacionales Proyectos

    Proyeccin Social

    Remuneracin Media 1250 1500 1750 1300

    Desviacin estndar 150 250 100 200

    N empleados 8 5 12 25

    a) Calcule el promedio de remuneraciones de toda la empresa. b) En cul de los departamentos las remuneraciones son ms homogneas?

    13. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variacin del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada trabajador del 20% de su sueldo ms una bonificacin de $60 y el coeficiente de variacin baja a 4%. Halle la media y la desviacin estndar de los sueldos del mes de agosto. Cunto dinero adicional necesita la empresa para pagar todos los sueldos del mes de septiembre?

    14. La distribucin de los sueldos (en dlares) de los empleados de dos empresas A y B se tabul en 3 intervalos de igual amplitud en cada caso, siendo las frecuencias absolutas del primero al tercero de 10, 30, 30 y de 30, 50, 20 respectivamente en A y B. Si los sueldos mnimo y mximo son de 50 y 200 en A y de 60 y 240 en B. a) En qu empresa los sueldos son ms homogneos? b) S un empleado de A y otro de B ganan cada uno $130. Quin de ellos est mejor

    considerado en su centro de trabajo? 15. Las puntuaciones de un test aplicado a un grupo de estudiantes, se tabularon en una

    distribucin de frecuencias de 6 intervalos de igual amplitud de manera que la marca de clase del segundo intervalo es 25 y el lmite superior del quinto intervalo es 60. Si las frecuencias en porcentajes del primer al cuarto intervalo son respectivamente 15, 20, 35, 14 y si el 94% de las puntuaciones son menores que 60. a) Determine la distribucin de frecuencias de las puntuaciones. b) Qu porcentaje de estudiantes tienen entre 38 y 53 puntos?

    16. En una prueba de aptitud mental, la menor y mayor puntacin fueron 50 y 200,

    respectivamente. Los puntajes (sin decimales) se tabularon en una distribucin de frecuencias simtrica de 5 intervalos de igual amplitud, donde el 20% de los casos son menores de 95 y el 70% de los casos son menores que 140. Halle el intervalo centrado en la mediana donde se encuentran el 50% de los puntajes.

    17. El consumo mensual de agua (en metros cbicos) de una muestra de 225 viviendas se tabul en una distribucin de frecuencias simtrica de cinco de amplitud iguales. Si el consumo mnimo es de 35 m3, el consumo promedio de 45m3, y si 1/3 de la muestra consume al menos 43m3 pero menos de 47m3 Qu porcentaje de la muestra consume al menos 47 m3? Cuntos metros cbicos como mnimo consumen el 60% de las viviendas?

    18. Una prueba de conocimientos tipo A se calific sobre 20 puntos dando una media de 12 y una desviacin estndar de 2 puntos. mientras que una prueba de aptitud tipo B se calific sobre 100 puntos, con una media de 70 y una desviacin estndar de 5. a) En cul de las dos pruebas los puntajes son ms homogneos? b) Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor rendimiento?

  • Anl is is Probabi l s t ico 45

    CIBERTEC CARRERAS PROFESIONALES

    19. Un conjunto habitacional est conformado por tres edificios de departamentos. De estos edificios, se tiene los siguientes datos respecto al consumo mensual de electricidad de cada uno de los edificios:

    Edificio 1 : Tiene 12 departamentos que gastan en promedio 45 soles con una desviacin estndar de 10 soles.

    Edificio 2 : Tiene 9 departamentos cuyos consumos en soles son 38, 42, 56, 60, 43, 52, 41, 44, 53.

    Edificio 3 : Los consumos se dan en la siguiente tabla:

    Consumo en soles Departamentos

    [30, 40[ 1

    [40, 50[ 4

    [50, 60[ 4

    [60,70] 2

    a) Cul de los edificios tiene menor consumo promedio de electricidad? b) Cul es el consumo promedio en todo el conjunto habitacional? c) En cul de los edificios el consumo es ms disperso?

    20. Una empresa de estudios de mercado ha realizado un trabajo, para estudiar, entre otras

    variables el pago mensual por alquiler de departamentos (con caractersticas similares) en los distritos A y B. La informacin recogida fue la siguiente:

    Pago mensual por alquiler (en $)

    Nmero de Departamentos (Dist. A)

    Nmero de Departamentos (Dist. B)

    [350 , 400[ 10 9

    [400 , 450[ 35 36

    [450 , 500[ 70 60

    [500 , 550[ 40 75

    [550 , 600[ 25 90

    [600 , 650[ 15 24

    [650 , 700] 5 6

    Con esta informacin, se calcularon los siguientes valores para el Distrito A:

    Medida Estadstica Valor (en soles)

    Media Aritmtica 500

    Moda 476,92

    Variancia 4773,87

    Primer Cuartil 457,14

    Segundo Cuartil 489,29

    a) Realice un anlisis comparativo de las distribuciones de montos mensuales por

    alquileres de departamentos de los dos distritos. b) Se considera que un distrito es ms residencial cuando el pago mensual por alquiler

    es ms del 40% de los datos observados. Cul de los dos distritos se podra considerar ms residencial?

  • 46

    CARRERAS PROFESIONALES CIBERTEC

    Resumen

    Una manera de averiguar cul es la variable de un estudio estadstico es preguntarnos lo siguiente: Qu es lo que estoy estudiando?

    Una misma variable estadstica puede tener distintas clasificaciones: puede ser cualitativa o cuantitativa.

    Los estadgrafos o parmetros provenientes de variables cualitativas se representan mediante proporciones (porcentajes); en cambio, los que provienen de variables cuantitativas se representan, por lo general, mediante promedios.

    Mostrar la informacin a travs de una Tabla de Distribucin de Frecuencias permite, a simple vista, sacar algunas conclusiones respecto al conjunto de datos que estamos estudiando.

    Las Tablas de Distribucin de Frecuencias tienen como principal funcin facilitar el clculo de los estadsticos o parmetros adecuados.

    Las Tablas de Distribucin de Frecuencias se pueden elaborar para datos discretos y para datos continuos.

    En la actualidad, gracias a los distintos softwares existentes, el cuadro estadstico ha pasado a ser una herramienta de referencia para elaborar grficos.

    El promedio es, por lo general, la medida que mejor representa los datos.

    Si los datos son muy dispersos o encontramos valores extremos es posible que el promedio no sea representativo de los mismos. En este caso es mejor utilizar la mediana.

    Cuando el clculo de las medidas de tendencia central se hace sobre la base de cuadros de distribucin de frecuencias, los resultados son aproximados.

    Cuando la variable de estudio es ordinal, las medidas de tendencia central que se utilizan son la MEDIANA y la MODA.

    Cuando la variable de estudio es escalar, las medidas de tendencia central que se utilizan son la MEDIA, la MEDIANA y la MODA.

    Cuando en una distribucin de frecuencias la MEDIA, MEDIANA y MODA tienen el mismo valor, se dice que es una DISTRIBUCIN SIMTRICA.

    Las medidas de posicin son tiles para establecer valores mnimos o mximos que se deben lograr como pautas para mejorar el rendimiento de la produccin, de las personas, etc.

    Una mayor dispersin de datos implica una menor concentracin de los mismos y viceversa.

    Una mayor homogeneidad en los datos equivale a una menor dispersin de los mismos y viceversa.

  • Anl is is Probabi l s t ico 47

    CIBERTEC CARRERAS PROFESIONALES

    A mayor coeficiente de variacin, mayor dispersin y, por lo tanto, menos homogeneidad de los datos.

    El Coeficiente de Variacin nos permite determinar la representatividad del promedio de un conjunto de datos, pues si es menor del 50% podemos considerar al promedio como representativo de los datos. En caso contrario, se considera que los datos son muy dispersos y, por lo tanto, no es recomendable utilizarlos en un estudio estadstico.

    Bibliografa

    ANDERSON, DAVID R.

    2008 Estadstica para administracin y economa. Editorial Thomson (519.5 ANDE 2008)

    WEIERS, RONALD 2006 Introduccin a la estadstica para negocios. Mxico, D.F.: Thomson

    (519.5 WEIE) MOYA CALDERON, RUFINO 2005 Estadstica descriptiva. Conceptos y aplicaciones. Ed. San Marcos. (519.4 MOYA/E) CRDOVA ZAMORA, MANUEL 2003 Estadstica descriptiva e Inferencial. Ed. Moshera. (519.5 CORD 2003)

  • 48

    CARRERAS PROFESIONALES CIBERTEC

  • Anl is is Probabi l s t ico 49

    CIBERTEC CARRERAS PROFESIONALES

    ANLISIS PROBABILSTICO

    LOGRO DE LA UNIDAD DE APRENDIZAJE

    Al trmino de la unidad, el alumno, trabajando de manera individual, calcula e interpreta probabilidades simples y condicionales, sobre la base de un conteo de posibilidades o sobre la base de un modelo de distribucin de probabilidad que va de acuerdo con determinadas condiciones de dependencia o independencia estadstica.

    TEMARIO

    Anlisis combinatorio

    Probabilidad clsica

    Probabilidad condicional

    Distribucin Binomial

    Distribucin de Poisson

    Distribucin normal estndar

    Distribucin muestral de medias y muestral de proporciones

    ACTIVIDADES PROPUESTAS

    Los alumnos, trabajando de manera individual, calculan e interpretan casos de anlisis combinatorio y probabilidades clsicas, condicionales y distribuciones de probabilidad.

    UNIDAD DE APRENDIZAJE

    2

  • 50

    CARRERAS PROFESIONALES CIBERTEC

    1. ANLISIS COMBINATORIO

    Para poder empezar el estudio de las probabilidades, es necesario conocer en primera instancia las diferentes formas de poder combinar los diferentes elementos que tiene un conjunto de datos. As, el Anlisis Combinatorio, es el conjunto de procedimientos que permiten determinar el nmero de resultados de un experimento sin necesidad de conocer todos los resultados que de l se originan. El anlisis combinatorio se basa en los dos principios bsicos: el principio de la adicin y el principio de la multiplicacin.

    1.1. Principio de la adicin

    Dados dos experimentos A y B, el nmero de maneras posibles que puede ocurrir el experimento A o B est dado por lo siguiente:

    n(A o B) = n(A) + n(B) Donde: n(A) : Nro. de formas distintas que puede ocurrir el experimento A n(B) : Nro. de formas distintas que puede ocurrir el experimento B

    1.2. Principio de la multiplicacin

    Dados dos experimentos A y B, el nmero de maneras posibles que puede ocurrir el experimento A y B est dado por lo siguiente:

    n(A y B) = n(A) x n(B)

    2. PERMUTACIONES

    Una permutacin de un conjunto de elementos es un arreglo de los mismos siguiendo un orden establecido, es decir, el cambio en el orden establecido SI genera casos diferentes. El nmero de permutaciones posibles de n elementos, todos distintos, agrupados en sub grupos de r elementos diferentes es:

    ! rn!n

    Pnr

    Algunos ejemplos en los que se aplican las permutaciones son los nmeros que se pueden formar con 3 cifras; la combinacin de colores para hacer una camiseta; las formas en que se pueden ordenar personas en una fila, etc.

    3. COMBINACIONES Una combinacin de un conjunto de elementos es una seleccin de tales elementos sin

    tener en cuenta el orden, es decir, el cambio en el orden de los elementos NO genera un caso diferente.

  • Anl is is Probabi l s t ico 51

    CIBERTEC CARRERAS PROFESIONALES

    El nmero de combinaciones de n elementos tomados de r en r (sub grupos de r elementos) es:

    ! rn!r!n

    Cnr

    Algunos ejemplos en los que se aplican las combinaciones son el nmero de apretones de mano en una reunin; seleccionar a los invitados de una fiesta; seleccionar preguntas para un examen a partir de un banco de preguntas, seleccionar subgrupos de personas a partir de un grupo ms grande, etc.

    4. PROBABILIDAD CLSICA

    La probabilidad es un nmero real que expresa la confianza o incertidumbre en la ocurrencia de un evento cuyo resultado no se puede predecir con certeza.

    4.1. Definicin clsica de probabilidad

    Si un experimento aleatorio se puede realizar de n maneras posibles y mutuamente excluyentes;