Esta Di Stica

74
UNIVERSIDAD TECNICA DE AMBATO UNIVERDIDAD TECNICA DE AMBATO 09 FACULTAD DE CONTABILIDAD Y AUDITORIACARRERA DE CONTABILIDAD Y AUDITORIA MODALIDAD SEMIPRESENCIAL MODULO : ESTADÍSTICA DESCRIPTIVA MEDIADOR: Dra. Margoth Bonilla Dr. Orlando Guevara Correa SEPTIEMBRE 2009

Transcript of Esta Di Stica

UNIVERSIDAD TECNICA DE AMBATO

UNIVERDIDAD TECNICA DE

AMBATO

09

FACULTAD DE CONTABILIDAD Y AUDITORIACARRERA DE CONTABILIDAD Y

AUDITORIA MODALIDAD SEMIPRESENCIAL

MODULO : ESTADÍSTICA DESCRIPTIVA MEDIADOR: Dra. Margoth Bonilla Dr. Orlando Guevara Correa

SEPTIEMBRE 2009

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 2

PRESENTACIÓN Este módulo ha sido diseñado con miras a facilitar el aprendizaje de la Estadística descriptiva, dando énfasis en trabajo aplicados en lo posible a su especialidad.

La aspiración básica es presentar un trabajo de fácil comprensión, con procedimientos estadísticos básicos que requieren de un mínimo nivel matemático, sin que esto naturalmente afecte a la precisión de los resultados ni al rigor científico. Considerando que la práctica ayuda en el aprendizaje, al finalizar cada tema se incluye ejercicios resueltos para que se los estudie, discuta y analice. Como también algunos propuesto para que los resuelva con procedimientos similares. ESTRATEGIAS DE TRABAJO Para adquirir el dominio de los objetivos sin dificultad, se requiere: 1. Realizar la lectura comprensiva, utilizando técnicas de estudio como: el subrayado, esquemas, resúmenes, etc. 2. Utilizar un cuaderno de trabajo para volver a verificar los ejemplos del módulo, usando calculadora que contenga elementos básicos de estadística. 3. Elija un lugar apropiado para que pueda trabajar sin molestias ni interrupciones. 4. Fije una hora especial para el estudio. 5. Utilice lápiz para resolver los ejercicios. EVALUACIÓN Art. 10 Reglamento de Evaluación para la promoción de los años lectivos y semestres manifiesta que las asignaturas prácticas la calificación final del trimestre serán evaluadas así: Actividades académicas (trabajos en clase y extraclase) 60% Examen 40 %

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 3

I N D I C E ESTADISTICA ...................................................................................................... 1

INTRODUCCIÓN .............................................................................................. 1

Estadística Analítica e Inferencial. ...................................................................... 1

UNIDAD 1 .............................................................................................................. 3

CONCEPTOS MATEMÁTICOS ........................................................................... 3

REDONDEO DE DATOS .................................................................................. 3

NOTACION CIENTIFICA ................................................................................. 4

DIGITOS SIGNIFICATIVOS ............................................................................ 4

Razones ............................................................................................................... 5

Proporciones ........................................................................................................ 5

Ley Fundamental de las Proporciones: ............................................................... 6

Porcentaje o Tanto por Ciento............................................................................. 6

FUNCIONES ...................................................................................................... 6

NOTACION DE SIGMA CON SUMA .............................................................. 6

PROPIEDADES DEL OPERADOR ∑ .............................................................. 8

UNIDAD 2 .............................................................................................................. 9

INTRODUCCIÓN A LA ESTADÍSTICA ............................................................. 9

VARIABLES .................................................................................................... 11

SEGÚN LA NATURALEZA DE LA VARIABLE: ........................................ 11

SEGÚN LA ESCALA DE MEDICIÓN: .......................................................... 12

SEGÚN LA RELACIÓN ENTRE VARIABLES: ........................................... 12

ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA ................................. 12

Recopilación de los Datos ................................................................................. 14

Elaboración de los Datos ................................................................................... 14

DISTRIBUCIÓN DE FRECUENCIAS ................................................................ 15

Generalidades .................................................................................................... 15

Intervalos de Clase y Límites de Clases. .......................................................... 15

FORMACIÓN DE LA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS . 18

SEGUNDO PROCESOS PARA VARIABLES CONTINUAS ....................... 19

GRÁFICOS: .......................................................................................................... 22

UNIDAD 3 ............................................................................................................ 27

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 4

3. Medidas de centralización ................................................................................. 27

MEDIA ARITMETICA (Xm) .......................................................................... 27

PROPIEDADES DE LA MEDIA ARITMÉTICA ........................................... 28

MEDIA GEOMETRICA ( G o Mg ) ................................................................ 33

Aplicación de la Media Geométrica .................................................................. 36

MEDIA ARMONICA (H) ................................................................................ 38

LA MEDIANA (MED) ..................................................................................... 38

Calculo de la Mediana con Datos Discretos ..................................................... 38

LA MODA (MOD) O promedio modal ........................................................... 40

DATOS AGRUPADOS.- ...................................................................................... 40

UNIDAD 4 ............................................................................................................ 48

Medidas de variabilidad ........................................................................................ 48

DATOS AGRUPADOS CON FRECUENCIA Y DAIC .................................. 53

DESVIACION MEDIA ABSOLUTA ( DMA ) ............................................... 54

DESVIACION ESTÁNDAR ............................................................................ 54

UNIDAD 5 ............................................................................................................ 58

MOMENTOS ESTADÍSTICOS ........................................................................... 58

PUNTUACIONES TIPIFICADAS. ...................................................................... 60

LA CURVA NORMAL .................................................................................... 61

RESUMEN DE MING MANAGER .................................................................... 65

BIBLIOGRAFÍA GENERAL ............................................................................... 68

UNIVERSIDAD TECNICA DE AMBATO

EL que quiere hacer algo encuentra un medio, el que no quiere hacer nada, encuentra una excusa

Proverbio árabe OBJETIVOS DE LA ASIGNATURA

OBJETIVO GENERAL

Identificar los campos de aplicación de la Estadística descriptiva a través de un proceso de aprendizaje orientado a consolidar el conocimiento, el desarrollo de habilidades y destrezas.

OBJETIVOS ESPECÍFICOS • Aplicar algunos conceptos básicos necesarios para el estudio de estadística.

• Interpretar, organizar y elaborar cuadros de distribución de frecuencias.

• Representar gráficamente los datos estadísticos mediante barras, centrogramas, histogramas, polígonos de frecuencias, polígonos suavizados, ojivas, etc.

• Calcular medidas de centralización como la media, mediana, moda, desviación media, varianza, desviación estándar con DNA, DAF, DAIC.

• Calcular medidas de variabilidad como la desviación media, varianza, desviación estándar con DNA, DAF, DAIC.

• Analizar las puntuaciones tipificadas y la curva normal

• Establecer proyecciones de datos

UNIVERSIDAD TECNICA DE AMBATO

Quienes dicen que algo no puede hacerse deben apartarse del camino de quienes están haciendo.

Anónimo

ESTADISTICA

INTRODUCCIÓN Tarea casi imposible sería tratar de señalar un campo en donde la Estadística no haya causado gran impacto, y su uso no sea una práctica permanente y cotidiana. En La ingeniería y en la administración industrial sobre todo, esta ciencia ha adquirido una connotación especial. Problemas de la producción, uso eficiente de materiales, manejo de la fuerza de trabajo etc. cobran fuerza mayor con conceptos como “Control de Calidad y Calidad Total” cuya esencia estadística revela la importancia de esta ciencia. Si queremos como país tercermundista afrontar con éxito los retos del nuevo milenio, tendremos que mejorar substancialmente la calidad de lo poco que producimos, y producir más y mejor. Para sobrevivir, debemos adquirir el compromiso continuo de mejoramiento de calidad, desde el diseño hasta la producción, aplicando experiencias y propuestas como las de Edwards DEMING, o el criterio japonés de imitar, igualar, superar. Una de las características fundamentales del milenio que iniciamos, consiste en el empleo cada vez mayor de las ideas y conceptos de la Teoría de Probabilidades, con una amplia aplicación científica, fundamentalmente en la investigación. ¿Cómo podríamos en Genética por ejemplo emitir criterios sobre la frecuencia relativa con que aparecen diversas características de grupos de individuos sin la estadística y las probabilidades?; o el cálculo de la densidad del tráfico en una metrópoli en una hora pico, etc. etc. Fenómenos tan variados pero tan actuales son los que estudian y ayudan a comprender estas ciencias. Estadística Analítica e Inferencial. Podemos definir a la Estadística como una ciencia metodológica que se encarga de la toma, recopilación, ordenamiento, organización, análisis, interpretación, y proyección o pronóstico de datos numéricos pertenecientes a fenómenos masivos; entendiéndose estos últimos como aquellos en los cuales participan un sin número de elementos de un mismo tipo o especie. El total de elementos que conforman un fenómeno se denomina ”población”; mientras que entendemos por ”muestra”; a un subconjunto de este Universo, cuyos elementos han sido escogidos en forma aleatoria; pero son representativos de la población, es decir que posea las mismas características, no deben existir desviaciones mayores en los resultados de las aplicaciones estadísticas que se hicieran a la población y a la muestra. Distinguimos dos tipos de Estadística: ”La Analítica”; que tiene como límite los resultados obtenidos del análisis e interpretación de los fenómenos y ”La Inferencial”, que utiliza los datos de la primera y además los proyecta en función de pronosticar posibles resultados respecto de fenómenos iguales o similares en diferente tiempo y espacio, en base a generalizaciones de datos. Algunos de los problemas fundamentales que resuelve la estadística inferencial se refieren a la evaluación de riesgos y toma de decisiones.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 2

Debemos entender que la Estadística sin embargo de ser científica, es inexacta; la exactitud propia de la esencia de la materia la podemos mejorar mediante ”La Probabilidad Matemática” , que es la ciencia que nos permite pronosticar la aparición, repetición, evolución, terminación, etc. de fenómenos estudiados mediante formulación matemática; siendo este el vínculo entre estas dos ciencias. Los datos estadísticos en dependencia de características cualitativas y cuantitativas, como la longitud de la serie y algunos otros por menores se clasifican en: ”Datos Agrupados y Datos No Agrupados“. Cuando la serie no es relativamente grande, además de un ordenamiento que puede ser ascendente o descendente y no es necesaria una clasificación alguna, entonces estamos trabajando con datos no agrupados. Estadísticamente los parámetros más representativos de una serie de datos ya sean estos no agrupados o agrupados son “Los Promedios o Medidas de Tendencia central, y las medidas de desviación o dispersión”. TERMINOS CLAVE: Estadística analítica, estadística inferencial, población, muestra, probabilidad matemática. ACTIVIDAD: Investigue e exprese con sus propias palabras: • El concepto de estadística. • La importancia de la estadística. • Definición de la estadística descriptiva. • Definición de la estadística inferencial. • Población muestra

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 3

Nunca es tarde para triunfar, tampoco es tarde para empezar.

Anónimo

UNIDAD 1 OBJETIVO DE LA UNIDAD: Definir algunos conceptos básicos para la estadística.

CONCEPTOS MATEMÁTICOS • Conceptos • redondeo de datos y cifras significativas • Notación de potencia base 10 y Notación Científica • Funciones y variables • El operador y sus leyes REDONDEO DE DATOS Es el procedimiento de redondear las cifras sean a enteros o decimales de acuerdo al número de cifra que va a trabajar, aplicando las reglas aplicadas en matemática. Por ejemplo: Redondear un número como 52,8 en unidades es 53, pues el 52,8 esta más proximo a 53 que a 52. Redondear 52. 465 en centécimas es 52.46 (se redondean al entero pa

1. Si el último dígito es menor que 5 (d<5), se desprecia

r que precere al 5) Redondear 52. 575 en centécimas es 52.58 (se redondean al entero par que precere al 5 ). Reglas:

Ejemplos: 7.2 = 7 7.11 = 7.1 0.374 = 0.37

2. Si el último dígito es mayor que 5 (d>5), el dígito anterior se aumenta en una unidad.

Ejemplos: 7.8 = 8 7.17 = 7.2 0.09 = 0.1

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 4

7.177= 7.18 El caso dudoso aparece, cuando los números terminan en 5. 3. Si el dígito anterior al 5 es impar, se aumenta en una unidad.

Ejemplo: 8.875 = 8.88 66.975 = 66.98

4. Si el dígito anterior al 5 es par, se conserva. Ejemplo: 5.25 = 5.2 8.05 = 8.0 EJERCICIO Aproximación a un entero: 9.2 = 7.8 = Aproximación a la décima: 5.17 =

6.11 = 0.08 =

Aproximación a la centésima: 4.177 =

0.374 = 1.098 =

NOTACION CIENTIFICA Es importante emplear la notacion científica (base 10) en los números que tienen varios ceros antes o descpues del punto decimal. 101 = 10 102=100 103=1000 104=10 000 100 = 1 10-1 = 0.1 10-2 = 0.01 10-3 = 0.001 89 393 000 000 = 8.94 x 1010 0.00003416 = 3.42 x 10-5

Ejercicio : 0.000000456 = 5 058 300 000 = 347 201 000 000 = 0.00294 = 0.0007402 = 0.000018234 = DIGITOS SIGNIFICATIVOS Los dígitos empleados a parte de los ceros necesarios para localizar el punto decimal se llaman digitos significativos y cifras significativas de un número. Ejemplos : 43.7 tiene 3 cifras significativas 345 000 tiene 6 cifras significativas

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 5

0.0036 = 3.6 x 10-3 tiene 2 cifras significativas 0.003600 = 3.600 x 10-3 tiene 4 cifras significativas 65,4 Tiene tres cifras significativas 4,5300 Tiene cinco cifras significativas 0,0018 = ,0018 =1,8x10-3 Tiene dos cifras significativas 78 dos 78,6 tres 1008 cuatro 197,09 cinco 0,0025 dos (dos ceros a continuación de la coma no son significativos). Razones

La razón es la relación entre dos números, a través de la operación de división o cociente, como la expresión a : b, donde a y b son dos números cualesquiera y b diferente de 0.

Ejemplo: La razón 4 respecto a 5 puede ser expresada de la siguiente manera:

• 4 : 5 (Notación de Razón)

• 4 ÷ 5 (Notación de división)

• 4 / 5 (Notación de fracción)

• 0,8 (Notación decimal)

EJERCICIO

Dado el número de estudiantes varones y mujeres asistentes al seminario. Determinar la razón existente entre los estudiantes de los dos sexos.

Proporciones

La proporción es una igualdad entre dos razones como la expresión a:b::c:d. Siendo a, b, c y d números cualesquiera; con b y d = 0; a y d se denominan extremos, b y c medios. Ejemplos: La proposición 3 : 4 y 9 : 12 puede expresarse como: 3 : 4 : : 9 : 12 (Notación de razón) 3÷4 = 9÷12 (Notación de división) 3/4 = 9/12 (Notación de fracción)

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 6

Ley Fundamental de las Proporciones:

“Producto de los extremos es igual al producto de los medios”. Si a : b : : c : d => ad = bc, permitiendo calcular cualquiera de los elementos de una proporción.

Porcentaje o Tanto por Ciento

El porcentaje es una razón entre un número cualesquiera y cien.

Ejemplos:

5 : 100; 38 : 100 14 : 100 54: 100(Como razón) 5 ÷100 (Como división) 5 / 100 (Como fracción) 0, 05 (Como decimal) 5 % (Como porcentaje)

Ejercficio Escriba en totas las alternativas cada uno 30/100 = 28:100 = 0.32 = 17% = FUNCIONES Si acada valor de posible de la variable X le corresponde uno o mas valores en Y, decimos que Y es función de X escribiendo Y = F( X ) y se lee “y es igual a f de x “ , se puede utilizar otras letras G(x), T(x), etc. La dependencia funcional o correspondencia entre las variables se escribe en una tabla. Por que el concepto de función admite extensión a varias variables. El grafico es una representación entre las variables. Muchos gráficos aparecen en estadistica según la naturaleza de los datosd involucrados y el propósito del gráfico Ejemplo : grafique la función Y = x2

Tabla de datos x Y= x2 y 1 2 3

Y= 12 Y= 22

Y= 32

1 4 9

NOTACION DE SIGMA CON SUMA

Y = x2

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 7

En muchos precedimientos estadisticos que estudiaremos es necesario obtener la suma de un conjunto de números. La letra griega ∑ se utiliza para denorar una suma.

∑n

iX

Σ = Sigma X = Variable i = Subíndice n = Número de casos

La suma de n terminos x1, x2, x3 , ... xn es ∑x = x1 + x2 + x3 + ... +xn Por ejemplo: Si x: 1, 5, 6, 9. ∑x = 1+5+6+9 = 21 ∑x2 =12+52+62+92 = 143 Utilizando tablas

x X2 (x+1) (x+1)2 2*x 1 5 6 9

1 25 36 81

2 6 7 10

4 36 49

100

2 10 12 18

∑=21 ∑=143 ∑=25 ∑=189 ∑=42

EJERCICIO Los puntajes obtenidos en varias pruebas se muestran en el siguiente cuadro

No Ri Ti Xi Yi Zi 01 25 08 42 31 27 02 44 21 38 50 16 03 12 34 20 40 05 04 18 12 29 30 26 05 34 25 36 48 50 06 33 17 06 19 31 07 21 14 23 18 14 08 10 25 34 19 18 09 26 13 24 29 34 10 41 27 16 35 28 11 22 39 17 26 30 12 14 26 25 46 33 13 29 10 38 48 17 14 16 25 24 19 37 15 40 36 25 16 13 16 12 15 30 22 34 17 20 34 28 26 17 18 24 28 32 35 40 19 40 36 28 16 45 20 10 20 30 40 50

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 8

Hallar: ∑ )(x ; ∑ + )1(x , ∑ + )3(x , 2∑ − )3(x PROPIEDADES DEL OPERADOR ∑ 1. Cuando cada valor de una variable va ha ser multiplicada por una

constante o dividida entre ella, dicha constante se puede aplicar después de los valores que se hayan sumado. ∑cx = c∑x

1. La operación de la suma o sumatoria de una constante es igual al

producto de la constante y el número de veces que representa. ∑n

i=1 c= nc 2. La adición de una suma ( o diferencia) de dos variables es igual a la

suma (o diferencia) de la sumatorias individuales de las dos variables. ∑n

i=1 (x2i + yi) = ∑n

i=1 x2i + ∑n

i=1yi

∑ni=1 (x2

i - yi) = ∑ni=1 x2

i - ∑ni=1yi

TERMINOS CLAVE Redondeo, cifras significativas, sumatoria. REALICE LAS SIGUIENTES ACTIVIDADES 1. Escriba 3 números decimales y aplique el criterio de notacion

cientifica. 2. Desarrolle cada uno de las siguientes sumas indicadas: ∑x , ∑xy, ∑|x-

3| , ∑x/n, ∑3X. Para x=3, 6, 8, 9, 11 y n=5 3. Calcule cada una de las siguientes cantidades: ∑y, (∑y)2 , ∑(y-12), ),

∑(y-12)2, ∑(y-12)2/(n-1), ∑y2 si Y=15, 10,5 , 9, 14, 20, 6, 17. 4. Calcule las siguientes cantidades según los datos: ∑x, ∑f, ∑xf, ∑xf2,

∑x2f x 10, 11, 15, 19, 21, 26 f 3, 5, 9, 10, 2, 1

5. Problemas afines Estadistica Schaum pág 31 BIBLIOGRAFÍA DE LA UNIDAD • Spiegel Myrray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda

Edición McGRAW-HILL 2000. PÁG 1-35 • Stephen P. Shao, ESTADISTICA PARA ECONOMISTAS Y

ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. PÁG. 3-19 Y 105-153

UNIVERSIDAD TECNICA DE AMBATO

UNIDAD 2

OBJETIVOS DE LA UNIDAD • Organizar los datos estadísticos • Interpretar y elaborar cuadros de distribución de frecuencias. • Representar gráficamente los datos estadísticos mediante barras,

centrogramas, histogramas, polígonos de frecuencias, polígonos suavizados, ojivas, etc.

INTRODUCCIÓN A LA ESTADÍSTICA Objetivos y funciones de la estadística Organización de datos Tipos de variables; discretas y continuas Tablas de distribución de frecuencias Representaciones gráficas

Variables discretas: Gráfico de barras Gráfico de sectores o pastel Variables continuas: Gráfico de columna o histograma

Polígono de frecuencias absolutas y polígono suavizado Ojiva ascendente y descendente

DEFINICIÓN DE TÉRMINOS USADOS DE ESTADÍSTICA Estadística La palabra Estadística proviene de una voz italiana STATISTA que

significa ESTADISTA.

Estadística Es un conjunto de métodos que tiene por objeto analizar, comparar,

establecer relaciones y obtener conclusiones. La Estadística se aplica a todas las ciencias, les ayuda y les suministra datos División de la Estadística Estadística Descriptiva Es aquella que facilita la interpretación de datos, mediante tablas, gráficos y diagramas. Estadística Inferencial Es aquella que da información para sacar conclusiones de un grupo grande de personas, lugares o cosas por medio de la observación de solo una pequeña parte del conjunto total (muestra)

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 10

NOTA: En la Estadística Descriptiva existe un mínimo margen de error. En la Estadística Inferencial existe un mayor margen de error. Ejemplo:

Error Máximo

Investigación de Laboratorio 1% Investigación Social 5% Estadísticas. Es cualquier conjunto sistemático de datos estadísticos referente a un determinado fenómeno o asunto como por ejemplo: Estadística educativa, estadística económicas. Estadístico. Es el profesional que se dedica al estudio de la estadística. Población.- Es el conjunto de todos los elementos que poseen una misma característica. Ejemplo: La población formada por todos los alumnos de la facultad. Población Finita.- Es aquella que está delimitada y conocemos el número de elementos que le integran. Ejemplo: alumnos de una Escuela. Población Infinita.- Es aquella que a pesar de estar delimitada en el espacio, no se conoce para efecto de la investigación, el número de elementos que lo integran. Ejemplo: bacterias en el piso del aula.

Muestra.- Es una parte de la población; es todo subconjunto finito y representativo de una población, que se determina con el propósito de estudiar las proposiciones de toda la población a partir del estudio de las unidades de análisis que conforma este subconjunto. Ejemplo: Conjunto de alumnos de la carrera de contabilidad de auditoría de la facultad. Unidad estadística: Es el estudio de coda uno de los elementos de la población. Información: Es el resultado del procesamiento de datos conforme a objetivos establecidos. Datos estadísticos: Es el valor que toma una variable en coda unidad de análisis. Codificación.- Es la asignación de un código. Ejemplo: Soltero = 01 Casado = 02

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 11

Tabulación.- Es el proceso de distribuir los datos en cuadros o tablas, con el fin de ordenar o agrupar en clases o categorías. Dato.- Elemento especificado. Dato Continuo.- Cualquier valor en el intervalo continuo. Ejemplo: la temperatura. 10, 1o C. Dato Discreto.- Es el resultado de contar un número de conceptos u objetos. Clase.- Es una categoría (60 – 62). Recorrido o Rango.- Es la diferencia entre el valor mayor y menor. Ejemplo: 100 estudiantes, la estatura mayor = 1.74 m y la menor = 1.60 m., el rango es: 1.74 m – 1.60 m. = 0.14 m. Toma de Datos.- Es una colección de datos desordenados. Ejemplo: estatura de 20 estudiantes de una Escuela de la Facultad. VARIABLES Variables.- Es toda característica ó fenómeno que puede tomar cualquier valor de un conjunto determinado. Ejemplo: Edades, sexo, números de hijos por familia, lugar de nacimiento, color, raza, idioma, calificaciones. Las variables pueden ser: según la naturaleza de la variable, según la escala de medición y según la relación entre variables: SEGÚN LA NATURALEZA DE LA VARIABLE: A. Variable cualitativas.- Cuando sus datos se expresan mediante una característica, atributo o palabras. Expresan una cualidad (no numéricas) Por ejemplo: La raza, religión, lugar de nacimiento. B. Variable cuantitativa.- Cuando el valor de la variable se expresa en una cantidad; sus datos son numéricos y pueden resultar de la operación de contar o medir y pueden ser de dos clases: * Variable cuantitativa discreta.- Cuando los valores que toman las variables son números naturales. Resultan de la operación de contar. Por ejemplo: La variable: números de hijos por familia. Dato: 0; 1; 2; 3; 4; 5; 6; 7; etc. * Variables cuantitativas continuas.- Cuando los valores de las variables asumen números reales. Se obtienen por medición o comparación. Por ejemplo: Variable: estatura de 5 alumnos. Dato: 1,42 m; 1,43 m; 1,50 m; 1,54 m; 1,60 m.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 12

Variable: peso de un grupo de niños Dato: 29 kg; 30 kg; 35 kg; 40 kg; 45 kg; etc SEGÚN LA ESCALA DE MEDICIÓN: A. Variables nominales.- Son aquellas que establecen dos o más categorías que no guardan solución entre ellas. Ejemplo: sexo, estado civil, ocupación, lugar de nacimiento, etc. B. Variables ordinales.- Son aquellas que establecen categorías que guardan entre sí un orden o jerarquía convencional sin grado de distancia entre ellas. Ejemplo: Orden de méritos, grado de instrucción, nivel económico, clase, social, etc. C. Variables de intervalos.- Son aquellas que establecen categorías que guardan entre sí un orden o jerarquía convencional y mantienen grados de distancia entre ellas, pero no tienen un origen común. Ejemplo: Cociente de inteligencia, puntuación en una escala de calificación, temperatura, etc. D. Variables de razón.-Son aquellas que comprenden a todos los tipos anteriores, establecen categorías, orden, distancia y origen común cuyos valores se expresan como números reales. Ejemplo: Edad, ingresos, pesos, estatura, producción anual, cantidad de accidentes, etc SEGÚN LA RELACIÓN ENTRE VARIABLES: A. Variables independientes: Llamadas causales, son aquellas que condicionan en forma determinante a la variable que es motivo del estudio (variable dependiente)

Ejemplo: Para el caso de presupuesto familiar, serán variables independientes: el ingreso, el número de miembros de la familia, etc. B. Variables dependientes: Llamadas también de efecto, es aquella que está condicionada por las variables independientes. En el ejemplo anterior el presupuesto familiar es la variable dependiente. C. Variables íntervinientes: Llamadas interferentes, son aquellas que coparticipan con las variables independientes, condicionando de estas manera el comportamiento de esta manera el comportamiento de las variables dependientes. Ejemplo: En el caso del ingreso (variable independiente con respecto al presupuesto familiar) serían variables intervinientes la edad de los miembros de la familia, la conducta del consumo. ETAPAS DE UNA INVESTIGACIÓN ESTADÍSTICA

- Recopilación de Datos - Elaboración de los Datos:

• Crítica • Codificación • Tabulación • Presentación

- Análisis e Inferencias

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 13

- Formulación: • Hipótesis • Leyes • Teorías

RECOPILACION DE DATOS

• DIRECTA• INDIRECTA

ELABORACION DE DATOS

• CRITICA• CODIFICACION• TITULACION• PRESENTACION

ANALISIS E INFRENCIAS

• HIPOTESIS• LEYES• TEORIAS

ETAPAS DE LA INVESTIGACION CIENTIFICA

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 14

Recopilación de los Datos

Los datos pueden ser primarios y secundarios.

- Datos primarios Son los registrados de primera mano, Ej: Datos en oficinas, registro civil, etc.

- Datos Secundarios Son aquellos tomados de fuentes primarias que se pueden proporcionar a los usuarios. Las fuentes primarias pueden ser:

- Fuente Oficial, cuando son elaborados por organismos del estado. Ej: Estadísticas del Banco Central

- Fuente Particular, cuando son elaborados por organismo particulares o autónomos. Ej: Indice de precios de la Universidad Central del Ecuador.

La recopilación de datos debe estar sujeta a un plan:

• Objetivo, Propósito (Motivación) • Clase y cantidad de datos requeridos • Ámbito de muestreo (geográfico o poblacional) • Método de recopilación (Muestreo) • Recursos necesarios (Humanos, financieros, materiales,

técnicos) • Organización (Estudio preliminar, asesoría, capacitación,

etc.) • Cronograma de actividades (inicio-fin) • Presupuestos de gastos (costo, financiamiento).

Elaboración de los Datos

Crítica

- Examen de los datos - Fidelidad - Secuencia lógica - Verificación si los cálculos son exactos

Codificación

- Asignación de un código

Soltero = 01 Casado = 02

Tabulación

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 15

- Distribución de los datos en cuadros o tablas Presentación

- Textual: Aplicación limitada, principalmente informes - Cuadros o tablas : Presentación en una matriz

• Cuadro # • Nombre • Encabezado • Cuerpo • Referencia

- Gráficos • Líneas • Barras • Pastel

DISTRIBUCIÓN DE FRECUENCIAS Es fundamental el establecimiento de ciertas definiciones estadísticas para poder unificar criterios de trabajo. Generalidades Cuando existen un gran número de datos es necesario distribuirlos en

CLASES O CATEGORÍAS y determinar el número de individuos u objetos

pertenecientes a cada clase (Frecuencia de clase).

Distribución de

160-162 5

Frecuencias Es la ordenación tabular de los datos en clases con sus respectivas

frecuencias.

Ejemplo: Cuadro

Estaturas de 100 estudiantes de la Facultad. -------------------------------------------------------------------------- Estatura (cm) Número de Estudiantes --------------------------------------------------------------------------

163-165 18 166-168 42 169-171 27 172-174 8

-------------------------------------------------------------------------- TOTAL 100 --------------------------------------------------------------------------

Intervalos de Clase y Límites de Clases.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 16

Intervalo de Clase : Es un rango y viene dado por: Vmayor-Vmayor Ejemplo:160-162 Tamaño o Ancho de un Intervalo de Clase: Es la diferencia entre límites, Vmayor- Vmenor. Ejemplo: 162- 160 162.5-159.5 Límites de Clase: Son los valores extremos: Vmenor y Vmayor. Ejemplo: 160 y 162

59.5 y 162.5 (límites reales) Intervalo de Clase Abierto: Es cuando no tiene superior o inferior. Ejemplo: Personas> 65 años Personas< 65 años Marca de Clase :

1. Determinar el valor mayor y el valor menor entre los datos registrados.

Es el punto medio del intervalo de clase y viene dado por:

Vmenor+ Vmayor PUNTO MEDI O Marca de clase= -----------------------

2 Ejemplo: 160+162 322 = ----------- = ------------ = 161 2 2

Reglas Generales para formar las Distribuciones de Frecuencias

2. Encontrar el RANGO (diferencia entre el mayor y el menor de los datos).

3. Dividir el rango en un número conveniente de INTERVALOS DE CLASE del mismo tamaño. Si esto no es posible, utilizar intervalos de clase de diferente tamaño e intervalos de clase abiertos. El número de intervalos de clase se toma generalmente entre 5 y

20 dependiendo de los datos. 4. Determinar el número de observaciones que se encuentran

dentro de cada intervalo de clase.

EJERCICIO

Los pesos de 40 estudiantes de la Facultad son los siguientes: Cuadro 5

Pesos de 40 estudiantes de la Facultad ---------------------------------------------------------------------------------------------------

------- 138 164 150 132 144 125 149 157

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 17

146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 155 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 128

**** RECORDAR CONCEPTOS BÁSICOS 1. Tabla de distribución de frecuencia (f): cuadro con los valores ordenados de mayor a menor o viceversa. 2. Frecuencia (f): Número de veces que se repite un valor 3. Número de casos (N) ∑f = N 4. Nombre de los valores (x) 5. Intervalo de clase: grupo de valores 6. Ancho del intervalo (i): Número de valores contenidos en el intervalo 7. Límites del intervalo: Son los valores extremos y son de dos clases. Límites aparentes (x) y Límites reales (LR) Los límites aparentes (x) sirven para ubicar las frecuencias Los límites reales (L R) sirven para graficar y es iguales a los límites aparentes aumentados en 1/2 unidad en cada extremo. 8. Punto Medio o marca de clase (Pm): Es un valor que está en el centro y se lo obtiene sumando los valores extremos y dividiendo por 2,

2inflimsuplim erioriteerioritePm +

=

El Pm. representa a todo el intervalo Si el Pm representa a todos los valores se supone que éstos se distribuyen uniformemente, lo cual no siempre sucede. Fórmulas i = ls –li+1 ( con límites aparentes) i = Ls-Li ( con Límites reales) ∑F = N

2LiLsPm +

=

FORMAS DE AGRUPAR LOS DATOS

1. Datos No agrupados (DNA) 2. Datos agrupados con frecuencia (DAF) 3. Datos agrupados en intervalos de clase (DAIC) DNA DAF

x

20 20 19 19 19 18 17 17 17

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 18

DAIC

X (ls – li) f LR =Ls - Li Pm

71- 73 74 - 76 77 - 79 80 - 82

13 12 15 10

70.5 - 73.5 73.5 – 76.5 76.5 - 79.5 79.5 – 82.5

72 75 78 81

∑=50

i = ls – li +1 = 73 – 71 +1 = 3 (con límites aparentes) i = Ls – Li = 73.5 – 70.5 = 3 ( con límites reales) Punto medio:

72

27371

2=

+=

+=

LiLsPm

TERMINOS CLAVE Variable, variable discreta, variable continua, marca de clase, límites, frecuencia. REALICE LAS SIGUIENTES ACTIVIDADES Los intervalos de clase para cierta puntuación son: 128-134, 135-141, 142-148, 149-155, 156-162, 163-167, 168-170. Halle: a. El ancho de cada intervalo b. Los límites reales de cada intervalo c. El punto medio de cada intervalo. FORMACIÓN DE LA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PRIMER PROCESO: 1. Se determina la amplitud o recorrido real de los datos (A)

A = valor mayor - valor menor 2. Se determina el ancho del intervalo i 3. Se determina el número de grupos que va a tener la distribución que se recomienda no más de 18 ni menos de 5.

gruposdenúmeroCiA ..1 =+=

4. El primer intervalo debe contener al valor menor así no se comience por ese valor. 5. El límite inferior del primer intervalo debe ser múltiple de i o una unidad menos al valor menor. Ejemplo:

f

20

2

19

3 18

1 17

4 ∑=10

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 19

En una empresa de la ciudad se aplica una encuesta para determinar la edad de sus empleados y se obtienen las siguientes puntuaciones: 56 – 78 – 62 – 37 – 54 – 39 – 62 - 60 28 – 82 – 38 – 72 – 62 – 44 – 54 - 42 42 – 55 – 57 - .65 – 68 – 47 – 42 - 56 56 – 56 – 55 – 66 – 42 – 52 – 48 - 48 47 – 41 – 50 – 52 – 47 – 48 – 53 - 68 Construya una distribución de frecuencias de 10 grupos. 1. Se determina la A: A= 82 – 28 +1 = 55 2. Se determina i y se calcula el N° de grupos A / i = C + 1 = No Grupos a. Con i = 3 A / i = 55/3 = 18+1 =19 Grupos b. Con i = 4 A / i = 55/4 = 13+1= 14 Grupos c. Con i = 5 A / i = 55 / 5 = 11 Grupos d. Con i = 6 A / i = 55 / 6 = 9+1 =10 Grupos e. Con i = 7 A / i = 55 / 7 = 7+1 = 8 Grupos f. Con i = 8 A / i = 55/8 = 6+1 = 7 Grupos En el ejemplo se determina que con i = 6, el N° de Grupos es 10, procediendo a la elaboración de la tabla de distribución de frecuencias. TABLA DE DISTRIBUCION DE FRECUENCIAS.

SEGUNDO PROCESOS PARA VARIABLES CONTINUAS • Determinar el número de intervalos o número de grupos. Se

recomienda trabajar en el siguiente intervalo 5≤ k ≤20. (k es el intervalo de clase) k = n (n es el tamaño de la muestra) o también cuando la desigualdad 2k >n es verdadera.

• Establecer la amplitud del intervalo de clase k

VmVMi −=

• Recorrido calculado de los datos = κ *i • Recorrido real de los datos = VM-Vm (el recorrido calculado de los

datos debe ser mayor que el recorrido real de los datos en caso

X

F

L R

PM 24-29

1

23.5-29.5

26.5 30-35

0

29.5-35.5

32.5 36-41

4

35.5-41.5

38.5 42-47

8

41.5-47.5

44.5 48-53

7

47.5-53.5

50.5 54-59

9

53.5-59.5

56.5 60-65

5

59.5-65.5

62.5 66-71

3

65.5-71.5

68.5 72-77

1

71.5-77.5

74.5 78-83 2 77.5-83.5 80.5

∑=40

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 20

contrario puede aumentar 1 al intervalo ó al recorrido considerando la menor diferencia para corregir)

Factor extremo = extremos

datoslosderealrecorridodatoslosdecalculadocorrido.2

........Re −

• Determinar el límite inferior del primer intervalo de clase y el límite

superior del último. Limite inferior del primer intervalo =Vm - factor extremo Limite superior del último intervalo =VM + factor extremo • Construir la tabla de distribución de frecuencia. (escribir cada grupo

escribir como intervalos por ejemplo 48<x≤56) Ejemplo Con los datos del ejemplo anterior construir las distribución de frecuencias considerando como variables continuas. En una empresa de la ciudad se aplica una encuesta para determinar la edad de sus empleados y se obtienen las siguientes puntuaciones: 56 – 78 – 62 – 37 – 54 – 39 – 62 - 60 28 – 82 – 38 – 72 – 62 – 44 – 54 - 42 42 – 55 – 57 - .65 – 68 – 47 – 42 - 56 56 – 56 – 55 – 66 – 42 – 52 – 48 - 48 47 – 41 – 50 – 52 – 47 – 48 – 53 - 68 K= n = 40 = 6.32455532 = 6

Amplitud del intervalo de clase k

VmVMi −= =

62882 − =

654

=9+1(corregir)=10 Recorrido calculado de los datos = κ *i= 6*10=60 Recorrido real de los datos = VM -Vm = 82-28 = 54

Factor extremo = 2

5460 − =26 = 3

Limite inferior del primer intervalo =Vm - factor extremo= 28-3 = 25 Limite superior del último intervalo =VM + factor extremo =82+3=85

EDAD RECUENTO # EMPLEADOS (F) 25 <x≤ 35 35 <x≤ 45 45 <x≤ 55 55 <x≤ 65 65 <x≤ 75

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 21

75 <x≤ 85 TERMINOS CLAVE Amplitud, ancho del intervalo, número de grupos ACTIVIDADES Los Puntos medios o marcas de clase de una distribución de frecuencias con intervalos de igual anchura son: 46, 55, 64, 73, 82, 91. Halle: a. El ancho del intervalo (i) b. El número de intervalos de clase (x) c. Los límites reales de cada intervalo (L R) 2. Un examen de contabilidad presentado por 40 alumnos se calificó con puntos de 1 a 50; los resultados fueron: 31 - 13 – 34 – 32 – 31 - 29 - 7 - 39 – 27 - 30 37 - 36 – 38 – 36 – 29 –38 – 12 – 41 – 30 - 27 11- 29 – 13 – 26 – 35 – 29 – 34 – 9 – 46 - 12 27 - 19 – 41 – 32 – 36 – 38 – 44 – 14 –39 - 40 Ordene los datos Encuentre la Amplitud o rango Forme una tabla de distribución de frecuencia con el ancho del intervalo que usted crea conveniente.

UNIVERSIDAD TECNICA DE AMBATO

GRÁFICOS: La presentación gráfica nos da una visión concreta de los datos teniendo como ventajas la exactitud y la simplicidad. GRÁFICOS DE VARIABLES VARIABLES La variable es una característica que puede tener diferentes valores en los distintos elementos o individuos de un conjunto. Las variables se clasifican en: Discretas Continuas Las variables Enteras o Discretas son aquellas que adoptan únicamente valores enteros Ej.: Número de personas, número de objetos etc. Las variables continuas son aquellas que adoptan así sea hipotéticamente cualquier tipo de valor Ej.: Pesa, estatura, temperatura, calificaciones, etc. CUALITATIVAS: las variables cualitativas son definidas por cualitativas o atributos. Barras.- Los gráficos de barras no están sujetos a normas fijas de elaboración.- Pueden ser estructurados de Barras separadas simétricamente o de barras unidas. Ejemplo: ordene la siguiente información correspondiente al color de zapatos de los alumnos en una clase de estadística. Marrón marrón azul blanco mostaza blanco guinda beige marrón negro beige negro marrón marrón marrón azul beige guinda blanco crema marrón verde beige negro mostaza

x f azul 2

blanco 3 beige 4 crema 1 guinda 2 marrón 7

mostaza 2 negro 3 verde 1

SUMA 25

0

1

2

3

4

5

6

7

8

COLOR DE CALZADO

Series1

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 23

CUANTITATIVAS: Entre las principales clases de gráficos variable cuantitativa tenemos: 1. Gráficos de variables enteras o discretas son las barras y centrogramas. Las frecuencias de variables discretas son puntos fijos entonces podemos contar es un conjunto finito o infinito numerable. CENTROGRAMA O DIAGRAMA CIRCULAR: Las distribuciones categóricas (o cualitativas) a menudo se presentan en forma gráfica como diagramas de pastel como el de la figura, donde un círculo se divide en sectores (rebanadas de pastel) que son proporcionales en tamaño a las frecuencias o porcentajes correspondientes. Para construir un diagrama de pastel primero convertimos la distribución en una distribución en porcentaje. Después, como un círculo completo Por tanto se determina la suma de los valores y utilizando reglas de tres en función de los 360 grados y los porcentajes si lo requiere.

ff

grados∑

=360 Porcentaje f

f∑=

100 donde f es la frecuencia de la clase y

∑f = N número de datos. Ejemplo: Se ha realizado una encuesta a 20 familias para saber el número de hijos y se obtuvo el siguiente resultado: 3 – 7 – 7 – 6 – 7 – 4 – 5 – 1 – 4 – 5 5 – 9 – 4 - 2 – 4 – 6 – 7 – 4 – 7 – 6

GRÁFICOS DE VARIABLES CONTINUAS: HISTOGRAMA POLÍGONO DE FRECUENCIAS POLÍGONAS SUAVIZADOS - POLÍGONOS DE FRECUENCIAS RELATIVAS, OJIVAS. HISTOGRAMA Es aquel gráfico en donde el área total representa a la frecuencia total, (densidad de frecuencia). Existe proporción entre el área y el número de casos. Para elaborarlo se levantan las ordenadas Correspondientes sobre los límites reales hasta la altura de su respectiva frecuencia. Ejemplo:

NUMERO DE HIJOS

5% 5%5%

25%

15%15%

25%

0%

5% 1

2

3

4

5

6

7

8

9

N° Hijos f grados % 1 1 18 5 2 1 18 5 3 1 18 5 4 5 90 25 5 3 54 15 6 3 54 15 7 5 90 25 8 0 0 0 9 1 18 5

suma 20 360 100

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 24

POLÍGONO DE FRECUENCIAS Se puede establecer comparaciones en el mismo eje.

Se lo gráfica ubicando un punto a la altura correspondiente sobre el PM. Todo polígono se acostumbra a cerrarlo en el siguiente y en el anterior PM. Ejemplo: Polígono de frecuencia de la distribución de las cantidades de tiempo que 80 estudiantes dedicaron a actividades de horas libres.

POLÍGONO SUAVIZADO Los polígonos de las muestras tienen líneas abruptas y hay que suavizarlas. Si la muestra es más grande el polígono es más suave. NORMAS PARA SUAVIZAR.

1. Se toma la frecuencia propia, la anterior y la que le sigue, se suma y se divide por 3

2. Siempre se presenta en el mismo gráfico el polígono de frecuencias y el suavizado.

x

F

fS 21-23

1 1

24-26

2 2 27-29

3 3.6

30-32

6 4 33-35

5 6.6

36-38

9 7 39-41

7 6.6

42-44

4 4.3 45-47

2 2.3

20.5 23.5 26.5 29.5 32.5 35:5 38.5 41.5 44.5

HIDTOGRAMA

0

5

10

LR

F

Serie1 Serie2 Serie3 Serie4 Serie5

Serie6 Serie7 Serie8 Serie9 Serie10

Serie11 Serie12 Serie13 Serie14 Serie15

Serie16 Serie17 Serie18 Serie19 Serie20

X

F 24-29

1 30-35

0 36-41

4 42-47

8 48-53

7 54-59

9 60-65

5 66-71

3 72-77

1 78-83

2 ∑=40

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 25

48-50

1 1

∑=40

OJIVA Aplicando la misma técnica del polígono de frecuencia a una distribución acumulativa obtenemos lo que se denomina una ojiva, sin embargo las frecuencias acumulativas de trazan en los límites de clase y fronteras de clase correspondientes en lugar de hacerlo en las marcas de clase. Ejemplo: Ojiva de la

distribución de las cantidades de tiempo que 80 estudiantes dedicaron a actividades de horas libres TERMINOS CLAVE Gráficos, barra, Centrograma, histograma, polígono, polígono suavizado, ojiva. EJERCICIOS (Estadística John Freund Pág. 33) 1. La siguiente distribución representa los costos financieros totales que

pagaron 200 clientes en sus cuentas de presupuesto a una tienda departa-mental:

Cantidad (dólares)

Frecuencia

0-19 18 20-39

62 40-59

63 60-79

43 80-99

14 a) Trace un histograma de esta distribución.

b) Dibuje un diagrama de barras de esta distribución. 2. Convierta la distribución del ejercicio anterior en una distribución acumulativa "menos de" y trace una ojiva. 3. La que sigue es la distribución de los pesos de 140 alumnas de nuevo ingreso que entraron a cierta universidad: Peso (libras) Frecuencia 90-99 4 100-109 23 110-119 49 120-129 38 130-139 17 140-149 6 150-159 3 a) Trace un histograma de esta distribución. b) Trace un polígono de frecuencia de esta distribución. 4. Convierta la distribución del ejercicio anterior en una distribución en porcentaje acumulativa "menos de" y dibuje una ojiva.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 26

5. La tabla siguiente muestra cómo llegan al trabajo obreros de Phoenix, Arizona: Medios de transporte Porcentaje Viaja solo 81 En automóviles propios 14 En autobús 3 Varios o trabaja en casa 2 Construya un diagrama de pastel de esta distribución en porcentaje. 6. Construya un diagrama de pastel de la siguiente distribución, que muestra cómo se distribuyen los perros que entran a una exposición canina según clasificaciones de AKC: Grupo Número Perros deportivos 39 Sabuesos 50 Perros de trabajo 112 Terriers 24 Miniaturas 34 Perros no deportivos 41 7. Construya un diagrama de pastel de la distribución categórica de la página 15 (que represente los planes de ir a la universidad de los 548 alumnos del último año de preparatoria). 8. Aquí, una vez más, se tienen las calificaciones (del ejercicio 2.18) que obtuvieron 50 estudiantes en un examen de contabilidad: 73 65 82 70 45 50 70 54 32 75 75 67 65 60 75 87 83 40 72 64 58 75 89 70 73 55 61 78 89 93 43 51 59 38 65 71 75 85 65 85 49 97 55 60 76 75 69 35 45 63 BIBLIOGRAFÍA DE LA UNIDAD • Freud John. ESTADÍSTICA. CUARTA EDICIÓN. Edit Prentice Hall Pág.33 • Kasmier Leonard. ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y

ECONOMIA. (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 8-38

• Spiegel Murray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 37-59

• Stephen P. Shao . ESTADISTICA PARA ECONOMISTAS Y

ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. Pág. 59-95

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 27

UNIDAD 3 OBJETIVO DE LA UNIDAD: • Calcular y analizar lo valores de las medidas de centralización como la

media aritmética, mediana, moda, con DNA, DAF, DAIC

3. Medidas de centralización Media aritmética: propiedades Media ponderada, media geométrica, media armónica Mediana. Moda Relaciones entre las medidas de centralización. DATOS NO AGRUPADOS.- Medidas de Centralización o Promedios.-Distinguimos parámetros de dos tipos: Computacionales y Posicionales. Los primeros se denominan así por cuanto se calculan por fórmula, la cual se encuentra matemáticamente fundamentada, se denominan también científicos. Los promedios posiciónales, denominados también empíricos

MEDIA ARITMETICA (Xm) No es sino la razón de la sumatoria de las observaciones por el número de ellas.

Xm =

se determinan unas veces por observación y otras por fórmula, pero esta última generalmente es empírica o está sujeta a principios de interpolación lineal y geométrica. Entre los promedios computacionales mas importantes tenemos:

nxΣ

Ejemplo: Calcular el promedio (media aritmética) de las notas de un estudiante si su cuadro de calificaciones es:

MATERIA NOTAS Estadística Economía

Inglés Matemática Ed. Física Francés

9.6 8.0 7.7 6.5 10.0 9.9

Total ∑=51.7

Xm = ∑Xi / n =51.7 / 6 = 8.617 Vale aclarar aquí el concepto de media aritmética ponderada, que no es sino la asignación de pesos W (valores de importancia), a c/u de las observaciones. Su expresión formular es:

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 28

Xp = ∑ Wi Xi / N (N = ∑W) Para el ejemplo anterior, asignando los siguientes pesos (valores de importancia) a las diferentes materias: MATERIA NOTAS PESO (W) Estadística 9.6 2 Economía 8.0 3 Inglés 7.7 3 Matemática 6.5 3 Ed. Física 10.0 1 Francés 9.9 1 Xp =

2*9.6 + 3*7.7 + 3*6.5 + 10*1 + 9.9*1 2+3+3+3+1+1 Xp = 8.13 Una variación de esta fórmula se puede utilizar para calcular series con observaciones que se repiten f veces (frecuencias), es decir:

Xp = ∑ Wi Xi / N (N = ∑W)

PROPIEDADES DE LA MEDIA ARITMÉTICA La media aritmética cuenta con algunas propiedades matemáticas entre las cuales citaremos: • ∑ ( Xi-Xm ) = 0: La Sumatoria de las desviaciones de las observaciones

respecto de la media aritmética de la serie, es igual a cero. Para el ejemplo anteriormente citado:

Desviación d = Xi - Xm

9.6 - 8.617 = 0.983 8.0 - 8.617 = -0.617 7.7 - 8.617 = -0.917 6.5 - 8.617 = -2.117 10.0 - 8.617 = 1.383 9.9 - 8.617 =

∑ = 0,002 ≡ 0

1.283

• La media aritmética de una constante es igual a la misma constante KxK =

Ejemplo: -------------------- No Xi ------------------- 1 8 2 8 3 8 4 8 5 8 6 8

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 29

-------------------- TOTAL 48 --------------------

x 8 = 48/6 = 8

• Cuando a los valores se le suma o se les resta una constante la media aritmética original también queda sumada o restada.

Xi ± K = x ± K

Ejemplo: Calcular la media aritmética ( X )

• Indicar cuál es la nueva X si a todos los Xi, le aumentamos 5 puntos y le restamos 5 puntos.

SOLUCIÓN: No. Xi Xi + 5 Xi –5 ----------------------------------- 1 15 20 10 2 14 19 9 3 12 17 7 4 10 15 5 5 9 14 4 6 8 13 3 ------------------------------------ 68 98 38 ------------------------------------

• Si a los valores originales se les multiplica o se les divide una constante, la X también queda multiplicada o dividida por dicha constante.

Xi */ K = X*/ K Ejemplo:

----------------------------------- No. Xi Xi * 2 Xi /2 ----------------------------------- 1 20 40 10 2 18 36 9 3 14 28 7

x = 74/5 = 14.8

x *K = 148/5 = 29.6

x /K = 37/5 = 7.4

x = 68/6 = 11.33

x (Xi +5)= 98/6 = 16.33

x (Xi – 5)= 38/6 = 6.33

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 30

4 12 24 6 5 10 20 5 ------------------------------------ 74 148 37 ------------------------------------

• Cuando a los valores se le suma o se les resta una constante la media aritmética original también queda sumada o restada.

Xi ± K = x ± K

Ejemplo:

• Calcular la media aritmética ( X )

• Indicar cuál es la nueva X si a todos los Xi, le aumentamos 5 puntos y le restamos 5 puntos.

SOLUCIÓN: No. Xi Xi + 5 Xi –5 ----------------------------------- 1 15 20 10 2 14 19 9 3 12 17 7 4 10 15 5 5 9 14 4 6 8 13 3 ------------------------------------ 68 98 38 ------------------------------------

• Si a los valores originales se les multiplica o se les divide una constante, la X también queda multiplicada o dividida por dicha constante.

Xi */ K = X*/ K Ejemplo:

----------------------------------- No. Xi Xi * 2 Xi /2 ----------------------------------- 1 20 40 10 2 18 36 9 x = 74/5 = 14.8

x *K = 148/5 = 29.6

x /K = 37/5 = 7.4

x = 68/6 = 11.33

x (Xi +5)= 98/6 = 16.33

x (Xi – 5)= 38/6 = 6.33

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 31

3 14 28 7 4 12 24 6 5 10 20 5 ------------------------------------ 74 148 37 ------------------------------------

• La ∑ ( Xi-p )2 = mínimo , p = Xm: La Sumatoria de las desviaciones

cuadradas respecto de un valor “P”, es mínimo, solamente cuando p = X (media aritmética)

Por ejemplo: Desviación con P≠ Xm

Desviación con p = Xm

D = x - Xm ( 9.6-9.6 ) 2 = 0 ( 8.0-9.6 ) 2 = 2.56 ( 7.7-9.6 ) 2 = 3.61 ( 6.5-9.6 ) 2 = 9.61 (10.0-9.6 ) 2 = 0.16 ( 9.9-9.6 ) 2 = 0.09

( 9.6-8.617) 2 = 0.967 ( 8.0-8.617) 2 = 0.380 ( 7.7-8.617) 2 = 0.840 ( 6.5-8.617) 2 = 4.48

(10.0-8.617) 2 = 1.914 ( 9.9-8.617) 2 = 1.647

∑= 16.03 ∑= 12.228 (Igual obtenemos una sumatoria mayor para cualquiera de los valores de la serie).

• Si sumamos los valores de dos grupos de datos individualmente ( en serie) se alcanza una X general, igual a la suma de las medias aritméticas parciales.

x ( Yi + Zi ) = ZY +

Ejemplo: ------------------------------------------- No. Yi Zi Yi + Zi ------------------------------------------- 1 10 9 19 2 10 8 18 3 9 7 16 4 7 10 17 5 9 10 19 6 10 9 19 7 8 10 18 8 8 7 15 9 9 8 17 10 9 10 19 ------------------------------------------- 89 88 177 -------------------------------------------

7.1710

177)(==

+= ∑

nzy

x ii

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 32

9.81089

=== ∑n

yy i

8.81088

=== ∑n

zz i

7.17889.8 =+=+= zyx

• Media de Submuestras, cuando queremos obtener una X general conociendo las iX de muestras de distinto tamaño.

Pasos:

1. Ponderar la media de cada muestra por el número de casos

2. Sumar estos productos

3. El producto total dividir para la suma de las muestras o número total de casos (n1 = tamaño de la muestra)

4321

332211

...................

nnnnnxnxnxnxx nn

+++++++

=

Ejemplo:

Tenemos tres paralelos de un curso, conocemos el promedio de cada paralelo:

Paralelo ni iX

A 25 8.5

B 23 9.2

C 18 7.9

Cuál es el promedio general de los paralelos del curso

Cuadro

------------------------------------------- Paralelo iX ni iX ni -------------------------------------------

A 8.5 25 211.6

B 9.2 23 212.5

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 33

C 7.9 18 142.2 ------------------------------------------- 566.3 ------------------------------------------- (8.5)(25) + (9.2)(23) + (7.9)(18) x = ------------------------------------------ 25+ 23 +18 212.5 + 211.6 + 142.2 X = -------------------------------- 66

∑∑=

i

ii

nnx

x

X = 8.58 Independientemente del sin número de ventajas que presenta este promedio (facilidad de cálculo, caracterización de la serie, simple interpretación, etc.),su gran desventaja es que al intervenir todos los valores de la serie en su determinación, se ve seriamente afectada por valores extremos. MEDIA GEOMETRICA ( G o Mg ) Se define como la raíz enésima “n“ del producto de las “N“ observaciones. Matemáticamente se expresa:

G = ( Π Xi) 1/n Π son los productos de Xi

G = ( X1. X2. X3. X4. .... XN)1/N Por Ejemplo, la media geométrica de la serie 9.6, 8.0, 7.7, 6.5, 10.0, 9.9 que analizámos será: G = (9.6*8.0*7.7*6.5*10.0*9.9) 1/6 G = 8.513 Aún cuando G también se influencia de valores extremos, esta influencia es menor a la observada en X. Sin embargo este promedio no se puede aplicar para observaciones iguales a cero, y en aquellas con valores negativos.

Es la medida de Tedencia Central que se basa en procedimientos matemáticos (fórmulas).

Se emplea en valores correspondientes a la escala de intervalo o Razón.

• Aplicación

1. Cuando la distribución es sesgada.

2. Cuando se quiere dar importancia a valores pequeños

3. Cuando los valores crecen en forma exponencial (interés compuesto, crecimiento poblacional)

• Fórmula.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 34

∏∏ ====

Producto ; nn

ii

nn xxxxxMg

1321 ......

jemplos:

1. Cuál es la Mg de 2 y 8

41682 22 === xMg

2. Cuál es la Mg de 2, 4 y 8

464842 33 === xxMg

3. Cuál es la Mg de: 2, 5, 7, 9, 10, 15

74889.69450015*10*9*7*5*2 66 ===Mg

Conocimientos de Logaritmos • Log (a)(b) = log a+ log b • Log a/b = log a – log b • Log an = n log a • Log n a = log a/n

• Log Mg = n

Logxn

LogxLogxLogx in ∑=+++ ..........21

Ejemplo:

Calcular la Mg aplicando logaritmos -------------------------------- No. Xi Log Xi -------------------------------- 1 2 0.30103 2 5 0.69897 3 7 0.84509 4 9 0.95424 5 10 1.00000 6 15 1.17609 -------------------------------- 4.97543 -------------------------------- Log Mg =4.97543/6 =0.829238 Mg = Antilog (0.829238) Mg = 6.74894

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 35

Ejemplo: Calcular la Mg y aplicando logaritmos, para los siguientes valores:

-------------------------------- No. Xi Log Xi -------------------------------- 1 5 0.69897 2 7 0.84509 3 7 0.84509 4 9 0.95424 5 10 1.00000 6 10 1.00000 7 10 1.00000 8 11 1.04139 9 14 1.14612 10 14 1.14612 -------------------------------- 9.67702 --------------------------------

n

LogxMg i∑=log

log Mg = 0.967702

Mg = antilog (0.967702)

1010 475398000014*14*11*10*10*10*9*7*7*5 ==Mg = 9.28337

Ejercicio Calcular la Mg y aplicando logaritmos y frecuencias, para los siguientes valores:

--------------------------------------------------------------- No. Yi ni i

i

nY log Yi ni logYi --------------------------------------------------------------- 1 5 1 5 5 0.69897 0.69897 2 7 2 72 49 0.84509 1.69018 3 9 1 9 9 0.95424 0.95424 4 10 3 103 1000 1.00000 3.00000 5 11 1 11 11 1.04139 1.04139 6 14 2 142 196 1.14612 229224 --------------------------------------------------------------- 9.67702 ---------------------------------------------------------------

967702.010

67702.9log === ∑nLogYn

Mg ii

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 36

log Mg = 0.967702

Mg = antilog (0.967702) = 9.2833 Aplicación de la Media Geométrica

En caso de la educación, la Mg se emplea para el cálculo poblacional de acuerdo a la fórmula de interés compuesto.

( )nrPP += 10

Donde :

P = Población final

P0 = Población inicial

r = Tasa de crecimiento

n =Tiempo (número de años)

Ejemplo : El Ecuador en 1998 tenía 12´543. 294 habitantes. Qué población tendrá en el 2005, si crece con una tasa de 2,1 % anual.

Solución:

Datos:

P = ? ( )nrPP += 10

Po=12.543.294 P = 12.543.294 (1+0.021)7

r = 2.1 % = 0.021 P = 14.507.474 habitantes

n = 2005-1998 =7 años

Ejemplo: Qué población tuvo Quito en 1990 si en 1998 tuvo 1.873.205 habitantes, si creció con una tasa del 2.38% anual.

Solución:

Datos:

P0 = ? ( )nrPP += 10

P =1.873.205

r = 2.38 % = 0.0238

n = 1998-1990 =8 años

( )1.551902=

+=

+=

)0238.01(205.873.1

10 nrPP habitantes

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 37

Ejemplo Con que tasa creció la ciudad de Guayaquil si en 1992 tuvo 1.975.640 habitantes y en 1998 tuvo 2.390.000 habitantes.

Solución:

Datos:

P0 =1.975.000 ( )nrPP += 10

P =2.390.000

r = ?

n = 1998-1992 =6 años

( )000.975.1000.390.21

0

=+= nrPP

3.2%0.032 ==−===+

103224.103224.120973.11 6

rr

Ejemplo

En que tiempo se duplicará la población de la ciudad de Ambato, si crece con una tasa de 1.93% si en la actualidad tiene 198.670 habitantes.

Solución:

Datos:

P = 2*198.670 =397340 ( )nrPP += 10

Po=198.670 397.340 = 198.670 (1+0.0193)n

r = 1.93 % = 0.0193

n = ?

n)193.01(670.198340.397

+=

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 38

años 36n =

=+

=

+=+=

0083.03010.0

)0193.01log(2log

)0193.01log(2log)0193.01(2

n

n

n

MEDIA ARMONICA (H) No es sino el recíproco de la media aritmética de los recíprocos de los valores observados. Matemáticamente : H = n . ∑

LA MEDIANA (MED)

La mediana divide a la distribución en dos partes exactamente igual, es decir, que tiene el 50 % de las observaciones a cada lado.

Me

1 1 Xi Este promedio está asociado directamente con series donde intervenga el tiempo. Para cálculos estadísticos aplicados a la Física por ejemplo es preferible que siempre utilicemos este promedio. PROMEDIOS POSICIONALES: A diferencia de los computacionales, estos carecen de sustentación matemática, sin embargo de aquello son ampliamente utilizados debido a su importancia práctica y a determinadas ventajas sobre los computacionales. Los más comunes son :

Xp 50% 50% Xg

Este estadístico se emplea con datos cuantitativos que se encuentran en la escala ordinal y en general cuando la media aritmética deja de ser representativa, porque la representación es sesgada o cuando uno de los extremos se aleja extremadamente del centro. En consecuencia conocemos por mediana el valor más central de la serie, es decir es aquel valor que divide a la serie ordenada

Calculo de la Mediana con Datos Discretos

en 2 partes iguales. Si el número de observaciones de la serie es par entonces la Med se calcula como la media aritmética de los valores más centrales de la serie. La mediana es un parámetro de tendencia central (promedio),ampliamente aplicado. Es muy cercano a la media aritmética pero al mismo tiempo no se influencia en absoluto de valores extremos a diferencia de ésta. Lamentablemente por ser un promedio posicional no se utiliza en cálculos matemáticos más profundos. En el caso que se analizaba anteriormente, la mediana Med. será: 10.0, 9.9 , 9.6 , 8.0 , 7.7 , 6.5 Los valores centrales son 9.6 y 8.0; por tanto: Med = (9.6 + 8.0)/ 2 = 8.8

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 39

La Me con datos discretos se obtiene por simple inspección, determinando el valor que se encuentra en el centro de la distribución.

Procedimiento:

• Ordenar los valores

• Señalar el valor que se encuentra en el centro (mitad)

• Si es impar el número de casos, la Me es el valor central

• Si es par el número de casos, la Me es el promedio de los valores centrales

Ejemplo: Determinar la mediana para los siguientes puntajes:

Cuadro Puntajes -------------------------------------------- No Xi Yi Yi -------------------------------------------- 1 5 4 20 2 7 5 12 3 4 7 10 4 10 8 8 Me = 8 5 12 10 7 6 8 12 5 7 20 20 4 -------------------------------------------- Puesto u orden de la Me = (n+1)/2 =(7+1)/2 = 4 Ejemplo: Determinar la mediana para los siguientes puntajes: ----------------------------------- No Xi Yi ----------------------------------- 1 15 14 2 20 15 3 17 17 4 19 19 Me = 19.5 5 23 20 6 28 23 7 14 26 8 26 28 ------------------------------------ Me = (19+20)/2 = 19.5

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 40

Puesto = (n+1)/2 = (8+1)/2 = 4.5

LA MODA (MOD) O promedio modal Es es un parámetro de tendencia central ampliamente utilizado en fenómenos comerciales y fundamentalmente relacionada con la discretización de variables continuas para análisis y proyección de procesos. De este concepto, podemos concluir que una serie puede tener mas de un promedio modal (Bimodal, Trimodal, Multimodal) o en su defecto puede no tenerlo. La serie 10.0, 9.9, 9.6, 8.0, 7.7, 6.5 carece de Moda. La serie 2, 3, 5, 5, 5, 6, 8, 8, 9, 10 la moda es 5

DATOS AGRUPADOS.- Fundamentalmente, el agrupamiento de datos se debe a necesidades de carácter metodológico, es decir que cuantitativamente y cualitativamente existe la necesidad de tal agrupamiento, por ejemplo cuando el número de datos de la serie de un fenómeno estudiado es demasiado grande, se vuelve necesario un agrupamiento de datos, así como la presencia de características propias por intervalos de observaciones de una misma especie, también demanda este tratamiento. El agrupamiento señalado consiste en subdividir a la serie en diferentes “categorías “ o “ clases “ y en determinar por separado y mediante técnicas de conteo el número de observaciones pertenecientes a cada una de ellas. Denominamos a este proceso de agrupamiento como distribución de frecuencias y los datos obtenidos en forma tabular conforman la denominada “Tabla de distribución de frecuencias”. Si por ejemplo hemos observado alturas de estudiantes de la facultad de la carrera de contabilidad y Auditoria ( con muestra de 258 alumnos), y estos datos han sido tabulados mediante una distribución de frecuencias, podríamos tener datos como los siguientes: H ( mts ) FRECUENCIA f Lim Real f ( % ) 1.55 - 1.59 15 1.545 - 1.595 5,81 1.60 - 1.64 26 1.595 - 1.645 10,08 1.65 - 1.69 82 1.645 - 1.695 31,78 1.70 - 1.74 75 1.695 - 1.745 29,09 1.75 - 1.79 40 1.745 - 1.975 15,50 1.80 - 1.84 16 1.795 - 1.845 6,20 1.85 - 1.89 3 1.845 - 1.895 1,16 1.90 - 1.94 1 1.895 - 1.945 0, 39 ∑=258 Suponemos que el número de clases de la distribución, corresponde a necesidades metodológicas del estudio del fenómeno. Cada clase cuenta con sus límites normales “superior e inferior“, siendo los valores más grande y más pequeño de la clase respectivamente. Por ejemplo para la primera clase: LNi = 1.55 m

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 41

LNs = 1.59 m Distinguimos además los límites reales de clase que toman en cuenta la aproximación adoptada para las unidades de medidas del fenómeno. Si en nuestro caso la aproximación es de 1 cm, entonces tendremos que: LRi = 1.545 m LRs = 1.595 m Conocemos por “Longitud de clase o tamaño de clase ( i ) “ a la diferencia calculada entre los límites reales de clase. La longitud de la clase será: i= LRs – LRi =1.595-1.545 = 0.05m = 5 cm De fundamental importancia en distribución de frecuencias es el concepto ”marca de clase (Pm) “, debido a que es este valor el que expresa y representa a su categoría o clase. Es en función de la marca que se realizan todos los cálculos estadísticos posteriores. Se calcula como la Media Aritmética de los límites superior e inferior de clase (normales o reales).

Pm = 2

595.1545.1 + = 1.57

Pm = 2

59.155.1 + = 1.57

PROMEDIOS EN DATOS AGRUPADOS PROMEDIOS COMPUTACIONALES.- En datos agrupados distinguimos de igual manera los promedios computacionales y los posiciónales. Entre los computacionales citamos a la media aritmética, la media geométrica y la media armónica. MEDIA ARITMETICA (X).- Se calcula como la relación entre la sumatoria de las frecuencias por las marcas de cada clase, por el número total de observaciones. X = (Σ fj *Pmj) / n Para el caso de DAIC. PROMEDIOS POSICIONALES.- posiciónales se calculan de múltiples maneras. Por ser parámetros que carecen de formulación matemática, las fórmulas que nos permiten su determinación, son de lo mas variadas, y enmarcan aspectos relacionados de ubicación y posicionalmente de los parámetros MEDIANA ( MED ) .- La fórmula mas utilizada para el cálculo de la med es la siguiente:

Med = LRi + (N/2- faa ) * i fcm

en donde: LRi = Límite real inf de la clase med = 1.695 N/2 = Valor posicional para la med . = 129 faa = Frec acum anterior a la clase med = 123 fcm = Frec de la clase med . = 75 i = Longitud de clase o tamaño del intervalo = 0.05

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 42

Med = 1.695 + (129-123)

211∆+∆

* 0.05 = 1.699 75 MODA ( MOD ).- Entre las fórmulas conocidas la mas utilizada se expresa :

Mod = LRicm + * i En donde: Lricm = lim real inferior de la clase modal = 1.645 ∆1 = dif entre la clase modal y la premodal = ( 82-26)= 56 ∆2 = dif entre la clase modal y la posmodal = ( 82-75)= 7 i = Longitud de clase o tamaño del intervalo = 0.05 En nuestro caso la clase que mayor frecuencia tiene es la 3ª fila ( 82 )

Mod =1.645 + 756

56+

*0.05 = 1.689

TERMINOS CLAVE Media aritmética, media geométrica, media armónica, mediana, moda ACTIVIDADES EJERCICIOS: a) MEDIA ARITMÉTICA : (Estadística de John Freund Pág. 51) 3.1 Un productor de comerciales para televisión sabe exactamente cuanto dinero se gastó en la producción de cada uno de los comerciales. De un ejemplo de cada problema en los que estos datos se verían como: a) una población; b) una muestra. 3.2 Los resultados de la elección final de un distrito muestran que los tres candidatos de cierta oficina recibieron 16 255, 11 278 y 3 455 votos. ¿Para qué oficina podrían estar trabajando estos candidatos de manera que estos números constituyeran a) una población; b) una muestra? 3.3 Suponga que se nos da información completa acerca del numero de almuerzos que los ejecutivos de una compañía de seguros cargaron a sus cuentas de gastos durante los primeros meses de 1985. Dé un ejemplo ilustrativo de cada situación donde estos datos se verían como a) una población; b) una muestra. 3.4 Las que siguen son las edades de 20 personas designadas como el cuerpo de un jurado por una corte: 48, 58, 33, 42, 57, 31, 52, 25, 46, 60, 61, 49, 38, 53, 30, 47, 52, 63, 41 y 34. Obtenga su edad media.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 43

3.5 Las siguientes son las pérdidas de peso (en libras) de ocho personas que siguen una dieta prescrita durante cuatro semanas: 5.3, 2.4, 1.9, 3.5, 4.0, 2.6, 2.5 y 1.8. Determine su pérdida de peso media. 3.6 En su toma de posesión, los 10 primeros presidentes de Estados Unidos tenían 57, 61, 57, 57, 58, 57, 61, 54, 68 y 51 años de edad. Calcule la media. 3.7 Al intentar determinar las calorías por ración de lasaña en una asignación de laboratorio de nutrición, 15 estudiantes obtuvieron 329, 335, 347, 318, 316, 322, 330, 351, 362, 315, 342, 346, 353, 327 y 333. Obtenga la media. 3.8 Los registros de una semana de un sitio de automóviles de alquiler muestran las siguientes cantidades (en dólares) que se gastaron en gasolina en cada uno de sus 32 automóviles: 37.87 24.75 38.67 32.45 31.55 50.55 64.50 39.01 69.49 52.83 53.41 60.75 21.45 47.82 40.58 30.56 37.51 34.69 41,88 30.24 15.25 27.63 24.65 45.14 20.11 31.22 41.35 26.27 36.00 38.76 25.68 23.65 Determine el gasto medio de estos automóviles. 3.9 Los registros de 15 personas convictas de diversos crímenes mostraron que, respectivamente, 4, 3, O, O, 2, 4, 4, 3, 1, 0, 2, 0, 2, 1 y 4 de sus abuelos eran nacidos en el extranjero. Determine la media y analice si se puede utilizar para apoyar el argumento de que el "criminal en promedio" tiene dos abuelos nacidos en el extranjero. 3.10 El elevador de un hotel esta diseñado para transportar una carga máxima de 2 000 libras. ¿Se sobrecarga si en un viaje transporta a 8 mujeres que pesan 123 libras y 5 hombres cuyo peso es 174 libras? 3.11 Un puente está diseñado para soportar una carga máxima de 180 000 li-bras. Si en un momento dado se carga con 36 vehículos que tienen un peso medio de 4 630 libras, ¿existe un peligro real de que pudiera derrumbarse? 3.12 Por error, un maestro ha borrado la calificación que recibió uno de 10 estudiantes de su clase en un examen final. Sin embargo, sabe que los alumnos promediaron (tuvieron una calificación media de) 71 en el examen y que los otros 9 estudiantes recibieron calificaciones de 96, 44, 82, 70, 47, 74, 94, 78 y 56. ¿Cuál debe haber sido la calificación que borró el maestro? 3.13 Las horas de sueño que ha tenido un estudiante durante cada una de las 10 noches anteriores son 6, 8, 2, 13, 9, 7, 6, 5, 10 y 7. Determine la media y analice su utilidad en la descripción de la "mitad" de los datos. 3.14 Se presentó una nota en la legislatura de un estado para revocar el im-puesto de venta de medicinas sobre prescripción. Comente el argumento del director financiero del estado de que la nota de prescripción percápita en promedio (media) de los cuatro años anteriores fue un frívolo $5.20, que en realidad no es una carga para nadie. 3.15 Los registros muestran que en Phoenix, Arizona, la temperatura máxima diaria normal de cada mes es 65, 69, 74, 84, 93, 102,105, 102, 98, 88, 74 y 66 grados Fahrenheit. Verifique que la media de estas cantidades sea 85 y comente la afirmación de que, en Phoenix, la temperatura máxima diaria en promedio es de 85 grados, que es muy agradable. 3.16 Las mediciones cuidadosas muestran que el contenido real de café de seis jarras de café instantáneo es 6.03, 5.98, 6.04, 6.00, 5.99 y 6.02 onzas de café. ¿Cuál habría sido el error en el contenido medio de café de las seis jarras si el tercer valor se hubiese registrado en forma equivocada como 6.40? 3.17 Si alguien invierte $1 000 al TV», $3 000 al 7.5% y $16 000 al 8%, ¿cuál es el rendimiento porcentual total de estas inversiones?

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 44

3.18 En un año reciente, los salarios medios o en promedio de maestros de primaria en Oregon, Washington y Alaska fueron de $13 300, $14 500 y $21 000 respectivamente. Dado que había 13 000, 17 200 y 2 400 maestros de primaria en estos estados, determine el salario promedio de todos los maestros de primaria de los tres estados. b) MEDIANA (Estadística de John Freund Pág. 61) 3.25 Determine la posición de la mediana de a) n=15 y b) n=40. 3.26 Determine la posición de la mediana de a) n = 17 y b) n=30. 3.27 Obtenga la posición de la mediana de a) n = 39 y b) n=150. 3.28 En 1985, 12 vendedores de autos usados vendieron, respectivamente, 58, 70, 85, 42, 64, 46, 66, 89, 44, 93, 58 y 79 automóviles usados. Determine la mediana. 3.29 Los siguientes son los números de comidas de restaurantes que ingirieron 13 personas durante una semana dada: 3, 10, 5, 1, 8, 5, 6, 12, 15, 1, 0, 6 y 5. Obtenga la mediana. 3.30 Al copiar un informe, los 16 alumnos de una clase de mecanografía co-metieron O, 1, 3, O, O, O, O, 4, O, O, 1, 2, O, 1, O y 2 errores. Determine a) la media; b) la mediana. Discuta los méritos relativos de los dos resultados. 3.31 Veinte fallas de energía duraron 18, 125, 44, 96, 31, 26, 80, 49, 125, 63, 45, 33, 89, 12, 103, 75, 40, 80, 61 y 28 minutos. Determine la mediana. 3.32 En el ejercicio 3.4 se dieron las edades de 20 personas designadas para desempeñar la función de jurado. Halle la mediana. 3.33 Obtenga la mediana de la distribución en relación con el número de películas de largo metraje que habían visto 400 personas por televisión durante una semana dada. P=número de películas NP=número de personas

P NP 0 1 2 3 4 5 6 7 8

72 106 153 40 18 7 3 0 1

400

3.34 Veinticinco juegos de la NBA duraron, respectivamente, 138,142,113, 126,135,142,159,157,140,157,121,128,142,164,155,139,143,158, 140, 118, 142, 146, 123, 130 y 137 minutos. Determine la duración mediana de estos juegos a) en forma directa; b) construyendo antes una gráfica de tallo y hoja.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 45

3.35 A cada una de 15 personas que solicitaba fondos para una organización de caridad se le asignó una cuota (cantidad de dinero) que debía recaudar y los siguientes son los porcentajes de sus cuotas respectivas que lograron en realidad: 92, 107, 353, 90, 78, 80, 74, 92, 102, 86, 106, 109, 95, 102 y 91. Calcule la media y la mediana de estos porcentajes e indique cuál de los dos registros constituye una indicación más precisa del desempeño en "promedio" de estas personas. 3.37 Para verificar la afirmación de que la media es, por lo general, más con-fiable que la mediana (es decir, que está sujeta a fluctuaciones de oportunidad menores), un estudiante realizó un experimento que consistía en tomar 15 veces tres cartas de una pila ordinaria de 52 cartas de juego, después de haber quitado las sotas, las reinas y los reyes. Los que siguen son los resultados: 8, 3 y 2; 6, 6 y 7; 3, 5 y 9; 4, 4 y 10; 8, 3 y 8; 10, 1 y 4; 7,10 y 4; 1, 3 y 1; 5,1 y 9; 8,10 y 3; 4, 5 y 9; 5, 3 y 8; 3, 6 y 7; 1, 8 y 8; y 10, 5 y 6. a) Calcule las 15 medianas y las 15 medias. b) Agrupe las medianas y las medias que se obtuvieron en el inciso a) en distribuciones aparte que tengan las clases 0.5-2.5, 2.5-4.5, 4.5-6.5 y 6.5-8.5. (No puede haber ambigüedades ya que las medianas y las medias de tres números redondos no pueden ser iguales a 2.5, 4.5 o 6.5.) c) Trace histogramas de las dos distribuciones que se obtuvieron en el inciso b) y explique cómo ilustran la afirmación de que la media suele ser más confiable que la mediana. 3.38 Para verificar la afirmación de que la media suele ser más confiable que la mediana (es decir, que está sujeta a menores fluctuaciones de oportunidad), un estudiante realizó un experimento que consistía en lanzar 12 veces tres dados. Los siguientes son sus resultados: 2, 4 y 6; 5, 3 y 5; 4, 5 y 3; 5, 2 y 3; 6, 1 y 5: 3, 2y 1;3, 1 y 4; 5, 5 y 2; 3, 3 y 4; 1, 6y 2; 3, 3 y 3; y 4, 5 y 3. a) Calcule las 12 medianas y las 12 medias. b) Agrupe las medianas y las medias que se obtuvieron en el inciso a) en distribuciones aparte que tengan las clases 1.5-2.5, 2.5-3.5, 3.5-4.5 y 4.5-5.5. (Observe que no habrá ambigüedades debido a que las medianas y las medias de tres números redondos no pueden ser iguales a 2.5, 3.5 o 4.5.) c) Trace histogramas de las dos distribuciones obtenidas en el inciso b) y explique cómo ilustran la afirmación de que la media suele ser más confiable que la mediana. 3.39 Repita el ejercicio anterior con sus datos lanzando tres dados en forma repetida (o un dado tres veces) y construya distribuciones correspondientes de las 12 medianas y las 12 medias. (Si no dispone de dados, simule el experimento en forma mental o sacando pedazos de papel numerados de un sombrero.) 3.40 Un servicio de investigaciones para el consumidor obtuvo los siguientes datos en millas por galón de cinco corridas de prueba realizadas con cada uno de tres automóviles compactos: Auto A: 27.9, 30.4, 30.6, 31.4, 31.7 Auto B: 31.2, 28.7, 31.3, 28.7, 31.3 Auto C: 28.6,29.1,28.5,32.1,29.7

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 46

a) Si los fabricantes del automóvil A desean anunciar que su automóvil tuvo un mejor desempeño en esta prueba, ¿cuáles de los "promedios" que se estudian en este libro se pudieran utilizar para verificar su afirmación? b) Si los fabricantes del automóvil B desean anunciar que su automóvil tuvo un mejor desempeño en esta prueba, ¿cuáles de los promedios que se estudian en este libro pudieran usar ellos para verificar su afirmación? *3.41 Suponga que los fabricantes del automóvil C del ejercicio anterior contratan a un estadístico poco escrupuloso y lo instruyen para obtener alguna clase de "promedio" que demostrará que su automóvil tuvo un mejor desempeño en esta prueba. Muestre que el rango medio, que se define como la media de los valores menor y mayor, servirá a sus fines. 3.42 Determine las posiciones de la mediana, Qi y q} cuando n = 21, y verifique que haya tantos valores a la izquierda de la posición de Q¡ como entre la posición de Qi y la de la mediana, entre la posición de la mediana y 63 y a la derecha de la posición de Q¡. 3.43 Vuelva a realizar el ejercicio anterior con n = 18. 3.44 Vuelva a hacer el ejercicio 3.42 con n = 20. 3.45 Con referencia al ejercicio 3.29, determine gi y Q^ para los números de comidas del restaurante que ingirieron las 13 personas durante la semana dada. 3.46 Con referencia al ejercicio 3.31, obtenga Q^ y Q¡ para las duraciones de las fallas de energía. c) Moda (Estadística de John Freund Pág. 65) 3.50 Las siguientes son las cantidades de tiempo (en minutos) que 16 personas pasaron formadas en una fila para comprar boletos para un concierto: 8, 2, 9, 1, 16, 5, 7, 11, 9, 1, 14, 12, 9, 0, 8, 4. ¿Determine la moda? 3.51 Una inspección de 18 trabajos de plomería domésticos recién terminados en una ciudad arrojaron O, 1, 3, O, O, O, 1, O, 4, 1, O, 1, 1, 2, O, 1, O y 2 vio-laciones al código de construcción de la ciudad. Obtenga la moda. 3.52 Con referencia al ejercicio 3.29, determine la moda del numero de comidas del restaurante que ingirieron las personas. 3.53 Con referencia al ejercicio 3.34, obtenga la moda de las duraciones de los juegos de baloncesto. Con referencia a los datos, determine la moda de las calificaciones de contabilidad de los 50 alumnos.

73 65 82 70 45 50 70 54 32 75 75 67 65 60 75 87 83 80 72 64 58 75 89 70 73 55 61 78 89 93 43 51 59 38 65 71 75 85 65 85 49 97 55 60 76 75 69 35 45 63

3.55 Cuando se les preguntó cuál era su color favorito, 50 personas dijeron: rojo, azul, azul, verde, amarillo, azul, café, rojo, azul, rojo, rojo, verde, blanco, azul, rojo, verde, azul, rojo, verde, verde, morado, blanco, amarillo, azul, azul, azul, rojo, rojo, café, anaranjado, blanco, verde, azul, azul, negro, rojo, azul, rojo, amarillo, verde, amarillo, azul, azul, anaranjado, rojo, verde, blanco, morado, azul y rojo. ¿Cuál fue su elección modal?

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 47

3.56 A 40 votantes registrados se les preguntó si se consideraban a si mismos como demócratas, republicanos o independientes. Utilice los siguientes resultados para determinar su elección modal: demócrata, republicano, independiente, independiente, demócrata, independiente, republicano, republicano, independiente, demócrata, demócrata, independiente, demócrata, independiente, republicano, independiente, independiente, independiente, demócrata, demócrata, republicano, independiente, independiente, republicano, republicano, demócrata, republicano, demócrata, independiente, independiente, demócrata, demócrata, independiente, republicano, independiente, independiente, demócrata, independiente, republicano, demócrata. BIBLIOGRAFÍA DE LA UNIDAD • Freud John. ESTADÍSTICA. CUARTA EDICIÓN. Edit Prentice Hall Pág.44-66 • Kasmier Leonard. ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y

ECONOMIA. (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 39-50

• Spiegel Murray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 60-90

• Stephen P. Shao . ESTADISTICA PARA ECONOMISTAS Y

ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. Pág. 5197-216

UNIVERSIDAD TECNICA DE AMBATO

UNIDAD 4

OBJETIVO DE LA UNIDAD • Calcular medidas de desviación media, varianza, desviación estándar con DNA,

DAF, DAIC.

Medidas de variabilidad Cuartiles, deciles y percentiles Amplitud o rango Desviación media Varianza Desviación estándar.

CUANTILES El sufijo “ILES“ estadísticamente significa el # de partes en que dividimos una serie.

Los cuantiles o medidas de orden que se comportan así como la Me divide a la distribución en dos partes iguales, tenemos otras medidas que dividen a la distribución en 4, 5, 10 y 100 partes iguales, las mismas que se conocen COMO los cuartiles, quintiles, deciles y percentiles respectivamente.

La concepción, procedimiento e incluso la fórmula es similar a la Me, lo único que se cambia es n/2.

• Cuartil (Q), tiene tres cortes. Q1 Q2 Q3 25% 25% 25% 25%

Así el Q1 es el valor que supera al 25 % de los datos, mientras es superado por el 75% restante.

Q2, es el valor que se encuentra en la mitad, es decir, tiene el 50% de las observaciones a cada lado, es decir igual que la mediana.

Q3, es el valor que supera el 75% de los datos y es superado por el 25% restante.

• Decil (D), tiene 9 cortes.

D1 D2 D3 D4 D5 D6 D7 D8 D9

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 49

10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 % 10 %

D2, valor que supera el 20% y es superado por el 80% restante.

• Percentiles (P), tienen 99 cortes.

P37, valor que supera el 37% y es superado por el 63% de la distribución.

FÓRMULAS:

n41 Primer cuartel

( )

−+=

j

j

j n

Nn

ClQ1

14

1

n42 Segundo cuartel

( ) ( )

−+=

−+=

−−

j

j

jj

j

j n

Nn

Cln

Nn

ClQ11

224

2

n43 Tercer cuartil

( )

−+=

j

j

j n

Nn

ClQ1

34

3

n107 Séptimo decil

( )

−+=

j

j

j n

Nn

ClD1

7107

n10037 Percentil 37

( )

−+=

j

j

j n

Nn

ClP1

3710037

Ejercicios:

1. Calcular: Q1 =? Me =? Q3 =? D9 =? P3 =? P87 =? ---------------------------------------------------- No Intervalos Yi ni Ni ---------------------------------------------------- 1 89-91 90 1 47 2 86-88 87 5 46

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 50

3 83-85 84 9 41 4 80-82 81 12 32 5 77-79 78 8 20 6 74-76 75 6 12 7 71-73 72 4 6 8 68-70 69 2 2 65-67 66 0 0 ---------------------------------------------------- 47 ---------------------------------------------------- 1.1 SOLUCIÓN

1n/4 = 47/4 = 11.75 Cj = 3 Nj-1=6 l = (75+72)/2 = 147/2 = 73.5

( )

−+=

j

j

j n

Nn

ClQ1

14

1

+=6

675.1135.731Q

375.761 =Q

1.2 SOLUCIÓN:

n/2 = 47/2 = 23.5

Cj = 3

Nj-1= 20

nj = 12

l = (78+81)/2 =79.5

−+=

j

j

je n

Nn

ClM12

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 51

2375.8012

205.2335.79

QM

M

e

e

==

+=

1.3 SOLUCIÓN:

3n/4 =(3*47)/4 = 35.25

Cj = 3

Nj-1= 32

nj = 9

l = (81+84)/2 = 82.5

+=9

3225.3535.823Q

583.833 =Q

1.4 SOLUCIÓN:

9n/10 =(9*47)/10 = 42.3

Cj = 3

Nj-1= 41

nj = 5

l = (84+81)/2 = 85.5

+=5

413.4235.859D

28.869 =D

1.5 SOLUCIÓN:

3n/100= (3*47)/100 = 1.41

Cj = 3

Nj-1= 0

n3 = 2

l = (67+68)/2 = 67.5

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 52

+=2

041.1350.673P

615.693 =P

1.6 SOLUCIÓN:

87n/100 =(87*47)/100 = 40.84

Cj = 3

Nj-1= 32

l = (81+84)/2 = 82.5

+=9

3289.4035.8287P

461.8587 =P DESVIACION CUARTILICA O RANGO SEMIINTERCUARTILICO (DQ).- Conocemos por rango intercuartílico a la expresión Q3-Q1; siendo la desviación cuartílica, el rango intercuartílico dividido por dos.

DQ = (Q3 - Q1)/2 En nuestro caso: Q1=9.7; Q3=7.925

DQ = (9.7-7.925)/2 = 1.775/2 = 0.888

MEDIDAS DE DESVIACION Y DISPERSION

Desviación y dispersión estadísticas son conceptos que denotan el grado de alejamiento de los valores de la serie tomados como un todo, respecto de sus promedios (generalmente de la Media aritmética y la Mediana. Entre los principales podemos citar: RANGO O RECORRIDO (R).- Es la medida de la longitud o el espacio del desarrollo de la serie. Se calcula como la diferencia entre el valor máximo y mínimo. Para la serie que analizamos:

R = 10.0-6.5 = 3.5 DESVIACION MEDIA ABSOLUTA (MAD).- Este parámetro se define como la media aritmética de las desviaciones de la serie tomadas en valor absoluto respecto de la media aritmética o de la Mediana de la misma. MAD = Σ |Xi- X| / N o MAD =Σ |Xi- Med| / N çRespecto de la media aritmética:

DATO |Xi-Xm| 10.0 9.9 9.6

1.383 1.283 0.983

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 53

8.0 7.7 6.5

0.617 0.917 2.117

∑=7.300 N=6 Suma: 7.300 MAD = 7.300/6 = 1.217 DESVIACION TIPICA O STANDAR (σ).- Matemáticamente se expresa como la raíz cuadrada de la media aritmética de las desviaciones cuadráticas de la serie respecto de la media aritmética o de la mediana.

σ = (Σ(Xi- X)2 /N) 1/2

Dato (Xi-X)2

10.0 1.913 9.9 1.646 9.6 0.966 8.0 0.381 7.7 0.841 6.5

4.482 Suma:10.229 ; σ = (10.229/6)1/2 = 1.306 VARIANZA (σ)2.- No es sino el cuadrado de la desviación standar. Es decir:

V = σ2 = Σ(Xi- X)2 /N = 1.705 COEFICIENTE DE VARIACION CV.- Es la razón de la desviación standar respecto de la media aritmética, generalmente expresada en forma porcentual, es decir:

CV = σ/X (%) CV = 1.306 / 8.617 = 0.152 * 100 = 15.156%

DATOS AGRUPADOS CON FRECUENCIA Y DAIC CUANTILES: Estos parámetros posicionales también son para datos agrupados : Cuantìles, Decìles y Percentiles los mas utilizados respectivamente se calculan de la manera siguiente: CUARTILES ( Qi ): Para los Cuartiles las fórmulas más utilizadas son: Q1 = Lricq + ( N/4 - faa ) * k fq1 Q2 = Lricq + ( 2N/4 - faa ) * k = Med fq2 En nuestro caso tendremos:

Q1 = 1.645 + ( 64.5 - 41 ) * 0.05 82

Q1 = 1,659 Q2 = 1.695 + ( 124 - 123 ) * 0.05

75 Q2 = 1.699 Q3 = 1.695 + ( 193,5 - 123 ) * 0.05

75

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 54

Q3 = 1.742 DECILES Y PERCENTILES ( Pi , Qi ): Las fórmulas utilizadas tienen el mismo principio que para el cálculo de los Cuartiles. Enunciaremos algunas de ellas. D3 = Lricd + ( 3N/10 - faa ) * k

fd D8 = Lricd + ( 8N/10 - faa ) * k fd D8 = 1.645 + ( 77.4 - 41 ) * 0.05 = 1.667 82 P17 = Lricp + ( 17N/100 - faa ) * k = 1.647 fp P39 = Lricd + ( 39N/100 - faa )

* k = 1,6814 fp

MEDIDAS DE DESVIACION Y DISPERSIÓN Al igual que para los datos no agrupados los promedios de desviación y dispersión nos dan una idea del grado de alejamiento o separación de los valores de la serie, respecto de un promedio ( generalmente la media aritm o la med ) . En su orden podemos calcularlos de la siguiente manera . RANGO

DESVIACION MEDIA ABSOLUTA ( DMA ) Este parámetro de dispersión que tiene el mismo sentido para los datos no agrupados se calcula mediante las fórmulas: DMA = ∑ fj

.-No es sino la diferencia entre el límite superior de la última categoría menos el límite inferior de la primera categoría . R = Lns - Lni = 1.94 - 1.55 = 0,39 m

xj - X DMA = ∑ fj xj – Med| N N En el caso nuestro tendremos que: DMA = 13.46 = 0.052 DMA = 13.452

DESVIACION ESTÁNDAR Para datos agrupados la desviación standard se calcula mediante la fórmula: S = √

= 0.05213 258 258

Σ fj( xj- Xm )2 N S = √ Σ fj( xj- Med )2 N En nuestro caso: S = √ 1.0852 / 258 = 0.0648

S = √ 0.90486 0/ 258 = 0.0672 VARIANZA Siendo este parámetro igual a S2 , en nuestro caso tendremos :

S2 = 1.0852 S2 = 1.1652

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 55

TERMINOS CLAVE Desviación media, cuantiles, Cuartiles, deciles, percentiles, desviación estándar, varianza. ACTIVIDADES: Con los ejercicios del tema anterior calcule Cuartiles deciles y percentiles el DNA y DAIC. Ejercicios : (Estadística de John Freund Pág. 92) 3.89 Determine X m y S de la siguiente distribución de los ingresos semanales de 125 personas que reciben un sueldo: Ingresos semanales Ingresos semanales

(en dólares) Frecuencia

120.00-129.99 130.00-139.99 140.00-149.99 150.00-159.99 160.00-169.99 170.00-179.99 180.00-189.99

9 20 36 30 15 11 4

*3.90

Numero de boletos De la rifa

Obtenga la media y la desviación estándar de la distribución de edades del ejercicio 2.19 de la página 25. *3.91 Determine la media y la desviación estándar de la siguiente distribución de los costos totales de viaje de 200 estudiantes en unas vacaciones de dos semanas por Europa: Costó del viaje (en dólares) Frecuencia 1 600 - 1 799 12 1 800 - 1 999 31 2 000 – 2 199 73 2 200 - 2 399 57 2 400 - 2599 16 2 600 -2 799 7 2 800 -2 999 4 *3.92 Los que siguen son los números de minutos que un médico tuvo espe-rando a 60 pacientes después de las horas de sus citas: 12.1 9.8 10.5 5.6 8.2 0.5 6.8 10.1 17.2 4.2 8.3 1.3 7.9 11.3 6.3 7.2 9.3 9.9 7.2 12.7 1.2 4.6 10.3 8.5 10.0 12.8 9.6 13,5 10.8 5.1 12.7 11.5 3.8 12.9 13.0 3.9 7.5 16.1 11.1 8.3 9.6 6.4 15.7 5,8 9.7 11.9 2.4 5.2 8.4 16.7 2.5 13.0 4.8 10.7 11.4 9.3 4.7 6.0 9.5 14.6 Agrupe estos datos en una distribución con las clases 0.0-2.9, 3.0-5.9, 6.0-8.9, 9.0-11.9, 12-14.9 y 15.0-17.9, y después obtenga la media y la desviación estándar. *3.93 Obtenga la mediana de la distribución del ejercicio 3.89.

frecuencia

menos de 30 28

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 56

C)PESO FRECUENCIA 100 o menos

101-110 111-120 121-130 131-140

41 13 8 3 1

A)calificación frecuencia B) CI FRECUENCIA

40-49 50-59 60-69 70-79 80-89

5 18 27 15 6

menos de 90 90-99 100-109 110-119

más de 119

3 14 22 19 7

*3.94 Determine la mediana de la siguiente distribución de los números de boletos de rifa que vendieron los 70 miembros de una organización de servicio social:

*3.95 Determine la mediana de la distribución del ejercicio 2.19 de la página 25. *3.96

Obtenga la mediana de la distribución del ejercicio 3.91. *3.97 Si es posible, encuentre Q1 y Q3 de la distribución del ejercicio 3.94. *3.98 ¿Es posible determinar la media y la mediana de cada una de las siguien-tes distribuciones? Explique sus respuestas.

*3.99 Determine Q1 y Q3, de la

distribución del ejercicio 2.19 de la página 25. *3.100 Con referencia al ejercicio 3.92, determine los tiempos de espera más corto y más largo y utilice la distribución que se obtuvo en el ejercicio para determinar Q1, la mediana y Q3. Asimismo, utilice los resultados para trazar una gráfica. *3.101 Con referencia al ejercicio 2.19 de la página 25, suponga que el miembro más joven del club de servicio de presentación tiene 20 y el más viejo. tiene 53. Utilice esta información junto con los resultados de los ejercicios 3.95 y 3.99 para trazar una gráfica. *3.102 Si es posible, obtenga P10, P40 y P90 para la distribución del ejercicio 3.94. *3.103 Con referencia al ejercicio 3.91, determine P10 y P90 *3.104 Con referencia al ejercicio 3.92, obtenga P10 y P90. *3.105 Emplee los resultados de los ejercicios 3.89 y 3.93 para calcular el coeficiente pearsoniano de asimetría (SK= 3(media – mediana)/desviación estándar ) para la distribución de los ingresos semanales. *3.106 Use los resultados de los ejercicios 3.90 y 3.95 para calcular el coeficien-te pearsoniano de asimetría (SK= 3(media – mediana)/desviación estánda) de la distribución de las edades de los miembros del club de servicio de presentación. *3.107

30-44 45-59 60-74 75-89

Emplee los valores de xy s que se obtuvieron en el ejercicio 3.92 y el va-lor de la mediana obtenido en el ejercido 3.100 para calcular SK para la distribución de las duraciones de los tiempos de espera. *3.108 Tire un par de dados 120 veces y construya una distribución que muestre cuántas veces hubo O seises, cuántas veces hubo 1 seis y cuántas hubo 2 seises. Trace un histograma de esta distribución y describa su forma.

19 10 8 5

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 57

*3.109 Si una moneda se lanza al aire cinco veces, el resultado se puede repre-sentar por medio de una serie de letras A y S (por ejemplo, AASSA), donde A representa las águilas y S los soles. Habiendo obtenido esta serie de aes y eses (A y S), entonces se puede verificar después de cada lanzamiento sucesivo si el número de águilas excede el número de soles. Por ejemplo, para la serie AASSA, las águilas van adelante después del primer lanzamiento, después del segundo, del tercero, no después del cuarto, pero una vez más después del quinto lanzamiento; en total, están adelante cuatro veces. Repita este experimento 50 veces y construya un histograma que muestre en cuántos casos las águilas estuvieron adelante en total O veces, 1 vez, 2 veces,... y 5 veces. Explique por qué la distribución resultante debe ser en forma de U. *3.110

• Freud John. ESTADÍSTICA. CUARTA EDICIÓN. Edit Prentice Hall Pág.44-66

Utilice un paquete de computadora o una calculadora estadística preprogramada para determinar la media y la desviación estándar de los datos no procesados del ejercicio 3.92. Determine los errores de agrupación respectivos comparando los resultados con los ejercicios 3.92. BIBLIOGRAFÍA DE LA UNIDAD

• Kasmier Leonard. ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMIA. (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 43 y 47

• Spiegel Murray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 90-115

• Stephen P. Shao . ESTADISTICA PARA ECONOMISTAS Y ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. Pág. 217-248

UNIVERSIDAD TECNICA DE AMBATO

UNIDAD 5

OBJETIVO DE LA UNIDAD • Analizar los valores de las puntuaciones tipificadas y la curva normal

MOMENTOS ESTADÍSTICOS CURVA NORMAL

PUNTUACIONES Z

MOMENTOS ESTADÍSTICOS

Son formulaciones matemáticas, que se definen como parámetros estadísticos, algunos de ellos cuales tienen amplia connotación dentro del estudio de curvas de distribución de frecuencias y más específicamente respecto del sesgo y de la curtosis Distinguimos los momentos indefinidos de grado r ( Xr) y los momentos respecto de la media, de grado r ( Mr ). Para datos no agrupados: Xr =

Mientras para datos Agrupados: Xr =

∑ Xir

N Mr = ∑ ( Xi -

X )r

∑ fj Mjr

N Mr =

SESGO Y CURTOSIS

∑ fj ( Mj - X ) r

N

Estos dos conceptos aun cuando en su esencia diferentes, se manejan en forma paralela, puesto que ambos definen características de suma importancia para las distribuciones de frecuencia y sus curvas representativas (Polígonos de Distribución Suavizado). El sesgo no es otra cosa que el grado de asimetría que describe una curva de distribución, tomando como

referencia una curva de distribución normal y por tanto simétrica. Mod = Med = X

Si el sesgo describe una curva cuya cola mas larga se encuentra del lado derecho entonces la curva es positivamente sesgada.

Mod < Med < X

Decimos que la distribución es negativamente sesgada, cuando la cola mas larga se encuentra del lado izquierdo de la misma.

Mod < Med < X

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 59

Existen múltiple fórmulas para determinar el sesgo de una distribución; algunas de ellas empíricas y otras con sustento matemático. Entre las más importantes señalaremos: Sesgo =

Que puede reemplazarse por: Sesgo =

X - Mod S

3 ( X - Med ) S Debido a que empíricamente se tiene que X - Mod ≡ 3 ( X - Med ). Estas fórmulas son aplicables cuando las distribuciones son desde ligeras a medianamente sesgadas. Se conocen como Coeficiente de Sesgo Pearson 1 y 2. También tenemos el coeficiente de sesgo cuartílico que se expresa como: ∆Q = Q3 - 2Q2 + Q1 Q3 - Q1 Con sustento matemático la fórmula más importante es: a3 =

M3 S3

Todos estos coeficientes de sesgo serán iguales a cero para distribuciones normales - simétricas; serán positivas para distribuciones con sesgo derecho; y si las distribuciones tienen sesgo izquierdo entonces los coeficientes serán negativos.

Entendemos por curtosis al grado de apuntamiento o achatamiento que

presenten las curvas de distribución de frecuencia. Distinguimos curvas Leptocúrticas, Mesocúrticas y Platicúrticas Así :

Generalmente la curtosis de una distribución se calcula mediante el coeficiente de curtosis percentílica “ A4 “, los mismos que se determinan mediante las fórmulas: A4 = M4 S4 K = DQ . P90 - P10 DQ = Q3 - Q1 2 Una distribución normal se dice que es Mesocúrtica siendo su coeficiente A4 = 3 y siendo K = 0,263 Siendo A4 > 3 o lo que es lo mismo k > 0.263 la curva será leptocúrtica, mientras que A4 < 3 o lo que es lo mismo k < 0.263 la curva será platicúrtica. El sesgo y la curtosis aparecen también permanentemente en forma combinada.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 60

PUNTUACIONES TIPIFICADAS.

Valores σµ−

=Xz =

Sd

El valor z nos indica cuántas S un valor se separa de la Xm del grupo.

Cualquier distribución puede ser transformada a valores z. Los valores z utilizan

como unidades de medida a las S.

Como 3 S a cada lado de la CN incluyen prácticamente a todos los casos, se deduce que la mayor puntuación z que encontrarse es –3 a 3

La distribución de las z tienen siempre: X = O y S = 1

Como los valores z se expresan con decimales positivos y negativos, se pueden complicar los cálculos, transformándose la z en Z. VALORES Z

Z = 1Oz + 50

La distribución de la Z tienen siempre: X = 50 y S = 10

Las puntuaciones tipificadas transforman los puntajes crudos en unidades iguales y comparables.

1. Sirven para la investigación, ya que se utilizan en la verificación científica de las hipótesis.

2. Se utilizan en el área pedagógica, fundamentalmente en la evaluación, ya que son unidades de medida, iguales y pueden operarse matemáticamente.

Ejemplos: Un estudiante obtiene en Álgebra una calificación de 65 y en la asignatura de

Inglés una calificación de 32 puntos. Determinar en cuál asignatura está mejor ubicado, conociendo que en álgebra el grupo obtuvo un promedio de 45 y una desviación estándar de 20, mientras que en inglés la media fue de 20 y la desviación típica de 5.

1. Álgebra: X = 45; S=20 Q Juan 65

2. Inglés: X= 20; s = 5 Q Juan 32

z65 = (65 –45)/20 = 20/20 = 1 z32 =(32-20)/5 =12/5= 2.4

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 61

EMPLEO DE LAS PUNTUACIONES TIPIFICADAS Valores t y valores z: En una CN, los valores z y los valores t son iguales. Los valores z se utilizan cuando la Curva es Normal. Los valores t se utilizan cuando la Curva no es Normal. Los valores z se utilizan para distribuciones simétricas. Los valores t se utilizan para distribuciones asimétricas. Valores z para muestran grandes (más de 30) Valores t para muestras pequeñas (menos de 30) La fórmula de los valores t es igual a la de los valores z, la diferencia esta en que los valores t se interpretan en función de los denominados "Grados de Libertad".

RANGO PERCENTIL.( RP)

Los valores z, Z y t se denominan también valores standard, y en función de los puestos tenemos la siguiente relación:

NPRP 50100100 −

−=

Ejemplo: En una clase hay 48 alumnos; Juan tiene el puesto 12. Calcular RP

4850)12(100100 −

−=RP RP= 76

Esto quiere decir que Juan tiene el Percentil 76 ( P76) está sobre el 76% de la clase. Percentil 53 quiere decir que está sobre el 53% de la clase.

Md = Q2= Percentil 50 = Decil 5

LA CURVA NORMAL Curva de error curva de campana, curva gauss o curva De Moivre.

Los polígonos obtenidos de diversos acontecimientos se aproximan más o menos a la Curva Normal.

CARACTERÍSTICAS: La CN es asintótica La CN es simétrica La CN es unimodal Casi todos los casos Están entre ± 3 S El área bajo la CN que representa una distribución de frecuencias presenta gráficamente todos los sucesos posibles (probabilidades). UTILIZACIÓN DE LA TABLA Y PROBLEMAS SOBRE CURVA NORMAL.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 62

Las tablas dan el porcentaje del área de la CN que se encuentra entre la Xm y las ordenadas "y" levantadas en diversos sitios. Distribución Normal La curva normal, conocida también como Campana de Gauss o Curva de Moivre, es producto de la representación gráfica de distribuciones infinitas que permite establecer con exactitud la suposición de continuidad en la teoría estadística, es una teoría que sirve para explicar la relación entre intervalos de sus valores y sus correspondientes probabilidades, además muchos estadígrafos muéstrales tienen una distribución normal e independiente de la distribución poblacional siempre que la muestra sea lo suficientemente grande, la distribución normal se encuentra definida por la µ y σ, en consecuencia la configuración de la curva normal depende de la media µ y la desviación típica σ (puede tener diferente media y la misma desviación σ o la misma media µ y diferente desviación típica σ). Así, cerca del 99.73% de todas las observaciones quedan dentro de un intervalo de tres desviaciones típicas a partir de su media P (µ -3 σ < µ < µ +3σ)= 99,73% y la probabilidad de que la Xm quede a menos o más de una o dos desviaciones típicas de su media es el 68,27% y el 95,45% respectivamente. La curva como se ve es simétrica, respecto a su media. Tenga en cuenta que: • Los puntajes o valores X tienden a agruparse alrededor del valor central

o puntaje cero.

• La curva normal es simétrica respecto a su eje vertical.

• Los extremos de la campana son asíntotas.

• La media, la mediana, el modo se localiza en un mismo punto, que es el de Z=0.

• El eje vertical de la curva divide exactamente por la mitad el área bajo la curva.

• La media se calcula igual que en la distribución binomial.

µ= NP

σ2 = NPQ

NPQ=σ Una de las aplicaciones de la curva normal es que nos permite delimitar las áreas que corresponden a determinados intervalos que va de la media a una ordenada cualquiera. La distribución que representa las variables se conoce como DISTRIBUCIÓN NORMAL TÍPICA, y se llama variable Z, que tiene aplicación en problemas de estima estadística y contraste de hipótesis, se define:

σµ−

=Xz

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 63

Z es la diferencia de una observación con respecto de la media en unidades de desviación típica. Así los cocientes de inteligencia de un gran grupo de estudiantes, tiene

como µ = 100 y como desviación típica σ=10, se desea saber la probabilidad de que IQ de cualquier persona quede dentro del intervalo de 100 a 110. La probabilidad de que un alumno elegido al azar tenga un IQ entre 100 y 110 es aproximadamente el 34.13 %. Si el grupo de alumnos tomados para la prueba es de 2000. ¿Cuál es la probabilidad del número de alumnos que tendrán un cociente de 135 puntos?

55.310

1005.135=

−=

−=

σµXz A= 0.4998 (ver tabla z)

45.310

1005.134=

−=

−=

σµXz A=0.4997 (ver tabla z)

A1-A2 = 0.4998 –0.4997 = 0.0001 %A = 0.01 (REGLA DE TRES) 100 - 2000 0.01 - x= 2000. (0.01)/100 = 0.2

PERSONAS No hay un cociente de 135 puntos.

TERMINOS CLAVE Curva normal, momento, Sesgo, simétrica, asimétrica, puntuación z, puntuación t . ACTIVIDADES Resuelva los ejercicios 1.- En una investigación realizada en un grupo de alumnos, se determina que el estudiante A obtiene una puntuación de 14,8 / 20 en la asignatura de Estadística, recibida en el paralelo A con la guía del profesor A. El estudiante B en el paralelo B, en la asignatura de Estadística, con el mismo profesor A obtiene una puntuación de 17,9 / 20. Determine cuál de los dos estudiantes está mejor ubicado en su respectivo paralelo, conociendo que en la asignatura de Estadística, en el paralelo A se obtuvo un promedio de 12 y una S=1,3 y en el paralelo B se obtuvo una media de 16 y una S=2,1.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 64

2.- En una empresa, Carolina obtuvo un sueldo de 108 dólares, sabiendo que el promedio de sueldos en la empresa de 180 dólares y la S = 15, encuentre el porcentaje de empleados que superan el sueldo de Carolina. 3.- Los puntajes obtenidos en una prueba de rendimiento motor hecha con 2.000 estudiantes que participan en deportes, están distribuidos normalmente y tienen una media y una desviación estándar de 45 y 5 respectivamente. Encontrar el número de estudiantes que están entre 47 y 52,5.

4.- Los resultados de los exámenes de tres asignaturas en una clase son los que figuran en la tabla inferior. A la derecha se encuentran las calificaciones obtenidas por una alumna, Isabel.

Examen

X

S

Calificaciones de Isabel

Matemática 40

12

44 Contabilidad 25

8

30

Economía

110

15

108

Utilizando valores Z determine:

En cuál de los tres exámenes obtuvo mejor resultado.

Cuál es el promedio de rendimiento de Isabel en las tres asignaturas. BIBLIOGRAFÍA DE LA UNIDAD Freud John. ESTADÍSTICA. CUARTA EDICIÓN. Edit Prentice Hall Pág.260-280 Spiegel Murray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. Pág. 116-128 Stephen P. Shao . ESTADISTICA PARA ECONOMISTAS Y ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. Pág. 300-321

UNIVERSIDAD TECNICA DE AMBATO

RESUMEN DE MING MANAGER

•CONVIÉRTALO EN UNA PRESENTACIÓN PORTABLE.

1 ESTADÍSTICA

1.1 CLASIFICACIÒN

1.1.1 DESCRIPTIVA

DISTRIBUCION DE FRECUENCIAS

MEDIDAS DE TENDENCIA CENTRAL

GRAFICOS

Diagrama circulare

Histograma

Ojiva

Polígonos de frecuencias

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 66

1.1.2 INFERENCIAL

PROBABILIDADES

MUESTREO

VERIFICACION DE HIPOTESIS

1.2 UTILIDADES: Es una herramienta que se aplica

1.2.1 Economía

1.2.2 Finanzas

1.2.3 Administración empresarial

1.2.4 Mercadotecnia

1.2.5 Contaduría

1.2.6 Campos como gerencia de negocios

1.2.7 Subtopic

1.3 IMPORTANCIA

1.3.1 Como todas las ciencias, la estadística también evoluciona a grandes pasos. Apoyándose como debe ser en la informática y la computación, no es extraño que en los últimos años del siglo XX se diseñaran nuevas y mas eficientes técnicas para la obtención de datos y su procesamiento.

1.3.2 El estudio de la estadística obviamente debe adecuarse a los nuevos tiempos, utilizando recursos actuales que permite la automatización de tareas con menores costos, reduciendo sustancialmente los tiempos de proceso.

1.4 DEFINICIÒN

1.4.1 DEFINICIÓN ETIMOLOGICA

La palabra Estadística proviene de una voz italiana STATISTA que significa ESTADISTA.

UNIVERSIDAD TECNICA DE AMBATO

ESTADISTICA Página 67

1.4.2 Es un conjunto de métodos que tiene por objeto analizar, comparar, establecer relaciones y obtener conclusiones.

2 PROCESA DATOS DE LA INVESTIGACIÓN CIENTÍFICA See also: ESTADÍSTICA

UNIVERSIDAD TECNICA DE AMBATO

BIBLIOGRAFÍA GENERAL • Berenson Mark L.. ESTADÍSTICA. BÁSICA EN ADMINISTRACIÓN, conceptos y aplicaciones. • Chao Lincon L. ESTADÍSTICA PARA LAS CIENCIAS ADMINISTRATIVAS. McGraw-Hill • Castro Alfonso. ESTADÍSTICA Y PROBABLIDADES APLICADAS. Centro matemático Universidad Central. • Endenhall William INTRODUCCIÓN A LA PROBABILIDAD Y LA ESTADÍSTICA. • Kasmier Leonard. ESTADÍSTICA APLICADA A LA ADMINISTRACIÓN Y ECONOMIA. (COLECCIÓN SHAUM) Segunda Edición McGRAW-

HILL 2000. • Moreno Bonnett Alberto, Jaufred m. Francisco Javier. ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA. Representaciones y servicios

de Ingeniería S.A México. • Spiegel Myrray, ESTADÍSTICA, (COLECCIÓN SHAUM) Segunda Edición McGRAW-HILL 2000. • Pugachev V.S. INTRODUCCIÓN A LA TEORÍA DE PROBABILIDADES. Mir. Moscu • Richard L. Levin. ESTADÍSTICA PARA ADMINISTRADORES. • Romo Dávila Miguel Ángel. MANUAL DE ESTADÍSTICA. Quito • Stephen P. Shao . ESTADISTICA PARA ECONOMISTAS Y ADMINISTRADORES DE EMPRESAS. Herrero Hermanos. México. • Stevenson William J. ESTADISTIVA PARA ADMINISTRACIÓN Y ECONOMIA. Harla. México.

UNIVERSIDAD TECNICA DE AMBATO