Estadística Unidades Desarrolladas

101
Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 1 UNIDAD I EL PAPEL DE LA ESTADÍSTICA 1.1 INTRODUCCIÓN A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más difícil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos recibiendo presiones debido a problemas económicos angustiosos como una inflación galopante, el sistema tributario engorroso y oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido económico y social está amenazado por la contaminación ambiental, la deuda publica, la tasa de criminalidad que siempre va en aumento y las impredecibles tasas de interés. Si estas condiciones parecen ser características del estilo de vida actual, no debe olvidarse que problemas de esta naturaleza contribuyeron a la caída de la antigua Roma más que la invasión de las hordas de bárbaros provenientes del norte. Un periodo de éxito en este planeta, relativamente corto, no es garantía de una supervivencia futura. A menos que puedan encontrarse soluciones viables a estos apremiantes problemas, podríamos acompañar en el olvido al dinosaurio y al ave dodo. Como ya lo hicieron los antiguos romanos. Este capítulo aportará una visión general sobre lo que es la estadística y cómo puede utilizarse. Esta visión general sobre la naturaleza de la estadística y los beneficios que puede proporcionarnos se efectuara revisando:

description

 

Transcript of Estadística Unidades Desarrolladas

Page 1: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

1

UNIDAD I

EL PAPEL DE LA ESTADÍSTICA

1.1 INTRODUCCIÓN

A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más difícil

tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones

deben tomarse con mucho menos que un conocimiento adecuado y experimentando una

gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para

nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos

recibiendo presiones debido a problemas económicos angustiosos como una inflación

galopante, el sistema tributario engorroso y oscilaciones excesivas en el ciclo

empresarial. Todo nuestro tejido económico y social está amenazado por la

contaminación ambiental, la deuda publica, la tasa de criminalidad que siempre va en

aumento y las impredecibles tasas de interés.

Si estas condiciones parecen ser características del estilo de vida actual, no debe olvidarse

que problemas de esta naturaleza contribuyeron a la caída de la antigua Roma más que la

invasión de las hordas de bárbaros provenientes del norte. Un periodo de éxito en este

planeta, relativamente corto, no es garantía de una supervivencia futura. A menos que

puedan encontrarse soluciones viables a estos apremiantes problemas, podríamos

acompañar en el olvido al dinosaurio y al ave dodo. Como ya lo hicieron los antiguos

romanos.

Este capítulo aportará una visión general sobre lo que es la estadística y cómo puede

utilizarse. Esta visión general sobre la naturaleza de la estadística y los beneficios que

puede proporcionarnos se efectuara revisando:

Page 2: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

2

• Las definiciones básicas de las herramientas estadísticas.

• Cómo llevar a cabo el muestreo para realizar análisis estadísticos.

• Las funciones que cumple la estadística.

• Cómo puede ayudar la estadística en la profesión.

1.2 LA IMPORTANCIA DE LA ESTADÍSTICA

Virtualmente cada área de la investigación científica seria puede beneficiarse del análisis

estadístico. Para quien formula las políticas económicas y para quien asesora al presidente y

a otros funcionarios públicos sobre procedimientos económicos apropiados, la estadística

ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los

programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de manera

inteligente tan sólo con la ayuda del análisis estadístico. Los hombres y mujeres de

negocios, en su eterna búsqueda de la rentabilidad, consideran que la estadística es esencial

en el proceso de toma de decisiones. Los esfuerzos en control de calidad, minimización de

costos, combinación de productos e inventarios, y una gran cantidad de otros asuntos

empresariales, pueden manejarse efectivamente a través del uso de procedimientos

estadísticos comprobados.

Para quienes están en el área de la investigación de mercados, la estadística es de gran

ayuda en el momento de determinar qué tan probable es que un producto nuevo sea exitoso.

La estadística también es muy útil para evaluar las oportunidades de inversión por parte de

asesores financieros. Los contadores, los jefes de personal, y los fabricantes encuentran

oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico. Incluso un

investigador en el campo de la medicina, interesado en la efectividad de un nuevo

medicamento, considera la estadística una aliada imprescindible.

Page 3: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

3

Tales aplicaciones y muchas otras se ilustran a lo largo de esta unidad. Se mostrará cómo

utilizar la estadística en el mejoramiento del desempeño laboral y en muchos otros aspectos

de la vida diaria.

1.3 LAS FUNCIONES DE LA ESTADÍSTICA

En repetidas ocasiones se ha enfatizado la utilidad de la estadística y la amplia variedad de

problemas que puede resolver. Para ilustrar de manera más completa esta amplia

aplicabilidad, es necesario analizar las diversas funciones de la estadística. La estadística

es la ciencia que tiene que ver con la (1) recolección, (2) organización. (3) presentación..

(4) análisis, e (5) interpretación de datos.

Aunque en todo estudio estadístico el primer paso es la recolección de datos, es usual en un

curso básico de estadística asumir que los datos ya han sido recolectados y que ahora están

disponibles. Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar

estos datos de manera significativa y descriptiva. Los datos deben colocarse en un orden

lógico que revele rápida y fácilmente el mensaje que contienen. Este procedimiento

constituye el proceso de la estadística descriptiva, tal como se define y se discute en los

capítulos siguientes. Luego de que los datos se han organizado y se han presentado para su

revisión, el estadístico debe analizarlos e interpretarlos. Estos procedimientos se basan en la

estadística inferencial y constituyen un importante beneficio para el análisis estadístico,

mediante la ayuda en el proceso de toma de decisiones y solución de problemas.

Se descubrirá que a través de la aplicación de procedimientos estadísticos precisos, es

posible predecir el futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las

presiones competitivas puede beneficiarse considerablemente de la capacidad para anticipar

las condiciones del negocio, antes que éstas ocurran. Si una empresa sabe cómo van a estar

sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes más

exactos y efectivos respecto a las operaciones actuales. Si se calcula las ventas futuras con

un grado de exactitud confiable, la gerencia puede tomar fácilmente decisiones importantes

Page 4: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

4

respecto a los niveles de inventario, pedidos de materia prima, contrataciones de empleados

y, virtualmente, sobre cada aspecto de las operaciones del negocio en si.

1.4.- BENEFICIOS DE LA ESTADÍSTICA

Es factible que en pocos años abandone la relativa seguridad del ambiente académico y esté

metido de cabeza en el mundo competitivo. Desde el punto de vista practico, usted debe

conocer la manera de utilizar los conocimientos en estadística después de graduarse. No

existe duda alguna acerca de que una experiencia académica. adecuadamente relacionada

con unos firmes cimientos ampliara significativamente las oportunidades de encontrar

empleo y, posteriormente, le permitirá demostrar la competividad laboral.

Cuando encuentre ese trabajo anhelado que le ponga en la rápida ruta del éxito profesional,

su jefe espera que usted haga dos cosas:

1. Tomar decisiones.

2. Solucionar problemas.

Estos dos cometidos pueden lograrse a través de la aplicación de procedimientos

estadísticos.

1.4.1 LA APLICACIÓN UNIVERSAL DE LA ESTADÍSTICA

Al ser capaz de solucionar problemas y tomar decisiones, se obtendrá una excelente

posición en la demanda del mercado laboral. Si logra tomar decisiones incisivas cuando se

está solucionando los problemas de alguien, dicha persona estará dispuesta a proporcionarle

una recompensa generosa. El mundo laboral paga más a las personas que son capaces de

plantear las preguntas correctas para alcanzar los objetivos fundamentales, que a quienes

tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante

evidentes una vez que se han planteado las preguntas. El análisis estadístico probará ser de

gran utilidad en la acertada formulación de estas preguntas esenciales.

Page 5: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

5

Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual

requieren soluciones cuantitativas. Si usted no está en capacidad de aplicar la estadística y

otros métodos cuantitativos a muchos de los problemas comunes que sin duda se le

presentarán, estará en gran desventaja en el mercado laboral.

Casi todas las áreas del saber requieren del pensamiento estadístico. Las disciplinas de

estudio que dependen ampliamente del análisis estadístico, incluyen - pero no se limitan a-

markting, finanzas, economía e investigación de operaciones. Los principios aprendidos en

contabilidad y gerencia administrativa también se basan en la preparación estadística.

Los analistas financieros y económicos con frecuencia se basan en sus habilidades

cuantitativas para proporcionar soluciones a problemas difíciles. La comprensión de los

principios financieros y económicos permitirá aplicar las técnicas estadísticas para hallar

soluciones viables y tomar decisiones. Quienes aspiran a cargos en el área contable o

administrativa, a ser independientes, o a desempeñar otra profesión en el sector industrial.

Descubrirán que comprender la estadística no sólo mejora las oportunidades de obtener un

empleo, sino que también aumenta la probabilidad de promoción mediante el

enriquecimiento en el desempeño laboral.

Las personas empleadas en tareas cuantitativas que trabajan con procedimientos

estadísticos, con frecuencia gozan de salarios más altos y están más protegidos de los

trabajos sin futuro. Además, muy al inicio de sus carreras, generalmente se encuentran en

contacto cercano con personas en cargos de alto nivel. La proximidad a la élite ejecutiva es

inevitable porque la alta gerencia necesita de la información y asistencia que la gente con

entrenamiento en estadística puede proporcionarle. En el mercado laboral actual, los

empresarios sencillamente no desean contratar o conservar a quienes no saben estadística.

Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio

publico, el gobierno, o hacia alguna otra fuente de retribución remunerada, la experiencia

Page 6: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

6

académica será más completa si se adquiere una sólida formación en fundamentos de

análisis estadístico.

1.4.2 GERENCIA DE CALIDAD TOTAL

A medida que la competencia mundial se Intensifica, surge, de parte de los negocios, un

esfuerzo por promover la calidad de sus productos. Este esfuerzo, conocido ampliamente

como Gerencia de Calidad Total (Total Quality Managemem, TQM), tiene como propósito

central la promoción de las cualidades del producto que el consumidor considera

importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y

la respuesta rápida a las posibles quejas del consumidor. Hoy día. la mayoría de los grandes

negocios (así como también muchos negocios pequeños) tienen departamentos de Control

de Calidad {Quality Control. QC) cuya función es recolectar datos sobre el desempeño y

solucionar problemas de calidad. Así, la TQM representa un área creciente de

oportunidades para quienes tienen conocimientos en estadística.

La TQM involucra el uso de equipos administrativos integrados conformados por

ingenieros, expertos en marketing, especialistas en diseño, estadísticos, y otros

profesionales que pueden contribuir a la satisfacción del cliente. La formación de estos

equipos, denominada Despliegue de la Función de Calidad (Quality Function Deployment,

QFD), está diseñada para reconocer y agenciar las inquietudes de los consumidores. Los

especialistas actúan conjuntamente para promover la calidad del producto y para que supla

de manera efectiva las necesidades y preferencias del consumidor.

Otro método común para mejorar la calidad de un producto es el uso de los círculos de

Control de Calidad (Quality Control, QC). Los círculos de control de calidad constan de un

grupo pequeño de empleados (generalmente entre 5 y 12) que se reúnen regularmente para

solucionar problemas relacionados con el trabajo. Con frecuencia se conforman tanto con

trabajadores en línea como con representantes de la gerencia, los miembros de estos

círculos QC son todos de la misma área de trabajo y reciben capacitación formal en control

Page 7: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

7

estadístico de calidad y en planeación de grupos. A través de discusiones abiertas y del

análisis estadístico, los círculos QC pueden lograr mejoras significativas en diversas áreas

que van desde el mejoramiento de la calidad- el diseño del producto. la productividad y los

métodos de producción, hasta la reducción de costos y seguridad. Se estima que más del

90% de las 500 mejores compañías que aparecen en la revista Fortune utilizan de manera

efectiva los círculos de control de calidad.

Uno de los elementos más importantes del TQM es un conjunto de herramientas y métodos

estadísticos utilizados para promover el Control Estadístico de Calidad (Statistical Quality

Control, SQC). Tales herramientas ayudan a organizar y analizar datos para efectos de

solucionar problemas. Una de estas herramientas es el diagrama de Párelo, denominado así

en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los problemas de

calidad que se presentan con mayor frecuencia o que han demostrado ser los más costosos.

La figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la producción de

hornos microondas. comercializados por JC Penney.

Figura 1. Diagrama de Pareto

3835

10 85

05

10152025303540

Dispositivo dedescogelación

automática

Dispositivo deconservación dela temperatura

Arranqueautomático

Pulsadores Cocción porfases

Defecto

Porc

enta

je d

e D

efec

tos

Fuente: QC, JC Penney,

Page 8: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

8

Los diagramas de Párelo con frecuencia expresan la regla 80/20: el 80% de lodos lo»

problemas se debe al 20% de las causas. Como lo demuestra la figura 1.1.

aproximadamente el 75% de todos los problemas es causado por el dispositivo de

descongelación automático y por el de conservación de la temperatura del horno.

Hablando en términos generales, el SQC esta diseñado para asegurar que los productos

cumplan con unas normas y especificaciones mínimas de producción. Este objetivo con

frecuencia se promueve a través del uso del muestreo de aceptación, el cual es parte

integral del SQC. El muestreo de aceptación implica probar una muestra aleatoria de

productos existentes para determinar si se debe aceptar o rechazar todo el envío, o el lote.

Esta decisión se basa en parte en un nivel de calidad aceptable (Acceptable Quality Level,

AQL), o número máximo de defectos que una empresa está dispuesta a tolerar.

En las organizaciones se es cada vez más consciente de la necesidad de mantener la calidad

del producto. Si una firma va a competir de manera exitosa, debe tomar todas las

precauciones para garantizar que sus productos cumplan con ciertos estándares básicos. Por

tanto, no es ninguna exageración insistir en la importancia de la TQM. Los principios

inherentes al TQM están aumentando en popularidad; representan la dirección futura del

análisis estadístico, aplicada al mundo de los negocios.

1.4.3 NECESIDAD DE LA FORMACIÓN EN ESTADÍSTICA

Se podría pensar que el tipo de trabajo a que se aspira no necesitará del análisis estadístico.

O quizás podría argumentarse que el personal de estadísticos de la compañía realizará el

trabajo estadístico pertinente y que no existe la necesidad de manejar los detalles del

análisis estadístico.

Este no es el caso. Incluso si los estadísticos profesionales de la organización realizan el

trabajo estadístico pertinente, es esencial poseer un cierto nivel de formación en este

campo. Para determinar cómo puede ayudar el staff de estadística al desempeño del trabajo

Page 9: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

9

de los otros, se debe conocer qué es la estadística, qué hacen los estadísticos y cómo lo

hacen. Cuando los problemas surgen se debe determinar cómo puede ayudar la estadística.

Para lograrlo, es necesario comprender los procedimientos estadísticos, y poder

comunicarse con los estadísticos, en un esfuerzo conjunto para diseñar soluciones

adecuadas y tomar decisiones óptimas. Una vez se ha adquirido esta familiaridad con el

análisis estadístico, se sorprenderá de las infinitas formas en que la estadística puede ayudar

en la solución de problemas que surgen con frecuencia en un escenario empresarial.

1.5 ALGUNAS DEFINICIONES BÁSICAS

Toda rama de la investigación científica tiene su vocabulario propio y la estadística no es la

excepción. Esta sección revisa algunos de los términos comunes utilizados en el análisis

estadístico. Las definiciones y expresiones que siguen son esenciales para la comprensión

de cómo se realizan las pruebas estadísticas.

1.5.1 ESTADÍSTICA .-Se refiere a las técnicas o métodos de recolección, representación,

procesamiento y análisis de un conjunto de datos los cuales ha sido recolectados luego de

realizar algunos experimentos, o simplemente considerar algunos aspectos de la vida diaria.

1.5.2 RAMAS DE LA ESTADÍSTICA.-

1.5.2.1 ESTADÍSTICA DESCRIPTIVA.- Consiste en organizar, resumir y simplificar en

términos generales información que a menudo resulta bastante compleja. Ej. Promedio de

calificaciones, rendimiento medio de un automóvil, etc.

1.5.2.2 TEORÍA DE LA PROBABILIDAD.- Sirve para analizar situaciones en las que

intervienen el azar. Ej., lanzamiento de una dado, resultado de un partido de fútbol,

elecciones presidenciales, etc.

Page 10: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

10

1.5.2.3 INFERENCIA ESTADÍSTICA.- Se refiere al análisis e interpretación de una

muestra de datos para poder así dar conjeturas sobre un grupo mayor denominado

población.

1.5.3 POBLACIONES Y PARÁMETROS.- En todo estudio estadístico, el investigador

está interesado en una determinada colección o conjunto de observaciones denominadas

población, (o universo). Si los ingresos de los 121 millones de asalariados de los Estados

Unidos son de interés para un economista que asesore al Congreso en la formulación del

plan nacional tributario, entonces los 121 millones de ingresos constituyen la población. Si

se está considerando un plan tributario para los perceptores de ingresos superiores a US

$100.000. entonces tales ingresos superiores a US $100,000 constituyen la población.

Si el director ejecutivo (ChiefExecutive Officer, CEO) de una gran empresa manufacturera

desea estudiar la producción de todas las plantas de propiedad de la firma, entonces la

producción de todas estas plantas es la población.

Se puede decir también que población es un conjunto de medidas, o el recuento de todos

los elementos o individuos que presentan una característica común. Pudiendo ser estos por

ejemplo un estudiante, un animal (entidad simple) o un curso, una familia (entidad

compleja).

La población es la colección completa de todas las observaciones de interés.

Un parámetro es toda medida descriptiva de una población. Algunos ejemplos son: el

ingreso promedio de todos los asalariados de Estados Unidos, o la producción total de

todas las plantas manufactureras.

El punto clave para recordar es que un parámetro describe una población.

Page 11: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

11

Parámetro es una medida descriptiva de la población total de todas las observaciones de

interés para el investigador.

1.5.4 MUESTRAS Y ESTADÍSTICOS.- Aunque generalmente los estadísticos se

interesan en algún aspecto de toda la población, generalmente descubren que las

poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso

promedio de cada uno de los 121 millones de asalariados seria una tarea abrumadora. Por

consiguiente. generalmente debe ser suficiente estudiar tan sólo una pequeña porción de

dicha población. A esta porción más pequeña y más manejable se le denomina muestra.

Una muestra es un subconjunto de la población seleccionado científicamente o ser

seleccionados al azar, es decir todos los elementos de la población tienen la misma

posibilidad de ser seleccionados ya sea por sorteo, por las tablas de números aleatorios, o

cualquier método al azar.

Muestra es una parte representativa de la población que se selecciona para ser

estudiada ya que la población es demasiado grande como para analizarla en su

totalidad.

Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula

el ingreso promedio de una muestra de varios miles de asalariados seleccionados entre la

población total de 121 millones de trabajadores. El promedio de esta muestra se utiliza

luego como una estimación del ingreso promedio para toda la población. Las muestras son

necesarias porque estudiar las poblaciones completas resulta muy costoso y consume

demasiado tiempo.

Un estadístico es una medida descriptiva de una muestra. El ingreso promedio de esos

varios miles de trabajadores, calculado por el Ministerio de Trabajo, es un estadístico. El

estadístico es a la muestra lo que el parámetro es a la población. El estadístico sirve como

Page 12: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

12

una estimación del parámetro. Aunque en realidad el interés se fija en el valor del

parámetro de la población, con frecuencia debe haber conformidad con sólo calcularlo con

un estadístico de la muestra que se ha seleccionado.

Estadístico Elemento que describe una muestra y sirve como una estimación del

parámetro de la población correspondiente.

1.5.5 CARACTERÍSTICAS DE UNA POBLACIÓN.- Corresponde a ciertos rasgos,

cualidades, propiedades que poseen los individuos de una muestra. Estos pueden ser:

Cuantitativos los cuales son mesurables (medibles) se describen numéricamente estos

pueden ser continuos o discretos; o Cualitativos (o por Atributos) no medibles se

expresan mediante palabras, símbolos (números).

1.5.6 VARIABLE.- Las variables son las características de la muestra o de la población

que se esta observando.

1.5.6.1 VARIABLE ALEATORIA- Si una característica es observada sobre una muestra

o población y los individuos observados son elegidos al azar entonces este carácter se

denomina variable aleatoria.(v.a)

Una v.a puede ser cuantitativa ( da como referente cantidades) o cualitativa (da como

referentes atributos).

También las variables aleatorias cuantitativas se pueden dividir en continuas y discretas.

Una variable continua es aquella que puede tomar cualquier valor dentro de un rango

dado. No importa que tan cerca puedan estar dos observaciones, si el instrumento de

medida es lo suficientemente preciso, puede hallarse una tercera observación que se

encuentre entre las dos primeras. Una variable continua generalmente resulta de la

medición.

Page 13: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

13

Los datos que se obtienen acerca de estas variables reciben el nombre de datos continuos.

Ejemplo altura, peso, velocidad, espesor, etc.

Las variable discretas pueden asumir solo ciertos valores, por lo general enteros. Nunca

serán fraccionarios. Los datos que se obtienen se denominan datos discretos. Estos surgen

al contar el número de conceptos y objetos que poseen ciertas características. Ejemplo

Cantidad de alumnos en un salón de clase, número de accidentes de trabajo , las casa de un

barrio, etc.

Las variables cualitativas (atributos) son de dos clases la nominales y de orden (jerarquía)

Las v.a nominales comprenden categorías Ejemplo sexo (femenino, masculino), color de

ojos (negro, café, azul). No son numéricos pero pueden asignarse valores para cada

categoría. Los datos nominales se obtienen cuando se definen las categorías y se cuentan el

número de observaciones que queda en cada una.

Las v.a de orden son cuando los conceptos se jerarquizan según la preferencia o logro.

Los datos de orden o jerarquizados constan de valores relativos asignados para denotar

orden. Ejemplo: primero, segundo; mayor, menor, aceptable no aceptable, más caro, mas

feo, muy alto, muy bajo, etc.

automovil. un de valorDAS.JERARQUIZA O ORDEN

ojos de piel, de colorsexo,NOMINALES.

ASCUALITATIV

colegio un de cursoshijos, de#DISCRETAS.

estaturapeso,CONTINUAS. VASCUANTITATI

STICAS)(CARACTERI VARIABLES

POBLACION

(1)

En una misma población se pueden obtener varios tipos de datos esto depende del objetivo

del estudio que se realice. Daremos entonces una tabla en la cual se pueden ver los

diferentes tipos de datos desde una misma población

Page 14: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

14

TIPO DE DATOS

CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS

Clase de tercer grado Edad, peso Nº en el grupo Niños / Niñas 3º grado

Automóviles Kph. Kpg Nº de defectos/auto colores Más sucio

Ventas de bienes

raíces Valores en USD. Nº de ofertas sobrevaluado Más caro

1.6 LA IMPORTANCIA DEL MUESTREO

Gran parte del trabajo de un estadístico se realiza con muestras. Las muestras son

necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser

estudiadas en su totalidad. Es muy costoso y demanda mucho tiempo examinar la población

total por tanto, debe seleccionarse una muestra de la población, calcular el estadístico de la

muestra, y utilizarlo para estimar el parámetro correspondiente de la población.

Este análisis sobre las muestras implica una distinción entre las dos principales ramas del

análisis estadístico: (1) la estadística descriptiva y (2) la estadística inferencial, como ya se

dijo la estadística descriptiva es el proceso de recolectar, agrupar y presentar datos de una

manera tal que describa fácil y rápidamente dichos datos mientras que la estadística

inferencial involucra la utilización de una muestra para sacar alguna inferencia o

conclusión sobre la población de la cual hace parte la muestra.

Cuando el Ministerio de Trabajo utiliza el ingreso promedio de una muestra de varios miles

de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, está

utilizando una forma simple de estadística inferencial.

La exactitud de toda estimación es de enorme importancia. Esta exactitud depende en gran

parte de la forma como se tomó la muestra, y del cuidado que se tenga para garantizar que

la muestra proporcione una imagen confiable de la población. Sin embargo, con mucha

frecuencia se comprueba que la muestra no es del todo representativa de la población y

resultará un error de muestreo. El error de muestreo es la diferencia entre el estadístico de

Page 15: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

15

la muestra utilizada para calcular el parámetro de la población y el valor real pero

desconocido del parámetro.

Error de muestreo Es la diferencia entre el parámetro desconocido de la población y

el estadístico de la muestra utilizado para calcular el parámetro.

Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo

es el azar en el proceso de muestreo. Debido al factor azar en la selección de elementos de

la muestra, es posible seleccionar sin darse cuenta, elementos atípicos que no representan

la población. Por ejemplo, en el esfuerzo por estimar la media poblacional es factible que

se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo así

una sobreestimación de la media poblacional. Por otro lado, el azar puede producir un gran

número de elementos de muestra que sean inusualmente pequeños, produciendo una

subestimación del parámetro. En cualquiera de los dos casos, ha ocurrido un error de

muestreo.

Una forma más, seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre

cuando hay alguna tendencia a seleccionar determinados elementos de muestra en lugar de

otros. Si el proceso de muestreo se diseña de manera incorrecta y tiende a promover la

selección de demasiadas unidades con una característica en especial, a expensas de las

unidades que no tienen dicha característica, se dice que la muestra está sesgada. Por

ejemplo, el proceso de muestreo puede favorecer de manera inherente la selección de

hombres excluyendo a las mujeres, o de personas casadas excluyendo a las solteras.

Sesgo muestral Es la tendencia a favorecer la selección de ciertos elementos de

muestra en lugar de otros.

Page 16: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

16

ACTIVIDADES RECOMENDADAS

1.- Describa en sus propias palabras cómo puede utilizarse la estadística para solucionar

problemas en varias disciplinas y ocupaciones.

2.- ¿De qué forma utilizará los servicios del estadístico profesional en su organización una

vez que usted encuentre empleo? ¿Por qué es poco probable escaparse de la necesidad de

tener un conocimiento básico en estadística?

3.- Describa en sus propios términos la diferencia entre una población y una muestra; entre

un parámetro y un estadístico.

4.- ¿Cuál es la diferencia entre una variable cuantitativa y una variable cualitativa? Dé

ejemplos.

5.- Diferencie entre una variable continua y una variable discreta. Dé ejemplos de cada una.

6.- Un informe reciente en la revista Fortune reveló que los japoneses pronto controlarán

hasta un 35% de las ventas de autos en los Estados Unidos; comparado con el 28% de

finales de los años 80 está apenas un 8% por encima de lo ocurrido en 1970. ¿Esta

información contiene estadística descriptiva, inferencial, o ambas? Explique.

7.- Cuál es la diferencia entre la estadística descriptiva y la estadística inferencial? ¿Cuál

cree usted que constituye una forma más elevada de análisis estadístico y por qué?

AUTOEVALUACION

1.- ¿En qué usos o funciones se puede aplicar la estadística? ¿Cómo cree usted que pueda

utilizarse para solucionar problemas comerciales y administrativos en el mundo real? Dé

ejemplos de problemas específicos que puedan surgir y explique cómo podría utilizarse la

estadística para desarrollar soluciones y respuestas.

2.- Si los estadísticos están interesados realmente en poblaciones, ¿por qué generalmente

trabajan con muestras?

3.- Indique lo siguiente en términos de datos:

Page 17: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

17

a) 17 gramos b) 3 correctas, 7 incorrectas c) más lento

d) 25 segundos e) 3 casas f) kilómetros por hora

g) tallas de camisas h) el mas encantador i) helados de vainilla

4.- Analice si las siguientes variables son discretas o continuas:

a. Número de carreras que oferta su facultad.

b. Número de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders.

c. Peso de los integrantes del equipo de fútbol nacional

d. Peso del contenido de las cajas de cereal que se producen en una determinada empresa

e. Número de libros que usted leyó el año pasado.

5.- Seleccione una población cualquiera que sea de su interés. Identifique variables

cuantitativas (discretas – continuas) y cualitativas (nominales – de orden) de esa población

que puedan seleccionarse para ser estudiadas.

6.- Defina el error de muestreo y explique qué lo causa.

Page 18: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

18

UNIDAD II

DESCRIPCIÓN DE LOS CONJUNTOS DE DATOS

2.1 INTRODUCCIÓN

Casi todos los trabajos que se hacen en estadística comienzan con el proceso de recolección

de datos necesarios para formar con ellos un conjunto que se utilizara en el estudio. Para

propósitos generales, se adoptará la suposición conveniente de que esta labor, con

frecuencia tediosa, ya ha sido realizada y que los datos están disponibles.

Esta recolección de datos originales revela muy poco por si sola. Es extremadamente difícil

determinar el verdadero significado de un grupo de números que simplemente se han

registrado en un papel. Nuestra labor es organizar y describir tales datos de manera concisa

y significativa. Para determinar su significancia, los datos se organizan de manera que, con

un simple vistazo, se pueda tener una idea de lo que pueden decirnos.

Entre las herramientas estadísticas que resultan de particular utilidad para organizar los

datos se incluyen;

• Tablas de frecuencia que colocan todos los datos en clases específicas.

• Diversos gráficos que pueden proporcionar una representación visual de los datos.

• Tablas de contingencia y diagramas de "tallo y hoja", los cuales también permiten la

presentación de un conjunto grande de datos de manera concisa y discernible.

2.2 MÉTODOS DE AGRUPACIÓN DE DATOS

Los métodos principales para organizar datos estadísticos comprenden el ordenamiento de

elementos en subconjuntos que presenten cualidades semejantes (por ejemplo, misma edad,

Page 19: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

19

misma finalidad, misma escuela, misma ciudad, etc.) Los datos agrupados se pueden

resumir gráficamente, o en tablas, y mediante el uso de medidas numéricas, como la media,

la amplitud o rango , la desviación estándar, y otras más. El nombre que reciben los datos

ordenados en grupos o categorías es el de distribución de frecuencia.

22..33 DISTRIBUCIÓN DE FRECUENCIAS

Como estadístico residente de Pigs and People (P&P) Airlines, el director de la división de

análisis estadístico le pide recolectar y agrupar los datos sobre el número de pasajeros que

han decidido viajar con P&P. Tales datos correspondientes a los últimos 50 días aparecen

en la tabla 2.1. Sin embargo, con estos datos en bruto, es improbable que el director pueda

obtener información útil y significativa respecto a las operaciones de vuelo. Los datos no

están organizados y es difícil llegar a una conclusión significativa simplemente revisando

una serie de números anotados en un papel. Es preciso agrupar y presentar los datos de

manera concisa y reveladora para facilitar el acceso a la información que contienen.

Primero se analizará cómo puede utilizarse una distribución de frecuencia para organizar el

conjunto de datos.

Tabla 2.1 Datos brutos sobre el numero de pasajeros de P&P Airlines

68 71 77 83 79 72 74 57 67 69

50 60 70 66 76 70 84 59 75 94

65 72 85 79 71 83 84 74 82 97

77 73 78 93 95 80 81 79 90 83

80 84 91 101 86 93 92 102 80 69

Una distribución de frecuencia es un método de clasificación de datos en clases o

intervalos, de manera tal que se pueda establecer con facilidad el números o porcentaje (es

decir la frecuencia) de cada clase. Esto proporciona una forma de observar un conjunto de

Page 20: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

20

números sin que se tenga que considerar cada número, y pueda ser extremadamente útil al

manejar grandes cantidades de datos. El número o porcentaje en una clase se denomina

frecuencia de clase.

Una distribución de frecuencia es un agrupamiento de datos en clases, que muestra el

número o porcentaje de observaciones de cada una de ellas. Una distribución de

frecuencia se puede presentar en forma tabular y gráfica. También se las conoce como

Serie estadística de frecuencias o de intervalos

El procedimiento para elaborar realmente una distribución de frecuencias para un conjunto

de datos dado, depende del tipo de datos particulares (esto es, continuos, discretos,

nominales, de orden o jerarquizados). Consideraremos primeramente el caso de que los

datos de estudio sean de tipo continuo.

2.4 ORDENACIÓN DE DATOS EN TABLAS DE FRECUENCIA

2.4.1 ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA

DATOS CUANTITATIVOS (CONTINUOS – DISCRETOS)

Una vez que se han recolectado los datos de una determinada variable, el paso siguiente

para la ordenación de los mismos es la elaboración de una distribución de frecuencia

conocida también como SSEERRIIEE EESSTTAADDÍÍSSTTIICCAA DDEE IINNTTEERRVVAALLOOSS oo SSEERRIIEE

EESSTTAADDÍÍSSTTIICCAA DDEE FFRREECCUUEENNCCIIAASS,, ddeeppeennddiieennddoo ddeell ttiippoo ddee ddaattooss qquuee ssee hhaann oobbtteenniiddoo..

Los pasos principales en la elaboración de una distribución de frecuencias para datos

muéstrales cuantitativos se enumeran a continuación:

1.- Obtener el rango de los datos (amplitud de variación a)

a = X mayor – X menor

Siendo:

a = Amplitud

Page 21: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

21

X mayor = valor mayor

X menor = valor menor

La amplitud de variación, recorrido o rango se define entonces como la diferencia que

se establece entre el valor mayor y el valor menor de la variable.

2.- Hallar el número de clases o intervalos , k ( se sugiere usar la regla de que le número de

clases se puede tomar como la raíz cuadrada del número de observaciones de estudio (n) es

decir, nk . NOTA: Es conveniente utilizar un número de intervalos no menor a 5 ni

mayor a 15. Si el número de intervalos es menor a 5 , las frecuencias estarían muy

concentradas, con lo cual no se permite un análisis mas real de los datos. Así mismos, si es

mayor a 15 las frecuencias estarían muy dispersas, dificultando la elaboración de la tabla,

su representación gráfica y sus cálculos matemáticos.

3.- Calcular la amplitud de clase (diámetro del intervalo, o tamaño del intervalo, ancho de

intervalo); se obtiene dividiendo el rango para el número de clases (a/k) redondeado a un

número conveniente. Una alternativa para conseguir el numero de clases o intervalos es

dividiendo el rango o amplitud para el ancho del intervalo y sumando 1 (a/k+1). Y por

ultimo también se puede tomar este valor de acuerdo al criterio personal.

4.- Determinar los límites de clase preliminares. Revisarlos de manera que los datos se

toquen pero que no se superpongan.

5.- Enumerar los intervalos y efectuar un conteo por marcas de datos según sus clase. (se

debe comprobar que el total de marcas sea igual a n)

6.- Elaborar una tabla o un grafico de frecuencias (histograma)

Page 22: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

22

Nota.- En algunas tablas de distribución de frecuencias se suele hallar la marca de clase que

es el promedio de los valores de los limites inferir y superior de cada clase.

EJEMPLO: ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS CON

LOS DATOS DE LA TABLA 2.1

1.- RANGO O AMPLITUD DE VARIACIÓN DE LA VARIABLE

Desde los datos de la tabla 2.1 se puede apreciar que el numero más alto es 102 y el mas

bajo 50. La diferencia entre estos dos valores es 52 (a = 102 - 50 = 52). Este valor

representa la amplitud de variación o rango de la variable.

2.- NÚMEROS DE CLASE O INTERVALOS DE CLASE ( DEPENDE DEL TIPO

DE DATOS)

Como 707750k 50n , entonces el total de los datos se ordenaran en 7

clases.

3.-AMPLITUD DE CLASES

Se divide la amplitud de variación para el numero de clases así:

a.c = 7427752 ,/ o a.c = 814271

752

,

4.- LIMITES DE CLASE

primera clase: limite inferior: 50 limite superior: 50 + 7 = 57 (lim inf+a.c)(50 a <57)

segunda clase: limite inferior: 57 limite superior 57 + 7 = 64 (57 a < 64)

tercera clase: limite inferior: 64 limite superior 64 + 7 = 71 (64 a < 71)

cuarta clase : limite inferior: 71 limite superior 71 + 7 = 78 (71 a < 78 )

quinta clase: limite inferior: 78 limite superior 78 + 7 = 85 (78 a < 85)

sexta clase: limite inferior: 85 limite superior 85 + 7 = 92 (85 a < 92)

séptima clase: limite inferior: 92 limite superior 92 + 7 = 99 (92 a < 99)

octava clase: limite inferior: 99 limite superior 99 + 7 = 106 (99 a < 106)

Page 23: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

23

Una vez que se han establecido las clases, a cada dato se colocará en la clase adecuada

mediante un conteo por marcas de la siguiente manera

Tabla 2.2.- DISTRIBUCIÓN DE FRECUENCIA EN FORMA TABULAR DE LA

VARIABLE: Número de pasajeros que viajan en P&P durante 50 días

ÍNDICE CLASES MARCAS CONTEO ( FRECUENCIA)

1 50 a <57 [50 – 57) I 1 2 57 a < 64 III 3 3 64 a < 71 IIIII III 8 4 71 a < 78 IIIII IIIII I 11 5 78 a < 85 IIIII IIIII IIIII 15 6 85 a < 92 IIII 4 7 92 a < 99 IIIII I 6 8 99 a < 106 I1 2

total 50

Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa

y la frecuencia porcentual (Porcentaje).

Tabla 2.3.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS,

RELATIVAS) DE LA VARIABLE: Número de pasajeros que viajan en P&P durante

50 días

CLASES (pasajeros)

f (Días)

fr

(f/n)

f % (f*100)

Fa

Fra

Fa%

50 a <57 1 0,02 2 % 1 0,02 2% 57 a < 64 3 0,06 6% 1+3 = 4 0,02 + 0,06 = 0,08 8% 64 a < 71 8 0,16 16% 4+8 = 12 0,08 + 0,16 = 0,24 24% 71 a < 78 11 0,22 22% 12+11 = 23 0,24 + 0,22 = 0,46 46% 78 a < 85 15 0,30 30% 23+15 = 38 0,46 + 0,30 = 0,76 76% 85 a < 92 4 0,08 8% 38+4 = 42 0,76 + 0,08 = 0,84 84% 92 a < 99 6 0,12 12% 42+6 = 48 0,84 + 0,12 = 0,96 86% 99 a < 106 2 0,04 4% 48+2 = 50 0,96 + 0,04 = 1 100%

N = 50

1 100%

Page 24: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

24

Donde:

Frecuencia absoluta: f (conteo de datos)

Frecuencia Relativa: fr (Frecuencia / # total de casos) Es decir: nffr

Frecuencia Porcentual: f% Es el porcentaje de la frecuencia absoluta.

Es decir 100

nf100frf **%

De igual manera se pueden obtener las diferentes frecuencias acumuladas.

Frecuencia acumulada: Fa (F) ( conteo y suma de datos)

Frecuencia Acumulada Relativa : Far (Frecuencia acumulada / # total de casos)

Es decir: nFaFar

Frecuencia Acumulada Porcentual: Fa% Es el porcentaje de la frecuencia acumulada

Es decir 100

nFa100FarFa **%

Luego de construir la tabla es importante la interpretación que se la de . Por ejemplo para la

frecuencia absoluta se puede decir que: Un día han viajado entre 50 y 56 pasajeros que

corresponde al 2 por ciento, también que 15 de los 50 días han viajado entre 78 y 84 (78 a <

85) que corresponde al 30 % del tiempo en observación . Mientras que para la frecuencia

acumulada: Hubo 23 días en los cuales menos de 78 pasajeros volaron en la mencionada

compañía. Con un equivalente del 46% del tiempo estimado para la investigación.

EJEMPLO.- FORMA ALTERNATIVA PARA CONSTRUIR LA DISTRIBUCIÓN

DE FRECUENCIA

Se realizo una encuesta a ciertos estudiantes y al ser preguntados por su estatura, dieron los

siguientes datos en cm.

Page 25: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

25

Tabla 2.4 .- Estatura de los estudiantes de primer semestre de la escuela de Ingenieria

de la ESPOCH.

149 147 165 160 161 164 168 169 170 159 158 164 162 170 160 157 149 162 165 171 168 167 151 152 154 149 153 153 154 162 169 168 167 164 168 167 168 161 150 163 167 167 165 166 169

1.- AMPLITUD DE VARIACIÓN: a = 171 – 147 = 24

2.- NÚMERO DE INTERVALOS: a diferencia del ejemplo anterior aquí no se calcula la

amplitud de la clase si no que se asigna una cantidad usando el criterio del estadístico en

este caso he ha tomado como a.c = 3 y luego se saca el numero de clases o intervalos

dividiendo la amplitud de variación o rango para el ancho del intervalo que se eligió

arbitrariamente. Así:

91813

24k

3.- LIMITES DE CLASE

primera clase: limite inferior: 145 limite superior: 145 + 3 = 148 o 145 a < 148 ( 147)

segunda clase: limite inferior: 148 limite superior 151 (o 150)

tercera clase: limite inferior: 151 limite superior 154 (o 153)

cuarta clase : limite inferior: 154 limite superior 157 (o 156)

quinta clase: limite inferior: 157 limite superior 160 (o 159)

sexta clase: limite inferior: 160 limite superior 163 (o 162)

séptima clase: limite inferior: 163 limite superior 166 (o 165)

octava clase: limite inferior: 166 limite superior 169 (o 168)

novena clase: limite inferior: 169 limite superior 172 (o 171)

Page 26: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

26

4.- MARCA DE CLASE

La marca de clase se calcula para cada una de las clases o intervalos así sacando la suma de

los límites de clases y dividiendo para dos .

2sup lim inf XmMc

lim

Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa,

la frecuencia porcentual (Porcentaje)y la marca de clase .

Tabla 2.5.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS,

RELATIVAS) DE LA VARIABLE: Estatura de los estudiantes de primer semestre de

la escuela de Ingenieria de la ESPOCH.

CLASES

X

Mc

Xm

f

(Días)

fr

(f/n)

f %

(f*100) Fa Fra Fa%

145 – 147 146 1 0.02 2 1 0.022 2.22

148 – 150 149 4 0.09 9 5 0,114 11.11

151 -153 152 4 0.09 9 9 0,20 20.00

154 -156 155 2 0.04 4 11 0,244 24.44

157 -159 158 3 0.07 7 14 0,31 31.11

160 - 162 161 7 0.16 16 21 0,4667 46.67

163 - 165 164 7 0.16 16 28 0,6222 62.22

166 - 168 167 11 0.24 24 39 0,8667 86.67

169 - 171 170 6 0.13 13 45 1 100.00

45 1 100

Page 27: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

27

2.4.2 ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA

DATOS CUALITATIVOS (NOMINALES Y DE ORDEN O

JERARQUIZADOS)

Quizá las distribuciones de frecuencias más fáciles sean las que se utilizan para datos

nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen

de manifiesto con más facilidad, de modo que los cálculos son mínimos. Por ejemplo,

considerar los datos nominales de la tabla 2.3, que representan las ventas de gaseosas,

ordenados en una tabla de frecuencia.

Las categorías son los diversos sabores de las gaseosas. Obsérvese la última categoría.

Varios. Puede haber algunos sabores que se vendan poco, como: fresa, tamarindo y toronja,

los cuales se agruparán en una sola categoría para simplificar la comprensión de los datos.

Tabla 2.6 DATOS DE LA VENTA DE GASEOSAS EN UN DÍA

SABOR VENTAS

Cola (negra) 600

Limón 200

Naranja 100

Uva 50

Fresa 40

Otros 10

Total 1000

Con la información de la tabla 2.6 se puede determinar la frecuencia absoluta como las

ventas reales que se tuvo durante ese día, para luego proceder a determinar las frecuencias

acumulada, relativa y porcentual de la misma manera que para los datos cuantitativos

Page 28: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

28

Tabla 2.7.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, RELATIVAS Y

PORCENTUALES) DE LA VARIABLE : Venta de gaseosas en un día

CLASES Categorías

X

F (ventas reales)

fr (f/n)

f % (f*100)

Cola negra 600 0.6 60 % Limón 200 0.2 20%

Naranja 100 0.1 10% Uva 50 0..5 5%

Fresa 40 0.04 4% Otros 10 0.01 1% Total 1000 1 100%

La presentación de datos jerarquizados es bastante semejante. Considérense los datos del

promedio de calificaciones que se presentan a continuación en un formato un tanto

diferente al de las tablas de frecuencias anteriores, sólo para demostrar otra forma de

elaborarlas

Tabla 2.8- DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y

PORCENTUALES DE LA VARIABLE: Calificaciones de un curso en la asignatura

de Matemática.

CALIFICACIONES DEL CURSO MALA REGULAR BUENA MUY BUENA EXCELENTE TOTALES NUMERO 2 4 20 10 4 40 PORCENTAJE 5% 10% 50% 25% 10% 100%

2.5 GRÁFICOS ESTADÍSTICOS

2.5.1.- GRÁFICOS PARA DATOS CUANTITATIVOS CONTINUOS.

A menudo se dice que “una imagen vale más que mil palabras.” De hecho, los estadísticos

han empleado las técnicas gráficas para describir de manera mas vivida series de datos. En

particular, los histogramas y los polígonos se usan para describir datos numéricos que han

sido agrupados en distribuciones de frecuencia, de frecuencia relativa o de porcentaje.

Page 29: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

29

2.5.1.1.- HISTOGRAMAS DE FRECUENCIAS.-

Los histogramas son diagramas de barras verticales en los que se construyen barras

rectangulares en los límites de cada clase. Al graficar histogramas, la variable aleatoria o

fenómeno de interés se despliega a lo largo del eje horizontal; el eje vertical representa el

número, proporción o porcentaje de observaciones por intervalo de clase, dependiendo de

,si el histograma particular es, respectivamente, un histograma de frecuencia, un histograma

de frecuencia relativa o un histograma de porcentaje.

Un histograma de frecuencia se describe a continuación con los datos de la tabla 2.5 que

reflejan las estaturas de los estudiantes de primer semestre de la escuela de Ingeniería de la

ESPOCH. En el eje horizontal están las marcas de clase y en el vertical las frecuencias

absolutas.

Figura 2.1 . Histograma de Frecuencia Absoluta

ESTATURA

171168165162159156153150147

FREC

UEN

CIA

ABS

OLU

TA

12

10

8

6

4

2

0

6

11

77

3

2

44

1

Fuente: Datos tomados de la tabla 2.5

Se puede también graficar histogramas de frecuencias tanto para la frecuencia relativa

como para la frecuencia porcentual.

Page 30: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

30

2.5.1.2.- POLÍGONOS DE FRECUENCIAS ABSOLUTAS

Al igual que con los histogramas, al graficar polígonos el fenómeno de interés se despliega

a lo largo del eje horizontal y el eje vertical representa el número, proporción o porcentaje

de observaciones por intervalo de clase.

El polígono de porcentaje se forma permitiendo que el punto medio o marca de clase

represente los datos de esa clase en el eje horizontal y luego conectando la sucesión de

puntos medios con sus respectivos valores ya sea de las frecuencias o de los porcentajes de

clase en el eje vertical.

Debido a que los puntos medios consecutivos son conectados por una serie de líneas rectas,

el polígono algunas veces está dentado en apariencia. Sin embargo, al tratar con una serie

de datos muy grande, si tuviéramos que crear los límites de las clases en su distribución de

frecuencia más juntos (incrementando así el numero clases en esa distribución), las líneas

dentadas del polígono se "suavizarían".

Figura 2.2. Polígono de Frecuencia Absoluta.

0

2

4

6

8

10

12

146 149 152 155 158 161 164 167 170

ESTATURAS ( MEDIAS)

FREC

UEN

CIA

S A

BSO

LUTA

S

Fuente: Datos tomados de la tabla 2.5

Page 31: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

31

2.5.1.3.- POLÍGONOS DE FRECUENCIAS ACUMULADAS

La variación de este polígono con relación al de las frecuencias absolutas es que en el eje

vertical se ubican las frecuencias acumuladas ya sean absolutas, relativas o porcentual

generando un grafico estadístico conocido con el nombre de OJIVA o POLÍGONO DE

FRECUENCIA ACUMULADA .

Figura 2.3 . Polígono de frecuencia acumulada.( datos tabla 2.5)

05

101520253035404550

146 149 152 155 158 161 164 167 170

ESTATURA

FREC

UEN

CIA

AC

UM

ULA

DA

Fuente: Datos tomados de la tabla 2.5

Al igual que los histogramas los polígonos se pueden construir con las frecuencias

absolutas y acumuladas tanto relativas como porcentuales.

2.5.2.- GRÁFICOS PARA DATOS CUANTITATIVOS DISCRETOS Y

CUALITATIVOS NOMINALES Y DE ORDEN.

2.5.2.1 DIAGRAMAS DE BARRAS.-

Un diagrama de barras es parecido a un histograma, este puede mostrar cantidades o

porcentajes para una , dos o mas valores sobre el eje vertical. En los diagramas de barras,

cada clase o categoría se describe mediante una barra cuya longitud representa la

frecuencia o porcentaje de observaciones que caen en una categoría.

Page 32: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

32

Para construir un diagrama de barras se hacen las siguientes sugerencias:

a) Todas las barras deben tener el mismo ancho, solo el largo diferirá dependiendo de

la frecuencia que presente cada categoría o clase

b) Las barras pueden ser horizontales o verticales.

c) Los espacios entre las barras deben variar entre la mitad del ancho de una barra

hasta el ancho de una barra

d) Las escalas y guías son auxiliares útiles en la lectura de una gráfica y deben

incluirse. El punto cero debe indicarse

e) Los ejes de la grafica deben etiquetarse claramente

EJEMPLO.- Mediante una encuesta se logro recabar los siguientes datos sobre el tipo de

colegio en el que obtuvieron su título de bachiller 272 estudiantes de la Universidad, y con

ellos se elaboro una distribución de frecuencia tabular la cual se detalla a continuación.

Tabla 2.9.- TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA LA VARIABLE

Tipo de colegio en el que obtuvieron su título de bachiller 272 estudiantes de la

Universidad.

TIPO DE COLEGIO

f fr fr%

Particular 44 0,162 16,2

Fiscal 206 0,757 75,7

Fiscomisional 22 0,081 8,1

Total 272 100,0 100,0

Figura 2.4. Diagrama de barras de los datos de la tabla 2.9

Page 33: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

33

TIPO DE COLEGIO

fiscomisionalfiscalparticular

FREC

UEN

CIA

ABS

OLU

TA

300

200

100

0 22

206

44

Fuente: Datos tomados de la tabla 2.9

2.5.2.2 DIAGRAMA DE BARRAS COMPUESTAS

Mediante este diagrama se puede representar dos series de datos y así efectuar

comparaciones.

EJEMPLO.- Representar en un diagrama de barras compuestas los resultados definitivos

de la segunda vuelta electoral realizada el 6 de mayo de 1984. Correspondiente a la Costa,

para el Ing. León Fébres Cordero y para el Dr. Rodrigo Borja.

Tabla 2.10.- RESULTADOS DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL

REALIZADA EL 6 DE MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING.

LEÓN FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA.

provincias Ing. León Fébres Cordero Dr. Rodrigo Borja Guayas Manabí

Los Ríos El Oro

Esmeraldas

493581 129622 68309 48771 28180

232410 104730 56321 70963 39262

Page 34: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

34

Para obtener el diagrama de barras compuestas utilizamos el siguiente procedimiento:

Primero sumamos las votaciones de los dos candidatos para cada una de las provincias.

Tabla 2.11 DISTRIBUCIÓN DE FRECUENCIA PARA RESULTADOS

DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL REALIZADA EL 6 DE

MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING. LEÓN

FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA.

Provincias Ing. León Febres Cordero

Dr. Rodrigo Borja TOTAL

Guayas Manabí

Los Ríos El Oro

Esmeraldas

493581 129622 68309 48771 28180

232410 104730 56321 70963 39262

725991 234352 124630 119734 67442

Luego utilizamos el primer cuadrante del sistema de coordenadas, para representar las

provincias en el eje horizontal y las frecuencias en el eje vertical. Representamos en cada

una de las barras el total de la votación de los dos candidatos para cada provincia.

Ubicamos en cada una de las barras la frecuencia de cada candidato identificándolo con la

leyenda correspondiente. Entonces el grafico queda así:

Figura 2.5 . Diagrama de Barras compuestas para los datos de la tabla 2.11.

0

200000

400000

600000

800000

Guayas Manabí Los Rios El Oro Esmeraldas

Ing. León Febres Cordero Dr. Rodrigo Borja

Page 35: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

35

Fuente: Tribunal Supremo Electoral Boletín oficial de los escrutinios de las votaciones del

6 Mayo de 1984.

2.5.2.3 DIAGRAMA PASTEL O DE SECTORES

Para construir una gráfica de pastel o diagrama pastel cuando no se dispone de software

apropiado se usa compás y transportador ( graduador) el primero para dibujar el círculo y el

segundo para la medir los sectores del pastel apropiados. Puesto que el circulo tiene 360º el

transportador puede usarse para dividir el pastel basándose en “rebanadas” de porcentaje

deseadas. Los grados que le corresponde a cada clase o “rebanada” se los obtiene

realizando una regla de tres simple y se la ubica en la tabla de distribución de frecuencia

que se elaborara para el efecto de la misma manera que para los diagramas de barras.

Tabla 2.12 TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA LA VARIABLE:

Tipo de colegio en el que obtuvieron su título de bachiller 272 estudiantes de la

Politécnica.

TIPO DE COLEGIO

F fr % º Particular 44 0,162 16 59º

Fiscal 206 0,757 76 272º Fiscomisional 22 0,081 8 29º

Total 272 100,0 100,0 360º

Figura 2.6. Diagrama Pastel de los datos de la tabla 2.10

Page 36: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

36

TIPO DE COLEGIO

22 / 8%

206 / 76%

44 / 16%

fiscomisional

fiscal

particular

Fuente: Datos tomados de la tabla 2.12.

2.5.2.4 DIAGRAMA DE PARETO

El diagrama de Pareto es un tipo especial de gráfica de barras verticales en la que las

respuestas categorizadas se grafican en el orden de rango descendiente de sus frecuencias y

se combinan con un polígono acumulativo en la misma escala. El principio básico detrás de

este dispositivo gráfico es su capacidad de distinguir los “pocos vitales” de los “muchos

triviales”, permitiéndonos enfocar las respuestas importantes. Así pues, el diagrama logra

su mayor utilidad cuando la variable categórica de interés contiene muchas categorías. El

diagrama de Pareto se usa ampliamente en el control estadístico de procesos y calidad de

productos

Al construir el diagrama de Pareto, el eje vertical contiene los porcentajes (de 100 en el

extremo superior a 0 en el extremo inferior) y el eje horizontal contiene las categorías de

interés. Las barras igualmente espaciadas también deben ser de igual ancho y, para un

impacto visual, sugerimos que las barras sean del mismo color. El punto del polígono de

porcentaje acumulativo para cada categoría se centra en el punto medio de cada barra

respectiva. Por tanto, al estudiar un Diagrama Pareto, debemos concentrarnos en dos cosas,

Page 37: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

37

las magnitudes de las diferencias en las longitudes de las barras correspondientes a las

categorías descendientes adyacentes y los porcentajes acumulativos de estas categorías.

Figura 2.7. Diagrama Pareto de los datos de la tabla 2.10

TIPO DE COLEGIO

fiscomisionalparticularfiscal

FREC

UEN

CIA

S

300

200

100

0

POR

CEN

TAJES

100

75

50

25

022

44

206

Fuente: Datos tomados de la tabla 2.12

2.5.2.5 CARTOGRAMA

Consiste en un mapa sobre el cual se destacan diferentes motivo, sea rayando coloreando o

utilizando diversas figuras o signos convencionales que estén en relación con el hecho o

fenómeno que se quiere resaltar. Por ejemplo El cartograma de América de Sur en el cual

se hallan localizados los diferentes países que lo forman.

Page 38: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

38

2.5.2.6 PICTOGRAMA

Es un recurso que se utiliza para efectuar la representación de los fenómenos investigados

mediante signos o figuras que atraigan la atención; por lo cual es el gráfico que se utiliza

con gran ventaja en situaciones publicitarias, antes que en representaciones estadísticas, en

las que también existe inconveniente de no poder representar la fracción.

EJEMPLO.- Vamos a representar la población de seis provincias del Ecuador según datos

estimados por el INEC.

Tabla 13.- Datos del número de habitantes de seis provincias del Ecuador según los

datos proporcionados por el INEC.

PROVINCIAS MAS DENSAMENTE POBLADAS DEL

ECUADOR

GUAYAS

PICHINCHA

MANABÍ

LOS RÍOS

AZUAY

LOJA

2038703

1330076

1025858

516840

438760

410509

Gráficamente de los puede representar de la siguiente manera:

Page 39: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

39

Figura 2.8. Pictograma de los datos de la tabla 2.13

Guayas

Pichincha

Manabí

Los Ríos

Azuay

Loja

Donde: = 100 000 habitantes

= 25 000 a 38 000 habitantes.

Fuente: INEC 2000.

ACTIVIDADES RECOMENDADAS

1.- Un conjunto tiene 100 observaciones; la más grande es 315 y la más pequeña es 56.

a) ¿Cuántas clases debería tener la tabla de frecuencia?. ¿Por qué?

b) ¿ Cual es la amplitud del intervalo ?

c) ¿Qué valores deberán ir en cada clase como limites superior e inferior?

d) ¿Cuáles son las marcas de clase para estos intervalos ¿

2.- En un estudio reciente sobre 500 graduados en administración de negocios, el salario

inicial más alto que se reportó fue de $27.500 al año y el más bajo fue de $19.900. Usted

Page 40: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

40

desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de

trabajo que Ud. ha recibido

a) ¿Cuántas clases pondría en su tabla de frecuencias . Porqué?

b) ¿ Cuál es la amplitud del intervalo ?

c) c) ¿Cuáles son los limites y puntos medios de cada clase?

3.- Elabore una distribución de frecuencia en forma tabular y gráfica. Los datos obtenidos

son del número de accidentes ocurridos durante 60 días tomados al azar en la ciudad de

Riobamba los cuales han sido proporcionados por la Policía Nacional . comente los

resultados.

9 7 4 3 6 5 8 2 3 6 2 3 0 3 0 2 1 3 1 5 11 7 4 2 3 2 4 7 3 2 1 3 2 1 0 1 2 2 2 3 3 2 5 4 3 6 2 8 2 3 4 1 2 1 6 1 3 2 1 1

4.- Los siguientes datos pertenecen a las precipitaciones pluviales (anuales) de los últimos

50 años, registradas en la zona del estado de Ohio. Elabore una tabla de distribución de

frecuencias y un histograma de frecuencias relativas tanto absolutas como acumuladas.

Interprete los datos que se obtienen en la tabla como en los gráficos estadísticos.

15.2 14.6 27.9 24.9 20.0 43.5 30.7 30.0 35.7 40.9 23.4 17.8 26.9 30.8 19.9 36.8 33.4 19.8 29.6 38.2 25.1 42.0 35.2 15.6 25.5 29.7 27.8 14.6 22.1 24.3 30.1 30.1 22.1 24.4 28.7 35.0 26.1 28.2 19.4 28.7 28.0 25.3 31.8 31.0 28.3 13.5 32.1 25.4 26.7 36.8

5.- Los siguientes datos son los ingresos de 60 ejecutivos de marketing para una empresa

“X” ( ponga Ud. el nombre a la empresa). Los datos están expresados en miles de dólares

58 76 89 45 67 34 64 76 34 65 45 39 79 74 56 71 85 87 74 38 69 79 61 71 69 62 56 38 69 79 71 54 31 69 62 39 65 79 47 46 77 66 55 75 62 57 77 36

Page 41: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

41

73 72 64 69 51 50 40 50 74 61 69 73

a) Construya una tabla y grafico de frecuencia absoluta para los datos. Interprete los

resultados tanto de la tabla como del gráfico

b) Construya una tabla y grafico de frecuencia acumulada para los datos. Interprete los

resultados tanto de la tabla como del gráfico

6.-La junta de directores de una gran cooperativa de vivienda desea investigar la posibilidad

de contratar a un supervisor para un campo de juegos al aire libre. Se sondearon las 616

casas de la cooperativa, cada una con un voto, sin importar su tamaño. Se recolectaron los

siguientes datos:

¿Debería la cooperativa contratar un Supervisor? Si 146 No 91 No está seguro 58 Sin respuesta 321 Total 616

a) Convierta los datos en porcentaje y construya

1.- Un diagrama de barras

2.- Un diagrama pastel

b) Eliminando el gripo “sin respuesta”, convierta las 295 respuestas a porcentajes y

construya

1.- Un diagrama de barras

2.- Un diagrama pastel

c) ¿Cuál de estos gráficos prefiere y porqué?

d) Basándose en los resultados de a) y c) ¿ Que recomendaría hacer a la junta de

directores?.

7.- Los siguientes datos representan acciones de mercado ( en porcentaje ) propiedad de

fabricantes de teléfonos celulares portátiles vendidos durante 1999.

Page 42: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

42

Fabricante Acciones del mercado (%)

Motorota 22 Nokia 14 Mitsubishi 10 Toshiba 9 Samsung 8 Todos los demás 37 Total 100

Fuente: The New York Times, 31 de Octubre de 1993, Pág. 1

Construya:

a) Un diagrama de barras

b) Un diagrama pastel

c) Describa estos resultados en un breve informe y sugiera algunos planteamientos

para que Samsung pueda mejorar su posición en el mercado.

8.- Las importaciones a los Estados Unidos provenientes de países en desarrollo

constituyeron el 41,4% de un total estimado de 575.9 miles de millones de dólares en el año

1993. Por otra parte, las exportaciones de los Estados Unidos hacia países en desarrollo

constituyeron 40.7% de un total estimado de 459.600 de millones de dólares en ese mismo

año. La siguiente tabla presenta un desglose por país o región ( en porcentaje ) de

importaciones y exportaciones de Estados Unidos para el año 1993:

País o Región Acciones del mercado de importaciones a los

EE.UU %

Acciones del mercado de las exportaciones de los

EE.UU (%) África 2.3 1.6 Asia ( excluyendo Japón) 23.5 17.2 Canadá 19.2 21.7 Comunidad Europea 16.6 20.8 Japón 18.4 10.4 Latinoamérica 12.9 16.8 Medio Oriente 2.7 4.7 Otro 4.4 6.8 Total 100 100

Fuente: The New York Times, 19 de Diciembre de 1993, Pág. F7.

Page 43: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

43

Construya:

a) Diagramas de barras separadas para importaciones y exportaciones

b) Diagramas pastel separados para importaciones y exportaciones

c) Diagramas de barras unidas para importaciones y exportaciones

d) ¿Cuál de estas graficas prefiere y por que?

e) Realice un resumen interpretativo de una de las graficas construidas.

9.- Recoja datos de su empresa o lugar de trabajo y elabore un cartograma

10.- Recoja datos de su empresa o lugar de trabajo y elabore un pictograma.

AUTOEVALUACION

1.- Un conjunto de datos concreto tiene 130 observaciones. ¿Alrededor de cuantas clases

deberá contener la distribución de frecuencias?

2.- ¿Porque es necesario organizar los datos de un modo sistemático después de

recogerlos?. ¿Por qué no dejarlos en su forma bruta para preservar su integridad y no

traicionar su verdadero significado?

3.- Definir y poner ejemplos de los métodos de organización de datos que se han explicado.

¿Cuáles son las ventajas de cada uno de ellos?

Distribución de frecuencias

Distribución de frecuencias acumuladas

Distribución de frecuencias relativas

Gráfico circular

Histograma

4.- ¿Cuál es la relación entre un polígono de frecuencias y una ojiva?

Page 44: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

44

5.- ¿En qué forma resultarán afectados los limites de clase de una distribución de

frecuencias si trabajamos con datos continuos en lugar de discretos?

6.- Exponer con brevedad las reglas que se han de observar para establecer intervalos y

límites de clase en una distribución de frecuencias. ¿Qué consideraciones habremos de

tener en cuenta si trabajamos con datos continuos?

Page 45: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

45

UNIDAD III

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA

DATOS NO AGRUPADOS

3.1 INTRODUCCIÓN

El análisis de datos suele realizarse de diversas maneras, dependiendo de si existe una

cantidad pequeña o grande de datos que se deba analizar. Cuando existen, digamos, 30 o

menos puntos de datos, se utilizan los métodos que presentaremos a continuación; para

mayores cantidades de datos, son más prácticas las computadoras o técnicas en las que es

necesario llevar a cabo, en primer lugar, el agrupamiento de los datos antes del análisis.

Tales técnicas se explicarán con mayor detalle más adelante.

Con frecuencia un conjunto de números se puede reducir a una o unas cuantas medidas

numéricas sencillas que resumen el conjunto total. Tales medidas son mas fáciles de

comprender que los datos originales, no procesados. Más aún, son esenciales para técnicas

de cálculo. Dos importantes características de los datos que las medidas numéricas pueden

poner de manifiesto son: 1) el valor central o típico del conjunto y 2) la dispersión de los

números.

El objetivo de esta parte es presentar los métodos más útiles para resumir datos. Mientras

no exista una medida mejor para este objeto, diferentes situaciones suelen inclinarse más

por una técnica que por otra. La siguiente exposición presenta una gran variedad de

técnicas y sugiere algunas consideraciones generales que se pueden utilizar para seleccionar

entre diversas medidas.

Page 46: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

46

3.2 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central se utilizan para indicar un valor que tiende a tipificar o a

ser el más representativo de un conjunto de números. Las tres medidas que más

comúnmente se emplean son la media, la mediana y la moda.

3.2.1 MEDIA ARITMÉTICA

La media aritmética es lo que viene a la mente de la mayoría de las personas cuando se

menciona la palabra "promedio". Como este término tiene ciertas propiedades matemáticas

deseables, es la más importante de las tres medidas que estudiaremos. La media aritmética

se calcula al sumar los valores de un conjunto y al dividir el producto de esta suma entre el

número de valores del mismo. De este modo, la media de los valores 70, 80 y 120 es

903

2703

1208070

Si un alumno presentó cuatro exámenes y obtuvo calificaciones de 83, 94, 95 y 86, la

calificación promedio del alumno es 89,5:

5,894

86959483

La media de una muestra se representa por el símbolo x (que se lee "x con raya"), y su

cálculo se puede expresar en notación sigma como se observa a continuación.

n

xx

n

1ii

o, en forma más simple como n

xx

Page 47: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

47

El procedimiento para calcular la media aritmética es el mismo, independientemente de si

un conjunto de valores representa las observaciones de la muestra o todos los valores

obtenidos de una población. Sin embargo, se utiliza el símbolo para la media de una

población y N para el número de elementos de la misma:

nx

La media presenta ciertas propiedades útiles e interesantes, que explican por qué es la

medida central que se utiliza más ampliamente:

1. La media siempre se puede calcular para un conjunto de números.

2. Existe una media única para un conjunto dado de números.

3. La media es sensible a (o afectada por) cada valor del conjunto. De este modo, si cambia

algún valor, la media también cambiará.

4. Si se suma una constante a cada valor del conjunto, la media aumentará por la misma

cantidad. De manera que si se suma una constante de 4.5 a cada valor, la media aumentará

en 4.5. En forma similar, el restar de cada valor una constante, o bien, multiplicarlo o

dividirlo por la misma, hará que la media disminuya en la misma cantidad, o resulte

multiplicada o dividida por dicha constante.

5.- La suma de las desviaciones de los números de un conjunto a partir de la media, es

cero:

0xx i

Por ejemplo, la media de los números 2, 4 y 6 es 4:

43

642x

Page 48: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

48

Si restamos 4 de cada número, tenemos,

2 – 4 = -2

4 – 4 = 0

6 – 4 = +2

0

3.2.2 MEDIA PONDERADA

La fórmula anterior para calcular la media aritmética supone que cada observación

es de igual importancia. En términos generales, esto suele suceder así, no obstante,

hay algunas excepciones. Tomemos, por ejemplo, la situación en la que un profesor

informa a su clase que les hará dos exámenes de una hora, cada uno de los cuales

equivaldrá al 30% de la calificación de todo el curso, y un examen final que

corresponderá al 40%.

El cálculo de la media deberá considerar las diferentes ponderaciones de los

exámenes. Se aplica la siguiente fórmula:

n

1ii

n

1iii

w

xwponderadamedia

donde w¡ es el valor de la observación i-ésima. Así, un alumno que obtenga 80 en el primer

examen, 90 en el segundo y 96 en el final, obtendrá un promedio de 89,4:

Page 49: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

49

Examen Calificación Ponderación no. 1 80 0,30

no. 2 90 0,30 final 96 0,40

media ponderada = 0.30(80) + 0.30(90) + 0.40(96) = 89.4

0.30 + 0.30 + 0.40

Supóngase que en otra asignatura hay un examen de medio curso y otro final, y que este

último va a valer el doble que el primero. Un alumno que obtenga 95 en el primer examen y

89 en el segundo, tendría un promedio de 91.0.

Examen Calificación Ponderación Intermedio 95 1 Final 89 2

0.9121

)89(2)95(1ponderadamedia

3.2.3 MEDIANA

La segunda medida de tendencia central de un conjunto de números es la mediana. Su

característica principal es que divide un conjunto ordenado en dos grupos iguales; la mitad

de los números tendrá valores que son menores que la mediana, y la otra mitad alcanzará

valores mayores que está. Para encontrar la mediana, primeramente es necesario ordenar los

valores (generalmente) de menor a mayor. Posteriormente se deberá separar la mitad de los

valores para obtener la mediana.

Por ejemplo, la mediana del grupo 5, 6 y 8 es 6, en el cual el 6 está en medio. En términos

generales, la mediana ocupa la posición (n + 1)/2. Por tanto, para tres números, la posición

es (3 + 1)/2 = 2 o sea, la segunda posición.

Page 50: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

50

Considérese un segundo ejemplo: Obtener la mediana de estos valores: 7, 8, 9 y 10. Según

la fórmula, la posición de la mediana es (4 + 1)/2 = 2.5 que se encuentra a la mitad de los

dos valores intermedios, o sea 8.5 en este caso. Esto deja dos valores menores y dos

mayores.

El procedimiento para obtener la mediana es como sigue:

1. Ordenar o clasificar los valores.

2. Contar para saber si existe un número de valores par o impar.

3. En caso de que se tenga un número impar de valores, la mediana es el valor

intermedio. En cambio, para un número par de valores, la mediana es el

promedio de los dos valores intermedios.

A continuación presentamos algunos ejemplos.

Par Mediana Impar Mediana

a.- 2.3. 3.4 3 a.- 1. 2. 3. 3,3.4. 7 3

b.-1,18, 19,20 18.5 b.- 9, 40, 80, 81,100, 80

La mediana de un conjunto de números es mayor que la mitad de los valores y menor que

la otra mitad de los mismos.

3.2.4 COMPARACIÓN ENTRE LA MEDIA Y MEDIANA

Elegir el uso de la media o la mediana como medidas de tendencia central de un conjunto

de números depende de varios factores. La media se ve afectada o es influida por todo valor

Page 51: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

51

del conjunto, incluyendo los extremos. La mediana, por otra parte, es relativamente

insensible a valores extremos.

En términos generales, la media posee ciertas propiedades matemáticas que la hacen más

atractiva. Además, ordenar los datos para encontrar la mediana puede resultar aburrido, y

para determinarla no es posible utilizar una calculadora como sucede al obtener la media.

3.2.5 MODA

La moda es el valor que con más frecuencia se presenta en un conjunto. Por ejemplo, en el

conjunto 10, 10, 8, 6 y 10, el 10 se presenta tres veces, en tanto que cada uno de los otros

valores, sólo una vez. El valor más frecuente, la moda, es 10. El valor moda es descriptivo

cuando se trabaja con canteo de datos.

En comparación con la media y mediana, la moda es la menos útil para la mayoría de los

problemas estadísticos, ya que no se inclina por un análisis matemático en el mismo sentido

que lo hacen las otras dos(media y mediana) Sin embargo, desde un punto de vista

puramente descriptivo, la moda es indicativa del valor "típico" en términos del valor que se

presenta con mayor frecuencia. La moda es más útil cuando uno o dos valores, o un grupo

de éstos, ocurren con mayor frecuencia que otros. Por el contrario, cuando la mayoría o

todos los valores se presentan casi con la misma frecuencia, la moda no sirve para describir

datos.

La moda es el valor que ocurre con mayor frecuencia.

Esta es una medida que sirve para datos continuos, discretos, nominales y jerarquizados. Es

decir es la única medida de tendencia central que sirve para todo tipo de datos.

Page 52: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

52

3.2.6 COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA

Definición Ventajas Limitaciones

Media

n

xx

n

1ii

1.- refleja cada valor

2.- propiedades matemáticas

atractivas

1.- puede ser

excesivamente influida

por los extremos

Mediana

La mitad de los

valores son

mayores, la otra

mitad es menor

1.- es menos sensible que la

media

1.- difícil de determinar si

hay gran cantidad de datos

Moda Valor con la

frecuencia más alta

1.- valor “típico”; más

valores en este punto que en

cualquier otro

1.-no se presta para

análisis matemático. 2.- puede o no haber un

valor modal para algunos

conjuntos de datos.

3.3 MEDIDAS DE DISPERSIÓN

Para describir en forma adecuada un conjunto de datos, es necesario dos tipos de medidas

de resumen. Además, para obtener información respecto a la parte media de un conjunto de

números, es conveniente también tener un método para expresar la cantidad de dispersión o

difusión que hay entre los números.

Por ejemplo, las medidas de dispersión indican si los valores están relativamente cercanos

uno del otro o si se encuentran dispersos. En una forma esquemática, esto se ilustra en la

figura 1 en las partes (a) y (b). Las observaciones en la figura 1 (a) tienen valores que están

relativamente cercanos entre si, en comparación con los de la figura 1 (b).

Page 53: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

53

. . ........... . (a) Baja dispersión

. . . . . . . . . . . (b) Alta dispersión

Figura 3.1 la dispersión mide cuan próximos están los valores del grupo entre si.

Es conveniente considerar cuatro variables de dispersión: la amplitud de variación (rango),

la desviación media, la varianza y la desviación estándar. Todas estas medidas excepto el

rango toman a la media como punto de referencia. En cada caso, un valor cero indica que

no hay dispersión, en tanto que la dispersión aumenta a medida que se incrementa el valor

de la medida del rango , varianza, etc.

3.3.1 RANGO

El rango o amplitud de variación de un grupo de datos es generalmente la medida mas

sencilla de calcular y comprender, Se concentra en el número mayor y el número menor

del grupo (es decir, los puntos extremos). Dicha medida se puede expresar en dos formas:

1. La diferencia entre los valores extremos (mayor – menor)

2. Los valores mayor y menor del grupo (del menor al mayor)

El uso de una u otra manera de expresar el rango depende de la naturaleza del conjunto de

datos y de la magnitud de los mismos.

Por ejemplo saber solo que el rango de un conjunto de datos es 44, no dice nada más

respecto a los números; sin embargo, si se establece que el rango es de 300 a 344, se

proporciona más información acerca de la magnitud de los números.

Page 54: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

54

El rango se puede expresar, estableciendo la diferencia entre los números mayor y

menor de un grupo, o bien, identificando ambos números

EJEMPLOS:

RANGO O AMPLITUD DE VARIACIÓN

NÚMEROS DIFERENCIA DEL MAS BAJO AL MAS ALTO

1,5,7,13 13 – 1 = 12 1 al 13

14,3,17,4,8,73,36,48 73 – 3 = 70 3 al 73

3,2;4,7;5,6;2,1;1,9;10,3 10,3 – 1,9 = 8,4 1,9 al 10,3

La ventaja de utilizar esta medida como medida de dispersión, se base en el hecho de que

su obtención es relativamente sencilla, aún cuando se trate de un conjunto bastante grande

de números.

La principal limitación que tiene en cambio es que se considera solamente los valores

extremos del conjunto, y no proporciona mayor información respecto a los demás valores

del mismo.

. ... . .. ... ..

(1)

. ... ............ . (2)

. . . . . . . . . . . . .

(3)

Figura 3.2 Tres grupos de datos, todos con el mismo rango.

Page 55: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

55

En la figura 3.2 se presentan tres conjuntos de datos bastante diferentes, que poseen el

mismo rango, pero no así la misma dispersión. En el primero, los valores se distribuyen en

forma uniforme, y esta medida cumple con su objetivo. En el segundo conjunto, los

números se encuentran más agrupados, aunque el rango aún proporciona una “cruda”

medida de dispersión. No obstante, el tercer conjunto demuestra cómo se puede influir

fácilmente en el rango mediante unos cuantos valores extremos, y representar información

bastante engañosa respecto a la dispersión de una serie de números.

Debido a estos problemas el rango no es suficiente para medir la dispersión de datos

entonces citaremos algunas medidas de este tipo pero que utilizan a la media como punto

de referencia.

3.3.2 MEDIDAS DE DISPERSIÓN QUE UTILIZAN LA MEDIA COMO PUNTO DE

REFERENCIA

Dadas sus propiedades matemáticas, la media de un conjunto de datos casi siempre se

calcula. En consecuencia, se ha encontrado determinado número de medidas de dispersión

que utilizan esta medida como punto de referencia.

Todas estas incluyen la obtención de la desviación o diferencia entre cada valor del y la

media xx i . Se consideran tres de estas medidas, la primera trata sobre la desviación

absoluta respecto de la media, mientras que las otras dos se concentran en desviaciones

cuadradas a partir de la media.

El análisis se llevara a cabo principalmente con cálculos que comprendan datos muestrales,

en oposición a datos obtenidos a partir de poblaciones enteras, con la idea de que la

estadística muestral se utilizará para aproximar los parámetros de la población.

Page 56: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

56

3.3.3 DESVIACIÓN ABSOLUTA MEDIA (DAM)

La desviación absoluta media (DAM) mide la desviación promedio de valores con respecto

a la media del grupo, sin tomar en cuenta el signo de la desviación. Se obtiene al restar la

media de cada valor del grupo, eliminando el signo (+ 0 - ) de la desviación (es decir

tomando el valor absoluto de esta resta), hallando después el promedio (dividir para el

número de las observaciones n). Por definición se debe tener en cuenta que la suma de las

desviaciones positiva y negativas de la media siempre será igual a cero. La DAM se calcula

mediante la siguiente fórmula:

n

xxDAM

n

1ii

donde n es el número de observaciones.

Ejemplo.- Obtenga la DAM para el siguiente conjunto de valores

1, 2, 3, 4, 5

Solución.-

Primero calculamos la media

35

543215

xx

5

1ii

para facilitar los cálculos se sugiere realizar la siguiente tabla:

xi x xx i xx i 1 2 3 4 5

3 3 3 3 3

-2 -1 0 1 2

2 1 0 1 2

0 6

Page 57: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

57

Luego sacamos el promedio: 2.1

56

y esta será la DAM es decir :

DAM = 1.2

La desviación absoluta media de un conjunto de datos es la desviación promedio de los

valores del conjunto con respecto a la media sin tomar en cuenta el signo de la

diferencia.

Es relativamente sencillo comprender la desviación media, no obstante, no se la emplea tan

ampliamente como medida de dispersión, ya que otras medidas presentan propiedades

matemáticas mas atractivas, a la DAM se le utiliza de diferentes manera en control de

inventarios.

3.3.4 VARIANZA

La varianza de una muestra se calcula casi en la misma forma que la desviación media, con

dos pequeñas diferencias:

1.- Las desviaciones se elevan al cuadrado antes de sumarlas y

2.- Se obtienen el promedio, utilizando n-1 en lugar de n, ya que esta pretende

proporcionar un mejor cálculo de la varianza de la población del obtenido mediante

el uso de n.

La varianza muestral se puede calcular mediante la siguiente formula:

1n

xxss

n

1i

2i

2x

2

Page 58: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

58

Si un conjunto de datos constituye una población, o bien, si el objeto de resumir los datos

es únicamente para describir un conjunto de datos en lugar de sacar inferencias respecto a

una población, entonces se deberá sustituir en el denominador (n-1) por n.

Ejemplo: Calcular la varianza de la siguiente muestra: 1,2,3,4,5

Solución.- Para facilitar los cálculos se sugiere realizar la siguiente tabla:

xi x xx i 2i xx

1 2 3 4 5

3 3 3 3 3

-2 -1 0 1 2

4 1 0 1 4

0 10

Luego aplicamos la fórmula de la varianza:

5,2

410

15

xxs

5

1i

2i

2

Nota.- si tales valores hubieran sido todos los valores de una población, su varianza sería

10/5 = 2.

A la varianza la podemos definir como:

La desviación promedio de los valores obtenidos a partir de la media, elevada al

cuadrado y calculada mediante n-1 en lugar de n.

En resumen los pasos necesarios para calcular la varianza son los siguientes:

Page 59: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

59

1.- Calcular la media

2.- Restar la media de cada valor del conjunto

3.- Elevar al cuadrado cada una de estas desviaciones

4.- Sumar los cuadrados de las desviaciones

5.- Dividir entre (n-1) en el caso de datos muestrales; dividir entre n simplemente para

resumir el conjunto o si los datos equivales a todos los valores de una población.

Una fórmula alternativa que suele emplearse para calcular la varianza muestral es

1n

nxxss

2n

1ii

n

1i

2i

2x

2

una vez más se sustituye n-1 por n en el denominador , para obtener la varianza de la

población.

Esta fórmula algunas veces es más fácil de utilizar que la anterior ya que no se requiere

calcular la media y no es necesario obtener cada una de las desviaciones. Y en el caso de

que una media se por ejemplo 3,333333333, el método anterior da lugar a errores, debido al

redondeo de números.

Mediante los datos anteriores podemos ver que la varianza calculada con esta fórmula es

igual a la que resulto anteriormente.

xi 2ix

1 2 3 4 5

1 4 9 16 25

15 55

Page 60: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

60

La varianza será:

5,24

104

455515

)5/15(551n

nxxs

2

2n

1ii

n

1i

2i

2

3.3.5 DESVIACIÓN ESTÁNDAR

La desviación estándar es simplemente la raíz cuadrada positiva de la varianza. De este

modo si la varianza es 81 la desviación estándar será 9; si la varianza es 10 la desviación

estándar es 10 = 3,16. Para obtener la desviación estándar se debe calcular la varianza y

hallar su raíz cuadrada. Las fórmulas para la desviación estándar son:

1n

nxx

1n

xxs

2n

1ii

n

1i

2i

n

1i

2i

Al igual que para la varianza si se desea calcular la desviación estándar de la población

basta sustituir en el denominador n -1 por n.

La desviación estándar es una de las medidas de resumen que más se suele utilizar para

distribuciones, y desempeña un papel importante en la estadística. Es importante observar

que las unidades de la desviación estándar son las mismas que las de la media.

Por ejemplo, si la media esta en unidades monetarias, la desviación estándar también lo

estará, Si la media esta en metros lo mismo ocurrirá con la desviación estándar. Por otro

lado, la varianza se expresa en unidades al cuadrado ( es decir, unidades monetarias2,

metros2).

Page 61: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

61

EJEMPLO: Estime la desviación estándar de la muestra dada anteriormente.

Como la varianza era 5,2s 2 entonces 5,2s 1,58.

En si la

Desviación estándar de un conjunto de datos se define como la raíz cuadrada positiva de

la varianza.

3.3.6 COEFICIENTE DE VARIACIÓN

La desviación estándar es un término absoluto del que se pueden sacar conclusiones

erróneas sobre la dispersión de la muestra. Así para una muestra de x = 30 y s = 4 y otra de

x = 60 y s = 6 parece que en principio la segunda es más dispersa. Sin embargo reduciendo

los datos a una misma escala sucede lo contrario.

Para evitar lo anterior utilizamos el coeficiente de variación, que es el cociente que resulta

de dividir la desviación estándar entre la media aritmética.

)(100xsCV

Será más dispersa la muestra que tenga mayor coeficiente de variación.

En el caso anterior Cp= 4/30 = 0.13 para la primera muestra y Cp =6/60 = 0.1 para la

segunda. La primera tiene más dispersión que la segunda teniendo en cuenta la media de

cada una.

Este coeficiente no es conveniente usarlo cuando la media se halla muy próxima a 0. En los

demás casos es la medida de dispersión más representativa

Page 62: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

62

3.3.7 OTRAS MEDIDAS

Las medidas presentadas anteriormente se utilizan cuando los datos son de tipo

cuantitativo, con excepción de la moda, que sirve también con datos cualitativos

(nominales).

Otra medida que se emplea con datos de este tipo es la proporción que es la fracción o

porcentaje de elementos de un grupo o clase particular. La proporción se calcula mediante

la fórmula

nxproporción

en la cual x es el número de elementos que tienen determinada característica y n es el

número total de observaciones.

Por ejemplo si observamos que 10 personas de una muestra de 40 tienen color de ojos

negros, decimos que la proporción es 10/40 = 0,25 o 25%.

ACTIVIDADES RECOMENDADAS

1.- a) ¿Puede la desviación tener valor de cero?.¿Puede ser negativa? Explique.

b) ¿Puede ser negativa la desviación absoluta media? Explique

2.- Calcule la media y la desviación estándar de las ventas diarias si se obtuvieron ingresos

de: $8100, $9000, $5600, $7680, $4800, $10640.

3.- Obtenga la media y la mediana para cada uno de los siguientes conjuntos de datos.

a. 7, 9, 2, 1, 5, 4, 5, 7, 6, 2

b. 30, 2, 79, 50, 38, 17, 9

c. 90, 87, 92, 81, 78, 85, 95, 80

d. 1, 2, 10, 7, 7, 9, 8, 5, 2, 11

Page 63: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

63

e. 0.0011, 0.032, 0.027, 0.035, 0.042

f. 42, 30, 27, 40, 35, 32, 33.

4.- Calcule las medidas de tendencia central y de dispersión para el siguiente conjunto de

datos : 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, 87; suponiendo que son:

a) muestrales

b) de la población.

Realice un comentario sobre las respuestas y justifíquelo.

5.- Determine la desviación estándar para los valores del ejercicio 4 en términos muestrales

y de población.

6.- Calcule la mediana, la media y la moda para el número de clientes que están formados

en colas de 12 cajas en la oficina matriz de un importante banco. Si los datos son: 1, 3, 4, 3,

4, 2, 4, 1, 2, 2, 1, 0

7.- Calcule la media y la desviación estándar para los tiempos de reacción para los

siguientes datos muestrales:

2.2, 2.5, 2.7, 2.3, 2.4, 2.0, 2.7, 2.3, 2.4, 2.4, 2.8

8.- Considere los siguientes datos obtenidos sobre una muestra de precios de oferta:

26.5, 27.5, 25.5, 26, 27, 23.4, 25.1, 26.2, 26.8

a) Determine el rango

b) Obtenga la DAM

c) Encuentre la varianza

d) Calcule la desviación estándar.

9.Convierta cada uno de los siguientes enunciados en una proporción:

a) 5 niños de 25

b) 7 de nueve pacientes

c) 3 rojos, 4 azules y 5 verdes de 12 canicas.

Page 64: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

64

10.- Calcule cada una de las siguientes proporciones por medio de la tabla que se muestra a

en la figura 3.3:

a) Días soleados del mes de junio

b) Días parcialmente nublados del mes de junio

c) Domingos soleados

d) Fines de semanas lluviosos (viernes, sábado, domingo)

e) Días con nieve.

f) Jueves nublados

Figura 3.3.- Tiempo del mes de Junio

D L M M J V S

1

2

3 4

5

6

7 8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

Soleado Parcialmente nublado:

Nublado; lluvioso; nevado

Page 65: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

65

AUTOEVALUACION

1.- Definir y poner ejemplos de una medida de tendencia central y una medida de

dispersión.

2.- ¿En qué condiciones preferiría usted la mediana a la madia aritmética como medida de

tendencia central? Explíquelo.

3.- Como propietario de una agencia de publicidad próspera de Chicago, George Kay gana

110000 dólares al año. Sus siete empleados más recientes ganan 15000, 21000, 18500,

17900, 21200, 15900 y 22500 dólares. ¿Qué medida de tendencia central piensa usted que

es la mejor indicación del promedio de estos ocho sueldos? Calcule el promedio.

4.- Helen es directora de los servicios de personal de un gran banco de la ciudad. Tiene que

contratar a una secretaria por su eficiencia en mecanografía. Una candidata al trabajo

mecanografío seis veces un manuscrito con el siguiente número de errores: 5, 6, 2, 1, 2, 0.

Otra candidata mecanografío el mimo manuscrito seis veces con: 3, 4, 5, 3, 4 y 5 faltas.

¿Qué candidata debe contratar Helen?

Page 66: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

66

UNIDAD IV

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA

DATOS AGRUPADOS.

4.1 INTRODUCCIÓN

En la unidad anterior se dieron las nociones básicas de estas medidas, aplicadas a casos en

los cuales las observaciones eran pocas, en esta unidad se ampliaran estos conceptos para

series estadísticas, ya sean de intervalos o de frecuencias.

4.2 MEDIDAS DE TENDENCIA CENTRAL

4.2.1 LA MEDIA ARITMÉTICA

4.2.1.1 LA MEDIA ARITMÉTICA DE UNA SERIE ESTADÍSTICA DE

FRECUENCIAS.

Para obtenerla se multiplica la variable por la frecuencia correspondiente, luego se halla la

suma de todos estos productos y dividimos por el número de casos.

Esta descripción se puede sintetizar con la fórmula:

n

fXX

n

1iii

En donde:

X = Media Aritmética

Xi . fi = Sumatoria del producto de la variable por la frecuencia de cada clase

n = número de casos u observaciones.

Page 67: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

67

Media Aritmética = casos de númerofrecuencia lapor variablela de producto del atoriaSum

EJEMPLO: Los datos de una encuesta aplicada a estudiantes, en relación al número de

hermanos, una vez tabulados quedan así:

X f 1 2 3 4 5 6 7 8 9

10 11 12

3 10 10 16 14 7 8 7 1 0 2 1

79

Determinar la Media Aritmética: Para ello construimos la siguiente tabla

x f X.f 1 2 3 4 5 6 7 8 9 10 11 12

3 10 10 16 14 7 8 7 1 0 2 1.

3 20 30 64 70 42 56 56 9 0 22 12

79 384

Page 68: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

68

Aplicando la fórmula n

fXX

n

1iii

tendremos

586479

384X .

Como conclusión tenemos que los 79 alumnos encuestados tiene un promedio de 5

hermanos.

4.2.1.2 LA MEDIA ARITMÉTICA DE UNA SERIE ESTADÍSTICA DE

INTERVALOS

A este procedimiento lo podemos sintetizar de la siguiente manera:

1. Encontramos los puntos medios de la serie.

2. Multiplicamos las frecuencias por los puntos medios correspondientes.

3. Sumamos todos los productos de las frecuencias por los puntos medios.

4. Dividimos la suma anterior por el número de elementos de la serie.

Todo este procedimiento lo podemos sintetizar con la fórmula:

n

fXmX

n

1iii

Siendo:

X = Media Aritmética

f . Xm = Sumatoria de los productos de las frecuencias por los puntos medios

n = número de elementos

Page 69: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

69

Media Aritmética = elementos de Númeromedios puntos lospor sfrecuencia las de productos los de aSum

EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba,

Provincia de Chimborazo en el año 2002 fue:

X f

21 – 25

26 – 30

31 – 35

36 – 40

41 – 45

46 – 50

51 – 55

56 – 60

61 - 65

83

191

99

67

41

27

16

7

4

Calcular la Media Aritmética:

X F Xm f.Xm

21 – 25

26 – 30

31 – 35

36 – 40

41 – 45

46 – 50

51 – 55

56 – 60

61 - 65

83

191

99

67

41

27

16

7

4

23

28

33

38

43

48

53

58

63

1.909

5.348

2.267

2.546

1.763

1.296

848

406

252

Page 70: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

70

De donde:

f . Xm = 17.635

n = 535

Si: n

fXmX

n

1iii

Entonces: 96.32

535635.17

X

La edad promedio de los 535 profesores ha sido de 32.96 años es decir 33 años.

4.2.1.3 PROPIEDADES Y APLICACIONES

4.2.1.3.1 PROPIEDADES

1 A la formula de la media aritmética se le puede despejar cualquiera de sus

elementos es decir puede ser tratada matemáticamente.

2 La media aritmética es un promedio que depende de todos los valores de la serie, es

afectada por los valores extremos.

3 La suma de las desviaciones con respecto a la media aritmética es igual a cero.

4 Se puede establecer la media aritmética de un conjunto de promedios o lo que es lo

mismo, determinar la media de las medias aritméticas.

5 Se puede establecer la media aritmética de un conjunto de promedio o lo que es lo

mismo, determinar la media de las medias aritméticas.

Page 71: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

71

4.2.1.3.2 APLICACIONES

Se utiliza:

1 Obtener un promedio representativo en la serie.

2 Comparar dos o más series.

3 Calcular otro tipo de medidas. Como medidas de dispersión, medidas de

correlación, etc.

4.2.2 LA MEDIANA

4.2.2.1. MEDIANA DE UNA SERIE ESTADÍSTICA DE FRECUENCIA.

Para determinar el valor de la mediana, hemos utilizado el siguiente procedimiento:

1. Calculamos la columna de la frecuencia acumulada

2. La mediana la encontramos en la variable que corresponde a la frecuencia

acumulada inmediata a aquella que sobrepasa la mitad del número total de casos

EJEMPLO: Los datos de una encuesta, sobre el número de hermanos de cada uno de

encuestados, una vez tabulados quedan así:

X f 1 2 3 4 5 6 7 8 9 10 11 12

3 10 10 16 14 8 7 7 1 0 2 1

79

Page 72: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

72

Determinar la mediana

X f fa

1

2

3

4

3

10

10

16

3

13

23

39

5 14 53

6

7

8

9

10

11

12

7

8

7

1

0

2

1

61

68

75

76

76

78

79

Puesto que: n/2 = 79/2 = 39.5 entonces: Mdm = 5

4.2.2.2 MEDIANA DE UNA SERIE ESTADÍSTICA DE INTERVALOS

Para este cálculo se sigue el siguiente proceso:

1. Determinar la columna de la frecuencia acumulada.

2. Dividimos (n/2), nos permite determinar la posición de la mediana.

3. Encontramos el límite real inferior del intervalo.

4. Obtenemos la frecuencia acumulada menor, que es la ubicación de la mediana.

5. Encontramos el valor de la frecuencia.

6. Hallamos el ancho del intervalo.

Todo este proceso la sintetiza la fórmula:

Page 73: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

73

if

mfa2nLiMdm ..)/(

Siendo:

Mdm = mediana

Li = límite real inferior

n/2 = número total de casos divido para dos

fa.m = frecuencia acumulada menor

i = ancho del intervalo

f = frecuencia

EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba,

Provincia de Chimborazo en el año 2002 fue:

X f 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65

83 191 99 67 41 27 16 7 4

535

Calcular la mediana

X f f.a 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65

83 191 99 67 41 27 16 7 4

83 274 373 440 481 508 524 531 535

535

Page 74: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

74

n/2 = 535/2 = 267.5

Li = 25 + 26 / 2 = 25.5

fa.m = 83

f = 191

i = 5

if

mfe2nLiMdm ..)/(

Reemplazando: 33.305.

191)835.267(5.25

Mdm

Se puede decir entonces que 30.33 es el valor central de la serie.

4.2.2.3 PROPIEDADES Y APLICACIONES

4.2.2.3.1 PROPIEDADES

1 La mediana no es como la media, un número que señale precisión en el cálculo,

sino que es un promedio que ocupa el valor central de la serie, haciendo que la

mitad de la población se ubique a su izquierda y, la otra mitad, a su derecha.

2 La mediana es un valor central y para su determinación no es necesario conocer

todos los elementos de la serie

3 Los elementos de la variable demasiado grandes o demasiados pequeños, no

influyen en la determinación de la mediana.

4 La fórmula que hemos propuesto para el cálculo de la mediana, en una serie de

intervalos, recoge un proceso que se utiliza para su cálculo aproximado.

Page 75: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

75

4.2.2.3.2 APLICACIONES

Este promedio se utiliza para:

1 Encontrar el valor central de la serie

2 Dividir el área del polígono de frecuencia en dos partes iguales.

3 Establecer la verificación de la hipótesis, en los métodos no paramétricos de la prueba

de la mediana.

4 Encontrar un promedio más fiable en cierto tipo de variables como: salarios, estaturas,

pesos, etc. ya que no influyen en esta determinación los valores extremos muy grandes

o muy pequeños.

4.2.3 LA MODA

Para obtener la moda de una serie estadística no es necesario utilizar ninguna fórmula, sino

que se lo hace tomando el valor que más veces se repite.

4.2.3.1 LA MODA DE UNA SERIE ESTADÍSTICA DE FRECUENCIA

Para determinar la moda en una serie de frecuencias, se encuentra la variable que tiene

mayor frecuencia y dicha variable será la moda de la serie.

EJEMPLO: La tabulación de una encuesta en relación con el número ideal de hijos que

debe tener una familia, nos da los siguientes datos:

X f 1 10 2 20 3 8 4 20 5 6 6 4 7 5 73

Page 76: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

76

Observando el cuadro se puede apreciar que existen dos valores que coinciden y que poseen

la mayor frecuencia (20).

Por lo tanto las modas correspondientes serán 2 y 4, de donde se deduce que existen series

uní modales, bimodales o multimodales.

4.2.3.2 LA MODA DE UNA SERIE ESTADÍSTICA DE INTERVALOS

Cuando los datos están agrupados en una serie estadística de intervalos, se localiza el

intervalo con mayor frecuencia, la cual se llama clase modal, en la cual necesariamente

estará localizada la moda que se pretende calcular, mediante la siguiente fórmula.

i.dd

dLiMo21

1

Donde:

Li = limite real inferior

d1 = diferencia entre la frecuencia modal y la frecuencia del intervalo menor

d2 = diferencia entre la frecuencia modal y la frecuencia del intervalo mayor

i = ancho del intervalo

EJEMPLO: En la tabla que reflejan las edades de los profesores de la ciudad de Riobamba

calcular la moda:

X f 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65

83 191 99 67 41 27 16 7 4

535

Page 77: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

77

Li = 5.25

22625

5i

9299191d

10883191d

2

1

aplicando la formula tenemos:

5.92108

1085.25Mo

2.28Mo

7.25.25Mo

2005405.25Mo

El valor de 28. 2 realmente representa la edad más común de este grupo de profesores y el

gráfico se puede apreciar que es el valor mas alto de la serie, debiendo coincidir como es

lógico con el punto más alto de la serie.

4.2.3.3 PROPIEDADES Y APLICACIONES

4.2.3.3 1 PROPIEDADES

1 Es el valor de la variable que más veces se repite en la serie, pues pertenece a la

mayor frecuencia.

2 El valor de la moda no se altera por los valores muy grandes o muy pequeños

que existan en la serie

Page 78: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

78

3 La moda no tiene ninguna significación en series compuestas de pocos

elementos y que no se repitan.

4 La determinación de la moda es una serie de intervalos de clase, nos conduce a

un valor aproximado de la moda.

4.2.3.3 2 APLICACIONES

1 Es una medida muy fácil de calcular, pero resulta ser un valor aproximado.

2 La moda en una distribución puede no existir, pero si existe, puede que no sea el

único, así por ejemplo se puede dar el caso de distribuciones bimodales,

trimodales o multimodales

3 La moda se lo utiliza para detectar la estatura más corriente, el salario más

común, la calificación que más se repite; en otros casos tiene muy poca

significación.

4.3 MEDIDAS DE DISPERSIÓN

4.3.1 LA DESVIACIÓN MEDIA

4.3.1.1 LA DESVIACIÓN ABSOLUTA MEDIA PARA UNA SERIE ESTADÍSTICA

DE FRECUENCIA.

La desviación absoluta media para este tipo de datos agrupados se la obtiene en base de la

siguiente fórmula:

n

difiDAM

n

1i

.

donde:

n

1idifi.

es la sumatoria del valor absoluto, ( para asegurar que la sumatoria sea

positiva) del producto de las frecuencias por las desviaciones.

Page 79: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

79

di: XX i (diferencia entre el valor de cada observación con respecto a la media).

n: número de casos

Esta fórmula obedece a la misma definición de desviación absoluta media para el caso de

que las observaciones sean menores a 30, solamente se introduce un nuevo elemento que es

F, en razón de que se trata de una serie de frecuencia.

EJEMPLO.- Hallar la desviación media para el peso (kg) registrado para un grupo de

señoritas, los cuales se detallan a continuación:

X f 44 1 45 2 46 2 47 3 48 5 49 3 50 2 51 1

Para hallar la DAM se construye la siguiente tabla:

X f X.f XXd i

f.d

44 1 44 3.63 3.63 45 2 90 2.63 5.26 46 2 92 1.63 3.26 47 3 141 0.63 1.89 48 5 240 0.37 1.85 49 3 147 1.37 4.11 50 2 100 2.37 4.74 51 1 51 3.37 3.37

19 905 28.11

Page 80: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

80

Donde 634719905X ./ . Aplicando la relación que sirve para obtener la desviación se

tiene: 48.1

1911.28

DAM(kg) que es el valor con el cual cada valor de la variable difiere

con respecto a la media aritmética .

4.3.1.2 LA DESVIACIÓN ABSOLUTA MEDIA PARA UNA SERIE ESTADÍSTICA

DE INTERVALOS.

La fórmula que nos permite hacer los cálculos correspondientes a la desviación absoluta

media para una serie estadística de intervalos es.

n

difiDAM

n

1i

.

donde:

n

1idifi.

es la sumatoria del valor absoluto, ( para asegurar que la sumatoria sea

positiva) del producto de las frecuencias por las desviaciones.

di: XXm i (diferencia entre la marca de clase con respecto a la media).

n: número de casos

EJEMPLO.- Mediante la aplicación de una encuesta se escogieron los siguientes datos,

que tienen relación con la edad de un grupo de personas.

X f. 16-19 4 20-23 3 24-27 2 28-31 8 32-35 12 36-39 20 40-43 10 44-47 5 48-51 0 52-55 1

65

Page 81: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

81

Hallar la desviación absoluta media.

X f Xm XXmd i

f.d

16-19 4 17.5 17.42 69.68 20-23 3 21.5 13.42 40.26 24-27 2 25.5 9.42 18.84 28-31 8 29.5 5.42 43.36 32-35 12 33.5 1.42 17.04 36-39 20 37.5 2.58 51.60 40-43 10 41.5 6.58 65.80 44-47 5 45.5 10.58 52.90 48-51 0 49.5 14.58 0 52-55 1 53.5 18.58 18.58

65 378.06

Donde: años 9234X , , luego la 825

6506378DAM ..

años, que es valor que indica con

cuanto se separan las edades de cada una de las personas con respecto a la edad media.

4.3.1.3. PROPIEDADES Y APLICACIONES

4.3.1.3.1 PROPIEDADES

1 La desviación absoluta media constituye una buena medida de dispersión, porque el

número de casos no influye en el resultado

2 La desviación absoluta media es la media aritmética de las desviaciones.

4.3.1.3.2 APLICACIONES

1 Sirve cuando se requiere examinar la dispersión de la variable con respecto al

promedio

2 Cuando se requiere establecer con cuanto están dispersos los valores de la variable

con respecto a otros valores muy grandes o muy pequeños.

3 El cálculo de la DAM es muy utilizado en la determinación de la desviación

estándar, de las correlaciones y en las regresiones.

Page 82: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

82

4.3.2 LA VARIANZA

La varianza cuantifica el valor de la dispersión de la variable con respecto a la media. Por si

sola no brinda mucha ayuda al investigador pero es una herramienta muy importante para el

cálculo de la desviación estándar.

4.3.2.1 LA VARIANZA PARA UNA SERIE ESTADÍSTICA DE FRECUENCIA.

Cuando se considera una serie estadística de frecuencia la varianza esta dada por la

siguiente fórmula:

n

difis

n

1i

2

2x

.

donde 2di : 2i XX (diferencia entre el valor de cada observación con respecto a la

media, elevada al cuadrado).

n: número de casos

EJEMPLO.- Hallar la varianza el ejemplo utilizado en el cálculo de la desviación absoluta

media para una serie estadística de frecuencias, que se refiere al peso de un grupo de

señoritas dados en Kg.

Construimos la tabla partiendo del ejemplo ya mencionado para no repetir los cálculos.

X f X.f XXd i

d.2 f.d2

44 1 44 3.63 13.18 13.18 45 2 90 2.63 6.92 13.83 46 2 92 1.63 2.66 5.31 47 3 141 0.63 0.40 1.19 48 5 240 0.37 0.14 0.68 49 3 147 1.37 1.88 5.63 50 2 100 2.37 5.62 11.23 51 1 51 3.37 11.36 11.36

19 905 62.42

Page 83: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

83

Luego la varianza será 29.3

1942.622 xs

4.3.2.2 LA VARIANZA PARA UNA SERIE ESTADÍSTICA DE INTERVALOS.

Cuando se considera una serie estadística de intervalos la varianza esta dada por la

siguiente fórmula:

n

difis

n

1i

2

2x

.

donde 2di : 2i XXm (diferencia entre el valor de la marca de clase o punto medio del

intervalo con respecto a la media, elevada al cuadrado).

n: número de casos

EJEMPLO.- Al igual que para el caso del cálculo de la serie estadística de frecuencia se

tomara el ejemplo que se empleo para la DAM para facilitar la determinación de la

varianza y dar seguimiento al ejemplo planteado.

En la tabla se aumentaran los cálculos necesarios para hallar la varianza quedando

establecida de la siguiente manera:

X f Xm XXmd i

d.2 f.d2

16-19 4 17.5 17.42 303.46 1213.83 20-23 3 21.5 13.42 180.10 540.29 24-27 2 25.5 9.42 88.74 177.47 28-31 8 28.5 5.42 29.38 235.01 32-35 12 33.5 1.42 2.02 24.20 36-39 20 37.5 2.58 6.66 133.13 40-43 10 41.5 6.58 43.30 432.96 44-47 5 45.5 10.58 111.94 559.68 48-51 0 49.5 14.58 212.58 0 52-55 1 53.5 18.58 345.22 345.22

65 3661.79

Page 84: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

84

Luego la varianza será: 3456

65793661s 2

x ..

( en unidades al cuadrado lo que no ofrece

aplicabilidad alguna).

Esta medida no es muy aplicable como tal, sino que es de gran ayuda para el cálculo de la

desviación estándar.

4.3.2.3. PROPIEDADES Y APLICACIONES

4.3.2.3.1 PROPIEDADES

1 La varianza siempre es una cantidad positiva

2 La varianza siempre es mayor o igual que la desviación absoluta media

3 Cuanto mayor es el grado de dispersión, mayor es el valor de las desviaciones de las

variables con respecto a la media aritmética.

4.3.2.3.2 APLICACIONES

1 Su mayor utilidad se presenta en la estadística inferencial

2 La varianza es una medida de dispersión que se utiliza con poca frecuencia ya que

ha sido sustituida con el uso de la desviación estándar.

4.3.3 LA DESVIACIÓN ESTÁNDAR

Es la medida de dispersión más fiable y se define como la raíz cuadrada la media de los

cuadrados de las desviaciones , o lo que es mismo la raíz cuadrada de la varianza .

4.3.3.1 LA DESVIACIÓN ESTÁNDAR PARA UNA SERIE ESTADÍSTICA DE

FRECUENCIA.

Para efecto del cálculo de la desviación estándar de una serie estadística de frecuencia

haremos uso de la formula:

Page 85: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

85

n

difis

n

1i

2

x

.

donde 2di : 2i XX (diferencia entre el valor de cada observación con respecto a la

media, elevada al cuadrado), y ; n: número de casos.

EJEMPLO.- Hallar desviación estándar para el ejemplo utilizado en el cálculo de la

desviación absoluta media para una serie estadística de frecuencias, que se refiere al peso

de un grupo de señoritas dados en Kg.

Construimos la tabla partiendo del ejemplo ya mencionado para no repetir los cálculos.

X f X.f XXd i

d.2 f.d2

44 1 44 3.63 13.18 13.18

45 2 90 2.63 6.92 13.83

46 2 92 1.63 2.66 5.31

47 3 141 0.63 0.40 1.19

48 5 240 0.37 0.14 0.68

49 3 147 1.37 1.88 5.63

50 2 100 2.37 5.62 11.23

51 1 51 3.37 11.36 11.36

19 905 62.42

Como varianza es 29.3

1942.622 xs

(K.g2) para determinar la desviación estándar bastará

con extraer la raíz cuadrada de este valor en consecuencia se tiene 81.1xs K.g

Page 86: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

86

4.3.3.2 LA DESVIACIÓN ESTÁNDAR PARA UNA SERIE ESTADÍSTICA DE

INTERVALOS.

Para efecto del cálculo de la desviación estándar de una serie estadística de intervalos

haremos uso de la formula:

n

difis

n

1i

2

x

.

donde 2di : 2i XXm (diferencia entre la marca de clase con respecto a la media, elevada

al cuadrado), y ; n: número de casos.

EJEMPLO.- Al igual que para el caso del cálculo de la serie estadística de frecuencia se

tomara el ejemplo que se empleo para la DAM para facilitar la determinación de la

desviación estándar y dar seguimiento al ejemplo planteado.

X f Xm XXmd i

d.2 f.d2

16-19 4 17.5 17.42 303.46 1213.83

20-23 3 21.5 13.42 180.10 540.29

24-27 2 25.5 9.42 88.74 177.47

28-31 8 28.5 5.42 29.38 235.01

32-35 12 33.5 1.42 2.02 24.20

36-39 20 37.5 2.58 6.66 133.13

40-43 10 41.5 6.58 43.30 432.96

44-47 5 45.5 10.58 111.94 559.68

48-51 0 49.5 14.58 212.58 0

52-55 1 53.5 18.58 345.22 345.22

65 3661.79

Page 87: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

87

Como la varianza será: 3456

65793661s 2

x ..

años2 ( en unidades al cuadrado lo que no

ofrece aplicabilidad alguna).

Luego la desviación estándar será: 57s x , años

Nota.- Si las observaciones son tomadas de una muestra se deberá sustituir n-1 por n

4.3.3.3. PROPIEDADES Y APLICACIONES

4.3.3.3.1 PROPIEDADES

4 El valor de la desviación estándar esta dado en las mismas unidades que el conjunto

de datos de la variable.

5 El valor de la desviación estándar se encuentra en relación directa con la dispersión

de los datos.

4.3.3.3.2 APLICACIONES

1 La desviación estándar es el promedio más fiable y de uso más frecuente en el

análisis e interpretación de una curva normal.

2 Es la medida de dispersión más importante y tiene muchas aplicaciones en la

estadística inductiva o inferencial.

3 La desviación estándar, además se utiliza en la determinación de las irregularidades

de la curva normal asimetría y curtosis.

Dentro de las aplicaciones en casos prácticos de la desviación estándar revisaremos dos de

ellas, que son consideradas de mucha utilidad en negocios y economía.

Page 88: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

88

4.3.3.3.2.1 TEOREMA DE CHEBYSHEV

El Teorema de Chebyshev fue formulado por el matemático ruso P.L.Chebyshev (1821-

1894). Establece que para todo conjunto de datos, por lo menos (1 – 1/K2)% de las

observaciones están dentro de K desviaciones estándar de la media, en donde K es

cualquier número mayor que 1.

Así por ejemplo, si se forma un intervalo con K = 2 desviaciones estándar por encima de la

media, entonces por lo menos el %* 75100

211 2

de todas las observaciones estarán

de dicho intervalo, de igual modo si se toma K = 3 desviaciones estándar por encima de la

media, entonces por lo menos el %%.* 908988100

311 2

de todas las

observaciones estarán de dicho intervalo.

Para aplicar este teorema tomaremos la información sobre el peso de un grupo de señoritas

y se desea saber en que rango de pesos están el 75% ( K = 2) y el 90% ( K = 3) de todas las

informaciones se deberá utilizar la desviación estándar para encontrar tal detalle que lo

mostramos a continuación.

Si K = 2 se obtiene que el 75% de las observaciones estarán en el intervalo formado de la

siguiente forma : XS2X , luego si multiplicamos 2 por el valor de la desviación estándar

calculado anteriormente se tiene 2*2.77= 5.54 resultando el intervalo :

7753 09425456347 5456347 .;...;.. Kg. debido a que la media es 47.63 y la

desviación estándar es 2.77.

Page 89: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

89

Si K = 3 se obtiene que el 90% de las observaciones estarán en el intervalo formado de la

siguiente forma : XS3X , luego si multiplicamos 3 por el valor de la desviación estándar

calculado anteriormente se tiene 3*2.77= 8.31 resultando el intervalo :

9455 9.3233186347 3186347 .;..;.. Kg. debido a que la media es 47.63 y la

desviación estándar es 2.77.

4.3.3.3.2.2 LA DISTRIBUCIÓN NORMAL Y LA REGLA EMPÍRICA.

La desviación estándar puede utilizarse para sacar ciertas conclusiones si el conjunto de

datos en cuestión está distribuido normalmente. El concepto de una distribución normal se

encuentra usualmente en análisis estadístico y es de importancia considerable. Una

discusión minuciosa de la distribución normal se presenta en capítulos posteriores. Sin

embargo, una introducción a todo este concepto importante permitirá demostrar un uso

práctico para la desviación estándar, y establecerá la base para una futura investigación más

completa. Una distribución normal es una distribución de datos continuos (no discretos)

que produce una curva simétrica en forma de campana, como la que muestra en la figura

4.1

Figura 4.1 Una distribución normal

EJEMPLO.- Se asume que se tiene un número grande de observaciones para el tiempo, en

minutos, que le toma a los esquiadores terminar un trayecto en particular. Si los datos están

distribuidos normalmente, una gráfica de la frecuencia con la cual ocurre cada observación

Page 90: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

90

tomará la forma de la figura 4.1 Las observaciones en cada extremo ocurrirán relativamente

de forma poco frecuente, pero las observaciones que están más cerca de la mitad ocurrirán

con una frecuencia alta. por tanto se produce la curva simétrica en forma de campana. La

observación modal, 10 en este caso es la que ocurre con la mayor frecuencia y por tanto

está en el pico de la distribución. En una distribución normal, la media, la mediana y la

moda son todas iguales.

Es de importancia que la mitad de las observaciones está por encima de la media y la mitad

está por debajo. Esto significa que la mitad del área que está bajo la curva está a la

izquierda de la media y la otra mitad del área que está debajo de la curva está a la derecha

de la media.

Para ilustrar cómo se aplica la desviación estándar en la distribución normal, se asume que

1.000 esquiadores de slalom bajan una pendiente empinada en Vail. Los tiempos para

todos los esquiadores parecen estar distribuidos normalmente, con una media de 10X en

minutos y una desviación estándar de 2s x minutos. La regla empírica dice que si se

incluyen todas las observaciones que están a una desviación estándar de la media (una

desviación estándar por encima de la media y una desviación estándar por debajo de la

media) estas serán el 68.3% de todas las observaciones. Es decir, que no importa cuál es la

media ni cuál es la desviación estándar, se puede citar seguro de que el 68.3% de las

observaciones quedan a una desviación estándar de la media si las observaciones están

distribuidas normalmente.

Debido a que el promedio de los esquiadores se toma 10 minutos para completar el

trayecto, mover una desviación estándar (es decir. 2 minutos) por encima y por debajo de

esta media de 10 produce un rango de 8 a 12 minutos. Así, de acuerdo con la regla

empírica, 683 (68.3% de 1,000) esquiadores se tomaron entre 8 y 12 minutos para bajar la

montaña.

Page 91: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

91

Claro que si se mueve más de una desviación estándar por encima y por debajo de la media,

se comprenderá un porcentaje más grande de observaciones. La regla empírica especifica

que:

68.3% de las observaciones están dentro de más o menos una desviación estándar de

la media

95.5% de las observaciones están dentro de más o menos dos desviaciones estándar

de la media,

99.7% de las observaciones están dentro de más o menos tres desviaciones estándar

de la media.

Dados los tiempos de los esquiadores, una desviación estándar (2 minutos) por encima y

por debajo de la media de 10 da un rango de 8 a 12 minutos. Dos desviaciones estándar (4

minutos) por encima y por debajo de la media de 10 da un rango de 6 a 14 minutos. Tres

desviaciones estándar (6 minutos) da un rango de 4 a 16 minutos. Esto se muestra en la

figura 4.2

Figura 4.2 Tiempos distribuidos normalmente de los 1,000 esquiadores

De acuerdo con la regla empírica. 997 de los 1.000 esquiadores se tomaron entre 4 y 16

minutos para terminar el trayecto. Así, sólo 3 de los 1.000 esquiadores fueron o muy

buenos esquiadores y tomaron menos de 4 minutos o eran muy malos y se tomaron más de

16 minutos. Una observación de más de tres desviaciones estándar de la media (por encima

o por debajo de ésta) es raro que ocurra y se da menos de 1% del tiempo si los datos están

distribuidos normalmente.

Page 92: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

92

También es importante recordar que la regla empírica describe el área total bajo la curva

normal que se encuentra dentro de un rango dado. No sólo el 68.3% de todos los

esquiadores se loman entre 8 y 12 minutos para bajar de forma segura la montaña, sino que,

además, el 68.3% de toda el área que está bajo la curva normal está dentro del mismo rango

de 8 a 12 minutos.

Si las observaciones están altamente dispersas, la curva en forma de campana se aplanará y

se esparcirá. Se asume que un segundo grupo de esquiadores también hizo un promedio de

10 minutos, pero tuvo una desviación estándar de 4 minutos. Los tiempos del segundo

grupo están más dispersos que los del primero. Los tiempos más rápidos en esquí estaban

por debajo de 10, y los más lentos estaban muy por encima de 10 comparados con los del

primer grupo. Esta dispersión mayor se reflejaría en una curva de distribución normal más

extensa, tal y como se muestra en la figura 4.3

Figura 4.3 Dos distribuciones normales con medias iguales pero con desviaciones estándar

diferentes

Ambas distribuciones están centradas en la media de 10X minutos, pero la que tiene la

distribución con mayor 4s x minutos está más dispersa que el conjunto de observaciones

con menos dispersión. Para abarcar el 68,3% de las observaciones en este grupo más

disperso, es necesario incluir todas las que están dentro del intervalo de 6 a 14.

Page 93: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

93

4.3.3.3.2.3. SESGO

No todas las distribuciones son normales. Algunas están sesgadas a la izquierda o a la

derecha. En la figura 4.4 se encuentran las curvas de distribución para el peso de las

personas. En la figura 4.4 a) se dice que la distribución está sesgada a la derecha. Parecería

que las pocas personas más pesadas que están en el extremo superior en la escala de peso

(quizá algunos hombres más grandes) halan la cola de la distribución hacia la derecha. En

una segunda distribución de pesos que se muestra en la figura 4.4 (b), unas cuantas mujeres

diminutas halan la distribución hacía el extremo interior, haciendo que se desvíe hacía la

izquierda.

Figura 3.5 Distribución sesgada del peso de las personas

(a) (b)

Moda Moda

En ambos casos, la moda es por definición la observación que ocurre con mayor frecuencia.

Por tanto, está en el pico de la distribución. Sin embargo, como se dijo anteriormente, por

su sola naturaleza, la media se ve más afectada por las observaciones extremas. Por tanto,

es halada en la dirección del sesgo, más de lo que está la mediana, la cual está en algún sitio

entre la media y la moda.

El sesgo puede medirse mediante el coeficiente de sesgo de Pearson.

Page 94: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

94

Coeficiente de Pearson:

xs

medianaX3p

Si p < 0, los datos están sesgados a la izquierda, si p > 0. entonces están sesgados a la

derecha; si p = 0 están distribuidos normalmente.

EJEMPLO.- Sesgo para los pasajeros de P&P

Utilizando los datos agrupados de la lista de pasajeros de P&P, se calcula

1412s778X x .,. y la mediana = 78.33. Dada esta información, el director ejecutivo

de P&P puede ver claramente que los datos están sesgados a la derecha, debido a que la

media excede a la mediana. Además, también desea una medida del grado de sesgo.

Solución: se tiene: 030

141233787783p .

...

Interpretación:

Debido a que P > 0, los datos para P&P están, como se presumió, sesgados a la derecha. El

grado hasta el cual están sesgados se refleja en el valor del coeficiente de Pearson. Si se

fuera a hacer la gráfica de los datos, aparecerían como en la figura 4.4 (a).

4.3.3.3.2.4 COEFICIENTE DE VARIACIÓN

Como se ha enfatizado. un uso importante de la desviación estándar es servir como medida

de dispersión. Sin embargo, se aplican ciertas limitaciones. Cuando se consideran dos o

más distribuciones que tienen medias significativamente diferentes, o que están medidas en

unidades distintas, es peligroso sacar conclusiones respecto a la dispersión sólo con base en

la desviación estándar. Es como violar el viejo adagio sobre la comparación entre manzanas

y naranjas.

Page 95: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

95

Por tanto, con frecuencia debemos considerar el Coeficiente de Variación (CV), el cual

sirve como medida relativa de dispersión. El coeficiente de variación determina el grado de

dispersión de un conjunto de datos relativo a su media. Se calcula dividiendo la desviación

estándar de una distribución por su media y multiplicando por 100.

Coeficiente de variación: )(100

Xs

CV x

Los datos agrupados para P&P reportaron una media de 78.7 pasajeros por día, con una

desviación estándar de 12.14 pasajeros. Se supone que P&P también recolecta datos sobre

el mismo periodo para el número de millas que la aerolínea voló y dicha media y

desviación estándar ha probado ser de 1.267.5 y 152.7. respectivamente. La desviación

estándar más alta para las millas voladas puede sugerir que estos datos presentan una

variación .mucho mayor.

Sin embargo, si se calcula el coeficiente de variación para pasajeros, se encuentra que es

431510070781412CV ...

mientras que para las millas es solamente

051210051267

7152CV ..

.

Es claro que al comparar la variación en dos conjuntos de datos muy diferentes, es sabio

utilizar el coeficiente de variación y no sólo la desviación estándar.

ACTIVIDADES RECOMENDADAS

1.- Los precios de las acciones están cotizados en octavos de dólar de manera que por

ejemplo, 5 1/8 es $5.125; 5 ¼ es $5.25; 5 3/8 es $5.375 y así sucesivamente hasta 5 7/8

Page 96: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

96

que es $ 5.875. a continuación se da una muestra de siete precios de cierre de las acciones

tomadas de The Wall Street Journal de octubre 8 de 1997.

Walt Mart 27 3/8 Disney 42 5/8 Mobil 69 7/8 General Motors 29 1/2 General Mills 69 7/8 Toys R. Us 38 5/8 Dow Jones 29 1/4

a) Calcule la media, la mediana, y la moda. Interprete cada estadístico.

b) ¿Qué le dice cada una? ¿Por qué son diferentes si todas son promedios?

c) Calcule e interprete la varianza y la desviación estándar.

2.- The Snowflake comercializa botas para esquiar en San Luis Obispo. California. De los

últimos 100 pares vendidos 4 eran talla 9,33 talla 91/2, 26 talla 10, 29 talla 101/2 y 8 eran

talla 13. Haga comentarios sobre el uso de la media, la mediana y la moda como medidas

de tendencia central y el uso de cada una en la toma de decisiones sobre los tamaños que se

deben tener en inventario. Calcule cada medida.

3.- Debido a que las tasas de interés cayeron a comienzos de 1997, se encontró que una

muestra dé-las tasas hipotecarias para hipotecas a 15 anos de las instituciones de crédito en

Peoría. Illinois era

7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85%

a) Calcule e interprete la media, la mediana y la moda.

b) ¿Estos datos están sesgados a la izquierda, a la derecha, o están distribuidos

normalmente? Calcule el coeficiente de Pearson como medida de sesgo.

c) Calcule e interprete la varianza y la desviación estándar.

4.- Una encuesta de instituciones de crédito en un centro urbano cerca de Peoría (ver

problema anterior) reveló tasas de crédito hipotecario de

Page 97: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

97

7.1%, 7.3%, 6.3%, 6.7%, 6.8%, 6.85%. 7.5%

a. ¿Las tasas de crédito hipotecario son más altas en Peoría o en otros centros urbanos?

b. ¿Cual ciudad parece tener las tasas de interés mas consistentes entre las instituciones?

5.- The Noah Fence Company vende cuatro tipos de cercas a los barrios residenciales de las

afueras de la ciudad. El grado A le cuesta a Noah $5.00 por pie lineal de instalación, el

grado B cuesta $3.50, el grado C cuesta $2.50 y el grado D cuesta $2.00. Ayer Noah instaló

100 yardas del grado A, 150 del grado B, 75 yardas del grado C y 200 yardas del grado D.

¿Cual fue el costo promedio de instalación por pie lineal?

¿La campaña publicitaria logró su meta de suavizar las ventas semanales? .

6.- Bill Kari compró 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones

a $30 cada una y 75 acciones a $35 cada una.

a) ¿Cuál es el monto tolal de su inversión?

b) ¿Cual es el precio promedio por acción?

7.- . Las edades de cincuenta de los directores ejecutivos de las mejores corporaciones de la

nación reportadas en la edición de la revista Forbes de la edición del 24 de mayo de 1997

aparecen en la siguiente tabla de frecuencias.

a) Calcule e interprete la media, la mediana y la moda.

b) Calcule e interprete la varianza y la desviación estándar.

EDADES FRECUENCIA 50 - 55 8 55 – 60 13 60 - 65 15 65 - 70 10 70 - 75 3 75 - 80 1

Page 98: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

98

8.- La misma edición de la revista Forbes (que se vio en el problema anterior) también

proporcionó datos sobre los salarios en miles de dólares. Resultó la siguiente tabla de

frecuencias:

SALARIO (en miles de dólares) FRECUENCIA

90 - 440 9

440 – 790 11

790 – 1140 10

1149 – 1490 8

1490 – 1840 4

1840-2190 3

2190 - 2540 5

a) Calcule la media, la mediana y la moda. Interprete sus respuestas.

b) ¿Los salarios están tan dispersos como las edades del problema anterior?

9.- Los siguientes datos de muestras se han obtenido para el número de clientes diarios en

Rosie´s Flower Shoppe:

34, 45, 23, 34, 26, 32, 31, 41

Calcule la varianza, la desviación estándar.

10.- La siguiente es una muestra de las ganancias por acción en dólares, para las acciones

cotizadas en la Bolsa de Valores de Nueva York:

1.12, 1.43, 2.17, 1.19, 2.87 y 1.49

Calcule la varianza, la desviación estándar

11.- Las horas trabajadas por Ronnie cada semana durante los últimos dos meses son

52 48 37 54 48 15 42 12 Asumiendo que estos son datos muéstrales, calcule:

a) La media

b) La mediana

Page 99: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

99

c) La moda

d) ¿Cuál es probablemente una mejor medida para el punto central?

12.- Utilizando las horas de trabajo de Ronnie del problema anterior, calcule e interprete:

a) El rango

b) La varianza

c) La desviación estándar

AUTOEVALUACION

1.- Quienes ponen los discos en KAYS claman que ponen más canciones cada hora que sus

rivales de la KROC del otro pueblo. Durante las últimas 24 horas se recolectaron y

tabularon los datos sobre el número de canciones puestas por ambas estaciones. Utilice los

datos para preparar un reporte que compare las dos estaciones. Su reporte terminado debe

presentarse a la Comisión Federal de Comunicaciones, y debe contener referencias respecto

a las medidas de tendencia central y de dispersión.

Número de canciones por hora KAYS KROC 5 - 11 2 4

11 – 17 4 5 17– 23 6 7 23 – 29 8 5 29 – 35 2 2 35-41 2 1

2.-The Walt Sireet Joumal describió una disputa entre la gerencia y el sindicato de trabajo

local respecto a la eficiencia y productividad de los trabajadores. La gerencia argumentaba

que a los empleados les tomaba más de 20 minutos terminar cieno trabajo. Si se mide el

tiempo de 85 empleados, arrojando los resultados tabulados, con base en esta muestra, ¿la

gerencia está en lo correcto? Calcule las tres medidas de tendencia central.

Page 100: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

100

CLASE (número de minutos)

FRECUENCIA (número de empleados

5 – 7 2 7 – 9 8 9 - 11 10

11 - 13 15 13 – 15 17 15 – 17 14 17 – 19 7 19 – 21 9 21- 23 3

3.- En el ejercicio anterior, la gerencia también se encuentra preocupada porque el

desempeño de los empleados es demasiado errático; no existe mucha variación en la

cantidad de tiempo que toma a los trabajadores completar un trabajo. Identifique y calcule

el estadístico apropiado de acuerdo con la preocupación de la gerencia.

4.- Dados los siguientes puntajes de 9 pruebas para la clase de economía del profesor

Pundit, calcule el coeficiente de sesgo de Pearson. Asuma que estos son datos muéstrales.

80 83 87 85 90 86 84 82 88

5.- Aquí se muestran las relaciones precio-ganancia para 30 acciones diferentes transadas

en la Bolsa de Valores de Nueva York (New York Stock Exchange - NYSE)

4.8 5.2 7.6 5.7 6.2 6.6 7.5 8.0 9.0 7.7 3.7 7.3

6.7 7.7 8.2 9.2 8.3 7.3 8.2 6.5 5.4 9.1 10.0 7.3

8.2 9.7 8.4 4.7 7.4 8.3

a) Calcule la media y la desviación estándar.

b) De acuerdo con el teorema de Chebyshev por lo menos ¿cuantas relaciones precio-

ganancia están dentro de dos desviaciones estándar de la media?

c) ¿Cuántas están realmente a dos desviaciones estándar de la media?

Page 101: Estadística Unidades Desarrolladas

Estadística Gerencial

Tutor: Dra. Lourdes Zúñiga L.

101

6. La mecánica local en Vinney´s Auto Shop y Chann School le dice que las reparaciones

de su carro le costarán $714.12. Los datos de la industria muestran que la cuenta promedio

por reparaciones parecidas a las suyas es de $615, con una desviación estándar de $31.

¿Qué puede concluir sobre las tasas de Vinney´s si usted asume que las reparaciones están

distribuidas normalmente?