Post on 17-Nov-2015
description
1
ANLISIS EXPLORATORIO DE DATOS Y
PROBABILIDAD E INFERENCIA ESTADISTICA
Dr. Jos Nerys funes Torres
Lic. Ren Armando Pea Aguilar
Facultad de Ciencias Naturales y Matemtica
Escuela de Matemtica
Departamento de Estadstica
Universidad de El Salvador
Septiembre de 2010.
2
ndice general.
Introduccin. ............................................................................................................................ 5
Captulo 1. Conceptos Bsicos de Estadstica. ................................................... 6
1.1. La Estadstica y sus aplicaciones ............................................................................................. 6 1.1.1. Qu es la Estadstica? ...................................................................................................... 6
1.1.2. Aplicaciones de la Estadstica. .......................................................................................... 6 1.2. Poblacin, Muestra y tcnicas de muestreo. .......................................................................... 10 1.3. Unidad de estudio y unidad de muestreo ............................................................................... 13 1.4. Variables y datos .................................................................................................................... 14 1.5. Escalas de medicin .............................................................................................................. 15
1.5.1. Escalas nominales ........................................................................................................... 15
1.5.2. Escalas ordinales ............................................................................................................. 16
1.5.3. Escalas de intervalos ....................................................................................................... 16 1.5.4. Escalas de razones o cocientes ........................................................................................ 17
1.6. Diseo de Experimentos estadsticos. .................................................................................... 18 1.7. Gua de ejercicios N 1........................................................................................................... 18
Captulo 2. Distribuciones de frecuencias y sus representaciones
grficas ..................................................................................................................................... 20
2.1. Estadstica Descriptiva con una variable ............................................................................... 20
2.1.1. Distribucin de frecuencias ............................................................................................. 20 2.1.2. Descripcin de Variables Cualitativas ............................................................................ 21 2.1.3. Variables cuantitativas discretas. .................................................................................... 29
2.2. Distribucin de frecuencias agrupadas. .................................................................................. 30
2.2.1 Representacin grfica de variables continuas ................................................................ 32 2.3. Gua de ejercicios N 2........................................................................................................... 33
Captulo 3. Medidas Caractersticas de una Distribucin Cuantitativa
Emprica. ................................................................................................................................... 35
3.1 Medidas de posicin ........................................................................................................... 35 3.2 Medidas de Dispersin ....................................................................................................... 42 3.3 Medidas de forma ............................................................................................................... 43
3.4. Gua de Ejercicios N 3. ......................................................................................................... 44
Captulo 4. Distribuciones Bivariadas ...................................................................... 73
4.1. Distribuciones bidimensionales ............................................................................................. 73 4.2. Distribuciones marginales y condicionales. ........................................................................... 74 4.3. Coeficiente de correlacin lineal ............................................................................................ 77 4.4. Introduccin al modelos de regresin lineal .......................................................................... 77
4.5. Modelo de regresin simple. ................................................................................................. 82 4.5.1. Estimacin de los parmetros por mnimos cuadrados ................................................... 82 4.5.2. Propiedades de los estimadores por mnimos cuadrados y el modelo ajustado de
regresin. ................................................................................................................................... 84 4.5.3. Intervalos de confianza ................................................................................................... 86
3
4.5.4. Prueba de hiptesis de la pendiente y de la ordenada al origen. ..................................... 88
4.6. Prediccin de nuevas observaciones ...................................................................................... 89
4.7. Ejercicios. ............................................................................................................................... 98
Captulo 5. Los Valores Relativos ............................................................................ 101
5.1. Razones, Proporciones, Porcentajes y Tasas. ....................................................................... 101 5.2. Diferencia Relativa ............................................................................................................... 103
5.3. Los nmeros ndices ............................................................................................................. 104 5.3.1. Relacin entre ndices de base fija y variable. .............................................................. 106 5.3.2. ndices agregativos simples ........................................................................................... 107 5.3.3. ndices de precios .......................................................................................................... 108 5.3.4. ndices de cantidad. ....................................................................................................... 109
5.3.5. Clculo del salario e ingreso real. ................................................................................. 111
5.4. Gua de ejercicios N 5. ........................................................................................................ 112
Captulo 6. Mtodos de Conteo. ............................................................................... 114
6.1 Introduccin .......................................................................................................................... 114 6.2 Muestras ordenadas. .............................................................................................................. 114
6.3 Variaciones, combinaciones y permutaciones. ..................................................................... 116 6.3.1. Variaciones de N elementos tomados de n en n. ........................................................... 116
6.3.2. Variaciones con repeticin de N elementos tomados de n en n. ................................... 116 6.3.3. Permutaciones. ............................................................................................................. 116 6.3.4. Combinaciones. ............................................................................................................. 118
6.4. Teorema del Binomio. .......................................................................................................... 122 6.5. Gua de Ejercicios N 1. ...................................................................................................... 125
6.6. Solucines. ........................................................................................................................... 126
Captulo 7. Conceptos Bsicos de Probabilidad ............................................. 132
7.1 Introduccin. ......................................................................................................................... 132
7.2. Experimento aleatorio. ......................................................................................................... 132 7.3. Espacio Muestral. ................................................................................................................ 133
7.4. Sucesos o Eventos ................................................................................................................ 133 7.4.1. Estructuras con subconjunto .......................................................................................... 134
7.5. Axiomas de Probabilidad ..................................................................................................... 136 7.5.1. Probabilidad (Axiomtica). ........................................................................................... 136
7.6. Resultado Igualmente Probables o Modelo Uniforme de Probabilidad ............................... 138
7.7. Probabilidad condicional. .................................................................................................... 138
7.8. Independencia de sucesos. ................................................................................................... 142 7.9. Ejercicios de clculo de probabilidad ................................................................................... 142
7.9.1. Problemas variados de probabilidad ............................................................................. 147 7.9.2. Hoja 4. Ejercicios de probabilidad (Repaso, Captulo 6 y 7) ........................................ 153
Captulo 8. Variables aleatorias y distribuciones de probabilidad ......... 155
8.1. Nociones bsicas .................................................................................................................. 155 8.2. Distribucin de probabilidad binomial ................................................................................. 159 8.3. Distribucin de Poisson ........................................................................................................ 161
4
8.4. Distribucin geomtrica ....................................................................................................... 165
8.5. Distribucin hipergeomtrica ............................................................................................... 166
8.6. Densidad uniforme ............................................................................................................... 169 8.7. Densidad normal o de Gauss ................................................................................................ 172 8.8. Aproximacin de la binomial por medio de la normal ......................................................... 175 8.9. Ejercicios. ............................................................................................................................. 175
Captulo 9. Estimacin de Parmetros. ................................................................. 178
9.1. Distribucin de la medida de la muestra. ............................................................................. 178 9.2. Distribucin de la diferencia entre las medias de dos muestras. .......................................... 180 9.3. Distribucin de la proporcin de la muestra. ....................................................................... 184 9.4. Distribucin de la diferencia entre las proporciones de dos muestras. ................................ 186
9.5. Intervalos de confianza ......................................................................................................... 188
9.5.1. Seleccin del tamao de la muestra .............................................................................. 192
Captulo 10. Contraste de hiptesis. ...................................................................... 198
10.1.- Introduccin ...................................................................................................................... 198 10.2. Nociones bsicas ................................................................................................................ 198
10.3. Procedimiento sistemtico para una prueba de hiptesis de una muestra. ......................... 199 10.4. Procedimiento sistemtico para una prueba de hiptesis de dos muestras independientes.202
10.5. Prueba de hiptesis para una y dos proporcin independientes ........................................ 202
Bibliografa ............................................................................................................................ 206
5
Introduccin.
La estadstica como herramienta para el anlisis de los datos es esencial en los profesionales que
con frecuencia tienen la necesidad de realizar anlisis de datos para la toma de decisiones.
Este libro, recoge en 10 captulos conocimientos estadsticos bsicos que van desde el anlisis
descriptivo de datos, probabilidad e inferencia estadstica.
Debemos aclarar que los mtodos descriptivos aqu propuestos son elementales univariantes y en
el enfoque de la probabilidad slo hemos considerado espacios probabilsticos discretos
incluyendo dos continuas la uniforme y la normal.
Este libro, es recomendables para principiantes en el rea de estadstica. Los conocimientos aqu
planteados son base para ir enfrentando otros de estadstica de mayor dificultad.
6
Captulo 1. Conceptos Bsicos de Estadstica.
1.1. La Estadstica y sus aplicaciones
1.1.1. Qu es la Estadstica?
La Estadstica es una ciencia que estudia las caractersticas de un conjunto de casos para hallar en
ellos regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar
predicciones.
La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos
a un conjunto de objetos, personas, procesos, etc. A travs de la cuantificacin y el ordenamiento
de los datos intenta explicar los fenmenos observados, por lo que resulta una herramienta de
suma utilidad para la toma de decisiones.
Bajo este contexto, la Estadstica se divide en dos reas: Estadstica Descriptiva y Estadstica
Inferencial.
ESTADSTICA DESCRIPTIVA: permite organizar y presentar un conjunto de datos de
manera que describan en forma precisa las variables analizadas haciendo rpida su lectura e
interpretacin. Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los
datos, que son el resultado de las observaciones y/o experimentos.
Ejemplos:
1. Durante los ltimos dos das se ha informado de un total de trece homicidios diarios. 2. La encuesta Gallup informa una ventaja de 25% para el candidato de izquierda.
ESTADSTICA INFERENCIAL: Generaliza los resultados de una muestra a los de una poblacin total, es cuando de los datos estadsticos obtenidos de una muestra se infiere o se
deduce una observacin la cual se generaliza sobre la poblacin en total. Para determinar la
confiabilidad de la inferencia de los datos estadsticos de una muestra, se hace necesario
comprobar la misma para poder asegurar que lo que se observa en una muestra se observar
tambin en la poblacin. Generalmente el anlisis estadstico inferencial se lleva a cabo para
mostrar relaciones de causa y efecto, as como para probar hiptesis y teoras cientficas.
1.1.2. Aplicaciones de la Estadstica.
Mucha gente piensa que la Estadstica no tiene nada que ver con otras disciplinas que no sean las
ingenieras y economa. Otros nunca le encuentran aplicaciones tiles, y por eso tampoco les
gusta. Pero, en realidad tiene infinitas aplicaciones en todo el conocimiento adquirido por la
humanidad, partiendo ante todo, lo relacionado con las ingenieras, economa, las ciencias
biolgicas, ciencias sociales e incluso en algunas ramas del rea Jurdica. Y, en definitiva, casi
todos los campos de las ciencias emplean instrumentos estadsticos de importancia fundamental
para el desarrollo de sus modelos de trabajo.
7
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con
exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y
fsicos, entre otros, y sirven como herramienta para relacionar y analizar dichos datos. El trabajo
del experto estadstico no consiste ya slo en reunir y tabular los datos, sino el proceso de
interpretacin de esa informacin a travs de modelos estadsticos-matemticos, aumentando el
alcance de las aplicaciones de la estadstica, esto se ha logrado, gracias al desarrollo de la teora
de probabilidad.
Dentro de las Aplicaciones de la Estadstica se destacan las siguientes:
1. La Estadstica en el Periodismo
En general, los periodistas adems de dedicarse al mbito de la noticia, realizan crnicas y
estudios de investigacin, que nos entregan preguntas y respuestas frente a determinados sucesos
o situaciones de inters pblico. Algunos de los estudios ms frecuentes realizados por los
periodistas son sobre alcoholismo, enfermedades, sexualidad, delincuencia, poltica, etc. Para
ello, hacen uso de las encuestas u otros instrumentos tcnicos de medicin propios de la
estadstica, a travs de dichos estudios es posible conocer la opinin de la gente y con ello
informar a la opinin pblica, a travs de los medios de comunicacin, desde donde las
autoridades pertinentes e interesadas en estos estudios pueden adoptar las medidas correctivas, si
es el caso. Tal es as, que la estadstica forma parte importante del periodismo investigativo.
1. La Estadstica en la Poltica
Conocidas son las famosas encuestas de tipo poltico, que entregan una orientacin de la
intencin de voto, de la aceptacin de un candidato, del impacto de un programa o proyecto de
estado, etc. de una muestra estadstica representativa, sobre la opinin de las personas en un
tiempo determinado, teniendo esta herramienta una gran confiabilidad. As es que el uso de la
estadstica es imprescindible para determinar caminos a seguir para los candidatos de eleccin
popular.
2. La Estadstica en la Publicidad
Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice, Adidas,
Laboratorios Lpez, etc. nos llenan de slogans, msica y colores en sus comerciales, lo nico que
buscan es que la gente adquiera los productos y/o servicios que ofrecen.
Se dedican, entonces, a realizar las llamadas campaas publicitarias, y, antes de lanzar una
campaa, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de
lograr el xito de ventas deseado. Estos estudios son de carcter estadstico, es decir, hacen un
diseo muestral y seleccionan una muestra para inferir las caractersticas de la poblacin.
3. La Estadstica en la economa y las finanzas.
En la administracin es una herramienta del control, como parte del proceso administrativo (o lo
que es lo mismo: planeacin, organizacin, direccin y control) ya que la estadstica ayuda a
8
recolectar, estudiar y al final interpretar los datos que obtienen al terminar el proceso
administrativo, retroalimenta con esta informacin y al final se observa en que pueden mejorar y
que se est haciendo bien.
En la mercadotecnia es una herramienta muy importante cuando tienes la necesidad de trabajar
con datos de muestreo para conocer los gustos y preferencias de las personas. Igualmente en la
auditoria administrativa cuando recabas datos para conocer en que puede mejorar una
organizacin. En pocas palabras te puede servir en cualquier rea de una organizacin debido a
que muestra los resultados de las actividades que bienes realizando.
En la economa se utiliza como una herramienta de prediccin para pronosticar el
comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando
como base el comportamiento pasado de los precios de los mismos. Tambin puede servir para
estudiar el comportamiento de la bolsa de valores, de ciertos productos bsicos, los economistas
por lo regular se sienten magos que creen predecir cosas. En general, la Estadstica suministra los
valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y
microeconmicos, a travs de la evaluacin de modelos economtricos para el establecimiento de
polticas econmicas; anlisis del costo de la canasta bsica, el poder adquisitivo de la poblacin,
etc.
5. La estadstica en la Banca y Seguros
El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las
cantidades que habr de pagar la compaa en el caso de muerte del asegurado. En consecuencia,
la prediccin adecuada de las probabilidades de muerte constituye uno de los ejes centrales de la
reduccin del riesgo que se asume. Por ello, el objetivo de la Estadstica de Seguros es una
presentacin exhaustiva de los mtodos disponibles para ajustar tablas de mortalidad y tablas de
seguros no vida, ejemplo, aseguramiento de vehculos, viviendas, etc.
Por otra parte, algunas de las aplicaciones concretas de la Estadstica en el sistema bancario son
las siguientes:
Sistemas de concesin de tarjetas de crdito y fijacin de su lmite.
Sistemas de estimacin del potencial econmico de los clientes.
Definicin de tipologas comerciales de clientes.
Determinacin del pblico objetivo en campaas comerciales.
Modelizacin del riesgo segn las caractersticas de los clientes.
Aplicacin de la teora de colas para brindar un servicio de calidad.
Finalmente, es de mucha utilidad la tcnica de minera de datos para el anlisis de bases de datos del sistema bancario.
6. La estadstica en ciencias humanas y sociales
La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en
buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para
9
llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de
su objeto de estudio, inabordable en la mayora de los casos sino es a travs de perspectivas
complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y
sociales se concentra cada vez ms en la llamada Estadstica Multivariante (Anlisis Cluster,
Factorial, Discriminante, etc.).
Las ciencias sociales se han visto apabulladas en los ltimos aos por avances vertiginosos en
informtica y aplicaciones estadsticas, por ejemplo, en El Salvador, se ha elaborado el Mapa de
Pobreza, donde se ha interrelacionado una gran variedad de variables de diferentes reas:
Educativas, Econmicas, Salud, entre otras. Tambin, se ha hecho investigacin sobre los
factores que estn asociados al rendimiento acadmico de los estudiantes, finalmente, se han
utilizado diferentes tcnicas para el anlisis de los resultados acadmicos de los estudiantes.
Las ciencias sociales: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada,
lo que conlleva a:
Definicin de indicadores de fenmenos sociales.
Medicin de constructos o variables no directamente observables (la satisfaccin, la inteligencia, ...)
Medicin de los efectos entre constructos no observables para establecer polticas sociales.
Estudio de la evolucin de la demografa.
Estudios sociales sobre la integracin de la poblacin inmigrada.
Fenmenos sociales como las pandillas, criminalidad, delincuencia, contaminacin, entre otros.
7. La estadstica en las ciencias qumicas.
En Qumica, la estadstica se aplica en varias reas: En el diseo de experimentos se usan
mtodos estadsticos, en el control de procesos y control de calidad (o gerenciamiento de calidad)
de procesos y productos. En EEUU est muy de moda el sistema seis sigma, creado por general
electric, que utiliza algunos conceptos estadsticos para lograr el aseguramiento de la calidad.
Por otra parte la produccin qumica tiene su costo econmico y financiero que tambin requiere
mucho uso de estadstica, por ejemplo, si no se elabora un buen diseo experimental, se
necesitarn muchas rplicas para validar una formulacin qumica.
Algunas de las aplicaciones concretas que podemos mencionar:
Utilizacin de diseos experimentales para optimizar la composicin de productos alimenticios.
Evaluacin de la superficie de respuesta de una reaccin qumica segn determinados factores.
Prediccin del comportamiento de un componente no sintetizado a partir de las propiedades moleculares de sus descriptores.
Control de procesos de produccin para detectar problemas evitando a su vez falsas alarmas.
10
8. La estadstica en Ciencias biolgicas.
En el rea de las ciencias biolgicas, interesa estudiar el comportamiento de ciertas plantas y sus
cruces a fin de determinar cmo se relacionan genticamente los padres con los hijos, hablando
de Genotipo y Fenotipo. En esta categora es tambin donde se realizan los mayores avances de la
humanidad, en descubrimientos. Cada ao se descubren miles de frmulas cientficas que
relacionan fenmenos de la naturaleza con modelos matemticos.
Los cientficos se dedican a realizar estudios estadsticos, recogiendo datos y muestras,
investigando el tiempo de reproduccin de un virus, el comportamiento migratorio de algunas
aves o insectos, adems de factores de tamao y volumen del crecimiento de ciertas especies de
animales o vegetales. Todo esto funciona con la idea de recopilar informacin, muestrear ciertas
reas para ver cmo se han comportado algunas aves, por ejemplo, se pueden dibujar o simular
curvas que se supone que son relativamente parecidas al comportamiento migratorio de aves. Con
esta herramienta se podran determinar tambin las pocas de mayor probabilidad de contagio,
diseminacin de algn virus o bien enfermedades transmitidas por insectos.
Algunas aplicaciones concretas en esta rea son: Determinacin del tamao de poblaciones
naturales en una regin; efectividad de la utilizacin de barreras naturales (filas de rboles
plantados en los lmites del terreno) como medio de prevenir las plagas de insectos o aves sobre
las plantaciones y as disminuir la utilizacin de pesticidas: y, determinacin de los niveles
ptimos de utilizacin de los fertilizantes. Obviamente, en esta rea es donde ms se hace usos de
la teora de Diseos de Experimentos.
9. La estadstica en las ciencias mdicas.
Permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de
mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera.
Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadstica,
haciendo un recorrido por diversas reas del conocimiento humano, con el fin, de conocer cmo
se relacionan con las diversas ciencias, formando una sola verdad. Evidentemente, existen,
muchas disciplinas donde se aplica la estadstica, que no han sido consideradas en este apartado,
por ejemplo, las ingenieras, la pintura, la msica, etc. Finalmente, es de resaltar que en todos los
temas donde se analice informacin est presente la estadstica.
1.2. Poblacin, Muestra y tcnicas de muestreo.
Las estadsticas de por s no tienen sentido si no se considera o se relaciona dentro del contexto
con que se trabajan. Por lo tanto es necesario entender los conceptos de poblacin y de muestra
para lograr comprender mejor su significado en la investigacin educativa o social que se lleva a
cabo.
POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas
caractersticas comunes observables en un lugar y en un momento determinado. Cuando se vaya a
llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al
seleccionarse la poblacin bajo estudio. Entre stas tenemos:
11
Homogeneidad - que todos los miembros de la poblacin tengan las mismas caractersticas
segn las variables que se vayan a considerar en el estudio o investigacin. Por ejemplo, si se
fuera a investigar la incidencia de la drogadiccin entre jvenes mujeres adolescentes, entonces
hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la
poblacin asegurarse de que todas las personas entrevistadas sean de la edad determinada y del
sexo femenino. (La adolescencia se define operacionalmente como el periodo comprendido de
edad que flucta entre 12 y 21 aos.)
Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters. Determinar si
el estudio es del momento presente o si se va a estudiar a una poblacin de cinco aos atrs o si
se van a entrevistar personas de diferentes generaciones.
Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no puede ser muy abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o comunidad en especfico.
Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es sumamente importante porque ello determina o afecta al tamao de la muestra que se vaya a seleccionar,
adems que la falta de recursos y tiempo tambin nos limita la extensin de la poblacin que se
vaya a investigar.
MUESTRA - la muestra es un subconjunto fielmente representativo de la poblacin.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y
cun representativo se quiera que sea el estudio de la poblacin, en este sentido, la muestra puede
ser:
ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser
incluido.
Un procedimiento de extraer una muestra aleatoria de una poblacin finita es: enumerar todos
los elementos que conforman la poblacin, escribir esos nmeros en papelitos y echarlos en una
urna o bolsa mezclarlos bien removindolos y sacar uno a uno tantos como lo indique el tamao
de la muestra. En este caso los elementos de la muestra lo constituirn los elementos de la
poblacin cuyos nmeros coincidan con los extrados de la bolsa o urna.
El tamao de la muestra (MAS):
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de
unidades de anlisis (personas, organizaciones, captulo de telenovelas, etc), que se necesitan
para conformar una muestra n que me asegure un error estndar menor que 0.01 ( fijado por el
muestrista o investigador), dado que la poblacin es aproximadamente de N elementos.
En el tamao de una muestra de una poblacin se debe tener presente la varianza poblacional,
error mximo permisible prefijado (diferencia del parmetro y estimador), con un nivel de
confianza de 1 . Simblicamente se refiere a lo siguiente: 1P X d
, bajo este
contexto podemos utilizar la frmula:
12
Ejemplo. Se desea estimar la estatura promedio de los estudiantes de la asignatura de
Tratamiento de la Informacin Estadstica. Se sabe que la estatura de un estudiante es una
variable aleatoria con distribucin normal. Determine el tamao de muestra aleatoria necesaria
para garantizar una probabilidad igual a 0.95 de que el estimador y el parmetro se diferencien en
menos de 10cm.
Solucin.
Datos conocidos.
d= 10cm
Calcular: , 1
2
Z
=1.96
: Para calcular la desviacin estndar hay que solicitar la estatura de cada estudiante y luego
calcular la varianza utilizando la siguiente frmula: 2
2
1
1 n
X i
i
S x xn
, posteriormente se
obtiene la raz cuadrada y ese es el valor que se debe utilizar en esta ecuacin. Supongamos que =12cm, entonces:
Determinar:
2
21
2 12(1.96) 5.53 610
Z
n n nd
, se requiere una muestra de 6
estudiantes para cumplir las hiptesis del problema.
ESTRATIFICADA - cuando se subdivide en estratos o subgrupos segn las variables o
caractersticas que se pretenden investigar. Cada estrato debe corresponder proporcionalmente a
la poblacin.
El nmero determinado de elementos muestrales es: 1
k
i
i
n n
, donde ni es el nmero de
elementos en el estrato i=1, 2, , k . No se entrar en detalle del clculo del tamao muestral, ya
que supera el alcance de esta asignatura.
13
SISTEMTICA - cuando se establece un patrn o criterio al seleccionar la muestra. Ejemplo: se
entrevistar una familia por cada diez que se detecten.
El muestreo es indispensable para el investigador ya que es imposible entrevistar a todos los
miembros de una poblacin debido a problemas de tiempo, recursos y esfuerzo. Al seleccionar
una muestra lo que se hace es estudiar una parte o un subconjunto de la poblacin, pero que la
misma sea lo suficientemente representativa de sta para que luego pueda generalizarse con
seguridad de ellas a la poblacin.
El tamao de la muestra depende de la precisin con que el investigador desea llevar a cabo su
estudio, pero por regla general se debe usar una muestra tan grande como sea posible de acuerdo
a los recursos que haya disponibles. Es de especificar que para cada mtodo de muestreo existen
frmulas para determinar el tamao de muestra.
1.3. Unidad de estudio y unidad de muestreo
La unidad de anlisis o estudio corresponde a la entidad mayor, primaria o representativa de lo
que va a ser objeto especfico de estudio en una medicin y se refiere al qu o quin es objeto de
inters en una investigacin. Por ejemplo: Condiciones de hacinamiento de las familias del
Municipio de Soyapango, San Salvador. Unidad de Anlisis: Familias del Municipio de
Soyapango.
Debe estar claramente definida en un protocolo de investigacin y el investigador debe obtener la
informacin a partir de la unidad que haya sido definida como tal, aun cuando, para acceder a
ella, haya debido recorrer pasos intermedios. Las unidades de anlisis pueden corresponder a las
siguientes categoras o entidades:
Personas
Grupos humanos
Poblaciones completas
Unidades geogrficas determinadas
Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones
intrahospitalarias, etc)
Entidades intangibles, susceptibles de medir (exmenes, das, camas)
El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de
anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio
mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese
servicio mdico. Si el objetivo es dar cuenta de la satisfaccin del alumno sobre el desempeo
docente, la unidad de anlisis es el alumno que recibe clases con el docente evaluado.
14
La unidad de muestreo corresponde a la entidad bsica mediante la cual se acceder a la unidad
de anlisis. En algunos casos, ambas se corresponden. Por ejemplo, si se desea estimar la
prevalencia de dao auditivo en relacin con niveles de ruido ambiental en una muestra de
trabajadores de una fbrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se
dispone de un registro detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador
de la fbrica.
1.4. Variables y datos
VARIABLES Las variables son las caractersticas observables de un objeto, problema o evento que se puede
describir segn un esquema de medicin bien definido. Cada rasgo o aspecto de una poblacin
constituye una variable. La edad de unas personas, su sexo, color de su piel, nacionalidad, su
nivel de motivacin, niveles de ansiedad, el nmero de nacimientos, nmero de matrimonios,
frecuencia de suicidios, estatura, peso, niveles de inteligencia, actitudes, entre muchas otras.
Las variables pueden adquirir diferentes valores o clasificarse en diferentes categoras segn la
naturaleza o tipo de estudio que se lleve a cabo. Entre stas tenemos las siguientes
clasificaciones:
VARIABLES CUALITATIVAS - son aquellas que se expresan en forma verbal como
categoras o atributos. Por ejemplo, el sexo, color, afiliacin poltica, nacionalidad, motivacin,
rea acadmica o profesin de una persona.
VARIABLES CUANTITATIVAS - son las que varan en trminos de cantidad y se registran o
expresan en forma numrica. Por ejemplo, edad, promedio acadmico, puntuaciones de
exmenes, frecuencia de delitos, temperatura, ingresos anuales o salarios por hora. Hay algunas
caractersticas que pueden clasificarse o expresarse como variable cuantitativa y transformarla a
cualitativa o viceversa. Por ejemplo, nivel de aprovechamiento acadmico estudiantes de 4:00
puntos, o estudiantes de 3:00 puntos y as sucesivamente. El investigador puede expresar
mediante una escala numrica el aprovechamiento acadmico al clasificar a los estudiantes, como
tambin puede clasificarlos como variable cualitativa en las categoras de excelentes, buenos,
regulares y deficientes.
VARIABLES DISCRETAS - son aquellas que slo adquieren un valor absoluto o especfico
que nunca cambian. Pueden ser cualitativas. Ejemplo: el sexo, nacionalidad, grupo tnico, entre
otras.
VARIABLES CONTINUAS - que siempre son cuantitativas, son las que pueden asumir
cualquier valor. Por ejemplo, la edad, altura, peso, ndice acadmico.
En el campo de la investigacin, que se suele examinar las relaciones entre dos o ms variables al
investigar un asunto o problema, se clasifican las variables como:
VARIABLES INDEPENDIENTES - son las caractersticas controladas por el investigador y
que se supone tendrn efectos sobre otras variables.
15
VARIABLES DEPENDIENTES - son las caractersticas o aspectos que se alteran por
consecuencia del control que ejerce el investigador sobre otras variables.
Estos dos ltimos tipos de variables suelen darse ms en estudios o investigaciones
experimentales, pero tambin podemos considerarlas en estudios descriptivos. Por ejemplo, en un
estudio experimental se investiga si un nuevo medicamento mejora las condiciones del sida. A
tales efectos se seleccionaron 30 pacientes, de los cules 15 reciban el nuevo medicamento
(grupo experimental) y otros 15 continuaban con su tratamiento tradicional (grupo control). El
nuevo medicamento viene a ser la variable independiente porque es la que los investigadores
controlan y que luego examinarn sus efectos en la condicin del sida, la cual viene a ser la
variable dependiente, porque es la condicin que se va alterar o quedar afectada por el nuevo
medicamento.
En un estudio descriptivo donde interesa saber si la clase social es factor determinante en el
aprovechamiento acadmico en las escuelas, entonces la clase social es la variable independiente
y el aprovechamiento acadmico la dependiente.
Una variable puede ser independiente en una investigacin y dependiente en otra, todo depender
de la finalidad de la investigacin. Por ejemplo, si se lleva a cabo un estudio para determinar
cmo las condiciones socio-econmicas influyen a la drogadiccin, en este caso, status socio-
econmico es una variable independiente. Por el contrario, si se lleva a cabo una investigacin
para saber cmo la drogadiccin afecta las condiciones sociales y econmicas, entonces, el status
socio-econmico resultara ser la variable independiente.
DATOS: son los hechos que describen sucesos y entidades.
1.5. Escalas de medicin
Una escala es un esquema especfico para asignar nmeros o smbolos con el objeto de designar
caractersticas de una variable. Las escalas de medicin comnmente conocidas son: nominales,
ordinales, de intervalos y de razn. A continuacin veamos los cuatro tipos de escalas de
medicin.
1.5.1. Escalas nominales
Las escalas nominales son aquellas donde se clasifican los objetos, personas o variables en
categoras cualitativamente distintas. Consiste simplemente en agrupar objetos en clases o asignar
las personas de acuerdo a alguna cualidad una vez que los objetos o personas posean
caractersticas comunes que lo hagan pertenecer a una categora. Por ejemplo, todos los
estudiantes que obtuvieron sobre 9 puntos fueron clasificados como excelentes, los que
obtuvieron menos de 8.9 pero ms de 8.0 como muy buenos y de 7.0 a 7.9 como buenos. En una
redada de drogas se arrestaron 22 mareros, cuatro acusados de homicidios, ocho acusados de
violacin y diez por extorciones.
Se pueden utilizar nmeros en las escalas nominales, pero stos no representan magnitudes
absolutas. Los nmeros slo se utilizan con el propsito de clasificarlos a determinada categora.
16
Por ejemplo, si vas a comprar pintura azul en la ferretera te presentan una escala con diferentes
tonalidades del color azul y cada tonalidad posee un nmero, pero este nmero slo es para
facilitar al vendedor identificar el color solicitado entre cientos de colores. De igual modo en
muchas solicitudes se le asigna el nmero 1 al sexo masculino y nmero dos al femenino y esta
clasificacin slo es para facilitar los cmputos y manejos de informacin estadstica, pero no
quiere decir que los masculinos tengan ms o menor valor que las del sexo femenino. Los
nmeros que se utilizan para efectos de identificacin en una escala nominal nunca se utilizarn
para llevar a cabo los procedimientos matemticos de suma, resta, multiplicacin y divisin.
1.5.2. Escalas ordinales
Las escalas ordinales son las que clasifican a las personas, eventos u objetos en una posicin con
relacin a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se
asignan nmeros es slo para indicar el orden de las posiciones de lo que se est clasificando. Por
ejemplo, en un determinado grupo escolar se decidi seleccionar los cinco estudiantes con el
promedio ms alto para premiarlos con un viaje al Lago de Coatepeque y result que Esteban
qued tercero con un promedio de 8.90, seguido de Jorge con 8.88 y, luego Leticia con 8.75.
Esteban como tercero se le asigna el nmero tres, pero sta designacin numrica slo indica su
posicin con relacin a los otros cuatro alumnos. Sabemos que Esteban tiene un mejor promedio
que Jorge y que su promedio es superior que el de Leticia. Sin embargo, no podremos saber hasta
qu punto es mejor su promedio comparado con los otros.
Con las escalas ordinales tampoco se pueden llevar a cabo las operaciones aritmticas de suma,
resta, multiplicacin y divisin. La diferencia que puede haber entre unas personas u objetos en
este tipo de escala no necesariamente constituye unidades iguales o absolutas que puedan
utilizarse para determinar si el que tiene un segundo lugar posee el doble valor que el que queda
en cuarta posicin. Por ejemplo, en un evento atltico de una carrera que no haya sido
cronometrada, podemos saber quin lleg primero, segundo y tercer lugar, pero no podemos
saber con precisin la velocidad entre un corredor y otro. La diferencia que hay entre el primero y
el segundo no necesariamente es igual a la que hubo entre el segundo y el tercero.
1.5.3. Escalas de intervalos
Las escalas de intervalos son aquellas que ordenan los objetos o eventos segn la magnitud del
atributo que representan y proveen intervalos iguales entre las unidades de medida. Adems, no
poseen un punto cero absoluto o verdadero ya que el mismo es establecido por convencin de
forma arbitraria por los expertos en el rea o materia de estudio y no implica la ausencia del
atributo o la propiedad en cuestin. Por ejemplo, la escala de inteligencia posee un punto cero,
pero administrando cualquier tipo de prueba que intente medir la inteligencia, nunca va a
encontrar un ser humano con cero inteligencia. De igual modo si el agua est en 0 grado C, esto
no quiere decir que carezca de temperatura, ya que en una escala de intervalos, como se ha
indicado, es una designacin arbitraria y convencional.
Una diferencia de cierta magnitud en una escala de intervalos significa lo mismo en todos los
puntos de la escala. As por ejemplo, en los termmetros de grados Fahrenheit y centgrados que
17
utilizan este tipo de escalas, estn divididos en unidades iguales, la diferencia en la temperatura
entre 100 grados y 101 grados es equivalente a la diferencia entre 110 grados y 111 grados.
La numeracin de los aos en nuestro calendario utiliza tambin una escala de intervalos. Las
autoridades eclesisticas y gubernamentales de la poca decidieron arbitrariamente fijar como el
ao 1 el del nacimiento de Cristo y como unidad de medida un lapso de 365 das. Por lo tanto, el
lapso de tiempo que estuvo Bill Clinton como presidente de los Estados Unidos desde 1993
2001 es igual al que transcurri George Bush desde 2001 2009.
1.5.4. Escalas de razones o cocientes
Las escalas de razones o cocientes se diferencian de las de intervalos solamente en que la de
razones el punto cero no es arbitrario y corresponde a una total ausencia del asunto o propiedad
estudiada. La escala de una simple regla de 12 pulgadas posee una escala de razones la cual est
dividida en 12 unidades cada una de igual magnitud y parte de un punto cero absoluto y
verdadero.
La mayora de las variables con las cuales se utiliza este tipo de escalas se refieren ms a la
ejecucin de tareas motoras, a las medidas de objetos y de aspectos fisiolgicos.
Dos ejemplos de las escalas de razones y cocientes son: las medidas de la estatura y el peso. Si
una columna mide seis metros es el doble de alto de otra columna que mide tres metros. Si
Enrique pesa 180 libras, entonces pesa el doble que Mara quin pesa 90 libras. Las razones de
los nmeros en estas escalas tienen un determinado sentido, lo que hace posible que se
interpreten los valores numricos entre las cantidades obtenidas de los objetos.
Adems pueden llevarse a cabo las diferentes operaciones matemticas.
RESUMEN: CARACTERSTICAS, EJEMPLOS Y LIMITACIONES
DE LAS ESCALAS DE MEDICIN ESCALA CARACTERSTICAS USOS/EJEMPLOS LIMITACIONES
Nominal Se clasifican las personas, eventos u
objetos en categoras.
Denominaciones religiosas, afiliacin
poltico partidista, codificaciones en
la clasificacin de objetos, pinturas,
movimientos literarios.
No se pueden precisar diferencias
cuantitativas entre las categoras.
Ordinal Se clasifican u ordenan las
personas, objetos y eventos en
determinada posicin.
Orden de llegada de atletas en una
carrera, puntuaciones de una prueba,
rangos militares, nivel de popularidad
de estudiantes en una escuela.
Restringida para Identificar
diferencias relativas, pero no
precisa diferencias en cantidad
absoluta entre personas u objetos.
Intervalo Escala que posee unidades de igual
magnitud. El punto cero de la escala
es arbitrario y no refleja la ausencia
del atributo.
Temperaturas (Celsius y Fahrenheit),
fechas del calendario, escala de
inteligencia.
Razones no tienen sentido ya que el
punto cero es establecido
convencionalmente.
Razones Escala que posee un punto
cero absoluto e intervalos de igual
magnitud.
Distancia, peso, estatura, tiempo
requerido para realizar una tarea
escolar.
Ninguna, excepto que su uso se
supedita mayormente a medir
cualidades fsicas ms que para la
medicin de aspectos psicolgicos.
18
1.6. Diseo de Experimentos estadsticos.
El diseo de un experimento es la secuencia completa de los pasos que se deben tomar de
antemano, para planear y asegurar la obtencin de toda la informacin relevante y adecuada al
problema bajo investigacin, la cual ser analizada estadsticamente para obtener conclusiones
vlidas y objetivas con respecto a los objetivos planteados.
Un Diseo Experimental es una prueba o serie de pruebas en las cuales existen cambios
deliberados en las variables de entrada de un proceso o sistema, de tal manera que sea posible
observar e identificar las causas de los cambios que se producen en la respuesta de salida.
El propsito de cualquier Diseo Experimental, es proporcionar una cantidad mxima de
informacin pertinente al problema que se est investigando. Y ajustar el diseo que sea lo ms
simple y efectivo; para ahorrar dinero, tiempo, personal y material experimental que se va a
utilizar. Es de acotar, que la mayora de los diseos estadsticos simples, no slo son fciles de
analizar, sino tambin son eficientes en el sentido econmico y en el estadstico.
De lo anterior, se deduce que el diseo de un experimento es un proceso que explica tanto la
metodologa estadstica como el anlisis econmico.
DISEO: Consiste en planificar la forma de hacer el experimento, materiales y mtodos a usar,
etc.
EXPERIMENTO: Conjunto de pruebas o ensayos cuyo objetivo es obtener
informacin, que permita mejorar el producto o el proceso en estudio.
1.7. Gua de ejercicios N 1. 1. Contestar verdadero o falso y comentar su respuestas segn sea el caso:
a) La Estadstica es una ciencia que estudia y describe las caractersticas de un conjunto de
casos.
b) La estadstica inferencial generaliza los resultados de una muestra a los de la poblacin
total.
c) Durante los ltimos dos das se ha informado de un total de cinco homicidios diarios en
San Salvador, este es un ejemplo de estadstica inferencial.
d) A las medidas que se obtienen de una muestra se les da el nombre de parmetro.
e) En una muestra aleatoria ciertos elementos tienen mayor probabilidad que otros de ser
seleccionados.
2. Mediante ejemplos, explicar la diferencia entre la estadstica descriptiva y estadstica
inferencial.
19
3. POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas
caractersticas comunes observables en un lugar y en un momento determinado. A partir
de esta definicin enumere las caractersticas de una poblacin.
4. Describir dos ejemplos de poblacin.
5. Describir dos ejemplos de muestra de una poblacin.
6. Definir al menos dos tipos de muestreo y dar ejemplos de aplicacin de cada uno.
7. Se desea estimar la edad promedio de los estudiantes de la asignatura de Tratamiento de
la Informacin Estadstica. Se sabe que la edad de un estudiante es una variable aleatoria
con distribucin normal con desviacin estndar de 6aos. Determine el tamao de
muestra aleatoria necesaria para garantizar una probabilidad igual a 0.95 de que el
estimador y el parmetro se diferencien en menos de 5aos.
8. Establecer las diferencias entre la unidad de anlisis y la unidad muestral.
9. Establecer las diferencias entre variables cualitativas y cuantitativas.
10. Definir al menos dos ejemplos de variables cualitativas y de variables cuantitativas.
11. Establecer las diferencias entre variables discretas y continuas.
12. Definir al menos dos ejemplos de variables discretas y de variables continuas.
13. Definir las siguientes escalas de Medicin y presentar dos ejemplos de cada una de ellas:
Escala nominal
Escala ordinal
Escala de intervalo.
Escala de razn
20
Captulo 2. Distribuciones de frecuencias y sus
representaciones grficas.
2.1. Estadstica Descriptiva con una variable
La estadstica descriptiva permite organizar y presentar un conjunto de datos de manera que
describan en forma precisa las variables analizadas haciendo rpida su lectura e interpretacin.
Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los datos, que son el
resultado de las observaciones y/o experimentos. Se denomina variable al carcter o fenmeno de
la realidad objeto de estudio. Las variables pueden ser de diferentes tipos, dependiendo de los
datos que la forman.
:
Cualitativas o atributosVariables
Cuantitativas Discretas o Continuas
Las variables cualitativas o atributos son aquellas que no toman valores numricos. Describen
diferentes cualidades denominadas modalidades. Ejemplo: Sexo, estado civil, color de los ojos,
etc. Las variables cualitativas estn formadas por datos que toman valores numricos y pueden
ser discretas, si slo toman un nmero entero de valores, y continuas, si pueden tomar cualquier
valor real dentro de un intervalo.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de
frecuencias y b) la representacin grfica.
2.1.1. Distribucin de frecuencias
Supongamos que hemos recogido un conjunto de n datos englobados en una variable X. La tabla
que recoge de modo sistemtico estos datos se denomina distribucin de frecuencias. La
Distribucin de Frecuencias (Simples o agrupadas en intervalos). Comnmente llamada tabla de
frecuencias, se utiliza para hacer la presentacin de datos provenientes de las observaciones
realizadas en el estudio, estableciendo un orden mediante la divisin en clases y registro de la
cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un
mejor anlisis e interpretacin de las caractersticas que describen y que no son evidentes en el
conjunto de datos brutos o sin procesar.
21
La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencias simple
o no agrupada.
Datos Frecuencias Absolutas Frecuencias Relativas
Simples Acumuladas Simples Acumuladas
1
2
.
.
.
k
x
x
x
1
2
.
.
.
k
n
n
n
1 1
2 1 2
1
.
.
.
k
k i
i
N n
N n n
N n
1 1
2 2
/
/
.
.
.
/k k
f n n
f n n
f n n
1 1
2 2
/
/
.
.
.
/k k
F N n
F N n
F N n
Total
1
k
i
i
n n
1
1k
i
i
f
La primera columna representa los distintos valores de esos datos y la segunda la frecuencia
simple, es decir, el nmero de veces que se ha observado el correspondiente valor; la tercera
columna recoge la frecuencia acumulada (nmero de veces que se han observado valores
menores o iguales que el que corresponde a dicha fila). Las frecuencias relativas se obtienen a
partir de las frecuencias absolutas, dividiendo por el tamao de la muestra.
2.1.2. Descripcin de Variables Cualitativas
DISTRIBUCIN DE FRECUENCIAS
Supongamos que tenemos N observaciones de una variable cualitativa.
Supongamos que la variable puede tomar valores pertenecientes a k clases o categoras:
4
Verde
AzulColor de ojos k
Marron
Negro
Representamos mediante n1, n2, , nk el nmero de datos que aparecen en cada una de las k
categoras.
Frecuencia absoluta de la clase i-sima (ni): nmero de observaciones en la clase i.
22
Frecuencia relativa de la clase i-sima (fi): es la proporcin de datos en la clase i-sima, es
decir, fn
Ni
i .
- La suma de las k frecuencias relativas es igual a la unidad: f1 + f2 ++ fk=1
- Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con distinto nmero de observaciones
Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus
respectivas frecuencias.
- Nos indica cmo se distribuye la frecuencia total entre las categoras - Es el resumen ms importante de la informacin contenida en una variable cualitativa Ejemplo 1: nivel educativo
Se ha clasificado a 20 individuos segn su nivel de estudios que puede tomar valores:
1 sin
2
3
4 sup
estudios
primariosNivel educativo
medios
eriores
y se han obtenido los siguientes datos:
1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3;
N=20; k=4
Frecuencias absolutas:
n1=3; n2=7; n3=6; n4=4 N n n n n 1 2 3 4 3 7 6 4 20
Frecuencias relativas:
f f f f1 2 3 43
200 15
7
200 35
6
200 3
4
200 2 , ; , ; , ; ,
f f f f1 2 3 4 0 15 0 35 0 3 0 2 1 , , , ,
23
Distribucin de frecuencias:
Categoras ni fi
1. Sin estudios 3 0,15
2. Primaria 7 0,35
3. Media 6 0,3
4. Superior 4 0,2
N=20 1
La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios
REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS
A) Diagrama de barras: Permite visualizar de forma sencilla la distribucin de una variable cualitativa. Se dibuja sobre cada categora una barra (o rectngulo) cuya altura coincida
con la frecuencia absoluta o relativa de dicha clase.
Ejemplo: Nivel de estudios (Continuacin ejemplo 1)
Frecuencias relativas fi
0.10
0.15
0.20
0.25
0.30
0.35
0.40
1 2 3 4
B) Diagrama de Pareto: Es como un diagrama de barras en el que se ordenan las clases de mayor a menor frecuencia (absoluta o relativa). En la parte superior de la figura suele
trazarse una lnea que representa la suma de la frecuencia de cada clase y las que la
preceden, esto se usa para identificar la minora de las caractersticas que representan la
mayora de casos.
24
A principios del Siglo XX, Vilfredo Pareto (1848-1943), un economista italiano, realiz
un estudio sobre la riqueza y la pobreza. Descubri que el 20% de las personas
controlaba el 80% de la riqueza en Italia.
La grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante
prestar atencin.
Algunos ejemplos de tales minoras vitales son:
La minora de clientes que representan la mayora de las ventas.
La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de desperdicio de los costos de retrabajos.
Ejemplo: Nivel educativo (Continuacin ejemplo 1)
Frecuencias relativas fi (Grfico de Pareto)
0.10
0.15
0.20
0.25
0.30
0.35
0.40
2 3 4 1
f2=0,35
f2+ f3=0,35+0,3=0,65
f2+ f3+ f4=0,35+0,3+0,2=0,85
f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1
Un 35 por ciento de la poblacin llega hasta la educacin primaria y el 65 por ciento de la
poblacin tiene un nivel educativo primario o media.
25
Diagrama de Pareto
0.0
0.2
0.4
0.6
0.8
1.0
2 3 4 1
En el diagrama anterior se observa que el 65 por ciento de la poblacin, tiene un nivel
educativo primaria o media.
C) Pictograma: Es una forma de representar las cantidades estadsticas por medio de
dibujos, utilizando para ello objetos y figuras. Las figuras empleadas deben explicarse por
s mismas.
Ejemplo: Nivel de educativo (Continuacin).
a) Distribucin de frecuencias:
Categoras ni fi
1. Sin estudios 3 0,15
2. Primario 7 0,35
3. Medio 6 0,3
4. Superior 4 0,2
N=20 1
b) Elaboracin del Pictograma (Ejercicio para el estudiante)
26
Ejemplo: Variable socioeconmica (SOC): La variable SOC describe la categora
socioeconmica:
1
2
3
4
5
6
7
trabajadores agrarios
empresarios agrarios
obreros
SOC autonomos
clase media
clase alta
retirados
Los datos de 75 hogares (o unidades de gasto) son:
3 7 3 5 3 5 1 5 7 5 5 3 3 5 1 1 3 2 2 3 1 3 7 5 3 3 3 5 5 5 7 7 5 1 4 2 1 7 3 4 3 3 3 5 3 3 6
6 7 2 7 1 3 3 2 5 3 7 2 2 7 5 2 2 7 6 1 5 3 5 3 3 3 4 3
(a) Obtener las frecuencias absolutas de cada una de las categoras.
n1=8 n2=9 n3=25 n4=3 n5=16
n6=3 n7=11
(b) Calcular las frecuencias relativas y mostrar la distribucin de frecuencias
fn
N1
1 8
750 11 , f
n
N2
2 9
750 12 ,
fn
N3
3 25
750 33 , f
n
N4
4 3
750 04 ,
fn
N5
516
750 21 , f
n
N6
6 3
750 04 ,
fn
N7
7 11
750 15 ,
Ntese que:
f f f f f f f fii
1 2 3 4 5 6 7
1
7
1
27
Distribucin de frecuencias:
Categora ni fi
1. Trabajadores agrarios 8 0,11
2. Empresarios agrarios 9 0,12
3. Obreros 25 0,33
4. Autnomos 3 0,04
5. Clase media 16 0,21
6. Clase alta 3 0,04
7. Retirados 11 0,15
N=75 1
(c) Construir el diagrama de Pareto
0.0
0.2
0.4
0.6
0.8
1.0
3 5 7 2 1 4 6
f3=0,33; f3+f5=0,33+0,21=0,54
f3+f5+f7=0,33+0,21+0,15=0,69
f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81
f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92
f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9
F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1
El 33 por ciento de la poblacin son obreros y el 54 por ciento de la poblacin son obreros o clase
media, y as sucesivamente.
28
Grfico de sectores:
En el caso de variables cualitativas el diagrama circular se utiliza con mucha frecuencia. Consiste
en representar sobre un crculo los diferentes atributos, mediante un sector circular de ngulo
proporcional a la correspondiente frecuencia. El ngulo de cada sector circular se calcula
multiplicando por 360 la frecuencia relativa.
Los grficos de sectores, tambin conocidos como diagramas de "tartas o pastel", se divide un
crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le
corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Si el nmero de
categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo
suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de cuatro
categoras. En este caso se pueden apreciar con claridad dichos subgrupos.
Ejemplo.
La poblacin segn nivel de estudio del Municipio de Ayutuxtepeque se presenta en el siguiente
cuadro:
Parvularia Primaria o bsica
Educacin media
Superior no universitaria
Tcnico universitario
Superior universitaria Maestra Doctorado Total
1168 15895 6842 499 363 4556 70 7 29400 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elaborar un grfico de sectores.
Se tienen 8 categoras, por lo tanto debe aparecer el crculo dividido en 8 porciones. La tabla
anterior presenta las frecuencias absolutas, habr que dividir cada dato por el total (29,400) a fin
de obtener la frecuencia relativa y luego multiplicar esta ltima por 100. Por ejemplo, para la
categora de educcin bsica: (15,895/ 29,400)*100 = 54,06%. Observe que no se ha
multiplicado por 360, ya que es ms ilustrativo el porcentaje (As trabaja Excel).
Figura 2. Nivel educativo de la poblacin de Ayutuxtepeque, por ciento.
Es evidente que la mayora de la poblacin tiene un nivel educativo bsico o media con el
54.06% y 23.27% respectivamente. En general la poblacin de Ayutuxtepeque tiene un nivel
educativo relativamente bajo, son muy pocos los que llegan a hacer estudios universitarios.
29
2.1.3. Variables cuantitativas discretas.
Diagrama de Barras:
Para el caso de distribuciones de frecuencias no agrupadas en intervalos, el diagrama de barras es
el grfico ms empleado. Que se usa cuando se pretende resaltar la representacin de porcentajes
o frecuencias de datos que componen un total. Una grfica de barras contiene barras verticales
que representan valores numricos. Las frecuencias estn asociadas con categoras. Una grfica
de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de
largo (alto si es horizontal) igual a la frecuencia. La grfica de barras sirve para comparar y tener
una representacin grfica de la diferencia de frecuencias o de intensidad de la caracterstica
numrica de inters. Si en vez de frecuencias simples utilizamos frecuencias acumuladas,
tenemos el llamado diagrama de escalera.
Ejemplo. Con la informacin del VI Censo de Poblacin y V de Vivienda, El Salvador, 2007, se
han clasificado las mujeres de El Salvador de 12 aos y ms, segn el nmero de hijos varones,
resultando los siguientes datos.
Construir un grfico de barras para el nmero de hijos varones de las
mujeres salvadoreas.
Ejemplo.
La poblacin segn condicin de ocupacin del Municipio de Ayutuxtepeque se presenta en el
siguiente cuadro:
OCUPADOS DESOCUPADOS INACTIVOS Total
REA URBANA 10966 2832 8531 22329
EL ZAPOTE 329 42 477 848
LOS LLANITOS 2410 227 2550 5187
Total 13705 3101 11558 28364 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elaborar un grfico de barras para la poblacin total de Ayutuxtepeque segn su condicin de
ocupacin.
N Hijos Varones Madres
0 278290
1 509469
2 339180
3 177050
4 92233
5 50916
6 27791
7 15004
8 7328
9+ 7366
30
2.2. Distribucin de frecuencias agrupadas.
Cuando en la muestra existen muchos valores diferentes y mucha variabilidad se recomienda, an
a costa de perder informacin, agrupar los datos en clases, en lo que se denomina distribucin de
frecuencias agrupada en intervalos.
Clase Marca Frecuencias Absolutas Frecuencias Relativas
Clase Simples Acumuladas Simples Acumuladas
0 1
1 2
1
.
.
.
k k
L L
L L
L L
1
2
.
.
.
k
x
x
x
1
2
.
.
.
k
n
n
n
1 1
2 1 2
1
.
.
.
k
k i
i
N n
N n n
N n
1 1
2 2
/
/
.
.
.
/k k
f n n
f n n
f n n
1 1
2 2
/
/
.
.
.
/k k
F N n
F N n
F N n
Total
1
k
i
i
n n
1
1k
i
i
f
A cada uno de los intervalos se les denomina clase y al punto medio marca de clase. A efectos de
clculo la marca de clase se elige como representante del intervalo. El nmero de clases en que se
dividen los datos no debe ser excesivo. A modo orientativo, el nmero de clases se puede obtener
mediante la siguiente frmula emprica, llamada de Sturges:
3 log( )
2 log(2)
nnmero de clases (Tomar la parte entera)
31
Ejemplo. Poblacin de El Salvador, por sexo y edad, ao 2007..
Edad Hombre Mujer Total Edad Hombre Mujer Total Edad Hombre Mujer Total
< 1 51787 50097 101884 36 31398 40111 71509 72 8591 10717 19308
1 53230 51477 104707 37 31414 38801 70215 73 7461 9522 16983
2 55845 54261 110106 38 29639 37419 67058 74 8011 10030 18041
3 59752 57127 116879 39 29435 37454 66889 75 8067 9886 17953
4 62658 59659 122317 40 31769 39411 71180 76 7535 9745 17280
5 62274 59738 122012 41 24732 32964 57696 77 6897 8872 15769
6 69088 66249 135337 42 26840 34653 61493 78 5825 7123 12948
7 75310 72672 147982 43 24578 32639 57217 79 5334 6700 12034
8 71525 68511 140036 44 24299 31746 56045 80 5717 7089 12806
9 70953 68407 139360 45 24451 31422 55873 81 4124 5274 9398
10 74244 70664 144908 46 21989 29308 51297 82 3841 5220 9061
11 71744 69499 141243 47 22251 28713 50964 83 3438 4508 7946
12 74093 72835 146928 48 20682 26481 47163 84 3281 4378 7659
13 68251 66194 134445 49 20584 26241 46825 85 3263 4413 7676
14 71191 67632 138823 50 22897 28057 50954 86 3096 4286 7382
15 64523 63752 128275 51 17664 22874 40538 87 2750 3758 6508
16 61880 61630 123510 52 19081 24360 43441 88 1767 2358 4125
17 61255 61624 122879 53 17671 22344 40015 89 1595 2219 3814
18 57590 58584 116174 54 17962 22824 40786 90 1405 2091 3496
19 53136 56591 109727 55 17848 22561 40409 91 786 1143 1929
20 50243 55085 105328 56 17114 21361 38475 92 826 1206 2032
21 45994 51623 97617 57 16816 20974 37790 93 673 990 1663
22 46006 51429 97435 58 14462 17853 32315 94 559 869 1428
23 42864 49278 92142 59 15478 18608 34086 95 482 816 1298
24 42894 51126 94020 60 17461 19979 37440 96 416 674 1090
25 42616 50552 93168 61 12470 15424 27894 97 356 588 944
26 41993 50707 92700 62 13590 17093 30683 98 + 526 948 1474
27 43473 52214 95687 63 12274 15528 27802
28 39209 48076 87285 64 12412 15633 28045
29 39672 49378 89050 65 12802 15513 28315
30 41911 50744 92655 66 11774 14915 26689
31 33494 42933 76427 67 11864 14597 26461
32 35940 45312 81252 68 9694 12291 21985
33 33124 41990 75114 69 9647 12060 21707
34 33931 42870 76801 70 10861 13101 23962
35 34628 42848 77476 71 8525 10638 19163 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Elabore una tabla de frecuencias agrupadas por edad.
32
2.2.1 Representacin grfica de variables continuas
Histogramas y polgono de frecuencias.
El histograma y el polgono de frecuencias son las representaciones grficas usadas para
distribuciones de frecuencias agrupadas en intervalos. El histograma se construye dibujando en
cada clase un rectngulo de base la amplitud del intervalo y de altura se representan las
frecuencias. Si desde el extremo superior de cada una de las barras que representan los intervalos
de clase se hace una marca en el punto medio y luego se unen los puntos por lnea recta se
obtiene el polgono de frecuencias.
El polgono de frecuencias se lleva hasta el eje horizontal en los extremos hasta los puntos que
seran los puntos medios si hubiera una clase adicional en cada extremo del histograma
correspondiente. Esto permite que el rea total quede incluida. Es decir, el rea total bajo el
polgono de frecuencias equivale al rea bajo el histograma.
Ejemplo: Estatura de los estudiantes de clase (ejercicio prctico)
Ejemplo:
El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y
2008, para los municipios de Soyapango, Ilopango y San Martn.
Grupos de
edades
SOYAPANGO ILOPANGO SAN MARTN
Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2004
Total 15 167 182 12 78 90 11 42 53
AO 2005
Total 14 228 242 5 74 79 11 75 86
AO 2006
Total 16 246 262 15 69 84 6 48 54
AO 2007
Total 20 179 199 10 67 77 8 71 79
AO 2008
Total 10 128 138 9 66 75 7 54 61
Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar el sexo, no aparecen registrados en el cuadro anterior.
Utilizar la mejor representacin grfica para la informacin anterior (Diagrama de barras e
histogramas)
33
2.3. Gua de ejercicios N 2.
Distribucin de frecuencias y sus representaciones grficas.
1. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7,
6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.
2. Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:
Peso [50,
60)
[60,
70) [70, 80) [80,90)
[90,
100)
[100,
110)
[110,
120)
fi 8 10 16 14 10 5 2
a) Construir la tabla de frecuencias.
b) Representar el histograma y el polgono de frecuencias.
3. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
a) Construir la tabla de frecuencias agrupadas en intervalos de amplitud 5 unidades.
b) Dibujar el histograma y el polgono de frecuencias.
4. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de individuos
que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las
siguientes: 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas.
b) Qu proporcin de hogares est compuesto por tres o menos personas? Qu proporcin de individuos vive en hogares con tres o menos miembros?
c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.
5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el nmero de empleados que hay en cada una de ellas para un estudio posterior. Las
observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11,
12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10,
11, 12, 12, 11, 13, 13, 15, 13, 11, 12.
a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas.
b) Qu proporcin de sucursales tiene ms de 15 empleados?
34
c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes. d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribucin
de frecuencias y represente su histograma y su polgono de frecuencias.
6. Los siguientes valores son los niveles de glucosa en sangre extrada a 100 nios en ayunas:
56 61 57 77 62 75 63 55 64 60
60 57 61 57 67 62 69 67 68 59
65 72 65 61 68 73 65 62 75 80
66 61 69 76 72 57 75 68 81 64
69 64 66 65 65 76 65 58 65 64
68 71 72 58 73 55 73 79 81 56
65 60 65 80 66 80 68 55 66 71
72 73 73 75 75 74 66 68 73 65
73 74 68 59 69 55 67 65 67 63
67 56 67 62 65 75 62 63 63 59
a. Elabore una distribucin de frecuencias b. Un histograma y un polgono de frecuencias.
7. Los siguientes datos representan las ventas de tabaco en Espaa durante el ao 1992, en millones de cajetillas, segn marcas:
Marcas Ventas
Ducados
Fortuna
Marlboro
Winston (1)
Lucky Strike (1)
Chesterfiel
Otros marcas
1,107
1,041
535
333
164
110
725
a. Calcular el porcentaje de ventas de cada marca sobre el total. b. Representar los datos anteriores mediante un diagrama circular
8. Las edades de los empleados de una determinada empresa son las que aparecen en la siguiente tabla:
Edad N de empleados
Menos de 25 22
Menos de 35 70
Menos de 45 121
Menos de 55 157
Menos de 65 184
Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias para
datos agrupados (amplitud del intervalo definida segn su conveniencia).
35
Captulo 3. Medidas Caractersticas de una
Distribucin Cuantitativa Emprica.
3.1 Medidas de posicin
Los promedios o medidas de posicin proporcionan valores tpicos o representativos de la
variable en estudio. Podemos hablar de medidas de posicin centrales, como la media (aritmtica,
geomtrica y armnica), la mediana y la moda y medidas de posiciones no centrales, como los
cuartiles, quintiles, deciles y percentiles.
La media aritmtica es la medida de posicin ms utilizada (esta muy influenciada por los valores
extremos de la variable). Viene definida como la suma de los datos divido por el nmero de ellos.
Dependiendo de la naturaleza de los datos que pretendemos promediar, ser conveniente el uso
de otro tipo de medidas, como son la media geomtrica (Todos los datos son positivos y hay
mucha dispersin; ejemplo: porcentajes, tasas de crecimiento, razones, nmeros ndices, inters
anual, inflacin, etc.) y la media armnica (resulta poco influida por la existencia de
determinados valores muy grandes que el conjunto de los otros, siendo en cambio sensible a
valores muy pequeos), cuyas frmulas se presentan en la siguiente tabla. Si a cada observacin
se le asigna un valor diferente, dado en forma de peso, y a continuacin se calcula la media, nos
encontramos con una media ponderada. La moda de un conjunto de valores es aquel valor que
ocurre con ms frecuencia. Si todos los valores son distintos, no hay moda, por otra parte, un
conjunto de datos puede tener ms de una moda.
Medidas de tendencia central
Media aritmtica 1 1 2 2
1. . . k kx x n x n x n
n
Media geomtrica 1 2
1/
1 2 . . .k
nnn n
kG x x x
Media armnica
1 2
1 2
. . . k
k
nH
nn n
x x x
3.1.1. Media aritmtica.
Es la medida ms conocida, la ms fcil de calcular y con la que siempre estamos ms
familiarizados, ya que siempre hemos calculado el promedio de calificaciones obtenidas en cada
periodo escolar (Ciclo, ao, etc.) A veces se le denomina simplemente media o promedio, y es
utilizada con tanta frecuencia, que en algunas ocasiones nos conduce a resultados que no revelan
36
lo que se pretende presentar, ya que la distribucin de los datos puede requerir de la aplicacin de
un promedio diferente a la media, ya sea, media geomtrica o media armnica.
Le media es altamente sensible a cualquier cambio en los valores de la distribucin. No es
recomendable su uso cuando la variable est dada en forma de tasas o porcentajes. La media es
representativa del conjunto de datos si se quiere promediar cantidades semejantes, que presentan
variaciones dentro de un margen razonable.
Media Aritmtica simple. Se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el nmero total de observaciones. Su frmula est dada por:
1
n
i
i
x
xn
Ejemplo. Supongamos que en un almacn tienen empleados a 12 vendedores, y sus ingresos
mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $ 469 y $
547. Se pide determinar la media de los ingresos de los 12 vendedores.
Solucin.
Ejemplo. Consideremos las utilidades y prdidas de un almacn por departamentos, como se
muestra en la siguiente tabla.
OBSERVACIN. El promedio por departamento se
mantiene de un ao a otro, pero nos oculta los cambios que
se han producido por departamentos donde ha habido un
desplazamiento de los beneficios. Para superar estas
deficiencias se requiere trabajar con la media ponderada.
Media aritmtica ponderada
Cuando el nmero de observaciones es grande, las operaciones para calcular la media se
simplifican si agrupamos los datos en una tabla de frecuencias. La frmula matemtica est dada
por:
1
k
i i
i
x f
xn
Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el punto
medio de cada clase en vez de x (marca de clase).
Propiedades de la media.
Dada la importancia de la media y su uso frecuente, conviene considerar algunas de sus
propiedades:
1. La suma de las desviaciones respecto a la media es cero, esto es:
Departamentos 2008 2009
Calzado -10 20
Electrodomsticos 153 58
Juguetera -40 -20
Ropa 130 152
Miscelneos -13 10
Promedio 44 44
37
Para datos no agrupados:1
( ) 0n
i
i
x x
Para datos agrupados: 1
( ) 0n
i i
i
x x n
. La verificacin de esta propiedad es inmediata.
2. La media aritmtica de una constante es igual a la constante. 3. La media del producto de una constante por una variable, es igual a multiplicar a la
constante por la media de la variable.
4. La media de una variable ms (o menos) una constante ser igual a la media de la
variable, ms (o menos) la constante, es decir, 1( )
k
i i
i
x c n
x cn
5. La media aritmtica de una muestra dividida en submuestras, es igual, a la media ponderada de las submuestras, tomando como ponderacin los tamaos de las
submuestras. Esto es, 1
1 2 ...
m
i i
im
x n
x donde n n n nn
Ejemplo: Un inversionista tiene 1,200 acciones de un precio inferior a $3,490 dlares
siendo su valor promedio de $ 2,905; adems, 800 acciones cuyo valor unitario es
superior a $ 3,490 y su valor promedio de $ 4,275. Calcular el valor promedio de las
2,000 acciones.
Solucin.
1 21 2
1 2
2905(1200) 4275(800)3,453
1200 800
x n x nx
n n
En promedio el inversionista gasta $ 3,453 dlares en las 2000 acciones.
3.1.2. La media geomtrica (Mg)
La media geomtrica se define como la raz n-sima de la multiplicacin de los n valores de la
variable. Se utiliza cuando se quiere dar importancia a valores pequeos de la variable o cuando
se desea obtener el promedio de valores que estn dados en progresin geomtrica.
En el campo industrial y comercial se utiliza para obtener promedios sobre el crecimiento o
decrecimiento de una variable. Por ejemplo, un capital ahorrado a una tasa de inters compuesto,
durante un periodo de tiempo.
La media geomtrica se calcula utilizando la siguiente frmula: 1 2
1 2 . . .knn nn
kMg x x x donde los ni es el nmero de veces que se repite cada dato, en caso que los datos no se repitan los
ni=1.La frmula de la media geomtrica tal como se ha presentado tiene el inconveniente de que
38
tanto el producto de los xi como su raz n-sima, pueden ser un valor demasiado alto que dificulte
las operaciones. Para obviar esta dificultad se transforma la ecuacin anterior en:
1
ln
exp
k
i i
i
n x
Mgn
. Es obvio que las dos ecuaciones son equivalentes, esta ltima
ecuacin es la ms utilizada en el clculo de la media geomtrica.
Ejemplo (Media geomtrica)
Las tasas de inters de tres bonos son 5%, 7% y 4%.
La media geomtrica es: 3 7 5 4 5.192G x x
La Mg da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la
tasa de 7%.
3.1.3. La media armnica (Ma)
Iniciamos diciendo que el inverso de la media armnica es igual a la media aritmtica del inverso
de los valores de la variable, esto es:
1
1
1
ki
i i
ki
i i
n
x nMa
nMa n
x
Ejemplo: Se sabe que dos obreros A y B, se tardan 50 y 40 minutos respectivamente en reparar
un par de zapatos. Cul es el tiempo requerido para reparar un par de zapatos?
Solucin.
1 2
244.44
1 1 1 1
50 40
nMa Ma
x x
, es el tiempo requerido para reparar un
par de zapatos.
El mayor uso de la media armnica es para calcular la velocidad promedio. Recordemos que:
39
ndista ciaVelocidad
tiempo , supongamos que se han recorrido k trayectos (distancias) a cierta
velocidad cada trayecto, entonces la velocidad media vendr dada por:
1 1
tank k
i i
i ii i
dis cia total dVm
d d
V V
Ejemplo. Supongamos que la distancia entre dos ciudades, A y B, es de 80 kilmetros y entre B
y C de 120 kilmetros. Si un automovilista recorre de A a B a una velocidad de 100Km/h y de B
a C a una velocidad de 80Km/h. Cul es la velocidad promedio?
Solucin.
1
20086.956
80 120
100 80
ki
i i
dVm
d
V
3.1.4. La moda
La moda es una medida de posicin, menos importante que los promedios y su uso es bastante
limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una frecuencia
demasiado grande con respecto a las dems.
La moda se define aquel valor de la variable o del atributo que presenta la mayor densidad, es
decir, la mayor frecuencia.
Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es unimodal. Si hay
dos valores en la variable con la misma frecuencia mxima, la distribucin es bimodal. Si hay
ms de dos, la distribucin es multimodal. Cuando ninguno de los valores que toma la variable se
repite, no existe moda.
Datos agrupados.
Cuando la moda se aplica a una variable continua, se requiere que la amplitud de los intervalos
sea constante. A se presenta una frmula para obtener una aproximacin del valor modal:
11
1 1
ii
i i