UNIDAD DOS MEDIDAS ESTADÍSTICASyamilemedina.weebly.com/uploads/6/4/1/1/6411426/... · promedio,...

17
1 UNIDAD DOS La estadística es una ciencia que demuestra que si mi vecino tiene dos coches y yo ninguno, los dos tenemos uno. Frase de George Bernard Shaw PALABRAS CLAVE 2.1 Objetivos Específicos de la Unidad 1. Calcular la media aritmética, la mediana, la moda en datos originales y en datos agrupados 2. Interpretar cada una de estas medidas y comprender sus aplicaciones. 3. Explicar que indican las medidas de dispersión con respecto al valor promedio 4. Calcular la varianza, desviación estándar en datos originales y datos agrupados 5. Interpretar la desviación estándar y comprender su aplicación. 6. Calcular e interpretar las medidas de localización Datos originales o datos sin agrupar, datos agrupados, Media o promedio, Mediana, Moda, Cuartil, Percentil, Varianza, Desviación estándar. MEDIDAS ESTADÍSTICAS

Transcript of UNIDAD DOS MEDIDAS ESTADÍSTICASyamilemedina.weebly.com/uploads/6/4/1/1/6411426/... · promedio,...

1

UNIDAD DOS

La estadística es una ciencia que demuestra que si mi vecino tiene

dos coches y yo ninguno, los dos tenemos uno.

Frase de George Bernard Shaw

PALABRAS CLAVE

2.1 Objetivos Específicos de la Unidad 1. Calcular la media aritmética, la mediana, la moda en datos originales y en

datos agrupados 2. Interpretar cada una de estas medidas y comprender sus aplicaciones. 3. Explicar que indican las medidas de dispersión con respecto al valor

promedio 4. Calcular la varianza, desviación estándar en datos originales y datos

agrupados 5. Interpretar la desviación estándar y comprender su aplicación. 6. Calcular e interpretar las medidas de localización

Datos originales o datos sin agrupar, datos agrupados, Media o promedio, Mediana, Moda, Cuartil, Percentil, Varianza, Desviación estándar.

MEDIDAS ESTADÍSTICAS

2

2.2 COMPETENCIAS El estudiante identifica y aplica la medida apropiada para caracterizar la información e interpreta los resultados obtenidos a partir del uso correcto de las formulas.

2.3 DESARROLLO TEMATICO

2.3.1 MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo número. Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos más bien que valores típicos. Entonces sería más adecuado buscar un valor central. Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual.

Todas las medidas tanto de tendencia central como de dispersión se estudian bajo la óptica de datos originales o sin agrupar o datos agrupados (los que aparecen en tablas de frecuencias), aunque el concepto de la medida es el mismo bajo las dos formas.

2.4.1.1 LA MEDIA ARITMETICA

Es la medida de tendencia central más conocida, es fácil de calcular, sus formulas permiten tratamiento algebraico. Para representarla utilizamos un símbolo que la diferencia de acuerdo a si se trabaja en una población o en una muestra, aunque la formula que se aplica es igual en los dos casos. SIMBOLO

: MEDIA MUESTRAL µ : MEDIA POBLACIONAL

3

2.4.1.1.1 Datos sin agrupar La media aritmética se define como la suma de todos los valores observados dividida por el número de observaciones (n). La formula para datos no agrupados es:

Ejemplo: se pregunta a un grupo de personas sobre la edad y se obtienen los siguientes resultados: X: Edad (años) 17 18 19 20 21 22 23 La media es:

Se Interpreta diciendo que la edad promedio es de 20 años. En muchas ocasiones se habla en términos del valor promedio, por ejemplo se dice hay un grupo de personas que tienen una edad promedio de 20 años, se puede pensar que las personas son las del grupo anterior, pero cuando se observa el grupo las edades son:

4 5 6 65

4

El promedio de estos datos es:

En este ejemplo se puede ver que esta medida presenta el inconveniente de ser muy sensible a los valores extremos, cuando estos son demasiados bajos o demasiado altos. 2.4.1.1.2 Datos agrupados Es claro que la media aritmética es la sumatoria de los datos dividida entre el numero total de datos, sin embargo cuando se tiene una tabla de frecuencias o datos agrupados para efectuar ese proceso se debe recordar que la marca de clase es el valor representativo o característico del grupo y que la frecuencia absoluta es el número de datos que pertenecen a la respectiva clase. Para las distribuciones con datos agrupados, existe una formula, también fácil de aplicar:

en donde ni corresponde a las frecuencias y Xi al valor de marca de clase Ejemplo La distribución sobre la edad de un grupo de personas se presenta en la siguiente tabla:

5

Xi ni Intervalos

Marca de clase

frecuencias

Xi*ni

30 – 34 32 4 128 34 – 38 36 7 252 38 – 42 40 8 320 42 – 46 44 6 264 46 – 50 48 5 240

Total n =30 1204

(Recuerde que la marca de clase es el punto medio de cada intervalo. Para obtenerla se suman los límites en cada intervalo y se divide entre dos).

Observe que por facilidad para el manejo de esta medida se ha abierto una columna adicional en la tabla marcada como Xi*ni (la multiplicación de las dos columnas). La media aritmética solo se puede calcular con valores numéricos, es decir que estén en escala de intervalos o de razón

2.4.1.1.3 Media ponderada:

La media ponderada es un caso especial de la media aritmética, se presenta cuando cada uno de los valores de la variable tiene un peso o una importancia diferente y esto se ve reflejado en el cálculo de la media.

La media ponderada se obtiene multiplicando cada valor de la variable por su “peso” o ponderación correspondiente.

Ejemplo

Un curso se evalúa con un primer parcial que tiene un valor del 20%, un segundo parcial con un valor del 50% y un taller con un valor del 30%. Si un estudiante obtiene una nota de 3,5 en el primer parcial, 2,8 en el segundo parcial y 4,2 en el taller ¿Cuál es la nota promedio?

13.4030

12045==X

6

Valor ponderación

Xi Wi

3,5 20

2,8 50

4,2 30

En formula la media ponderada se escribe de la siguiente forma:

Xi : Valor de la variable

Wi: Peso o ponderación

La formula se presenta como

Observe la similitud que tiene con la media para datos agrupados.

2.4.1.2 LA MEDIANA

7

SIMBOLO

2.4.1.2.1 Datos sin agrupar

La mediana se define como la medida de tendencia central que divide a cualquier distribución en dos partes iguales, es decir es el valor que ocupa la posición central de los datos ordenados.

En la siguiente distribución:

7, 8, 8, 9, 12, 15, 18, 18, 20, 21, 23

La mediana es 15, porque se sitúa en el punto que divide la distribución en dos partes iguales. Hay el mismo número de casos antes y después de 15. La mediana se usa en variables medidas en escala ordinal, intervalo o de razón.

Para interpretar esta medida se tiene en cuenta que cuando se tienen todos los datos se habla del 100% de la información:

50% 50%

------------------------------------------------*-----------------------------------------------------

7 15 23

La mediana al quedar en el centro de los datos los divide en dos grupos. Para el grupo de la izquierda la mediana es el valor máximo del 50% de los datos más pequeños. Para el grupo de la derecha se convierte en el mínimo del 50% de los datos más grandes.

Cuando hay una distribución con un número par de casos,(n es par) la mediana es el promedio de los dos valores medios. Así, en la siguiente distribución:

78, 95, 86, 73, 52, 90, 89, 84, 76, 92

Me: MEDIANA

8

n = 10 (par)

El valor de la mediana es 85, porque, primero al ordenar la distribución de menor a mayor queda:

52, 73, 76, 78, 84, 86, 89, 90, 92, 95

Siendo 10 el total de datos, los que aparecen en la posición quinta y sexta están en la mitad de la distribución, entonces la mediana será:

Este resultado indica que el 50% de los valores más bajos tienen un valor máximo de 85.

2.4.1.2.2 Datos agrupados

Cuando se tiene información agrupada, la mediana se define como el valor del intervalo que divide la distribución en dos partes iguales.

Variable Discreta

Cuando la variable es discreta como en el siguiente ejemplo sobre el número de hijos de un grupo de familias:

X: Número de hijos por familia

Xi ni Ni

1 12 12

2 15 27

3 8 35

4 5 40

5 2 42

n = 42

Para ubicar el valor central:

1. Calcule las frecuencias absolutas acumuladas.

9

2. Se calcula el valor n/2

3. Se compara n/2 con las frecuencias absolutas acumuladas Ni hasta encontrar la menor frecuencia acumulada que contiene el valor n/2

4. La mediana es el valor de la variable en donde esta contenido n/2

En la tabla anterior

21 se compara con las Ni y se encuentra contenido en Ni=27 (menor frecuencia que lo contiene), por lo tanto la mediana es 2.

Variable Continua

Los pasos a seguir en el cálculo de la mediana son:

1. Encuentre las frecuencias absolutas acumuladas. 2. Con base en la frecuencia absoluta acumulada ubique el intervalo donde

quede la frecuencia correspondiente a la mitad del tamaño de la muestra es decir n/2

3. Compare el valor de n/2 con la frecuencia absoluta acumulada hasta obtener la menor frecuencia acumulada que lo contiene.

4. Aplique la siguiente formula: 5.

en donde:

Li = Limite inferior del grupo en donde se ubica n/2

N i-1= Frecuencia absoluta acumulada en el grupo anterior a donde esta ubicado n/2

ni = Frecuencia del intervalo donde esta n/2

C = Amplitud del intervalo

10

Ejemplo

Los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una prueba de aptitud.

Puntaje

No estudiantes

ni

Ni

20 30 4 4

30 40 9 13 Ni-1

40 50 19 32 grupo mediana

50 60 7 39

60 70 6 45

70 80 5 50

Me = 46.32

El 50% de los estudiantes con menores puntajes obtienen un valor máximo de 46,32

2.4.1.3 La moda

SIMBOLO

Md: MODA

11

2.4.1.3.1 Datos sin agrupar

La moda de una distribución se define como el valor que presenta la mayor frecuencia. Se usa con mediciones de escala nominal, ordinal, de intervalo y de razón.

Es comúnmente utilizada como una medida de popularidad, que refleja la tendencia de una opinión.

Para los datos: 5 7 6 8 7 9 5 7 10

La moda es 7

En algunas distribuciones solo hay una moda, pero en otras puede haber dos o mas modas.

Si tomamos los siguientes datos:

1, 4, 4, 4, 2, 5, 5, 8, 6, 3, 5,

Se observa que tanto el cuatro como el cinco aparecen con mas frecuencia y en tres ocasiones. Es decir, hay dos modas y la distribución es bimodal.

Puede existir el caso en el que todos los datos se repiten con la misma frecuencia, en este caso se dice que no hay moda, por ejemplo:

3 4 5 6 7 8 9

Md = No hay

O como en el siguiente caso:

2 2 3 3 4 4

Los datos se repiten el mismo número de veces por lo tanto no hay moda.

2.4.1.3.2 Datos agrupados

Variable Continua

Cuando se trabaja con datos agrupados, la moda se puede calcular con la siguiente formula:

12

en donde:

Li = Limite inferior del grupo en donde se ubica la mayor frecuencia absoluta

ni= Frecuencia absoluta del grupo de la moda

ni-1 = Frecuencia absoluta en el grupo anterior al de la moda

ni+1 = Frecuencia absoluta del grupo posterior al de la moda

Ci = Amplitud del intervalo de la moda

El grupo de la moda es el que tiene la mayor frecuencia.

La siguiente tabla muestra la distribución obtenida al estudiar los puntajes obtenidos por 50 estudiantes como calificación en un curso de estadística

Puntaje

No estudiantes

20 30 4

30 40 9 ni-1

40 50 19 ni

50 60 7 ni+1

60 70 6

70 80 5

El intervalo que contiene el mayor número de casos o mayor frecuencia es

40 – 50. Con este intervalo se aplica la formula de la moda:

13

Moda = 44.54

Se interpreta diciendo que la mayoría de las personas obtienen un puntaje de 44,54 (se deja en valor decimal, no se aproxima porque la variable es continua).

2.4.1.4 Propiedades de la media, mediana y moda

Propiedades de la media aritmética

1. Puede ser calculada en distribuciones con escala de razón o de intervalo.

2. Todos los valores son incluidos en el cómputo de la media.

3. Una serie de datos solo tiene una media.

4. Es una medida muy útil para comparar dos o más poblaciones.

Desventajas de la media aritmética

Si alguno de los valores es extremadamente grande o extremadamente pequeño, la media no es el promedio apropiado para representar la serie de datos.

Propiedades de la mediana

1. Hay solo una mediana en una serie de datos.

2. No es afectada por los valores extremos (altos o bajos)

3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se encuentra en el intervalo abierto.

Propiedades de la moda

1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, de intervalo, y de razón).

2. La moda tiene la ventaja de no ser afectada por valores extremos.

3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.

14

Desventajas de la moda

En muchas series de datos no hay moda porque ningún valor aparece más de una vez.

En algunas series de datos hay más de una moda, en este caso uno podría preguntarse ¿cuál es el valor representativo de la serie de datos?

EJEMPLO 3 Los siguientes datos representan el tiempo (en minutos) que se toman cada uno de los nueve empleados de una entidad financiera en atender a un cliente

1 3 2 2 3 4 2 1 3

a. Cuál es la moda? b. Cuál es la media? c. Cuál es la mediana? SOLUCIÓN a. Moda = 2 y 3 los datos son bimodales La mayoría de los empleados gastan 2 o 3 minutos en atender los clientes b. Media:

Entonces

El tiempo promedio de atención es de 2 minutos por cliente.

c. Para calcular la mediana primero se ordenan los datos de menor a mayor:

1 1 2 2 2 3 3 3 4

Se halla el valor ubicado en el centro de los datos

Me = 2

El 50% de los empleados que menos tiempo gastan en atender a los clientes tienen un tiempo máximo de 2 minutos.

15

Se puede interpretar también: el 50% de los empleados que más tiempo gastan en atender a los clientes tienen un tiempo mínimo de 2 minutos.

EJEMPLO 4

Como parte de un plan de desarrollo y apertura de planes de ahorro y vivienda, la asociación de entidades financieras necesita conocer el nivel de ahorro mensual de sus clientes. Para ello seleccionó muestras en dos de sus filiales: Bancos, y Fondos de Ahorro. Los datos obtenidos fueron los siguientes expresados en miles de pesos al mes.

En Bancos se obtuvieron los siguientes registros:

50, 72, 25, 20, 75, 85, 40, 30, 98, 50

Y de los Fondos de Ahorro se obtuvo la siguiente distribución del Ahorro.

AHORRO Nro. De Clientes

15 23 16

23 31 9

31 39 21

39 47 14

47 55 10

a) Identificar: Población, muestra, variable, tipo de variable, escala de medida.

b) Calcular e interpretar el ahorro promedio de los clientes en cada una de las dos filiales.

c) Calcular e interpretar el ahorro promedio de los clientes en las dos filiales en conjunto.

SOLUCION

a) Población: Clientes que ahorran en las entidades financieras

Muestra : 80 clientes seleccionados (10 de bancos y 70 de Fondos de Ahorro)

Variable: Ahorro mensual en miles de pesos

16

Tipo de variable: Cuantitativa continua

Escala de medida: De razón

b) Ahorro promedio en Bancos:

Se utiliza la formula de la media para datos sin agrupar:

En bancos el ahorro promedio es de $54.500 por cliente

En fondos de ahorro se utiliza la fórmula para datos agrupados:

AHORRO Nro. De Clientes n i Xi X ini

15 23 16 19 304 23 31 9 27 243 31 39 21 35 735 39 47 14 43 602 47 55 10 51 510

70 2394

En fondos el ahorro promedio es de $34.200 por cliente

c) Para calcular el ahorro promedio de las dos filiales en conjunto se tiene en cuenta que:

Bancos número de clientes n = 10

17

Fondos de ahorro número de clientes n = 70

El ahorro promedio de los clientes en las dos filiales en conjunto es de $36.740

2.5 BIBLIOGRAFÍA

(1) Martínez B. C., Estadística y Muestreo. 11 ed., ECOE, 2002. (2) Lind D.A., Marchall W.G, Wathen S.A. Estadística para Administración y Economía,

Decimotercera edición .Mc Graw Hill 2008 (3) Lincoln L.CH.,Estadística para las Ciencias Administativas, 3 ed. Mc. Graw Hill 1993. (4) Webster A. L., Estadística aplicada a los negocios y la economía 3 ed. Mc. Graw

Hill,2000 (5) NEWBOLD Paul, Estadística para los Negocios y la Economía. Ed. Prentice Hall. (6) Montiel A.M.,Rius F.,Barón F.J., Elementos Básicos de Estadística Económica y

Empresarial, 1 ed. Prentice Hall, 1997.