Presentacion Modulo 05

16
1 Métodos para el análisis descriptivo: centralización Estadística

description

modulo

Transcript of Presentacion Modulo 05

Page 1: Presentacion Modulo 05

1

Métodos para el análisis

descriptivo: centralización

Estadística

Page 2: Presentacion Modulo 05

2

Medidas de Tendencia Central a partir

de datos agrupados

Page 3: Presentacion Modulo 05

3

Una distribución de frecuencias consta de datos agrupados en

clases. Cada valor de una observación cae dentro de alguna de

las clases. Suponga que tenemos una distribución de frecuencias

del saldo promedio mensual de la cuenta de cheques de 600

clientes de una sucursal bancaria. A partir de la información de la

tabla, podemos calcular fácilmente una estimación del valor de la

media de estos datos agrupados. Es una estimación porque no

utilizamos los 600 datos puntuales de la muestra. De haber usado

los datos originales sin agrupar, podríamos haber calculado el

valor real de la media, pero sólo después de obtener el promedio

de los 600 valores individuales. En aras de la sencillez, debemos

sacrificar la precisión.

Media Aritmética

Page 4: Presentacion Modulo 05

4

Page 5: Presentacion Modulo 05

5

Para encontrar la media aritmética de datos agrupados,

primero calculamos el punto medio de cada clase. Para

lograr que los puntos medios queden en cifras cerradas,

redondeamos las cantidades. Así, por ejemplo, el punto

medio de la primera clase, 24.995, se convierte en 25.00.

Después multiplicamos cada punto medio por la frecuencia

de las observaciones de dicha clase, sumamos todos los

resultados y dividimos esta suma entre el número total de

observaciones de la muestra. La fórmula es la siguiente:

Page 6: Presentacion Modulo 05

6

𝑥 = media de la muestra

∑ = símbolo que significa “la suma de”

f = frecuencia (número de observaciones) de

cada clase

x = punto medio de cada clase en la muestra

Page 7: Presentacion Modulo 05

7

En la siguiente tabla se ilustra cómo calcular la media

aritmética de una colección de datos agrupados.

En nuestra muestra de 600 clientes, el saldo mensual

promedio de las cuentas de cheques es $142.25. Ésta es la

aproximación hecha a partir de la distribución de

frecuencias. Observe que, como no conocemos cada uno

de los datos puntuales de la muestra, suponemos que

todos los valores de una clase son iguales a su punto

medio. Nuestros resultados, entonces, son sólo una

aproximación del promedio del saldo mensual real.

Page 8: Presentacion Modulo 05

8

Page 9: Presentacion Modulo 05

Mediana

9

A menudo, tenemos acceso a los datos hasta después de

agruparlos en una distribución de frecuencias.

Por ejemplo, no conocemos todas las observaciones que

llevaron a la tabla que contiene datos acerca de los 600

clientes bancarios. En este caso, tenemos 10 intervalos de

clase y un registro de las frecuencias con las que aparecen

las observaciones en cada intervalo. No obstante, podemos

calcular la mediana del saldo de las cuentas de cheques de

estos 600 clientes determinando cuál de los 10 intervalos

de clase contiene la mediana.

Page 10: Presentacion Modulo 05

10

Page 11: Presentacion Modulo 05

11

Para calcular cual de los intervalos de clase contiene la mediana,

debemos sumar las frecuencias que aparecen en la columna de

frecuencias de la tabla hasta que lleguemos al elemento número (n

+ 1)/2. Como tenemos 600 cuentas, el valor para (n + 1)/2 es

300.5 (el promedio de los números 300 y 301). El problema

consiste en encontrar los intervalos de clase que contengan a los

elementos número 300 y 301. La frecuencia acumulada para las

dos primeras clases es sólo 78 123 201. Pero cuando tomamos en

cuenta al tercer intervalo de clase y sumamos 187 elementos a los

201 acumulados, tendremos un total de 388. En consecuencia, las

observaciones número 300 y 301 deben estar en esta tercera clase

(el intervalo de $100.00 a $149.99).

Page 12: Presentacion Modulo 05

12

𝑚 = mediana de la muestra

n = número total de elementos de la distribución

F = suma de todas las frecuencias de clase hasta, pero sin

incluir, la clase de la mediana

fm = frecuencia de la clase de la mediana

w = ancho de intervalo de clase

Lm = límite inferior del intervalo de clase de la mediana

Page 13: Presentacion Modulo 05

13

Page 14: Presentacion Modulo 05

Moda

14

Cuando los datos ya se encuentran agrupados en

una distribución de frecuencias, podemos

suponer que la moda está localizada en la clase

que contiene el mayor número de elementos, es

decir, en la clase que tiene la mayor frecuencia.

Para determinar un solo valor para la moda a

partir de esta clase modal, utilizamos la

ecuación.

Page 15: Presentacion Modulo 05

15

LM0= límite inferior de la clase modal

d1=frecuencia de la clase modal menos la frecuencia de

la clase que se encuentra inmediatamente menor que

ella

d2= frecuencia de la clase modal menos la frecuencia

de la clase inmediatamente mayor que ella

w =ancho del intervalo de la clase modal

Page 16: Presentacion Modulo 05

16