Medidas de tendencia central y dispercion

Post on 07-Jul-2015

5.901 views 3 download

Transcript of Medidas de tendencia central y dispercion

Caracterización de variables

cuantitativas

José David Ojeda

Datos no agrupados

Medidas de tendencia central

Medidas de tendencia central

1. El diagrama de dispersiónEs la representación de los datos en la recta numérica mediante puntos.Ejemplo: A continuación se relacionan las cantidades de artículos vendidos en una tienda de computadores durante 15 días.25, 32, 20, 21, 29, 26, 30, 25, 19, 22, 17, 28, 30, 21, 40.

1. El diagrama de dispersión• Elaborar un diagrama de dispersión y

analizarlo.

En la gráfica se puede observar que la mayoría de los datos, exceptuando el dato 40, se encuentran cercanos entre si. Es decir que el numero de artículos vendidos fue muy parecido en 14 de los 15 días.

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Medidas de tendencia central2. La Media:

La media aritmética o promedio se representa por y se interpreta como el individuo típico de la población:

1 2 31 ,n

ini

X X X X XXn n

= + + …= =

X

2. La Media:• Ejemplo: El jefe de recursos humanos de

una empresa esta interesado en determinar el numero medio de cigarrillo que consumen los trabajadores en un día. Para ello pregunto a 16 empleados por la cantidad de cigarrillos que fumaron ese día, los resultados fueron:

• 3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 0Calcular el numero promedio de cigarrillos que consume un trabajador.

2. La Media:• Solución: Calculamos la media aritmética

El numero de medio de cigarrillos que consume un trabajador en un día es de tres. Se espera que al escoger al azar un empleado de la empresa, fume alrededor de 3 cigarrillos

3 1 4 7 6 7 0 4 6 2 3 1 0 2 2 016

X + + + + + + + + + + + + + + +=

48 316

X = =

Medidas de tendencia central3. La Mediana:

Es el dato que divide un grupo de datos en dos partes iguales. Se simboliza .Para calcular la mediana es necesario ordenar los datos de menor a mayor, una vez ordenados se ubica el valor que esta en el centro de ellos.

3. La Mediana:• En el calculo de la media se pueden

presentar dos casos:• Caro 1: Numero de datos impar: En este

caso se suma 1 a la cantidad de datos y se divide entre 2. La mediana será el dato que esta en esa posición.Por ejemplo si se tienen 11 datos, la media estará en la posición

luego de ordenar los datos.11 1 62+ =

3. La Mediana:• Ejemplo: Un biólogo desea probar que el

diámetro del tronco de un árbol influye en la producción de oxigeno para ello hace la medición del diámetro de 7 arboles en centímetros:110, 79, 128, 161, 158, 175, 50.Calcular la mediana de los diámetros de tronco.

3. La Mediana:• Solución:

Ordenamos los datos de menor a mayor50, 79, 110, 128, 158, 161, 175

Se concluye que el 50% de los diámetros de tronco son iguales o superior a 128.

47 12

128x x + ÷

= = =

3. La Mediana:• Caso 2: Numero de datos par: Se divide

el total de datos entre 2. Se toma el dato que esta en esa posición y el dato siguiente, la mediana será el promedio de estos dos datos.

3. La Mediana:• Ejemplo 2: En un simulacro se midió el

tiempo de reacción de seis patrullas de policías luego de recibir una llamada de emergencia. Los resultados en minutos fueron:

6,0 5,99 5,41 5,44 5,21 5,48Calcular la mediana de los tiempos de reacción.

• Solución: Ordenamos los datos de menor a mayor.

3. La Mediana:5,21 5,41 5,44 5,48 5,99 6,0

Se puede concluir que el 50% de las patrullas llegaron en 5,46 minutos o menos.

6 6 12 2 3 4 5,44 5, 48 5, 46

2 2 2

x xx x

+ ÷ ÷

++ += = = =

Medidas de Dispersión

Medidas de Dispersión

Medidas de Dispersión

Medidas de Dispersión

=

−=

∑ 2

2 1( )

1

n

ii

x XS

n

Medidas de Dispersión• Ejemplo: El entrenador de un equipo de

futbol pregunto a los jugadores sobre el tiempo en horas que dedican al entrenamiento por semana. Los resultados fueron:

5, 5, 6, 8, 7, 7, 9, 5, 6, 8, 4, 11, 6, 10, 8.Solución: Hallamos la media de los datos

+ + + + + + + + + + + + + += 5 5 6 8 7 7 9 5 6 8 4 11 6 10 815

X

= =10515

7X

Medidas de Dispersión• Hallamos la desviación de cada uno de los

datos con respecto a la media y su cuadrado.

• Teniendo en cuenta la tabla anterior, la varianza es:

+ + + + + + + + + + + + + +−

=2 4 4 1 1 0 0 4 4 1 1 9 16 1 9 115 1

S

==2 25614

4 HorasS

Medidas de Dispersión3. Desviación Estándar

Se nota como S, y es la raíz cuadrada de la varianza

La desviación estándar se utiliza para interpretar el comportamiento de los datos y la representatividad del promedio

=

−= =

∑ 2

2 1( )

1

n

ii

x XS S

n

Medidas de Dispersión• La varianza al ser sumada y restada dos

veces a la media, proporciona un intervalo en el cual se encuentra el 95% de los datos, este intervalo se denomina intervalo de extremos :

• Si este intervalo es muy grande, se dice que el promedio no representa bien a los datos. En el caso contrario se dirá que el promedio es un buen representante de los datos.

− + 2 , 2X s X s

Medidas de Dispersión• Para el ejemplo del equipo de futbol la

desviación estándar sería:

• Construimos el intervalo de extremos:

Se observa que los datos están muy alejados entre si, ya que el 95% de los futbolistas entrena entre 3 y 11 horas semanales.

= == 2 2 2 Horas4 HorasSS

− + = = − +7 2(2) 2 , 2 3, 7 2(2) , 11X s X s

Medidas de Dispersión• Ejemplo: A continuación se muestran las

edades de 20 pacientes del pabellón de adultos del Hospital General55, 78, 50, 41, 55, 35, 41, 42, 51, 54, 41, 54, 72, 76, 75, 47, 62, 59, 75, 46.

• Caracterizar la variable utilizando la media, el rango, la varianza y la desviación estándar y el intervalo de extremos.

Medidas de Dispersión1). Hallamos la media

2). Hallamos el rango

+ + + + + + + + + + + + + + + + + + += 55 78 50 41 55 35 41 42 51 54 41 54 72 76 75 47 62 59 75 4620

X

= =110920

55,45X

= −

= −=

78 3543

Mayor MenorRango D DRangoRango

Medidas de Dispersión3). Hallamos la VarianzaEn la siguiente tabla hallamos la desviación de cada dato y el cuadrado de estaDato 55 78 50 41 55 35 41 42 51 54

Desviación -0,45 22,55 -5,45 -14,45 -0,45 -20,45 -14,45 -13,45 -4,45 -1,45

Cuad. Des.

0,203 508,5 29,7 208,8 0,203 418,2 208,8 180,9 19,8 2,103

Dato 41 54 72 76 75 47 62 59 75 46

Desviación -14,45 -1,45 16,55 20,55 19,55 -8,45 6,55 3,55 19,55 -9,45

Cuad. Des.

208,8 2,103 273,9 422,3 382,2 71,4 42,9 12,6 382,2 89,3

Medidas de Dispersión• Utilizando los resultados de la tabla

anterior, hallamos la varianza:

4). Hallamos la Desviación Estándar:

+ + + + ==−

2 20,203 508,5 29,7 ... 89,320 1

182,36 añosS

= == 2 2182,36 añ 13,5 os añosS S

Medidas de Dispersión5). Hallamos el intervalo de extremos

Dentro de este intervalo se encuentra el 95% de los datos, como el intervalo es muy grande, aproximadamente de 28 a 83 años, la variabilidad es muy alta.Las edades de los pacientes son entonces muy heterogéneas, la media no representa bien los datos

− + − + =

=

55,45 2(13,5) 55,45 2(13,5)

2 , 2 ,

28, , 45 82,45

X s X s