Entrega cincocompendio

50
1. Establecer las diferentes fórmulas que llevan al cálculo de las medidas de tendencia central 2. Buscar la aplicabilidad y sensibilidad de cada una de las medidas de tendencia central. 3. Hacer cálculo de todas las medidas de tendencia central con las diferentes tipos de datos. 4. Hacer uso de R, para el cálculo de las medidas de tendencia central.

Transcript of Entrega cincocompendio

Page 1: Entrega cincocompendio

1. Establecer las diferentes fórmulas que llevan al cálculo

de las medidas de tendencia central

2. Buscar la aplicabilidad y sensibilidad de cada una de

las medidas de tendencia central.

3. Hacer cálculo de todas las medidas de tendencia

central con las diferentes tipos de datos.

4. Hacer uso de R, para el cálculo de las medidas de

tendencia central.

5. Hacer uso de R para el grafico de cuartiles mediante

las cajas de bigotes (Boxplot)

Page 2: Entrega cincocompendio

MEDIDAS DE TENDENCIA CENTRAL

Lo que hasta ahora se ha hecho se redujo a resúmenes de la

información en tablas de frecuencias y sus correspondientes clases de

frecuencias así como sus representaciones gráficas.

Con Las medidas de tendencia central, pondremos nuestra atención en

hacer resúmenes numéricos porque mediante unos resultados tienden a

localizarse en el centro de la información, el resultado o parámetro

describe al grupo en su totalidad.

Estos resúmenes numéricos representan simplificaciones de los datos

que por ser resúmenes dejaran por fuera la mayor parte de los detalles y

se quedan sólo con lo más general que tienen los datos.

EJEMPLO:

Si se desea conocer el rendimiento académico de un grupo de

estudiantes entonces se puede calcular el promedio. Con esta medida

representativa se puede afirmar en forma aproximada como es el

rendimiento académico de todo el grupo.

Algunas de las medidas de tendencia central son:

1. Media

Media aritmética

Media geométrica

2. Mediana

Cuartiles

Déciles

Page 3: Entrega cincocompendio

Percentiles

3. Moda

MEDIA ARITMÉTICA:

El principal resumen que se puede hacer de una colección de datos es el

promedio al que llamaremos media aritmética. Su cálculo se basa en

la magnitud de los datos

Aunque es una medida de cálculo sencillo la información brindada por el

número por si sola no es del todo confiable, dice poco de la distribución

de los datos. Por ejemplo si decimos que el rendimiento académico de

un grupo es de 2 y lo clasificamos como insuficiente, individualmente

existirán estudiantes que superaron el logro y la valoración de 2. Así

como existen estudiantes por debajo de esta valoración. La media

aritmética es un resumen muy bueno, pero no da los detalles. El cálculo

de la media aritmética depende de la forma como este dada la

distribución de los datos, por eso el cálculo se lo hace de dos formas

diferentes:

1. MEDIA PARA DATOS NO AGRUPADOS:

Se calcula sumando todos los datos y dividiendo por el número total de

ellos.

Sean X1, X2, X3,…Xn datos no agrupados de una distribución numérica.

Entonces la media se calcula mediante la expresión

X=∑i=1

n

X i

n

Page 4: Entrega cincocompendio

EJEMPLO:

El pagador del colegio desea calcular el promedio de 7 facturas pagadas

por adquisición de material de oficina en el mes de agosto y tienen

como montos:

12, 235, 318, 15, 616, 325, 212

Utilizando la formula X=

∑i=1

n

X i

n se obtiene

X=12+235+318+15+616+325+2127 = 247,57

El número 247.57, representa el precio promedio que se ha pagado en el

mes de agosto por material de oficina.

Si los datos enteros son pocos y se pueden ordenar en una tabla de

frecuencias absolutas entonces la media se puede calcular mediante la

expresión:

EJEMPLO:

Un Profesor de geografía tiene registrado en su informe de logros la

información de 20 estudiantes con los siguientes resultados.

X=∑i=1

n

X i∗f

n

Page 5: Entrega cincocompendio

E S A S D I A S E D

A I S E D A S A D I

Los datos de los logros obtenidos se pueden registrar en la siguiente

tabla.

Haciendo uso de la expresión X=

∑i=1

n

X i∗f

n , se obtiene el siguiente resultado.

X=1∗4+2∗3+3∗5+4∗5+5∗320

=6020 = 3

De este resultado podemos decir que el rendimiento académico del

grupo en el área de geografía es aceptable.

MEDIA PARA DATOS AGRUPADOS:

Hace referencia a la media calculada para los datos organizados en una

distribución de frecuencias, que por lo general corresponden a datos de

tipo continuo, y en una cantidad que exceden a 20 datos. Para el cálculo

de la media para datos agrupados definamos primero que es una marca

de clase

MARCAS DE CLASE:

Logros

No de estudiantes

fDIASE

12345

43553

Page 6: Entrega cincocompendio

Es el punto medio de cada intervalo de clase, la denotaremos como X i ..

Sea [a b] los datos en el intervalo de clase, entonces la marca de clase

se define como:

Con la marca de clase definimos la media para datos agrupados como

sigue:

EJEMPLO:

Determine la edad promedio, en el grado once de un colegio, si los

estudiantes presentan las siguientes edades:

18 18 17 15 16 20 23 21 25 17

16 21 22 19 21 24 19 22 21 16

15 19 21 22 15 24 18 16 19 20

Construimos primero las condiciones necesarias para armar los

intervalos de clase.

R = Xmax – Xmin = 25 – 15 = 10

Corre por ahí el chiste de que si en un salón

hay más o menos la misma cantidad de niños

que de niñas, ¿cuál es el género del alumno

promedio?

Xi =

a+b2

X =

∑i=1

n

Xi∗f

n

Page 7: Entrega cincocompendio

m = 1 + 3,3 log(30) = 1 + 3,3*(1,47) = 5,85 6 por Exceso, 5 por

defecto.

C =

106 2

Rango = C * m = 2*6 = 12

Diferencia: 12 – 10 = 2

Xmin - 1 = 14

Xmax + 1 = 26

Con los resultados de la tabla ya se puede hacer el cálculo de la media.

X =

584 ,130

=19

La edad promedio de los alumnos del grado once es de: 19 años.

SUBMUESTRAS:

Si se quiere dividir la muestra total de una población en varias

submuestras y se hace necesario el cálculo total de la media entonces

se recurre a la siguiente formula.

Edades f xi f* xi

14.5 _ 16

16,5 _ 18

18,5 _ 20

20,5 _ 22

22.5 _ 24

24.5 _ 26

7

5

6

8

3

1

15

17

19

21

23

25

105

85

114

168

69

25

30 566

Page 8: Entrega cincocompendio

Donde

EJEMPLO:

Una empresa de juegos mecánicos ha extendido una invitación a

diferentes colegios de la ciudad. Debido a situaciones técnicas y para

protección y satisfacción de los estudiantes en algunos juegos, La

empresa hace descuentos del 50% bajo los siguientes requerimientos

Se deben formar grupos de mujeres y hombres por separado.

1. Las estaturas de los hombres en promedio no deben superar los

170 cms

2. Las estaturas de las mujeres en promedio no deben superar los

165 cms.

3. El promedio total de las estaturas para todos los estudiantes

invitados debe ser de 168 cms

Un docente encargado en uno de los colegios invitados escogió al azar

50 estudiantes, 30 hombres, y 20 mujeres, los datos se especifican

abajo.

Mujeres Hombres

160 145 170 175 130 140 175 180 142 145

X=X1∗n1+X2∗n2+X3∗n3+.. .. . .+Xn∗nn

n

n = n1 + n2 + ...+

nn

Page 9: Entrega cincocompendio

145 169 171 143 144 178 145 155 168 166

149 157 173 143 138 165 156 158 170 173

139 150 157 135 148 152 172 165 134 154

143 128 137 171 124

145 153 180 172 153

Será que todo el grupo puede asistir a los juegos mecánicos con el

descuento del 50%?.

La edad total promedio las calculamos mediante la expresión

X=X1∗n1+X2∗n2+X3∗n3+.. .. . .+Xn∗nn

n

Entonces

X=152∗20+157∗3050 = 155

Los requerimientos dados por la empresa se cumplen por tanto todos los

niños escogidos por el profesor pueden asistir a disfrutar de los juegos

mecánicos con un descuento del 50%..

PROPIEDADES DE LA MEDIA ARITMÉTICA:

1. La media es única

2. El cálculo de la media es sencillo y de fácil comprensión

3. Cuando existen datos extremos suficientemente distantes de la

mayoría de los datos la media no es una medida muy confiable.

PROBLEMA PARA RESOLVER

Page 10: Entrega cincocompendio

1. La siguiente tabla muestra las diferentes actividades realizados por

diferentes personas en una institución educativa de la ciudad y su

correspondiente asignación salarial.

a. Encontrar el salario promedio

b. Si se conviene reconocerles $70 diarios de aumento, cual es el nuevo

salario promedio?

Trabajadores No Salarios

Rector

Secretarias

Coordinadores

Docentes

Celadores

Aseadoras

1

4

2

45

3

4

2’000.0

00

750.000

1’500.0

00

1’200.0

00

600.000

450.000

2. Cuatro grupos de estudiantes consistentes en 15, 20, 10 y 18,

individuos, dieron pesos medios de 162, 148, 153, y 140 lb,

respectivamente. Hallar el peso medio de todos los estudiantes.

3. Los siguientes datos representan las notas definitivas de 45

estudiantes en un curso de estadística aplicada.

4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.0

3.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.4

3.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.6

3.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.1

2.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4

Page 11: Entrega cincocompendio

a. Encuentre la nota promedio del grupo.

b. El resultado de la media puede asegurar con certeza el

rendimiento académico del grupo?

c. Si las dos primeras filas de los datos representan las notas de

estudiantes de sexo femenino, calcule las medias de los hombres

y de las mujeres.

d. Con la media de los hombres y de las mujeres calcule la media

total.

e. Compare el resultado anterior con el resultado encontrado en el

primer punto.

MEDIA GEOMETRICA:

Existen algunos datos que tienen comportamientos crecientes o

decrecientes en forma infinita y que por tanto el promedio dado por la

media aritmética tendría mucho margen de error. Para ello se recurre al

cálculo de la media geométrica.

EJEMPLOS:

1. Crecimiento de número de enfermos de SIDA.

2. Crecimiento poblacional

3. Crecimiento de la pobreza en el mundo

4. Crecimiento de plagas y bacterias en cultivos.

La media geométrica para datos no agrupados se define mediante la

expresión.

Mg =

n√X1∗X2∗X3∗.. . Xn

Page 12: Entrega cincocompendio

Apliquemos la expresión para la siguiente serie de números.

2, 4, 8, 16.

Mg = 4√2∗4∗8∗16 =

4√1024 = 5,66

Haciendo uso de los logaritmos y sus propiedades se llega a la siguiente

formula:

La media geométrica para datos

agrupados se calcula mediante la

expresión.

Haciendo uso de los logaritmos y sus propiedades la formula se puede

expresar mediante la expresión.

La demostración matemática de la anterior expresión es sencilla y se

deja al estudiante como ejercicio, ella le permitirá recordar las

propiedades y la definición de logaritmo.

Para aplicaciones prácticas de medias geométricas se suele recurrir a las

aplicaciones de las progresiones geométricas en las que se definen los

conceptos de interés simple y de interés compuesto.

Mg =

AntiLog(∑i=1

n

LogX i

n)

Mg =

n√X1f 1∗X

2f2¿ X

3f3¿ .. .∗X

nfn

Mg =

Anti log(∑i=1

n

fi*log Xi

n)

Page 13: Entrega cincocompendio

INTERES SIMPLE:

Se conoce como interés simple el interés que se cobra únicamente sobre

el capital dado en préstamos y no sobre los intereses producidos por el

mismo. Se calcula mediante la expresión

INTERÉS COMPUESTO:

Consiste en sumar periódicamente los intereses mas el capital. Se

calcula mediante la expresión.

EJEMPLOS:

1. Un profesor solicita un préstamo a un banco, de $ 10`000.000 al 12%

de interés anual. Para que sea descontado por nomina. ¿Cuánto pagara

el profesor al final de tres años?

CT = Monto total

Co = Monto inicial = $ 10’000.000

i = Tasa de interés anual = 12% = 0.12

n = Tiempo en años = 3

CT = 10’.000.000(1+ 0.12)3

CT = $14’ 049.280

Al final de los tres años el profesor pagara $ $14’ 049.280

CTotal = C0 (1 +

i)n

In = C0 ( 1+ i )n-1 *

i

Page 14: Entrega cincocompendio

2. Al comienzo de cada año escolar los padres de familia siempre en

forma inútil manifiestan el alza en útiles escolares. Doña Maria una

madre de familia manifiesta que hace 4 años la misma lista para su hijo

mayor era de $150.000, para este año la lista que le han dado para su

hijo menor tiene un valor de $300.000. Cual fue el promedio de

incremento anual?

Co = $150.000

CT = $300.000

n = 4 años

i = ?

De la expresión CTotal = C0 (1 + i)n despejemos i.

CTCo = ( 1+ i ) n ;

1 + i =

n√CTCn ; finalmente obtenemos una expresión para i

i =

n√CTCn - 1

Aplicando los datos en la expresión antes encontrada obtenemos el

resultado final

i =

n√CTCn - 1 =

4√300 .000150 .000

−1 = 1,189 - 1 = 0.189 = 18. 9%

18.9 % Corresponde al alza anual de los textos escolares en el mercado.

MEDIANA:

Page 15: Entrega cincocompendio

Determina la posición central que ocupa un dato en el orden de su

magnitud, dividiendo la información en dos partes iguales, dejando igual

número de datos por encima y por debajo de ella.

MEDIANA PARA DATOS NO AGRUPADOS:

Si los datos no están agrupados y la distribución de datos es impar,

entonces la mediana es el dato central.

Si el número de datos es impar, el dato central de la distribución

organizada en forma ascendente o descendente es la mediana.

X1, X2, X3, X4, ... , Xn n Impar

Me= Xi , donde Xi representa el dato central

Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.

X1, X2, X3, X4, ... , Xn n par

Me=

X i+X j2 , donde Xi, Xj representan Los datos centrales

EJEMPLO:

1. Las notas de un estudiante de una universidad en 5 exámenes

corresponden a:

5,0 1,5 3,8 4,1 2,2,

Calcule la mediana de las notas.

Organizamos las notas en orden ascendente o descendente

1,5 2,2 3,8 4,1 5,0

Page 16: Entrega cincocompendio

Me = 3,8

Significa que la mitad de las notas del estudiantes esta por debajo de

3,8 y la otra mitad están por encima de este valor.

2. Supongamos que el estudiante conoce ahora otra nota

correspondiente a otra asignatura. La distribución de datos es par:

5,0 1,5 3,8 4,1 2,2 3,2

Si organizamos nuevamente los datos

1,5 2,2 3,2 3,8 4,1 5,0

La mediana corresponde a:

Me =

3. 2+3 . 82 = 3.5

El 50% de las notas están por debajo de 3.5. 4. La siguiente tabla muestra el Consumo mensual de agua, en m3, de

una escuela pública, encuentre la mediana de la distribución.

Enero = 10, . . . . Mayo = 14, . . . . Septiembre =

18,

Febrero =12, Junio = 19, Octubre = 22,Marzo = 15, Julio = 17, Noviembre =15,Abril = 18, Agosto = 18, Diciembre = 13

X1= 10 X2=12 X3 =13 X4=14 X5= 15 X6=15

X7=17 X8 =18 X9 = 18 X10 = 18 X11 = 19 X12

= 22

Me =

X6+X7

2 =

15+172 =16,

Page 17: Entrega cincocompendio

La mitad del consumo del agua en la escuela está por debajo de 16 m3,

y por encima de 16 m3 de consumo al año

MEDIANA PARA DATOS AGRUPADOS:

La mediana para datos agrupados se encuentra mediante la fórmula:

Dónde:

Li = Limite real inferior a la clase mediana

n = Es el tamaño de la muestra o población

Fa = Frecuencia acumulada anterior a la clase mediana.

C = Ancho del intervalo

f= Frecuencia observada en la clase mediana

CLASE MEDIANA:

Se entiende por clase mediana al primer intervalo de clase que contiene

en las frecuencias acumuladas el valor de n /2, siempre que el número

de intervalos sea par, de lo contrario la clase mediana es el intervalo

central.

EJEMPLO:

Las notas de 40 estudiantes están resumidas en la siguiente tabla. Se

pide determinar el valor de la mediana.

Me= Li +

( n2−Fa

f )∗C

Page 18: Entrega cincocompendio

Li = Limite real inferior a la clase mediana = 2

n = Es el tamaño de la muestra o población = 40

Fa = Frecuencia acumulada anterior a la clase mediana. = 7

C = Ancho del intervalo = 1

f= 5

La clase mediana se ha señalado con rojo, resultado de dividir la

muestra de 40 estudiantes en 2 y de haber ubicado en las frecuencias

acumuladas el primer valor que contenga a esta división.

Utilizando la formula anterior y reemplazando, obtenemos.

Me= Li + ( n2−Fa

f )∗CLi = 2 + (

20−75 )*1 = 2 + (13/5) = 3,03 =3

El 50% de los estudiantes tienen notas inferior a 3 y el 50 % tiene notas

superiores a 3, podemos afirmar entonces que el rendimiento académico

del grupo es bueno?

LOS CUANTILES:

Son medidas derivadas de la mediana, e intentan medir en valores de

proporción más pequeña que la mediana misma a una muestra. Los

cuantiles se dividen en:

1. Cuartiles

Notas f F

0 _ 11 _ 22 _ 33 _ 44 _ 5

2551513

27122740

40

Page 19: Entrega cincocompendio

2. Deciles

3. Percentiles

4. Quintiles

CUARTILES:

Los cuartiles son valores posiciónales. Son medidas de tendencia

central que dividen la distribución de datos en cuatro partes iguales.

Muestra la importancia de la cuarta parte de la muestra analizada. Se

simboliza con Q.

El primer cuartil deja el 25% de la información por debajo de él, y el 75%

por encima, el segundo cuartil, al igual que la mediana, divide la

información en dos partes iguales, y por último el tercer cuartil deja el

75% por debajo de sí, y el 25% por encima.

Gráficamente:

Se necesita, entonces calcular tres cuartillas ya que la cuarta queda

automáticamente determinada.

Su cálculo se deduce de la fórmula que en forma general se expresa así:

QJK =

Li+( k∗n4−Fa

fo )∗c

0% 25% 50% 75%

Page 20: Entrega cincocompendio

De esta expresión podemos encontrar los cuartiles.

CUARTIL 1: Q1

Representa el 25% de la muestra tomada. Por encima de este valor esta

el 75% de los valores de una distribución.

Se obtiene de la expresión anterior cuando K= 1

CUARTIL 2: Q2

Se obtiene cuando K = 2; representa el 50% de la muestra tomada. Por

encima de este valor esta el 50% de los valores de una distribución.

Si observamos la deducción de la formula deducimos que el cuartil 2

representa la mediana.

CUARTIL 3: Q3

Se obtiene cuando K = 3; representa el 75% de la muestra tomada. Por

debajo de este valor esta el 25% de los valores de una distribución.

Q1 =

Li+( n4−Fa

fo )∗c

Q2 =

Li+( 2∗n4

−Fa

fo )∗c=Li+( n2−Fa

fo )∗c

Q3 =

Li+( 3∗n4

−Fa

fo )∗c

Page 21: Entrega cincocompendio

DECILES:

Se definen como la medida de tendencia central que divide la

distribución de datos en diez partes iguales. Muestra la importancia de

la décima parte de la muestra analizada. Se simboliza con D.

Su cálculo se deduce de la fórmula que en forma general se expresa así:

El cálculo de cualquiera de los nueve deciles se calculan haciendo uso

de la formula anterior.

EJEMPLO:

para un caso especial se requiere el cálculo de los deciles 7 y 3. Las

expresiones para los deciles mencionados serian:

PERCENTILES:

Se definen como la medida de tendencia central que divide la

distribución de datos en cien partes iguales. Muestra la importancia de

la centésima parte de la muestra analizada. Se simboliza con P.

CJK =

Li+( k∗n10−Fa

fo )∗c

D3 =

Li+( 3∗n10

−Fa

fo )∗cD7 =

Li+( 7∗n10

−Fa

fo )∗c

Page 22: Entrega cincocompendio

Su cálculo se deduce de la fórmula que en forma general se expresa así:

PJK =

Li+( k∗n100−Fa

fo )∗c

Page 23: Entrega cincocompendio

EJEMPLO:

Para un caso especial se requiere el cálculo de los percentiles 70 y 40.

Las expresiones para los deciles mencionados serian:

EJEMPLO DE APLICACIÓN:

La secretaria de educación está implementando un estudio sobre la

asignación salarial de los docentes del departamento con el objetivo de

promover un plan de vivienda. Para llegar a conclusiones precisas los

encargados del estudio han elaborado una encuesta que consta de 10

preguntas a una muestra de 200 profesores de todos los municipios. Dos

de las 10 preguntas estaban redactadas así:

1. Cuál es su grado de escalafón? _____

2. Su asignación salarial (En miles de pesos) de acuerdo a su grado de

escalafón se ubica en los siguientes rangos.

a. 500 _ 700 ______

P40 =

Li+( 40∗n100

−Fa

fo )∗c=

Li+( 2∗n5

−Fa

fo )∗c

P70=

Li+( 70∗n100

−Fa

fo )∗c=Li+( 7∗n10

−Fa

fo )∗c

Page 24: Entrega cincocompendio

b. 700 _ 900 ______

c. 900 _ 1100 ______

d. 1100 _ 1300 ______

e. 1300 _ 1500 ______

f. 1500 _ 1800

Los resultados de las encuestas para la primera pregunta se resumen en

la siguiente tabla.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 31 2 3 4 5 6 7 8 9 10 11 12 13 14 21 2 3 4 5 6 7 8 9 10 11 12 13 1 21 2 3 4 5 6 7 8 9 10 11 12 2 1 21 2 3 4 5 6 7 8 9 10 1 12 2 1 21 2 3 4 5 6 7 8 9 9 1 12 2 1 21 2 3 4 3 6 7 9 9 9 1 12 3 1 21 2 3 2 3 6 2 9 9 3 12 12 3 1 9

Haciendo uso de R, Calcular las medidas cuantiles para datos no

agrupados, realizar gráficos Boxplot.

Solución:

Los datos se organizaron en un archivo txt, denominado “Escalafon.txt”

y se grabó en la carpeta de trabajo. En el entorno de R se ha

direccionado, direccionando hacia la carpeta en donde se encuentra el

archivo. Las siguientes líneas hacen llamado de los datos.

datos=read.table("Escalafon.txt")

attach(datos)

Page 25: Entrega cincocompendio

datos

Veamos un resumen de las medidas cuantiles

summary(datos)

Min. : 1.00 1st Qu.: 3.00 Median : 6.00 Mean : 6.34 3rd Qu.: 9.00 Max. :14.00

De inmediato se obtienen los cuartiles de la distribución, además del

valor mínimo, máximo y el promedio. Para este caso el promedio se

requiere redondearlo ya que se está considerando los grados de

escalafón como datos enteros, por tanto:

X=6

Las medidas cuartiles se pueden representar mediante la caja de

bigotes o los Boxplot

La grafica se obtiene mediante los comandos

boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de

docentes")

Una representación con mejor presentación se obtiene mediante la

codificación

Page 26: Entrega cincocompendio

boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon",

xlab="Docentes")

Para reconocer las demás medidas cuantiles en R, se requiere tener los

datos como un vector, veamos un ejemplo para un número determinado

de datos extraído de la información obtenida en el grupo de los 200

docentes entrevistados

datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,

2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)

quantile(datos1, prob = seq(0, 1, length = 11), type = 5)

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0

quantile(datos1)

0% 25% 50% 75% 100% 1.00 3.75 7.50 10.25 14.00

quantile(datos1, prob = c(0.15, 0.25, 0.35))

15% 25% 35% 2.05 3.75 5.00

Page 27: Entrega cincocompendio

Los resultados de la encuesta para la segunda pregunta se muestran en

la siguiente tabla.

Los encuestadores conocedores de las medidas cuantíles calcularon Q1,

Q3, D3, D8, P10, P60, P70 y tomaron sus respectivas conclusiones.

Antes de proceder al cálculo de los cuantíles elaboraron una tabla de

frecuencias.

a. Para calcular el cuartil uno partimos de la expresión Q1 =

Salarios No de

docentes

500 _ 700 30

700 _ 900 75

900 _ 1100 35

1100 _ 1300 20

1300 _ 1500 25

1300 _ 1800 15

TOTAL 200

Salarios f F

500 _ 700 30 30

700 _ 900 75 105

900 _ 1100 35 140

1100 _ 1300 20 160

1300 _ 1500 25 185

1300 _ 1800 15 200

TOTAL 200

Page 28: Entrega cincocompendio

Li+( n4−Fa

fo )∗C. De la expresión

n4 =

2004 = 50, sabemos que las

operaciones se harán en el segundo intervalo ya que en las frecuencias

acumuladas el valor de 50 queda perfectamente contenido en 105.

Por tanto:

Li = 700

n4 = 50 Q1 =

Li+( n4−Fa

fo )∗C. = 700 +

(50−3075 )

*200 = 753.333

Fa = 30 Lo que indica que el 25 % de los docentes entrevistados

ganan

fo = 75 salarios medios correspondientes a $753.333.

C = 200

b. Para calcular el cuartil tres partimos de la expresión Q3 =

Li+( 3n4

−Fa

fo )∗C. De la expresión

3n4 =

6004 = 150, sabemos que las

operaciones se harán en el quinto intervalo ya que en las frecuencias

acumuladas el valor de 150 queda perfectamente contenido en 185.

Por tanto:

Li = 1300

3n4 = 150 Q3 =

Li+( 3n4

−Fa

fo )∗C. = 1300 +

(150−16025 )

*200 =

1’220.000

Page 29: Entrega cincocompendio

Fa = 160 Lo que indica que el 75 % de los docentes entrevistados

ganan

fo = 25 salarios medios correspondientes a $1’220.000.

C = 200

d. Para calcular el decil tres partimos de la expresión D3 =

Li+( 3n10

−Fa

fo )∗C. De la expresión

3n10 =

60010 = 60, sabemos que las

operaciones se harán en el segundo intervalo ya que en las frecuencias

acumuladas el valor de 60 queda perfectamente contenido en 105.

Li = 700

3n10 = 60 D3 =

Li+( 3n10

−Fa

fo )∗C. = 700 +

(60−3075 )

*200 = $

780.000

Fa = 30 Lo que indica que el 30 % de los docentes entrevistados

ganan

fo = 75 salarios medios correspondientes a $780.000.

C = 200

f. El decil 8 se deja como ejercicio de aplicación.

g. Para calcular el percentil 10 tres partimos de la expresión

P10 =

Li+( n10−Fa

fo )∗C. De la expresión

n10 =

20010 = 20, sabemos que

las operaciones se harán en el primer intervalo ya que en las frecuencias

acumuladas el valor de 20 queda perfectamente contenido en 30.

Page 30: Entrega cincocompendio

Li = 500

n10 = 20 P10 =

Li+( n10−Fa

fo )∗C. = 500 +

(2030 )

*200 = $ 633.333

Fa = 0 Lo que indica que el 10 % de los docentes

entrevistados ganan

fo = 30 salarios medios correspondientes a $633.333

C = 200

Los P60 y P70, se dejan como ejercicio de aplicación.

Gráficos Boxplot

PROPIEDADES DE LA MEDIANA

Entre las propiedades de la mediana, vamos a destacar las siguientes:

1. Es una medida descriptiva que tiene la ventaja de no estar afectada

por las observaciones extremas, ya que no depende de los valores que

toma la variable, sino del orden de las mismas.

2. Es de cálculo rápido y de interpretación sencilla.

3. A diferencia de la media, la mediana de una variable discreta es

siempre un valor de la variable que estudiamos.

3. Si una población está formada por 2 subpoblaciones de medianas

Med1 y Med2, sólo se puede afirmar que la mediana, Med, de la

población está comprendida entre Med1 y Med2

Page 31: Entrega cincocompendio

4. El mayor defecto de la mediana es que tiene unas propiedades

matemáticas complicadas, lo que hace que sea muy difícil de utilizar en

inferencia estadística.

5. Es función de los intervalos escogidos.

6. Puede ser calculada aunque el intervalo inferior o el superior no tenga

límites.

EJERCICIO DE APLICACIÓN

1. Al consejo directivo de un colegio le han llegado las quejas de que los

precios de las comidas y artículos que se venden en la cafetería están

elevados. Para averiguar si el rumor es cierto se tomaron como muestra

algunos artículos encontrándose los siguientes precios.

70 86 75 72 66 90 85 70

72 81 70 75 84 62 66 74

82 75 68 83 81 65 75 70

73 65 82 80 66 73 95

85 84 75 68 80 75 68 72

78 73 72 68 84 75 72 80

Para ayudar al consejo directivo y determinar si el rumor es cierto o

falso realice las siguientes actividades.

Page 32: Entrega cincocompendio

a. Agrupar en intervalos de clase apropiados

b. Determinar el precio promedio de los artículos

c. Determinar la mediana de los artículos

d. Calcule, Q1, Q3, D3, D5, D7, P80, V2, V3, P70.

e. Realice un gráfico de bigotes y su respectivo análisis con las medidas

visualizadas

f. Realice un gráfico de barras

g. Realice un gráfico de ojivas de la distribución.

h. Respecto a las gráficas y las medidas de tendencia central, elabore

una conclusión.

2. En un colegio con modalidad en agropecuaria, el peso en kilogramos

presentado por el departamento de porcicultura en la experimental ABC

viene dado por la tabla.

Pesos Frecuencias

118 _ 126127 _ 135136 _ 144145 _ 153154 _ 162163 _ 171172 _ 180

368

10742

Calcule el valor de la media y la mediana, y realice interpretaciones de

las dos medidas obtenidas.

MODA

Cuando hablamos de histogramas, dijimos que los picos en los

histogramas se llaman modas. Usaremos como moda la marca de la

clase que tenga un pico en el histograma.

La moda es el valor que ocurre con mayor frecuencia en una

distribución de datos

Page 33: Entrega cincocompendio

En un conjunto de datos agrupados o no agrupados pueden existir varias

modas o ninguna. Si existen dos frecuencias con los mayores valores

entonces tendrá dos modas, si todas las frecuencias son iguales,

entonces el conjunto de valores propuestos no tendrá moda.

MODA PARA DATOS NO AGRUPADOS

Simplemente será contar el número de datos y observar su frecuencia.

Por

EJEMPLO.

En un almacén de suministros para partes de computadores se ofrecen

diferentes marcas de impresoras con diferentes valores. (En miles de

pesos) Las ventas en el mes de julio reportaron los siguientes datos.

$250 $300 $320 $250 $400 $250

$300 $310$400 $250

Si ordenamos los valores tenemos la siguiente tabla.

Mo = Moda =3 es la de mayor frecuencia, lo que indica que las

impresoras mas vendidas en julio fueron las impresoras cuyo valor

corresponde a $250000.

Precio

s

f

250

300

310

320

400

3

2

1

1

2

Page 34: Entrega cincocompendio

EJEMPLO 2

Los puntajes de una cierta prueba son los siguientes

15, 17, 19,19, 19, 20, 22, 22, 22, 25, 28, 28, 28, 30.

Calcular para estos datos la moda:

Puntaje

s

f

1517192022252830

11313131

Aquí existen varias modas:

Mo1= 19

Mo2 =22

Mo3 = 28

EJEMPLO 3

En una encuesta realizada en un colegio se pregunta por la asignatura

de mayor aceptación y gusto. Las respuestas brindadas por los

estudiantes arrojaron los siguientes resultados.

ASIGNATURA ESTUDIANTE

S

MATEMÁTIC 5

Page 35: Entrega cincocompendio

AS

ESPAÑOL 5

ESTETICA 5

SOCIALES 5

INLGES 5

BIOLOGIA 5

TOTAL 30

Cuál es la asignatura que se pone de moda de acuerdo a los gustos de

los estudiantes?

Respuesta

Observando en la tabla los registros de los 30 alumnos se puede

determinar que todas las asignaturas tienen la misma aceptación.

Para este caso decimos que la moda no existe, es una distribución

amodal

MODA PARA DATOS AGRUPADOS

Para datos agrupados la moda se calcula utilizando la siguiente formula

Δ1 = fo - fa

Δ2 = fo - fs

Donde:

fo = Frecuencia absoluta observada

Mo = Li + ( Δ1

Δ1+Δ2)

*C

Page 36: Entrega cincocompendio

fs = Frecuencia absoluta siguiente a la observada

fa = Frecuencia absoluta anterior a la observada.

EJEMPLO:

Determine la nota de mayor relevancia en una evaluación de Calculo

Integral realizada a 50 estudiantes de Ingeniería de una universidad de

la capital.

Notas f

0 _ 1

1 _ 2

2 _ 3

3_ 4

4 _ 5

1

5

12

22

10

Utilizando la formula

Antes de utilizar la formula entendamos que la clase modal es el

intervalo de clase que presenta la mayor frecuencia absoluta.

Para nuestro ejemplo la clase modal esta determinado por el intervalo [3

_ 4]

Teniendo en cuenta la clase modal podemos hacer los siguientes

cálculos.

Δ1 = fo – fa = 22 – 12 = 10

Mo = Li + ( Δ1

Δ1+Δ2)

*C

fo

fa

fs

Page 37: Entrega cincocompendio

Δ2 = fo – fs = 22 – 10 =1 2

De aquí:

Mo = 3 + (1010+12 )∗1

= 3.45 = 3.5

La nota de mayor relevancia en el grupo analizado fue de 3.5

PROPIEDADES DE LA MODA

De la moda destacamos las siguientes propiedades:

1. Es muy fácil de calcular.

2. Puede no ser única.

3. Es función de los intervalos elegidos a través de su amplitud, número

y límites de los mismos.

4. Aunque el primero o el último de los intervalos no posean extremos

inferior o superior respectivamente, la moda puede ser calculada.

5. Esta dada solo en términos de las frecuencias absolutas

Page 38: Entrega cincocompendio

EJERCICIOS PARA PRACTICAR

1. Un estudio en las diferentes escuelas y colegio de un país, consistió

en anotar el número de palabras leídas en 15 segundos por un grupo de

120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta

los resultados de la tabla

No de palabras

leídas

Disléxicos Normales

26 24 9

27 16 21

28 12 29

29 10 28

30 2 32

Calcule:

1. Las medias aritméticas de ambos grupos.

2. Las medianas de ambos grupos.

3. El porcentaje de sujetos disléxicos que superaron la mediana de

los normales

4. Q1, Q3, D5, D7, P70, P35

5. Las modas de ambos grupos.

6. Que implica que la moda del segundo grupo sea mayor que la

del primer grupo.

Realizar los anteriores cálculos en R-Estadístico, dibujar las respectivas

cajas de bigotes.

2. Con el fin de observar la relación entre la inteligencia y el nivel

socioeconómico (medido por el salario mensual familiar) se tomaron dos

Page 39: Entrega cincocompendio

grupos, uno formado con sujetos de cociente intelectual inferior a 95 y

otro formado por los demás; De cada sujeto se anotó el salario mensual

familiar. Teniendo en cuenta los resultados que se indican en la tabla:

Nivel

socioeconómico

Sujetos con CI <

95

Sujetos con

Intervalos Frecuencia Frecuencia

6 – 10 75 19

10 – 16 35 26

16 – 22 20 25

22 – 28 30 30

28 – 34 25 54

34 – 40 15 46

a. Dibuje un gráfico que permita comparar ambos grupos.

b. Calcule las medidas de tendencia central para aquellos sujetos con CI

< 95

c. Calcule las medidas de tendencia central para aquellos sujetos con CI

> 95

d. interprete los diferentes resultados obtenidos teniendo en cuenta los

gráficos obtenidos.

Realices las anteriores operaciones en R-estadistico

3. Considere las siguientes medidas: media, mediana, moda, (max +

min)/2, primer cuartil, tercer cuartil. Dos de las propiedades de abajo

pertenecen a las medidas anteriores.

1. Su valor siempre tiene que ser igual a uno de los datos observados.

2. Divide al conjunto de datos en dos conjuntos de igual tamaño.

Page 40: Entrega cincocompendio

3. Es el centro de los datos en un intervalo de clase.

4. Siempre existe.

4. Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas

partes divide a una distribución los quintiles, y cuál es el quintil cuyo

valor corresponde a la mediana?

1. 5 partes

2. El 3 quintil

3. 50 partes

4. El segundo Quintil

5. Si se dan los siguientes Cuantíles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50;

P90; en cual de los siguientes alternativas los Cuantíles mostrados son

equivalentes

A. Q3; D8; P50

B. Q2; D5; P50

C. Q3; D8; P90

D. Q2; D5; P25

E. Q1; D2; P50

6. Se sabe que ninguna de las sucursales de una empresa comercial

tiene más de 9 empleados o menos de 7. La mayoría tiene 8 empleados,

pero el 25% tiene 9 empleados y una de cada 10 sucursales tiene 7

empleados. ¿Cuál es el promedio de empleados por sucursal?.

A. 10.15

B. 8.15

C. 9.15

D. 15.15

Page 41: Entrega cincocompendio

E. 11.15

7. Un estudiante descubre que su calificación en un reciente examen de

estadística, corresponde al percentil 70. Si 80 estudiantes presentan el

examen, aproximadamente, significa que el número de estudiantes que

sacaron calificación superior a él fueron:

A. 56

B. 24

C. 30

D. 20

E. 10

8. Los salarios pagados a los empleados de una compañía se muestran

en la siguiente tabla.

El valor de la media y el Q2

1. 250.000

2. 360.000

3. 229052

4 370.000

Cargos Numer

o

Salario

Directores 2 930.00

0

Supervisor

es

4 510.00

0

Economist

as

6 370.00

0

Contadore

s

4 350.00

0

Auxiliares 26 246.00

0

Obreros 110 190.00

0

Page 42: Entrega cincocompendio

9. En una muestra de las compras de 15 estudiantes en la tienda de una

escuela primaria, se observan las siguientes cantidades de ventas,

dispuestas en orden de magnitud ascendente: $100, $100, $250, $250,

$250, $350, $400, $530, $900, $1250, $1350, $2450, $2710, $3090,

$4100.

El valor de la media, mediana y moda de estas cantidades de ventas son

respectivamente:

A. $1200, $530, $205

B. $1210, $205, $530

C. $1210, $3090, $900

D. $250, $530, $900

E. $1210, $530, $250