GUIA-ejercicios con datos granel-intervalares. con datos... · Ejemplos solo con datos...

15
Ejemplos solo con datos cuantitativos o numéricos: Medidas de centralización Para datos a granel: Considere una muestra de notas de un alumno en la asignatura de matemática: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Calculo de la media aritmética: 4 . 5 10 6 . 4 7 4 . 6 2 . 6 8 . 4 3 . 5 6 . 4 7 . 6 5 . 3 5 . 4 = = X También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos: Ejemplo: supongamos que la media es Xs= 50 Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 -0.4 Suma de desvíos = 3.6 n d s X X + = =5.0+ 4 . 5 36 . 5 36 . 0 0 . 5 10 6 . 3 = = + = Media geométrica Para el ejemplo: : G= 10 6 . 4 7 . 4 . 6 2 . 6 8 . 4 3 . 5 6 . 4 7 . 6 5 . 3 5 . 4 x x x x x x x x x =5.3 Media armónica: Para el ejemplo: H= 51 . 0 6 . 4 1 7 1 4 . 6 1 2 . 6 1 8 . 4 1 3 . 5 1 6 . 4 1 7 . 6 1 5 . 3 1 5 . 4 1 1 = + + + + + + + + +

Transcript of GUIA-ejercicios con datos granel-intervalares. con datos... · Ejemplos solo con datos...

Ejemplos solo con datos cuantitativos o numéricos:

Medidas de centralización Para datos a granel: Considere una muestra de notas de un alumno en la asignatura de matemática: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6

Calculo de la media aritmética:

4.510

6.474.62.68.43.56.47.65.35.4 =+++++++++=X

También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos: Ejemplo: supongamos que la media es Xs= 50

Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 -0.4

Suma de desvíos = 3.6

n

dsXX ∑+= =5.0+ 4.536.536.00.5

10

6.3 ==+=

Media geométrica

Para el ejemplo: :

G=10 6.47.4.62.68.43.56.47.65.35.4 xxxxxxxxx =5.3

Media armónica:

Para el ejemplo: H= 51.0

6.4

1

7

1

4.6

1

2.6

1

8.4

1

3.5

1

6.4

1

7.6

1

5.3

1

5.4

11 =

+++++++++

Para el ejemplo:

RMS= 3.176.474.62.68.43.56.47.65.35,4 2222222222 =+++++++++

Caso especial de la media aritmética:

La moda para datos a granel (Mo): Es el dato que más se repite, puede haber más de una moda o ninguna, siempre es un dato de la muestra. Para el ejemplo: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Mo= 4,6

La mediana para datos a granel (Md): Corresponde al valor central de los datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n: par).No siempre es un dato de la muestra: Para el ejemplo Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Ordenando los datos: Notas 3.5 4.5 4.6 4.6 4.8 5.3 6.2 6.4 6.7 7

Md= 1.52

3.58.4 =+

Medidas de dispersión para datos a granel:

El más elemental es el rango de variación: Rg= mayor valor observado o medido- menor valor observado o medido Para el ejemplo: Rg= 7-3.5= 3.5

Desviación media: DM=n

xxi∑ −

Para el ejemplo Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6

Con: 4.5=X Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 desvíos -0.9 -1.9 1.3 -0.8 -0.1 -0.6 0.8 1.0 1.6 -0.8 ∑ =0

desvíos 0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8 ∑ =17

DM= 7.110

17 =

Desviación estándar: ( )

1

2

−−

= ∑n

xxS para la muestra

Para el ejemplo: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 desvíos -0.9 -1.9 1.3 -0.8 -0.1 -0.6 0.8 1.0 1.6 -0.8 ∑ =0

desvíos 0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8 ∑ =17

desvíos2 0.81 3.61 1.69 0.64 0.01 0.36 0.64 1.0 2.56 0.64 ∑ =11.96

S= 15.1110

96.11 =−

Desviación estándar para la población: (es solo un estimativo)

( )n

xxS ∑ −

=2

Para el ejemplo:

S= 09.110

96.11 =

Nota: existen otras medidas de dispersión que se estudiaran con datos intercalares. Ejercicio tipo con datos intervalalares.

clases Xi f fr. f% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00

clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00

clases Xi f Xi*f 485.55 – 535.50 510.53 4 2042.12 535.51 – 585.46 560.49 9 5044.41 585.47 – 635.42 611.45 10 6114.50 635.43 – 685.38 660.41 7 4622.87 685.39 – 735.34 710.37 8 5682.96 735.35 – 785.30 760.33 2 1520.66 40 25027.52

69.62540

52.25027 ==X

Para el ejemplo: Supongamos como media supuesta la marca de clase de la segunda clase, esto es: 560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma simplificada como se indica: Xi Desviación :Xi - Xs f (Xi-Xs)*f 510.53 510.53-560.49=-49.96 4 -199.84 560.49 560.49-560.49=0 9 0 611.45 611.45-560.49=50.96 10 509.60 660.41 660.41-560.49=99.92 7 699.44 710.37 710.37-560.49=149.88 8 1199.04 760.33 760.33-560.49=199.84 2 399.68 ∑ =2607.92

69.62540

92.260749.560 =+=X

Valor que coincide con el calculado anteriormente.

clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00

Luego la abscisa que deja la mitad de la superficie total a cada lado es: 586.465+34.965=621.43

CRITERIO TABULAR O INTERVALAR: clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 585.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00

Md= 587.465+33.922=621.39

EN GENRAL:

clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00

Parámetros de dispersión:

Desviación media: DM=n

fxxi∑ −

Para el ejemplo:

Se sabe que la media es: 69.62540

52.25027 ==X

clases Xi (Xi - X ) XXi − f Fa XXi −

485.55 – 535.50 510.53 -115.16 115.16 4 460.64 535.51 – 585.46 560.49 -65.20 65.20 9 586.80 587.47 – 635.42 611.45 -14.24 14.24 10 142.40 635.43 – 685.38 660.41 34.72 34.72 7 243.04 685.39 – 735.34 710.37 84.68 84.68 8 677.44 735.35 – 785.30 760.33 134.64 134.64 2 269.28 ∑ =0 40 ∑ =2379.60

DM= 49.5940

60.2379 =

Desviación estándar: ( )

1

2

−−

= ∑n

fxxS para la muestra

clases Xi (Xi - X ) (Xi - X ) 2 f (Xi - X ) 2 f 485.55 – 535.50 510.53 -115.16 13261.83 4 53047.32 535.51 – 585.46 560.49 -65.20 4251.04 9 38259.36 587.47 – 635.42 611.45 -14.24 202.78 10 2027.80 635.43 – 685.38 660.41 34.72 1205.48 7 8438.36 685.39 – 735.34 710.37 84.68 7170.70 8 57365.60 735.35 – 785.30 760.33 134.64 18127.93 2 36255.86 ∑ =0 ∑ =44219.76 40 ∑ =195394.30

S= 78.70140

30.195394 =−

Desviación estándar:( )

n

xxS ∑ −

=2

para la población.

Para el ejemplo: 89.6940

30.195394 =

Rango intercuartílico: Datos que se ubican entre el 25% y el 75% Para el ejemplo: El 25% de los datos: 25% de 40 = 10 De acuerdo a la tabla: clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda clase: Datos del primer cuartel:

535,505+ ( ) 81.5683.33505,535505.535455.5859

6 =+=−

Datos del tercer cuartel: 75% de los datos: 75% de 40 = 30 Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite inmediatamente superior de la cuarta clase, esto es: 685.38.

Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran entre 568,81 y 685,38 (este criterio permite eliminar los outlier) Nota: el segundo intercuartílico corresponde a la mediana: En efecto: el 50% de los dados es 50% de 40 = 20 Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7 restante de los 10 de la tercera clase, esto es:

587.465+ 03.621565.33465.587)465.587415.635(10

7 =+=− (que corresponde al

valor calculado anteriormente)

Nota: cualquier otro intercuartílico se calcula de la misma manera: Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil? clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 Tercer decil: 30% de 40 = 12

535.505+ )505.535455.585(9

8 − =579.905

Sexto decil: 60% de 40 = 24

635.425+ 56.642)425.635375.685(7

1 =−

El rango es entonces: 579.91 y 642.56

También se puede calcular parámetros como porcentajes de alumnos que se ubican en determinado rango de puntajes.

Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos? Se procede como se indica clases Xi f fr. F% Fa Fa% 485.55 – 535.50 510.53 4 4/40 10.00 4 10.00 535.51 – 585.46 560.49 9 9/40 22.50 13 32.50 587.47 – 635.42 611.45 10 10/40 25.00 23 57.50 635.43 – 685.38 660.41 7 7/40 17.50 30 75.00 685.39 – 735.34 710.37 8 8/40 20.00 38 95.00 735.35 – 785.30 760.33 2 2/40 5.00 40 100.00 40 1 100.00 De acuerdo a la tabla el menor puntaje: 548.34 puntos se ubica en la segunda clase, por lo que habrá que tomar parte de los 9 alumnos, el mayor puntaje 694.15 puntos se ubica en la quinta clase y toma parte de los 8 alumnos. En resumen:

95.49

9(585.46-548.34)+10+7+ )39.68515.694(

95.49

8 − =6.69+10+7+1.40=25.09=25

alumnos .Que corresponde al 62.5% del total .Es decir el 62.5% de la muestra se ubica en ese rango de notas.