2. Estad°stica Descriptiva

35
1 UNIVERSIDAD DE LOS ANDES Facultad de Ingeniería Departamento de Ingeniería Industrial Probabilidad y Estadística I Sesión # 2 Estadística Descriptiva y Representación Gráfica de Datos Estadísticos Mario Castillo (Coordinador General Curso)

Transcript of 2. Estad°stica Descriptiva

Page 1: 2. Estad°stica Descriptiva

1

UNIVERSIDAD DE LOS ANDES

Facultad de Ingeniería

Departamento de Ingeniería Industrial

Probabilidad y Estadística I

Sesión # 2

Estadística Descriptiva y

Representación Gráfica de Datos Estadísticos

Mario Castillo (Coordinador General Curso)

Page 2: 2. Estad°stica Descriptiva

2

CONTENIDO

1. CONTEXTO GENERAL

- Escalas de Medición

- Población

- Variables Aleatorias

- Muestras

2. DISTRIBUCIÓN DE FRECUENCIAS DE UNA VARIABLE ALEATORIA

- Variables discretas

- Variables continuas

- Variables categóricas

3. ESTADÍSTICAS BÁSICAS

Medidas de Tendencia

- Media Muestral

- Mediana Muestral

- Percentiles y Cuartiles

Medidas de Variabilidad

- Varianza Muestral

- Desviación Muestral

4. CASOS DE APLICACIÓN

Page 3: 2. Estad°stica Descriptiva

3

Escalas de Medición

1. Contexto General

1. RAZÓN: Variables numéricas que representan magnitudes. Cuentan con un orden

lógico, permite medir distancias y cuentan con un cero absoluto (altura, peso,

distancia).

2. INTERVALO: Variables numéricas que representan magnitudes. Cuentan con un

orden lógico y permite medir distancias. Carecen de un cero absoluto

(temperatura: Distancia entre 10 y 12 grados es igual a la distancia entre 15 y 17

grados. No se puede establecer que una temperatura de 10 grados equivale a la

mitad de una temperatura de 20 grados. Una temperatura de 0 grados no significa

que hay ausencia de temperatura).

3. ORDINAL: Variables numéricas que representan una categoría o identifican un

grupo de pertenencia. Cuentan con un orden lógico (Pregrado = 0, Postgrado = 1).

4. NOMINAL: Variables numéricas que representan una categoría o identifican un

grupo de pertenencia. No cuentan con un orden lógico (Mujer = 0, Hombre = 1).

Page 4: 2. Estad°stica Descriptiva

4

Escalas de Medición

1. Contexto General

Escala Descripción Ejemplos

Estadísticas

Descriptivas

Permitidas

Razón

1. Para dos valores x1 y x2 el

cociente x1/x2 es una

cantidad con un significado

práctico. El 0 corresponde a

la ausencia del atributo.

2. Para dos valores x1 y x2 la

distancia (x1- x2) es una

cantidad con un significado

práctico

3. Hay un orden natural

(ascendente o descendente)

de los valores a través de la

escala.

• Longitud

• Peso

• Estatura

• Dinero

La media geométrica,

la media armónica, la

media, el rango y la

desviación estándar

Intervalo

Satisface las propiedades 2 y 3

de la escala de Razón, pero no

la 1.

• Temperatura

(Celsius o

Fahrenheit)

• Años Calendario.

• Talla de zapatos.

El rango, la media y la

desviación estándar.

Page 5: 2. Estad°stica Descriptiva

5

Escalas de Medición

1. Contexto General

Escala Descripción Ejemplos

Estadísticas

Descriptivas

Permitidas

Ordinal

Satisface únicamente la

tercera propiedad de la escala

de Razón.

• Clasificación de

los equipos en un

torneo

• Estratos

•Calificaciones A,

B, C

Los percentiles.

Nominal

•No satisface ninguna de las

propiedades de la escala de

Razón.

•Comprende variables que

identifican atributos o

cualidades.

•Color de los ojos

• Género

•Número de

teléfono

El porcentaje y la

moda.

Page 6: 2. Estad°stica Descriptiva

6

POBLACIÓN

Conjunto (personas, cosas u objetos abstractos) del cual se quiere estudiar ciertas propiedades características de los elementos que lo conforman. Dichas propiedades se expresan a través de variables que denotaremos por X, Y y Z, por ejemplo.

MUESTRA ALEATORIA

Conceptualmente: una muestra aleatoria de tamaño n de una población es un subconjunto de n elementos de la población seleccionados de acuerdo con un procedimiento aleatorio que garantice su representatividad.

Formalmente: Una MA de una población X, consiste en un conjunto X1, X2, ..., Xn de n Variables Aleatorias independientes que tienen la misma distribución que la VA X.

1. Contexto General

Page 7: 2. Estad°stica Descriptiva

7

Distribución de Frecuencias de una Variable Aleatoria Variables Discretas

Intensidad del tráfico

0

2

4

6

8

10

12

14

16

Intensidad del tráfico 3 11 10 15 9

1 2 3 4 5

Facilidad de parqueo

0

5

10

15

20

25

Facilidad de parqueo 4 6 7 9 22

1 2 3 4 5

Visibilidad y facilidad de acceso al punto

0

2

4

6

8

10

12

14

16

Visibilidad y facilidad de

acceso al punto

4 14 7 13 10

1 2 3 4 5

Page 8: 2. Estad°stica Descriptiva

8

Promedio Transacciones 3 Últimos Meses

0

2

4

6

8

10

12

14

400 o

menos

401-

600

601-

800

801-

1000

1001-

1200

1201-

1400

1401-

1600

1601-

1800

1801-

2000

2001-

2200

2201-

2400

2400 o

más

Transacciones

Mensuales

Fre

cuencia

2. Distribución de Frecuencias de una Variable Aleatoria

Variables Continuas

Histograma Variable Ingresos Cajero

0

2

4

6

8

10

12

6000

00

8000

00

1000

000

1200

000

1400

000

1600

000

1800

000

2000

000

2200

000

2400

000

2600

0000

2800

0000

y m

ayor

...

Clase

Fre

cu

en

cia

Page 9: 2. Estad°stica Descriptiva

9

2. Distribución de Frecuencias de una Variable Aleatoria

Variables Categóricas

Estrato

0

2

4

6

8

10

12

14

16

2 3 4 5 6

Estrato

Page 10: 2. Estad°stica Descriptiva

10

Consideremos una Muestra Aleatoria x1, x2, …, xn de una población dada.

• La Media Muestral se define por:

• La Mediana Muestral

Corresponde al valor medio de las n observaciones.

Para calcularlo, se ordenan las n observaciones (incluyendo las que tienen

valores repetidos)

Si n es impar: mediana = [(n +1)/2] ésimo valor de la muestra.

Si n es par: mediana =

promedio entre el [n /2] ésimo y el [(n/2) + 1] ésimo

valores de la muestra.

3. Estadísticas Básicas - Medidas de Tendencia

nXn

ii /)(

1

X

Page 11: 2. Estad°stica Descriptiva

11

Mediana Muestral - Ejemplo

= (10.2 + 10.9)/2

Si n es impar:

mediana = [(n +1)/2]

ésimo valor de la muestra.

Si n es par: mediana =

promedio entre el [n /2] ésimo

y el [(n/2) + 1] ésimo

valores de la muestra.

Page 12: 2. Estad°stica Descriptiva

12

Considere los siguientes datos sobre la concentración de globulina receptora, para una muestra

de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de hierro:

x1 = 15.2 x2 = 9.3 x3 = 7.6 x4 = 11.9 x5 = 10.4 x6 = 9.7

x7 = 20.4 x8 = 9.4 x9 = 11.5 x10 = 16.2 x11 = 9.4 x12 = 8.3

Determine la mediana muestral de las observaciones.

a. 11.61

b. 9.7

c. 9.4

d. 10.05

Page 13: 2. Estad°stica Descriptiva

13

Si n es impar: mediana = [(n +1)/2] ésimo valor de la muestra.

Si n es par: mediana =

promedio entre el [n /2] ésimo

y el [(n/2) + 1] ésimo

valores de la muestra.

1 15.2 7.6

2 9.3 8.3

3 7.6 9.3

4 11.9 9.4

5 10.4 9.4

6 9.7 9.7

7 20.4 10.4

8 9.4 11.5

9 11.5 11.9

10 16.2 15.2

11 9.4 16.2

12 8.3 20.4

Media Muestral 11.61

Mediana 10.05

Ejercicio Mediana Muestral – Respuesta

= (9.7 + 10.4)/2

Page 14: 2. Estad°stica Descriptiva

14

Relación Medidas de Tendencia

Page 15: 2. Estad°stica Descriptiva

15

Page 16: 2. Estad°stica Descriptiva

16

n

ii xx

nS

1

22

1

1

Estadísticas Básicas - Medidas de Variabilidad

Varianza Muestral

Desviación Estándar Muestral

s =

2S

Page 17: 2. Estad°stica Descriptiva

17

Varianza Muestral - Ejemplo

n

ii xx

nS

1

22

1

1

Page 18: 2. Estad°stica Descriptiva

18

Considere los siguientes datos sobre la concentración de globulina receptora, para una

muestra de mujeres con pruebas de laboratorio de evidente anemia por deficiencia de

hierro:

x1 = 15.2 x2 = 9.3 x3 = 7.6 x4 = 11.9 x5 = 10.4 x6 = 9.7

x7 = 20.4 x8 = 9.4 x9 = 11.5 x10 = 16.2 x11 = 9.4 x12 = 8.3

Determine la varianza muestral de las observaciones.

a. 3.79

b. 3.63

c. 14.41

d. 13.21

Page 19: 2. Estad°stica Descriptiva

19

Ejercicio Varianza Muestral – Solución

xi

15,2 12,9000694

9,3 5,32840278

7,6 16,0667361

11,9 0,08506944

10,4 1,46006944

9,7 3,64173611

20,4 77,2934028

9,4 4,87673611

11,5 0,01173611

16,2 21,0834028

9,4 4,87673611

8,3 10,9450694

Σxi = 139,3 158,569167

11,6083333 s2 = 14,4153788x

2)( xx

i

2

)( xxi

n

ii xx

nS

1

22

1

1

Page 20: 2. Estad°stica Descriptiva

20

Estadísticas Básicas y

Cuartiles y Percentiles

Estadísticos

salary

474

0

34419,57

28875,00

17075,66

3E+008

15750,00

135000,00

21000,00

22950,00

24000,00

24825,00

26700,00

28875,00

30750,00

34500,00

37162,50

41100,00

59700,00

Válidos

Perdidos

N

Media

Mediana

Desv. típ.

Varianza

Mínimo

Máximo

10

20

25

30

40

50

60

70

75

80

90

Percentiles

Page 21: 2. Estad°stica Descriptiva

21

ANÁLISIS DEL PUNTAJE UNIANDES CON BASE EN EL

RENDIMIENTO DE LOS ESTUDIANTES DE PRIMER

SEMESTRE DE 2000-II

Realizado por: Carlos Castellanos

Dirigido por: Mario Castillo

Page 22: 2. Estad°stica Descriptiva

22

OBJETIVOS

• Analizar la población de los estudiantes que cursaron primer semestre en el segundo periodo del 2000 respecto a su desempeño académico y su relación con el puntaje Uniandes.

• Analizar la capacidad de predicción del puntaje Uniandes.

• Formular las conclusiones y recomendaciones.

Page 23: 2. Estad°stica Descriptiva

23

METODOLOGÍA

• Análisis descriptivo

• General

• Por programa

• Por colegio

• Análisis estadístico avanzado

• Factorial

• Discriminante

Page 24: 2. Estad°stica Descriptiva

24

¿Qué es un estudiante exitoso?

Se define como exitoso al estudiante que logre un promedio

acumulado superior a 3.25; sin embargo, el punto de corte se

maneja como un parámetro. Se toma como otro punto de

referencia un promedio acumulado de 3.5

Page 25: 2. Estad°stica Descriptiva

25

Promedio de los estudiantes de segundo semestre del 2000

4.884.63

4.384.13

3.883.63

3.383.13

2.882.63

2.382.13

1.881.63

Histogram

Fre

qu

en

cy70

60

50

40

30

20

10

0

Std. Dev = .50

Mean = 3.66

N = 575.00

HISTOGRAMA DEL PROMEDIO ACUMULADO

Page 26: 2. Estad°stica Descriptiva

26

Puntaje uniandes total

775.0

725.0

675.0

625.0

575.0

525.0

475.0

425.0

375.0

325.0

275.0

225.0

HistogramF

req

ue

ncy

50

40

30

20

10

0

Std. Dev = 139.74

Mean = 458.4

N = 575.00

HISTOGRAMA DEL PUNTAJE TOTAL UNIANDES

Page 27: 2. Estad°stica Descriptiva

27

1 2 3 4 5

Variables 20% inferior Entre el 20 y el 40% Entre el 40 y el 60% Entre el 60 y el 80% 20% superior

Quintiles

Promedio acumulado

Puntaje uniandes total <320

<3.28

321-406 407-494.6 494.7-596 >596

3.29-3.53 3.54-3.8 3.81-4.08 >4.08

DISTRIBUCIÓN POR QUINTILES

Page 28: 2. Estad°stica Descriptiva

28

Quintiles N Medias Std. Deviation

Promedios del quintil 20 % inferior del puntaje uniandes 116 3.39 0.42

Promedios entre el 20% y 40% del puntaje uniandes 115 3.53 0.43

Promedios entre el 40% y el 60% del puntaje uniandes 114 3.58 0.50

Promedios entre el 60% y el 80% del puntaje uniandes 117 3.78 0.39

Promedios del 20% superior del puntaje uniandes 113 4.01 0.49

MEDIAS DE LOS PROMEDIOS ACUMULADOS POR QUINTILES

Page 29: 2. Estad°stica Descriptiva

29

44 31 21 14 6 116

27 35 19 23 11 115

26 25 27 20 16 114

14 16 30 31 26 117

8 8 15 30 52 113

119 115 112 118 111 575

20.00

40.00

60.00

80.00

100.00

Quint iles

del

puntaje

uniandes

Total

20.00 40.00 60.00 80.00 100.00

Quint iles del promedio acumulado

Total

Quintiles del puntaje uniandes * Quintiles del promedio acumulado

Tabulación Cruzada

Page 30: 2. Estad°stica Descriptiva

30

ANÁLISIS DE LOS COLEGIOS DE MÁS APORTE

Código Colegio Ciudad N TOT_PROM %Prom inf. a 3.25 %Prom inf. a 3.5

19489 BOGOTA D.C. 8 4.23 0.00 12.50

19472 BOGOTA D.C. 33 4.07 3.03 12.12

24299 BOGOTA D.C. 18 4.01 5.56 5.56

24281 BOGOTA D.C. 13 3.92 15.38 23.08

55988 BOGOTA D.C. 14 3.91 7.14 7.14

19513 BOGOTA D.C. 18 3.82 0.00 11.11

19331 BOGOTA D.C. 13 3.81 15.38 15.38

19422 BOGOTA D.C. 8 3.81 25.00 25.00

19349 BOGOTA D.C. 23 3.79 8.70 17.39

36723 BOGOTA D.C. 13 3.79 7.69 15.38

19364 BOGOTA D.C. 31 3.66 12.90 19.35

16741 CALI, VALLE 9 3.66 22.22 44.44

19505 BOGOTA D.C. 16 3.62 12.50 43.75

19497 BOGOTA D.C. 7 3.6 14.29 57.14

62497 BOGOTA D.C. 12 3.59 0.00 41.67

19448 BOGOTA D.C. 29 3.55 24.14 27.59

46490 BOGOTA D.C. 14 3.54 14.29 42.86

16774 CALI, VALLE 5 3.51 20.00 60.00

62208 BOGOTA D.C. 7 3.5 14.29 57.14

4234 CARTAGENA, BOLIVAR 7 3.49 28.57 42.86

21899 BOGOTA D.C. 12 3.43 33.33 58.33

25395 BOGOTA D.C. 11 3.38 36.36 63.64

34306 BOGOTA D.C. 7 3.28 42.86 85.71

19430 BOGOTA D.C. 9 3.27 55.56 66.67

22574 BOGOTA D.C. 5 3.16 40.00 80.00

Page 31: 2. Estad°stica Descriptiva

31

CROSSTABS

Page 32: 2. Estad°stica Descriptiva

32

QUINTILES IDENTIFICADOS

Quintiles

PROMEDIO EN

MATEMÁTICAS

PROMEDIO

EN FÍSICA

PUNTAJE

UNIANDES FISICA

MATE-

MATICAS QUIMICA

20 2,80 2,67 361 50 45 52

40 3,11 3,00 444 54 48 55

60 3,39 3,33 518 57 52 59

80 3,72 3,67 608 61 56 63

Page 33: 2. Estad°stica Descriptiva

33

QUINTILES ICFES EN MATEMÁTICAS VS.

PROMEDIO EN MATEMÁTICAS

Tabla de contingencia Quintiles Matemáticas ICFES * Quintiles cursos Matemáticas

94 99 90 54 38 375

25,1% 26,4% 24,0% 14,4% 10,1% 100,0%

83 67 66 48 42 306

27,1% 21,9% 21,6% 15,7% 13,7% 100,0%

113 104 106 104 77 504

22,4% 20,6% 21,0% 20,6% 15,3% 100,0%

75 90 95 94 85 439

17,1% 20,5% 21,6% 21,4% 19,4% 100,0%

44 56 84 97 152 433

10,2% 12,9% 19,4% 22,4% 35,1% 100,0%

409 416 441 397 394 2057

19,9% 20,2% 21,4% 19,3% 19,2% 100,0%

Recuento

% de Quintiles

Matemáticas ICFES

Recuento

% de Quintiles

Matemáticas ICFES

Recuento

% de Quintiles

Matemáticas ICFES

Recuento

% de Quintiles

Matemáticas ICFES

Recuento

% de Quintiles

Matemáticas ICFES

Recuento

% de Quintiles

Matemáticas ICFES

1

2

3

4

5

Quint iles

Matemáticas

ICFES

Total

1 2 3 4 5

Quint iles cursos Matemáticas

Total

Page 34: 2. Estad°stica Descriptiva

34

QUINTILES ICFES EN QUÍMICA VS.

PROMEDIO EN MATEMÁTICAS

Tabla de contingencia Quintiles Química ICFES * Quinti les cursos Matemáticas

122 85 68 37 16 328

37,2% 25,9% 20,7% 11,3% 4,9% 100,0%

107 108 71 69 46 401

26,7% 26,9% 17,7% 17,2% 11,5% 100,0%

102 93 111 91 56 453

22,5% 20,5% 24,5% 20,1% 12,4% 100,0%

55 82 108 93 81 419

13,1% 19,6% 25,8% 22,2% 19,3% 100,0%

23 48 83 107 195 456

5,0% 10,5% 18,2% 23,5% 42,8% 100,0%

409 416 441 397 394 2057

19,9% 20,2% 21,4% 19,3% 19,2% 100,0%

Recuento

% de Quintiles

Química ICFES

Recuento

% de Quintiles

Química ICFES

Recuento

% de Quintiles

Química ICFES

Recuento

% de Quintiles

Química ICFES

Recuento

% de Quintiles

Química ICFES

Recuento

% de Quintiles

Química ICFES

1

2

3

4

5

Quint iles

Química

ICFES

Total

1 2 3 4 5

Quint iles cursos Matemáticas

Total

Page 35: 2. Estad°stica Descriptiva

35

Tabla de contingencia Quintiles Puntaje Uniandes * Quintiles cursos Matemáticas

146 110 82 43 20 401

36,4% 27,4% 20,4% 10,7% 5,0% 100,0%

104 99 93 80 33 409

25,4% 24,2% 22,7% 19,6% 8,1% 100,0%

91 84 97 83 58 413

22,0% 20,3% 23,5% 20,1% 14,0% 100,0%

54 83 99 90 89 415

13,0% 20,0% 23,9% 21,7% 21,4% 100,0%

14 40 70 101 194 419

3,3% 9,5% 16,7% 24,1% 46,3% 100,0%

409 416 441 397 394 2057

19,9% 20,2% 21,4% 19,3% 19,2% 100,0%

Recuento

% de Quintiles

Puntaje Uniandes

Recuento

% de Quintiles

Puntaje Uniandes

Recuento

% de Quintiles

Puntaje Uniandes

Recuento

% de Quintiles

Puntaje Uniandes

Recuento

% de Quintiles

Puntaje Uniandes

Recuento

% de Quintiles

Puntaje Uniandes

1

2

3

4

5

Quint iles

Puntaje

Uniandes

Total

1 2 3 4 5

Quint iles cursos Matemáticas

Total

QUINTILES EN PUNTAJE UNIANDES VS.

PROMEDIO EN MATEMÁTICAS