Mic sesión 3

28
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA Sesión 3: ESTADÍSTICA DESCRIPTIVA: Agrupación y Presentación de Datos. FÁTIMA PONCE 1

Transcript of Mic sesión 3

Page 1: Mic sesión 3

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 3:

ESTADÍSTICA DESCRIPTIVA: Agrupación y Presentación de Datos.

FÁTIMA PONCE 1

Page 2: Mic sesión 3

FÁTIMA PONCE 2

PUNTOS A TRATARSesión 3:

Estadística Descriptiva: Agrupación y Presentación

Uso e importancia de la Estadística.

Estadística Descriptiva: Presentación y análisis de datos. oTablas de Frecuencia e Histograma.oRepresentaciones Gráficas.

Page 3: Mic sesión 3

FÁTIMA PONCE 3

ESTADÍSTICA DESCRIPTIVA:AGRUPACIÓN Y

PRESENTACIÓN DE DATOS

Page 4: Mic sesión 3

FÁTIMA PONCE 4

Permite construir y analizar cuadros estadísticos y gráficos resúmenes, con el objetivo de resumir los datos, de manera que sean entendibles e interpretables con facilidad, a fin de que nos sirva la información para la toma de decisiones: Distribuciones de frecuencias e histograma, Gráficas de barras, líneas, pie, otros.

Aplicar e interpretar medidas numéricas que resumen los datos: Medidas de localización central (media, mediana,

moda), variabilidad (varianza, desviación estándar, coefi- ciente de variabilidad) y emplearlos como medidas de

tendencia y riesgo.

ESTADÍSTICA DESCRIPTIVA

Page 5: Mic sesión 3

FÁTIMA PONCE 5

Los datos pueden organizarse de varias maneras.

Datos sin procesar: Recolectar y presentarlos (Datos no agrupados).

Datos Procesados: Organizados (agrupados) a fin de ver rápidamente alguna(s) de su(s) característica(s) para entender mejor la población y tomar una mejor decisión:

o Distribución de frecuencias: Método para agrupar datos. Se dividen en clases y se cuenta el número de observaciones en cada clase.

o Representaciones Gráficas.

BÚSQUEDA DE UN PATRÓN SIGNIFICATIVO EN LOS DATOS

Page 6: Mic sesión 3

FÁTIMA PONCE 6

Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. En ambos casos se han ordenado los datos de la muestra.

PRESENTACIÓN ORDENADA DE LOS DATOS

Género FrecuenciaHombres 3Mujeres 8

3

8

0

5

10

Hombres Mujeres

Page 7: Mic sesión 3

FÁTIMA PONCE 7

DISTRIBUCIÓN DE FRECUENCIAS

Page 8: Mic sesión 3

FÁTIMA PONCE 8

DISTRIBUCIÓN DE FRECUENCIASEs un resumen tabular de datos organizados en clases, es decir, en grupos de valores que describen una característica de los datos.

Indica el número de veces que ocurre cada dato en la clase.

Notas14119

1868

141516131112

Este resumen aporta más claridad.

Dat

os D

esor

dena

dos

Número de veces que ocurre cada dato en la clase disjunta.

Frecuencia0372

12

clase0-5

6-1011-1516-20

Page 9: Mic sesión 3

FÁTIMA PONCE 9

Las frecuencias pueden ser: Absoluta, Relativa Porcentual.

y pueden presentarse

Simple / No acumuladas, Acumuladas: Sólo tienen sentido para variables

numéricas u ordinales. Útiles para calcular cuantiles.

DISTRIBUCIÓN DE FRECUENCIAS

Page 10: Mic sesión 3

FÁTIMA PONCE 10

Tipo de Clases

Cuantitativas: Discretas (con poca variabilidad) Discretas (con mucha variabilidad) Continuas

Las clases están compuestas por datos discretos (conteo) y datos continuos (medición).

Cualitativas: Emplean etiquetas o nombres para determinar las

categorías.

Page 11: Mic sesión 3

FÁTIMA PONCE 11

Distribución de Frecuencias: PASOS1. Determinar el número de clases disjuntas en las

que se dividen los datos: Debe permitir observar la variación en los datos. Cuanto más grande sea el rango de los datos, más clases puntuales se requiere. El número de clases es arbitrario, pero se recomienda

esté entre 5 y 15 clases.Para determinar el número de clases en las que se dividen los datos (n) de la muestra se emplea:

Número de clases = raiz (n), ó Número de clases = 3 log(n), ó Fórmula de Sturges: Número de clases = 1 + 3.3 log(n)

Es referencial.

Page 12: Mic sesión 3

FÁTIMA PONCE 12

Distribución de Frecuencias: PASOS

2. Determinar el Ancho o tamaño del intervalo o amplitud de clase: El ancho debe ser el mismo para todas las clases.

Rango Ancho aprox de clase = ----------------------------- número de clases

Dato mayor – Dato menor Ancho aprox de clase = --------------------------------------- número de clases

Page 13: Mic sesión 3

FÁTIMA PONCE 13

Distribución de Frecuencias: PASOS

3. Determinar los límites de clase: Cada clase tiene un límite inferior y un límite superior.

Se recomienda que el límite inferior de la primera clase sea el valor mínimo de los datos.

Las clases son completamente incluyentes (abarcan a todos los datos) y mutuamente excluyentes (ningún dato entra en más de una clase): Cada dato pertenece a una y sólo una de las clases.

Page 14: Mic sesión 3

FÁTIMA PONCE 14

Distribución de Frecuencias: PASOS4.Tabular o Determinar la frecuencia:

Contar el número de datos que cae dentro

de cada clase para construir la tabla.

012345678

0-5 6-10 11-15 16-20

Histograma de frecuencias Absolutas

clase0-5

6-1011-1516-20

Frecuencia0372

5.Ilustrar los datos en un Histograma de frecuencia.Informa acerca de la forma de

la distribución de los datos.Se construyen rectángulos

sobre c/u de las clases, con alturas proporcionales al número de elementos que caen en la clase (frecuencia).

Page 15: Mic sesión 3

FÁTIMA PONCE 15

Si se tiene el número de horas que demoran las Municipalidades en dar respuesta a una solicitud en 50 gobiernos distritales. Elabore una distribución de frecuencias

Datos sinProcesar:

85 54 56 73 7351 59 66 67 6464 71 63 65 6468 71 74 61 6273 64 53 60 6156 65 56 65 7180 68 64 72 6765 63 65 64 7264 61 86 67 8273 70 65 59 84

Ejemplo: Distribución de frecuencia

Page 16: Mic sesión 3

FÁTIMA PONCE 16

EJEMPLO: Distribución de frecuencia

1. Número de Clases 62. Ancho o amplitud de clase: Valor Máximo – Valor mínimo (86 – 51) 35 = -------------------------------------- = ---------- =---- 6 Número de clases 6 6

Clases Límite inferior Límite superior 1 51 56 2 =51+6 =57 62 3 =57+6 =63 68 4 =63+6 =69 74 5 =69+6 =75 80 6 =75+6 =81 86

3. Límites de clase: Definir límite inferior y superior de c/clase

Page 17: Mic sesión 3

FÁTIMA PONCE 17

21 de los 50 gobiernos locales tuvieron una demora entre 63 y 68 horas.

Ningún gobierno distrital se demoró menos de 51 horas ni más de 86.

Punto Medio de Clase (51 + 56)/2 = 53.5

Clases (demora en horas) Cuenta

Frecuencia Absoluta (gobiernos

distritales)51-56 IIIII I 657-62 IIIII II 763-68 IIIII IIIII IIIII IIIII I 2169-74 IIIII IIIII I 1175-80 I 181-86 IIII 4

50

4. Determinar las frecuencias

EJEMPLO: Distribución de frecuencia

Page 18: Mic sesión 3

FÁTIMA PONCE 18

EJEMPLO: Distribución de Frecuencia

5. Ilustrar en un gráfico: Histograma de frecuencias. Informa acerca de la forma de la distribución de los datos. Se construyen rectángulos sobre c/u de las clases, con

alturas proporcionales al número de elementos que caen en la clase (frecuencia).

Clases (horas)

Frecuencia Absoluta (gob.

distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4

50

51-56 57-62 63-68 69-74 75-80 81-860

5

10

15

20

25

Demora (en horas)

Frec

uenc

ia

Page 19: Mic sesión 3

FÁTIMA PONCE 19

Frecuencia Relativa y Porcentual

Muestra que la frecuencia relativa porcentual de la tercera clase es 42%.

Clases (horas)

Frecuencia Absoluta

(gob. distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4

50

Frecuencia Relativa = 6/50 = 0.12= 7/50 = 0.14= 21/50 = 0.42= 11/50 = 0.22= 1/50 = 0.02= 4/50 = 0.08

1

Frecuencia Porcentual

12%14%42%22%2%8%

100%

Page 20: Mic sesión 3

FÁTIMA PONCE 20

FRECUENCIAS ACUMULADAS

Una distribución de frecuencias acumuladas permite ver cuántas observaciones están por encima de ciertos valores. En ejercicio anterior:

OJIVA: Gráfica de una frecuencia acumulada.

Clases (horas)

Frecuencia Absoluta

(gob. distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4

50

Frecuencia Acumulada

6 13 34 45 46 50

Frecuencia Acumulada

%12%26%68%90%92%

100%

Page 21: Mic sesión 3

FÁTIMA PONCE 21

POLÍGONO DE FRECUENCIA Es una línea que conecta los puntos medios de todas las

barras de un histograma y bosqueja con mayor claridad un perfil del patrón de los datos.

Se utiliza para representar distribuciones de frecuencias de variables cuantitativas continuas, pero se emplean segmentos de recta, de ahí el nombre de polígono.

0

1

2

3

4

5

6

7

8

2.5 8 13 18 23

Polígono de Frecuencias

0

2

4

6

8

2.5 8.0 13.0 18.0 23.0

Histograma de Frecuencias Absolutas y Polígono de Frecuencias

Page 22: Mic sesión 3

FÁTIMA PONCE 22

REPRESENTACIONES GRÁFICAS

Constituyen uno de los principales y más sencillos métodos de presentar

la información.

Page 23: Mic sesión 3

FÁTIMA PONCE 23

¿Qué Gráfico Usar: Barra, Línea o Círculo?

Depende de los datos y lo que queremos mostrar. El gráfico debe ayudar a interpretar correctamente lo que los datos nos dicen:

Las barras se emplean para comparar.

Las líneas se usan más para ver su comportamiento en el tiempo (la tendencia).

Círculo o Pie se emplea para mostrar proporciones o participaciones de un todo.

Page 24: Mic sesión 3

FÁTIMA PONCE 24

Gráfico: Gráficos de Barra (comparativos)

Pueden ser: Sencillo: Contiene una única serie

de datos.

Agrupado: Contiene varias series de datos y cada una se representa por un tipo de barra de un mismo color o textura.

Apilado: Contiene varias series de datos. La barra se divide en segmentos de diferentes colores o texturas y cada uno de ellos representa una serie

Intención de postular a la Universidad

Page 25: Mic sesión 3

FÁTIMA PONCE 25

Gráfico de Líneas

12345678910

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

5000

55006000

65007000

75008000

8500Consumo Mensual de Energía Eléctrica

Muestra proporciones (%) relativas de una variable.

Gráfico Circular

Participación del Mercado de Internet Móvil 2015, según tipo de terminal

Fuente: OSIPTEL.

Page 26: Mic sesión 3

FÁTIMA PONCE 26

Por ejemplo de cotizaciones de acciones. Muestra el valor más alto, el más bajo y el de cierre de la acción.

Gráfico de Máximos y Mínimos (datos financieros)

Page 27: Mic sesión 3

FÁTIMA PONCE 27

Es un gráfico que representa mediante figuras o símbolos las frecuencias de una variable cualitativa o discreta.

Suelen usarse para comparar magnitudes o ver la evolución en el tiempo de una categoría concreta.

Por ejemplo:

PICTOGRAMA

Transporte Residencial/ Industria/ Otros Comercio Minería 42% 29% 25% 4%

Consumo final de energía total por sectores

Page 28: Mic sesión 3

FÁTIMA PONCE 28

BIBLIOGRAFIA

Anderson, D., Sweeney, D. y Williams T. (2008). Cap 2.

Levin, R. y Rubin, D. (2010). Cap. 2.