El análisis de informaciòn

14
UNIVERSIDAD RICARDO PALMA Escuela de Post Grado Maestría en Docencia Superior ANÁLISIS DESCRIPTIVO DE DATOS PRESENTACIÓN EN CUADROS Y GRÁFICOS SILVANA CÁRDENAS QUINTANA Octubre, 2009

description

Para el trabajo final

Transcript of El análisis de informaciòn

Page 1: El análisis de informaciòn

UNIVERSIDAD RICARDO PALMAEscuela de Post GradoMaestría en Docencia Superior

ANÁLISIS DESCRIPTIVO DE DATOS

PRESENTACIÓN EN CUADROS Y GRÁFICOS

SILVANA CÁRDENAS QUINTANA

Octubre, 2009

Page 2: El análisis de informaciòn

EL ANALISIS DE LA INFORMACIÓN

Dominar conceptos básicos para el análisis estadístico

Cuando se tiene bastante claridad acerca del problema que se va a investigar y cuando ya se ha definido el conjunto de conceptos o hipótesis que guiarán el trabajo de investigación, es necesario considerar la forma como se harán y cómo se analizarán las observaciones que servirán para concluir acerca de la verdad o falsedad de las hipótesis planteadas.

En conclusión, la información por sí sola no soluciona los problemas a los que nos enfrentamos. Es necesario tener un buen entendimiento del problema a investigar, para identificar qué y cuánta información se necesita.

ANALISIS ESTADÍSTICO

Una de las etapas importantes en el proceso de investigación se relaciona con la sistematización y análisis de la información. Esta etapa que se conoce como la de Análisis Estadístico de la Información, es una disciplina que se define como la ciencia de la recolección, análisis, interpretación y presentación de información que puede expresarse en forma numérica.

Por tanto, la Estadística tiene una gran importancia en la tarea de generar conocimiento acerca de las características de una estructura, o de un proceso dado, y en general en la solución de los problemas de investigación.

La estadística se basa en la existencia de las técnicas que conforman un cuerpo completo de métodos para clasificar, describir e inferir algo a partir de información numérica.

ESTADISTICA DESCRIPTIVA

Cuando el investigador ha recolectado la información que necesita para su investigación, procede al análisis descriptivo de las variables bajo estudio, es decir describe lo que ha encontrado en su investigación, sin la capacidad de poder inferir conclusiones.

Page 3: El análisis de informaciòn

ANÁLISIS DESCRIPTIVO

1. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE CUADROS O TABLAS

1.1 Tabla o cuadro estadístico: Es un conjunto de filas y columnas.

Estructura de una tabla:

1. Número ( cuando hay varias tablas)2. Título (¿Qué?, ¿Cuándo?, ¿Dónde?)3. Encabezamiento (referente a la primera fila) es donde se indica la

naturaleza (las categorías de la variable) del contenido de cada columna.4. Columna matriz. Aquí es designada la naturaleza (las modalidades de la

variable) del contenido de cada fila,5. Cuerpo. Donde se consignan los datos.6. Pie (fuente de aclaraciones necesarias: Fuente, notas, comentarios).

Ejemplo:

Tabla N º 1

ALUMNOS DE LA URP CLASIFICADOS SEGÚN FACULTAD Y SEXOSEGÚN MATRICULA 2008 (*)

FACULTAD TOTAL SEXOMasculino Femenino

TOTALCiencias ContablesDerechoIngenieríaPsicología

Fuente: Oficina de Matrícula.(*) Los datos se refieren al semestre 2008-1

1

2

4

6

5

3

Page 4: El análisis de informaciòn

1.2 Tabulación de datos

Tabulación.- Es ordenar la información en una tabla y contar.

Conceptos

Sea X una característica de la población en estudio que toma diferentes valores xi, i= 1,……, k

Frecuencia absoluta de un dato (fi )

Llamaremos frecuencia absoluta de un valor x de la variable estadística X, al número de veces que aparece repetido dicho valor en el conjunto de observaciones.

Frecuencia relativa de un dato (hi )

Frecuencia relativa de un valor observado xi de la variable X , al cociente entre su frecuencia absoluta (f ) y el número de observaciones realizadas (n) y se denota por hi = fi / n, i=1,…KSe expresa en términos de porcentajes.

Frecuencia absoluta acumulada (Fi )

La frecuencia absoluta acumulada de un valor x de la variable X es igual a la suma de los valores inferiores o iguales a dicho valor.

Frecuencia relativa acumulada (Hi )

Se llama frecuencia relativa acumulada de un valor x de una variable X, al cociente entre su frecuencia absoluta acumulada y el número de observaciones realizadas (n).Se denote por Hi = Fi /n

Propiedades de las frecuencias

Sea n el número total de observaciones realizadas de la variable X que toma valores xi

1.fi = n2.hi = 1 ó 100%3.Fk = n4.Hk = 15.0 fi n i=1, …., k6.0 hi 1 i=1, ….. k

Page 5: El análisis de informaciòn

1.3 Tabulación de datos de una variable cualitativa

Se hace una lista de las posibles categorías de la variable y se ve cuantas veces se repite cada una.

Ejemplo:

NUMERO DE HOGARES DE LIMA METROPOLITANA SEGÚN EL TIPO DE VIVIENDA QUE OCUPAN. 2007 (*)

Tipo de vivienda fi hi

Total 80 1.00Casa independiente

5 0.06

Dpto. en edificio 25 0.31Vivienda en quinta 20 0.25Vivienda en vecindad

20 0.25

Otro 10 0.13

Fuente: INEI. Encuesta de Hogares (ENAHO).

Interpretación:

f1: 5 hogares ocupan casas independientes.h1: El 6% de los hogares ocupan casas independientes.

1.4 Tabulación de datos de una variable discreta ( de recorrido corto)

Sea una variable discreta X cuyos valores observados son x1 , x2 ……xk

Se hace una lista de los diferentes valores que toma la variable, se ordena en forma ascendente y se ve cuantas veces se repite cada valor.

Valores de X

fi hi Fi Hi

Total n 1x1 f1 H1 F H1

x2 f2 H2 F H2

. . . . .xK fK hK FK = n HK = 1

Page 6: El análisis de informaciòn

Ejemplo:

Sean 12 alumnos clasificados según el número de cursos aprobados en el último semestre:

3, 2, 2, 3, 3, 3, 7, 6, 5, 1, 4, 4

Sea X: Número de cursos aprobados

X fi hi Fi Hi

Total 12 1.001 1 0.08 1 0.082 2 0.17 3 0.253 4 0.33 7 0.584 2 0.17 9 0.755 1 0.08 10 0.836 1 0.08 11 0.927 1 0.08 12 1.00

Interpretación:

f3 = 4, hay 4 alumnos que han aprobado 3 cursos.h6 = 0.08, el 8% de los alumnos han aprobado 5 cursos.F4 = 9, existen 9 alumnos que han aprobado a lo más 4 cursos.H5 = 0.83, el 83 % de los alumnos han aprobado a lo más 5 cursos.

1.5 Tabulación de datos cuantitativos de variable continua y de variable discreta ( de recorrido amplio)

Cuando se trata de datos de una característica cuantitativa de variable continua se tienen que formar intervalos sucesivos que abarquen todo el recorrido.Igualmente si tenemos una característica cuantitativa de variable discreta de recorrido amplio no conviene enumerar uno a uno los valores que toma sino conviene formar intervalos.

Reglas para la construcción de una tabla (distribución de frecuencias) 1. Determinación del recorrido o rango de los datos (R)

Rango = Valor máximo - valor mínimo

2. Determinación del número de intervalos ( I )

a) Se calcula de forma tentativa y aproximada.b) Existen fórmulas para su cálculo:

I = 5, sí n = 5I = , sí n>25

Fórmula de Sturges: I = 1+ 3.22 log(n)

Page 7: El análisis de informaciòn

3. Determinación de la amplitud del intervalo ( A ) A = R / I

4. Determinación de los límites del intervalo.Se debe tomar el resultado numérico más bajo como el límite inferior del primer intervalo. Luego agregar A para obtener el límite superior y así sucesivamente.

Ejemplo:

En una oficina de prensa, el tiempo requerido para armar la totalidad de la página editorial fue registrada durante 50 años. Los datos aproximados a la décima de minuto más cercana, se dan enseguida:

20.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8 20.125.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.523.7 20.3 23.5 19.0 25.1 25.0 19.5 24.1 24.2 21.821.3 21.5 23.1 19.9 24.2 24.1 19.8 23.9 22.8 23.919.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7

Construya la distribución de frecuencias para el tiempo.

Solución:

Rango = 25.3 - 19.0 = 6.3I = = = 7.07, aprox. 7 intervalosA = R / I = 6.3 / 7 = 0.9

Tiempo para armar la totalidad de la página editorial

Tiempo fi hi Fi Hi

Total 50 1.00[ 19.0 - 19.9 ) 5 0.10 5 0.10[ 19.9- 20.8 ) 6 0.12 11 0.22[ 20.8 - 21.7 ) 9 0.18 20 0.40[ 21.7 - 22.6 ) 5 0.10 25 0.50[ 22.6 - 23.5 ) 7 0.14 32 0.64[ 23.5 - 24.4 ) 14 0.28 46 0.92[ 24.4 - 25.3 ) 4 0.08 50 1.00

Interpretación:

f 3 : Durante 9 años el tiempo requerido fue entre 20.8 y 21.6 minutos.h3 : En el 18% de los años se tomó entre 20.8 y 21.6 minutos.F3 : En 20 años el tiempo requerido fue entre 19.0 y 21.6 minutos.H3: en el 40% de los años se requirió entre 19.0 y 21.6 minutos.

2. PRESENTACION GRAFICA DE VARIABLES

Page 8: El análisis de informaciòn

2.1 Presentación grafica de variables cualitativas

Barras.- Se usan cuando la variable tiene muchas categorías.

a) Simples

b)Componentes

Page 9: El análisis de informaciòn

Circulares.- Cuando la variable tiene pocas categorías.

Page 10: El análisis de informaciòn

2.2 Presentación grafica de variables discretas (de recorrido corto) Gráfica de las frecuencias absolutasVaras o bastones de anchura igual a cero.

2.3 Presentación grafica de variables continuas o discretas (de recorrido amplio)

Gráfica de las frecuencias absolutas

Histograma.- Es una figura compuesta por una serie de rectángulos contiguos en que cada uno debe tener un área proporcional a la frecuencia del intervalo respectivo.

Polígono.- Se construye uniendo los puntos medios de la parte superior de cada rectángulo del histograma.

1 2 3 4 5 6 7

fi

xi

Page 11: El análisis de informaciòn