Instituto nacional de estadística

29
INSTITUTO NACIONAL DE ESTADÍSTICA Recuperación de la información

Transcript of Instituto nacional de estadística

Page 1: Instituto nacional de estadística

INSTITUTO NACIONAL DE ESTADÍSTICA

Recuperación de la información

Page 2: Instituto nacional de estadística

PRESENTACIÓN

Esta presentación consta de dos bloques

principales:

Introducción a la recuperación de

Información

Instituto Nacional de Estadística (INE)

Page 3: Instituto nacional de estadística

ÍNDICE DE LA PRESENTACIÓN

Dentro de la Introducción a la recuperación de

información podemos encontrar los siguientes

módulos:

- ¿Cómo se lleva a cabo?

- Ruido y silencio documental

- Sistema de recuperación de información

- Herramientas para recuperar información

- Navegación vs recuperación de información

- Técnicas de recuperación de información

Page 4: Instituto nacional de estadística

ÍNDICE DE LA PRESENTACIÓN

Dentro del INE podemos encontrar los siguientes módulos:

- Introducción

- ¿Qué es el INEbase?

- ¿Qué clasificación temática sigue la organización primaria de la información?

- El IOE

- La organización de la información

- El programa PC- Axis

- Operaciones estadísticas de INEbase

- Vídeo: Trabajando con la base de datos del INE

Page 5: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

¿CÓMO SE LLEVA A CABO?

El proceso de recuperación se lleva a

cabo mediante consultas a la base de datos

donde se almacena la información

estructurada, mediante un lenguaje de

interrogación adecuado.

Dependiendo del tipo de búsqueda se pueden

recuperar multitud de documentos o

simplemente un número muy reducido.

Page 6: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

¿QUÉ ES EL SILENCIO DOCUMENTAL?

Son aquellos documentos almacenados

en la base de datos pero que no han sido

recuperados, debido a que la estrategia de

búsqueda ha sido demasiado específica o

que las palabras claves utilizadas no son

las adecuadas para definir la búsqueda.

Page 7: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

¿QUÉ ES EL RUIDO DOCUMENTAL?

Son aquellos documentos recuperados

por el sistema pero que no son relevantes.

Esto suele ocurrir cuando la estrategia de

búsqueda que se ha definido es

demasiado genérica.

Page 8: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

SISTEMA DE RECUPERACIÓN DE INFORMACIÓN

Proceso donde se accede a una

información previamente

almacenada, mediante herramientas

informáticas que permiten establecer

ecuaciones de búsqueda específicas.

Page 9: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

HERRAMIENTAS PARA RECUPERAR INFORMACIÓN

Bases de datos

Internet: Revistas

electrónica, buscadores, directorios, metabu

scadores, buscadores selectivos, programas

para buscar y agentes inteligentes.

Page 10: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

NAVEGACIÓN VERSUS RECUPERACIÓN DE INFORMACIÓN

Navegación:

- Obtiene la información

a través del hipertexto.

- La adquisición de

conocimiento se realiza

paulatinamente y

dependiendo del interés

del usuario se

profundiza a través de

los nodos de

información en una

materia u otra.

Recuperación de

información:

La información se

obtiene de forma lineal.

Page 11: Instituto nacional de estadística

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Sistemas de recuperación de lógica

difusa:

Permiten establecer consultas con frases

normales, de forma que la máquina al

realizar la búsqueda elimina signos de

puntuación, artículos, etc.

Page 12: Instituto nacional de estadística

Técnicas de ponderación de términos:

Los documentos recuperados se encuentran

en función del valor obtenido en la

ponderación. El valor depende de los

términos pertinentes que contenga el

documento y la frecuencia con que se

repita.

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Page 13: Instituto nacional de estadística

Técnica de clustering:

Se atribuye unos valores que actúan como

agentes para agrupar los documentos por

orden de importancia, mediante algoritmos

ranking.

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Page 14: Instituto nacional de estadística

Técnicas de retroalimentación por relevancia:

Pretende obtener el mayor número de

documentos relevantes tras establecer varias

estrategias de búsqueda.

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Page 15: Instituto nacional de estadística

Técnicas de stemming:

Lo que pretende es eliminar las posibles

confusiones semánticas que se puedan dar en

la búsqueda de un concepto, para ello trunca

la palabra y busca solo por la raíz.

INTRODUCCIÓN A LA RECUPERACIÓN DE INFORMACIÓN

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Page 16: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

La Ley de 31 de diciembre de 1945 crea el Instituto Nacional deEstadística, que tiene como misión la elaboración yperfeccionamiento de las estadísticasdemográficas, económicas y sociales ya existentes, la creaciónde otras nuevas y la coordinación con los servicios estadísticosde las áreas provinciales y municipales.

La Ley fue publicada en el BOE del 3 de enero de 1946.

Además de regular la coordinación entre otros serviciosestadísticos como el Servicio Sindical de Estadística, la Leycrea el Consejo Superior de Estadística. El Instituto Nacional deEstadística se organiza en Servicios Centrales, Delegacionesprovinciales y Delegaciones en los Ministerios.

Page 17: Instituto nacional de estadística

El INE nos permite recuperar información

a través de su base de

datos, denominada INEbase.

Mediante esta base de datos podemos

realizar una observación de toda la

información que el INE almacena en

Internet.

EL INSTITUTO NACIONAL DE ESTADÍSTICA

Page 18: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

¿QUÉ ES INEBASE?

Es el sistema que utiliza el INE para el

almacenamiento de la información estadística

en internet. Contiene toda la información que

el INE produce en formatos electrónicos.

Page 19: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

¿QUÉ CLASIFICACIÓN TEMÁTICA SIGUE LA

ORGANIZACIÓN PRIMARIA DE LA INFORMACIÓN?

La organización primaria de la

información sigue la clasificación temática

del Inventario de Operaciones

Estadísticas de la Administración General

del Estado (IOE).

Page 20: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

INVENTARIO DE OPERACIONES ESTADÍSTICAS DE LA

ADMINISTRACIÓN GENERAL DEL ESTADO (IOE)

El Inventario de Operaciones Estadísticas

de la Administración General del Estado

es un repertorio de las operaciones

estadísticas realizadas por el Instituto

Nacional de Estadística, los Ministerios, el

Banco de España y el Consejo General

del Poder Judicial.

Page 21: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

LA ORGANIZACIÓN DE LA INFORMACIÓN

Se accede a las operaciones estadísticas

a través

la lista completa de operaciones de

INEbase

O

los menús temáticos

Page 22: Instituto nacional de estadística

Para cada operación estadística

existe

Una página que da acceso a toda la

información relativa a la misma

EL INSTITUTO NACIONAL DE ESTADÍSTICA

LA ORGANIZACIÓN DE LA INFORMACIÓN

Page 23: Instituto nacional de estadística

Los resultados detallados

incluyen

los últimos resultados publicados

Y

la historia reciente de la estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

LA ORGANIZACIÓN DE LA INFORMACIÓN

Page 24: Instituto nacional de estadística

Los ficheros de datos se pueden visualizar

desde

INEbase

O

PC-Axis

EL INSTITUTO NACIONAL DE ESTADÍSTICA

LA ORGANIZACIÓN DE LA INFORMACIÓN

Page 25: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

EL PROGRAMA PC-AXIS

Pc-Axis es el formato en que el INE edita ydifunde la mayor parte de su producciónestadística a través de su página web, en elapartado INEbase. Este formato requiere tenerel programa PC-Axis instalado.

Trabajando con los ficheros PC-axis seconsiguen ventajas en cuanto a presentación dela información, ordenación y anidamiento de lasvariables, exportación a múltiples formatos yanálisis gráfico y geográfico.

Page 26: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

OPERACIONES ESTADÍSTICAS DE INEBASE

Entorno físico y medio ambiente

Demografía y población

Sociedad

Economía

Entorno físico y medio ambiente

Ciencia y tecnología

Agricultura

Industria, energía y construcción

Servicios

Clasificaciones y estándares

Internacional

Síntesis estadística

Banco de series Tempus2

Page 27: Instituto nacional de estadística

EL INSTITUTO NACIONAL DE ESTADÍSTICA

TRABAJANDO CON LA BASE DE DATOS DEL INE

Page 29: Instituto nacional de estadística

TRABAJO REALIZADO POR:

Cruz Osorio Martín

Ana Belén Pacheco Mora

Málaga, 23 de mayo de

2012