Conceptos Administracion Informacion

25
Bases de datos Conceptos de administración de información Ing. Rosa Navarrete

description

gestión y administrador base de datos

Transcript of Conceptos Administracion Informacion

Page 1: Conceptos Administracion Informacion

Bases de datos Conceptos de administración de información Ing. Rosa Navarrete

Page 2: Conceptos Administracion Informacion

Sílabo

• 1. CONCEPTOS DE ADMINISTRACIÓN DE INFORMACIÓN • 1.1 Almacenamiento y recuperación• 1.2 Captura y representación• 1.3 Búsqueda y recuperación• 1.4 Análisis e indexamiento• 1.5 Confiabilidad, seguridad, escalabilidad, eficiencia

2

Page 3: Conceptos Administracion Informacion

Almacenamiento de Información (Information Storage) • El almacenamiento de la información se refiere a la

disposición persistente de datos que se conservan parasu acceso (de acuerdo a su propósito y vigencia),generalmente desde los sistemas informáticos.

• El almacenamiento está relacionado con la disposición alargo plazo, por tanto no se considera comoalmacenamiento formal de datos, los mecanismos dealmacenamiento temporal en memoria principal (chipsde silicio de la RAM o memoria de acceso aleatorio).

• El almacenamiento externo se refiere al uso dedispositivos de almacenamiento secundarios o auxiliares,los cuales son capaces de conservar la información demanera permanente.

Page 4: Conceptos Administracion Informacion

Almacenamiento de información

• La tecnología de almacenamiento actual utilizatodo tipo de soportes. Por ejemplo, sistemasWORM, bibliotecas de cintas y bibliotecasvirtuales.

• En los últimos años, los sistemas SAN y NAS handemostrado su excelente fiabilidad.

Page 5: Conceptos Administracion Informacion

• Las unidades SAN (Storage Area Network)pueden ser rack (armarios) gestionan más quecientos de discos duros, con más de 50 terabytesde capacidad

• Las unidades NAS (Network Attached Storage)son unidades independientes que cuentan consistemas operativos y de archivos propios ygestionan los discos duros que llevanconectados.

Tecnologías de almacenamiento

Page 6: Conceptos Administracion Informacion

• Los sistemas de discos duros SAN Serial ATA(SATA) se están convirtiendo en una manerarentable de disponer de gran capacidad dealmacenamiento.

• Otras tecnologías de almacenamiento, comoiSCSI, DAS (Direct Attached Storage), Near-LineStorage (datos adjuntos en soportes extraíbles) yCAS (Content Attached Storage), tambiénproporcionan disponibilidad.

Tecnologías de almacenamiento

Page 7: Conceptos Administracion Informacion

• Los sistemas que manejan datos, como Bases dedatos, Data-Warehouse, Meta-Datos, Data-Mining, Cloud entre otros, son utilizados pararegistrar datos, con una estructura lógica,organizada y almacenada para su explotación.

• La explotación se refiere a almacenar, buscar,recuperar y actualizar información.

Sistemas de almacenamiento de Información

Page 8: Conceptos Administracion Informacion

Bases de Datos (Databases)

• Es un conjunto de datos relacionadoscoherentemente que almacenan información.

• La información esta organizada y almacenada, parasu explotación.

• Los usuarios puedan buscar, recuperar y actualizarlos datos que necesitan, a través de lenguajesespecíficos que permiten formular consultas(expresión lógica sobre la información).

• Las consultas permiten la identificación de unsubconjunto lógico de la base de datos, es decir, unaselección de registros que cumplen la condiciónlógica.

Page 9: Conceptos Administracion Informacion

Data Warehouse

• Almacenamiento de grandes volúmenes dedatos (generalmente datos históricos).

• Se subdividen a veces en unidades lógicas máspequeñas, Datamarts, dependientes de la lógicade agrupación de los datos.

• Generalmente utilizadas para procesamientoanalítico de los datos (Sistemas de ayuda en ladecisión (DSS), Sistemas de informaciónejecutiva (EIS) o herramientas para hacerconsulta o informes).

Page 10: Conceptos Administracion Informacion

Data Mining

• Data-Mining es un proceso para extraerinformación útil a partir de grandes cantidadesde datos.

• Explotación del Data Warehouse.• Transformar la información disponible en

conocimiento útil para el contexto.

Page 11: Conceptos Administracion Informacion

Meta Datos

• Sus funciones principales son la localización,identificación y descripción de recursos, legiblese interpretables a través de computador.• Metadatos para la conservación, preservar los

recursos de información.• Metadatos técnicos, informar sobre los

requerimientos técnicos del hardware osoftware

• Metadatos de uso, informar sobre el nivel deutilización, tipo de usuarios, etc.

Page 12: Conceptos Administracion Informacion

Cloud

• La nube es un avance en el suministro detecnología de la información y los servicios.

• Proporciona acceso bajo demanda a un conjuntocompartido de recursos informáticos, de formadinámica a escala.

• Ventajas en costes, rapidez y eficiencia.• Función principal, almacenar datos de Base de

datos como servicio (DBaaS), específicamente entorno a la información confidencial que sealmacena en la nube.

Page 13: Conceptos Administracion Informacion

Sistemas de Recuperación de Información (Information Retrieval System)• Calvin N. Moores fue el primero en introducir el

término information retrieval, en el año 1950,basado en organización; búsqueda y sistematizacióny generación de técnicas. “La búsqueda deinformación en un stock de documentos, efectuadaa partir de la especificación de un tema”.

• Jean Tague Sutcliffe identificó las variables quedefinen a la recuperación de información como:

• Campo de estudio; colección de documentos o basesde datos; representación de la información;usuarios; consultas y frases u oraciones de búsquedao estrategia de búsqueda; intermediarios debúsqueda; proceso de búsqueda y evaluación de labúsqueda.

Page 14: Conceptos Administracion Informacion

• Salton en 1983, define: “La recuperación de lainformación tiene que ver con la representación,almacenamiento, organización y acceso a los ítem deinformación”. Indica que, en principio, no debenexistir limitaciones a la naturaleza del objetoinformativo

• Baeza-Yates incorpora la reflexión siguiente: “Larepresentación y organización debería proveer alusuario un fácil acceso a la información en la que seencuentre interesado. Desafortunadamente, lacaracterización de la necesidad informativa de unusuario no es un problema sencillo de resolver”.

Sistemas de Recuperación de Información

Page 15: Conceptos Administracion Informacion

Sistemas de Recuperación de Información

Recuperación de datos

Recuperación de información

Acierto Exacto Parcial, el mejorInferencia Algebraica InductivaModelo Determinístico PosibilísticoLenguaje deconsulta

FuertementeEstructurado

Estructurado oNatural

Especificaciónconsulta Precisa Imprecisa

Error en larespuesta Sensible Insensible

Page 16: Conceptos Administracion Informacion

Sistemas de Recuperación de Información

Documentos

Base de Datos

Recuperación

Necesidad de Información

DocumentosRelevantes

Documentos no Relevantes

Page 17: Conceptos Administracion Informacion

Modelos de un SRIModelo Descripción

Modelos clásicos Incluye los tres más comúnmente citados:booleano, espacio vectorial y probabilístico.

Modelosalternativos Están basados en la Lógica Fuzzy.

Modelos lógicosBasados en la Lógica Formal. Larecuperación de información es un procesoinferencial.

Modelos basadosen lainteractividad

Incluyen posibilidades de expansión delalcance de la búsqueda y hacen uso deretroalimentación por la relevancia de losdocumentos recuperados.

Modelos basadosen la InteligenciaArtificial

Bases de conocimiento, redes neuronales,algoritmos genéticos y procesamiento dellenguaje natural.

Page 18: Conceptos Administracion Informacion

• Almacenamientos estructurados, recuperaciónestructurada.

• Recuperación de información en las bibliotecas(semi-estructurada)

• World Wide Web: La evolución lógica de los SRIha sido hacia la web, donde han encontrado unaalta aplicación práctica y un aumento delnúmero de usuarios, especialmente en el campode los directorios y motores de búsqueda.

Evolución

Page 19: Conceptos Administracion Informacion

Captura y representación

• La captura y representación de información constituyen parte del procesamiento de datos.

• La captura se refiere a la obtención del dato. • Un dato es un símbolo lingüístico o numérico o de índole

visual (pixel) o audible, que representa ya sea algo concreto como abstracto.

• Datos + contexto, implica información.• La captura implica técnicas eléctricas, electrónicas o

mecánicas usadas para manipular datos para el empleo humano o de máquinas.

• Para la representación se definen formatos estandarizados que permiten la interpretación de los símbolos que se capturan.

Page 20: Conceptos Administracion Informacion

Análisis de datos

• El Análisis de Datos (Data Analysis) se refiere a la exploración sistemática de volúmenes de datos en bruto (estructurados o no) orientado a buscar comportamientos o información que pueda ser deducida.

• Implica el proceso de inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, lo que sugiere conclusiones, y apoyo a la toma de decisiones.

• El análisis de datos se distingue de la extracción de datos por su alcance, su propósito y su enfoque sobre el análisis.

• Los extractores de datos clasifican inmensos conjuntos de datos usando software sofisticado para identificar patrones no descubiertos y establecer relaciones escondidas.

• El análisis de datos se centra en la inferencia, el proceso de derivar una conclusión basándose solamente en lo que conoce el investigador.

• Fundamenta los Sistemas de información para la decisión, utilizados en entornos empresariales.

• Se usa en las ciencias, para verificar o reprobar modelos o teorías existentes.

Page 21: Conceptos Administracion Informacion

Análisis de datos

• El análisis de datos incluye por ejemplo, el procesamiento analítico en línea (OLAP) hasta el análisis CRM en centros de llamadas.

• Los bancos y las compañías de tarjetas de crédito, por ejemplo, analizan los retiros y los patrones de gasto para prevenir el fraude o robo de identidad.

• Las compañías de comercio electrónico (Ecommerce) examinan el tráfico en el sitio web o los patrones de navegación para determinar qué clientes son más o menos propensos a comprar un cierto producto o servicio, basándose en compras previas o patrones de visualización.

• El análisis de datos moderno normalmente usa tableros de información que se basan en flujos de datos en tiempo real.

• El llamado análisis en tiempo real implica análisis e informes dinámicos basados en los datos que introducidos en un sistema un minuto antes del tiempo actual de uso.

Page 22: Conceptos Administracion Informacion

Análisis de datos

• Análisis exploratorio de datos (EDA), donde se descubren nuevas características en los datos,

• Análisis confirmatorio de datos (CDA), donde se prueba si las hipótesis existentes son verdaderas o falsas.

• El análisis cuantitativo de datos (QDA) es usado en las ciencias sociales para sacar conclusiones de datos no numéricos, como palabras, fotografías o videos.

Page 23: Conceptos Administracion Informacion

Indexamiento

• El indexamiento se refiere a ordenar una serie de datos o informaciones de acuerdo a un criterio común a todos ellos, para facilitar su consulta y análisis.

• Indexar datos almacenados depende de cuál es su estructura, base de datos, datawarehouse, etc.

• El indexamiento en bases de datos produce información estructurada de apoyo que permite el ordenamiento y la localización directa de información.

• El indexamiento requiere de estructuras previamente acordadas y de algoritmos que manejen dichas estructuras para mantenerlas actualizadas, conforme la información sea agregada, modificada o eliminada.

Page 24: Conceptos Administracion Informacion

Indexamiento

• El índice de una base de datos es una estructura de datos que mejora la velocidad de las operaciones, por medio de identificador único de cada fila de una tabla, permitiendo un rápido acceso a los registros de una tabla en una base de datos.

• El índice tiene un funcionamiento similar al índice de un libro, guardando parejas de elementos: el elemento que se desea indexar y su posición en la base de datos. Para buscar un elemento que esté indexado, sólo hay que buscar en el índice dicho elemento para, una vez encontrado, devolver el registro que se encuentre en la posición marcada por el índice.

• Los índices son construidos sobre árboles B, B+, B* o sobre una mezcla de ellos, funciones de cálculo u otros métodos.

Page 25: Conceptos Administracion Informacion

Confiabilidad, seguridad, escalabilidad y eficiencia • Respecto de las características de calidad que debe reunir el

entorno de soporte de la información almacenada. • En el caso de las bases de datos, los DBMS (Data Base

Management System).• Confiabilidad, soporte seguro de la información almacenada,

no susceptible a pérdidas por eventos no programados. • Seguridad, acceso por perfiles a la información.• Escalabilidad, crecimiento horizontal (incorporación de nuevas

tablas o nuevos campos en tablas) y vertical (volumen de registros) de las bases de datos. También se refiere a la escalabilidad del hardware de soporte.

• Eficiencia, respuesta exitosa ante la gestión de los datos (tiempo, exactitud).