Diccionario Datos
-
Upload
adrian-duran-melendez -
Category
Documents
-
view
8 -
download
0
description
Transcript of Diccionario Datos
Capítulo 21. Gestión de Metadatos
Además de la gestión de datos, administradores de bases tienen que ser capaces de gestionar y
controlar la definición de los elementos de datos utilizados en las bases de datos. Sin una
comprensión de la estructura, las limitaciones, la definición y descripción de los datos, es probable
que los datos van a ser mal interpretadas o mal utilizados. Además, los datos que no está bien
definida puede causar problemas de integridad de la base de datos.
¿Qué son los metadatos?
¿Alguna vez has visto el programa de "Antiques Roadshow" en la televisión? En este espectáculo, la
gente trae artículos a anticuarios profesionales tenerlos examinadas y evaluadas. Los participantes
esperan aprender que sus artículos son tesoros perdidos hace mucho tiempo de un valor inmenso. Los
anticuarios siempre pasan mucho tiempo hablando con los propietarios sobre sus artículos. Ellos
siempre hacen preguntas como "¿De dónde sacaste este material?" y "¿Qué me puede decir sobre su
historia?" ¿Por qué? Debido a que estos detalles proporcionan conocimiento sobre la autenticidad y
la naturaleza de la partida. El distribuidor también examina cuidadosamente el artículo, en busca de
marcas y las fechas que brindan pistas sobre el origen del artículo.
Los usuarios de los datos deben ser capaces de ponerlo en contexto antes de los datos se vuelve útil
como información. Información sobre los datos se conoce como metadatos. La definición más simple
de los metadatos son "datos sobre datos". Para ser un poco más precisos, los metadatos describen
datos, proporcionando información como el tipo, duración, descripción textual, y otras
características. Por ejemplo, los metadatos permite al usuario saber que el número de cliente es un
campo numérico de cinco dígitos, mientras que los datos en sí podría ser 56.789.
Los metadatos son "datos sobre datos".
Por lo tanto, el uso de nuestro ejemplo "Antiques Roadshow", el elemento que se está evaluando es el
"datos". Las respuestas a las preguntas de los anticuarios y las marcas en el tema son los "metadatos".
El valor se asigna a un elemento sólo después de los metadatos sobre ese tema se descubre y se
evalúa.
Metadatos caracteriza datos. Se utiliza para proporcionar la documentación que los datos puedan ser
comprendidas y más fácilmente consumidos por su organización. Metadatos contesta el quién, qué,
cuándo, dónde, por qué y cómo las preguntas de los usuarios de los datos.
A partir de datos de conocimiento y más allá El bloque básico de construcción del conocimiento es de datos. Data es un hecho representado como
un elemento o evento fuera de contexto y sin relación con otros hechos. Ejemplos de datos son 27,
JAN, y 010110. Sin más detalles, no sabemos nada acerca de cualquiera de estos tres datos.
Considere lo siguiente:
• Es 27 un número en base diez, o es en octal (que se traduciría a 23 en base diez)?
• Si 27 es un número en base diez, ¿qué representa? Es una edad, una cantidad de dinero, un
coeficiente intelectual, una talla de zapatos, o algo completamente distinto?
• ¿Qué representa ENE? ¿Es el nombre de una mujer (o el nombre de un hombre)? ¿O
representa el primer mes del año? O tal vez es algo completamente distinto?
• Por último, ¿Qué pasa con 010.110? ¿Es un número binario? ¿O es una representación de
una fecha, tal vez 01 de enero 1910? 01 de enero 2010? O algo completamente distinto?
Datos es un hecho representado como un elemento o evento fuera de contexto.
Debido a la falta de contexto, todos estos son ejemplos de datos. Información, por otro lado, añade
contexto mediante la especificación de relaciones entre los datos, y posiblemente otra información.
Los datos en el contexto de metadatos hace que la información. Las relaciones pueden representar
información, sin embargo, las relaciones no constituyen en realidad la información hasta que se
entienden. Además, las relaciones que representan los datos tienen una tendencia a ser limitado en su
contexto, en su mayoría en el pasado o presente, con poca o ninguna incidencia en el futuro.
Nuevo Diccionario Colegiado de Webster define el conocimiento como "el hecho o condición de
saber algo con familiaridad adquirida a través de la experiencia o de la asociación." Conocimiento
añade la comprensión y la retención a la información. Es el siguiente paso natural después de la
información. Para tener "conocimiento" requiere información junto con los patrones entre los datos,
la información y otros conocimientos. Por lo tanto, las parejas de conocimiento de información con
la comprensión y la cognición.
El paso final sería pasar del conocimiento a la sabiduría. La sabiduría puede ser pensado como
conocimiento aplicado. Usted puede tener la certeza de que los alimentos grasos son malas para ti,
pero si se comen todos modos, no es sabio.
Sabiduría se puede pensar en el conocimiento como aplicada.
Para que los datos sean algo más que simples datos, se requiere metadatos. Sin metadatos, los datos
no identificable significado no es más que una colección de dígitos, caracteres o bits. Metadatos da
datos de su forma y permite su uso por profesionales de la información.
Estrategia de Metadatos
Una organización sabio desarrollará una estrategia de metadatos para recoger, gestionar y
proporcionar un vehículo para acceder a los metadatos. Una estrategia de metadatos de sonido debe
tratar los siguientes puntos:
• Una directiva de cómo metadatos se utiliza en la organización
• Procedimientos para la identificación y definición de propiedad de los datos y la
administración
• Identificación de los tipos de metadatos que deben recogerse
• Una descripción de la finalidad para cada tipo de metadatos que se identifica-una razón clara
y concisa por qué cada pieza de metadatos es requerido por la organización
• Los métodos para la recogida y almacenamiento de metadatos (normalmente utilizando un
repositorio) • Métodos de acceso a los metadatos
• Las políticas destinadas a hacer cumplir los procedimientos de custodia de datos y la
seguridad de acceso a los metadatos
• Identificación de fuentes de metadatos, tanto internos como externos
• Medidas para medir la calidad y facilidad de uso de los metadatos
Metadatos difunde y apoya a los datos de su organización produce y mantiene. Por el montaje y
gestión de metadatos, su organización tendrá acceso a los datos pertinentes acerca de sus datos, por
lo que sus sistemas sean más utilizables y las bases de datos más útiles.
DBAs deben participar en el equipo que desarrolla la estrategia de metadatos, pero la organización de
administración de datos, si existe, debe ser el líder de los esfuerzos de los metadatos.
Datos Administración
Un mayordomo de datos es responsable de las acciones
tomadas utilizando un conjunto definido de datos. Una política
de la administración de datos será identificar a los individuos
dentro de la organización cuya responsabilidad es crear,
mantener y borrar datos. Un mayordomo de datos no es
necesariamente el titular de los datos. Una política integral de
gestión de datos también definirá los consumidores de los
datos, es decir, aquellos que usan directamente los datos en el
transcurso de su trabajo.
Data Warehousing y metadatos
Las empresas que utilizan sistemas de almacenamiento de datos son más propensas que otras
empresas para que se han embarcado en una estrategia de gestión de metadatos. Los usuarios
requieren información precisa acerca de los datos contenidos en un depósito antes de que los datos
pueden ser utilizados adecuadamente para los negocios. Por lo tanto, este tipo de empresas tienen una
necesidad crítica de fácil acceso metadatos de alta calidad. Con frecuencia, sin embargo, poco o nada
de metadatos es capturado y administrado antes de la aparición de un esfuerzo de almacenamiento de
datos.
Un esfuerzo de almacenamiento de datos tiene una necesidad crítica de fácil acceso metadatos de alta
calidad.
Tipos de Metadatos
A pesar de que todos los metadatos describen datos, hay muchos tipos y fuentes de metadatos
diferentes. En un nivel fundamental, sin embargo, todos los metadatos es uno de dos tipos: de
metadatos tecnología o metadatos negocio. Metadatos Tecnología describe los aspectos técnicos de
los datos en relación con el almacenamiento y la gestión de los datos en los sistemas informáticos.
Los metadatos de negocio, por su parte, describe los aspectos de cómo los datos es utilizado por la
empresa, y es necesario para que los datos tienen un valor a la organización. Sabiendo, por ejemplo,
que la columna de la lično es un número entero positivo entre 1 y 9999999 es un ejemplo de
metadatos de la tecnología. Por supuesto, el usuario de negocios también requiere esta información.
Sabiendo que un número referido como un lično es el número de licencia profesional de los
instructores del curso certificado, que debe debe ser único, y que cada profesor puede tener uno y
sólo un número de licencia es un ejemplo de metadatos comerciales. (Aunque, estos detalles también
son también útiles para el DBA para crear la base de datos adecuada y eficaz.)
Para los administradores de bases, el propio DBMS es una buena fuente de metadatos. El catálogo
del sistema utilizado para almacenar información acerca de los objetos de base de datos es una tienda
vital de metadatos DBA metadatos-tecnología. DBAs y desarrolladores hacen uso regular de los
metadatos en el catálogo del sistema DBMS para ayudarles a entender los objetos de bases de datos y
los datos que figuran en él mejor. Dependiendo de las DBMS, el usuario puede escribir consultas en
las tablas de catálogo del sistema o puntos de vista, o puede ejecutar procedimientos almacenados
proporcionados por el sistema para devolver los metadatos de las tablas de catálogo del sistema. Casi
cualquier tipo de información descriptiva sobre la composición de los datos se pueden encontrar en el
catálogo del sistema. Por ejemplo, la mayoría de los DBMS almacenan todos los siguientes
metadatos en el catálogo del sistema:
• Los nombres de cada base de datos, tablas, columnas, índices, vistas, relación, procedimiento
almacenado, disparador, etc.
• La clave principal para cada tabla y claves externas que hacen referencia de nuevo a esa
clave primaria
• Qué tablas están en qué puntos de vista
• Tipo de datos, la longitud y las limitaciones de cada columna de cada tabla
• Los nombres de los archivos físicos utilizan para almacenar datos de bases de datos, así
como información sobre el almacenamiento de archivos, extensiones, y los volúmenes de
disco
• Autorización y seguridad de la información que detalla qué usuarios tienen qué tipo de
autoridad en la que los objetos de base de datos
• Fecha y hora del último cambio de definición de base de datos, así como el ID del usuario
que implementa el DDL para el cambio
• Información de la organización de base de datos
El catálogo del sistema DBMS es una fuente particularmente efectiva de metadatos.
El catálogo del sistema DBMS es una fuente particularmente efectiva de metadatos porque es activa,
integrada y nonsubvertible. El catálogo del sistema está activo porque los metadatos se construye y
se mantiene en forma automática a medida que se crean y modifican los objetos de base de datos. A
medida que el DBA crea las bases de datos, el DBMS recopila automáticamente y rellena los
metadatos en el catálogo del sistema. La integración del catálogo del sistema y el DBMS, junto con
el carácter activo del catálogo del sistema, mantiene los metadatos de la tecnología en el catálogo del
sistema de información precisa y actualizada. Además, el catálogo del sistema DBMS es
nonsubvertible, lo que significa que las operaciones normales de DBMS son el único mecanismo
para poblar el catálogo del sistema. Por supuesto, el subvertibility del catálogo del sistema será
diferente de DBMS DBMS. Algunos DBMS proporcionan opciones para activar actualizaciones
directas en el catálogo del sistema, pero esta opción es para ser utilizado sólo en casos de emergencia
y, en general bajo la dirección del personal de soporte técnico del proveedor de DBMS.
Aunque una gran cantidad de metadatos se puede encontrar en el catálogo del sistema, estos
metadatos DBMS suele ser insuficiente para describir completamente los datos. Por ejemplo, las
descripciones de los objetos de base de datos no se encuentran comúnmente en el catálogo del
sistema DBMS. Algunos DBMS proporcionan sistema de descripción catálogo columnas que se
pueden poblaron a discreción del DBA. Sin embargo, muchos administradores de bases evitar esto
por temor a desorganizar el catálogo del sistema. También es posible que las descripciones de los
objetos de base de datos no estaban disponibles cuando se crearon los objetos. Metadatos adicional
que es útil, pero no se encuentra en el catálogo del sistema, incluye
• Los metadatos para archivos nondatabase (plano o archivos secuenciales)
• Modificación información sobre cuándo y por quién datos en la base de datos fue modificado
ultimamente
• Información cuaderno para la tabla de base de datos (o un archivo nondatabase), así como
los programas que usan esa información
• Información sobre el empleo y las transacciones que acceden a los datos del lote
• Metadatos Operativa sobre componentes de la infraestructura de TI
• Modelo de datos de metadatos que describe el diseño de base de datos lógica y cómo se
correlaciona con la aplicación de base de datos física
• El almacenamiento de datos y la fuente de datos que definen los metadatos ETL (s), el
sistema de registro, y otra información analítica
• Propiedad de los datos y metadatos de la mayordomía
Por supuesto, esto es una lista incompleta. Existe una gran variedad de diferentes tipos de metadatos
y propósitos que pueden ser catalogados y administrado. La captura y el mantenimiento de
documentos de metadatos mejor las bases de datos y sistemas, lo que las hace más fáciles de usar.
Los más metadatos que poner a disposición de los usuarios de negocio, más valor que será capaz de
extraer de sus sistemas de información.
La captura y el mantenimiento de bases de datos y metadatos hace que los sistemas sean más fáciles
de usar.
Repositorios y diccionarios de datos
Un repositorio almacena información sobre los activos de datos de una organización. En otras
palabras, los repositorios se utilizan para almacenar metadatos. Una correctamente implementados
repositorio almacena todos los metadatos pertinentes para la corporación. Puede actuar como un
único mecanismo, centralizada para ayudar en la migración de los datos procedentes de múltiples
fuentes a un almacén de datos.
Un repositorio almacena toda metadatos pertinentes para la corporación.
En la elección de un repositorio, basar su decisión en el almacenamiento de metadatos y las
necesidades de recuperación de toda la organización, no sólo las bases de datos que desea apoyar.
Típicamente, un repositorio puede
• Almacenar información acerca de sus datos, procesos, y el medio ambiente.
• Soporte de múltiples formas de ver los mismos datos. Un ejemplo de este concepto es el
enfoque threeschema, en el que los datos se ve en los planos conceptuales, lógicos y físicos.
• Tienda documentación en profundidad, y producir de detalle y gestión de informes de esa
documentación.
• Datos de apoyo a la creación y administración de modelo. Integración con ETL popular, el
modelado de datos y herramientas CASE es también un importante criterio de evaluación.
• Soporte para el control de versiones y cambio. Versiones ayuda a sincronizar el desarrollo de
aplicaciones, eliminando la reanudación y el aumento de la flexibilidad.
• Hacer cumplir las convenciones de nomenclatura.
• Analizar y extraer los metadatos de múltiples fuentes. Por ejemplo, si su sitio es una gran
tienda COBOL, el vendedor repositorio debe ofrecer herramientas que analizan
automáticamente el código fuente COBOL para extraer metadatos.
• Generar cuadernos de definiciones de elementos de datos.
Estas son algunas de las funciones más comunes de un repositorio. Al elegir un repositorio para el
desarrollo de bases de datos, las siguientes características generalmente son deseables.
• Los almacenes de datos utilizados por el repositorio se pueden almacenar utilizando tablas de
bases de datos en su DBMS. Esto permite que las aplicaciones para leer directamente las
tablas del diccionario de datos. Por ejemplo, si usted es principalmente una tienda de Oracle,
debe favorecer el uso de un repositorio que almacena su información de metadatos en las
tablas de Oracle. Algunos productos de repositorios utilizan múltiples DBMS y permiten al
usuario elegir el DBMS a utilizar.
• El repositorio debe ser capaz de leer directamente el catálogo del sistema o puntos de vista
sobre el catálogo del sistema para cada DBMS que utiliza. Esto asegura que el repositorio
tendrá información actualizada sobre los objetos de la base.
• Si el repositorio no lee directamente el catálogo del sistema, una interfaz debe proporcionar
para simplificar la tarea de poblar el repositorio utilizando la información de catálogo del
sistema.
• El repositorio proporciona una interfaz para cualquier herramienta de modelado y diseño
utilizados para la generación de objetos de la base.
La mayoría de los productos populares son repositorios basados en mainframe y se basan en una
metadata centralizada "base de datos", o repositorio. Este enfoque es generalmente más adecuado
para la documentación de los sistemas basados en OLTP. Un depósito de este tipo puede ser más
difícil de usar en un entorno de almacenamiento de datos, ya que un foco de mainframe puede
presentar retos en la gestión de metadatos en una implementación de almacenamiento de datos
distribuida, estado-of-the-art. Muchas herramientas ETL utilizados en los proyectos de
almacenamiento de datos también contienen un repositorio que se orienta hacia las necesidades del
almacén de datos. Organizaciones que necesitan para administrar metadatos, tanto para OLTP y
almacenes de datos deben asegurarse de que los datos en sus repositorios ETL se pueden migrar con
éxito al repositorio OLTP.
Otros productos del repositorio son centrado en las aplicaciones. Tal tecnología repositorio se centra
en el desarrollo de aplicaciones de metadatos que es útil, pero no completa. Por ejemplo, el
repositorio de Microsoft se centra en Visual Studio y se centra en los activos informáticos de
Microsoft. Microsoft se ha asociado con Computer Associates, fabricantes del PLATINUM®
Repositorio, para proporcionar capacidades adicionales para toda la empresa la tecnología de
repositorio de Microsoft líder en el mercado.
Algunos productos de depósito son centrado en las aplicaciones.
Beneficios del repositorio
Repositorio tecnología ofrece muchos beneficios a las organizaciones que explotan adecuadamente
sus capacidades. Los metadatos en el repositorio puede ser utilizado para integrar puntos de vista de
varios sistemas que ayudan a los desarrolladores a entender cómo los datos es utilizado por dichos
sistemas. Los patrones de uso pueden ser analizados para determinar cómo los datos se relaciona en
formas que no pueden ser entendidos formalmente dentro de la organización. El descubrimiento de
estos patrones puede conducir a la innovación de procesos de negocio.
En general, el principal beneficio de un repositorio es la consistencia que proporciona en la
documentación de elementos de datos y reglas de negocio. El repositorio ayuda a unificar las "islas
de datos independientes" inherentes a muchos sistemas heredados. El repositorio permite a la
organización de reconocer el valor de sus sistemas heredados por programa y metadatos
operacionales que se puede utilizar para integrar los sistemas de legado con desarrollo de nuevas
aplicaciones documentar.
Un repositorio proporciona consistencia en la documentación de los elementos de datos y reglas de
negocio.
Por otra parte, un repositorio puede soportar un entorno rápidamente cambiante como las impuestas
por los esfuerzos de desarrollo de Internet en las organizaciones. Los metadatos en el repositorio
puede ser examinado para producir informes de análisis de impacto para determinar rápidamente
cómo los cambios en un área impactarán otros.
Reutilización es un gran ahorro de tiempo. Si algo se puede reutilizar en lugar de ser desarrollado
desde cero, no sólo el tiempo de ser salvos, sino también valiosos recursos se pueden implementar en
los proyectos más importantes. Repositorios facilitan la reutilización documentar componentes de la
aplicación y hacer estos metadatos a disposición de la organización.
Por último, los repositorios son una ayuda inestimable a las iniciativas de almacenamiento de datos.
Desafíos del repositorio
Uno de los mayores desafíos en la implementación y el uso de la tecnología de repositorio es
mantener el repositorio hasta a la fecha. El repositorio debe llenarse con datos de múltiples fuentes,
todos los cuales pueden cambiar en cualquier momento. Cuando la composición o estructura de los
cambios de datos de origen, sus metadatos más probable es que tenga que cambiar, también.
El proceso para poblar el repositorio es complicado y debe ser lo más automatizado posible. Referirse
aFigura 21-1. Fuentes de metadatos provienen de múltiples áreas y ubicaciones dentro de una
organización y pueden incluir
• Metadatos del componente de aplicación de las herramientas de desarrollo de programas,
programas de aplicación y bibliotecas de código
• Metadatos de Empresas de la entrada del usuario de negocios, documentos y notas
• Datos de modelado de metadatos de las herramientas de modelado de datos
• Metadatos de base de datos del catálogo del sistema DBMS
• ETL metadatos de herramientas de almacenamiento de datos
• Metadatos Operacional de operaciones automatizadas y herramientas de planificación de
trabajos
• Otros tipos de metadatos, tales como el uso de datos de metadatos de herramientas de
consulta
Figura 21-1. Rellenar el repositorio
Rellenar el repositorio es complicado.
Para tener éxito, esta información debe ser recopilada, analizada, y registrado en el repositorio de
metadatos corporativa. El proceso de integración debe tener en cuenta la frecuencia de cambio para
cada origen de metadatos. Cada vez que cambia los metadatos en la fuente, los metadatos en el
repositorio estará fuera de sincronización hasta que se escanee el metadatos de origen, capturado, y
se integra en el repositorio de nuevo.
Muchas de las tiendas no son dueños de un repositorio. Más exactamente, muy pocas tiendas poseen
un repositorio centralizado de metadatos. Además, muchas organizaciones que poseen un repositorio
no siempre aplicar los procedimientos de integración y uso adecuados, haciendo que el repositorio
para ser descuidado. Tan pronto como los metadatos en el repositorio se vence, inexacta, o
inexistente, el repositorio dejará de tener valor. Por supuesto, la culpa no es necesariamente con el
depósito de la tecnología más probable es que la culpa es de la organización que no implementa
procedimientos para mantener los metadatos en el repositorio hasta a la fecha. Por supuesto, este
esfuerzo requiere un presupuesto importante, el compromiso y el esfuerzo de los profesionales de la
gestión de datos profesionales, con el DAS y DBAs.
Muy pocas tiendas poseen un repositorio centralizado de metadatos.
Datos Diccionarios
Los diccionarios de datos fueron los precursores de la tecnología repositorio. Los diccionarios de
datos eran populares en la década de 1980. El propósito de un diccionario de datos era para gestionar
las definiciones de datos. En general, se ofrecieron automatización la pequeña usuario tenía que
introducir manualmente las definiciones. En algunos casos, el diccionario de datos se integró en los
DBMS y bases de datos podría definirse usando los metadatos en el diccionario de datos, pero esto
era productos DBMS-prerelational antes tenían catálogos del sistema.
El propósito de un diccionario de datos es gestionar las definiciones de datos.
A medida que se identifican más y más tipos de metadatos y organizaciones desean acumular y
administrar dichos metadatos, el diccionario de datos se transformó en el repositorio. El uso de
herramientas CASE, como Excelerator y Advantage Gen, para la aplicación y desarrollo de bases de
datos habilitadas más metadatos para ser capturado y mantenido durante el proceso de desarrollo.
Como desarrolladores hicieron más sofisticados con el tiempo, los diccionarios de datos se
desarrollaron para proporcionar algo más que datos atribuyen descripciones. Los productos se
volvieron capaces de rastrear las aplicaciones acceder a lo que las bases de datos. Los desarrolladores
que utilizan el diccionario de datos correctamente fueron capaces de mantener sus sistemas y
aplicaciones con más facilidad.
A decir verdad, AD / Cycle y Repository Manager iniciativas de IBM causaron gran parte de esta
transformación. A pesar de que ambas iniciativas fracasaron en última instancia, en el mercado, la
tecnología repositorio cambió para siempre por empresas de IBM en este campo. Para obtener más
información sobre las iniciativas de IBM en esta área, consulte Repository Manager de IBM / MVS
por Henry C. Lefkovits, el libro definitivo sobre el tema.
Resumen
Este capítulo sobre la gestión de metadatos ha sido necesariamente breve. Como DBA, usted tendrá
que entender el papel de los metadatos como impacta a los DBMS, bases de datos y usuarios de
bases de datos. Las organizaciones que pasan mucho tiempo en la gestión y el mantenimiento de
metadatos probablemente tendrán un administrador de datos sobre el personal. Como alternativa, el
administrador de almacenamiento de datos o arquitecto podrían centrarse en la gestión de metadatos.
DBA puede involucrarse en ciertos aspectos de la gestión de metadatos, como la selección de
repositorio, instalación y mantenimiento. Sin embargo, la mayoría de los administradores de bases
utilizarán metadatos mucho más de lo que serán llamados a almacenar, administrar y mantener los
metadatos.