FACULTAD DE INGENIERÍA ARQUITECTURA Y URBANISMO
ESCUELA DEINGENIERÍA DE INGENIERIA INDUSTRIAL
“LINKED DATA Y SU ALINEACION CON EL
GOBIERNO DE TI”
CURSO:
REDES DE COMPUTADORAS II
DOCENTE:
ING. CARRIÓN BARCO GILBERTO
AUTORES :
MONTEJO PIZARRO WILLIAN
PARRA SERQUEN JORGE
PIMENTEL, 25 Junio del 201
LINKED DATA
INTRODUCCION
La revolución provocada por el fenómeno de la Web 2.0 ha hecho que ahora cualquier
persona, independientemente de sus conocimientos técnicos, pueda publicar
información en la Web. Como consecuencia, nos encontramos ante un escenario
caracterizado por la masificación de contenidos en la Red, precisando el ser humano
de algún tipo de intermediario “inteligente” capaz de extraer, procesar y localizar de
forma autónoma la información requerida. La nueva “Web de los Datos”, también
conocida como “Web 3.0” o “Web Semántica”, sienta los cimientos de este futuro
inmediato, creando una red de nodos con información multidisciplinar que puede ser
explorada por aplicaciones software sin necesidad de la intervención humana. La
iniciativa Linked Open Data (LOD), impulsada por Tim Berners Lee (creador de la Web),
define los mecanismos que dan forma a esta nueva Internet, en la que los datos ya no
están cautivos en silos propietarios, sino que pueden ser libremente compartidos y
reutilizados por agentes software. Un nodo de la red Linked Data se caracteriza
porque, además de mantener los datos propios de su dominio de interés, define
enlaces a otros con información relacionada o complementaria.
LA INICIATIVA DE LINKED OPEN DATA
El modo en el que la información se publica en Internet ha sufrido una profunda
evolución durante los últimos años. Desde las primeras publicaciones de datos en la
Web a principios de los 90, basadas en textos estáticos, hasta los actuales modelos de
publicación de la información basados en blogs, redes sociales y foros, se puede
afirmar que han cambiado no solo las tecnologías sino también los paradigmas
subyacentes. La Web actual se basa en un diseño sencillo, accesible e intuitivo para el
ser humano. Este interpreta la información presentada en pantalla y accede a nuevos
datos mediante una serie de hiperenlaces incluidos en el documento que está
consultando.
Resulta paradójico que la principal razón del éxito de la Web se haya convertido en
uno de los principales desafíos a resolver a la hora de evolucionar cara a un nuevo
modelo de acceso a la información en el que el ser humano, abrumado por la ingente
cantidad de datos disponibles en la Red, precisa de un intermediario (un agente
software) que se encargue de explorar la Web, descubrir y procesar los datos buscados
y presentarlos finalmente en un entorno amigable.
La “Web de los Documentos”, accesible y entendible únicamente por el ser humano, se
convierte así en la “Web de los Datos”, accesible y entendible también por las
máquinas. Para hacer realidad la “Web de los Datos” es preciso definir un mecanismo
que permita a los agentes software “interpretar” (manipular simbólicamente) la
información disponible en Internet. La primera y más básica especificación en este
sentido definida por el W3C es el modelo RDF.
Una declaración RDF toma la forma de una tripla compuesta de un sujeto, un objeto, y
un predicado que determina la relación que une sujeto y objeto.
RDF garantiza la interoperabilidad sintáctica de los datos, queda por resolver el
problema de la interoperabilidad semántica de los mismos. Para ello es preciso
establecer un consenso sobre el significado concreto de los términos (nombre de
conceptos y relaciones) que existen en un dominio particular.
La Web Semántica dispone de un instrumento específico para realizar esta labor, la
ontología, entendiendo como tal una “especificación explícita de una
conceptualización”, que puede ser descrita formalmente mediante la especificación
RDFS o bien, si la potencia semántica de esta no es suficiente, mediante OWL, ambas
especificaciones basadas en RDF definidas por el W3C.
Desde un punto de vista tecnológico existen básicamente dos estrategias para la
publicación de la información en esta nueva Web. La primera, más continuista, pasa
por enriquecer las páginas web existentes, expresadas en HTML, con anotaciones RDF
(utilizando las directrices establecidas en la especificación RDF), que aportan contexto
e información procesable por un ente automatizado al documento. Esta aproximación,
aunque sencilla en su concepción, incrementa la complejidad en la creación y
mantenimiento de las páginas web, por lo que en los últimos años ha ganado fuerza
una iniciativa alternativa: Linked Open Data.
La iniciativa Linked Data basa su funcionamiento en tecnologías y estándares
ampliamente aceptados, cimentándose en 4 principios básicos:
1. Utiliza de URI como nombres para objeto de información.
2. Utilización del protocolo HTTP para que las personas pueda buscar esos
nombres.
3. Cuando alguien busque un URL, proporcionar información útil, utilizando las
normas (RDF,SPARQL).
4. Incluir enlaces a otras entidades mediante URI para potenciar el
descubrimiento de nuevos elementos de información que puedan ser
relevantes para el usuario.
EVOLUCION DEL CRECIMIENTO DEL LINKED DATA.
Mayo 2007
Julio 2009
Setiembre 2011
CREACIÓN Y PUBLICACIÓN DE UN NODO LINKED DATA
En este apartado se describe el proceso de creación de un nodo Linked Data orientado
a la publicación
En este proceso se realizan los siguientes pasos:
A. Definir la terminología (ontología)
El primer paso consiste en definir la ontología que identifica los términos (en
particular los nombres de los conceptos y de las relaciones) que se van a utilizar
para describir la información a publicar.
En la actualidad existen multitud de bases de datos y otro tipo de registros
electrónicos que almacenan información nutricional de alimentos. Por tanto,
para el desarrollo de la ontología es conveniente realizar un estudio previo de
los esquemas utilizados en estos registros, basándonos en nuestro caso en la
USDA (Database for Nutrition Information).
B. Populación
Consiste en recopilar la información que se desea exponer a través del nodo Linked Data y registrarla en formato RDF haciendo uso de los términos identificados en la ontología.
Para ello se ha creado un script semiautomatizado encargado de:
1. Extraer la información de interés del catálogo de la USDA.2. Identificar potenciales conflictos.3. expresar dicha información en forma de triplas RDF.4. Almacenar los datos en un almacén RDF (en nuestro caso se ha utilizado
el Virtuoso Universal Server20).
C. Configuración del nodo
Linked Data no define un patrón concreto para asignar un nombre único (una
URI) a los recursos, por lo que cada nodo puede seleccionar el esquema que
considere más conveniente. En nuestro caso, el patrón seleccionado combina
un prefijo común (el espacio de nombres propio del nodo), seguido de un sufijo
que identifica la clase del recurso y su identificador USDA.
D. Vinculación con otros nodos
Tras configurar nuestro nodo hemos alcanzado los tres primeros principios
básicos de los cuatro establecidos en Linked Data, restando el establecimiento
de relaciones con otras entidades. Uno de los procedimientos más comunes
para realizar esta labor es el record linkage, proceso definido en la literatura
especializada como la “identificación y relación de diferentes registros en
fuentes de datos heterogéneas que hacen referencia al mismo objeto en el
mundo real”.
GOBIERNO DE TI
“El gobierno de las TI es el alineamiento
estratégico de las TI con la organización de
forma tal que se consigue el máximo valor de
negocio por medio del desarrollo y
mantenimiento de un control y
responsabilidades efectivas, gestión del
desempeño y gestión de riesgos de las TI”.
Es el conjunto de acciones que realiza el área
de TI en coordinación con la alta dirección
para movilizar sus recursos de la forma más eficiente en respuesta a requisitos
regulatorios, operativos o del negocio.
Constituye una parte esencial del gobierno de la empresa en su conjunto y aglutina la
estructura organizativa y directiva necesaria para asegurar que TI soporta y facilita el
desarrollo de los objetivos estratégicos definidos.
Garantiza que:
TI está alineada con la estrategia del negocio.
Los servicios y funciones de TI se proporcionan con el máximo valor posible o
de la forma más eficiente.
Todos los riesgos relacionados con TI son conocidos y administrados y los
recursos de TI están seguros.
LINKED DATA ALINEADO CON EL GOBIERNO DE TI
El gobierno de las TI está demostrando su efectividad y rendimiento a la hora de
obtener el máximo valor de las TI para las organizaciones. El 65% de los responsables
TI que ya han implantado estos sistemas reconocen que son efectivos o muy efectivos.
La publicación de la norma ISO 38500 en 2008, ha supuesto un gran respaldo para el
reconocimiento de la importancia de los sistemas de gobierno de las TI y se ha
convertido en un referente y un excelente punto de partida para la implantación de
estos sistemas.
Los objetivos principales de la norma ISO 38500 son:
Asegurar que, si la norma es seguida de manera adecuada, las partes
implicadas (directivos, consultores, ingenieros, proveedores de hardware,
auditores, etc.), puedan confiar en el gobierno corporativo de TIC.
Informar y orientar a los directores que controlan el uso de las TIC en su
organización.
Proporcionar una base para la evaluación objetiva por parte de la alta dirección
en el gobierno de las TIC.
Gobierno corporativo de TI Norma ISO 38500
El Gobierno de TI y la norma ISO/IEC 38500 proporcionan un marco de principios para
que la dirección de las organizaciones los utilice al evaluar, dirigir y monitorizar el uso
de las tecnologías de la información y comunicaciones (TIC) con el objetivo de cumplir
con los siguientes 6 principios u objetivos:
Responsabilidad: Todo el mundo debe comprender y aceptar sus
responsabilidades en la oferta o demanda de TI. La responsabilidad sobre una
acción lleva aparejada la autoridad para su realización.
Estrategia: La estrategia de negocio de la organización tiene en cuenta las
capacidades actuales y futuras de TI. Los planes estratégicos de TI satisfacen las
necesidades actuales y previstas derivadas de la estrategia de negocio.
Adquisición: Las adquisiciones de TI se hacen por razones válidas, basándose
en un análisis apropiado y continuo, con decisiones claras y transparentes. Hay
un equilibrio adecuado entre beneficios, oportunidades, costes y riesgos.
Rendimiento: Las TI están dimensionadas para dar soporte a la organización,
proporcionando los servicios con la calidad adecuada para cumplir con las
necesidades actuales y futuras.
Conformidad: La función de TI cumple todas las legislaciones y normas
aplicables. Las políticas y prácticas al respecto están claramente definidas,
implementadas y exigidas.
Factor Humano: Las políticas, prácticas y decisiones de TI demuestran respecto
al factor humano, incluyendo las necesidades actuales y emergentes de todo el
personal involucrado.
Redes Temáticas del Gobierno de TI
Red Temática de Linked Data de España.
La red temática española de Linked Data se creó en enero del 2011 con el
objetivo de facilitar el intercambio y transferencia de conocimientos en el área
de la Web de Datos (también conocida como Linked Data o, en español, Red de
Datos Enlazados), entre grupos de investigación nacionales asociados a
Universidades, Centros Tecnológicos, administraciones públicas y empresas.
La red, dirigida por Oscar Corcho del Ontology Engineering Group, fue
financiada durante los años 2011 y 2012 por el Ministerio de Ciencia e
Innovación, inicialmente, y luego por la Secretaría de Estado de Investigación,
Desarrollo e Innovación, dependiente del Ministerio de Economía y
Competitividad. A pesar de no contar con financiación a partir del año 2013, sus
actividades se seguirán realizando con la colaboración de los miembros activos.
Red Temática de Linked Data del Reino Unido
Después de los problemas recientes y eventos que afectan las
implementaciones piloto del Gobierno del Reino Unido Linked Data, pensé que
sería útil proporcionar una actualización en nombre del Gobierno del Reino
Unido Vinculado del Grupo de Trabajo de Datos - Equipo de inicio rápido, que
tuvo su primera reunión el lunes.
En primer lugar, un problema en el servidor interrumpe el acceso a los
depósitos de origen de varios de los conjuntos de datos de Linked Data y los
datos vinculados API páginas finales de fuente para los conjuntos de datos
como http://education.data.gov.uk y http://transport.data. gov.uk .
En segundo lugar, Talis Systems Ltd, que alojan varios de los data.gov.uk activos
Linked Data ha anunciado el inminente cierre de su servicio de hosting.
Se está trabajando para restablecer estos servicios. Estamos transfiriendo los
datos y el frente API asociada termina de utilizar un conjunto de software de
código abierto que se ejecutan en la infraestructura cloud de productos
básicos.
Conceptos del Tema:
RDF:
Es un modelo de datos para los recursos y las relaciones que se puedan establecer
entre ellos. Aporta una semántica básica para la este módulo de datos que puede
representarse mediante XML.
TRIPLE:
Es una relación entre el sujeto, propiedad y un objeto.
SPARQL:
Es un lenguaje de consulta sobre RDF, que permite hacer búsquedas sobre los recursos
de la web Semántica utilizando fuentes de datos.
URL:
Es un localizador de recursos uniforme (uniform resource locator), es una secuencia de
caracteres, de acuerdo a un formato modélico y estándar, que se usa para nombrar
recursos en Internet para su localización o identificación.
WEB SEMANTICA:
Es una Web extendida, dotada de mayor significado en la que cualquier usuario en
Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla
gracias a una información mejor definida
Top Related