PresentacióN De La Tesis

35
Presenta: Adriana Cortés Montano Asesor: Dr. Carlos Arturo Torres Gastelú

description

 

Transcript of PresentacióN De La Tesis

Page 1: PresentacióN De La Tesis

Presenta:

Adriana Cortés Montano

Asesor:

Dr. Carlos Arturo Torres Gastelú

Page 2: PresentacióN De La Tesis

1.1 Planteamiento del problemaLa red actual es una estructura diseñada para el intercambio de

información de las personas. Las páginas Web son creadas por humanos para ser entendidas por humanos. Sin embargo actualmente no existe un formato común para mostrar información, es por esto, que los desarrolladores de páginas Web hacen sus páginas con base en los usuarios que pueden visitarlas o simplemente con el formato que más se ajuste a sus necesidades.

Los buscadores Web de este momento realizan búsquedas de información mediante palabras claves que puedan aparecer en el código HTML de las páginas Web de la Internet. Sin embargo existe una carencia de clasificación entre las diversas páginas que existen en la red, ya que, con los estándares actuales no se puede diferenciar entre información personal, académica, comercial, etc. No hay duda de que Internet ofrece ventajas enormes cuando buscamos información, sin embargo le falta maneras de encontrarla de forma precisa e inteligente.

Page 3: PresentacióN De La Tesis

1.1.1 Pregunta de investigación¿Cómo crear una ontología para la Web

Semántica basada en el lenguaje de marcado OWL?

 1.1.2 Propuesta de solución a la problemáticaProponer un modelo de ontologías para la Web

Semántica basado en OWL.

Page 4: PresentacióN De La Tesis

1.2.1 Objetivo generalIdentificar un modelo adecuado para la creación de

ontologías, con base en el lenguaje de marcado OWL. 1.2.2 Objetivos específicosDefinir el lenguaje OWL y sus orígenes como apoyo de

la Web Semántica.Explicar en que consiste el lenguaje de marcado OWL y

determinar las ventajas de aplicar OWL en la Web Semántica.

Exponer un caso de éxito en una empresa donde se haya aplicado el lenguaje OWL.

Proponer un modelo que se adecue al propósito de la investigación.

Page 5: PresentacióN De La Tesis

1.2.5 Método de desarrollo de la propuesta

La estrategia aplicada a esta investigación consiste en un tipo de investigación descriptivo no experimental; ya que dentro de su contenido, se aborda el lenguaje de marcado OWL, elaborando una imagen para el lector acerca de sus ventajas y uso, por medio de una clara descripción y un análisis profundo. Un estudio descriptivo busca especificar las propiedades de cualquier fenómeno que sea sometido a análisis.

En este caso, el lenguaje de marcado OWL es mostrado a detalle y posteriormente analizado. Sus componentes son medidos y evaluados, presentando los resultados del análisis como propuesta de esta tesis. En este estudio descriptivo se seleccionan una serie de cuestiones tales como la reutilización, el grado de semántica que aporta a los datos y la variedad de aplicaciones basadas en este lenguaje. Posteriormente se mide cada una de ellas independientemente para así puntualizar el motivo de la investigación.

Page 6: PresentacióN De La Tesis

“El primer paso es poner los datos en la Web en una forma que las máquinas puedan naturalmente entenderlos, o convertirlos a esa forma. Esto crea lo que yo llamo una Web Semántica: una red de datos que pueden ser procesados directa o indirectamente por maquinas” (Berners-Lee, 1999).

Page 7: PresentacióN De La Tesis

“La apuesta más ambiciosa es la factibilidad de una Web con un enfoque semántico. Más allá de complejas cuestiones técnicas, se trata de máquinas conversando entre sí, haciendo de la red una gran biblioteca inteligente o bien un sistema operativo distribuido, donde los usuarios programan el comportamiento de los diferentes flujos de datos, convirtiendo a Internet en un sistema neuronal, capaz de entenderse a sí mismo” (Cruz, 2007).

Page 8: PresentacióN De La Tesis

Un proyecto ambicioso

La Web Semántica no es un concepto novedoso. Web 3.0

La necesidad de la WebAumento exponencial en la cantidad de información

en la Internet.Una red tonta.Web del futuro será “inteligente” ya que estará

llena de información que las máquinas podrán comprender y a partir de la cual extraerán conclusiones que sean útiles para el usuario.

Ejemplo de aplicación: RSS

Page 9: PresentacióN De La Tesis

¿Qué es la Web Semántica?Iniciativa de Tim Berners-Lee , Ora Lassila y

James Hendler.Web extendida dotada de mayor significado y

búsquedas más rápidas.Gracias a ella se puede delegar tareas al

software.

Page 10: PresentacióN De La Tesis
Page 11: PresentacióN De La Tesis
Page 12: PresentacióN De La Tesis

Lenguaje de marcado.Marcado de presentación.Marcado de procedimientos.Marcado descriptivo o semántico.

Ventajas de usar XML.Formato Universal.Se puede desarrollar el esquema tal como lo

deseemos y pedir a otros que lo sigan.Cada quien puede trabajar en su propia

plataforma.

Page 13: PresentacióN De La Tesis

¿Por qué RDF?XML no da ningún significado acerca del

sentido semántico de los datos.Más que un lenguaje es un modelo de datos.La construcción es a base de tripletas (sujeto,

propiedad, objeto).

Page 14: PresentacióN De La Tesis

Elemento importante de la Web Semántica.Surge de la filosofía.Las ontologías son especificaciones formales,

explicitas de conceptualizaciones compartidas.Taxonomías y tesauros.Elementos que deben contener una ontología.

Clases. Instancias.Las relaciones entre ellas.Propiedades.Funciones y procesos.Limitaciones y reglas.

Page 15: PresentacióN De La Tesis

Gracias al conocimiento almacenado en las ontologías, las aplicaciones podrán extraer automáticamente datos de las páginas Web, procesarlo y sacar conclusiones de ellos, así como tomar decisiones y negociar con otros agentes o personas.

Para poder explotar la Web Semántica, se necesitan lenguajes de marcado apropiados que representen el conocimiento de las ontologías.

Mayor expresividad que RDF.

Page 16: PresentacióN De La Tesis

Los niveles de representación necesitados para los modelos de ontologías son:Sintaxis.Estructura.Semántica.Pragmática.

Principales lenguajes:SHOEOILDAML+OILKIFFOAFOWL

Page 17: PresentacióN De La Tesis

Ventajas de las ontologías.Mejora en la búsqueda de información en la Web.Favorece la interoperabilidad.Comprueba la validez de los datos.Son útiles para organizar las colecciones de

recursos multimedia.Se usarán para programar agentes inteligentes, que

entenderán e integrarán las informaciones procedentes de distintas fuentes.

Facilitan el comercio electrónico.Dotan a los datos de semántica comprensible para

las máquinas y permiten la automatización de muchos procesos.

Page 18: PresentacióN De La Tesis

Entonces, ¿Es suficiente XML y RDF para que la Web Semántica sea posible?XML ofrece la interoperabilidad sintáctica.RDF ofrece la interoperabilidad semántica.

RDF tiene muchas carencias. No es lo suficientemente completo para describir los recursos de la Web con el detalle necesario.

Se usan porque es tan general porque puede emplearse en muchos dominios y sirve como puente entre vocabularios.

Page 19: PresentacióN De La Tesis

OWL es el acrónimo del inglés Ontology Web Language, un lenguaje de marcado para publicar y compartir datos usando ontologías en la WWW.

Tiene como objetivo facilitar un modelo de marcado construido sobre RDF y codificado en XML

RDF es muy limitada en predicados binarios, jerarquía de subclase y jerarquía de propiedad.

Esta diseñado para ser usado en aplicaciones que necesitan procesar el contenido de la información en lugar de solo representar información.

Page 20: PresentacióN De La Tesis

Los lenguajes anteriores a OWL no fueron definidos para ser compatibles con la arquitectura de la WWW ni mucho menos para la Web Semántica.

OWL rectifica esto proporcionando un lenguaje que utiliza la conexión proporcionada por RDF para añadir las siguientes capacidades a las ontologías: Capacidad de ser distribuidas a través de varios

sistemas. Escalable a las necesidades Web. Compatible con los estándares Web de accesibilidad

e internacionalización. Abierto y extensible.

Page 21: PresentacióN De La Tesis

La necesidad de utilizar OWL recae en que:La Web del futuro ofrece información con un

sentido explicito, permitiendo que las máquinas puedan procesar automáticamente e integrar la información disponible en la Web.

Se espera que las máquinas hagan tareas útiles de razonamiento sobre estos documentos y para esto el lenguaje debe ir más allá de la semántica básica de RDF.

OWL añade más vocabulario para describir propiedades y clases por ejemplo: relaciones entre clases, cardinalidad, igualdad, más tipos de propiedades, características de propiedades y clases enumeradas.

Page 22: PresentacióN De La Tesis

Proporciona tres lenguajes: cada uno con nivel de expresividad mayor que el anterior.OWL Lite está diseñado para aquellos usuarios

que necesitan principalmente una clasificación jerárquica y restricciones simples.

OWL DL está diseñado para aquellos usuarios que quieren la máxima expresividad conservando integridad y resolubilidad.

OWL Full está dirigido a usuarios que quieren máxima expresividad y libertad sintáctica de RDF sin garantías computacionales.

Page 23: PresentacióN De La Tesis

Elementos básicos de una ontología OWL:Sintaxis.Encabezado.Elementos de clases.Elementos de propiedad.Restricciones de propiedad.Propiedades especiales.Combinaciones booleanas.Enumeraciones.Instancias.Tipos de datos.Información de la versión.

Page 24: PresentacióN De La Tesis
Page 25: PresentacióN De La Tesis

La mayoría de las páginas Web están generadas de bases de datos.

Hay otros casos en donde los datos estructurados pueden ser extraídos con relativa facilidad de las páginas Web que siguen una platilla usando hojas de estilo XSLT.

SearchMonkey (SearchMonkey, 2008) reutiliza los datos estructurados para mejorar los resultados de búsqueda expuestos con beneficios para búsquedas de usuarios, desarrolladores y publicistas de contenido Web.

Page 26: PresentacióN De La Tesis

El conocimiento de los datos y su semántica permite presentar la página de una manera mucho más informativa, atractiva y concisa.

Beneficios para los publicadores: pueden esperar más clics y un flujo de tráfico de más alta calidad a su sitio.

Beneficios para los usuarios: la posibilidad de optar y tener un sistema libre de spam.

Para lograr esto la Galería de Aplicación Yahoo permite a los usuarios optar selectivamente por una particular aplicación SearchMonkey.

Page 27: PresentacióN De La Tesis

Las páginas

que son

confiables por

la máquina de

búsquedas

basadas en

otras métricas

pueden

esperar

también que

contengan

metadatos

confiables.

Page 28: PresentacióN De La Tesis

La representación de datos es un aspecto crucial para SearchMonkey.

Beneficios clave de la tecnología semántica:Las tecnologías semánticas prometen

representaciones más flexibles que las que actualmente ofrecen las tecnologías de XML.

Los micro-formatos son representados en RDF por medio del uso del vocabulario OWL para micro-formatos populares.

Page 29: PresentacióN De La Tesis

Definiciones de OWL de los vocabularios de SearchMonkey:

searchmonkey-action.owl: desempeña una acción, enlaza un proceso o tarea, o manda notificaciones dentro de un dominio de información.

searchmonkey-commerce.owl muestra información variada recopilada acerca de los negocios.

searchmonkey-feed.owl muestra información de un canal de información o feed de un sistema de trabajo en red.

Page 30: PresentacióN De La Tesis

searchmonkey-job.owl muestra información comúnmente encontrada en una descripción de trabajo de negocios o reclutamiento de puestos.

searchmonkey-media.owl muestra información detallada de varios tipos de media, presentaciones, especificaciones y objetos.

searchmonkey-product.owl muestra información detallada acerca de productos o manufactura cuando se busca un objeto para ordenarlo.

searchmonkey-resume.owl muestra información de un curriculum vitae.

Page 31: PresentacióN De La Tesis

SearchMonkey, no solo ha cumplido con metas inmediatas, sino que esta bien preparado para el futuro, con una Web cada vez mas orientada a los datos semánticos gracias a la aplicación de OWL.

Page 32: PresentacióN De La Tesis

Modelo que plantean Grigoris Antoniou y Frank van Harmelen.

Exponen más que pasos, escenarios para el desarrollo de las ontologías.

Entre los escenarios se pueden distinguir:1. Determinar alcances.2. Considerar la reutilización.3. Enumerar los términos.4. Definir las taxonomías.5. Definir las propiedades.6. Definir las facetas.7. Definir instancias.8. Checar anomalías.

Page 33: PresentacióN De La Tesis

Lenguaje Facilitador : OWLLenguaje desarrollado para la WWW.Tecnología bastante útil si queremos aplicar

semántica de gran calidad y contener metadatos útiles y confiables a futuros Portales Web basados en ontologías

La adquisición de conocimiento completamente automática esta lejos de ser alcanzada, pero la apuesta por OWL es dar el primer paso para lograr los propósitos de la Web Semántica.

Page 34: PresentacióN De La Tesis

Relevancia de la Web actual.Hacia una Web “inteligente”.Apoyo de diversas herramientas y tecnologías

unas con otras para lograr este propósito.Dos elementos importantes de la Web

Semántica: las ontologías y los lenguajes ontologicos.

Deficiencia en la expresividad de XML y RDF que en cambio sí ofrece OWL.

Lenguaje creado para la WWW y específicamente la Web Semántica.

Page 35: PresentacióN De La Tesis

No existe un método o una metodología estandarizada para la creación de las ontologías con OWL.

Método que plantea Grigoris Antoniou y Frank van Harmelen que está enfocado a la reutilización.

El ahorro de tiempo y recursos económicos es relevante.

La apuesta por OWL y el modelo propuesto es el camino que facilita lograr las metas de automatización total del conocimiento, que aunque se forjan poco a poco, no son imposibles de ser alcanzadas.