Web semantica

Post on 19-Jul-2015

110 views 0 download

Transcript of Web semantica

Web Semántica

Proyecto:

crawler o spider sobre

linio.com.mx &

mercadolibre.com.mx

http://soyprogramador.liz.mx/1http://soyprogramador.liz.mx/

Web Semántica

Por web semántica se entiende una forma de organizar el contenido

en la Web que mejore la cooperación entre computadoras y humanos.

Esto pasa por avanzar de una web de documentos a una web de

datos enlazados en la que se puedan ofrecer novedosos servicios que

hagan uso del potencial de combinar e interrelacionar datos de

diversa índole y procedencia.

2http://soyprogramador.liz.mx/

Historia

Web 1.0

• Páginas estáticas

• El uso de framesets o Marcos

Web 2.0

• El auge de los blogs

• Redes sociales

• Las webs creadas por los usuarios

• AJAX

Web 3.0 Semántica

• Bases de datos

• XML, RDF y microformatos

• Inteligencia artificial

• Clasificando la información

http://www.estudioseijo.com/noticias/web-10-web-20-y-web-30.htm3http://soyprogramador.liz.mx/

Buscador normal

4http://soyprogramador.liz.mx/

Buscador semántico

5http://soyprogramador.liz.mx/

RDF, SPARQL, y OWL

Para obtener esa adecuada definición de los

datos, la Web Semántica utiliza esencialmente

RDF, SPARQL, y OWL, mecanismos que

ayudan a convertir la Web en una

infraestructura global en la que es posible

compartir, y reutilizar datos y documentos entre

diferentes tipos de usuarios.

http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica#

6http://soyprogramador.liz.mx/

RDF?

Se basa en XML

RSS (Muy usado y popular)

http://web.resource.org/rss/1.0/

CFDI (Factura electrónica)

7http://soyprogramador.liz.mx/

RDF como FOAF

FOAF es un proyecto de Web Semántica, que permite crear

páginas Web para describir personas, vínculos entre ellos, y cosas

que hacen y crean. Se trata de un vocabulario RDF, que permite

tener disponible información personal de forma sencilla y

simplificada para que pueda ser procesada, compartida y

reutilizada.

Con esta descripción, los datos personales serán compartidos en la

Web pasando a formar parte de un motor de búsqueda donde será

posible descubrir información a cerca de una persona en concreto de

una forma sencilla y rápida.

http://www.ldodds.com/foaf/foaf-a-matic.es.html

8http://soyprogramador.liz.mx/

Ejemplo RDF (FOAF)

9http://soyprogramador.liz.mx/

Micro formatos

Enfocado para los usuarios y maquinas, especialmente para los primeros,

los micro formatos son un conjunto de formatos de datos simples,

construidos sobre las normas existentes y ampliamente adoptados.

En lugar de tirar lo que funciona hoy, los micro formatos tienen la intención

de resolver problemas sencillos y organizar la información.

10http://soyprogramador.liz.mx/

Micro formatos

Sin micro formatos Con micro formatos11http://soyprogramador.liz.mx/

Uso de micro formatos

Eventos

Calendarios

Información producto

Entrada (post)

Dirección

Tarjeta presentación

etc

http://microformats.org/wiki/microformats2

Organizando la información ya existente en la web

http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms#title 12http://soyprogramador.liz.mx/

Micro formatoEjemplo de h-card

Ejemplo de h-product

http://microformats.org/code/hcard/creator

13http://soyprogramador.liz.mx/

RDFa

RDFa es en esencia una generalización de los atributos de los

elementos meta y link de XHTML. La a minúscula que se añade a las

siglas RDF es precisamente la inicial de la palabra "atributos".

14http://soyprogramador.liz.mx/

RDFa

http://www.w3.org/TR/rdfa-lite/#bib-MICRODATA

No aporta conocimiento alguno para el motor de busqueda

Sabemos que se trata de una persona, conocemos su nombre,

teléfono y sitio web, aporta mucha mas información.

15http://soyprogramador.liz.mx/

Web semántica

http://blogs.fad.unam.mx/...1/web_semantica.pdf 16http://soyprogramador.liz.mx/

17http://soyprogramador.liz.mx/

Web semántica

Proyecto:

crawler o spider

Sobre linio.com.mx & mercadolibre.com.mx

Asiendo uso de la web semántica

18http://soyprogramador.liz.mx/

¿Qué es un crawler o spider?

Las arañas (también llamadas "spiders") de los motores

de búsqueda, recorren las páginas recopilando

información sobre los contenidos de las páginas.

Cuando se busca una información concreta en los

buscadores, ellos consultan su base de datos y

presentan resultados clasificados por su relevancia para

esa búsqueda concreta. Los buscadores pueden

almacenar en sus bases de datos desde la página de

entrada de cada web, hasta todas las páginas que

residan en el servidor, una vez que las arañas (spiders)

las hayan reconocido e indexado.

19http://soyprogramador.liz.mx/

¿Qué es un crawler o spider?

Los crawlers se pueden usar para varias cosas, lo más

común es que se usen para:

Analizar los enlaces de un sitio para buscar links rotos.

Recolectar información de un cierto tipo, como precios

de productos para armar un catálogo.

etc.

20http://soyprogramador.liz.mx/

Herramientas para la web

semántica

http://answers.semanticweb.com/q

uestions/75/which-tools-and-

libraries-do-you-use-to-develop-

semantic-web-applications 21http://soyprogramador.liz.mx/

Herramientas online

http://dbpedia.org/sparql

Editor donde podremos probar el uso de SPARQL

Tutorial sobre RDF

http://www.obitko.com/tutorials/ontologies-

semantic-web/rdf-elements.html

Top 10 productos de web semantica 2010

Introducción a Link data

Ontologías ejemplos

RDF en Wikipedia

DataSets22http://soyprogramador.liz.mx/