Web semantica

22
Web Semántica Proyecto: crawler o spider sobre linio.com.mx & mercadolibre.com.mx http://soyprogramador.liz.mx/ 1 http://soyprogramador.liz.mx/

Transcript of Web semantica

Page 1: Web semantica

Web Semántica

Proyecto:

crawler o spider sobre

linio.com.mx &

mercadolibre.com.mx

http://soyprogramador.liz.mx/1http://soyprogramador.liz.mx/

Page 2: Web semantica

Web Semántica

Por web semántica se entiende una forma de organizar el contenido

en la Web que mejore la cooperación entre computadoras y humanos.

Esto pasa por avanzar de una web de documentos a una web de

datos enlazados en la que se puedan ofrecer novedosos servicios que

hagan uso del potencial de combinar e interrelacionar datos de

diversa índole y procedencia.

2http://soyprogramador.liz.mx/

Page 3: Web semantica

Historia

Web 1.0

• Páginas estáticas

• El uso de framesets o Marcos

Web 2.0

• El auge de los blogs

• Redes sociales

• Las webs creadas por los usuarios

• AJAX

Web 3.0 Semántica

• Bases de datos

• XML, RDF y microformatos

• Inteligencia artificial

• Clasificando la información

http://www.estudioseijo.com/noticias/web-10-web-20-y-web-30.htm3http://soyprogramador.liz.mx/

Page 4: Web semantica

Buscador normal

4http://soyprogramador.liz.mx/

Page 5: Web semantica

Buscador semántico

5http://soyprogramador.liz.mx/

Page 6: Web semantica

RDF, SPARQL, y OWL

Para obtener esa adecuada definición de los

datos, la Web Semántica utiliza esencialmente

RDF, SPARQL, y OWL, mecanismos que

ayudan a convertir la Web en una

infraestructura global en la que es posible

compartir, y reutilizar datos y documentos entre

diferentes tipos de usuarios.

http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica#

6http://soyprogramador.liz.mx/

Page 7: Web semantica

RDF?

Se basa en XML

RSS (Muy usado y popular)

http://web.resource.org/rss/1.0/

CFDI (Factura electrónica)

7http://soyprogramador.liz.mx/

Page 8: Web semantica

RDF como FOAF

FOAF es un proyecto de Web Semántica, que permite crear

páginas Web para describir personas, vínculos entre ellos, y cosas

que hacen y crean. Se trata de un vocabulario RDF, que permite

tener disponible información personal de forma sencilla y

simplificada para que pueda ser procesada, compartida y

reutilizada.

Con esta descripción, los datos personales serán compartidos en la

Web pasando a formar parte de un motor de búsqueda donde será

posible descubrir información a cerca de una persona en concreto de

una forma sencilla y rápida.

http://www.ldodds.com/foaf/foaf-a-matic.es.html

8http://soyprogramador.liz.mx/

Page 9: Web semantica

Ejemplo RDF (FOAF)

9http://soyprogramador.liz.mx/

Page 10: Web semantica

Micro formatos

Enfocado para los usuarios y maquinas, especialmente para los primeros,

los micro formatos son un conjunto de formatos de datos simples,

construidos sobre las normas existentes y ampliamente adoptados.

En lugar de tirar lo que funciona hoy, los micro formatos tienen la intención

de resolver problemas sencillos y organizar la información.

10http://soyprogramador.liz.mx/

Page 11: Web semantica

Micro formatos

Sin micro formatos Con micro formatos11http://soyprogramador.liz.mx/

Page 12: Web semantica

Uso de micro formatos

Eventos

Calendarios

Información producto

Entrada (post)

Dirección

Tarjeta presentación

etc

http://microformats.org/wiki/microformats2

Organizando la información ya existente en la web

http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms#title 12http://soyprogramador.liz.mx/

Page 13: Web semantica

Micro formatoEjemplo de h-card

Ejemplo de h-product

http://microformats.org/code/hcard/creator

13http://soyprogramador.liz.mx/

Page 14: Web semantica

RDFa

RDFa es en esencia una generalización de los atributos de los

elementos meta y link de XHTML. La a minúscula que se añade a las

siglas RDF es precisamente la inicial de la palabra "atributos".

14http://soyprogramador.liz.mx/

Page 15: Web semantica

RDFa

http://www.w3.org/TR/rdfa-lite/#bib-MICRODATA

No aporta conocimiento alguno para el motor de busqueda

Sabemos que se trata de una persona, conocemos su nombre,

teléfono y sitio web, aporta mucha mas información.

15http://soyprogramador.liz.mx/

Page 16: Web semantica

Web semántica

http://blogs.fad.unam.mx/...1/web_semantica.pdf 16http://soyprogramador.liz.mx/

Page 17: Web semantica

17http://soyprogramador.liz.mx/

Page 18: Web semantica

Web semántica

Proyecto:

crawler o spider

Sobre linio.com.mx & mercadolibre.com.mx

Asiendo uso de la web semántica

18http://soyprogramador.liz.mx/

Page 19: Web semantica

¿Qué es un crawler o spider?

Las arañas (también llamadas "spiders") de los motores

de búsqueda, recorren las páginas recopilando

información sobre los contenidos de las páginas.

Cuando se busca una información concreta en los

buscadores, ellos consultan su base de datos y

presentan resultados clasificados por su relevancia para

esa búsqueda concreta. Los buscadores pueden

almacenar en sus bases de datos desde la página de

entrada de cada web, hasta todas las páginas que

residan en el servidor, una vez que las arañas (spiders)

las hayan reconocido e indexado.

19http://soyprogramador.liz.mx/

Page 20: Web semantica

¿Qué es un crawler o spider?

Los crawlers se pueden usar para varias cosas, lo más

común es que se usen para:

Analizar los enlaces de un sitio para buscar links rotos.

Recolectar información de un cierto tipo, como precios

de productos para armar un catálogo.

etc.

20http://soyprogramador.liz.mx/

Page 21: Web semantica

Herramientas para la web

semántica

http://answers.semanticweb.com/q

uestions/75/which-tools-and-

libraries-do-you-use-to-develop-

semantic-web-applications 21http://soyprogramador.liz.mx/

Page 22: Web semantica

Herramientas online

http://dbpedia.org/sparql

Editor donde podremos probar el uso de SPARQL

Tutorial sobre RDF

http://www.obitko.com/tutorials/ontologies-

semantic-web/rdf-elements.html

Top 10 productos de web semantica 2010

Introducción a Link data

Ontologías ejemplos

RDF en Wikipedia

DataSets22http://soyprogramador.liz.mx/