1Radar Networks
Nova SpivackCEO & FounderRadar Networks
Entendiendo La web
semántica
2Radar Networks
Sobre esta charla
• Entendiendo el sector semántico
•Haciendo la web semántica más usable
• Perspectivas futuras
• Twine.com
• Preguntas y respuestas
3Radar Networks
La gran oportunidad…
El gráfico social sólo conecta personas
Gente
Grupos
El gráfico semántico lo conecta todo…
EmailsCompañías
Productos
Servicios
Páginas web
Multimedia
Documentos
Eventos
Proyectos
Actividades
Intereses
Lugares
Mejores búsquedas
Anuncios más enfocados, mejores targets
Colaboración más inteligente
Integración más profunda
Contenido enriquecido
Mayor personalización
4Radar Networks
La tercera década de la web
•Un periodo de tiempo, no una tecnología….
• Enriquece la estructura de la web•Mejora la calidad de las búsquedas, la colaboración, la publicación, la publicidad•Hace las aplicaciones más integradas e inteligentes.
• Transforma la Web desde servidora de archivos a base de datos• Las tecnologías semánticas van a jugar un rol clave
5Radar Networks
La inteligencia está en las conexiones
Connections between people
Con
nect
ions
bet
wee
n In
form
atio
n
Social Networking
Groupware
JavascriptWeblogs
Databases
File Systems
HTTPKeyword Search
USENET
Wikis
Websites
Directory Portals
2010 - 2020
Web 1.0
2000 - 2010
1990 - 2000
PC Era1980 - 1990
RSSWidgets
PC’s
2020 - 2030
Office 2.0
XML
RDF
SPARQLAJAX
FTP IRC
SOAP
Mashups
File Servers
Social Media Sharing
Lightweight Collaboration
ATOM
Web 3.0
Web 4.0
Semantic SearchSemantic Databases
Distributed Search
Intelligent personal agents
JavaSaaS
Web 2.0 Flash
OWL
HTML
SGML
SQLGopher
P2P
The Web
The PC
Windows
MacOS
SWRL
OpenID
BBS
MMO’s
VR
Semantic Web
Intelligent Web
The Internet
Social Web
Web OS
6Radar Networks
Más allá de los límites de la búsqueda en base a keywords
Amount of data
Pro
duct
ivity
of S
earc
h
Databases
2010 - 2020
Web 1.0 2000 - 2010
1990 - 2000
PC Era1980 - 1990
2020 - 2030
Web 3.0
Web 4.0
Web 2.0 The World Wide Web
The DesktopKeyword search
Natural language search
Reasoning
Tagging
Semantic Search
The Semantic Web
The Intelligent Web
Directories
The Social Web
Files & Folders
7Radar Networks
Web de alta resolución
ColdplayBand
Palo AltoCity
JanePerson
IBMCompany
DavePerson
BobPerson
DesignTeamGroup
StanfordAlumnae
Group
IBM.comWeb Site
123.JPGPhotoDave.com
Weblog
SuePerson
JoePerson
Dave.comRSS Feed
Lives in
Publisher of
Friend of
Depiction of
Depiction of
Member of
Married to
Member of
Member of
Member of
Fan of
Lives in
Subscriber to
Source of
Author of
Member of
Employee of
Fan of
8Radar Networks
Cinco aproximaciones a la web semántica
• Tagging (etiquetado, marcadores sociales)
• Estadísticas
• Lingüísticas
•Web semántica
• Inteligencia artificial
9Radar Networks
Etiquetado
• Pros• Para el usuario es fácil añadir y leer tags• Los tags son sólo cadenas, sin complicados algoritmos y ontologías.• No es necesario aprender ninguna tecnología
• Contras• Para el usuario es fácil añadir y leer tags• Los tags son sólo cadenas, sin complicados algoritmos y ontologías.• No es necesario aprender ninguna tecnología
• Technorati
• Del.icio.us
• Flickr
• Wikipedia
10Radar Networks
Aproximación estadística
• Pros: • Algoritmos matemáticos puros• Masivamente escalables• Independientes del lenguaje
• Contras: • No hay comprensión del contenido• Es difícil hacer buenas consultas• Mejores para encontrar tópicos populares, no para encontrar una aguja en un pajar• No son buenos para datos estructurados
• Lucene (software para búsquedas)
• Autonomía
11Radar Networks
La aproximación lingüística
• Pros:• Entienden el lenguaje natural• Extraen conocimiento del texto• Los mejores para encontrar hechos particulares o relaciones.• Consultas más precisas
• Contras:• Necesitan muchos recursos computacionales• De difícil escalabilidad• Bastante erráticos• Dependientes del lenguaje
• Powerset
• Hakia
• Inxight, Attensity, y otros…
12Radar Networks
Enfoque semántico
• Pros:• Consultas más precisas• Aplicaciones más inteligentes con menos trabajo• No requieren de tantos recursos computacionales• Compartir y enlazar datos entre aplicaciones.• Funciona en datos estructurados y desestructurados
• Cons:• Ausencia de herramientas• Difíciles de escalar• ¿Quien crea todos los metadatos?
• Radar Networks (Twine)
• DBpedia Project
• Metaweb
13Radar Networks
Enfoque de la Inteligencia artificial
• Pros:• Inteligencia en dominios restringidos• Contestar cuestiones de forma inteligente• Razonamiento y aprendizaje
• Contras:• Computacionalmente intensivo• Difícil de escalar• Extremadamente difícil de programar• No funciona bien fuera de dominios restringidos• El entrenamiento es difícil, requiere mucho trabajo
• Cycorp
14Radar Networks
Los acercamientos, comparados
Crear software más inteligente
Crear o hacer datos más inteligentes
Estadístico
Lingüistico
Web semántica
InteligenciaArtificial
Tagging-Etiquetado
15Radar Networks
Dos formas de añadir “significado semántico”
• “De abajo-arriba” (Clásico)• Añadir metadatos semánticos a páginas y bases de datos en la web• Cada website se hace semántico•Hay que aprender RDF/OWL
• “De arriba-Abajo” (Contemporáneo)•Generar de forma automática metadatos semánticos para dominios verticales.• Crear servicios que proporcionen semantización como una capa sobre la web no semántica•Nadie tiene que aprender RDF/OWL
-- Alex Iskold
16Radar Networks
En la práctica lo que mejor funciona es un enfoque híbrido
EtiquetadoWeb semánticaDe arriba abajoestadísticasLingüísticoDe abajo arribaInteligencia artificial
17Radar Networks
La web semántica establece claves
• La inteligencia está fuera de las aplicaciones, en los propios datos
• Los datos se convierten en auto-descriptores; El significado de los datos se convierte en parte de los mismos
• Las aplicaciones se convierten en más inteligentes con menos trabajo porque los datos conllevan conocimiento sobre que son y cómo usarlos.
• Los datos pueden ser compartidos y enlazados más fácilmente
18Radar Networks
Web semántica = Base de datos abierta, como una capa sobre la web
Perfiles de
usuarioContenido
webRegistrode datos
Apps &Servicios
AnunciosY listas
Mapeado abierto de datos
Registro abierto de datos
Reglas abiertas
Ontologías abiertas
Interfaces consulta abierta
19Radar Networks
Los estándares abiertos en la web
•RDF – Almacena los datos como “triples”
•OWL – Define sistemas de conceptos denominados “ontologías”
• Sparql – Consultas en RDF
• SWRL – Define reglas
•GRDDL – Transforma datos a RDF
20Radar Networks
RDF “Triples”
• El sujeto, que es una referencia RDF URI o un nodo vacío
• El predicado, que es una referencia RDF URI
• El objeto, que es una referencia RDF URI, un literal o un nodo vacío
Source: http://www.w3.org/TR/rdf-concepts/#section-triples
Sujeto ObjetoPredicado
21Radar Networks
Los datos de la web semántica describen en sí mismos datos enlazados
Data Record ID
Field 1 Value
Field 2 Value
Field 3 Value
Field 4 Value
Definition
Definition
Definition
Definition
Definition
Definition
Definition
Ontologías
22Radar Networks
RDBMS vs Triplestore
S P OPerson Table
f_namejimnovachrislew
ID001002003004
l_namewissnerspivackjonestucker
Colleagues Table
SRC-ID001001001001002002002002003003003003004004004004
TGT-ID001002003004001002003004001002003004001002003004
Subject Predicate Object001 isA Person001 firstName Jim001 lastName Wissner001 hasColleague 002002 isA Person002 firstName Nova002 lastName Spivack002 hasColleague 003003 isA Person003 firstName Chris003 lastName Jones003 hasColleague 004004 isA Person004 firstName Lew004 lastName Tucker
23Radar Networks
Mezclar bases de datos en RDF es fácil
S P OS P O S P O
24Radar Networks
La web es la base de datos!
Application A Application B
ColdplayBand
Palo AltoCity
JanePerson
IBMCompany
DavePerson
BobPerson
DesignTeamGroup
StanfordAlumnae
Group
IBM.comWeb Site
123.JPGPhotoDave.com
Weblog
SuePerson
JoePerson
Dave.comRSS Feed
Lives in
Publisher of
Friend of
Depiction of
Depiction of
Member of
Married to
Member of
Member of
Member of
Fan of
Lives in
Subscriber to
Source of
Author of
Member of
Employee of
Fan of
25Radar Networks
¿Son los RDF/OWL la única forma de expresar la semantización?
•Otras formas:•Cadenas de etiquetas•Taxonomías y vocabularios controlados•Microformatos•Ad hoc [nombre, valor] pares•Notación semántica de metadatos alternativa
26Radar Networks
¿Una o varias web semánticas?
•Ambas cosas.
• La web semántica es una web de webs semánticas
•Cada uno de nosotros tiene su propia web semántica…
27Radar Networks
¿Porque está tardando tanto?
• El sueño de la web semántica está tardando en llegar
• La visión original estuvo demasiado focalizada en la Inteligencia Artificial.
• Las tecnologías y herramientas eran insuficientes.
• La necesidad de datos abiertos no era lo suficientemente fuerte.
• La bísqueda por palabras clave y el etiquetado no eran lo suficientemente buenos.
• Ausencia de aplicaciones para el usuario final.
• Muchas confusiones que aclarar.
28Radar Networks
Cruzando la brecha…
• Comunicando la vision• El foco está en los datos abiertos, no en la I.A (Inteligencia artificial).
• Progreso tecnológico• Los estándares y herramientas finalmente maduran
• Las necesidades no eran lo suficientemente fuertes• La búsqueda por keywords y etiquetas no es ya tan productiva• Las aplicaciones necesitan formas mejores de compartir datos
• Aplicaciones y contenidos• Varias empresas empiezan a exponer daots a la web semántica. Pronto habrá muchos datos.
• Educar al mercado• Mostrar los beneficios de la web semántica al mercado
29Radar Networks
Futuro, perspectivas:
• 2007 – 2009• Inicio incipiente• Emergen algunas killer apps (aplicaciones)•Otras aplicaciones inician el proceso de integración
• 2010 – 2020• Adopción mayoritaria• Los contenidos semánticos son usados de forma mayoritaria en webs y herramientas
• 2020 +• El próximo gran ciclo: Razonamiento y Inteligencia Artificial. • La web inteligente• La web aprende y piensa de forma colectiva
30Radar Networks
El futuro de la plataforma….
• 1980’s -- El escritorio es la plataforma
• 1990’s -- El explorador es la plataforma
• 2000’s -- La web es la plataforma
• 2010’s -- El gráfico es la plataforma
• 2020’s -- La red es la plataforma
• 2030’s -- ¿El cuerpo es la plataforma…?
31Radar Networks
Una de las principales aplicaciones de la web semántica…
32Radar Networks
¿Qué es Twine?
• Twine es un nuevo servicio de gestión compartida de información en la web
• Trabaja con contenido, conocimiento, datos o cualquier otro tipo de información.
•Diseñado para individuos y grupos que quieran organizar, buscar, compartir y ser informados de su información de una forma más efectiva.
33Radar Networks
Funcionamiento de Twine
1. Colección de información estructurada o desestructurada sobre el autor en Twine via email, Web o escritorio
2. Twine crea automáticamente conocimiento en web • Entiende los tags & links de forma automática• Busca de forma automática en la Web• Organiza de forma automática la información
3. Proporciona búsquedas semánticas, descubrimientos y registro de términos de interés
4. Ayuda a conectar con otra gente y grupos para hacer crecer el conocimiento compartiendo lugares con intereses comunes
34Radar Networks
Casos de uso
•Individuales•Información colectiva y de autor para distintos intereses.•Compartir con colegas y amigos•Encontrar y descubrir cosas más relevantes
•Groups & Teams•Gestionar contenido & conocimiento relativos a intereses comundes, objetivos o actividades.•Aumentar, contribuir a la inteligencia colectiva•Colaboracíon más productiva
35Radar Networks
Información de contacto
•Visita www.twine.com para solicitar una invitación.
• Email: [email protected]
•Blog del autor: http://www.mindingtheplanet.net
• Traducción al castellano: http://elcaparazon.net
•Gracias!
36Radar Networks
Derechos
• This presentation is licensed under the Creative Commons Attribution License.• Details: This work is licensed under the Creative Commons Attribution 3.0 Unported
License. To view a copy of this license, visit http://creativecommons.org/licenses/by/3.0/ or send a letter to Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.
• If you reproduce or redistribute in whole or in part, please give attribution to Nova Spivack, with a link to http://www.mindingtheplanet.net