Web profunda
• También conocida como “Web invisible”, “Internet invisible” o “Internet oculta”
• Formada por el conjunto de aquellos recursos que no son localizables mediante los buscadores.
• Internet superficial (máximo número de documentos accesibles por los buscadores) = unos 200 Terabytes
• Internet profunda = unos 100.000 Terabytes (500 veces más)
• 1 Terabyte ~ 1.100.000.000.000 de caracteres
Tipos de Web profunda
Web casi invisible
• Documentos que no han sido indexados por los buscadores
• Están a demasiada profundidad
• No hay ningún enlace que apunte a la página principal
• Están en un formato que no recogen los buscadores
Web temporal• Documentos que solo existen durante el
tiempo de su consultaWeb tras la pasarela• Documentos a las que solo se puede acceder
mediante registroWeb desaparecida• Aquellos documentos que no son accesibles
Porque el ordenador en el que se alojan no está conectado temporalmente a Internet
Web de pagoDocumentos que requieren un pago económico
Bases de datos (BD)
• Desde el punto de vista de la web, forman parte de la Web profunda
• Como web temporal, tras la pasarela o de pago
• Los buscadores solo pueden acceder, como mucho, a la página principal
• Cada BD tiene su propio lenguaje de consulta• Ciertos sitios web son, en realidad, bases de
datos
Búsquedas de imágenesBases de datos de pago
• Corbis • http://www.corbis.com• Getty Images • http://www.gettyimages.com• Bases de datos gratuitas• Colecciones de la UNESCO• http://www.unesco.org/webworld/digicol • Google• http://www.google.es à Imágenes• http://www.alltheweb• .Fuentes de información personal
Top Related