Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes...

22
Buscadores Práctica 4 Carmen Alija Martínez

Transcript of Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes...

Page 1: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

BuscadoresPráctica 4

Carmen Alija Martínez

Page 2: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

I.- El Buscador en Internet. Justificación y necesidad. Definiciones. Funcionamiento.

En Internet se puede encontrar información de casi cualquier tema que se nos ocurra. Esto es posible porque toda clase de instituciones y empresas, y también muchas personas, han publicado información en sus espacios en la red, con carácter público, para que cualquier visitante pueda acceder a ella. Esto que tiene un potencial enorme también presenta importantes inconvenientes, pues el primero es que resulta imposible saberse de memoria cada una de las direcciones que nos interesan y, aunque se pueden guardar como favoritos, nadie conoce todas las páginas que contienen la información que les puede interesar, además que al igual que la vida las necesidades de información son dinámicas. No buscamos lo mismo a los 20 que a los 40 años, ni si alquilamos o compramos una casa.

Hoy en día Internet se ha convertido en una herramienta para la búsqueda de información rápida. Para facilitar la búsqueda existen los buscadores, como por ejemplo Google, Yahoo, Ask, Lycos, Live search, Baidu por mencionar sólo algunos entre muchos otros.

Los buscadores que no son otra cosa que el Front-end, la parte del software que interactúa con el usuario, el nivel accesible por el internauta de un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo.

Un motor de búsqueda es un sistema informático que indexa archivos almacenados en servidores y páginas web. Un ejemplo son los buscadores de Internet. Las búsquedas se hacen con palabras clave o con esquemas jerárquicos por temas. El resultado de la búsqueda es un listado de direcciones web relacionadas con las palabras clave buscadas.

Se pueden clasificar en dos tipos:

• Índices Temáticos: Son sistemas de búsqueda por temas o categoría jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas “manualmente”, es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado.

• Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda en la red.

Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 1 de 23

Page 3: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Funcionamiento

Para un usuario de buscadores el funcionamiento de este sistema es muy sencillo: escribes un texto, pulsas “Intro” y aparecen resultados con enlaces a páginas que contienen ese texto. Pero detrás de este sencillo proceso hay mucha tecnología y una importante labor de búsqueda y clasificación del contenido de páginas web. Además, es necesaria una actualización constante de los datos de cada sitio.

Para poder efectuar búsquedas en Internet es preciso tener una base de información, que es donde se tiene que buscar. Internet incluye millones de Terabytes de información, por lo que revisar la totalidad de estos datos llevaría mucho tiempo. Por eso se han creado los robots de búsqueda.

En su trabajo los buscadores utilizan un web crawler o araña de la web que es un pequeño software, un pequeño programa que recorre el entramado de páginas Web de Internet de forma metódica, automática y sistematizada. Es un tipo especializado de webbot - robot de la Web - que se encarga de llevar a cabo un tipo concreto de tareas. En particular, se encarga de recorrer las páginas Web de Internet, descargarlas al ordenador local para su procesado posterior por un motor de búsqueda que indexa las páginas proporcionando un sistema de búsquedas rápido.

Las arañas Web (crawlers), como cualquier otro tipo de software, pueden ser utilizadas con fines diversos, aunque el uso más conocido es el de agente software en los motores de búsqueda, donde su función básica es proporcionar al indizador el contenido apropiado para ser indizado. Algunas arañas Web (crawlers) de este tipo son Googlebot o Yahoo slurp, las arañas Web (crawlers) de Google y Yahoo, respectivamente.

Es interesante conocer el funcionamiento de estos Webbots para entender cómo y en qué orden se nos presentan las distintas páginas ante una búsqueda introducida en un buscador, en definitiva porqué un buscador indexa y presenta el enorme contenido de Internet en el modo jerarquizado que lo hace, pues no hay que desconocer que los primeros enlaces de las primeras páginas tienen un mayor potencial de ser visitados.

Por lo general, una araña Web (crawler) dispone de un conjunto inicial de URLs, conocidas como semillas. La araña Web (crawler) va descargando las páginas Web asociadas a las semillas y buscando dentro de éstas otras URLs. Cada nueva URL encontrada se añade a la lista de URLs que la araña Web (crawler) debe visitar. A este proceso se le denomina recolección URLs. Cuando la araña Web (crawler) pasea por una página Web, lo que hace es decidir qué partes de ésta son de utilidad. Por ejemplo, puede quedarse sólo con los enlaces, sólo con imágenes, sólo con texto... Tras la visita, la araña Web (crawler) procesa la información disponible, es decir, aplica distintos tipos de algoritmo para conseguir el objetivo establecido. Por ejemplo, comprobar la disponibilidad de un enlace, las referencias cruzadas de otras páginas a esa, el tamaño de las imágenes, la profundidad de enlaces dentro de la web, el número de veces que aparecen las palabras clave relacionadas, etc. Pero estos robots también tienen importantes limitaciones: ninguna araña Web (crawler) puede acceder a todas las URLs que hay en Internet, pues el número de páginas existentes es gigantesco (entre otras causas: enormes cantidades de páginas que recorrer con crecimiento exponencial,

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 2 de 23

Page 4: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

elevado número de actualizaciones de páginas existentes, páginas que crean su contenido de forma dinámica interactuando con el usuario, redireccionamientos) Estadísticamente, el porcentaje de Internet que suele ser explorado por una araña Web (crawler) es aproximadamente del 15%.

Éstos robots que se encargan de revisar “todas” las webs y crear una lista de información que contiene sólo ciertas partes de cada página, actualizan periódicamente los datos referentes a las webs, de manera que la base de datos de páginas indexadas por el buscador esté más o menos al día. Según el Page Rank de la página, se actualizan los datos cada mes o menos.

De esta forma, cuando solicitas una búsqueda desde un motor de este tipo, se revisa la información que contiene ese índice y no la totalidad de Internet. Gracias a ello se tarda muy poco en obtener resultados, aunque esto tiene sus desventajas. Un ejemplo es que no se incluyen en el índice todas las páginas web que existen, y que los resultados están basados en criterios que no siempre son los que el usuario necesita.

Los “robots” de búsqueda sólo recopilan la información. Después hay que clasificarla. El criterio que se emplea para ello, en todos los motores de búsqueda basados en Google, es el establecido por el Page Rank.

Este sistema valora las páginas en función del número de enlaces a ellas que hay en otras webs. Así, cuantas más páginas tengan enlaces a la tuya, más “votos” tendrá ésta en el Page Rank. Pero Google también introduce algoritmos que hacen ponderar los enlaces en función de la clasificación de la página. Para que no haya fraudes, Google descarta automáticamente los sitios que se emplean sólo para colocar links. Además, está comprobado que es imposible saber cuántas páginas tienen enlaces a la tuya, lo que hace que este sistema sea más fiable. La puntuación que otorga el sistema Page Rank va de 0 a 10, donde 10 es la más alta.

Existe otro método parecido, que se usa en menos sistemas, denominado HITS (Hypertext Induced Topic Selection). Según este otro sistema las webs se valoran en función de los enlaces a esta página desde otras (Authority) pero, también, según los vínculos que tenga este sitio a otras páginas (Hub).

Además de la clasificación para ordenar los resultados de una búsqueda, existe otro sistema que se encarga de descartar las webs que tienen determinados contenidos, considerados inadecuados.

II.- Clases de Buscadores.En Internet existen varios tipos de buscadores. Algunos están diseñados para

búsquedas generales. Otros se ciñen a contenidos que se encuentran en determinada página o portal y, también, existen buscadores temáticos y de tipos de archivo muy concretos. Podemos clasificarlos en cuatro grandes grupos:

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 3 de 23

Page 5: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

- Buscadores jerárquicos (Arañas o Spiders).

La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.

• Sus robots recorren las páginas recopilando información sobre los contenidos. Cuando se busca una información en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas que residan en el servidor. Los robots de búsqueda deben analizar gran cantidad de webs, que pueden tener mucha información, y no es posible utilizarlos con la rapidez que se requiere para una búsqueda. Por ello, lo que extraen del rastreo se incluye en una base de datos, que es de donde se obtiene la información cuando solicitas una búsqueda. Algunos cuentan con función Caché que permite ver páginas almacenadas en los servidores del buscador tal y como la recopilaron sus bots.

• Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.

• Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.

• Cada cierto tiempo, los motores revisan los sitios, para actualizar los contenidos de su base de datos, por lo que no es infrecuente que los resultados de la búsqueda estén desactualizados. Generalmente, googlebot rastrea las webs cada mes, por lo que mucha información no está al día. Por ello, Google cuenta con otro robot (denominado freshbot) que analiza cada día (varias veces) determinado tipo de webs, como las de noticias, blogs y otros tipos de páginas de información. De todas formas, una vez que se ha accedido a una, si no está actualizada, se puede solicitar la actualización desde el navegador.

• Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes:

o Los programas que exploran la red -arañas (spiders).o los que construyen la base de datos.o los que utiliza el usuario, el programa que explota la base de datos.

• Si se paga, se puede aparecer en las primeras páginas de resultados, aunque los principales buscadores delimitan estos resultados e indican al usuario que se trata de resultados esponsorizados o patrocinados. Hasta el momento, aparentemente, esta forma de publicidad, es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.

Ejemplos de arañas: Google, MSN Search, Hotbot.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 4 de 23

Page 6: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Aunque la mayor parte de los buscadores jerárquicos son Generales, presentan variantes.

Una variante de los mismos son los buscadores específicos, buscadores que analizan la información de las webs en busca de determinados formatos de archivo, como imágenes, música, vídeos, etc. No se trata de encontrar estos ficheros en una base de datos concreta, sino de hacerlo en la red al completo. Los archivos que muestran no siempre contienen los parámetros de búsqueda en su nombre, sino que, en muchos casos, esas palabras están en determinada página, y el buscador te muestra las fotos que hay en ella. En Google se pone en la búsqueda filetype:xxx, siendo xxx la extensión del archivo.

Los buscadores temáticos también se encuentran integrados en muchos buscadores “generales”, aunque hay algunos que son independientes. Son herramientas que sirven para buscar en páginas de determinados contenidos, que se actualizan con mucha frecuencia. En este aspecto son como los catálogos de los buscadores verticales, pero se diferencian en que están especializados en noticias, blogs y otras páginas de información de actualidad. Suelen estar asociados a determinados sitios, de manera que no ofrecen la información de todos los medios. Muestran la información más actualizada que encuentran, que ha sido recopilada por un robot similar a freshbot. Google News.

- Directorios.

Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.

• Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.

• Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.

• Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.

• Su tecnología es muy barata y sencilla.

Ejemplos de directorios: Open Directory Project, Yahoo!, Terra (Antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios. Google en un paso en sentido contrario también tiene su directorio.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 5 de 23

Page 7: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

- Metabuscadores.

Es una clase de buscador que carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada buscador. Un buscador normal recopilan la información de las páginas mediante su indexación, como Google o bien mantiene un amplio directorio temático, como Yahoo. La definición simplista sería que un metabuscador es un buscador de buscadores.

Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados, según un orden definido por el sistema estructural del metabuscador. No permite diferente sintaxis en las búsquedas para cada buscador.

Hoy en día existe diversos metabuscadores como clusty, kartoo que presenta sus resultados en forma de mapas de relaciones, copernic, turbo10, webcrawler, metacrawler, dogpile, entre otros. Los metabuscadores facilitan y hacen más eficiente la búsqueda de información, aunque algunos se limitan a presentar los primeros 10 resultados de cada buscador.

-Buscadores verticales.

Buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas. Es importante resaltar que utilizan índices especializados para de esta manera acceder a la información de modo más específico y fácil. Ejemplos de este tipo de buscadores son: Trovit un buscador de anuncios clasificados de inmobiliaria, motor y empleo, y Nestoria buscador inmobiliario.

Una categoría dentro de éstos la representan los catálogos de Internet, entre los que se encuentran buscadores de hoteles, viajes, etc. Se centran exclusivamente en contenidos de determinado tipo de bases de datos. Para ello acceden a las páginas que tienen asociadas y extraen la información actualizada, según los parámetros especificados en la búsqueda. Por ejemplo, en un buscador de viajes como Lastminute, se puede buscar vuelos a un destino concreto y aparecerán resultados de diferentes compañías. Generalmente, estos buscadores incluyen ofertas más complejas, como alojamiento, transportes, y packs de vacaciones, extraídos de las bases de datos de las webs de origen.

Otra categoría son las búsquedas internas en webs. Las páginas más complejas suelen tener herramientas de búsqueda interna. Existen todo tipo de herramientas de este tipo, en páginas de información general, como las wikis (por ejemplo, wikipedia), pero también en webs de compras de software, como Softonic o Softpedia . Lo que tienen en común es que la información se extrae exclusivamente de la base de datos interna de esa página Web. Estos motores de búsqueda tienen herramientas de búsqueda avanzada adaptadas a los contenidos de ese sitio. Youtube es un buen exponente.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 6 de 23

Page 8: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

No podemos terminar este apartado sin hacer una siquiera una somera referencia a las Búsquedas avanzadas y su potencial. Para hacer una búsqueda de este tipo se usan herramienta con más parámetros, como el sitio web en el que se quiere buscar, o que sólo muestre páginas actualizadas en los últimos días o meses. Para acceder a este modo se debe pinchar en el vínculo que aparece en el propio buscador, que suele llamarse “búsqueda avanzada”. Además de esto, muchos buscadores ofrecen sugerencias para modificar la búsqueda, y que pueden ayudar más a encontrar lo que uno busca. Si has escrito una frase, por ejemplo “vuelos Venecia”, al aparecer los primeros resultados, el sistema te ofrece cambiarlos por palabras similares, por ejemplo, “Viajes Venecia, Hoteles Venecia”, o frases similares.

Existe otra forma de hacer búsquedas más específicas, que es añadiendo operadores “booleanos” (and, or, not, xor), palabras clave y otros símbolos y expresiones a las palabras que se buscan. Por ejemplo, si se escribes una frase entrecomillada, sólo se buscarán páginas que contengan esas palabras en ese orden. Si quieres que no aparezca un término en concreto, después de las palabras básicas para la búsqueda, deja un espacio, escribe el símbolo“-” y, seguidamente, la palabra que no quieres. Si quieres añadir más palabras o frases, y te interesa que todos los resultados de búsqueda las muestren, puedes poner el símbolo “+” y después esa palabra o frase (puedes entrecomillarla si quieres que se busque la frase completa).Para saber más acerca de este tema, se puede visitar la página web abcdatos o wikilearning.

III.- Breve Historia de los Buscadores.El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por

la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento.

El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler fue también el primero darse a conocer ampliamente por el público. También apareció en 1994 Lycos (que comenzó en la Carnegie Mellon University).

Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek, Inktomi, Northern Light y Altavista. De algún modo, competían con directorios (o índices temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron o se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.

Antes del advenimiento de la Web, había motores de búsqueda para otros protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor de búsqueda Verónica, para el protocolo Gopher.

En la actualidad se aprecia una tendencia por parte de los principales buscadores de Internet a dar el salto hacia entornos móviles creando una nueva generación de buscadores: los buscadores móviles, a la vez que van ampliando su función con diferentes servicios y programas de software gratuitos.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 7 de 23

Page 9: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

IV.- Análisis de los Principales Buscadores.Vamos a realizar una visita a los siguientes buscadores: Google, Yahoo, Live Search, Ask, emagister y WolframAlpha.

GOOGLE:

En 1997 una empresa formada por dos estudiantes de la Universidad de Stanford comenzaban su andadura por una nueva forma de entender Internet. Los fundadores de Google, Larry Page y Sergey Brin, supieron ver una evidencia que, hasta entonces se le había escapado al resto: En un panorama de saturación informativa donde el volumen de documentación está en constante aumento, para el usuario adquiere una importancia vital encontrar lo que busca en el momento en que lo necesita.

A partir de esta idea, en otoño de 1997 desarrollaron un motor de búsqueda tan certero que su uso pronto se extendió. Decidieron crear su propia empresa después de buscar financiación para lanzar el proyecto al mercado. En 1999, dos sociedades de capital riesgo: Kleiner Perkins Caufield y Sequoia Capital invirtieron 25 millones de dólares en Google Inq., por lo que disponía de un capital más que suficiente para ponerse a trabajar.

Los jóvenes directivos de Google consiguieron atraer a destacados cerebros de otras empresas gracias a su flexibilidad y a unas ventajas laborales entre las que destacan: La gratificación a los empleados con acciones de la compañía y la posibilidad de dedicar un 20% de su tiempo de trabajo a proyectos propios. La salida a bolsa en 2004 fue todo un acontecimiento y, poco después Google tenía un valor bursátil superior al de muchas empresas más antiguas y consolidadas. En la actualidad Google es el motor de búsqueda por Internet más potente y usado del mundo. Tiene capacidad para efectuar 120.000 búsquedas por minuto. Ello suponen clicks en los anuncios junto a los resultados, sin olvidar la gran cantidad de webs afiliadas en publicidad.

El buscador de Google es la página de inicio de muchos internautas: cuando abres el navegador es lo primero que aparece. Es una página limpia, minimalista, sin publicidad, que presenta el logo del buscador, que cambia para referirse a ciertos eventos históricos, un cuadro para entrar los términos de búsqueda y dos botones principales, Buscar con Google y Voy a tener suerte, que presentan los resultados de la

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 8 de 23

Page 10: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

búsqueda o remite directamente a la página Web mejor posicionada en relación a esa búsqueda, respectivamente.

Google es el buscador más usado en Europa, con un dominio aplastante casi el 90% llegando al 95% en algunos países. En USA. Su cuota de mercado alcanza el 60%, respetable pero no abrumadora.

Si se utiliza con mucha frecuencia, y al mismo tiempo se emplean otros servicios como YouTube, se puede personalizar la página de inicio con todo el contenido que te interese mediante iGoogle.

iGoogle es como un portal personalizado de entrada a Internet que refleja tus gustos e intereses y se articula en trono al buscador Google. Accediendo a iGoogle, la primera vez que entras te ofrece la opción de crear tu página web principal en menos de 30 segundos. Primero tienes que marcar los intereses. Hay muchos donde elegir: noticias, deportes, ocio, finanzas, tecnología, viajes, pasatiempos, etc. Puedes elegir un tema, es decir, la apariencia de tu portada. Existen varios fondos y diseños. Como último paso consulta Tu página. Se mostrará la portada personalizada. En la esquina superior derecha elige el país y tu ubicación, ya que el diseño irá cambiando según la hora del día y las fiestas y acontecimientos locales. Los intereses elegidos anteriormente se mostrarán en forma de pestañas. Además en el buscador hay un montón de recuadros: Los últimos videos de YouTube, el tiempo, titulares de periódicos, acceso a la Wikipedia… Si no te interesa pulsa en la x de cada ventana para cerrarla. Al pulsar el botón Añadir más cosas, en la esquina superior derecha, podemos incluir cientos de gadgets, con aplicaciones para todos los gustos. Desde cotizaciones de bolsa en tiempo real hasta el tiempo atmosférico, la hora de distintos lugares, y un largo etc.

Cuando has terminado de configurar la portada, puedes fijar esta página, iGoogle como predeterminada o de inicio. Así puedes acceder a Tu Google cada vez que pongas en marcha el navegador. Pero para ello es necesario tener cuenta en Gmail y vincularla a iGoogle o los cambios se perderán en la próxima sesión.

Ventajas de este buscador:

Google tiene hoy en día el motor de búsqueda más potente, es rápido, utiliza una publicidad no invasiva, separando claramente los resultados patrocinados de los que no lo son. En definitiva ocupa una sólida posición de número uno más que justificada. Don't Be Evil, es el eslogan informal de Google Inc., que guía sus decisiones y resume sus actuaciones, incluso las más polémicas, como la censura del buscador en China PRC. (para Google era peor no estar que estar con censura, advirtiendo de que la página está censurada).

Es sin lugar a dudas el número uno, con una cuota en el mercado de los buscadores muy superior a sus inmediatos competidores. Pero este reinado sin estar amenazado puede verse erosionado. Y son todos los demás contra el número uno tratando de ser un número dos que supone cuantiosos beneficios. Que Google marca el paso es indudable y en este ir hacia delante tenemos todos los servicios que se han ido articulando a partir del buscador y su fuente de ingresos, el cobro por la publicidad de los anunciantes. De ello nos ocupamos en una sección propia.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 9 de 23

Page 11: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Desde hace tiempo Google no sólo reconoce palabras clave, sino que también es capaz de interpretar frases del lenguaje natural e incluso preguntas como: ¿Quién fue Mozart?, directamente te enviará a una página web con la biografía del compositor o a la wikipedia.

Puedes usarlo como calculadora para las operaciones básicas, pero también acepta funciones matemáticas complejas y fórmulas. Puede convertir monedas y también temperaturas en grados Celsius o Fahrenheit.

Google permite buscar archivos de diferentes tipos añadiendo al final de la cadena de búsqueda la expresión filetype:“extensión del archivo”. Así se pueden buscar archivos PDF, DOC, XLS, JPG etc. para refinar las búsquedas.

El buscador de Google realiza visitas esporádicas a las webs, durante la indexación, y guarda una foto de la portada, en un almacén temporal llamado Caché. Si visitas una web ofrecida en la lista de resultados del buscador y por alguna razón no está disponible, puedes pulsar en el enlace En Caché para ver el contenido de la última portada que almacenó Google.

El botón Páginas Similares, incluido en cada resultado de las búsquedas, sirve además de para encontrar webs con la misma temática que la que muestra el resultado, otras páginas relacionadas. Por ejemplo si buscas webs sobre perros también te mostrará páginas genéricas sobre mascotas.

A veces resulta de utilidad saber que páginas Web apuntan a otra. Es una forma de conocer las páginas relacionadas. Al escribir en el buscador “Link: dirección”, nos informa de quién tiene enlaces que llevan a una página.

Si te interesa saber si una web de la competencia está mejor posicionada en Google, sólo tienes que indicar en el buscador la dirección completa, separada por un OR. Por ejemplo: www.realmadrid.es OR www.fcbarcelona.com. Te mostrará primero la mejor posicionada.

Tiene diccionario incorporado, para conocer el significado de una palabra hay que ponerla en el buscador con el comando define: palabra. Por ejemplo define: albornoz. Obtendrás varias definiciones provenientes de la Wikipedia, de webs académicas y de diccionarios en línea.

En ocasiones conoces el nombre de una empresa o de una afición, pero no sabes la dirección URL exacta. Con el comando inurl: palabra te aseguras de encontrar webs que incluyan dicha palabra.

Servicios complementarios:

En su búsqueda del reinado de Internet, en torno a Google se han articulado una pléyade de servicios que complementan o no necesariamente el buscador. Haremos una somera referencia a ellos, no sin olvidar que el resto de empresas con buscadores han tratado de crear servicios similares en un afán de competir y desbancar al rey indiscutible Google.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 10 de 23

Page 12: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

El Traductor de Google. Puede traducir no sólo textos, sino Webs enteras. Incluso en el blog podemos poner un enlace que lo traduzca en tiempo real a otros idiomas. La calidad de las traducciones ha mejorado con el paso del tiempo, ya que si en un principio usaba el motor de traducción de Systram, Google ha desarrollado el suyo propio y nos permite mejorarlo con la opción de proponer una traducción mejor.

Google Adsense permite colocar publicidad contextual en una página Web, es decir relacionada con el contenido de la misma. Google pagará una cantidad de dinero por cada “click” en los enlaces. Es una forma de financiar una Web.

El correo Gmail ha sido desde su inicio, cuando sólo podías tenerlo por invitación de otro usuario hasta que se abrió al público en general, una referencia sobre todo por su capacidad de almacenamiento, inicialmente de 2 Gb. que se ha ido expandiendo hasta 7 Gb. Permite mensajes con adjuntos de hasta 20 Mg y permite clasificar los mensajes e indexarlos mejor que ningún otro. Tiene un servicio de pago que amplia las prestaciones y la capacidad de almacenamiento. Aunque en número de usuarios es todavía pequeño en comparación a Yahoo y Hotmail su crecimiento es exponencial.

Google Talk es el servicio de mensajería instantánea de Google. En principio está vinculado a usuarios que tengan cuenta en Gmail. El otro gran competidor, Microsoft con su utilidad Messenger, renombrada Windows Live Messenger, domina claramente relegando a Google a un tercer puesto tras otros programas de mensajería instantánea.

Google Maps permite consultar el callejero de las ciudades, ver sus planos, planificar rutas, ver fotografías de los sitios vinculadas por los usuarios, personalizar los mapas. Una característica sorprendente es Street view que permite pasear a nivel de calle de las ciudades en un entorno virtual. Sólo las principales ciudades (en España, Madrid, Barcelona, Valencia, Sevilla y Oviedo) están digitalizadas con este servicio, pero la sensación de inmersión es enorme. Maps también permite consultar el tiempo a través The Weather Channel.

Google Earth permite observar fotografías tomadas por satélite de cualquier lugar del planeta. A partir de la versión 4.2 incluye una opción oculta: un simulador de vuelo que permite navegar como si fueras en un avión. Pero aparte del aspecto lúdico Google Earth, el Ministerio de Economía y Hacienda ha desarrollado una aplicación basada en él que permite consultar los datos fiscales y catastrales de los inmuebles. Para ello debes descargar Google Earth y un complemento. Pero la versión 5 ha aumentado las funciones permitiendo explorar Marte, la Luna y los Océanos.

Youtube, adquirido por Google es un portal con videos aportados por los usuarios y en torno a los cuales se ha ido creando una comunidad. Es una de las páginas que mayor número de visitas recibe y cuenta con un alto grado de fidelidad de sus usuarios.

Aplicaciones de escritorio de Google, entre las que se encuentran el paquete de programas gratuitos Google Pack que incluye entre otros su navegador Chrome,

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 11 de 23

Page 13: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Mozilla Firefox, Picasa, Adobe Reader, Skype y Norton Security Scan. También incluye Google Desktop y la Barra de Google para el explorador.

Google Desktop permite disfrutar de buena parte de los servicios de Google directamente desde el Escritorio de Windows. Permite añadir gadgets creados por los usuarios y complementos que amplían sus funcionalidades. Además cuenta con una caché de los archivos que manipulas y que puedes recuperar en caso de borrado accidental. Incluso puedes añadir un buscador de palabras en el diccionario de la Real Academia.

La Barra de Google se instala en el navegador, Explorer o Firefox con versiones distintas pero igualmente funcionales, y permite acceder desde el navegador de forma rápida y cómoda a distintas opciones como traducir la página, un diccionario, a las otras aplicaciones de Google, a las cabeceras de los correos de Gmail, etc.

Terminaremos con Google Docs. Aunque no están potente y compleja como Ms. Office tiene la ventaja de que no es necesario instalar nada en el ordenador para funcionar con ella y los documentos se almacenan en Internet, por lo que están accesibles desde cualquier lugar, siempre que haya conexión. Sólo es necesario disponer de una cuenta en Gmail para crear documentos de texto, hojas de cálculo o presentaciones. Permite compartir los documentos realizados y trabajar sobre el mismo archivo en tiempo real. Un paso hacia la Web 2.0 y el cloud computing que ha sido seguido por otros competidores como Microsoft con su limitada Office Live Workspace.

Por todo lo expuesto Google es mi buscador preferido. Integra funciones que los otros sólo remotamente y tiempo después pretenden igualar. Sólo Microsoft y en menor medida Yahoo tienen capacidad tecnológica y músculo financiero suficiente para pretender erosionar su posición. Pero Google también plantea dudas sobre su tratamiento de la privacidad y de los datos personales. Y esto no hay que dejarlo de lado. Amenaza con convertirse en el Gran Hermano cuya mirada pronto llegará a los lugares más recónditos de nuestra vida privada. Lo que buscamos, clickeamos, vinculamos o escribimos queda registrado por esta versión moderna del clásico de George Orwell, 1984.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 12 de 23

Page 14: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

YAHOO:

Yahoo irrumpió en la red como empresa de servicios web en Marzo de 1995. Concebida en los primeros días de Internet por dos jóvenes estudiantes de la Universidad de Stanford, Jerry Yang y David Filo, pronto se convirtió en el buscador y directorio más popular del momento y en Abril de 1996 comenzó a cotizar en el índice NASDAQ.

Hasta la aparición de Google, su buscador era el más popular y sus servicios de correo electrónico y mensajería instantánea se disputaban el mercado con Hotmail y Messenger de Microsoft, con gran implantación tanto en países anglosajones como hispanohablantes.

Sin embargo desde que Google entró en escena Yahoo no levanta cabeza. Lo último ha sido la oferta de compra por parte de Microsoft. Tras la retirada de la Opa por parte de Microsoft, queda por ver como saldrá a flote. Ha llegado a acuerdos con Google para usar su motor de búsqueda y compartir ingresos publicitarios pero corre el peligro de enfrentarse a las autoridades antitrust americanas.

El algoritmo de posicionamiento de Yahoo se conoce como WebRank. Presenta un funcionamiento similar al PageRank de Google.

A diferencia de Google, Yahoo se nos presenta como un portal en el que el buscador ocupa un lugar central. La página está más recargada que la de Google, pero aún así se presenta con la suficiente ergonomía y claridad para que la experiencia de

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 13 de 23

Page 15: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

navegación sea agradable. Yahoo también muestra en su portal, página de inicio un directorio temático, por lo que no renuncia a esta variante de los buscadores. Hay así mismo links al Correo Yahoo y Yahoo Messenger.

Y ya en la página de inicio, Yahoo nos presenta publicidad, algo que Google y Live no hacen.

A través de un vínculo en la página de inicio permite acceder a Mi Yahoo! que no es otra cosa que una personalización del portal, al modo como se hacia en iGoogle, pero bastante más simple y sin los complementos y añadidos que permite Google, entre otras cosas porque la comunidad a diferencia de iGoogle no los ha desarrollado.

En esta página de inicio personal en Yahoo, Mi Yahoo, se pueden añadir pestañas que contienen frames con vínculos a otras cuentas de correo que definamos, titulares con enlaces de los periódicos principales, Traductor BabelFish, Agenda y Bloc de notas.

Para mantener esta configuración personalizada es necesario tener cuenta de correo en Yahoo, aceptar las cookies e identificarse para guardar los cambios. En esto no se diferencia de iGoogle.

Comparando los resultados obtenidos con los de Google observamos que Yahoo encuentra un mayor número de páginas, lo que no significa mayor calidad de los resultados siendo en este aspecto similares. Los resultados son más o menos los mismos, de hecho ambas compañías han compartido y comparten tecnologías de búsqueda. Donde si hay una clara diferencia es en la orientación comercial de los primeros resultados por parte de Google frente a Yahoo.

Normalmente con los resultados de Google encuentro lo que quiero buscar, pero si no aparece en Google en las primeras posiciones busco en Yahoo, pues a veces el sistema de clasificación de las Web posiciona antes otras que en Google quedan rezagadas por no tener carácter comercial.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 14 de 23

Page 16: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Live Search:

Microsoft Corporation es una empresa multinacional estadounidense, fundada en 1975 por Bill Gates y Paul Allen. Dedicada al sector de la informática, con sede en Redmond, Washington, Estados Unidos. Microsoft desarrolla, fabrica, licencia y produce software y equipos electrónicos. Siendo sus productos más usados el Sistema operativo Microsoft Windows y la suite Microsoft Office, estos productos tienen una importante posición entre los ordenadores personales. Con una cuota de mercado cercana al 90% para Office en 2003 y para Windows en el 2006.

La compañía también suele ser nombrada como MS, por sus iniciales en el NASDAQ: MSFT o simplemente como Redmond. Tiene 80.000 empleados en 102 países diferentes y cuenta con unos ingresos de 51.120 millones de dólares durante el año 2007.

A mediados de los 80 consiguió dominar el mercado de ordenadores personales con el sistema operativo MS-DOS. La compañía inició una Oferta Pública de Venta en el mercado de valores en 1986. Durante su historia, ha sido objeto de críticas, como acusaciones de realizar prácticas monopolísticas que la han llevado ante la Comisión Europea y el Departamento de Justicia de los Estados Unidos.

Microsoft afianzó su posición en otros mercados como el de sistemas operativos y suites de oficina, con recursos como la red de televisión por cable MSNBC, el portal de Internet MSN, y la enciclopedia multimedia Microsoft Encarta. La compañía también comercializa hardware como el ratón de Microsoft y productos de entretenimiento como Xbox, Xbox 360, Zune y WebTV. Su Web oficial es una de las páginas más visitadas de la red, recibiendo por día más de 2'4 millones de visitas únicas.

Aunque Microsoft existía antes que Google, su falta de visión y previsión de lo que la World Wide Web significa y representa ahora y en el futuro ha hecho que en este aspecto vaya por detrás de Google. Un error estratégico que puede pasarle una fuerte factura y que trata de superar a pasos agigantados. Su intento de adquisición de Yahoo tenía un doble objetivo, por un lado crecer en el segmento de Internet con su adquisición y por otro evitar la alianza de ésta con Google.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 15 de 23

Page 17: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Windows Live Search vio la luz en septiembre de 2006, sustituyendo a MSN Search. Live es el buscador y MSN queda posicionado como el portal. El buscador de Microsoft tiene un aspecto minimalista y limpio, asemejándose al de Google. No presenta publicidad. Permite realizar búsquedas en la Web, por imágenes, de noticias y X-Rank. Este presenta una página en la que los famosos aparecen ordenados según la popularidad de las búsquedas al objeto de determinar quién está de moda y quién no.

Incluye la posibilidad de guardar las búsquedas habituales en el perfil propio de Live Search.

Aunque ha mejorado, el motor de búsqueda de Google es netamente superior. Se calcula que Google lleva un adelanto de 9 a 12 meses en el desarrollo de la tecnología sobre su inmediato competidor. Y este tiempo, que puede parecer poco, en el ámbito informático supone casi una Era.

No obstante Microsoft va incorporando actualizaciones y mejoras atendiendo a las prácticas más comunes de los usuarios. Un ejemplo son los enlaces profundos a las páginas Web en los resultados de las búsquedas, ya que los usuarios tienden a buscar las páginas interiores de los dominios.

Microsoft también cuenta con servicios complementarios articulados entorno al buscador y con orientación a la Web. En muchos casos han sido una respuesta al servicio ofrecido por Google, en otras consecuencia de adquisiciones de otras compañías. Microsoft Virtual Earth, Office Live Workspace, Live Search Maps, Windows Live Spaces son réplicas a los servicios de Google.

Sin embargo hay un segmento en el que Microsoft es líder indiscutible y es el de la mensajería instantánea. Messenger, rebautizado como Windows Live Messenger con 93 millones de usuarios es líder indiscutible. La búsqueda de ingresos podría derivarlo hacia una aplicación de llamadas telefónicas tipo Skype.

El anuncio del cierre de Microsoft Encarta ante la imposibilidad de competir con la Wikipedia, dados los cambios en la forma en que la gente busca información actualizada y vinculada frente a productos acabados, ponen en evidencia el descuido de Microsoft en este frente de batalla que es Internet.

Personalmente no utilizo Live en las búsquedas por que lo encuentro inferior a los competidores precedentes. Además si hago búsquedas en Google y hay alguna página Web que tiene versión en Castellano, me la presentará antes que esa misma página en francés u otro idioma que no sea el inglés. Live no hace este refinamiento y nos encontramos en los resultados con páginas en otros idiomas cuando esa página tiene versión en castellano.

Sin embargo hay un buscador de Microsoft que si uso y es Microsoft Knowledge Base debido a la utilización de sus sistemas operativos. Microsoft Knowledge Base contiene más de 150.000 artículos. Estos artículos han sido creados por miles de profesionales de soporte técnico que han resuelto los problemas que les exponen sus clientes. Microsoft Knowledge Base se actualiza, se amplía y se mejora con regularidad, para contribuir a asegurar que se dispone de acceso a la información más reciente.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 16 de 23

Page 18: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Ask:

Ask.com también conocido inicialmente como Ask Jeeves es un motor de búsqueda de Internet. Es parte de la compañía InterActive Corporation, fundada en 1996 por Garrett Gruener y David Warthen en Berkley, California. El programa original fue implementado por Gary Chevsky basado en su propio diseño. Los primeros inversionistas fue el Grupo RODA. Ask.com posee una gran variedad de sitios Web que son populares, además de tener las portadas para países específicos como Reino Unido, Italia, Alemania, Japón, Países Bajos y España, junto con la versión de Ask para Niños, Teoma (actualmente fuera de línea), Excite, MyWay.com, iWon.com, Bloglines y otros portales temáticos. Debido al tráfico combinado entre todos los sitios web, ask.com fue una de las diez compañías con más visitas en Estados Unidos, en septiembre de 2004.

Ask.com fue conocido en un principio como Ask Jeeves, donde Jeeves es el nombre del mayordomo que buscaba las respuestas a cualquier pregunta. A partir de 2006 fue eliminado.

La idea original tras Ask Jeeves es permitir que los usuarios obtengan las respuestas a las preguntas que se formulan a diario en un lenguaje natural. Con el paso del tiempo y debido a la creciente eficiencia de buscadores como Google, Ask Jeeves comenzó a perder usuarios, pero tras una reingeniería de la tecnología, permitió que existieran palabras claves para que el buscador de Ask Jeeves se basará en otros buscadores para sus respuestas. Sin embargo, como ask.com es lento para indexar todas sus páginas, no sufre de spam como los otros buscadores importantes de Internet.

Ask.com fue el primer buscador comercial del tipo pregunta-respuesta que fue desarrollado para WWW. Soporta una amplia variedad de consultas de usuarios realizadas en inglés, así como las tradicionales búsquedas con palabras claves y se esfuerza en que las búsquedas sean más intuitivas y amigables que los otros buscadores. Ask Jeeves vendió la misma tecnología que utiliza en el sitio ask.com a distintas empresas como Dell, Toshiba y ETrade. Parte de la empresa fue vendida a Kanisa en el año 2002. En 2008 anuncio al adquisición de Lexico Publishing Group, poseedor de las Webs Dictionary.com, Thesaurus.com, y Reference.com. Combinan 28 millones de visitantes.

Ask.com también posee la tecnología de búsqueda basado en temas de popularidad para calcular el grado de autoría en un resultado. La tecnología fue nombrada como Teoma. En 2006, Teoma fue renombrado y redirigido directamente a ask.com. El algoritmo de ExpertRank provee resultados ordenados mediante la preminencia de la autoría de los sitios web. Así como la popularidad por click, también se considera la búsqueda de términos por popularidad.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 17 de 23

Page 19: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

La página Web inicial adopta el look de Google, es decir limpia y minimalista. Permite a través de selectores buscar en la Web, imágenes, videos y cientos de respuestas. Esta última no es más que una vinculación a una base de datos de respuestas aportadas por otros usuarios de Internet o por Webs. Pretende contestar a preguntas planteadas en lenguaje natural. ¿Cuantos habitantes tiene Nueva York? Es evidente que la versión más desarrollada y precisa es la versión en inglés. Cuando las preguntas son planteadas en castellano en la versión local del buscador, los resultados no son tan precisos. Cuando se plantean preguntas la mayoría de las veces remite en los primeros lugares al correspondiente artículo de la Wikipedia. Por su parte los enlaces a Noticias y mapas abren el portal correspondiente.

Una característica llamativa es que a través de un pequeño icono al lado de los resultados de la búsqueda, unos prismáticos, posicionando el cursor podemos ver una pequeña imagen de la página Web vinculada. Es un paso importante pues sólo representa la página que seleccionemos evitando ralentizar el buscador haciendo una presentación preliminar de todas.

La calidad de los resultados es inferior a Google. Por ello no es un buscador que utilice mucho. Pero a veces cuando planteas una pregunta en inglés en la versión americana las respuestas pueden ser muy precisas. El hecho de que Google también tenga soporte para preguntas en lenguaje natural le ha quitado gran parte de su atractivo. Pero sin lugar a dudas ha sido el primero en señalar la senda a seguir.

EMagister:

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 18 de 23

Page 20: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Emagister es un buscador vertical especializado en la búsqueda de cursos. En este concepto se engloban Masters, Programas de Licenciatura y Diplomatura de las Universidades públicas y privadas, Oposiciones, Cursos subvencionados y de Formación Profesional.

Permite buscar cursos no sólo en España sino también en otros países (UE., EE.UU. y América Latina).

Además del buscador presenta pestañas que actúan como directorios, clasificando los cursos de acuerdo al esquema antes expuesto. Llama la atención la existencia de un directorio con Cursos Gratis, predominando los cursos de idiomas, entre ellos el inglés y los de informática. Pone a disposición de los usuarios recursos interesantes y además presenta la ventaja de que los cursos están valorados por los usuarios a través de sus opiniones.

En la pestaña Universidades podemos acceder a las distintas carreras universitarias, que al seleccionarlas nos presenta una completa información, desde donde cursarlas, planes de estudio y asignaturas, salidas laborales, titulaciones relacionadas y pasarelas a otras titulaciones.

En la pestaña oposiciones presenta un directorio con las convocatorias por sector y un buscador de cursos y temarios. Aunque estos últimos flojean bastante pues apenas tienen referencias, viviendo de los anuncios que Google inserta en las páginas de resultados de las búsquedas que o no aparece ningún resultado o son escasos. Sin embargo el directorio de las convocatorias de oposiciones por sector es bastante completo, bien ordenado y pleno de referencias.

En la pestaña cursos subvencionados aparecen los distintos cursos de las Administraciones Públicas subvencionados para parados o personal en activo. Dispone además de un servicio de alertas. Dentro de la ficha de cada curso se puede obtener información adicional como temario, horarios e incluso las opiniones de los alumnos, además de suscribirnos a alertas de cursos similares.

En el apartado de Formación Profesional aparecen cursos de empresas de educación a distancia, la mayor parte de pago. A diferencia de lo que ocurría con las universidades no se presentan aquí los distintos estudios oficiales.

Hay también un foro con distintos subforos para que los estudiantes y los que ya no lo son intercambien opiniones, siendo los más activos los de los opositores a los Cuerpos y Fuerzas de Seguridad del Estado y Autonómicas.

El apartado Publicar Cursos cuenta con dos grandes apartados, para promocionar cursos ya existentes, y otro para crear un curso propio online gratuito compartiendo los conocimientos. Una vez dotado de contenido, Emagister lo publica en su Web para libre acceso del resto de los usuarios.

Es una Web bastante completa en su especialidad. A veces descubres verdaderas joyas entre los cursos gratuitos publicados. Siempre puedes aprender cosas nuevas en Informática y en Idiomas. En todo caso el coste de probarlos no va a ser un impedimento. Destaca así mismo el directorio de Oposiciones. Muy completo y bien organizado. En definitiva una Web a tener en cuenta si preparas oposiciones o deseas actualizar tus conocimientos, aunque los cursos se refieren a unos determinados niveles de conocimiento.

Aunque se podrían haber probado otros buscadores jerárquicos, la mayor parte de ellos entran en una de las siguientes categorías: o la distancia en cantidad y calidad de los resultados respecto a Google es abismal, o usan el propio motor que Google les ha licenciado (Powered by Google). Es por ello que terminaremos

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 19 de 23

Page 21: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

nuestra exposición con un buscador que sólo algunos privilegiados previa solicitud han probado.

WolframAlpha:

WolframAlpha, es el nuevo buscador anunciado en Marzo de 2009 para ser lanzado en Mayo de este mismo año. En principio podría parecer un buscador más sino fuera por una serie de circunstancias.

En primer lugar el proyecto es obra de Stephen Wolfram, un emprendedor británico que tiene en su haber diversos logros y proyectos, y fue el ganador más joven del premio MacArthur Fellow, otorgado a los trabajos más creativos en Estados Unidos. Es un científico reconocido por su trabajo en física de partículas, autómatas celulares y álgebra computacional y es el autor del novedoso programa de ordenador Mathematica, de computación y álgebra simbólica. Pero también es un hábil hombre de negocios. El prestigioso portal de tecnología TechCrunch no ha dudado en comparar las implicaciones de este proyecto con la llegada de Google a nuestras pantallas.

Es inevitable comparar WolframAlpha con el buscador por excelencia, Google y, sin embargo, las diferencias son notables. Google devuelve una serie de vínculos de páginas que contienen el texto o cadena buscado, mientras que WolframAlpha se adentra en las entrañas de la pregunta e interpreta su significado. ¿Cómo lo hace? Mediante complejos modelos y algoritmos aderezados con potentes bases de datos que representan el mundo real. Dicho de otra manera, dispone de ingentes cantidades de datos que de alguna manera interpreta y filtra atendiendo a nuestra consulta. Lo realmente innovador es que este sistema no está programado para dar respuesta a cada una de las preguntas que formulamos, sino que las interpreta y devuelve una respuesta concreta.

Por si todo esto fuera poco, WolframAlpha habla un lenguaje llano y responde también a los modismos. Así, uno podrá preguntar con lenguaje de la calle y obtener una respuesta científica y contrastada con una descomunal base de datos. Con todo y pese a su poderío, WolframAlpha no es más que una herramienta que maneja los datos con una sorprendente agilidad y precisión y no puede equipararse a una mente humana (ni desde luego llegará a ello). El secreto de esta bestia es una base datos alimentada por el equipo de Wolfram y gestionada por un algoritmo matemático de gran precisión.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 20 de 23

Page 22: Buscadores - WordPress.com...- Buscadores jerárquicos (Arañas o Spiders). La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren

Pero este poderío plantea también interrogantes y peligros. Uno de ellos es la suspicacia sobre las respuestas. Por qué elegir esa respuesta en concreto y no otra cuando planteamos cuestiones opinables y sujetas a debate. ¿Se equivoca? ¿Quién y cómo se mantiene? Pueden ser tendenciosas las respuestas ¿Podemos preguntar qué opción política es más adecuada para un país? Evidentemente, la respuesta dependerá de la información introducida en el sistema y cómo se haya entrenado a éste a buscarla. Por otro lado, existen numerosas preguntas que tienen más de una respuesta acertada y WolframAlpha tendrá que lidiar con ellas.

Se trata en definitiva de un buscador inteligente que sabe interpretar nuestras preguntas y que no devuelve links en masa sin miramientos como los buscadores convencionales. Un proyecto que sorprende que haya pasado desapercibido hasta apenas un par de meses de su lanzamiento, sobre todo si consideramos que hay un equipo de no menos de cien personas alimentando terabytes de información a un ritmo frenético. Google, por su parte, no parece quedarse de brazos cruzados y ya en 2007 apuntaba en esta dirección, lo cual abre un horizonte apasionante en el terreno de las búsquedas en un futuro inmediato.

En breve Stephen Wolfram y su equipo han construido lo que ellos llaman una “computational knowledge engine” para la Web, en texto claro, tú preguntas y él te responde.

El acceso al buscador ahora es limitado mediante invitación. Está en período de pruebas. Pero dada la trayectoria de este emprendedor promete ser algo grande. Dentro de unos años quizás recuerdes este trabajo y su referencia a este novedosos buscador.

De momento y como conclusión final sigo utilizando Google como buscador general, sin renunciar a los portales verticales ni a los directorios cuando tengo que buscar información sectorial. Y como enciclopedia Wikipedia. La calidad de sus artículos no tiene que envidiar a Encarta (Microsoft ha anunciado que abandona su publicación) ni a la Britannica. En ella han escrito Premios Nobel, doctorados y estudiantes. Es una gran obra comunitaria. Os invito a contribuir en sus artículos y a mejorar los publicados.

Internet: un recurso para la investigación educativa Práctica 4 Buscadores Pág. 21 de 23