Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que...

17
Facultad de Medicina Humana C-II Curso Preuniversitario Búsqueda de Información en la Web

Transcript of Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que...

Page 1: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Facultad de Medicina Humana C-IICurso Preuniversitario

Búsqueda de Información en la Web

Page 2: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Principales buscadoresPrincipales buscadores

La inmensidad de información q e e iste en Internet p ede• La inmensidad de información que existe en Internet puede hacer que el usuario se pierda en ella a la hora de buscar datos específicos sobre un tema en particular.

• Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información a la que se desea acceder. Estas facilidades son denominadas buscadores.

• Los buscadores son una novedosa categoría de servicio. Son sistemas que organizan la información de Internet.

Page 3: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Componentes de los buscadores.

L R b t l d tá d l• Los Robots que recorren la red escrutándola.• La base de datos que es construida por los robots.• El motor de búsqueda que facilita la consulta a la base.

Page 4: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Como funciona el RobotComo funciona el Robot.

Robot Es n programa q e atra iesa na estr ct ra• Robot. Es un programa que atraviesa una estructurade hipertexto (tecnología que organiza información enbloques distintos de contenidos, conectados al final deuna serie de enlaces cuya actividad o selecciónypermite recuperar información), obteniendo ese enlacey todos los enlaces que están referenciados allí. Deellos se alimentan los grandes motores de búsquedade la webde la web.

• Un robot simplemente visita los sitios y extrae losenlaces que están incluidos dentro de éstos Seenlaces que están incluidos dentro de éstos. Sedenominan de diferente forma, en función del modo enel que hagan su búsqueda: gusanos (worms), orugas(web crawlers), hormigas (webants), entre otros.

Page 5: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Y las bases de datos que son?

L b d d t di t i E tá• Las bases de datos son enormes directorios. Estánoperados por humanos y no recuperan automáticamentelos enlaces incluidos en las páginas web, sino que sólo selimitan a hallar lo que las personas manualmente incluyenlimitan a hallar lo que las personas manualmente incluyenen ellos, pudiendo, como ventaja, clasificar por seccionesla temática de las Web al hacer el proceso manual.

Page 6: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Motor de búsqueda, qué es?

El t d bú d ( h i )• El motor de búsqueda (o search engine) es un programa que busca a través de una base de datos, en el contexto de la web, se refiere usualmente a búsquedas de bases de datos de documentos HTML (Hiper Text Markupdatos de documentos HTML (Hiper Text Markup Language), recopilados por un robot.

Page 7: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Como funciona esto?Como funciona esto?

• Un robot decide que visitar de diversas maneras usandodiferentes estrategias. En general comienza a trabajar desde unalista histórica de URL’s (Uniform Resorce Locator, localizadoruniforme de recursos) dentro de los sitios web especialmenteuniforme de recursos) dentro de los sitios web, especialmentedocumentos con muchos links, tales como una lista de servidoresy desde los sitios más populares en la web.

U b t d id i t l t d l tít l d• Un robot decide que registrar, generalmente usando los títulos deHTML, los primeros párrafos del documento o seleccionando laHTML completa; y registra las palabras contenidas, excluyendolas de uso común (pronombres, adverbios y palabras como

b á i t ) l l i l t t<web>, <página>, etc.) y algunos seleccionan los textosalternativos de los gráficos por lo que se recomienda prestarespecial atención, pues en caso de registrarse, son palabras quecontarán con un gran peso sobre la relevancia final en eldocumento.

Page 8: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Buscadores sin robotBuscadores sin robot

A í l di i ñ did bi i• Aquí las direcciones añadidas se ubican en secciones dentro de una estructura de árbol, debiéndose indicar las categorías bajo las que se desea queden ubicadas en el proceso de alta Los contenidos en muchos casos sonproceso de alta. Los contenidos, en muchos casos, son analizados y procesados por personas que visitarán la dirección añadida, determinando si ésta cumple con los requisitos necesarios para ser dada de alta y si los datosrequisitos necesarios para ser dada de alta y si los datos introducidos son correctos. Es imprescindible dar de alta el sitio web para figurar dentro de la base de datos de los directorios.

Page 9: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Palabras clave Palabras clave

• Hay que tener claro el concepto de palabra clave; es fundamental para lograr buenos resultados en la búsqueda de información. Los buscadores, y algunos directorios de búsqueda utilizan palabras clave que se ingresan para localizar los enclaves dentro de su base de datos y presentarlos como resultados, en listados de páginas que contienen entre 10 y 20 de estos enlaces variando lacontienen entre 10 y 20 de estos enlaces, variando la presentación de acuerdo con cada buscador.

• Las opciones permiten definir el uso de 3 clases de herramientas:herramientas:

– Las que proporcionan fácil y correcto a los datos en bruto.– Las que transforman los datos en información pertinente sin filtrarla

(ausencia de ruido) y la organizan estructurándola.( ) y g– Las que entregan la información al solicitante.

Page 10: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Sugerencias para elegir las palabras clave

E i t l i l i l l b l• Existen algunas sugerencias para elegir las palabras clave, como no usar las más comunes, y evitar que desborden los resultados con contenidos que realmente no interesan. Hay que utilizar terminología específica del tema que se busca sin utilizar acentos te o og a espec ca de te a que se busca s ut a ace tosni palabras que los buscadores, normalmente internacionales, no puedan distinguir.

• Utilizar las palabras And, Or, Not u otros operadores booleanospara definir mejor la búsqueda. Así mismo, la inclusión de textoentre comillas creará una frase para la búsqueda del contenidoexacto.

Page 11: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Métodos de búsquedaMétodos de búsqueda.

S i• Sugerencias:– Usar más de un motor de búsqueda.– Leer la página de About (acerca de).– Obtener resultados objetivos siendo específico.– Obtener más resultados siendo general.– Definir la búsqueda usando operadores booleanosDefinir la búsqueda usando operadores booleanos.

Page 12: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Como utilizar los operadores booleanos?

A d P b d á bl l i á i• And. Para buscar dos o más vocablos en la misma página, escribir la palabra And entre los vocablos (ejemplo: mar And kayak), también se puede agregar un signo de más (+) antes del segundo vocablo (ejemplo: mar + kayak)(+) antes del segundo vocablo (ejemplo: mar + kayak).

• Or. Para buscar uno de dos (o más) vocablos en la misma página hay que escribir la palabra Or entre los vocablos (ejemplo: kayak Or canoa)(ejemplo: kayak Or canoa).

• And Not. Para buscar páginas que incluyen el primer vocablo y no el segundo escribir las palabras And Notentre los vocablos (ejemplo: perro And Not labrador) oentre los vocablos (ejemplo: perro And Not labrador) o colocar un signo menos (-) antes del segundo vocablo (ejemplo kayak – lancha).

Page 13: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Y además, podemos utilizar:

• Comillas. Para buscar una frase exacta se debe encerrar la frase entre comillas (ejemplo: “renta kayak”).

• Paréntesis. Para agrupar partes de la búsqueda hay que encerrarlas en paréntesis. Por Ejemplo, escribir kayak And ( í O i ) C t l á i(guía Or equipo). Con esto regresan las páginas con ambas palabras kayak y guía o ambas palabras kayak y equipo.

• Asterisco Para buscar diversas formas de una palabraAsterisco. Para buscar diversas formas de una palabra, agregar un asterisco al final de la palabra (ejemplo: kayak*). Esto regresa páginas con las palabras kayak, kayaks, kayared, kayaking, etc.

Page 14: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Buscar es moverseBuscar es moverse

Buscar en internet no es fácil Sin embargo ya se tienen• Buscar en internet no es fácil. Sin embargo, ya se tienen herramientas de búsqueda que ayudarán a encontrar lo que deseamos si aprendemos su manejo.

• Recomendaciones para búsquedas efectivas:– Definir lo que se buscar. Acotar la búsqueda tan

estrechamente como sea posible, Usar la terminología menos ambigua. A menudo, la parte más difícil de una búsqueda es saber como otras personas denominan el objeto de la p jbúsqueda. Ver los sinónimos y traducirlos todos ellos al inglés.

– Diseñar la petición. Los términos de la búsqueda pueden ser palabras sueltas o frases (grupo de palabras que aparecenpalabras sueltas o frases (grupo de palabras que aparecen seguidas). Hay que apuntar las mejores suposiciones de las palabras clave y terminología antes de estar en la computadora y escribirlas de todas las formas que puedan apareceraparecer.

Page 15: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Elección de la información

Los problemas más frecuentes en la selección deLos problemas más frecuentes en la selección de información tienen diversas soluciones:

1. Demasiados resultados:• Ser más específico en la descripción del tema.• Usar más palabras clave y relacionarlas con el And lógico.• Elegir la presencia de las palabras más relevantes.• Eliminar posibles palabras parecidas sin interés, mediante el

Not lógico.ot óg co• Usar frases, en vez de palabras sueltas, si es posible.• Restringir la búsqueda a campos concretos. Por ejemplo: titulo

(title), url, enlace (link) o anfitrión (host).• Poner en mayúscula la primera letra de los nombres propios yPoner en mayúscula la primera letra de los nombres propios y

usar acentos.• Escribir en castellano o cualquier otro idioma que no sea el

inglés.• Si se desea darle mayor consideración a cierta palabraSi se desea darle mayor consideración a cierta palabra,

simplemente repetirla.

Page 16: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Elección de la información:

2 Si lt d d i d2. Sin resultados o demasiados escasos:• Quitar palabras clave, dejando solo las más relevantes.• Cambiar el And por el Or lógico.• Comprobar la ortografía, sobre todo si hay más resultados

de los obtenidos.• Usar sinónimos y variantes.y• Cambiar o incluir entre singular y plural. Por ejemplo: libro

a libros, lápices a lápiz.• Poner todas las palabras en minúsculasPoner todas las palabras en minúsculas.• Usar buscadores más universales y usar el inglés.• Es posible que no haya mucha información sobre

el temael tema.

Page 17: Búsqueda de Información en la Web · • Existen en la red una serie de sitios web que puedenExisten en la red una serie de sitios web que pueden ayudar a seleccionar la información

Elección de la información:

3 D i d l t3. Demasiado lentos:• Eliminar palabras comunes o frecuentes. No utilizar

palabras de pocas sílabas como los artículos, pues f ilit á l bú d l l ános facilitarán la búsqueda y la prolongarán

innecesariamente.• No usar muchas palabras. Eliminar las no necesarias.• Cambiar de buscador, quizás esté sobrecargado o

realice las búsqueda en otro momento.• Desactivar la carga automática de los gráficos hasta

que alcance un objetivo interesante.• Si se quiere saltar hacia alguna página que no sea la

contigua, hay que usar la opción Ir (Go).