4 1 buscadores de informacion

18
Página1 TECNOLÓGICO DE ESTUDIOS SUPERIORES DE JOCOTITLÁN Ingeniería en Gestión Empresarial Software de Aplicación Ejecutiva Unidad 4:Internet 4.1: Buscadores de Información Docente: Ing. Armando Barrios Lovera Alumno: José Alfonso García Molina Grupo: IG-202 FECHA: 23 DE MAYO DEL 2013

Transcript of 4 1 buscadores de informacion

Page 1: 4 1 buscadores de informacion

Pág

ina1

TECNOLÓGICO DE ESTUDIOS SUPERIORES

DE JOCOTITLÁN

Ingeniería en Gestión Empresarial

Software de Aplicación Ejecutiva

Unidad 4:Internet

4.1: Buscadores de Información

Docente: Ing. Armando Barrios Lovera

Alumno: José Alfonso García Molina

Grupo: IG-202

FECHA: 23 DE MAYO DEL 2013

Page 2: 4 1 buscadores de informacion

Pág

ina2

ÍNDICE

INTRODUCCIÓN 3

CAPITULO I

BUSCADOR

1.1 Buscador 4

1.1.1 Historia. 4

1.1.2 Definición de buscador. 5

1.1.3 Función de los buscadores. 6

1.1.4 Objetivo de los buscadores. 6

1.1.5 Clasificación de los buscadores. 7

1.1.6 Tipos de buscadores. 8

1.1.7 Componentes de un buscador. 8

CAPITULO II

BUSCADORES DE INFORMACIÓN

2.1 Técnicas y estrategias de búsqueda. 10

2.2 Algunos consejos para la búsqueda. 11

2.3 Términos para acotar la búsqueda. 12

2.4 Los buscadores más actuales y los más conocidos 12

Preguntas 15

Referencias bibliográficas y cibergráficas. 18

Page 3: 4 1 buscadores de informacion

Pág

ina3

INTRODUCCIÓN

En esta investigación, se encontrará lo más relevante información sobre los

buscadores de información, detallando su definición y concepto habitual que se

conoce de “buscador”.

Conociendo los conceptos más fundamentales, se localizara cuál es su función de

un buscador, así como su clasificación, su objetivo principal y los tipos de

buscadores que nosotros nos podemos encontrar en internet.

Al igual, se adentrará a fondo cual son los componentes de los buscadores; donde

se definirá sus mecanismos, como los los robots de rastreo, algoritmo de

indexación y el interfaz, ya que estos elementos son fundamentales, que nos

ayudan a generar nuestra búsqueda y encontrar la información que nosotros

requerimos.

Ya que también se mostraran cuales son algunas técnicas y estrategias, para

lograr una buena búsqueda por internet. Al igual que algunos consejos para ser

más fácil nuestra búsqueda.

Al final de esta investigación se darán a conocer algunos buscadores de

información, ya que estos buscadores son los más importantes y más actuales del

mundo. Por lo que hay muchas formas y herramientas que nos ayudan a lograr

una excelente búsqueda, por lo que hay que hay que considerar que no solo

existe un solo buscador, si no miles.

Page 4: 4 1 buscadores de informacion

Pág

ina4

CAPITULO I

BUSCADOR

1.1 Buscador

1.1.1 Historia de los buscadores

1994:

EInet Galaxy--------Directorio de 1994

El primer directorio como tal y como ahora lo conocemos en la actualidad .

En abril de 1994 David Filo y Jerry Yang crearon Yahoo!. Comenzó como un

directorio, por lo que tuvo que evolucionar incorporando un buscador para ese

directorio

20 de abril de 1994

Brian Pinkerton presento WebCrawlerEn realidad este buscador era de escritorio

pero tiempo después ya era un buscador en un robot de la red

Dos años después; en 1996

El proyecto Google comienza a desarrollarse en enero de 1996 Sergey Brin y

Larry Page. Hay que destacar dos razones por las que Google se hizo muy

interesante: una interfaz muy clara y sencilla (como la de AltaVista en sus inicios)

y unos resultados muy relevantes

Page 5: 4 1 buscadores de informacion

Pág

ina5

Ocho años después:

En marzo de 2004 algunos buscadores comenzaron a utilizar la base de datos de

Yahoo!

Comenzaron a aparecer nuevos proyectos muy interesantes. Uno de ellos es

Nutch, un motor de búsqueda en código abierto hecho por Java. Aunque su

desarrollo es costoso, ha conseguido el apoyo de Yahoo!

En noviembre de 2004, MSN Search y de la mano de Christopher Payne y

Oshoma Momoh pusieron en marcha una primera fase publicada del motor de

Microsoft, que se hizo publicada el 20 de enero del 2005. El 1 de noviembre de

2005 se presentaba la plataforma Windows Live que sería la nueva interfaz del

motor de búsqueda.

En 2006 y 2007

Hakia y Powerset motor de búsqueda semántica

La búsqueda semántica es un proceso utilizado para mejorar la búsqueda

por Internet mediante el uso de datos de las redes semánticas para desambiguar

las consultas y el texto de la webcon la finalidad de encontrar los resultados más

relevantes en relación a la demanda del usuario.

1.1.1 Definición de buscadores

Los buscadores son los sitios más frecuentados de internet, y por lo

general, el mejor punto de partida de todo recorrido por la red.

A los buscadores también se les denomina web “crawlers” ya que van

“avanzando” por la red (crawl, en inglés, “ir a rastras”.

Un buscador o motor de búsqueda es un sistema o

aplicación informática que permite la búsqueda de todo tipo de términos y

Page 6: 4 1 buscadores de informacion

Pág

ina6

palabras clave a partir del desarrollo de índices de archivos almacenados

en servidores web.

La utilización de buscadores web se ha convertido en uno de los principales

motivos de uso de Internet, facilitando la obtención de información y el trabajo de

fondo investigativa pero también con fines sociales, recreativos y personales.

Los buscadores poseen enormes bases de datos que contienen información

referente a páginas web. Estas bases de datos se generan por las altas de

usuarios que han creado sus páginas web (esto equivaldría a poner tus datos en

un listín telefónico). En muchos buscadores, si el creador de la página no se da de

alta en el buscador, la página no aparecerá. Para las empresas es muy importante

promocionar sus páginas en los buscadores para que la gente las encuentre

fácilmente.

Los buscadores son o bien motores de búsqueda, es decir, bases de datos que

incorporan nuevos términos en forma constante y automática, o bien, índices

temáticos, sistemas que requieren de un componente humano y manual para el

ingreso y asignación de sitios web a palabras clave y categorías.

1.1.2 Función de los buscadores

Proporcionar al usuario información sobre todas las páginas Web relacionado con

el tema que le hemos indicado.

El internet es algo tan complejo que siempre es difícil encontrar exactamente la

información que busca.

Web spiders. Estas arañas (spiders, en inglés) son programas que registran la red

buscando documentos mientras usted va siguiendo hipervínculando de las

páginas web.

Los buscadores utilizan a menudo esas “arañas”. Cuando una de ellas descubre

una página relativa a la temática indicada, aparece un “agente de software”, que

envía el documento y, además, información sobre él y un software de indexación.

El software de indexación recibe del agente los documentos y las direcciones

URL.

Si busca información a través de un buscador, lo normal es introducir una palabra

clave relativa al área o al tema que le interese. La base de datos del buscador es

examinada según los datos que usted haya introducido.

Page 7: 4 1 buscadores de informacion

Pág

ina7

1.1.3 objetivos de los buscadores

Encontrar los documentos que contengan las palabras claves introducidas.

Habitualmente localiza las páginas Web que mejor se adapten a las palabras

introducidas.

1.1.4 Clasificación de los buscadores

Los buscadores se pueden clasificar a través de navegación y el otro método es

buscando por medio de un buscador, el método de navegar es ir abriendo ligas en

las páginas, estas ligas son creadas por otros usuarios, sin embargo, para el

método de buscar se utiliza forzosamente un buscador.

CLASIFICACIÓN DE LOS BUSCADORES

1. ÍNDICES O DIRECTORIOS: Son los primeros buscadores que aparecieron. Un

directorio permite buscar información separando los temas en categorías

generales las cuales se dividen en subcategorías cada vez más específicas.

2. MOTORES DE BUSQUEDA: Se trata de la evolución natural de los directorios.

Permite localizar información al escribir con las palabras desplegando una lista

de páginas web que contiene datos relacionados con las palabras que se han

escrito.

3. METABUSCADORES: También llamados buscadres múltiples ya que realizan

varias búsquedas simultaneas en los demás buscadores y muestran los

resultados ordenados de acuerdo a cada buscador y el más conocido

es METRACRAWLER.

Metacrawler, uno de los meta buscadores más potentes de

internet ofrece un diseño renovado y una mejor organización

de los resultados de búsqueda gracias al nuevo sistema que

Page 8: 4 1 buscadores de informacion

Pág

ina8

permite agrupar automáticamente los resultados bajo

determinadas categorías. El servicio avanzado de búsqueda

permite utilizar operadores booleanos o acotar pesquisas por

fecha, idioma, dominio o restringir los contenidos para

adultos.

4. BUSCADORES ESPECIFICOS: Son aquellos que solo contienen información

sobre un tema concreto es importante resaltar que utilizan índices

especializados para acceder a la información de una manera más específica y

fácil.

1.1.5 Tipos de buscadores

BUSQUEDAS BASICAS: Se llevan a cabo al escribir lo que se desea encontrar en

el cuadro de texto de los buscadores. A veces es necesario ser lo más específico

posible al momento de escribir para obtener el resultado deseado.

BUSQUEDAS AVANZADAS: Los mecanismos de la búsqueda nos permiten

utilizar palabras especiales llamadas operadores lógicos u operadores booleanos

para modificar su criterio de búsqueda y existen 3 tipos de operadores lógicos que

se utilizan en ocasiones en la búsqueda de la web y es: Y (AND), O (OR), y NO

(NOT).

1.1.6 Componentes de un buscador

Los tres componentes de un buscador

Un robot de rastreo, Un programa o algoritmo de indexación

interfaz de búsqueda.

Los robots de rastreo

Los robots de rastreo tienen otros nombres: arañas de rastreo, crawlers o bots

rastreadores. Pero en definitiva son simplemente programas automatizados que

Page 9: 4 1 buscadores de informacion

Pág

ina9

recorren la web, buscando sitios web y las páginas que los componen, y en

general todos los archivos que pueda encontrar en la red.

Los robots de rastreo recorren la web y visitan los diferentes sitios web de una

manera generalmente aleatoria. Así pues, las visitas de las arañas rastreadoras

pueden ser ocasionales o muy frecuentes. Pero aun cuando sean ocasionales las

visitas, estas siempre llegarán y verificarán cambios en el contenido de la web o

de las páginas, modificaciones, eliminaciones, adiciones, etc.

La araña o robot de rastreo de Google se llama Googlebot, y en realidad no es

una sola araña, es decir, no hay un único Googlebot, sino varias copias del mismo

que se originan en diferentes máquinas de Google.

La araña de rastreo de Yahoo, tiene el nombre de Slurp, y la araña de rastreo de

Bing recibe el nombre de MSNBot por sus origines en el ahora extinto Microsoft

Live Search.

El trabajo de todos estos rastreadores es, de manera ideal, rastrear y recolectar

información de todas las páginas y archivos que existan en la web, sin embargo,

esto no siempre es así, de hecho de una manera indeseablemente frecuente son

incapaces de encontrar y rastrear el contenido total de muchos sitios web. En

otros casos, se les prohíbe rastrear y recopilar información. Son dos casos

diferentes: incapacidad y prohibición.

Hasta hace poco, los rastreadores sólo podían entender unos pocos tipos de

archivos, pero en la actualidad, casi todos los tipos de archivos pueden ser

accedidos y rastreados. Así, por ejemplo, evidentemente los archivos tipo html son

los primordiales, pero por ejemplo Googlebot es capaz de rastrear archivos pdf,

ps, rss, atom, dwf, kml, kmz, wk1 al wk5, wks, wku, lwp, mw, xls, ppt, doc, wkis,

wps, wdb, wri, odt, rtf, swf, ans, txt, wml, wap, jsp, asp y por supuesto php.

La Indexación de los resultados de búsqueda

La indexación de los motores de búsqueda consiste en la recolección, evaluación,

agrupación y almacenamiento de información de forma tal que se facilite y

garantice un acceso rápido y certero de su contenido. La búsqueda en estos

índices garantizará que puede recuperarse información relevante según el criterio

empleado.

La mayoría de los buscadores actualmente contienen en sus índices, miles de

millones de documentos indexados, probablemente Google sea el que posee la

mayor cantidad.

Page 10: 4 1 buscadores de informacion

Pág

ina1

0

La Interfaz de búsqueda

La puerta de acceso a las páginas de resultados de los buscadores es la interfaz

de búsqueda. Todos y cada uno de los motores de búsqueda, llámese Google,

Bing, Yahoo, Ask, etc., tienen su propia y particular interfaz de búsqueda, desde

las minimalistas hasta aquella que constituyen verdaderos portales web, en los

cuáles la búsqueda es simplemente un elemento más.

Al parecer, a la mayoría de las personas les interesaba una interfaz de búsqueda

simple y exclusivamente dedicada a servir sólo como puerta de acceso a lo que

estaba buscando, de ahí que Google inicialmente terminó siendo la opción

elegida, aunque obviamente no fue ese el único motivo.

Se puede decir que la interfaz de búsqueda, se presenta bajo dos formatos: antes

de cualquier búsqueda y con los resultados de las búsquedas.

Antes de la búsqueda, muchos buscadores sólo muestran la casilla para introducir

nuestra palabra o frase de búsqueda, y con los resultados que esta devuelve la

página se puebla con enlaces patrocinados, o sea, aquellos que son promovidos y

pagados por algún anunciante, y el resto de resultados o enlaces que

corresponden a sitios que resultan relevantes al criterio de búsqueda usado, a

estos se denomina resultados de búsqueda orgánicos. Cada uno de los

buscadores usa algoritmos de calificación propios que, evaluando los diferentes

aspectos que considera pertinentes para un criterio de búsqueda determinado,

presenta los resultados de mayor a menor relevancia, de arriba a abajo en la

página, y así luego en las siguientes. Cada buscador ofrecerá un resultado de

búsqueda diferente al de otro buscador.

En Resumen de los componentes de un buscador

Un buscador está formado fundamentalmente por tres componentes. El primero de

ellos recoge información, se llama robot, spider o crawler y navega por internet de

forma totalmente automática. Toda montaña de información encontrada, el

“índice”, se envía a la administración. El segundo elemento es el software de

indexación, que estructura y hacen examinables los datos trasmitidos. El tercer y

último componente examina la consulta realizando por el usuario y envía el

término de búsqueda al ordenador con los datos para, desde ahí, presentar al

usuario los resultados de su búsqueda.

CAPITULO II

BUSCADORES DE INFORMACIÓN

Page 11: 4 1 buscadores de informacion

Pág

ina1

1

2.1 Técnicas y estrategias de búsqueda.

TÉCNICAS DE BÚSQUEDA.

Planificar bien la búsqueda y saber que cada búsqueda es diferente.

Mirar la ayuda que cada buscador ya que hay pequeñas diferencias entre

uno y otro.

Acotar los términos de búsqueda que los operadores booleanos o de

cercanía, comodines, etc.

Usar si se puede varios búscadores.

Si es posible y lo permite la búsqueda hacer las acotaciones desde

búsqueda avanzada.

ESTRATEGIAS DE BÚSQUEDA.

Utilización de operadores booleanos: AND (+), NOT (-), NEAR.

Usar expresiones literarias, se ponen entre comillas

Uso de comodines: ejemplo. “comercio electrónico” + conta.

El uso de mayúsculas y minúsculas.

Acentos y ñ. es mejor consultar la ayuda de cada buscador

2.2 Algunos consejos para la búsqueda

Sugerencia: internet cuenta con diferentes servidores WWW que mantienen

contacto con todos los grandes buscadores.

Solo debe introducirse un término y será enviado a eso buscadores y catálogos.

En primer lugar se encuentran las conexiones lógicas entre términos de búsqueda

y, en segundo término, el contenido semántico del tema sobre el cual el usuario

busca información, es decir debe presentar sobre el cual el usuario busca

información. Por ello debe utilizar las opciones avanzadas de los buscadores.

También es necesario utilizar con precaución conexiones de varios términos con el

operador.

Puede unir palabras con “+”, Y o AND, es decir, los términos unidos por esos

operadores deben aparecer en las lista de resultados. Un signo “menos” (-), o

NOT excluye la palabra, que no debe aparecer en la presentación de resultados.

Page 12: 4 1 buscadores de informacion

Pág

ina1

2

2.3 Términos para delimitar la búsqueda

2.4 Los buscadores más actuales y los más conocidos.

Page 13: 4 1 buscadores de informacion

Pág

ina1

3

Como activa su éxito google.com? Es un resultado

alfanumérico que se inicia al consultar una duda,

ahí, en una espiral de resultados positivos, se

activan 54.000 servidores, luego 100.000

procesadores a los que activan 8.000 millones de

páginas web

Mención especial merece la transformación de

Yahoo!, cuya novedad más destacada es que el

usuario puede personalizar sus búsquedas a través

del servicio "My Yahoo! Search". De este modo, el

internauta puede ir guardando así los enlaces que

desee e incluso introducir comentarios personales.

Posteriormente, en la opción "Mi web", el internauta

encontrará sólo aquellas páginas que haya

consultado con anterioridad, similar a un servicio de

favoritos. Además, el portal permite almacenar

direcciones de sindicación de contenidos con el fin

de rescatarlas y utilizarlas más tarde.

Es un motor de búsqueda que encuentra y organiza

las respuestas que necesitas de manera que puedas

tomar decisiones con más información y rapidez.

La gran novedad en el sistema de Clusty es la forma

de organizar la información. Todos los enlaces

quedan agrupados en carpetas o 'clusters' en los

que las páginas 'web' se distribuyen por contenidos,

algo similar a lo que ocurre en el Explorador de

Windows.

Introduce la posibilidad de buscar documentos,

archivos o carpetas dentro del disco duro del

ordenador, y personaliza las búsquedas

inapropiadas o erróneas para ajustarlas a las

necesidades del usuario.

Ask Jeeves incluye sus conocidos 'prismáticos', que

permiten visualizar la página sin necesidad de

entrar.

Esta función permite a los usuarios despedirse del

'antiguo' método, con el que el usuario debe abrir

página por página y luego retroceder hasta la lista de

resultados

Wotbox es un Motor de búsqueda independiente de

búsqueda geográfico. "Estamos intentando brindar a

nuestros usuarios internacionales la mejor opción de

Page 14: 4 1 buscadores de informacion

Pág

ina1

4

búsqueda geográfica. A la vez que pretendemos que

la interfaz de búsqueda resulte tan familiar y sencilla

personalizando su lengua materna."

Buscador de webs, imágenes, MP3/audio, video,

directorio, noticias. También ofrece otras

herramientas como un traductor, filtro familiar,

servicio de páginas amarillas, buscador de personas

y comparador de precios de diferentes productos a

través de Dealtime (http://altavista.dealtime.com).

La base de datos actual está ordenada según la

fórmula de relevancia de AltaVista.

Dispone de dos opciones de búsqueda avanzada.

Podemos utilizar el sistema clásico de operadores

booleanos y para los internautas menos

experimentados, existe la opción de recurrir al

método de formulario simple.

Este novedoso buscador francófono destaca por la

cantidad de información añadida sobre una página

que nos facilita cuando realizamos una búsqueda en

él (visualización previa desde el propio buscador,

localización y características del servidor donde se

aloja la página, propietario del dominio e información

de antiguas versiones de la página consultada.

"El buscador seguro para los niños", se asoció con

Google para crear lo que califica como la mayor

base de datos online de sitios "seguros para los

niños". OneKey usa una combinación de sitios ya

filtrados por mano humana con la información ya

filtrada por Google para determinar los sitios

disponibles para la búsqueda.

METABUSCADORES

Un meta buscador muy potente.

Metacrawler, uno de los meta buscadores más

potentes de internet ofrece un diseño renovado y

una mejor organización de los resultados de

Page 15: 4 1 buscadores de informacion

Pág

ina1

5

búsqueda gracias al nuevo sistema que permite

agrupar automáticamente los resultados bajo

determinadas categorías. El servicio avanzado de

búsqueda permite utilizar operadores booleanos o

acotar pesquisas por fecha, idioma, dominio o

restringir los contenidos para adultos.

PREGUNTAS

1.- ¿Define buscador?

Es el punto de partida donde permite la búsqueda de todo tipo de términos y

palabras clave a partir del desarrollo de índices de archivos almacenados en

servidores web.

2.- ¿Qué ventajas tiene un buscador que se ubica en el país donde te sitúas?

Se encuentra información sobre el tema que se desea buscar del propio

país.

Las páginas web se muestran en el idioma del país.

3.- ¿Qué te tipo de buscador te envía más información?

Al utilizar los motores de búsqueda nos arroja más información de la deseada. Un

claro ejemplo es Google, ya que este buscador, al introducir la palabra clave nos

envía miles de sitios web, donde posiblemente va estar contenida la información

que el usuario este demandando.

4.- ¿Qué es mejor un buscador o un metabuscador?

Los metabuscadores, por qué; realizan varias búsquedas simultaneas en los

demás buscadores, y el buscador localiza la información al escribir las palabras

desplegando una lista de páginas web que contienen datos relacionados con las

palabras que se han escrito.

5.- ¿Cuál es el máximo de palabras que puedes utilizar en un buscador?

No hay límite de palabras, solo que, entre más palabras se inserten en el cuadro

de texto del buscador va ser más compleja la búsqueda y no se obtendrán los

resultados esperados.

6.- ¿El orden en el que aparecen las paginas a que se basa?

Page 16: 4 1 buscadores de informacion

Pág

ina1

6

De acuerdo a la popularidad de las páginas web o las más demandadas y por

ende que contengan información relacionada con lo que el usuario demande.

7.- ¿Cuáles son las ventajas de los buscadores?

Proporcionan información relevante.

8.- ¿Los directorios como se mostraban?

9.- ¿Ventajas de Google contra otros?

Google:

Es un buscador mundial

Es más rápida la búsqueda

Resultados muy relevantes.

Su interfaz clara y muy sencilla.

Tiene millones de páginas web.

10.- ¿Qué beneficios te brinda como empresa tener un buscador?

Son muchos los beneficios, por que interviene lo que es la mercadotecnia y así dar

a conocer a la empresa y los servicios que ofrece la misma.

11.- ¿Qué desventajas tiene un buscador?

Page 17: 4 1 buscadores de informacion

Pág

ina1

7

La información puede no ser verás.

Entre más palabras se ingresen al cuadro de texto del buscador no se

obtendrán resultados favorables.

No siempre se obtendrá la información deseada.

12.- ¿Dónde se almacena la información de los buscadores?

En una base de datos que se encuentran en discos duros almacenados

Page 18: 4 1 buscadores de informacion

Pág

ina1

8

REFERENCIAS

http://seoesencial.com/info-general/historia-de-los-buscadores.php

19/05/2013 12:42pm

http://culturainformatica.es/articulos/historia-de-los-buscadores/ 19/05/2013

12:44 pm

http://www.definicionabc.com/tecnologia/buscador.php#ixzz2TlP6KzPr

19/05/2013 01:13 pm

http://es.slideshare.net/alixnaza/buscadores-especializados#btnNext

19/05/2013 01:38 pm

http://yerikendisvd.blogspot.mx/p/clasificacion-de-los-buscadores-y-

tipos.html 19/05/2013 10:45 pm.

http://saber-web.com/2010/11/como-funciona-buscador-google/ 19/05/2013

02:09 pm.

http://www.taringa.net/posts/info/979463/Los-buscadores-mas-importantes-

del-mundo.html 22/05/2013 1:28 a.m

http://javiercasares.com/seo/historia-de-los-buscadores/ 22/05/2013 1:11

am