Bilatzaileak azalpena

7
Zer da bilatzaile bat? Spider, Robot edo Crawler dietzen diren softwarean oinarrituta daude. GoogleBot. Webguneetako URL-ak eta erlazionatutako informazioa automatikoki arakatzen dute eta horrekin beren datu-base erraldioia sortzen dute (Cache). Bilaketak datu-base horretan egiten ditugu. Gero estekari emandakoan, orduan joaten gara webgunera.

description

Bilatzaileak azalpena

Transcript of Bilatzaileak azalpena

Page 1: Bilatzaileak azalpena

Zer da bilatzaile bat?

• Spider, Robot edo Crawler dietzen diren softwarean oinarrituta daude. GoogleBot.

• Webguneetako URL-ak eta erlazionatutako informazioa automatikoki arakatzen dute eta horrekin beren datu-base erraldioia sortzen dute (Cache).

• Bilaketak datu-base horretan egiten ditugu. Gero estekari emandakoan, orduan joaten gara webgunera.

Page 2: Bilatzaileak azalpena

Zer da bilatzaile bat

• Interneteko informazio gehiena indizatzen dute.

• Bilaketa-emaitzen kalitatean erabiltzailearen trebetasuna inportantea da.

• Hiru robot daude: www.google.com , www.yahoo.com , www.live.com edo www.kumo.com

• Bilaketak datu-base horretan egiten ditugu. Gero estekari emandakoan, orduan joaten gara webgunera.

Page 3: Bilatzaileak azalpena

Nola aurkezten ditu emaitzak?

• Bilaketan ipinitako gako-hitzak non dauden eragina du: tituluan, url-an, azpitituluetan.

• Geografiak ere eragina du. Europatik egindako bilaketetan Europako emaitza gehiago.

• Page Rank algoritmoaren bidez.

Page 4: Bilatzaileak azalpena

PageRank

Page 5: Bilatzaileak azalpena

Nola aurkezten ditu emaitzak?PageRank

• Zenbat eta esteka gehiago jaso webgune batek orduan eta PageRank hobeagoa izango du.

• Zenbat eta PageRank altuagoa izan orduan eta posizio hobeagoak hartzeko aukera.

Page 6: Bilatzaileak azalpena

(Crawler/GoogleBot) Arakatzen du dokumentuen bila

Dokumentuak Indizatu

WEBA

Kontsulta

Algoritmoak, Page RankBilaketa

Bilaketa berregin

Datu-basea

Page 7: Bilatzaileak azalpena

Zarata eta isiltasuna

Zarata: Bilatutako dokumentu ez egokiak (B)Isiltasuna: Bilatu gabeko dokumentu egokiak (C)

Egokia Ez egokiaBilatuak A BBilatu gabeak C D

Bilatuak

Egokiak

Bilatuak eta egokiak

A CB