Lan praktikoa: Testuen datu-basea sortuLan praktikoa: Testuen datu-basea sortu Helburua: 1....

10
Lan praktikoa: Testuen datu-basea sortu Helburua: 1. Lematizatzailea eta indexatzailea zer diren ikastea 2. Testuen datu-base baten egitura ezagutzea 3. Hemeroteka txiki bat norbere ordenagailuan osatzea. Urratsak: 1. Testuak eskuratu 2. Testuak gorde 3. Softwarea eskuratu eta instalatu (lematizatzaile-indexatzailea) 4. Testuak lematizatu-indexatu 5. Hemeroteka kontsultatu 1. urratsa: testuak eskuratu Testuak handik edo hemendik eskura daitezke. Banan-banan eskura eta kopia daitezke edo webgune osoak kopiatzeko softwarea erabil daiteke. Lan honetan eskuz hartuko ditugu hiru dokumentu eta horiexekin osatuko dugu gure datu-base testuala. Jo ezazu Argia astekariaren webgunera http://www.argia.com Aurreko unitatean ikasi dugu Argiaren hemerotekan bilaketak egiten. Gogora ezkerreko markoan duzula <Bilaketak> egiteko leihoa. Jar ezazu bertan <hiesa> hitza, hies gaixotasunari buruzko tetsuak eskuratu nahi ditugulako. Kontura zaitez gur elan honetarako (ikastaro hasierako bilatzaileetan ez bezala) nahi bezala idatz daitekeela: hiesa, hies... hitz horien lema (<hies>) edo oinarrizko forma gramatikala bilatuko dugulako. Ikus ezazu ondoko irudi honetan, web-orrian duen itxura eta ikus ezazu bilaeten leihoa non dgaoen eta <hiesa> non jarri behar duzun.

Transcript of Lan praktikoa: Testuen datu-basea sortuLan praktikoa: Testuen datu-basea sortu Helburua: 1....

  • Lan praktikoa: Testuen datu-basea sortu Helburua:

    1. Lematizatzailea eta indexatzailea zer diren ikastea 2. Testuen datu-base baten egitura ezagutzea 3. Hemeroteka txiki bat norbere ordenagailuan osatzea.

    Urratsak:

    1. Testuak eskuratu 2. Testuak gorde 3. Softwarea eskuratu eta instalatu (lematizatzaile-indexatzailea) 4. Testuak lematizatu-indexatu 5. Hemeroteka kontsultatu

    1. urratsa: testuak eskuratu Testuak handik edo hemendik eskura daitezke. Banan-banan eskura eta kopia daitezke edo webgune osoak kopiatzeko softwarea erabil daiteke. Lan honetan eskuz hartuko ditugu hiru dokumentu eta horiexekin osatuko dugu gure datu-base testuala. Jo ezazu Argia astekariaren webgunera

    http://www.argia.com Aurreko unitatean ikasi dugu Argiaren hemerotekan bilaketak egiten. Gogora ezkerreko markoan duzula egiteko leihoa. Jar ezazu bertan hitza, hies gaixotasunari buruzko tetsuak eskuratu nahi ditugulako. Kontura zaitez gur elan honetarako (ikastaro hasierako bilatzaileetan ez bezala) nahi bezala idatz daitekeela: hiesa, hies... hitz horien lema () edo oinarrizko forma gramatikala bilatuko dugulako. Ikus ezazu ondoko irudi honetan, web-orrian duen itxura eta ikus ezazu bilaeten leihoa non dgaoen eta non jarri behar duzun.

    http://www.argia.com

  • botoiari eman ondoren, honako honen antzeko emaitza eskuratuko duzu. Emaitza ez da beti bera izango, bilaketa egun batean edo bestean eginda, artikulu berri gehiago egon daitezkeelako aldizkarian.

  • 2. urratsa: testuak gorde Aukera itzazu hiru testu Argia astekariko ARTIKULUEN artean (berriak-eta laburregiak dira praktika honetan egin nahi dugun lan honetarako). Artikulu horiek banan-banan ireki, tetsua kopiatu () eta testu prozesatzailean (Word-en adibidez) gorde.

    Orain, sortu HIES izeneko karpeta bat zure ordenagailuan eta gorde hiru testu horiek karpeta hartan. Hortaz, badugu gure testu bilduma. Gogoan hartu hiru testurekin bakarrik ari garela baina ehunka edo milaka testurekin ere berdin joka genezakeela. Goazen, bada, hurrengo urratsera.

  • 3. Softwarea eskuratu eta instalatu (lematizatzaile-indexatzailea) Lan honetarako Kapsulara joko dugu eta Kwin tresna erabiliko dugu. Tresna horrek irakurri ditu gure testuak, testu horretako hitzak lematizatuko ditu eta den-dena indexatuko du. Hau da, , , eta abar irakurtzean lemarekin gordeko ditu aurkibide orokorrean. Horrela, guk hitz horietako edozein bilatuta ere (0, -a, -etik...) denak erakutsiko dizkigu hemerotekak. Eskura dezagun tresna lehenbizi. Jo ezazu helbide honetara

    http://www.kapsula.com Goialdeko banner-ean bada lerro bat aldizka dioena Klik egizu hitz horien gainean, programa eskuratzeko.

    Honako orrialde hau agertuko zaizu:

    http://www.kapsula.comhttp://www.kapsula.com

  • botoian klik eginda, fitxategia eskuratuko duzu. Ikus ezazu ea non gordetzen duzun zure ordenagailuan. Jaistea bukatzean, honako fitxategi hau izango duzu:

  • Orain, aski duzu fitxategi horren gainean klik egitea, programa instalatzeko. Behin programa instalatua eta testuak bilduta ditugunez, testuak indexatzen has gaitezke.

    4. Testuak lematizatu-indexatu botoian klik eginda, leiho hau irekiko zaizu. botoian klik eginda agertuko zaizun menuan hautatu behar duzu. Izan ere, ezin duzu ezer kontsultatu, datu-baserik sortu ez duzulako.

    hautatu ondoren, elkarrizketa hau irekiko zaizu:

    Jarri izena zure datu-baseari (base berria) baita deskripzioa ere, hala nahi izanez gero (adibidez “Hiesari buruzko artikuluak, Argia astekarian). >Ados> botoiaren gainean klik egitean, dokumentuak hautatzeko leihoa irekiko da.

  • Word-ekin bezala, honekin ere testuak aukeratu behar dituzu. Jo ezazu hiru dokumentu haiek gorde dituzun karpetara (HIES) eta aukera itzazu hirurak. Kito. Datu-basea sortua duzu. Ohar zaitez fitxategi horiek eskuratzean, tresnak lematizatu egin dituela eta indexatu. Hemeroteka osatua duzu zure ordenagailuan (hiru dokumenturekin) eta aurrerantzean bilaketak egiteko aukera izango duzu.

  • 5. Hemeroteka kontsultatu Kwin ireki eta datu-basea aukeratu (eratu duzun bakarra, Kwin ariketa honetan lehen aldiz erabili baduzu). Orain botoia erabil dezakezu. Demagun hitza bilatu nahi duzula. Berehala erantzungo dizu programak esanez zein dokumentutan ageri den hitz hori (). Esate baterako, demagun hiru dokumentuetan dagoela: 001.doc, 002.doc eta 003.doc (eta zuk emandako izenak) agertuko dira leihoan.

    Orain nahikoa da horietako edozeinen gainean klik egitea: testua bera irekiko da eta bilatu duzun hitza ( agertuko da kolorez markatua.

  • Gainera, baduzu koadrotxo bat goialdean eskuinean, dokumentutik dokumentura eta agerpenetik agerpenera jauzi egiteko eta emaitzak banan-banan aztertzeko.

  • Horixe da hemeroteka eta antzeko zerbitzuek erabiltzen duten sistema. Gurean hiru dokumentu erabili ditugu baina sarean dauden webguneetan ehunka edo milaka izan daitezke arakatzen direnak.

    Testuen datu-baseakHelburuaUrratsak1. urratsa: testuak eskuratu2. urratsa: testuak gorde3. urratsa: softwarea instalatu4. urratsa: testuak indexatu5. urratsa: testuak kontsultatu