TERMINOLOGIA SAREAK EHUNDUZ (TSE)garaterm.ehu.es/garaterm_ataria/wp-content/uploads/...:...

14
TERMINOLOGIA SAREAK EHUNDUZ (TSE) GARATERM LAN-INGURUNEA Testuen kargarako interfazea (2020-II-19) 0. GOMENDIO OROKORRAK 0.1. Erabili Mozilla Firefox nabigatzailea: beste nabigatzaile batzuekin gerta daiteke funtzionalitate batzuek arazoak ematea. 0.2. Saihestu PDF formatuko dokumentuak igotzea: irudi modura prozesatzen dira eta informazio ugari galtzen da prozesatze linguistikoan. 0.3. Aurreko instrukzioaren ildotik, hauexek dira onartzen diren formatuak: Html (.html, .htm, .xhtml), Testua (.txt), Word (.doc, .docx, ...), Powerpoint (.ppt, .pptx, ...), Oppenoffice (.odt, .odp, ...), Latex (.tex). Latex dokumentua igoz gero konprimituta igo behar da konpilatzeko behar diren dokumentu guztiekin batera (.tar, .gz, .zip), baina “.tex” dokumentuak ez du karpeta baten barruan egon behar, goiko mailan egon behar baitu ondo prozesa dadin. 0.4. Igoko diren dokumentuen artean, bereizi fitxategi desberdinetan genero desberdinetako testuak: irakaskuntza-gida, apunteak, ppt aurkezpenak, ariketak, praktika-protokoloak, azterketak… (Aukera dago testu-genero horiek guztiak egokiro identifikatuta igotzeko, baina ez da nahitaezkoa denetarikoak igotzea: parte-hartzaile bakoitzak erabakiko du zein diren bere irakasgaian erabiltzen dituen hizkuntza-baliabideen adierazgarri). 0.5. Materialak fitxategi txikietan bereizita badituzu, hobe horrela mantentzea. Izan ere, prozesatze linguistikoan arazoren bat egonez gero, errazago detektatzen da fitxategi txikietan. 0.6. Lan-ingurunea prestatuta dago irakaskuntzan erabiltzen diren materialak igotzeko, baina baita jardun akademikoarekin lotutako bestelako testuak igotzeko ere: aldizkarietako artikuluak, blog espezializatuetako artikuluak, lan akademikoak (GrAL, MAL, doktoretza- tesiak). 0.5. Garbitu ahal duzun gehien lan-ingurunera igoko dituzun dokumentuak: a) Bibliografia- zerrendak kendu. b) Euskara ez diren hizkuntzetan dauden testu-zati luzeak ezabatu. c) Orrialde edota diapositiba guztietan errepikatzen diren goiburuak ezabatu: maiz errepikatzen direnez, estatistikak desitxuratzen dituzte. 1. Lan-ingurunera sartu Lan-ingurunera sartzeko, ERABILTZAILEA eta PASAHITZA behar dituzu: POSTA ELEKTRONIKOZ helduko zaizkizu. Gorde lehen saioan erabili ahal izateko. Testuak kargatzeko interfazera heltzeko, helbide honetara joan: http://ixa2.si.ehu.es/garaterm Emandako erabiltzailea eta pasahitza erabiliz, Garaterm lan-ingurunearen karga-interfazean sartuko zara, “login” sakatuz.

Transcript of TERMINOLOGIA SAREAK EHUNDUZ (TSE)garaterm.ehu.es/garaterm_ataria/wp-content/uploads/...:...

  • TERMINOLOGIA SAREAK EHUNDUZ (TSE) GARATERM LAN-INGURUNEA

    Testuen kargarako interfazea (2020-II-19)

    0. GOMENDIO OROKORRAK 0.1. Erabili Mozilla Firefox nabigatzailea: beste nabigatzaile batzuekin gerta daiteke funtzionalitate batzuek arazoak ematea. 0.2. Saihestu PDF formatuko dokumentuak igotzea: irudi modura prozesatzen dira eta informazio ugari galtzen da prozesatze linguistikoan. 0.3. Aurreko instrukzioaren ildotik, hauexek dira onartzen diren formatuak: Html (.html, .htm, .xhtml), Testua (.txt), Word (.doc, .docx, ...), Powerpoint (.ppt, .pptx, ...), Oppenoffice (.odt, .odp, ...), Latex (.tex). Latex dokumentua igoz gero konprimituta igo behar da konpilatzeko behar diren dokumentu guztiekin batera (.tar, .gz, .zip), baina “.tex” dokumentuak ez du karpeta baten barruan egon behar, goiko mailan egon behar baitu ondo prozesa dadin. 0.4. Igoko diren dokumentuen artean, bereizi fitxategi desberdinetan genero desberdinetako testuak: irakaskuntza-gida, apunteak, ppt aurkezpenak, ariketak, praktika-protokoloak, azterketak… (Aukera dago testu-genero horiek guztiak egokiro identifikatuta igotzeko, baina ez da nahitaezkoa denetarikoak igotzea: parte-hartzaile bakoitzak erabakiko du zein diren bere irakasgaian erabiltzen dituen hizkuntza-baliabideen adierazgarri). 0.5. Materialak fitxategi txikietan bereizita badituzu, hobe horrela mantentzea. Izan ere, prozesatze linguistikoan arazoren bat egonez gero, errazago detektatzen da fitxategi txikietan. 0.6. Lan-ingurunea prestatuta dago irakaskuntzan erabiltzen diren materialak igotzeko, baina baita jardun akademikoarekin lotutako bestelako testuak igotzeko ere: aldizkarietako artikuluak, blog espezializatuetako artikuluak, lan akademikoak (GrAL, MAL, doktoretza-tesiak). 0.5. Garbitu ahal duzun gehien lan-ingurunera igoko dituzun dokumentuak: a) Bibliografia-zerrendak kendu. b) Euskara ez diren hizkuntzetan dauden testu-zati luzeak ezabatu. c) Orrialde edota diapositiba guztietan errepikatzen diren goiburuak ezabatu: maiz errepikatzen direnez, estatistikak desitxuratzen dituzte. 1. Lan-ingurunera sartu Lan-ingurunera sartzeko, ERABILTZAILEA eta PASAHITZA behar dituzu: POSTA ELEKTRONIKOZ helduko zaizkizu. Gorde lehen saioan erabili ahal izateko. Testuak kargatzeko interfazera heltzeko, helbide honetara joan: http://ixa2.si.ehu.es/garaterm Emandako erabiltzailea eta pasahitza erabiliz, Garaterm lan-ingurunearen karga-interfazean sartuko zara, “login” sakatuz.

    http://ixa2.si.ehu.es/garaterm

  • Pasahitza ahaztu baduzu, berreskuratu dezakezu “Pasahitza ahaztu duzu?” botoia sakatuz. Hala ere, Garaterm lan-ingurunean esleituta duzun helbide elektroniko zehatza behar duzu. Ez badakizu zein den, TSE programaren arduradunen bati eskatu ahal diozu. Eskaria egin ondoren, berehala helduko zaizkizu posta elektronikoz erabiltzailea eta pasahitza. 2. Erabiltzailea eta pasahitza aldatu Erabiltzailea guk sortu dizugunez, gerta liteke zuretzat eroso ez izatea. Erabiltzailea alda dezakezu eta, adibidez, UPV/EHUn erabili ohi dugun LDAParena jarri. Erabiltzailea aldatu nahi izanez gero, honela egin dezakezu: Garatermen barruan zaudela “Kontua” botoian klik egin:

    Behin hor sartuta, erabiltzaile-izena eta zure datu guztiak alda ditzakezu.

    Uneren batean, pasahitza galtzen edo ahazten baduzu, posible duzu berreskuratzea, lan-ingurunearen lehen pantailan dagoen “Pasahitza ahaztu duzu?” botoiaren bidez.

  • Behin lan-ingurunean sartuta, pasahitza alda dezakezu, gogoratzen errazagoa zaizun beste bat sortzeko.

    3. Egile(are)n datuak sartu Testuak igotzen hasi aurretik, obraren EGILEA(k) sartu behar d(ir)a: sakatu “Egileak” botoia.

    Egiaztatu zure datuak ez daudela aldez aurretik sartuta, bilaketarako leihoa erabiliz. Zure datuak lehen aldiz sartu behar badituzu, sakatu “egile berria” botoia.

    Sartu zure datuak zabaltzen zaizun pantailan. Zure datuak bete ondoren, sakatu “Gorde” botoia. Sartuko dituzun fitxategiek egile bat baino gehiago badituzte, sartu egile guztiak prozesua errepikatuz, dokumentuak kargatzen hasi aurretik.

    KONTUZ! Telefonoa sartzen baduzu, ez utzi zuriunerik zenbakien artean.

  • 4. Dokumentuak igo Dokumentu bat igotzeko, sakatu “Obrak” botoia eta, ondoren, sakatu“Obra berria” botoia.

    Arakatu zure dokumentuen karpetan eta aukeratu igo nahi duzun dokumentua. Joan aukeratzen eskaintzen zaizkizun zerrendetatik “Eremua”, “Azpieremua”, “Egilea” e.a. TSE programan parte hartzen duzuenon kasuan, baliorik ohikoenak izango dira: Rola: Egilea; Espezializazioa: “Aditu irakaslea” eta Rol xehea: idazlea.

    Igo nahi duzun dokumentuak egile bat baino gehiago baditu, sakatu “Gehitu egilea” botoia gainerako egilea(k) sartzen joateko. Bete zure dokumentuari dagozkion datuak. Azpimarratuta dauden eremuak ezinbestekoak dira. TSE programaren dokumentuen kasuan, balio hauek izango dira ohikoenak:

    “Generoa: Material didaktikoa” “Itzulpena: Ez” Kontrol linguistikoa: “Espontaneoa”. Bakarrik hautatuko dugu “zuzendua” aukera testuak zuzenketa sistematiko batetik pasatu bada, adibidez, Euskara Errektoreordetzaren sareko argitalpenetan egiten den zuzenketa pairatu badu.

  • Baimenari dagokionez, aukeratu “Baimena: Bai” balioa. • “Baimen mota: Publikatzeko” aukeratzea eskatuko dizugu TSE programan. TSE

    programako partaide guztiek ikusi ahalko dituzte zure adibideak (konkordantziak) kontsulta-interfazean bilaketa bat eginez gero, baina ez dituzte ikusiko obraren egileen izen zehatzak.

    Datu guztiak sartu dituzunean, sakatu “Gorde” botoia.

    Ezinbesteko datu guztiak bete badituzu, eta dokumentua ondo gorde bada, mezu hau aterako zaizu.

  • Igotako dokumentuen zerrenda osoa ikusteko, sakatu “Obrak” botoia, eta igotako dokumentu guztiak ikusiko dituzu. Goialdean, igotako azken dokumentua agertuko zaizu.

    Ezinbesteko daturen bat sartzea ahaztu baduzu, aldiz, beste mezu hau aterako zaizu. Orduan, dokumentua berriro igo beharko duzu,

    eta falta zaizkizun datuak bete edota errorea eman duten balioak zuzendu beharko dituzu.

  • 5. Aldez aurretik igo den dokumentu baten metadatuak beste dokumentu bat igotzeko orduan aprobetxatzeko Sakatu “kudeatu” botoia igo duzun obraren eskuinaldean. Joan abiapuntu modura aprobetxatu nahi duzun dokumentura, eta “Kudeatu” botoia aukeratu.

    Igo dokumentu berria, eta aldatu beharreko datuak. Eta bukaeran sakatu “Berria gorde” botoia.

    “Kudeatu” botoia erabil dezakezu baita igo duzun dokumentu baten metadatuak aldatzeko. Orduan, aldatu nahi dituzun datuak aldatu ondoren, “Eguneratu” botoia sakatu beharko duzu aldaketa gordetzeko.

  • 6. Garaterm corpusean kontsultak egitea (behin testuak prozesatuta) Behin testuak prozesatuta, kontsultagai egongo dira Garaterm corpusaren kontsulta-interfazeetan. Garaterm lan-ingurunetik, zuzenean sar daiteke kontsulta-interfazean.

    Beste aukera bat da helbide honetan sartzea, lan-ingurunetik pasatu gabe: http://garaterm-corpusa.ixa.eus/ Bilaketa-interfaze arruntean, corpus guztietan bezala, “lema” edo “forma” bila dezakegu. “Lema” bilatuz gero (adibidez, ustiapen), lema horrek dituen forma guztiak (ustiapeneko, ustiapen, ustiapenaren…) agertuko zaizkigu bereizita ezkerreko zutabean, baita agerraldi kopurua (1.083), bilaketa-corpusaren tamaina (16.690.857) eta maiztasuna ere. Egile kopurua ere (77) erakusten digu. Eskuinaldean, aldiz, corpusean aurkitutako konkordantziak agertuko zaizkigu.

    http://garaterm-corpusa.ixa.eus/

  • “Lema” bilatu beharrean, “forma” bat bila dezakegu, adibidez, ustiapenaren.

    Kontuz ibili behar gara. Izan ere, ustiapen “forma” modura bilatzen badugu, bakarrik agertuko zaizkigu forma hori zehazki duten agerraldiak.

    Ohartu goiko bilaketetan “Da” aukeratu dugula, eta horrek esan nahi duela bilatzen dugun lema edo forma bere horretan bilatu nahi dugula. Nolanahi ere, posible dugu hasiera jakin bat duten lema guztiak bilatzea ere. Horretarako “Hasi” aukeratu behar dugu bigarren zerrendan. Adibidez, ustia hasiera duten lemak bila ditzakegu. Orduan, hasiera hori duten lemak bilatuko dizkigu corpusean: ustiapen, ustiatu, ustiaketa, ustiategi, ustiakuntza, ustiatze, ustiatzaile, ustiagarri, ustialeku…

  • Posible dugu baita bukaera jakin bat duten lemak bilatzea. Adibidez, pen bukaera duten lemak bilatzeko, “Bukatu” aukeratuko dugu, eta adierazpen, garapen, ebazpen, xedapen, ekoizpen eta abar luzea bilatuko dizkigu.

  • Bilaketa-interfaze arruntean hainbat parametro iragaz ditzakegu, bilaketa-leihoaren azpiko botoiak erabiliz: jakintza-eremua, testuak kontrolatuak (zuzenduak) diren ala zuzendu gabeko testu espontaneoak diren, eta emaitzak nola ordenatu nahi ditugun. Adibidez, “ustiapen” lema bilatzen badugu, baina bakarrik “Ekonomia Zientziak” alorrean eta “testu espontaneoetan”. Bestalde, “konkordantziak urtearen arabera ordenatzeko” eskatu diogu. Ikus emaitzak aldatu zaizkigula: agerraldi kopurua (639), azpicorpusaren tamaina (1.388.345), maiztasuna, eta egile kopurua (28).

    Kontsulta-interfaze aureratuan, bilaketak beste parametro batzuen arabera murrizteko aukera dugu, bai eta hitz bat baino gehiagoko sekuentziak bilatzeko ere:

  • Adibidez, batez besteko bilatu dugu beheko adibidean, corpus osoan, eta emaitzak eremuaren arabera antolatzeko eskatu diogu.

    Hirugarren kontsulta-interfazeak konparazio-bilaketak egiteko aukera ematen digu.

    Adibidez, Garaterm corpusean “estimazio” eta “zenbatespen” lemak zer proportziotan erabili diren ikus dezakegu. Bakoitzaren ehunekoa ez ezik, urteetan zeharreko eta jakintza-alorretan zeharreko banaketa ere eraksuten digu pantaila horretan.

  • Azkenik, kolokazioa bilatzeko kontsulta-interfazea dugu. Adibidez, hormona bigarren lema modura duten “izena+aditza” ereduko konbinazioak bila ditzakegu, eta konbinazio bakoitzaren adibideak ikusi.

  • “Izena+izenondoa” moduko konbinazioak bilatzen baditugu, aldiz, askotarikoak lortuko ditugu: