Unidad 2 Lenguajes (2)

download Unidad 2 Lenguajes (2)

of 14

Transcript of Unidad 2 Lenguajes (2)

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    LENGUAJES DOCUMENTALES

    UNIDAD II:

    Lenguaje de Anlisis y Recuperacin de la informacin

    LARI

    SI TIENES UNA BIBLIOTECA CON JARDN, LO TIENES TODO.

    Cicern.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Introduccin

    En esta segunda unidad se va a profundizar en el Lenguaje de Anlisis y Recuperacin de

    Informacin LARI. Este es un lenguaje controlado artificial destinado a describir o expresar

    los temas o materias centrales de los documentos y sus caractersticas formales, adems,

    describir el contenido de las solicitudes de informacin, que tiene como finalidad, localizar

    posteriormente los documentos necesarios para responder a esa solicitud.

    EL lenguaje de Anlisis y Recuperacin de Informacin (LARI) es de gran importancia para

    el anlisis y bsqueda de informacin ya que es el puente que comunica al usuario con el

    conocimiento que existe y es almacenado en algn lugar, llmese biblioteca o base de

    datos.

    El anlisis es un requisito previo para poner a disposicin de quien necesita la informacin

    que se genera. Este anlisis consiste en desglosar los documentos en sus partes indicando

    los aspectos ms importantes de ellos que merecen tenerse en cuenta y los cuales son de

    valor para su recuperacin posterior.

    Objetivos

    Conocer los presupuestos tericos sobre la utilizacin del Lenguaje de Anlisis y

    Recuperacin de Informacin LARI, orientada hacia la Ciencia de la Informacin y la

    Documentacin, Bibliotecologa y Archivstica.

    Analizar y recuperar informacin a partir de los LARI.

    Contenido de la unidad:

    Conceptualizacin bsica de los LARI. Clasificacin:

    Lenguaje Pre-Coordinado Lenguaje Post-Coordinado

    Evaluacin: Favor tener en cuenta las siguientes observaciones.

    Las actividades de la unidad dos (2) tienen un valor del 25% de la nota final.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Estas consisten en indizar (15%) textos teniendo en cuenta lo visto en la Unidad I y realizar una reflexin (10%) respecto a los LARI, tema que se desarrolla en la Unidad II. Se debe resaltar que son dos (2) notas independientes. En esta unidad se obtendr un 25% de la nota final.

    Tarea 2: la correspondiente a indizar tiene un valor del 15%

    Tarea 3: la reflexin respecto a los LARI que vale el 10% Todas las participaciones deben hacerse dentro de la fecha establecida, o sea entre el

    del 18 de agosto al 1 de septiembre de 2014.

    Cronograma:

    Recursos:

    Plataforma MOODLE, gua de la unidad nmero dos (2), foros, skype, mensajera de plataforma, correo electrnico e internet.

    UNIDAD II FECHA ACTIVIDADES

    LARI

    Del 18 de agosto

    al 1 de septiembre de

    2014

    Lectura de la Unidad dos (2).

    Tarea 2: Indizar, con un valor del 15% Tarea 3: Reflexin referente a los LARI

    10%

    (Calificable. 25 % de la nota final).

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    1.

    Leer muy bien la gua para la unidad II "LARI"

    2. Tarea dos (2): la correspondiente a indizar

    tiene un valor del 15%

    3. Las inquietudes podrn resolverse por medio del foro

    cafeteria o los mensajes personales.

    Tarea 3: la reflexin respecto a los LARI que

    vale el 10%

    Procedimiento para esta unidad:

    Para tener en cuenta:

    Aplicar los conocimientos adquiridos durante ste espacio de tiempo y tenerlos en cuenta en la realizacin de la tarea.

    Hacer las preguntas necesarias a su tutor (Juan Guillermo Caicedo Quintero) en caso de dudas; la idea es realizar un buen trabajo y que ste sea guiado.

    Consultar la bibliografa dada en la gua. Hacer consultas independientes en internet, libros, artculos y dems que apoyen el proceso de aprendizaje.

    Si al dar clic sobre los enlaces que llevan a los contenidos estudiados no se obtiene resultado, es necesario copiar el vnculo y pegarlo directamente del navegador, lo cual permite acceder de inmediato a dicha informacin.

    Enviar la tarea dentro de las fechas establecidas.

    Recuerde que en el foro CAFETERA: usted podr manifestar sus inquietudes, dudas y aportes sobre el curso.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    LA CADENA DOCUMENTAL

    UNIDAD II:

    Lenguaje de Anlisis y Recuperacin de la informacin

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    1. Conceptualizacin bsica de los LARI:

    Los LARI permiten la recuperacin de la informacin, previamente almacenada, por medio

    de la realizacin de una serie de consultas a los documentos contenidos en la base de

    datos. Esta serie de preguntas o interrogaciones se conceptan como sentencias formales

    de expresin de necesidades de informacin, y suelen venir expresadas por medio de un

    lenguaje de interrogacin.

    La funcin del anlisis documental es la de facilitar la recuperacin de la informacin al

    usuario siguiendo unos pasos sencillos en los que se debe determinar:

    Entre las funciones de los LARI estn:

    Transformar los documentos primarios en otros secundarios que permiten la identificacin, localizacin y difusin de los primeros.

    Los documentos secundarios pueden ser consultados ms fcilmente que los primeros.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Eliminar la ambigedad. Facilitar la labor de indizacin. Mejorar la consistencia de la indizacin. Servir de apoyo al proceso de bsqueda. Los fines son los de orientacin cientfica e informativa.

    2. Clasificacin de los LARI:

    Ampliar informacin en: http://eprints.rclis.org/14817/1/lendoc.pdf

    Son sistemas artificiales creados con una doble finalidad: almacenar informacin y para

    recuperarla. En el primer caso se habla tambin de (LBI) Lenguas de Bsqueda Informativa.

    Los lenguajes documentales para recuperar informacin son de dos clases: Lenguajes

    precoordinados y lenguajes postcoordinados.

    Lenguajes Precoordinados: los que realizan la coordinacin antes de la indizacin.

    Lenguajes Postcoordinados: los que realizan la coordinacin de trminos en el momento de

    la bsqueda, es decir despus de la indizacin. Veamos un poco ms detallado cada uno de

    ellos.

    2.1. Lenguajes Precoordinados:

    Se da cuando los trminos se combinan en el momento de la descripcin.

    CLASIFICACIONES JERRQUICAS:

    Se caracterizan porque cada clase o concepto se divide sucesivamente en subclases

    mutuamente excluyentes. Como resultado de esto, ocurre que entre las subdivisiones de esta

    clasificacin existen slo relaciones de jerarqua y coordinacin.1

    1 Ampliar informacin en:

    http://www.bibliociencias.cu/gsdl/collect/eventos/index/assoc/HASH01e6.dir/doc.pdf

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Ejemplo: Recursos Web

    Usabilidad o Bitcoras

    Espaol Ingls

    o Portales Espaol Ingls

    o Listas de Correo Espaol Ingls

    Web Semntica o Bitcoras

    Espaol Ingls

    o Portales Espaol Ingls

    o Listas de Correo Espaol

    Las clasificaciones jerrquicas son predominantemente enumerativas, se hacen al

    desarrollar el vocabulario, es decir, se precoordina antes de la indizacin. Ejemplo:

    Tuberas

    Tuberas Circulares

    Tuberas De Plstico

    Tuberas Metlicas

    Tuberas No Circulares

    Tuberas Para Agua

    Tuberas Para Vapor

    Las clasificaciones jerrquicas se elaboran

    partiendo del principio que establece la

    subdivisin de materias, en materias ms

    especficas, cuanto sea necesario. As se

    elabora una estructura jerrquica de tipo

    ramificada.

    Tener en cuenta:

    Si est conectad@ a Internet puede

    acceder directamente a estos vnculos de

    web encontrados a lo largo de la gua.

    Ubique el cursor sobre la direccin

    subrayada, con la tecla Ctrl + clic, o copie

    y pegue la direccin en su navegador.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Los aspectos fundamentales de las relaciones entre las subdivisiones de la clasificacin son la

    Jerarqua o Subordinacin y la Coordinacin. La Jerarqua es la relacin en que una clase

    es subclase de otra ms amplia.

    Ejemplo por jerarqua:

    Entre las CLASIFICACIONES JERRQUICAS ms conocidas tenemos:

    Ampliar informacin en: http://es.wikipedia.org/wiki/Clasificaci%C3%B3n_Decimal_Universal

    La clasificacin Decimal Universal-CDU:

    La Clasificacin Decimal Universal o CDU propuesta por Melvil Dewey 2 es un sistema de clasificacin del conocimiento que nace de la necesidad de ordenar y catalogar las obras en las bibliotecas. Este sistema se basa en la ordenacin del conocimiento a travs de dgitos. A un grupo principal se le asigna un dgito, del 0 al 9, y a cada nivel que deba ser creado dentro del grupo se le aade un nuevo dgito.

    Un ejemplo de tres niveles es el siguiente:

    3 - Ciencias sociales

    34 - Derecho

    341 - Derecho internacional.

    La clasificacin Decimal Dewey (CDD)

    2 Melvil Dewey: bibliotecario del Amherst College en Massachusetts, Estados Unidos, cre en 1876 el Sistema

    Dewey de clasificacin. Este sistema fue adaptado por Paul Otlet y Henri La Fontaine y publicado por primera

    vez en lengua francesa entre 1904 y 1907 con el nombre de Clasificacin Decimal Universal. Desde entonces

    ha sido continuamente revisado y desarrollado y ha demostrado ser un sistema muy flexible y efectivo para

    clasificar y ordenar fondos bibliogrficos. La ltima edicin es del ao 2004.

    LINGSTICA Vase adems LINGSTICA ESTRUCTURAL LINGSTICA HISTRICA

    NEUROLIGSTICA

    PSICOLINGSTICA...

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Tambin llamada el Sistema de Clasificacin Decimal de Dewey es un sistema de

    clasificacin de bibliotecas desarrollado por Melvil Dewey, bibliotecario del Amherst College

    en Massachusetts, EE. UU., en 1876 desde ese momento ha sido varias veces modificado

    y ampliado en sus 22 ediciones que han ocurrido hasta 2004. Durante este tiempo y desde

    1894 tambin se han desarrollado 14 ediciones abreviadas, basadas en la Edicin mayor

    desarrollada generalmente un ao antes.

    La clasificacin Dewey se basa en un modelo jerrquico decimal que toma los temas ms amplios y los va subdividiendo hasta los ms concretos; l propone diez clases principales y divide a su vez en diez Divisiones y cada una de estas en diez secciones; As, cada nivel inferior estar subordinaciones al nivel superior, algo que se denomina Fuerza Jerrquica.

    800 - Literatura

    880 - Literatura eslava

    882 - Literatura rusa

    As sucesivamente. Como puede observarse, cada nivel es una especialidad del anterior.

    La notacin que emplea est elaborada fundamentalmente en nmeros arbigos, aunque en varias partes del esquema se sugiera el uso de letras del alfabeto para la distincin en algunas temticas, como en el caso de la literatura.

    Las 10 grandes clases que lo conforman son (basadas en la Edicin 21):

    000 - Obras generales. 100 - Filosofa y psicologa. 200 - Religin, teologa. 300 - Ciencias sociales, ciencias polticas. 400 - Lenguaje y Lingstica. 500 - Ciencias puras (Matemticas, ciencias naturales, etc) 600 - Ciencias aplicadas: medicina, tecnologa. 700 - Bellas artes, juegos, deportes. 800 - Literatura. 900 - Geografa, historia.

    La clasificacin de la Biblioteca del Congreso de los Estados Unidos.

    LCC, Library of Congress Classification

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    La mayora de las bibliotecas de los Estados Unidos utilizan el sistema propuesto por la Biblioteca del Congreso de dicho pas. Inicialmente fue propuesta en 1897 por Hebert Putnam y Charles Ammi Cutter para ser usada en la Biblioteca del Congreso y reemplazar as la que haba propuesto Thomas Jefferson

    El sistema de clasificacin es de carcter enumerativo aunque divide algunas materias en categoras amplias. Proporciona una gua de los libros que estn realmente en la biblioteca, no una clasificacin universal.

    La clasificacin que propone este sistema es:

    A Obras generales

    B Filosofa. Psicologa. Religin

    C Ciencias Auxiliares de la Historia

    D Historia, General y Antigua

    E Historia: Estados Unidos

    F Historia Local de los Estados Unidos y de Amrica Inglesa,

    Holandesa, Francesa y Latina

    G Geografa. Antropologa. Recreo

    H Ciencias Sociales

    J Ciencia Poltica

    K Derecho

    L Educacin

    M Msica y Libros sobre Msica

    N Bellas Artes

    P Lengua y Literatura

    Q Ciencia

    R Medicina

    S Agricultura

    T Tecnologa

    U Ciencia Militar

    V Ciencia Naval

    Z Bibliografa. Biblioteconoma. Recursos Informativos (General)

    Las clases I, O, W, X e Y no son de uso estndar.

    LISTAS ALFABTICAS DE MATERIA. Tambin llamadas LEM

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Este tipo de lista presenta los encabezamientos para representar el tema(s) de un documento a partir de un lenguaje documental cuyo vocabulario principal consta de un conjunto de palabras, combinaciones de palabras y frases organizadas en orden alfabtico y designa las materias de alguna rama de la ciencia.

    CLASIFICACIONES FACETADAS:

    Este tipo de clasificacin se usa para organizar conjuntos de objetos que pueden estar en

    un sitio web, productos, documentos, etc., que son lo suficientemente homogneos como

    para ser descritos por sus atributos o propiedades (facetas y categoras) y sus valores

    (pertenencia a categoras), en otras palabras, por un conjunto de metadatos facetados.

    Ejemplo:

    TUBERAS

    Por su forma (faceta)

    TUBERAS CIRCULARES

    TUBERAS NO CIRCULARES

    Por material (faceta)

    TUBERAS DE PLSTICO

    TUBERAS METLICAS

    Por su aplicacin (faceta)

    TUBERAS PARA AGUA

    TUBERAS PARA VAPOR

    2.2. Lenguajes Postcoordinados:

    Permiten yuxtaponer los conceptos en el momento del anlisis, de manera que se puedan

    coordinar despus del almacenamiento. Precisan la utilizacin de ficheros suplementarios,

    llamados inversos, como los uniterms; permite utilizar un gran nmero de vas de acceso al

    documento, teniendo como intermediarios a estos ficheros, que necesitan una bsqueda

    en dos tiempos: identificacin de documentos y su localizacin.

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Los lenguajes Postcoordinados son los sistemas que se construyen a la luz de una

    investigacin seria y un anlisis de la terminologa empleada para la indizacin. Su objetivo

    central est dirigido a obtencin de conceptos y no de materias.

    Segn Van Slype se presentan varios tipos de lenguajes:

    A. LENGUAJES LIBRES entre los que se cuentan:

    Lista de Palabras Claves: son una coleccin de trminos no estructurados ordenados alfabticamente de palabras significativas, extradas de los ttulos o de los resmenes de los textos originales.

    Lista de Descriptores Libres: Son listas no estructuradas pero en las cuales se establecen conceptos destacados mediante un proceso intelectual. Generalmente se presentan por medio de palabras o expresiones.

    B. LENGUAJES CONTROLADOS: entre ellos estn:

    Lenguajes de Autoridades: Es una coleccin de conceptos sin relaciones estructurales que se encargan de representar de forma unvoca el contenido de los documentos y de las preguntas de las bsquedas. Los conceptos son tomados de una lista finita a priori y controlada.

    Tesauros: es una lista estructurada en las cuales se ve la presencia de relaciones sintcticas y semnticas. Representa los contenidos de los documentos y las consultas al sistema. Es el lenguaje ms controlado de todos ya que ofrece un alto grado de precisin y exhaustividad. EJEMPLO:

    TESAURO PARA LA INDIZACIN DE DOCUMENTACIN

    SOBRE PATRIMONIO CULTURAL

    Tesauro HEREIN (Documentacin sobre patrimonio cultural). Multilinge (actualmente

    disponible en 10 lenguas de la Unin Europea): http://www.europeanheritage.net

    Ejemplo de Lenguaje Postcoordinado.

    Objetos:

    Manzanas

    Naranjas

    Peras

    Envasado

    Manzanas

    Naranjas

    Peras

    Distribucin

    Manzanas

    Naranjas

    Peras

    Recoleccin

    Manzanas

    Naranjas

    Peras

  • CIENCIA DE LA INFORMACIN Y LA DOCUMENTACIN,

    BIBLIOTECOLOGA Y ARCHIVSTICA. (CIDBA)

    Procesos: Envasado Distribucin Recoleccin

    Bibliografa

    http://www.bibliociencias.cu/gsdl/collect/eventos/index/assoc/HASH01e6.dir/doc.pdf

    Sobre Clasificaciones Jerrquicas.

    http://www.nosolousabilidad.com/articulos/clas_facetadas1.htm

    Sobre Clasificacin Facetadas.

    http://docupo.pbworks.com/w/page/18009107/lenguajes-precoordinados-y-

    postcoordinados

    Sobre Lenguajes Post-coordinados.

    http://www.inqnable.es/temario/especifico/documentacion/Lenguajes%20documentales%2

    0postcoordinados%20.pdf/view?searchterm=None

    Sobre Lenguajes Post-coordinados.

    MATERIAL COMPLEMENTARIO

    Veamos con mayor profundidad lo propuesto en el documento:

    http://www3.unileon.es/dp/abd/tesauro/pagina/conceptos/tipoleng.html