Repositorio de Informacion
-
Upload
titaa-pena -
Category
Documents
-
view
3 -
download
2
description
Transcript of Repositorio de Informacion
-
Ingeniera59Vol.14 No.1REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
59
59
1 Doctorando en Informtica de
la Universidad Pontificia de
Salamanca, Espaa. Miembro
del Grupo de Investigacin
GICOGE.
2 Consultor en Branding del
Tecnolgico de Monterrey
sede Colombia. Estudiante de
Doctorado en Informtica dela Universidad Pontificia de
Salamanca de Espaa. Miem-
bro del grupo de Investigacin
en Trfico Inteligente y Segu-
ridad Ciudadana.
3 PhD. en Informtica Universi-
dad de Oviedo. Profesor Uni-
versidad Distrital, Facultad de
Ingeniera. Investigador prin-cipal Grupo de Investigacin
GICOGE.
4 PhD. en Informtica de la
Universidad de Oviedo. PhD.en Ciencias Polticas y Socio-
loga de la Universidad
Pontifica de Salamanca. Miem-
bro del grupo GICOGE. Direc-
tor del grupo de investigacin:Ingeniera del Software y So-
ciedad de la Informacin y el
Conocimiento, Universidad
Pontificia de Salamanca.
Artculo recibido en Junio de 2008, aprobadopara publicacin en Agosto de 2008
Lus EduardoCano Olivera 1
Pedro EnriqueEspitia Zambrano 2
Jos NelsonPrez Castillo 3
Luis Joyanes Aguilar 4
ResumenEste artculo presenta los pasos para realizar los
cambios de integracin y migracin de informacinde los repositorios digitales en diversas plataformas
de cdigo abierto (Open Source) con el fin degarantizar la estandarizacin de las solucionesinformticas propias de las Instituciones de
Educacin Superior (IES). Adems de mejorar elacceso a la aplicacin impendiendo que personas noautorizadas a la IES se registren dentro del sistema.
Adicin a este problema, existe el que se viene
presentando dentro de las Tecnologas de laInformacin y las Comunicaciones (TICs), con el augede informacin que es registrada segundo a segundo
a nivel mundial por el fenmeno de la Web 2.0 [9].Informacin que en la mayora de los casos no puedeser reutilizada tanto por centros de investigacin y/o
sector acadmico al no existir adecuadas herramientasinformticas que permitan centralizar la gestin delconocimiento en un determinado sitio y de manera
especializada segn los diferentes Ncleos Bsicosdel Conocimiento (NBC) que existen dentro delsector educativo [5], sin olvidar adems los costos en
las licencias de software que puedan existir.
Pese a que los movimientos del software libre [6][7]y del cdigo abierto [8], los que no se deben
confundir, hayan suministrado algunas herramientasinformticas para la gestin del conocimiento; en lamayora de los casos estas herramientas no se pueden
integrar entre s con otros sistemas de informacinque tenga una IES, debido a la poca documentacinque existe y/o a la especificacin nica dada a un
determinado lenguaje de programacin y/o motorde base de datos y/o plataforma tecnolgica con quefueron desarrollados, entre otros. Obligando a queen una determinada IES tenga que realizar diferentes
implementaciones descentralizadas con informacinredundante en sus sistemas de informacin, sin questas estn sincronizadas con otras soluciones
informticas que tenga la misma institucin.
Palabras clave: Conocimiento, RepositorioDigital, Sistema de Informacin, Software Libre,
Software Cdigo Abierto, Biblioteca Digital, Objetos
de Aprendizaje, Institucin de Educacin Superior.
Integration of Digital Repositories forthe Knowledge Management in theColombian University Ambience
AbstractThis article presents the steps to realize the changes
of integration and migration of information ofdigital repositories in different platforms of OpenSource (Open Source) in order to guarantee thestandardization of any proper informatic solutionsof the Universities of High School (UHS). Inaddition to improving the access to the applicationpreventing persons not authorized to the UHS fromregistering inside the system.
Addition to this problem, it exists the one that hasappearing inside the Information Technologies andthe Communications (ITCs), with the heyday ofinformation that is registered second to second on aglobal scale by the phenomenon of the Web 2.0 [9].Information that in most cases cannot be re-used somuch by research centers and/or academic sector afterthere did not exist suitable informatic tools that allowto centralize the knowledge management in a certainplace and of way specialized according to the differentBasic Nuclei of the Knowledge (BNK) that exist insidethe educational sector [5], without forgetting also thecosts in the licenses of software that could exist.
Although the movements of the free software [6]7] and with the open source [8], which must notmake a mistake, they have provided some informatictools for the knowledge management; in most casesthis tools cannot integrate between themselves withother information systems who has an UHS, due tofew documentation that exists and/or to the onlyspecification started to a certain computer languageand/or engine of database and/or technologicalplatform with which they were developed, betweenothers. Forcing that in a certain UHS has to realizedifferent implementations decentralized withredundant information in his information systems,without these being synchronized with otherinformatic solutions that the same institution has.
Key words: Knowledge, Digital Repository,Information System, Free Software, Open SourceSoftware, Digital Library, Objects of Learning,
University High School.
Integracin de Repositorios Digitalespara la Gestin del Conocimiento en elmbito universitario Colombiano
-
Ingeniera60 Vol.14 No.1 REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
60
60
Figura 1. Generacin de informacinvaliosa de acceso colectivo.
Fuente: adaptada por los autores.
1. INTRODUCCINEn el desarrollo de los programas acadmicos y de
los centros de investigacin que ofrecen lasInstituciones de Educacin Superior (IES), se generanconstantemente muchos datos, resultado de proyectosde investigacin, trabajos, monografas y tesis, entre
otros. Sin olvidar que de toda esta cantidad de datos,se establece que entre un 60% y 70% se convierten eninformacin y que de este rango, slo entre un 5% y
15% se convierte en verdadero conocimiento. Tambinse destaca, que de ese porcentaje de datos, en sumayora desconocido por muchos sectores, conlleva a
que se repitan y/o dupliquen una y otra vez endiferentes proyectos con diferentes nombres losmismos contenidos, presentando estancamiento en
la Gestin del Conocimiento.
Es en este sentido que surge la pregunta, En dndepuede existir un sistema dentro del sector educativode consulta de resultados y/o avances de proyectosya sean fallidos y/o exitosos, para que se tomen comoreferencia para nuevos prototipos y/o proyectos deinvestigacin? La respuesta es objetiva, dentro delsector bibliotecario de una IES, el cual, est encargado
de almacenar y gestionar toda la produccin intelectualque le llegue, con un pequeo inconvenientedetectado y es que sta no queda digitalizada sino en
inconvenientes, independiente de las caractersticas
tcnicas y/o lgicas que tengan dichas soluciones
informticas para el manejo de los Repositorios.
2. DIFERENCIANDO DATOS,INFORMACIN, CONOCIMIENTOY GESTIN DEL CONOCIMIENTO
Es importante puntualizar en los conceptos de:datos, informacin, conocimiento y gestin del conocimiento
y cmo estn relacionados entre s, en vista a que sepresenta confusin entre estos conceptos llevando auna mala interpretacin de los mismos y afectando
en ltima instancia los resultados obtenidos encualquier implementacin que se desarrolle.
2.1. Dato: Se conoce como una representacin
simblica (que puede ser numrica, alfabtica, algortmicaetc.), un atributo o una caracterstica de una entidad,el cual, no tiene un valor semntico (es decir, sentido)
en s mismo y que son generadas por las personas.En informtica, se dice adems, que el dato seencuentra dispuesto de una manera adecuada para
su tratamiento por un determinado computador.[1][3][4][34]. Convirtindose en la base de lainformacin.
2.2. Informacin: Se ha definido como un
conjunto de datos que son procesados de una maneraorganizada y con un determinado sentido semntico,constituyendo un mensaje sobre un ente o entidad.
[1][3][4][34].
2.3. Conocimiento: Surge a partir del anlisis yuso productivo de la misma informacin,definindolo en ltima instancia como el conjunto
organizado de datos e informacin que permitenresolver un determinado problema o tomar unadecisin (es decir, un conocimiento accionable).
[1][3][4][34].
2.4. Gestin del Conocimiento: Se ha definidocomo un proceso tanto cultural como tecnolgico,
que busca captar y transformar el conocimientoindividual para sistematizarlo y convertirlo eninformacin valiosa de acceso colectivo. [1][3][4]Ver Figura 1.
3. IMPORTANCIA DE LA EDUCA-CIN, LAS UNIVERSIDADES YLOS NCLEOS BSICOSDEL CONOCIMIENTO
Otros actores a tener en cuenta en este proceso,son aquellos que determinan las directrices de la
educacin dentro de los programas de formacinprofesional ofrecidos como son las Instituciones de
fsico. Adems, si le agregamosel factor de desplazamiento
geogrfico, se puede deducir quealguien interesado en un tpicodiferente no puede tener acceso a
la informacin de su inters ytendra que empezar desde cerosus estudios sin poder reutilizar
los resultados previos al rea deinters de cualquier investigador.
En razn a ello, ha surgido unasolucin para este tipo de
situaciones proveniente de lasTecnologas de la Informacin ylas Comunicaciones (TICs)
conocidas como Repositorios,algunos de licencia propietaria(Copyright) y otros de software
libre (GPL) o de cdigo abierto(Open Source), los cuales no sedeben confundir entre s, siendo
una alternativa para las IES quequieran incursionan en estecampo de accin, pero que por
sus caractersticas tcnicas, no sonfciles de integrar con otro tipode Sistemas de Informacin (SI).
En ste escrito se explicametdicamente, cmo puedenlas IES enfrentar estos
-
Ingeniera61Vol.14 No.1REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
61
61 Figura 2 .Estadsticas en Colombia sobre Repositoriospor el tipo de Contenido. Tomado de OpenDoar [35].
Educacin Superior (IES), y que se fundamentan en
las diferentes categoras existentes de los NcleosBsicos del Conocimiento (NBC) [5] suministradospor el Ministerio de Educacin Nacional (MEN)[5],
para analizar el proceso de formacin de la educacinnacional en Colombia.
Los Ncleos Bsicos del Conocimiento(NBC), consisten en la afinidad que tengan en loscontenidos programticos y los campos especficosdel conocimiento existentes. En total existen 55 NBC,
entre los que se destacan: Economa-Administracin-Contadura y afines, la Ingeniera-Urbanismo y afines,las Ciencias Sociales y Humanas, la Agronoma-
Veterinaria y afines y la Matemticas y CienciasNaturales, segn las estadsticas suministradas por elmismo MEN. [5]
Esta categorizacin de los NBC, ha facilitado el
aprendizaje y fortalecimiento de grupos deinvestigacin, semilleros de investigacin,comunidades especializadas multidisciplinarias y del
sector educativo en general. Pero para que se puedarealizar una congruente Gestin del Conocimiento,se necesita la implementacin de tecnologas basadas
en repositorios digitales, las cuales estn siendoimplementadas en Colombia a travs de unaherramienta de cdigo abierto para repositorios como
lo es DSPACE [21] con un 92% de aceptacin, pese aque existen otras en el mercado.
Necesidades que en Colombia han sido analizadasy adoptadas por las siguientes IES: Corporacin
Universitaria Lasallista [36], Corporacin UniversitariaMinuto de Dios. [37], E-medicina fetal [38], InstitutoInteramericano de Cooperacin para la Agricultura
IICA oficina en Colombia.[39], UniversidadAutnoma de Occidente [40], Universidad deAntioquia (UdeA) [41], Universidad de la Salle [42],
Universidad de los Andes [43], Universidad delRosario [44], Universidad ICESI [45], UniversidadNacional de Colombia [46] y Universidad Nacional
Abierta y a Distancia de Colombia (UNAD)[47]. Verfiguras 2 y 3.
Y le sigue en segundo lugar, SciELO [52], un
modelo para la publicacin electrnica cooperativade revistas cientficas en Internet con un 8%, adoptadaen la actualidad por la Universidad Nacional de
Colombia [46]. (Ver Figura 4).
Figura 3. Estadsticas en Colombia sobre elcrecimiento de base de datos sobre Repositorios
del 2006 al 2009. Tomado de OpenDoar [35]
Figura 4. Estadsticas sobre el software pararepositorio ms utilizado en Colombia.
Tomado de OpenDoar [35].
4. SISTEMAS DE INFORMACIN(SI) Y REPOSITORIOS
4.1. Sistema de Informacin
Cuando se habla de un Sistema deInformacin(SI) se nos viene a la mente, elconjunto de elementos que estn orientados al
tratamiento y la administracin de los datos y lainformacin, los cuales, ayudan en la generacin denuevo conocimiento, de acuerdo a su propsito.
Debido al crecimiento en datos e informacinprocesados por los sistemas de informacin para quepuedan ser consultados de manera centralizada, ha
surgido el concepto de repositorios.
4.2. Repositorio
Un repositorio, depsito o archivo se hadefinido como un sitio centralizado donde sealmacena y mantiene la informacin digital,habitualmente en bases de datos o archivos
informticos. En el latn original, la palabrarepositorium significa armario o alacena. El ingls laasume como repository y el castellano como repositorio.
El trmino se usa actualmente para definir los archivosabiertos, de mbito institucional y de acceso pblico,que almacenan trabajos en soporte digital. [57].
El Diccionario de la lengua espaola de la Real Academia
Espaola de 2001, incluye la palabra repositorio como:lugar donde se guarda una cosa. La ltima edicin
-
Ingeniera62 Vol.14 No.1 REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
62
62
del Diccionario Collins universal de 2005 la traduce
como: depsito.[58]. En vista de este significadoel imaginario colectivo suele hacerse a la idea mentalde un depsito como un almacn o armario donde
se puede guardar algo. La palabra repositorio en estecontexto connota a algo archivado, escondido,inmovilizado; recuerda algo antiguo y pasado de
moda. [57]. Todo ello inconsciente, que podraagregarse a los doce factores que apunta Alice Keefer(2007) que explican la resistencia de muchos autores
a incluir sus producciones intelectuales en losrepositorios. [59].
Estas apreciaciones quedan lejos del dinamismo que
la palabra le exige al significado moderno, que hacereferencia a un espacio institucional, dinmico, dondese puede incluir un documento con la certeza de que
quedar a disposicin de un abanico amplio deusuarios. Es as que los depsitos estn preparadospara distribuirse habitualmente sirvindose de una
red informtica como Internet o en un medio fsicode informacin digital. Y pueden ser de acceso pblico,o pueden estar protegidos y necesitar de una
autentificacin previa. Los depsitos ms conocidosson los de carcter acadmico e institucional.
A diferencia de los computadores personales (PCs),los depsitos suelen contar con sistemas de Backup
y mantenimiento preventivo y correctivo, lo que haceque la informacin se pueda recuperar en el caso deque una mquina o PC quede inutilizable. Los
depsitos se utilizan de forma intensiva en el sistemaoperativo GNU-Linux, almacenando, en su mayorapaquetes de software disponibles para su instalacin
mediante un gestor de paquetes.
4.3. Clasificacin de Repositorios:
Dentro de los repositorios han surgido los
siguientes, de acuerdo al enfoque al que estn
dirigidos:
4.3.1. Repositorio Digital (RD):
Un sistema en red formado por hardware,software, data y procedimientos que:
Contiene objetos digitales (OD). Contiene metadatos. Asegura la identificacin persistente del objeto
mediante un identificador nico persistente. Ofrece funciones de gestin, archivo y preserva-
cin de los objetos.
Proporciona un acceso fcil, controlado y estan-darizado a los objetos.
Ofrece los sistemas adecuados de seguridad para
los objetos y los metadatos. Sostenible en el tiempo.
Figura 5. Representacin de un ROA
4.3.3. Repositorio Temtico (RT)
El RT rene sus contenidos en funcin de su reatemtica, no por su origen institucional (ej.Arxiv) en
torno a una disciplina cientfica o disciplinas relacionadas.
4.3.4. Repositorio Institucional (RI):
Es aquel creado, mantenido y autorizado por unaInstitucin (no exclusivamente una Universidad) o ungrupo de Instituciones, que recoge los contenidos
digitales generados por la actividad de los miembros deesa Institucin. [49]. La organizacin SPARC [50]define los Repositorios Institucionales como sigue:
Pertenecen a una institucin Son de mbito acadmico. Son acumulativos y perpetuos. Son abiertos e interactivos.
Clifford Lynch, refirindose al mbito universitariodefine el repositorio institucional como un conjunto
de servicios que una Institucin ofrece a sucomunidad para la gestin, y difusin de loscontenidos digitales generados por los miembros de
esa comunidad. Es, en su nivel ms bsico, uncompromiso organizativo para el control de esosmateriales digitales, incluyendo su preservacin, su
organizacin, acceso y distribucin [48]. El tipo decontenido que puede manejar el RI es: Documentos textuales: libros, tesis, pre-prints,
artculos de libros, ponencias, documentos detrabajo, informes tcnicos, revistas, entre otros.
Objetos de aprendizaje (OA)
Software Imgenes, estticas y en movimiento
El contenido del RD permite que se conserve:
Patrimonio cultural de las organizaciones Repositorios acadmicos Documentos de organizaciones gubernamentales
Literatura gris Documentos, folletos, boletines, presentaciones,
conferencias y otros tipos de materiales.
4.3.2. Repositorio de Objetos de Aprendizaje (ROA)
Son un catlogo electrnico/digital que facilita lasbsquedas en Internet de objetos digitales para elaprendizaje. [13]. Se caracteriza porque tienen:
Bsqueda Recuperacin/Descarga Almacenamiento
Publicacin Colectacin
-
Ingeniera63Vol.14 No.1REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
63
63
Aplicaciones Multimedia
Simulaciones Pginas web Blogs
Posters, presentaciones , diapositivas, entre otros.
4.3.5. Repositorio Acadmico (RA)
Rene nicamente los documentos resultantesde la actividad acadmica de los miembros de una
IES, en concreto los proyectos fin de carrera, grado,
monografas, mster o doctorado.
4.4. Software para Repositorios Digitales
De acuerdo al tipo de licenciamiento, se handesarrollado aplicaciones para Repositorios,destacndose las siguientes:
1. Con licenciamiento comercial (Copyright):
Existen: CONTENTdm [14] Digital Commons [15] DigiTool [16] EQUELLA [17] intraLibrary [18] Open Repository [19] VITAL [20]
Aunque tengan buenas caractersticas, entre lasdesventajas presentan estn el costo por
licenciamiento. Adems, de que el cdigo fuente escerrado y con restricciones, por lo tanto no se puedenintegrar con otros sistemas de informacin.
Dependen de un solo proveedor en el aplicativo, y sise quiere integrar con otras soluciones informticas,las IES deben pagar por dicha implementacin.
2. Con licenciamiento Freeware:
Existe:
Zentity de Microsoft[29]
Aunque este tipo de software sea gratis, es decir,no se pague por el licenciamiento y su uso seailimitado, la desventaja es que el cdigo es cerrado
siendo difcil de integrar con otras solucionesinformticas. Adems que dependen de una solaplataforma tecnolgica como lo puede ser el Sistema
Operativo Windows sin ser multiplataforma.
3. Con licenciamiento Cdigo Abierto (OpenSource):
Existen: DSpace [21] E-Prints [22] Fedora Commons [23] Greenstone[24] CDSware [25] Connexions [26] PlanetDR [27] DOOR [28]
Se caracterizan porque el software est orientado alos beneficios prcticos de compartir el cdigo, dando
a los usuarios la libertad de mejorarlos [8], adems
que no contempla restricciones sobre su uso omodificacin y que no se deben confundir con elsoftware de licenciamiento libre. [6][7]. Este ltimo
grupo de licenciamiento, es el que corresponde al
enfoque del presente escrito.
5. COMPARACIN ENTRE LOS
PROGRAMAS PARA ROAS
DE CDIGO ABIERTO
El sitio Repositories Support Project (RSP) [10]realiz una encuesta sobre los once (11) repositorios
ms utilizados a nivel mundial en Marzo del 2009[30]. Analizando las caractersticas fundamentales decada software incluyendo aspectos como: los tipos
de tems que soporta, interface de usuario, validacinde usuarios, plataformas de software,interoperabilidad, funciones de administrador, ayuda,
documentacin y servicios. [30]
Figura 6 Comparacin de diferentes herramientas pararepositorios. Fuente RSP [10]
De ese estudio hemos tomando como referencianicamente los programas de Open Source: DSpace,
Eprints, Fedora Commons y PlanetDR,constituyndolos en el objeto de estudio del presentedocumento. De estas herramientas nos
concentraremos nicamente en aquellas caractersticasque son vitales para la integracin de los repositorioscon los sistemas de informacin que tiene algn
tipo de incidencia al respecto:
5.1. Validacin del Usuario:
a) El registro es necesario en estas aplicaciones, es-tando implementado de manera estndar a excep-cin de Fedora Commons que no lo contempla.
En DSpace, el usuario es el correo electrnico, y nopermite a mltiples usuarios usar la misma direc-
cin de correo electrnico. Siendo una desventajaporque un usuario se puede registrar varias vecescon cuentas de correo diferentes. El sistema provee
una caracterstica de recordatorio de contrasea.
En cambio, con las aplicaciones de los Eprints,Fedora Commons y PlanetDR, el sistema requiere
un usuario y contrasea para registrarse, adems una
-
Ingeniera64 Vol.14 No.1 REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
64
64
Figura 8. Comparacin de Gestoresde Bases de Datos. Fuente Forrester [56]
direccin de correo electrnico para utilizarla en caso
de que su contrasea sea olvidada. Varios usuariospueden usar la misma direccin de correo electrni-co, siendo un inconveniente porque no se puede
garantizar el acceso de un usuario nico con unasola cuenta de correo nica, con el agravante de su-plantacin de identidad.
b) Contemplacin de la utilizacin LDAP(Lightweight Directory Access Protocol, Proto-colo Ligero de Acceso a Directorios), que con-siste en almacenar la informacin de autenticacin(usuario y contrasea) para autenticarse aunque seaposible almacenar otro tipo de informacin (datos
de contacto del usuario, ubicacin de diversos recursos de
la red, permisos, certificados, etc). La aplicacin que loutiliza de manera estndar es Eprints siendo op-
cional en las otras.
c) Utilizacin de la autenticacin Atheans (Ate-nas): Contempla un mecanismo de autenticacinpara conceder el acceso a la informacin en lnea de
los servicios electrnicos (recursos digitales) adquiri-dos por una IES.
d) Utilizacin de la autenticacin Shiboleth: Esempleada para resolver las necesidades de cada or-
ganizacin para el intercambio de informacin so-bre sus usuarios de manera segura. A travs de laarquitectura Shibboleth, cada aplicacin solicita la
autentificacin de los usuarios y los autoriza parausar funciones especficas o hacer bsquedas queutilicen recursos especficos para quienes estn au-
torizados. Esta herramienta viene incluida para serhabilitada de manera opcional en las aplicacionesde estudio.
e) No contienen mdulos para facilitar la admi-nistracin de usuarios y contraseas de mane-ra automtica o para importarlos de otros Sis-temas de Informacin: Pese a que estos sistemasinformticos de repositorios digitales tienen bue-nas estructuras en seguridad manejando
algoritmos de encriptacin de contraseas comoMD5, no cuentan con un mecanismo que permitamigrar y/o importar los usuarios y contraseas
que maneja un aplicacin propia de la IES, y regis-trarlos dentro de las mismas aplicaciones de repo-sitorios, obligando a cada persona que se tenga
que registrar en dicho sistema, las veces que quierao sea necesario de acuerdo al nmero de comuni-
dades a las que desee acceder.
5.2. Plataforma Tecnolgica
a) Sistema Operativo: Estas soluciones funcionande manera monoplataforma o multiplataforma. Siendo
recomendable el uso de aquellas que seanmultiplataforma, con el fin de ahorrar costos a las IES
que estn trabajando en una plataforma con un sistema
operativo especfico y que no tengan inconvenientes demigracin. La mayora de sistemas informticos pararepositorios se orientan al Sistema Operativo Windows.
Pero se recomienda que por lo menos el software seacompatible adems con las plataformas Mac, GNU-Linux, y Unix y sus derivados. Ver Figura 7.
Figura 7. Comparacin de SistemasOperativos ms utilizados. Fuente Marketshare [55]
b) Bases de Datos (BD): Estas herramientas estnadecuadas para un tipo de base de datos especfico.
En el momento de la instalacin tienen una seriede scripts de creacin de base de datos de acuerdoal motor de BD que soporte. Por ejemplo, MySQL,
no es soportada por DSPACE [21], a diferencia deEPrints[22], FedoraCommons[23] y PlanetDR[27]que si la contemplan. En el caso de Oracle, es sola-
mente contemplado por DSPACE[21] y EPrints[22].O el caso de PostgreSQL que la contempla soloDSpace[21] y FedoraCommons[23]. Recordando por
ltimo, que estas no son las nicas bases de datosque existen. Ver Figura 8.
En este aspecto, es en donde se presenta la limitante
para integrarlo con los gestores de base de datosutilizados por las IES, de acuerdo a los procesosacadmicos y administrativos que manejen.
c) Lenguajes de Programacin: Cada sistema deinformacin se encuentra desarrollado en un len-guaje de programacin especfico, de acuerdo a las
necesidades suministradas por la entidad. Las IEScuentan con soluciones informticas propias desa-rrolladas por algn lenguaje llmese: php, jsp, asp,
vbs u otro, y deben someterse al tipo de lenguajeen el que haya sido desarrollada la herramienta desoftware cdigo libre. Ver tabla I.
92%
Total Market Share
-
Ingeniera65Vol.14 No.1REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
65
65
e)Documentacin Tcnica: Todas las herramien-tas informticas cuentan con una documentacintcnica bsica y/o estndar. Pero ninguna profun-diza con detenimiento sobre la solucin y se con-
centran en aspectos como instalacin, configura-cin y administracin de la solucin. Adems queno suministran el modelo Entidad-Relacin.
f) Soporte Tcnico: todas las solucionesinformticas analizadas, tienen foro, wiki, o listade correos, y aclaran nicamente procesos de tipo
genrico, ms no puntual cuando se requiere inte-grar alguna solucin o mejora al respecto. Dejandoesta actividad al programador para que estudie el
cdigo y realice las modificaciones necesarias, y en-seguida las publique, basndose en la filosofa delcdigo abierto (Open Source) [8].
6. INTEGRACIN DE LAS APLICA-
CIONES PARA RDs CON LOS SIs
INSTITUCIONALES DE LAS IES
Cuando se encuentran los inconvenientes antes
mencionados, las IES pierden el control de lasolucin informtica y no pueden realizar procesosde tipo administrativo como autorizar solo a aquellos
usuarios (administrativos, docentes, investigadores,estudiantes, egresados) que formen parte de dichaentidad, porque el sistema permite el registro de
cualquier persona ajena a la IES, o que se encuentredesvinculada de la misma. Adems, que permite laduplicidad en la informacin sin tener un control en
los datos bsicos del usuario.
La metodologa que se explica a continuacin, sonel resultado del estudio, dedicacin e investigacin enlos conceptos de repositorios, licenciamiento, dominio
sobre las herramientas especializadas en repositorioexistentes en cdigo abierto, programacin eimplementacin que se realiz en una IES que necesit
dicha integracin; las cuales no se encuentransoportadas en ninguna de las pginas oficiales derepositorios a nivel general, ni en los mismos soportes
y/o documentos tcnicos suministrados por losautores de esas herramientas, con el fin de que cualquierIES los tome como referencia para implementarlos
dentro de su organizacin.
6.1. Pasos para integrar una aplicacin de Re-
positorio con un SI propio de una IES
Como resultado de esta investigacin se presentana continuacin los pasos para estandarizarrepositorios multiplataforma y as poder integrar una
aplicacin que utilice una IES en las reas de Registroy Control, o Procesos Acadmicos de los Programas.Ver Figura 9.
Tabla I. Estadsticas de los lenguajes de programacin.Fuente: Tiobe [11]
Por ejemplo, DSpace[21], PlanetDR[27] y
FedoraCommons[23], basados en tecnologa Java,estn desarrollados en JSP. Eprints[22], est desa-rrollado en Perl, utilizando tecnologa Ajax y
Javascript.
El inconveniente se presenta, cuando el instaladory/o administrador y/o programador de la solu-
cin informtica no conoce o no domina el len-guaje de programacin con el cual fue desarrolladadicha aplicacin, empleando una frase de cajn eso
no se puede hacer o desarrollar o implementar., ocasio-nando que la IES se quede sin adecuarlo a suspropios requerimientos.
d)Servidores Web: Estos sistemas de informacinestn orientados a la Web y dependen del lenguajede programacin con el que fueron desarrollados,destacndose Internet Information Server (IIS),
Apache, Tomcat y Jboss, entre otros.
El inconveniente se presenta nicamente paraaquellas herramientas que funcionan con tecnologaJSP y Java, y que dependen de la compilacin del
servidor Apache Ant, como es el caso deDSpace[21], cuando se realiza algn cambio en elcdigo fuente de la aplicacin, presentando algunos
problemas de tipo tcnico al respecto.
e)Formato de los Metadatos: Todos contemplanlos formatos Dublin Core y Qualified DC. A
excepcin de FedoraCommons[23], que incluyeadems de los anteriores, los formatos METS,MARC y puede esperar cualquier otro formato. El
inconveniente se presenta en la integracin con eluso de metadatos nuevos no soportados.
-
Ingeniera66 Vol.14 No.1 REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
66
66
Figura 11. Ejemplo DSpace[21].Un usuario se puede registrar con diferentes correos.
Figura 12. Ejemplo DSpace[21], registro usuariosnuevos. Esta opcin no se debe permitir.
Figura 9. Metodologa para integrar unRepositorio Digital con un Sistema de
Informacin. Fuente: los autores
1. Contratar un Experto:
Es necesario contratar losservicios de undesarrollador y/o progra-
mador informtico exper-to, que tenga conocimien-to y/o dominio tanto de
las aplicaciones desarrolla-das por la IES como de lasolucin de repositorio a
implementar.
2. Dominio conceptos de
RD: El desarrollador y/oprogramador debe tenerclaro los conceptos de Re-
positorios y Metadatos.
3. Dominio herramienta
de RD: Se debe instalar laaplicacin del repositoriodigital y conocer todo el
funcionamiento de la mis-ma. Dicha documentacinse encuentra en la pgina
del autor de la herramien-ta. Si tiene dudas puederecurrir al foro del autor.
4. Modificar scripts Crea-
cin Base de Datos: To-
das las aplicaciones estudia-das cuentan con unosscripts para la creacin de las
tablas que necesita el siste-ma de repositorio digital.
Si se quiere montar en unmotor de base de datos es-pecfico que la IES utilice y
que no est soportado por
cuales siempre se encuentran en la pgina oficial
del respectivo motor de base de datos.
6. Desarrollar Interfaz de integracin RD con
SI: Para poder automatizar la lista de usuarios consus respectivas contraseas, as como las cuentasde correo electrnico que tenga la IES, en cualquie-
ra de sus respectivos sistemas de informacin, esnecesario realizar un programa (o interfaz) en ellenguaje de programacin original en el que este
desarrollada la aplicacin de la IES que contenga lainformacin que se va a migrar, sin olvidar el usode la instruccin MD5 para encriptar las claves.
Por ejemplo DSpace, est desarrollado en Java, yla aplicacin de la IES est en PHP. El
desarrollador puede utilizar las instruccionespg_connect y sus derivados, para conectarse des-de la aplicacin de la IES a la tabla e-person de la
base de datos PostgreSQL de DSpace y alimentarla informacin en la tabla de usuarios y contrase-as. Ver figura 10.
7. Interfaz permita validar usuarios existentes:
La interfaz a desarrollar debe validar que no se
duplique la cuenta de correo y que slo se utiliceuna vez. Ver Figura 11.
Figura 10. Tabla de usuariosde DSpace[21]
dicha aplicacin de repositorio, se debe buscar un
archivo con extensin .sql en donde figure la sen-tencia Create Database y Create Table, y modificar-lo de acuerdo al motor deseado. Estos scripts ma-
nejan la creacin de campos consecutivos o
autonumricos que se definen de ma-
nera diferente segn el estndar ANSIde SQL que contempla cada gestor debase de datos. Para adecuarlo a un mo-
tor de base de datos como MicrosoftSQL Server, se debe utilizar el lenguajeTransact-SQL, y modificarlo en su tota-
lidad, debido a que su estructura escompletamente diferente.
5. Instalar Drivers del Gestor de BD:
Se deben buscar los drivers del gestorde base de datos a adecuar en elaplicativo del repositorio digital, los
8. Comentariar Creacin de Usuarios en el RD:
En vista a que el cdigo fuente de la aplicacin delrepositorio se puede modificar, se debe inhabili-tar las opciones de registro nuevo de usuarios,
colocndole comentarios. Ver Figura 12.
9. Recompilar RD: En el caso de DSpace, se debecompilar los cambios realizados con Apache Ant yApache Maven. Con las otras soluciones informticas
no es necesario este paso. Ver Figura 13.
10. Estudio Metadatos e Inclusin: Para poder
incorporar nuevos estndares de metadatos den-tro de la aplicacin del repositorio no reflejados,se debe estudiar dichos formatos y adicionar las
-
Ingeniera67Vol.14 No.1REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
67
67
respectivas lneas de cdigo en los archivos del
cdigo fuente de la aplicacin. Ver Figura No 14.
Aunque DSpace sea la aplicacin de ms alta difusin
en repositorios digitales incluso hasta por la mismacomunidad, las otras soluciones de cdigo abiertotambin son funcionales y se pueden adecuar, mejorar
y personalizar de acuerdo a las necesidades de una IES.
Las herramientas repositorios digitales de cdigoabierto no tienen nada que envidiarle a las de licencia
propietaria, ofreciendo mejores componentes para laimplementacin de repositorios digitales de acuerdoa las necesidades que tenga la IES. Adems que
contribuyen de manera significativa en la Gestin delConocimiento.
En cuanto a la produccin intelectual, existendiferencias en cuanto a dejarlas en copyright (propias
para la IES) o en Creative Commons (conocimientocompartido), anlisis que slo le compete a la IES.
Las IES que no adopten este modelo, van a quedarobsoletas dentro de sus procesos administrativos y
acadmicos frente a la comunidad acadmica; adems,que el MEN est exigiendo produccin intelectual alas IES y sta es una de las formas de realizarlo por
medio del uso de los repositorios digitales.
REFERENCIAS BIBLIOGRFICAS[1] Gestin del Conocimiento http://www.gestiondelconocimiento.com
[2] PRESSMAN, Roger S. INGENIERIA DE SOFTWARE. Un enfoquepractico. Sexta Edicion.2005. Editorial Mc Graw Hill
[3] MICROSOFT. Encarta 2009.
[4] WIKIPEDIA. http://www.wikipedia.org
[5] Ministerio de Educacin Nacional www.mineducacion.gov.co
[6] STALLMAN,Richard. GNU Operating System http://www.gnu.org/philosophy/free-sw.es.html
[7] STALLMAN,Richard. Free Software Foundation (FSF) http://www.fsf.org
[8] RAYMOND,Eric, Open Source http://www.opensource.org
[9] World Wide Web Consortium (W3C) http://w3c.org
[10] Repositories Support Project http://www.rsp.ac.uk . Estadsticasde Repositorios http://www.rsp.ac.uk/software/surveyresults
[11] Tiobe. Estadsticas sobre lenguajes de programacin http://www.tiobe.com
[12] Colombia Aprende. http://www.colombiaaprende.edu.co
[13] Lpez, C. (2005) Los Repositorios de Objetos de Aprendizaje comosoporte a un entorno e-learning, Tesina doctoral, Universidad deSalamanca. (Director Francisco Jos Garca Pealvo). Disponibleen: http://www.biblioweb.dgsca.unam.mx/libros/repositorios/
[14] CONTENTdm http://www.oclc.org/contentdm
[15] DigitalCommons http://www.bepress.com/
[16] DigiTool http://www.exlibrisgroup.com/category/DigiToolOverview
[17] EQUELLAhttp://www.equella.com
[18] IntraLibrary http://www.intralibrary.com/
[19] Open Repository http://www.openrepository.com/
[20] VITAL http://www.vtls.com/products/vital
[21] DSpace, http://www.dspace.org/
[22] Eprints Repository. http://www.eprints.org/
[23] Fedora Commons- http://www.fedora-commons.org/
[24] Greenstone. http://www.greenstone.org/
Figura 13. Ejemplo DSpace[21], utilizacin apache ant.
Figura 14. Ejemplo DSpace, utilizacin metadatos.
11. Servidor Web debe ser multiplataforma: Es-tas aplicaciones estn desarrolladas para ejecutar-se en un servidor Web multiplataforma. A ex-
cepcin del Internet Information Server deMicrosoft, en donde lo nico que se puede con-figurar son las extensiones de PHP, pero para JSPno se podran integrar porque requiere de la m-
quina virtual de Java.
12. Cambiar iconografa y diseo del RD: En
cuanto al diseo y la iconografa con que vienenestas herramientas informticas, stas se puedencambiar y personalizar segn los diseos y los
colores corporativos que utilice la IES, formatoque viene en jpg y png, y se encuentran ubicadasen una carpeta predeterminada de imgenes.
13. Cambiar Hojas de Estilo (CSS): De igual for-ma, se pueden cambiar las hojas de estilo en cas-
cada (Cascade Style Sheet) que vienen con exten-sin .css, cambiando los formatos de los fon-dos, los tipos de letras, colores, enlaces y dems
cambios que considere indispensable la IES apli-car de acuerdo a su imagen corporativa.
Realizando los pasos mencionados se puedeintegrar cualquier solucin propia que tenga la IEScon las aplicaciones de repositorios digitales.
CONCLUSIONES
Los pasos para realizar los cambios de integraciny migracin de informacin, garantizan que cualquier
solucin informtica propia de la IES se integre conlas aplicaciones para repositorios digitales. Ademsque se puede mejorar el acceso a la aplicacin
impidiendo que personas no autorizadas a la IES seregistren dentro del sistema.
Para realizar cualquier cambio y/o ajuste, se
requieren conocimientos avanzados de programaciny de conceptualizacin en repositorios y metadatos.
-
Ingeniera68 Vol.14 No.1 REVISTA CIENTFICA Y TECNOLGICA DE LA FACULTAD DE INGENIERA, UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
68
68
[52] SciELO- Scientific Electronic Library Online). http://www.scielo.org
[53] Lpez, C. (2005) Los Repositorios de Objetos de Aprendizajecomo soporte a un entorno e-learning, Tesina doctoral, Univer-sidad de Salamanca. (Director Francisco Jos Garca Pealvo)http://www.biblioweb.dgsca.unam.mx/libros/repositorios/
[54] OAI. The Open Archives Initiative Protocol for MetadataHarvesting. http://www.openarchives.org/OAI/openarchivesprotocol.html
[55] Marketshare. Comparacin en Sistemas Operativos. http://marketshare.hitslink.com/
[56] Forrester. www.forrester.com. Comparacin de Gestores deBases de Datos. http://www.microsoft.com/presspass/itanalyst/docs/06-30 09 Enterprise Database Management Systems.PDF
[57] FRANGANILLO, JORGE. Depsitos: un factor psicolgico de des-confianza. Textos universitaris de biblioteconomia idocumentaci. nmero 20, juny de 2008. Facultat deBiblioteconomia i Documentaci. Universitat de Barcelona, Es-paa. http://www.ub.es/bid/pdf/20frang2.pdf
[58] Diccionario Collins universal: espaol-ingls, ingls-espaol(2005). Barcelona: Grijalbo.
[59] Keefer, Alice (2007). Los repositorios digitales universitarios ylos autores. Anales de documentacin, nm. 10, p. 205214.http://www.um.es/fccd/anales/ad10/ad1011.pdf.
Lus Eduardo Cano OliveraIngeniero de Sistemas de la Universidad Autnoma de Colombia.Especialista en Diseo y Construccin de Soluciones Telemticas de
la Universidad Autnoma de Colombia. Candidato a Magster en
Ciencias de la Informacin y las Comunicaciones con nfasis en Sis-
temas de Informacin, de la Universidad Distrital Francisco Jos deCaldas. Doctorando en Informtica de la Universidad Pontificia de
Salamanca de Espaa. Docente Universitario. Miembro del Grupo de
Investigacin GICOGE de la Universidad Distrital Francisco Jos de
Caldas y de la lnea de trabajo en Geosensores del mismo grupo deinvestigacin. http://gicoge.udistrital.edu.co/geosensores.
Pedro Enrique Espitia ZambranoDiseador Grfico, Universidad Jorge Tadeo Lozano. Especialista
en Comunicacin de Cultura Cientfica del CAEU. Editor Senior de
Publicaciones Cientficas Gaia. Presidente de la Fundacin FASARTE,
y director del Museo de Arte Vial. Asesor de Greennmax e-tecnology.Consultor en Branding del Tecnolgico de Monterrey sede Colom-
bia. Doctorando en Informtica de la Universidad Pontificia de
Salamanca de Espaa. Miembro del grupo de Investigacin en Tr-
fico Inteligente y Seguridad Ciudadana de la Universidad DistritalFrancisco Jos de Caldas. [email protected]
Jos Nelson Prez CastilloPhD. en Informtica Universidad de Oviedo. Profesor Facultad deIngeniera de la Universidad Distrital Francisco Jos de Caldas.
Magster en Teleinformtica Universidad Distrital Francisco Jos de
Caldas. Especialista en Sistemas de Informacin Geogrfica y
Teledeteccin Espacial Universidad de Henares. Investigador Princi-pal Grupo GICOGE. [email protected]
Luis Joyanes AguilarPhD. en Informtica de la Universidad de Oviedo. Doctor en CienciasPolticas y Sociologa de la Universidad Pontifica de Salamanca
campus de Madrid. Licenciado en Ciencias Fsicas de la Universidad
Complutense de Madrid. Licenciado en Enseanza Superior Militar
de la Academia Militar de Zaragoza. Profesor Titular Agregado deCtedra de Lenguajes y Sistemas Informticos de la Facultad de In-
formtica de la Universidad Pontificia de Salamanca campus Madrid,
donde tambin se desempe como: Decano de la Facultad de Infor-
mtica, Director de Doctorado, Director de Masters y Director delDepartamento de Lenguajes, Sistemas Informticos e Ingeniera de
Software. Miembro del grupo GICOGE. Autor de ms de 40 libros de
Informtica y numerosos artculos en revistas y congresos internacio-
nales.
[25] CERN Document Server Software (CDSware) http://cdsware.cern.ch/
[26] Connexions http://cnx.org/
[27] PlanetDR http://planet.urv.es/planetdr/
[28] DOOR (Digital Open Object Repository) http://door.sourceforge.net/
[29] Zentity http://research.microsoft.com/en-us/projects/zentity/
[30] RSP. Estudio Comparacin entre Respositorios. Marzo 2009.http://www.rsp.ac.uk/software/surveyresults
[31] OMPI (ORGANIZACIN MUNDIAL DE LA PROPIEDAD INTELEC-TUAL)-Sistemas automatizados de gestin de derechos y limita-ciones y excepciones al derecho de autor. Ginebra. Abril-2006
[32] Castro Martn, Pablo de. Estadsticas de uso de repositoriosinstitucionales: un indicador fiable de comparacin? Diciem-bre 2008, Universidad Complutense de Madrid, Madrid. http://eprints.ucm.es/8499/
[33] DRIVER (Digital Repository Infrastructure Vision for EuropeanResearch). Directrices DRIVER 2.0. para proveedores de conte-nido - exposicin de recursos textuales con el protocolo OAI-PMH . Noviembre 2008. http://www.driver-support.eu/documents/DRIVER_2_1_Guidelines_Spanish.pdf
[34] REAL ACADEMICA ESPAOLA. Diccionario de la Lengua Espa-ola. http://buscon.rae.es/draeI/
[35] Opendoar. Directorio de Repositorios de Acceso Abierto http://www.opendoar.org/
[36] Corporacin Universitaria Lasallista. http://www.lasallista.edu.co/. 1. Biblioteca Digital Lasallista (BIDILA). http://www.lasallistavirtual.edu.co:81/dspace/
[37] Corporacin Universitaria Minuto de Dios. http://www.uniminuto.edu/. 1. Colecciones Digitales Uniminuto. http://dspace.uniminuto.edu:8000/dspace/
[38] e-medicina fetal - http://e-medicinafetal.org/. 1. Digital Repositoryin Fetal Medicine (DRFM. http://digitalrepository.e-medicinafetal.org/
[39] Instituto Interamericano de Cooperacin para la Agricultura IICAoficina en Colombia. http://www.iica.int/colombia. 1. Centro Vir-tual de Informacion CVI IICA oficina en Colombia.http://zeus.iica.ac.cr:8090/dspace/
[40] Universidad Autnoma de Occidente - http://www.uao.edu.co/. 1.Biblioteca Digital - Autonoma Virtual. http://bohr.cuao.edu.co/dspace/
[41] Universidad de Antioquia (UdeA) - http://www.udea.edu.co/. 1.Biblioteca Digital del Sistema de Bibliotecas de la Universidadde Antioquia. http://tesis.udea.edu.co/dspace/
[42] Universidad de la Salle - http://unisalle.lasalle.edu.co/. 1. TEGRA.http://tegra.lasalle.edu.co/dspace/
[43] Universidad de los Andes - http://www.uniandes.edu.co/1.DSpace de Universidad de los Andes.http://dspace.uniandes.edu.co:5050/dspace/
[44] Universidad del Rosario - http://www.urosario.edu.co/. 1.edocUR.http://repository.urosario.edu.co/
[45] Universidad Icesi - http://www.icesi.edu.co/. 1. Biblioteca Digital- Universidad Icesi.http://bibliotecadigital.icesi.edu.co/. 2. Repo-sitorio Acadmico - Universidad Icesi. http://repositorioacademico.icesi.edu.co/repositorio_academico/
[46] Universidad Nacional de Colombia - http://www.unal.edu.co/ 1.Scientific Electronic Library Online - Colombia (SciELO - Colom-bia). http://www.scielo.org.co/. 2. Universidad Nacional De Colom-bia - Repositorio Institucional UN. http://www.digital.unal.edu.co/
[47] Universidad Nacional Abierta y a Distancia (UNAD). http://www.unad.edu.co. Tiene en proceso de implementacin variosrepositorios en DSPACE. http://www.unad.edu.co/index.php?option=com_content&view=category&id=178&Itemid=938
[48] LYNCH, Clifford A. Institutional Repositories: EssentialInfrastructure For Scholarship In The Digital Age portal: Librariesand the Academy - Volume 3, Number 2, April 2003, pp. 327-336
[49] BARTON, Mary. WATERS, Margaret. Cmo crear un RepositorioInstitucional. MIT Libraries..2004-2005 http://www.recolecta.net/buscador/documentos/mit.pdf
[50] SPARC (The Scholarly Publishing & Academic ResourcesCoalition) http://www.arl.org/sparc/
[51] ROAR. Registry of Open Access Repositories - http://roar.eprints.org/