Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de...
Transcript of Modelo para la recuperación de las estadísticas de uso de ... · análisis de datos por medio de...
3/35
Modelo para la recuperación de las estadísticas de uso de recursos
electrónicos de información.
Información del autor(es):
Nombres y apellidos: Laura Ortigoza Jiménez
Grado académico: Maestra en Ciencias
Cargo: Analista de la Unidad de Inteligencia
Perfil profesional:
Es Ingeniero Químico por la Universidad Veracruzana, recibió el grado de Maestra en
Ciencias por el Centro de Investigación Avanzada del IPN. Obtuvo un diplomado en
“Gestión de Proyectos e Inteligencia Competitiva” por el Consejo Nacional de Ciencia y
Tecnología (CONACYT). Cuenta con un diplomado por Harvard Manage Mentor en
Innovation Implementation Tiene un diplomado profesional otorgado por Microsoft de
“Minería de datos con SQL Server”. Se le otorgo una certificación en conocimientos sobre
propiedad intelectual otorgada por el Instituto Mexicano de la Propiedad Intelectual (IMPI) y
la Organización Mundial de la Propiedad Intelectual (WIPO).
Su experiencia laboral se ha desarrollado en generación de modelos de Unidades de
Vigilancia Tecnológica, creación de modelos para implementar metodologías sistemáticas
para el buen aprovechamiento y explotación de los recursos electrónicos de información y
análisis de datos por medio de herramientas de B.I.
Participó en el Consejo Nacional de Ciencia y Tecnología (CONACYT) en el diseño e
implementación de su herramienta de análisis estadístico de recursos electrónicos de
información para medir el uso de las bases de datos que suscriben para 520 instituciones
de educación e investigación superior.
Institución: Instituto Mexicano de la Administración del Conocimiento
Correo electrónico: [email protected]
4/35
Tema desarrollado: Modelo para la recuperación de las estadísticas de uso de recursos
electrónicos de información.
Resumen
Existe un reto en las Bibliotecas cuando se requiere conocer las necesidades de información de la comunidad, las tendencias de los intereses de sus usuarios, estadísticas de uso de los recursos electrónicos de información que contratan y los movimientos detallados que hacen los usuarios dentro del catálogo OPAC de la Biblioteca. Para trabajar de manera precisa y oportuna con este reto, se requiere romper la barrera de la recuperación y homologación de estadísticas de uso. En este trabajo se muestra una metodología que permite identificar las preguntas básicas e indispensables que lleven a la generación de indicadores que midan el uso de los diferentes servicios electrónicos que ofrece la Biblioteca. Además se identificarán las fuentes de datos disponibles para la generación de indicadores de uso y finalmente se muestran las diferentes alternativas en el tema de soluciones tecnológicas para la consolidación de estadísticas de uso de los diferentes recursos electrónicos de información. El enfoque principal en este trabajo es la generación de indicadores de uso en las Bibliotecas que permitan tomar decisiones, justificar presupuestos y trabajar con un plan estratégico anticipado respecto a lo que se suscribe o renueva de recursos electrónicos de información. Con el fin de contar con datos reales para la generación de indicadores de uso de los recursos electrónicos de información, se solicitó el apoyo de algunas Bibliotecas Digitales, de las cuales por convenio de confidencialidad se hace referencia a ellas como los casos de estudio: Caso de Estudio 1.- Biblioteca Digital de Nivel Superior. Caso de Estudio 2.- Biblioteca Digital Consorcial para 500 Instituciones de Educación Superior. Palabras clave: bibliominería estadísticas de uso en bibliotecas, gestión de datos, herramienta, indicadores de bibliotecas, minería de datos, solución.
Introducción
Las bibliotecas y centros de información han asumido nuevas e importantes responsabilidades en un mundo lleno de información. Se enfrentan a un universo cada vez más amplio de acceso a recursos electrónicos de información; Bases de Datos, Libros Electrónicos, Revistas Electrónicas, Catálogo OPAC, etc., todos en diferente plataforma, lo cual resulta en un problema, cuando el interés es conocer el uso que se le está dando a todos estos recursos. Además de lo anterior, es necesario conocer quien está utilizando el recurso, por cuanto tiempo y si ese acceso culmina o no en una descarga de texto
5/35
completo. El tema de estadísticas de uso en el ámbito Bibliotecario no es un tema nuevo. Diferentes Instituciones han estudiado los diferentes indicadores en Bibliotecas desde 1995. En la Tabla 1, se muestra a los diferentes Organismos y las Iniciativas que se han publicado al paso del tiempo:
Tabla 1. Estado del arte en el tema de indicadores en Bibliotecas.
Hay un gran interés en el ámbito bibliotecario por medir y evaluar el rendimiento de las bibliotecas. Las bibliotecas siempre han analizado estadísticas del uso de sus acervos, colecciones e instalaciones. Sin embargo los datos que analizan ofrecen información
Organismo Iniciativa
Comisión Europea Library Performance Indicators and Library
Management Tools [1].
SEDIC
Guía para la aplicación de la norma ISO
9000 a bibliotecas y servicios de
información y documentación [2].
International Federation of Library
Associations and Institutions (IFLA)
Directrices Internacionales para la medición
del rendimiento en las bibliotecas
Universitarias [3].
Joint Funding Councils (JFC)
The effective academic library: a framework
for evaluating the performance of UK
academic libraries [4].
Red Española de Bibliotecas
Universitarias (REBIUN)
Guía para indicadores de rendimiento y
calidad de bibliotecas [5].
Normas ISO y UNE
Norma ISO 11620 Indicadores de
rendimento de bibliotecas [6].
UNE-ISO 2789, Información y
documentación. Estadísticas
internacionales de bibliotecas, 2014 [7].
Norma Española UNE 50137 Indicadores
de rendimiento bibliotecario [8].
Comité de Bibliotecas Universitarias de
Perú (COBUN)
Indicadores de Gestión Bibliotecaria emitido
por el COBUN [9].
6/35
cuantitativa y por lo tanto es difícil asociarlo a una planeación estratégica en la gestión de la Biblioteca, ya que no hay forma de hilar las estadísticas con las metas, objetivos y toma de decisión para mejorar los servicios.
En el caso de las estadísticas de uso de los recursos electrónicos de información, se debe buscar la medición objetiva de los servicios Bibliotecarios por medio de indicadores que permitan mejorar el servicio, detectar oportunidades o debilidades y ajustar acciones que ayuden a cumplir el objetivo de la planeación estratégica de la Biblioteca. El manual “Claves para el éxito: indicadores de rendimiento para bibliotecas públicas” [11], sugiere los siguientes puntos a considerar al generar indicadores:
Planificar, conocer qué está consiguiendo la biblioteca y establecer los objetivos y prioridades para el futuro.
Comunicación, reportar el rendimiento del servicio a toda la organización (equipo directivo, personal y usuarios).
Resolver problemas antes de que surjan, en lugar de reaccionar tarde a una crisis, identificar áreas problemáticas y analizar sus causas.
Tomar decisiones a partir de datos pertinentes.
Estar pendientes de las mejoras y documentarlas.
En este trabajo se plantea un modelo que da a las Bibliotecas la opción de ser generadores de sus propios datos para la estandarización de reportes. El tema de la autonomía en la generación de estadísticas de uso, es con el fin de evitar la dependencia que en estos días se vive, al tener que solicitar a los proveedores el envío de las estadísticas de uso. En un entorno tan cambiante, donde se deben justificar presupuestos, tomar decisiones con información confiable y oportuna, las Bibliotecas requieren indicadores que ofrezcan información cuantitativa y cualitativa haciendo evidente el detalle de quienes están utilizando los recursos electrónicos de información.
7/35
Método utilizado
En el modelo propuesto permite identificar las necesidades y la metodología a considerar para la generación y recuperación de indicadores de uso de los recursos electrónicos de información. El modelo propuesto se basa en el Proceso de Bibliomining de Nicholson, Scott. y Stanton, J [12], asimilando las siguientes etapas:
Proceso de Bibliomining Modelo propuesto
1 Determinación de áreas a medir
Generación de preguntas claras y concisas: ¿Qué áreas quiero medir en la Biblioteca? ¿Cuáles son mis indicadores emergentes?
2 Definición de qué se quiere
conocer
Identificación de los indicadores necesarios que fundamente la toma de decisiones en el tema de contratación de recursos electrónicos de información.
3 Identificación de las fuentes de datos internas y externas
Sistema de validación (Log del proxy)
Iniciativa COUNTER
4 Selección de la herramienta tecnológica
Piwik
Google Analitycs
InfoIntelligen
5 Descubrimiento de patrones a través de la minería de datos y creación de informes con herramientas de análisis de datos
Transformar el análisis de datos en indicadores que me apoyen en la toma de decisiones. Análisis de datos, sin miedo a los resultados.
6 Análisis e implementación de los resultados
Aplicar los indicadores definidos, establecer estrategias a corto plazo, que permitan hacer ajustes y mejoras a las áreas analizadas.
Tabla 3: Adecuación de proceso Bibliomining al modelo propuesto.
8/35
Modelo propuesto aplicado
Etapa 1.- Determinación de áreas a medir
El objetivo de esta primer etapa es que por medio de preguntas claras y concisas se
definan qué áreas se someterán a medición y cuáles serán los indicadores que requiero
conocer.
I. ¿Qué áreas quiero medir en la Biblioteca?
Revisión de la inversión que se hace en la suscripción/renovación de los
recursos electrónicos de información que brinda la Biblioteca
II. ¿Cuáles son mis indicadores emergentes de acuerdo al área definida?
Recursos con mayor consulta y con menor consulta
Información cualitativa del uso de los recursos electrónicos de
información: de qué departamento, carrera, programa académico, tipo
de usuario, ID de usuario
Conocer si los recursos están siendo utilizados por la carrera/programa
académico para los cuales fueron contratados
Descargas en texto completo que se hacen por título de revista
Las revistas contratadas y utilizadas por los usuarios se encuentran
rankeadas dentro de un Factor de Impacto
9/35
Etapa 2.- Definición de qué quiero conocer
En esta etapa se definieron los indicadores a considerar para la “Revisión de la inversión
que se hace en la suscripción/renovación de los recursos electrónicos de información que
brinda la Biblioteca”:
Indicador Detalle del indicador
Uso de las Bases de datos
Número de accesos a las bases de datos por carrera, departamento, sede, persona, IP, etc.
Usuarios potenciales con respecto a los reales por carrera o departamento.
Análisis de colecciones
Uso de las colecciones electrónicas.
Traslape entre títulos dentro de las colecciones.
Descargas en texto completo por editor-revista
Textos completos descargador por revista, costo por artículo.
Factor de impacto de las revistas disponibles.
Inversión a la suscripción de los recursos electrónicos de información
Inversión en suscripción a bases de datos con respecto al uso.
Desarrollo de colecciones con respecto al interés de los usuarios.
Negociación con los editores/proveedores y/o agregadores.
Infraestructura Tecnológica adecuada
Plataforma intuitiva para la búsqueda y recuperación de contenido electrónico.
Validación de los usuarios para la autenticación.
Integración de los recursos electrónicos de información.
Tabla 2. Indicadores de una Biblioteca
Los indicadores que se muestran en la Tabla 2, brindan a los directores de las Bibliotecas
los elementos para hacer una suscripción o renovación de los recursos electrónicos de
información con fundamento en si se utiliza el recurso y quien lo utiliza. Con esta
información se tiene apoyo para la toma de decisiones, respecto a:
• Fijación de objetivos
• Asignación de presupuesto
• Plan operativo
10/35
Etapa 3.- Identificación de las fuentes de datos internas y externas
La materia prima de los indicadores son datos, por lo que se requiere que estos se
extraigan de fuentes confiables, que estén disponibles de manera inmediata y que se
encuentren en formatos manejables. En esta etapa se exponen las fuentes de datos
externas e internas que se utilizaron para la generación de los indicadores establecidos en
la “Revisión de la inversión que se hace en la suscripción/renovación de los recursos
electrónicos de información que brindan las Bibliotecas”.
Fuentes de datos externas
Podemos definir como fuente de datos externa a las estadísticas de uso por recurso
electrónico de información que envían o que se recuperan por medio de la plataforma de
los proveedores. Las características principales de esta fuente externa son que implican de
tiempo y esfuerzo en la recuperación de los datos, son estadísticas muy limitadas, ya que
no se obtiene el detalle de quien está haciendo las consultas, descargas o accesos. El
tener estadísticas globales, no permiten a la Dirección de Bibliotecas contar con elementos
que ayuden a la planeación estratégica de contratación, suscripción o renovación de
recursos electrónicos de información.
Otra fuente externa, de la cual las Bibliotecas son dependientes, son los archivos que
muestran los títulos de revistas, libros, etc, por colección, en este caso, se depende de que
dichas listas estén actualizadas o que brinden el detalle de la colección, por ejemplo:
tiempo de embargo, full text start o full text stop, tipo de fuente: revista académica, libro
electrónico, periódico, etc.
Fuentes de datos internas
A continuación se muestran las fuentes que se determinaron como internas, ya que son
fuentes de datos disponibles en las Bibliotecas y que además se pueden extraer de forma
automática, pudiendo así eliminar la dependencia que se tiene con el proveedor en el tema
de estadísticas de uso. Las fuentes de datos internas que se sugiere se exploten son:
a) Sistema de validación (Log del proxy)
11/35
Es un sistema de validación de usuarios que controla el acceso a los
recursos ofrecidos por la biblioteca. Es muy común que por cuestiones de política
institucional el modelo de configuración del sistema Proxy o Sistema de validación
se utiliza sólo para acceso remoto o acceso fuera del campus de la Institución. Sin
embargo se debe trabajar en la validación aun dentro del campus, con el fin de que
se aloje en las bitácoras del Proxy los datos de acceso dentro y fuera del campo y
evitar sesgo en la información, que pueden dar indicadores incorrectos, ya que el
escenario no estará completo.
En cuanto a la autentificación de usuarios, existen en el mercado varios
sistemas de validación. El más común en las bibliotecas es el EZ-Proxy, el cual es
capaz de guardar bitácoras de sesiones, que alojan de acuerdo a la configuración
el detalle de lo que hace el usuario al acceder por medio de su clave y contraseña a
los recursos electrónicos de información. Algunos datos almacenados en la bitácora
del Proxy o Sistema de validación pueden ser:
a. Recurso al que ingresó.
b. Institución afiliada.
c. Fecha y hora de ingreso al recurso.
d. IP (Dirección de Internet) desde donde ingresó el usuario.
e. Cuenta del usuario.
f. Programa académico.
g. Tiempo de estancia dentro de un recurso.
Los datos que se alojan en la bitácora dependen de la configuración del Proxy.
Los detalles del usuario se obtienen del Directorio Activo, LDAP o Base de datos de
usuarios, donde se aloja: Nombre del usuario-Carrera a la que pertenece-
Departamento al que pertenece-ID de usuario-Tipo de usuario, etc.
b) Iniciativa COUNTER (Counting Online Usage of Networked Electronic Resources)
[13], lanzada en 2002 y adoptada por los proveedores de los recursos electronicos
de información, como un estándar de medición de sesiones, búsquedas, servicios y
12/35
textos completos descargados. Algunos de los reportes COUNTER que se
consideraron en este trabajo son:
Journal Report 1 – full-text article requests (Artículos en texto completo
solicitados).
Database Report 1 – searches and sessions by database (Accesos y
búsquedas totales por base de datos)
Database Report 2 – turnaways by Month and Service (Rechazos del
proveedor al solicitante por mes).
Database Report 3 – searches and sessions by service (Total de búsquedas
y sesiones por servicio).
Los reportes COUNTER, son denominados como una fuente interna, porque son
datos disponibles, sin embargo, hay ciertas realidades que se deben tomar en
cuenta:
Los principales proveedores y/o agregadores han asimilado la iniciativa
COUNTER. Sin embargo aún hay proveedores que no se han sumado a
dicha iniciativa.
Los reportes COUNTER pueden descargarse directamente de la plataforma
del proveedor en formato Excel, XLS, HTML, entre otros, siempre y cuando
se tenga una clave y contraseña de administrador.
Los reportes COUNTER pueden descargarse de forma automática a través
del protocolo SUSHI (Standardized Usage Statistics Harvesting Initiative) [14],
protocolo para la extracción y consolidación de las estadísticas provenientes
de diferentes proveedores de información. Es importante mencionar que no
todos los proveedores lo tienen.
Uno de los puntos a considerar al pasar a la siguiente etapa, es la automatización para la
recuperación de los reportes COUNTER.
13/35
Etapa 4.- Selección de la herramienta tecnológica
El análisis de los datos puede ser complejo y tardado, si no se cuenta con una
herramienta que facilite el manejo de miles de datos y guardar históricos. La herramienta
que se utilizó en este trabajo funge como un semáforo, que permite conocer la evolución
de los indicadores, el impacto de las actividades realizadas y la formulación de estrategias
que ayuden a mejorar el servicio bibliotecario.
A continuación se presentan los resultados de la evaluación que se hizo a diversas
herramientas con las que se pueden generar estadísticas de uso de los recursos
electrónicos de información:
Características Piwik Google Analytics
InfoIntelligen Otros
Herramienta intuitiva SI SI SI SI
Herramienta especializada NO NO SI SI
Analiza diferentes fuentes de datos al mismo tiempo
NO NO SI NO
Relaciona precios por descarga
NO NO SI NO
Permite conocer factores de impacto de las revistas descargadas
NO NO SI NO
Analiza reportes COUNTER NO NO S NO
Analiza el proxy NO NO SI SI
Permite descargar los reportes en Excel
SI SI S SI
Es una plataforma a la medida de las necesidades de las instituciones
NO NO SI NO
Permite cambiar los tipos de gráficos
NO NO S SI
Permite guardar historiales SI SI SI SI
Tiene soporte técnico SI SI S SI
Tiene mantenimientos NO SI SI SI
Hay actualizaciones SI SI S SI
Puedes generar nuevos indicadores
NO NO SI NO
Hace conteos de entradas SI SI S SI
Analiza archivos o fuentes de datos adicionales en Excel
NO NO SI SI
Se conecta a la base de datos NO NO SI SI
14/35
de usuarios
Solución Web SI SI SI SI
Se instala en servidor institucional
SI NO NO AMBOS
Es por suscripción NO NO SI AMBOS
Solución Licenciada OPEN SOURCE
HOSTEADO SI NO
Usuarios ilimitados SI SI NO NO
Análisis de múltiples páginas web
SI SI SI NO
Tabla 3. Comparación de sistemas para estadísticas de uso
Google Analytics, es una solución para las Bibliotecas que requieren conocer accesos a
la plataforma de su Biblioteca Digital. Se utiliza Google Analytics, para conocer visitas al
sitio de la Universidad o bien visitas a la plataforma de Biblioteca Digital, el detalle es
acceso por IP´s y número de visitas. Google Analitycs es un sistema que se descarga a
partir de una suscripción y se coloca el script en el sitio web que se desea evaluar.
Piwik es un sistema web que se descarga y aloja en servidor. Este sistema es Open
Source y permite conocer, al igual que Google Analytics los accesos o visitas a la
plataforma de Biblioteca Digital. La diferencia es que con Piwik se puede configurar para
conocer el detalle de accesos por cada uno de los módulos que componen la plataforma
de la Biblioteca Digital, sin embargo no podemos conocer el detalle de quién está haciendo
uso de los recursos electrónicos de información, ni si está descargando algún título de
revista en particular.
Es importante enfatizar que los accesos, entradas o visitas hacen referencia y se
contabilizan cada vez que un usuario hace click sobre alguno de los módulos de la
Biblioteca Digital.
InfoIntelligen es una herramienta especializada para Bibliotecas, es parametrizable y
configurable a las necesidades de los usuarios finales (Dirección de Biblioteca).
Es una herramienta que tiene la capacidad de conexión automática a las fuentes de datos
ya sean internas o externas de la Biblioteca. Puede alimentarse de distintas fuentes de
datos, entre ellas la bitácora del Proxy o Sistema de Validación y vincular el Directorio
15/35
Activo o Base de Datos de los usuarios, del cual se desglosan accesos a los recursos
electrónicos de información, con el detalle de accesos por el perfil de los usuarios (carrera,
departamento, sede, ID, matrícula, cédula, tipo de usuario, etc). Debido a sus
características únicas de configuración puede suministrar reportes específicos
configurables a la Universidad.
Una de las principales potencialidades de InfoIntelligen es brindar a los usuarios
diferentes perspectivas a través de analizar datos asociados y no asociados. Con este
enfoque único, el análisis de datos es flexible. Los usuarios pueden navegar e interactuar
con los datos de cualquier manera, no están limitados a solamente seguir los caminos
predefinidos o utilizar los tableros de control o reportes pre configurados.
Características detalladas de InfoIntelligen:
I. Configuración de filtros de búsqueda de acuerdo a las necesidades de reportes
y análisis de datos que el usuario requiera.
II. Acceso Web, por medio de una URL y usuario y contraseña
III. Permite hacer múltiples cruces de búsqueda:
a. Accesos por recurso electrónico de información
b. Accesos por instituciones
c. Accesos por tipo de usuarios
d. Manejo de grupos y subgrupos:
i. Por región geográfica
ii. Por tipo de recurso electrónico
iii. Por tipo de institución
iv. Por programa académico
v. Por editoriales
vi. Por periodo de tiempo: año, semestre, mes, día, hora
IV. Análisis de datos: los usuarios pueden navegar, interactuar y analizar los datos
de diferentes formas, no están limitados a solamente reportes predefinidos.
Otras herramientas analizadas, aunque son herramientas especializadas en el tema de
Bibliotecas, no analizan los reportes COUNTER, ni hacen el análisis de los títulos de las
16/35
colecciones, lo cual para este caso de estudio son vitales, ya que requerimos conocer el
uso de los recursos electrónicos de información, relacionar los costos por descargas en
texto completo por título de revista, factor de impacto de las revistas consultadas, entre
otros. Los resultados de este análisis comparativo muestran que la herramienta más
conveniente para este estudio es InfoIntelligen ya que es la única herramienta que permite
conocer las necesidades, tendencias de los intereses de sus usuarios, estadísticas de uso
de los recursos electrónicos de información y movimientos detallados del catálogo OPAC.
Etapa 5.- Operación de InfoIntelligen
A continuación se expone el diagrama conceptual que utiliza InfoIntelligen para la
generación de indicadores de uso de las Bibliotecas:
Esquema 1: Diagrama conceptual de generación de Indicadores de uso de los recursos
electrónicos de información.
Data Mining
Archivos de colecciones
Log Proxy
LDAP, Directorio Activo, B.D. Usuarios
Estándar COUNTER
Homologación y estandarización de los datos
Conectividad Generación y análisis de indicadores de uso
InfoIntelligen
17/35
InfoIntelligen extrayendo y haciendo análisis de los datos del Sistema de Validación
o Proxy
InfoIntelligen se conecta directamente con la bitácora del sistema de validación, realiza el
análisis por sesión (cada login que hace un usuario o institución a un recurso) para
generar los reportes. Algunos de los reportes que se pueden recuperar de analizar la
bitácora de un sistema de validación son:
Accesos totales por recurso, institución, región, estado.
Uso por institución y/o grupos de instituciones filtrado por recurso y período de tiempo.
Entradas y tendencias a los recursos por unidad de tiempo.
Uso mensual por institución y por recurso.
Análisis de tendencias.
Top de los recursos más utilizados.
Los recursos menos utilizados.
Instituciones que tengan cero uso de los recursos electrónicos.
Top de instituciones que más utilizan los recursos electrónicos.
InfoIntelligen extrayendo y haciendo análisis de los reportes COUNTER
En el caso de los reportes COUNTER, se diseñó una estrategia para la recuperación o
extracción de estos reportes, de acuerdo a las siguientes condiciones:
i. Proveedores, Agregadores y/o editores que han asimilado COUNTER y SUSHI. La
conexión es automática por medio de la llave SUSHI.
ii. Proveedores, Agregadores y/o editores que han asimilado COUNTER, pero no SUSHI.
Se lleva el siguiente procedimiento:
a) Solicitar al proveedor las claves de administrador para ingresar a la plataforma del
proveedor y ejecutar la descarga manual de los reportes COUNTER.
18/35
b) Cargar los reportes a la plataforma que brinda InfoIntelligen, denominada “Módulo
de administración de reportes COUNTER”, la cual permite cargar los reportes en
formato Excel y se alojaran en una base de datos que será leída por InfoIntelligen
para su análisis.
Figura 1.- Módulo de Administración de reportes COUNTER. Carga masiva en web.
19/35
A continuación se presenta el esquema de la situación que se presenta con los
proveedores en la actualidad ante el tema de SUHI & COUNTER:
Esquema 2: Esquema de la extracción de los reportes COUNTER
Etapa 6.- Análisis y resultados
Se utilizó InfoIntelligen para generar los indicadores que se definieron en la Etapa 2. En
este caso todos se relacionan con el tema de uso de los recursos electrónicos de
información y justificación de presupuesto asignado para los mismos.
¿Cuentan con la iniciativa COUNTER?
Proveedores/ agregadores
y/o editores
Sí No
InfoIntelligen, se conecta, extrae los datos de
cualquiera de los dos casos.
Se solicita al proveedores/ agregadores y/o editores que estandarice un reporte y que lo cargue en el módulo de administración de reportes COUNTER.
Conexión automática por medio de la llave de SUSHI, el cual sirve de cosechador de los datos. Por default todos los proveedores que cuentan con COUNTER, tienen SUSHI.
20/35
Caso de estudio 1.- Biblioteca Digital con 420,099 ejemplares, compuesta de: 72 bases
de datos indizadas con 170,000 títulos distintos con texto completo, libros y revistas en
formato electrónico.
Algunas características de la Plataforma de la Biblioteca Digital del caso de estudio 1 son:
Cuentan con sistema de validación: EZ-Proxy.
Validan a los usuarios dentro y fuera del campus.
Cuentan con la relación de alumnos inscritos por carrera.
Los resultados que se obtuvieron de hacer análisis con InfoIntelligen en el caso de estudio
1 se muestran a continuación:
Indicador.- Uso de las Bases de datos
El primer análisis que se realiza es identificar las bases de datos que más se utilizan y las
que menos se utilizan. Esta información muestra los dos extremos del aprovechamiento
que le da la comunidad a los recursos electrónicos de información que brinda la Biblioteca
a la comunidad.
Figura 1. Accesos totales por recurso. Los mayores y menores utilizados por los usuarios
21/35
Este primer análisis es una estadística muy general, que en la actualidad la Biblioteca ya está
obteniendo con fuentes externas (solicitadas al proveedor). Con la finalidad de justificar la
inversión que se hace al suscribir y renovar los recursos electrónicos de información, se
generó un indicador que relacione el uso por base de datos con información cualitativa,
identificando quiénes son los usuarios con mayor consulta, de qué carreras, departamento e
inclusive qué tipo de usuario son.
La Figura 2 hace referencia a un cruce de información, que permite al caso de estudio 1,
justificar por carrera o departamento la inversión de los recursos electrónicos.
Figura 2. Accesos por carrera, departamento, sede, tipo de usuario
Conocer los accesos con un desglose detallado, por carrera, departamento tipo de sede, deja
ver los puntos de principal enfoque y los objetivos primordiales para capacitar y exhortar para
el Uso de los recursos electrónicos de información. Este tipo de indicadores permite crear una
alianza Biblioteca-Académico- Usuario y trabajar en conjunto para el aprovechamiento de los
recursos contratados.
22/35
Indicador.- Descargas en texto completo por editor-revista
Con los datos extraídos de los reportes COUNTER, se identificaron las descargas que se
hicieron en texto completo de un agregador, siguiendo la lógica de agregador-editor-
revista-descarga de título de revista. En la figura 3, se muestran los textos completos
descargados anualmente.
Figura 3. Total de textos completos descargados por editor por año.
En este caso de estudio se sometió a análisis un agregador, del cual se pudieron analizar
datos de los reportes COUNTER, que detallan la descarga por título de revista y hacer un
empate con las búsquedas y sesiones que hacen los usuarios de la Biblioteca, ya que no
toda búsqueda termina en descarga de texto completo.
23/35
Figura 4. Detalle a nivel de título de revista descargado en texto completo por año y mes,
con posibilidad de filtrar por revista y/o editorial.
Indicador.- Total de sesiones y búsquedas por base de datos
En la figura 5 se observa el análisis de los datos de los reportes COUNTER donde se
muestran el total de sesiones y búsquedas por base de datos. La diferencia entre una
búsqueda y una sesión se marca en la descarga de texto completo, una sesión se
completa cuando un usuario hace la descarga del texto completo, de otra forma sin
descarga, la acción queda en una búsqueda.
Los resultados observados después de analizar los reportes COUNTER son que del total
de búsquedas más sesiones. Las búsquedas corresponden al 80% del total, de ahí la
importancia de hacer la separación de las búsquedas y las sesiones, de otra forma el
indicador puede darnos información incorrecta.
24/35
Figura 5.- Total de sesiones y búsquedas por base de datos
Indicador.- Relación entre usuarios potenciales y reales filtrados por recurso, institución
o carrera
Para poder generar este indicador se requiere de datos que se generan en Servicios
Escolares, donde se lleva un control de la cantidad de alumnos que se inscriben por año,
semestre, por carrera o programa académico, denominados como “Usuarios Potenciales”.
Esta información muestra en la Figura 6 relacionando usuarios potenciales contra reales.
Este indicador hace evidente las carreras que más utilizan los recursos electrónicos de
información y las carreras a las cuales debemos enfocarnos para promover el uso los
recursos brindados por la Biblioteca.
25/35
Figura 6.- Relación entre usuarios potenciales y reales filtrados por recurso, institución o
carrera
Los resultados obtenidos en la relación de usuarios potenciales vs reales ayudaron a
generar un porcentaje de uso por carrera, el cual se utilizó para la definición de metas de
uso por carrera. Se utilizó un semáforo de aprovechamiento de los recursos, donde las
carreras que tienen un porcentaje de uso del 0-50 % están dentro del color rojo, mostrando
las carreras de las que hay que preocuparse. Inclusive se presentaron estos resultados
ante los decanos o jefes de las carreras y se expuso la preocupación de que los usuarios
no están utilizando los recursos contratados. Se diseñaron cursos de capacitación de las
plataformas de los recursos electrónicos de información, siendo las primeras invitadas las
carreras que cayeron dentro del color rojo.
En el color amarillo se encuentran las carreras que oscilan entre el 50-70 % de uso. Con
estas carreras se estableció una campaña de difusión: carteles, campañas de correo
electrónico. El caso de las carreras que se encuentran en color verde son las del
26/35
porcentaje del 70-100 % pocas carreras caen en este color. Se observa que son los
usuarios de posgrado que utilizan en mayor porcentaje las bases de datos.
Indicador.- Accesos a detalle, por usuario, tipo de usuario
Utilizando el directorio activo del caso de estudio 1, se pudo conocer el detalle de quién
accede, a qué recurso, desde que ubicación (dentro o fuera del campus), incluso desde
que dirección IP.
Figura 7.- Nivel de detalle por usuario
En este caso de estudio, los resultados generados del análisis de la bitácora del Proxy +
Directorio Activo + Base de datos de usuarios inscritos, permiten obtener diversos
indicadores, que apoyan la toma de decisiones sobre qué recursos electrónicos de
información renovar y con cuáles gestionar una estrategia de promoción y capacitación
27/35
para los usuarios. No se encontraron anomalías de abuso de acceso a las bases de datos,
los porcentajes de uso con respecto al total son de menos del 1% por alumno.
Caso de estudio 2. Biblioteca Digital para 500 Instituciones de Educación Superior:
cuentan con 30 recursos electrónicos de información contratados que incluye: Plataforma de
ebooks, Bases de datos de Revistas Científicas y Catalogo OPAC.
Algunas características de la Plataforma de la Biblioteca del caso de estudio 2
Cuentan con sistema de validación EZ-Proxy
Todos los usuarios que quieren acceder a la Biblioteca Digital, pasan por una única
validación que les permite consultar todos los recursos dentro de la Plataforma de
Biblioteca Digital.
Cuentan con una plataforma de administración de usuarios, donde el usuario
genera su cuenta por medio del llenado de un formulario electrónico. La Plataforma
de administración de usuarios guarda la información de los usuarios en una
bitácora o base de datos de usuarios.
Indicador.- Accesos totales a los recursos electrónicos por estado, institución, servicio,
tipo de usuario y carrera
Figura 8. Accesos por carrera, departamento, sede, tipo de usuario
28/35
Indicador.- Análisis de colecciones
A continuación se muestra el traslape de títulos entre las colecciones electrónicas
contratadas. En este gráfico se puede observar la importancia de hacer un análisis
detallado del contenido de las colecciones, ya que pueden existir títulos repetidos entre las
plataformas Open Access y Bases de datos por suscripción. Se pudieron identificar la
cantidad de títulos repetidos entre dos colecciones y los títulos repetidos.
Figura 9. Traslape entre colecciones
Aunque se utilizaron los archivos que el proveedor proporcionó como los más actualizados,
se encontró que algunos de los proveedores, ni siquiera tienen actualizados los archivos
de títulos que contienen sus colecciones, lo cual es un problema al hacer análisis de
colecciones a nivel de título.
Aunque se hizo el traslape de colecciones, hay un tema importante que resaltar: en el caso
de revistas habría que conocer los tiempos de embargo, las ediciones y volúmenes, ya que
el estudio de análisis de colección debe ser mucho más fino que una coincidencia entre
títulos.
En el caso del indicador: análisis de colecciones, se identificaron traslape de títulos entre
una colección Open Acces y una colección contratada, se pudo conocer el detalle de
cantidad de títulos traslapados, que títulos son los que se están traslapando y con esta
29/35
información la Biblioteca del caso de estudio 2 tuvo elementos suficientes para negociar
con el proveedor la renovación a menor costo, con un tema de traslape de títulos.
Indicador.- Entradas y tendencias a los recursos por unidad de tiempo
La Figura 10 muestra las tendencias de uso de los recursos electrónicos de información, se
observa una proyección del uso que se tendrá al termino del año, lo que permite trabajar
en una planeación anticipada de contratación, renovación de los recursos y estrategias que
anticipen el escenario de una falta de uso de los recursos. Además de un plan para la
implementación de cursos de capacitación a los usuarios que menos utilizan los recursos
que ofrece la Biblioteca.
Figura 10.- Entradas y tendencias a los recursos por unidad de tiempo
30/35
Conclusiones
Se puede concluir que la generación de indicadores de uso de los recursos electrónicos de
información permite a las Bibliotecas conocer el comportamiento de los usuarios y generar
reportes con información estratégica que nos lleven a conocer si hay impacto en la
formación académica de los usuarios potenciales o no, además detonan acciones de
mejora continua. Los indicadores de uso de los recursos electrónicos generados para los
dos casos de estudio presentados en este trabajo brindaron a la Biblioteca información
precisa y oportuna para una adecuada inversión en recursos electrónicos, les permitió
clarificar el proceso de toma de decisiones con respecto a:
Uso eficiente de los recursos
Potenciar patrocinios
Alianzas con los proveedores
Compras por medio de consorcio
Hay factores críticos de éxito al implementar este tipo de procesos. Los principales son: Conexión al servidor proxy.
Adecuada configuración del proxy.
Definir adecuadamente los indicadores requeridos.
Estatus de los proveedores ante la iniciativa COUNTER.
Validación de usuarios dentro de la institución.
Los indicadores generados en los casos de estudio dieron elementos de retroalimentación
a la académica sobre la utilización de los recursos, además de establecer estrategias que
incrementen y mejoren la selección de los recursos de información. El conocer el detalle a
nivel de tipo de usuario, permite ver una realidad en el aprovechamiento de los recursos
electrónicos de información, se encontró que los académicos son usuarios no tan
frecuentes, lo cual es preocupante, pero teniendo conocimiento de esto, le permite a la
Dirección de Biblioteca definir una estrategia en cascada: capacitar a los maestros y
hacerlos conscientes de que los principales promotores de la utilización de los recursos
deben ser ellos, ya que la interacción con la comunidad de estudiantes es diaria.
31/35
La validación de los usuarios tanto dentro como fuera del campus Universitario es muy
importante, ya que de otra forma hay un sesgo en los datos que se alojan en la bitácora del
Proxy.
En el tema de las herramientas tecnológicas para estadísticas de uso, se requiere de una
evaluación basada en la necesidad que se quiere cubrir. Se debe tomar en cuenta que la
herramienta debe ayudar a la recopilación, generación y análisis de datos, que permita
disminuir el tiempo de trabajo en el proceso de compilación, la elaboración de reportes
para mejorar la atención de los usuarios.
Bibliografía
[1] European Comission, Library Performande indicators and library management tools, Office for Official Publications of the European Communities, Luxembourg, Suzanne Ward, John Sumsion, David Fuegi, Ian Bloor, 1995. [2] SEDIC, Guía para la aplicación de la norma ISO 9000 a bibliotecas y servicios de información y documentación, Madrid, 1998. [3] International Federation of Library Associations and Institutions (IFLA). Directrices Internacionales para la medición del rendimiento en las Bibliotecas Universitarias, IFLA, 1998. [4] Joint Funding Councils, The effective academic library: a framework for evaluating the performance of UK academic libraries, Bristol: HEFCE Publications, 1995. [5] REBIUN (Red Española de Bibliotecas Universitarias), Informe estadístico anual de las bibliotecas universitarias y científicas españolas, 1997. Castellón: Biblioteca de la Universitat Jaume I, 1998. [6] ISO 11660. Information and Documentation-Librery performande indocators. Gevene: ISO, 1998. [7] UNE-ISO 2789, Información y documentación. Estadísticas internacionales de bibliotecas, 2014. [8] Norma Española UNE 50137 Indicadores de rendimiento bibliotecario, 2005.
[9] Indicadores de Gestión Bibliotecaria emitido por el COBUN, Deposito Legal en la biblioteca Nacional del Perú, 2008.
32/35
[10] Claves para el éxito: indicadores de rendimiento para bibliotecas públicas. Barcelona:
Eumo Editorial, Ediciones Octaedro, 1995.
[11] COUNTER (Counting Online Usage of Networked Electronic Resources),
http://www.projectcounter.org/.
[12] NICHOLSON, Scott. and STANTON, J., Data mining for management decisions in corporate, special, digital, and traditional libraries. In Nemati, H. & Barko, C., 2003.
[13] Protocolo SUSHI (Standardized Usage Statistics Harvesting Initiative), http://www.niso.org/workrooms/sushi.