DISEÑO Y MANEJO DE BASES DE DATOS...
Transcript of DISEÑO Y MANEJO DE BASES DE DATOS...
DISEÑO Y MANEJO DE BASES DE
DATOS SANITARIOS
Dr. Raúl Ferrando Piqueres.
Sergio García Muñoz
Hospital General Universitario de Castellón
2 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
ÍNDICE
1. Resumen
2. Introducción
3. Objetivos.
4. Marco legal de la explotación de datos sanitarios. Confidencialidad.
4.1. ¿Qué es un dato personal?
4.2. Ley orgánica de protección de datos
4.3. Ley de investigación biomédica
4.4. ¿Puedo utilizar los datos de mis pacientes para analizar resultados de salud
en practica clínica?
4.5. ¿Puedo utilizar los datos de mis pacientes para publicar estudios?
4.6. Valoración ética de las bases de datos
5. Bases de datos.
5.1. Características de una base de datos
5.2. Clasificación de bases de datos
5.3. Herramientas informáticas para el tratamiento de datos. sistemas de gestión
de bases de datos
6. Creación de bases de datos.
6.1. Pasos para la creación de una base de datos
7. Ejemplos de bases de datos sanitarias y su utilidad en la estratificación de
pacientes para el abordaje de la cronicidad.
7.1. Base de datos de investigación farmacoepidemiológica en atención primaria –
BIFAP
7.2. Conjunto mínimo básico de datos (CMBD)
7.3. Utilidad de las bases de datos sanitarias
8. Representación gráfica de datos aplicada a la explotación de datos sanitarios.
9. Bibliografía.
3 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
1. RESUMEN
La información es el recurso más importante para cualquier organización incluida la
sanitaria, ya que con esta información se pueden controlar procesos, hacer estudios y
mejorar la atención a los pacientes.
Una Base de Datos es un conjunto exhaustivo, no redundante, de datos estructurados y
organizados independientemente de su utilización.
Es importante saber utilizar una base de datos al ser una ayuda para el almacenamiento
de datos cruciales para la gestión de la información sanitaria, evitando la redundancia de
los mismos y permitiendo un movimiento mucho mas eficaz y rápido entre la información
disponible, por medio de tablas, claves y relaciones.
En definitiva, el diseño de una base de datos consiste en definir la estructura de los datos
que debe tener un sistema de información determinado. En el caso relacional, esta
estructura será un conjunto de esquemas de relación con sus atributos, claves primarias,
etc
A su vez, un sistema gestor de bases de datos (SGBD) consiste en una colección de
datos interrelacionados y un conjunto de programas para acceder a dichos datos. La
colección de datos, normalmente denominada base de datos, contiene información
relevante para una organización. El objetivo principal de un SGBD es proporcionar una
forma de almacenar y recuperar la información de una base de datos de manera que sea
tanto práctica como eficiente
En este capítulo se presenta una breve introducción a los principios de los sistemas de
bases de datos y su posible utilidad en la atención de pacientes crónicos.
4 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
2. INTRODUCCIÓN
La actividad sanitaria genera un gran volumen de información, tanto clínica del paciente,
como propia de su funcionamiento; datos que muchas veces no están disponibles para su
interpretación en el momento en el que se requieren para ser explotados, ya sea por que
se ha utilizado una metodología errónea de recopilación o un sistema de procesamiento
muy variado, al utilizarse multitud y muy distintos programas informáticos, cuya capacidad
de integrarse entre sí es muy limitada.
El cada vez más de moda ―Big data‖ (grandes volúmenes de datos) se refiere al conjunto
de datos e información tan grandes y tan complejos que hace muy difícil su
procesamiento utilizando herramientas de gestión de bases de datos convencionales.
No hay duda, éste es el futuro de los sistemas sanitarios y el análisis de la salud de
nuestros pacientes, según ha publicado la prestigiosa revista Forbes: ―los big data
representan una oportunidad para los innovadores y todos los que se preocupan por la
salud, aumentan substancialmente la posibilidad de obtener información más efectiva de
los datos y menores tasas de mortalidad de los pacientes”.
Las necesidades actuales de información a partir de los datos existentes que garanticen
una correcta toma de decisiones, ya sea para el conocimiento del propio sistema, manejo
de datos epidemiológicos, explotación de datos clínicos o su propia organización
administrativa, hace necesario tener un conocimiento mínimo del papel de la informática
en estos ámbitos.
La National Library of Medicine (NLM),define a la Informática Médica como: ―El campo de
las ciencias de la información que se ocupa del análisis y diseminación de los datos
médicos, a través de aplicar la informática a varios aspectos del cuidado de la salud y la
medicina‖
La Informática Médica es una especialidad interdisciplinaria que se alimenta y relaciona
con diferentes áreas de la investigación, educación médica, práctica clínica, ciencias de la
información e informática.
5 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Los cuatro pilares en los que se basa la Informática Médica para el manejo de la
información sanitaria son:
➢ Producir estructuras para representar datos.
➢ Desarrollar métodos para una correcta y ordenada adquisición y representación de
los datos.
➢ Manejar el cambio entre los procesos y las personas involucradas para optimizar
el uso de la información.
➢ Integrar la información de diferentes fuentes.
Para evolucionar en el desarrollo de estos cuatro pilares es necesario definir previamente
una seria de conceptos que garanticen un óptimo resultado de la gestión de la
información:
DATO: representación simbólica de alguna situación o conocimiento, sin ningún sentido
semántico, describiendo situaciones y hechos sin transmitir mensaje alguno. Puede ser
un número, una letra o un hecho. (ejemplo: cualquier formulario que rellenamos, la
historia clínica, diagnóstico, etc…)
INFORMACIÓN: conjunto de datos, los cuales son adecuadamente procesados, para que
de esta manera, puedan proveer un mensaje que contribuya a la toma de decisión a la
hora de resolver un problema, además de incrementar el conocimiento, en los usuarios
que tienen acceso a dicha información (ejemplo: los grupos de edad con un diagnóstico
determinado, individuos con un riesgo determinado, grupos de edad según determinado
diagnóstico, etc…).
Estos datos que han sido sometidos a un proceso, que han sido clasificados, ordenados
sintetizados y/o asociados, y que nos permiten concluir algo, son transformados en
información útil para la mejora del sistemas sanitarios.
6 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
El modelo informático de salud consta de tres partes esenciales: datos, información y
conocimiento. Estos elementos ordenados en una jerarquía, en la que los datos se
encuentran en la base del modelo, una vez ordenados, producen información pudiendo
llegar a la potencial generación de conocimiento. Este modelo informático se acerca
mucho a los objetivos de la medicina basada en la evidencia (MBE).
El análisis de los datos permite evaluar una situación o proceso, implementar actuaciones
de mejora que posteriormente serán reevaluadas para valorar su eficacia.
En los últimos años se ha observado un incremento de la prevalencia de enfermedades
crónicas debido, en parte, al incremento de la esperanza de vida, al envejecimiento de la
población y a la mejora de la atención sanitaria. Estos factores también han propiciado la
aparición de pacientes con un elevado número de patologías concomitantes, con un
DATOS —> INFORMACIÓN —> CONOCIMIENTO —> ACCIONES DE MEJORA —> DATOS—> INFORMACIÓN—> REEVALUACIÓN
7 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
elevado riesgo de descompensación y con un elevado número de medicamentos
destinados a su tratamiento. Estos pacientes representan un porcentaje cada vez más
significativo del total de la población, y realizan una elevada utilización de los recursos
sanitarios. De hecho, se puede afirmar que, con respecto a los pacientes crónicos, la
multimorbilidad es la norma, no la excepción.
Atendiendo a estas circunstancias, la estratificación de la población en grupos de riesgo,
que permita conocer y prever las necesidades futuras de recursos sanitarios, resulta
especialmente relevante en la transformación de los modelos asistenciales (haciéndolos
más proactivos), en el tratamiento de la cronicidad (estableciendo poblaciones diana para
determinadas actuaciones) y en la integración de los niveles asistenciales, tanto
sanitarios como sociales.
La Sociedad Española de Farmacia Hospitalaria (SEFH), en su plan estratégico sobre
Atención Farmacéutica del paciente crónico, definió como eje 2, la ―Orientación centrada
en el paciente: la estratificación como herramienta del nuevo modelo de atención‖,
constituyendo un marco esencial para avanzar en una mejor atención a los pacientes
crónicos desde la posición del farmacéutico especialista en Farmacia Hospitalaria y para
el desarrollo de futuras actuaciones en este sentido
En resumen, la estratificación puede ser una herramienta útil en varios procesos, con
objetivos tan diversos como la mejora de la calidad asistencial, la eficacia y la eficiencia
del sistema sanitario, la detección y disminución de la variabilidad de la práctica clínica, la
8 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
mejora de las técnicas de evaluación y, en definitiva, para la toma de decisiones, tanto a
nivel micro como macro.
Un elemento fundamental para poder llevar a cabo la estratificación de la población por
grupos de riesgo son los sistemas de información. Es necesario, pues, disponer de una
base de datos que integre la información recogida en los diferentes registros sanitarios y
de respuesta a esta demanda.
La cuestión es que cada vez se hace más hincapié en la necesidad de proporcionar a los
pacientes una atención social y sanitaria integral e integrada, pero el análisis y la
evaluación de esta atención no se puede llevar a cabo correctamente con unos sistemas
de información fragmentados, sino que se debe hacer a partir de la integración de los
datos que contienen.
3. OBJETIVOS
El principal objetivo de este módulo es adquirir las nociones básicas sobre la importancia
de las Bases de Datos sanitarias destinadas a la organización de la documentación
clínica obtenida en el paciente crónico (conceptos, diseño, explotación, representación de
datos).
Para ello se ha de tener en cuenta la legislación sanitaria aplicada a la confidencialidad
de los datos, que de validez y seguridad a las herramientas diseñadas para explotar la
información sanitaria, así como las connotaciones éticas derivadas de la utilización de
datos clínicos de pacientes.
Como complemento a la información aportada también se presentarán bases de datos
relacionadas con el ámbito sanitario y su potencial utilidad en la estratificación de los
pacientes crónicos.
9 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
4. MARCO LEGAL DE LA EXPLOTACIÓN DE DATOS SANITARIOS.
CONFIDENCIALIDAD
La normativa que vincula la salvaguarda de la información sanitaria es doble, la normativa
sanitaria a la que hay que añadir la de protección de datos. La legislación vigente en
nuestro país es la Ley General de Sanidad de 25 de abril de 1986 y la Ley 41/ 2002, de
14 de noviembre, reguladora de la Autonomía del Paciente y de derechos y obligaciones
en materia de información y documentación clínica. A todo ello hay que añadir las
normativas autonómicas.
La regulación en materia de protección de datos de carácter personal se constituye por la
Ley Orgánica 15/1999, de 13 de diciembre de Protección de Datos de carácter personal
(LOPD) y las normas dictadas en su desarrollo, quizás la más importante, el Real Decreto
994/1999, de 11 de junio, por el que se aprueba el Reglamento de medidas de seguridad
de los ficheros automatizados que contengan datos de carácter personal.
4.1 ¿QUÉ ES UN DATO PERSONAL?
Según el marco normativo nacional, es toda información relativa a una persona física
identificada o identificable. Además se considera cesión o comunicación de datos a toda
revelación de datos realizada a una persona distinta del interesado.
Confidencialidad, según la Real Academia Española, es lo que se hace o se dice en
confianza o con seguridad recíproca entre dos o más personas, y esta se rompe cuando
alguien confía algo a otra persona y éste le da la información a un tercero. Según nuestra
legislación la Protección de datos, ya en el Art. 18 de la Constitución Española se
contempla como derecho fundamental y se aparta de la intimidad desde el principio, pues
está concebido para proteger datos personales (sean o no íntimos). La intimidad se
quiebra cuando se obtiene información de un documento fichero.
4.2 LEY ORGÁNICA DE PROTECCIÓN DE DATOS
10 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de carácter personal
(LOPD) tiene como objetivo proteger a las personas físicas contra el tratamiento de datos
que permita la vulneración de la intimidad por asociación de datos. Obliga a distintos
niveles de seguridad según el tipo de dato, estableciendo un nivel alto para los datos en
relación con la ideología, religión, creencias, origen racial, salud o vida sexual y datos
policiales.
En la Ley se establecen los principios generales en los que se basa dicha protección, los
derechos y deberes de los usuarios de los datos y de las personas o entidades
contenidas en los mismos, la clasificación de los ficheros de datos y la constitución de la
Agencia de Protección de Datos como entidad reguladora. La LOPD se aplica cuando hay
una serie de datos organizados sobre personas y afecta tanto a ficheros de papel como
automatizados, excluyéndose ficheros de personas físicas con fines domésticos.
En este ámbito, también hay que tomar en consideración el Reglamento de Medidas de
Seguridad de los Ficheros Automatizados que contengan datos de carácter personal:
"Los ficheros que contengan datos de ideología, religión, creencias, origen racial, salud o
vida sexual, así como los que contengan datos recabados para fines policiales sin
consentimiento de las personas afectadas, deberán reunir, además de las medidas de
nivel básico y medio, las calificadas como de nivel alto―.
4.3 LEY DE INVESTIGACIÓN BIOMÉDICA
La ley 14/2007, de 3 de julio, de Investigación Biomédica presenta numerosos artículos
que afectan a las bases de datos. Caben destacar los artículos 50, 51 y 52 sobre el
acceso a datos genéticos por personal sanitario, la confidencialidad y derecho a la
protección de datos genéticos y sobre la conservación de los mismos.
En concreto el apartado 50.2.señala. "Los datos genéticos de carácter personal sólo
podrán ser utilizados con fines epidemiológicos, de salud pública, de investigación o de
docencia cuando el sujeto interesado haya prestado expresamente su consentimiento, o
cuando dichos datos hayan sido previamente anonimizados".
11 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Y el 52.3: "Fuera de estos supuestos, los datos únicamente podrán conservarse, con
fines de investigación, de forma anonimizada, sin que sea posible la identificación del
sujeto fuente".
Esta Ley entiende por anonimización: (art. 3 c) " «Anonimización»: proceso por el cual
deja de ser posible establecer por medios razonables el nexo entre un dato y el sujeto al
que se refiere. Es aplicable también a la muestra biológica" .
y por dato anonimizado: (art. 3. i): " «Dato anonimizado o irreversiblemente disociado»:
dato que no puede asociarse a una persona identificada o identificable por haberse
destruido el nexo con toda información que identifique al sujeto, o porque dicha
asociación exige un esfuerzo no razonable, entendiendo por tal el empleo de una
cantidad de tiempo, gastos y trabajo desproporcionados".
4. 4 ¿PUEDO UTILIZAR LOS DATOS DE MIS PACIENTES PARA ANALIZAR
RESULTADOS DE SALUD EN PRACTICA CLÍNICA?
En septiembre de 2012 el Instituto de Medicina de EE.UU publicó el informe ―Best
Care at Lower Cost: The Path to Continuously Learning Health Care in America‖,
donde señalaba el gran potencial que tenían para la medicina los avances
informáticos y el análisis de los datos de salud, por las mejoras que introducen en
la práctica clínica.
La búsqueda de algoritmos computerizados para tomar decisiones clínicas
proporciona resultados que llevan a elaborar guías, recomendaciones útiles y sólidas
desde el punto de vista estadístico.
Por mucha experiencia que tenga un profesional, siempre estará basada en un número
limitado de casos, mientras que la recopilación de datos facilita cierta ―objetivación‖. Se
trata de una cuestión que conecta con el debate sobre la subjetividad u objetividad en que
se ha de basar la decisión clínica.
12 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
En este sentido, hay que advertir que los métodos estadísticos no eliminan la
responsabilidad del profesional. Tampoco eliminan totalmente la incertidumbre
propia de la decisión clínica. El razonamiento médico ha de tener en cuenta los
valores, las necesidades y las prioridades de los pacientes individuales, lo cual no es una
habilidad computable.
Por lo tanto, la búsqueda de algoritmos computerizados para tomar decisiones
clínicas es una estrategia importante, pero no debe ser sobreestimada porque no
puede determinar, de antemano, una decisión particular. Lo que sí ofrece son
pautas basadas en evidencias estadísticas que aunque han de ser muy tenidas en
cuenta, en ocasiones pueden no ajustarse a los casos concretos.
4. 5 ¿PUEDO UTILIZAR LOS DATOS DE MIS PACIENTES PARA PUBLICAR
ESTUDIOS?
Como regla general, para poder utilizar los datos de pacientes para finalidades distintas a
la asistencia médica, se debe contar con el consentimiento expreso del paciente.
Es decir, se debe informar al paciente de que sus datos se van a utilizar para actividades
de investigación, docentes o científicas y éste deberá consentir. Para tener prueba de
este consentimiento se deberá solicitar por escrito.
Otra opción, y es la que prevé la Ley 41/2002, de 14 de noviembre, básica reguladora de
la Autonomía del Paciente y de derechos y obligaciones en materia de información y
documentación clínica, cuando los datos se quieran emplear para estas finalidades,
consiste en almacenar los datos identificativos del paciente separados de aquéllos de
carácter clínico-asistencial, de manera que se garantiza el anonimato de estos.
Así, se tendría una base de datos de historias clínicas que se podrían manejar para fines
científicos y que no permitirían identificar al paciente al que pertenecen.
Un aspecto, que habitualmente conduce a confusión, es la custodia y mantenimiento de
los ficheros específicos de investigación cuando la información en ellos contenida no
tiene ningún valor para el manejo clínico del paciente. Con fines de la investigación sí
13 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
parece prudente custodiar y mantener un fichero con los datos primarios durante un
periodo razonable, por posibles auditorías científicas (muy poco probables, salvo en el
caso de ensayos clínicos). Ante un fichero declarado debería pedirse autorización para su
destrucción a la Agencia Española de Protección de Datos (AEPD). Un fichero no
declarado no debería existir.
4.6 VALORACIÓN ÉTICA DE LAS BASES DE DATOS
En la valoración ética interesa distinguir entre lo que es ético y lo que es legal, pero hay
que advertir que, en general, las regulaciones y reglamentaciones aprobadas han
tenido en cuenta los requisitos éticos derivados de la protección de datos de los pacientes
y de los profesionales, aunque también se han puesto de relieve las notables
diferencias entre las distintas legislaciones nacionales sobre esta cuestión.
Hay quien considera que la explotación de los grandes datos sería, en sí misma,
éticamente neutra, como puede serlo cualquier otro tipo de metodología estadística. Sin
embargo, el uso de datos biológicos y de salud puede tener efectos tanto beneficiosos
como perjudiciales. Así, por ejemplo, la explotación de los grandes conjuntos de
datos puede llevar a comprender mejor los patrones de las enfermedades, de
modo que puede facilitar el diagnóstico o el pronóstico y tratamiento médicos, pero, al
mismo tiempo, puede dar lugar a abusos en el respeto debido a la confidencialidad de las
personas.
Se ha de promover la utilización de los datos de forma ética y responsable, que
busque el interés público y que, al mismo tiempo, concilie los intereses relevantes
de los individuos y otros grupos de personas, y respete sus derechos fundamentales.
Principios recomendados por el Nuffield Council
El principio de respeto a las personas
El principio de respeto de los derechos humanos
El principio de la participación de las personas con intereses moralmente relevantes
14 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Principios recomendados por el Nuffield Council
El principio de la responsabilidad de las decisiones
Fuente: Nuffield Council. The collection, Linking and Use of Data in Biomedical Research and Health care: Ethical Issues 2015, p.8
5. BASES DE DATOS.
BASES DE DATOS: bancos de información que contienen datos relativos a diversas
temáticas y que están categorizados de manera concreta, pero que comparten entre sí
algún tipo de vínculo o relación que busca ordenarlos y clasificarlos en su conjunto.
Las bases de datos para investigación constituyen el soporte de los estudios científicos.
De la calidad e integridad de los datos que en ella estén almacenados, dependerá en
gran medida la calidad, integridad y validez final de dichos estudios. Si los datos de
partida contienen una tasa significativa de errores o son incompletos, todo el trabajo
posterior se verá afectado. Por todo ello suele ser necesario un cierto preproceso de
estos datos, que permita almacenar y explotar la información obtenida.
Las bases de datos pueden ser de niveles diferentes en función de los objetivos que se
persiguen, desde un pequeño fichero para ordenar libros y revistas por clasificación
alfabética, hasta una compleja base que contenga datos de índole sanitario.
Recientemente, el término base de datos comenzó a utilizarse casi exclusivamente en
referencia a bases construidas a partir de software informático, que permiten una más
fácil y rápida organización de los datos. Las bases de datos informáticas pueden crearse
a partir de software o incluso de forma online usando Internet. En cualquier caso, las
funcionalidades disponibles son prácticamente ilimitadas.
El entorno tecnológico y el flujo de información en el que el mundo sanitario se encuentra
inmerso hace absolutamente necesaria el desarrollo de Bases de Datos que sumadas a
las ya existentes, potencien la estratificación, clasificación y explotación de la información
sanitaria.
5.1 CARACTERISTICAS DE UNA BASE DE DATOS
15 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Toda base de datos debe tener una serie de características básicas que garanticen su
utilidad:
➢ Seguridad (sólo personas autorizadas podrán acceder a la información).
➢ Integridad (la información se mantendrá sin pérdidas de datos).
➢ Independencia (esta característica es fundamental, ya que una buena base de
datos debería ser independiente del sistema operativo o programas que
interactúen con ella).
➢ Consistente (es decir, que la información se guarde sin duplicidades y de manera
correcta).
5.2 CLASIFICACIÓN DE BASES DE DATOS
Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto en
que se esté manejando, la utilidad de las mismas o las necesidades que satisfagan.
a. Según la variabilidad de la base de datos:
Bases de datos estáticas.
Son bases de datos únicamente de lectura, utilizadas primordialmente para almacenar
datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de
un conjunto de datos a través del tiempo, realizar proyecciones, tomar decisiones y
realizar análisis de datos para inteligencia empresarial.
Bases de datos dinámicas.
Son bases de datos donde la información almacenada se modifica con el tiempo,
permitiendo operaciones como actualización, borrado y edición de datos, además de las
operaciones fundamentales de consulta.
16 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
b. Según el contenido:
Bases de datos bibliográficas.
Sólo contienen un subrogante (representante) de la fuente primaria, que permite
localizarla. Un registro típico de una base de datos bibliográfica contiene información
sobre el autor, fecha de publicación, editorial, título, edición de una determinada
publicación, etc. Puede contener un resumen o extracto de la publicación original, pero
nunca el texto completo.
Bases de datos de texto completo.
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las
ediciones de una colección de revistas científicas.
Directorios.
Un ejemplo claro de este tipo de base de datos son las guías telefónicas en formato
electrónico.
Estos directorios se pueden clasificar en dos grandes tipos dependiendo de si son
personales o empresariales (llamadas páginas blancas o amarillas respectivamente).
Bases de datos o "bibliotecas" de información química, biológica o
médica.
Son bases de datos que almacenan diferentes tipos de información proveniente de la
química, biología o medicina. Se pueden considerar en varios subtipos:
Las que almacenan secuencias de nucleótidos o proteínas.
Las bases de datos de rutas metabólicas.
Bases de datos de estructura, comprende los registros de datos experimentales
sobre estructuras 3D de biomoléculas.
Bases de datos clínicas.
Bases de datos bibliográficas (biológicas, químicas, médicas y de otros campos).
17 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
5.3 HERRAMIENTAS INFORMÁTICAS PARA EL TRATAMIENTO DE DATOS.
SISTEMAS DE GESTIÓN DE BASES DE DATOS.
La gestión de la información obtenida debe transformarse en datos introducidos en bases
de datos, cuyo desarrollo y creación requiere de herramientas informáticas que faciliten
esta tarea y garanticen la calidad del sistema diseñado. Las principales herramientas
informáticas que se pueden utilizar para el tratamiento de los datos en investigación se
pueden clasificar en tres grupos:
✓ Hojas de Cálculo: Excel, Lotus.
✓ Programas estadísticos: SAS, EpiInfo, SPSS, STATA, Splus, Minitab,etc.
✓ Sistemas de Gestión de Bases de datos (SGBD): Access, Dbase, File
Maker, MySQL, SQL Server, Oracle, etc.
De estos tres grupos, los sistemas de gestión de bases de datos tienen una mayor
capacidad para la manipulación y relación de datos que las hojas de cálculo, permiten un
mejor acceso a los mismos y llevar a cabo consultas más complejas. Si bien es cierto que
estos sistemas requieren programas estadísticos que se aplican sobre los datos de las
tablas o consultas de las bases de datos durante el proceso de análisis de la información.
Sistemas de Gestión de Bases de Datos (SGBD)
Los Sistemas de Gestión de Base de Datos (DataBase Management System) son un tipo
de software muy específico, dedicado a servir de interfaz entre la base de datos, el
usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición de
datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta.
Los SGBD permiten generar sistemas de información: ―conjunto de datos organizados
listos y preparados para su posterior uso, generados por una necesidad‖, gracias a una
colección de datos interrelacionados y un conjunto de programas para acceder a dichos
datos.
La gestión de los datos implica, tanto la definición de estructuras para almacenar la
información, como la provisión de mecanismos para la manipulación de la información. Es
18 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
por ello que los SGBD se diseñan para gestionar grandes cantidades de información, con
un objetivo principal, proporcionar una forma de almacenar y recuperar la información de
una base de datos de manera que sea tanto práctica como eficiente.
Además, los sistemas de bases de datos deben proporcionar la fiabilidad de la
información almacenada, a pesar de las caídas del sistema o los intentos de acceso sin
autorización, permitiendo definir estructuras de almacenamiento de información y acceder
a lo datos de forma eficiente y segura.
Las características básicas de un sistema gestor de bases de datos son:
1. Independencia: Los datos se organizan independientemente de las aplicaciones
que los vayan a usar (independencia lógica) y de los ficheros en los que vayan a
almacenarse (independencia física).
2. Los usuarios y las aplicaciones pueden acceder a los datos mediante el uso de
lenguajes de consulta (p.ej. SQL, Query…).
3. Centralización: Los datos se gestionan de forma centralizada e independiente de
las aplicaciones.
4. Consistencia e integridad de los datos.
5. Fiabilidad (protección frente a fallos) y seguridad(control de acceso a los datos).
Entre los diferentes tipos de gestores de bases de datos destacan:
MySql: es una base de datos con licencia GPL basada en un servidor. Se
caracteriza por su rapidez. No es recomendable usar para grandes volúmenes de
datos.
PostGreSql y Oracle: Son sistemas de base de datos poderosos. Administra muy
bien grandes cantidades de datos, y suelen ser utilizadas en intranets y sistemas
de gran calibre.
Access: Es una base de datos desarrollada por Microsoft. Esta base de datos,
debe ser creada bajo el programa access, el cual crea un archivo .mdb.
Microsoft SQL Server: es una base de datos más potente que access desarrollada
por Microsoft. Se utiliza para manejar grandes volúmenes de informaciones.
19 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
6. CREACIÓN DE BASES DE DATOS
Una base de datos es un conjunto de datos relacionados y organizados a través de una o
más tablas.
Las tablas son las unidades básicas de almacenamiento de los datos. Normalmente, los
datos se organizan en una o varias tablas que se distribuyen en columnas,
correspondiendo cada una de ellas a una variable o campo.
Cada registro (fila) es un paciente, de modo que la tabla representa a un conjunto de
pacientes a través de un conjunto de registros. Y cada variable o campo es un dato que
se ha recogido para cada paciente (edad, fiebre, fecha, imc, etc).
La robustez y versatilidad de una base de datos esta basada en la capacidad de
relacionar tablas que incorporen información diferente. Una base de datos relacional es
aquélla que permite que diferentes tablas de datos estén relacionadas a través de un
campo o variable común:
• El uso de las relaciones es útil cuando varios registros de una tabla están vinculados
con otros registros de una o varias tablas: comparten información.
• La utilización de bases de datos relacionales evita la duplicación de registros.
6.1 PASOS PARA LA CREACIÓN DE UNA BASE DE DATOS
La clave para diseñar una base de datos eficaz radica en comprender exactamente qué
información se quiere almacenar y organizar correctamente los datos existentes.
1. Definir el objetivo y la finalidad de la base de datos:
El primer paso para la elaboración de bases de datos es analizar y desarrollar el diseño
de la misma, pensando los datos necesarios, como se va a emplear y que información se
desea obtener de la misma. ¿Qué, Cómo y Para qué?.
2. Organizar la información:
20 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Se han de recopilar todos los datos que se desean incluir en la base de datos.
Se ha de analizar y definir el tipo de información que se desea extraer a posteriori de la
base de datos, ya que así se podrán identificar los elementos que se han de incluir en la
misma. Es conveniente realizarse todas las preguntas posibles y así añadir el máximo de
elementos disponibles con el objetivo de que posteriormente esta base de datos sirva
para resolver cuestiones no definidas con antelación.
3. Estructura de una base de datos:
El tercer paso para crear bases de datos es elegir los temas principales de la base de
datos para dividir la información en tablas. Este proceso evita la duplicación de los datos
y sirve de ayuda a la hora de tener que actualizar alguno de ellos.
Una base de datos, a fin de ordenar la información de manera lógica, posee un orden que
debe ser cumplido para acceder a la información de manera coherente. Cada base de
datos contiene una o más tablas, que cumplen la función de contener los campos.
Para determinar las columnas de una tabla, se debe decidir qué información se necesita
recopilar sobre el tema que va a representar cada tabla.
4. Seleccionar el Tipo de Dato Adecuado:
Una vez identificadas todas las tablas y columnas que necesita la base de datos, se debe
determinar el tipo de dato de cada campo. Existen tres categorías principales que pueden
aplicarse prácticamente a cualquier aplicación de bases de datos: Texto, Números, Fecha
y hora.
Cada uno de éstos presenta sus propias variantes, por lo que la elección del tipo de dato
correcto no sólo influye en el tipo de información que se puede almacenar en cada
campo, sino que afecta al rendimiento global de la base de datos.
5. Normalización de las tablas:
La primera es de sentido común, evitar duplicar información para minimizar incoherencias
y errores y no malgastar espacio. La segunda premisa es que la información debe ser
completa y correcta
21 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Es necesario que al realizar la estructura de una base de datos, esta sea flexible. La
flexibilidad está en el hecho de que se puedan agregar datos al sistema posteriormente
sin tener que rescribir lo que ya se han incorporado inicialmente. Por ejemplo, si se
quisiera agregar la información de vía de administración de cada fármaco, lo único que se
deberia hacer es crear una tabla vía de administración que estuviese relacionada a la
tabla fármaco de la misma manera que la tabla dosis. Por lo tanto, no se tendría que
modificar la estructura de las tablas actuales, simplemente agregar la que hace falta.
El objetivo principal del diseño de bases de datos es generar tablas que modelan los
registros en los que se guarda la información. Es importante que esta información se
almacene sin redundancia para que se pueda tener una recuperación rápida y eficiente
de los datos.
6. Relaciones de tabla:
El concepto "relacional" significa que grupos parecidos de información son almacenados
en distintas tablas que luego pueden ser "juntadas" (relacionadas) basándose en los
datos que tengan en común. La aplicabilidad de la relación entre tablas y datos es clara:
• Una relación permite trabajar con varias tablas relacionadas a través de un campo
común o varios campos comunes.
• El objetivo de crear relaciones entre dos o más tablas es poder trabajar con ellas como
si fueran una sola.
• Al crear formularios, consultas e informes es probable que se tenga que extraer
información de más de una tabla: esto funciona mejor o es imprescindible, cuando
existe una relación entre las tablas.
• Se crean a través de Herramientas/Relaciones: primero se agregan las tablas y luego
se establecen las relaciones entre sus campos.
Aunque cada tabla almacena datos sobre un tema diferente, las tablas de una base de
datos suelen almacenar datos sobre asuntos que están relacionados entre sí. Por
ejemplo, puede que una base de datos contenga:
Una tabla de fármacos, con el código nacional, las dosis y sus vías de
administración.
22 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Una tabla de pacientes , con numero de historia clínica, nombre de paciente y
código nacional fármaco.
Una tabla de niveles de colesterol, con identificación analítica, nivel de colesterol e
identificador del paciente.
Dado que almacena datos sobre diferentes temas en tablas independientes, necesita
alguna manera de vincular los datos para que pueda combinar fácilmente datos
relacionados de esas tablas independientes. Para conectar los datos almacenados en
tablas diferentes, cree relaciones. Una relación es una conexión lógica entre dos tablas
que especifica los campos que las tablas tienen en común.
Los campos que forman parte de una relación de tabla se denominan claves.
La correspondencia de valores entre campos principales es la base de la relación de una
tabla. La relación de una tabla se puede usar para combinar datos de tablas relacionadas.
Mantener los datos separados en tablas relacionadas ofrece las siguientes ventajas:
Coherencia: Dado que cada elemento de datos se registra solo una vez en una
sola tabla, existen menos posibilidades de ambigüedad o incoherencia.
Eficacia: Registrar los datos en una sola ubicación implica el uso de menos
espacio en disco. Además, las tablas de menor tamaño tienden a proporcionar
datos más rápidamente que las de mayor tamaño.
Comprensibilidad: El diseño de una base de datos es más fácil de comprender si
los asuntos está separados en tablas de manera apropiada.
7. Creación de Formularios:
Los formularios dentro de una base de datos se utiliza para la introducción de la
información
Desde el formulario se puede modificar el contenido de un campo, borrarlo, añadir nuevos
registros, calcular campos, crear y utilizar gráficos, mostrar datos de varias tablas al
23 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
mismo tiempo. Todos los cambios que se realicen en el Formulario se ejecutaran en la
tabla relacionada.
Enlaces recomendados para el diseño de BASES DE DATOS:
Ejemplo de diseño de bases de datos relacionales:
https://www.fdi.ucm.es/profesor/fernan/MTIG_/Práct.%202.%20Diseño.pdf
Creación y diseño de una base de datos con Access
https://rua.ua.es/dspace/bitstream/10045/12769/8/Tutorial_Base_de_datos.pdf
7. EJEMPLOS DE BASES DE DATOS SANITARIAS Y SU UTILIDAD EN LA
ESTRATIFICACIÓN DE PACIENTES PARA EL ABORDAJE DE LA
CRONICIDAD.
Dado que las bases de datos pueden almacenar gran cantidad de información, permiten
su recuperación rápida, la información está organizada y puede obtenerse en distintos
formatos, se han convertido en una herramienta muy importante para la atención sanitaria
y el área de la investigación.
En España dos de las bases de datos clínicas más potentes para su aplicación en la
atención a la cronicidad y la investigación son descritas a continuación.
7.1 Base de datos de Investigación Farmacoepidemiológica en Atención Primaria -
BIFAP (www.bifap.org):
24 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
BIFAP es una base de datos informatizada de registros médicos de Atención Primaria
para la realización de estudios farmacoepidemiológicos, perteneciente a la Agencia
Española del Medicamento y Productos Sanitarios (AEMPS), y cuenta con la
colaboración de Comunidades Autónomas y el apoyo de las principales sociedades
científicas implicadas.
La Misión de BIFAP es promover la Salud Pública mediante la creación y mantenimiento
de una base de datos automatizada de ámbito nacional y base poblacional, a partir de la
información facilitada por los médicos de familia y pediatras de atención primaria del
Sistema Nacional de Salud, con el objetivo de realizar estudios farmacoepidemiológicos
orientados fundamentalmente a la evaluación de la efectividad y seguridad de los
medicamentos.
BIFAP esta especialmente comprometido en:
Proteger la confidencialidad de la información de los pacientes incluidos en la base de
datos de acuerdo con la legislación de protección de datos vigente.
Promover la colaboración de los médicos de Atención Primaria y mantener unos altos
niveles de calidad de la información y prestaciones.
Estimular la investigación de calidad desde la Asistencia Primaria de Salud,
asegurando unos altos niveles de calidad científica.
Desarrollar líneas de investigación independientes sobre aspectos relevantes para la
Comunidad científica y la Salud Pública de la población.
25 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
7.2 Conjunto mínimo básico de datos (CMBD):
Los hospitales nacionales registran desde principios de los años 1990, por normativa
ministerial, el denominado Conjunto Mínimo Básico de Datos (CMBD) de cada paciente
atendido en cada hospital del país, especialmente los de carácter público. En los últimos
años, además de los episodios de ingreso hospitalario convencional, se registran también
los episodios de Cirugía sin Ingreso y, más recientemente, los de Hospital de Día.
El CMBD contiene información muy valiosa para conocer la realidad sanitaria de una
población, ya que además de recoger los datos demográficos habituales (edad, sexo,
localidad de residencia), registra el diagnóstico que ha motivado el ingreso (diagnóstico
principal), los factores de riesgo, comorbilidades y complicaciones que presenta el
paciente durante el ingreso (diagnósticos secundarios), algunas técnicas diagnósticas
relevantes y las intervenciones terapéuticas, sobretodo de tipo quirúrgico, que han sido
utilizadas para tratar al paciente (los procedimientos). Finalmente, en el CMBD consta la
fecha de ingreso y de alta del paciente, así como su circunstancia de ingreso (urgente,
programada) y la circunstancia de alta del paciente (alta a su domicilio, defunción,
traslado a otro hospital, etc…).
Los diagnósticos y los procedimientos recogidos se codifican siguiendo la Clasificación
Internacional de Enfermedades, en su modificación clínica (CIE-9-MC). Esta codificación
es la que permite en última instancia agrupar los distintos episodios asistenciales
atendidos por un hospital en Grupos Relacionados con el Diagnóstico (GRD).
El CMBD se ha consolidado como una importante fuente de datos clínico-administrativos
para la investigación epidemiológica, así como para la planificación, gestión y evaluación
de la calidad clínico-asistencial, donde, además, su explotación mediante los sistemas de
clasificación de pacientes, como los GRD, lo convierten en una potente herramienta de
gestión dentro del sector hospitalario. Sin embargo, es importante mencionar que existe
la posibilidad de emplear el CMBD como fuente de información de otro tipo, como puede
ser la identificación de los pacientes crónicos, así como, para el análisis de las
26 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
características clínicas y epidemiológicas como son la mortalidad y el reingreso
hospitalario.
Esta base de datos se crea a través del Sistema de Información Sanitaria establecido por
la Ley de Cohesión y Calidad del Sistema Nacional de Salud, y proporciona información
sobre la actividad asistencial, las patologías atendidas, su complejidad, el abordaje clínico
y los costes que suponen. Los datos que ofrece son de carácter estadístico y sus
objetivos principales son tres:
1. Conocer la demanda asistencial y las enfermedades atendidas y favorecer los
estudios de investigación clínica, epidemiológica y de evaluación de servicios
sanitarios y resultados en salud.
2. Proporcionar a los registros autonómicos la información necesaria para la
evaluación y control de la atención prestada en el conjunto del Sistema Nacional
de Salud a sus ciudadanos.
3. Facilitar la realización de estadísticas del sector salud a nivel estatal, así como las
que deriven de compromisos con organismos oficiales internacionales, tales como
los indicadores de calidad de la OCDE o los indicadores de la Unión Europea.
La última modificación del sistema CMBD se aprobó en 2015 (Real Decreto 69/2015, de 6
de febrero, por el que se regula el Registro de Actividad de Atención Sanitaria
Especializada) y en ella, se extiende la recogida de datos a otras áreas de hospitales,
como el hospital de día, gabinetes de técnicas y procedimientos de alta complejidad y
urgencias. Por otra, se abarca el análisis de la demanda atendida en el sector privado, lo
que permitirá no sólo cubrir la información estadística, sino también conocer sus
resultados.
El sistema, además, incorpora nueva información destinada a mejorar los análisis de
calidad y seguridad de los pacientes. Entre los nuevos datos que recoge se encuentran
una serie de condiciones en el momento del ingreso hospitalario, procedencia del
paciente, determinadas circunstancias de la atención, ingresos en la UCI o aspectos de
continuidad asistencial.
Otra novedad es que se sustituye la Clasificación Internacional de Enfermedades que se
viene utilizando, la CIE 9MC, por la CIE 10 ES, de mayor alcance y especificidad, en línea
con la Organización Mundial de la Salud.
27 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
El Real Decreto garantiza la confidencialidad de los datos, la identidad del paciente
seguirá estando sometida a procesos de ―anonimización‖ y el tratamiento de los datos, a
la Ley 15/1999 de Protección de Datos de Carácter Personal.
En definitiva, con la implantación del Registro de Atención Especializada:
Se homogeneizará por primera vez toda la actividad del sector hospitalario, de
hospitalización y ambulatorio, público y privado.
Se mejorarán los análisis sobre calidad y seguridad del paciente.
Se podrán perfeccionar resultados sobre consumo de recursos y costes de los
procesos atendidos.
Las CC AA dispondrán de estadísticas sobre el flujo de pacientes entre territorios.
Será la fuente de datos más importante para la investigación epidemiológica y de
servicios sanitarios del nivel especializado.
La estructura del nuevo modelo RAE-CMBD, que tendrá una implantación paulatina entre
los años 2016 y 2018 en función de las modalidades asistenciales y titularidad de los
centros, contará con tres tipos de datos:
1. Datos de identificación del paciente
2. Datos de identificación del episodio
3. Datos clínicos
7.3 Utilidad de las bases de datos sanitarias:
La estratificación de la población en grupos de riesgo, que permita conocer y prever sus
necesidades futuras de recursos sanitarios, es un objetivo contemplado por la Sociedad
Española de Farmacia Hospitalaria (SEFH), en su plan estratégico sobre Atención
Farmacéutica del paciente crónico, definió como eje 2, la ―Orientación centrada en el
paciente: la estratificación como herramienta del nuevo modelo de atención‖ y resulta
28 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
especialmente relevante en la transformación de los modelos asistenciales (haciéndolos
más proactivos), en el tratamiento de la cronicidad (estableciendo poblaciones diana para
determinadas actuaciones) y en la integración de los niveles asistenciales.
La cuestión es que cada vez se hace más hincapié en la necesidad de proporcionar a los
pacientes una atención social y sanitaria integral e integrada, pero el análisis y la
evaluación de esta atención no se puede llevar a cabo correctamente con unos sistemas
de información fragmentados, sino que se debe hacer a partir de la integración de los
datos que contienen.
En la actualidad existen bases de datos institucionales, de las que se pueden obtener
datos diagnósticos y epidemiológicos (BIFAP, CMBD…), bases de datos de historias
clínicas, que habitualmente difieren de unas comunidades autónomas a otras y se puede
disponer de bases de datos de fabricación propia.
La base de datos para la estratificación de pacientes se fundamenta sobre un sistema de
tablas relacionadas que pivotan alrededor de la tabla de usuarios, que recoge los
principales datos del asegurado (demográficas o estado de salud, por poner dos
ejemplos).
Se puede concluir que, por el volumen de datos que integra, estas bases de datos tiene
las características de un ―big data‖ con una considerable capacidad de crecimiento y de
adaptación a nuevos requerimientos y fuentes de datos y ofrece unas enormes
posibilidades de análisis.
BIFAP
En la actualidad, se están llevando a cabo una serie de estudios de validación de la
información contenida en BIFAP. Su finalidad es asegurarse de que los datos registrados
en BIFAP se corresponden con datos reales en cuanto al diagnóstico, fecha del mismo,
medicación asociada y demás información relacionada. Del resultado de los mismos
dependerá el momento en que la base de datos entre en fase de producción. Si
finalmente BIFAP se consolida como herramienta de investigación se pondrá a
disposición del Sistema Nacional de Salud y de la comunidad científica una base de datos
integrada, para realizar estudios epidemiológicos. No es descabellado decir que BIFAP es
29 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
una base de datos única en España y que puede marcar un hito en la historia de la
investigación farmacoepidemiológica.
La epidemiología aporta en el campo farmacéutico una metodología que permite
proporcionar datos en la mayoría de las áreas de investigación y seguimiento de
fármacos. Ha resultado especialmente útil en la evaluación de las señales generadas a
través de los sistemas de farmacovigilancia. Las bases de datos informatizadas
proporcionan una gran cantidad de datos que se recogen de forma rutinaria para realizar
estudios epidemiológicos que evalúan el uso y los efectos de los medicamentos en
grandes grupos de la población general que normalmente no participan en los ensayos
clínicos durante la fase de desarrollo.
También permiten realizar estudios para ampliar el conocimiento de las enfermedades y
su historia natural. El uso de las bases de datos informatizadas en farmacoepidemiología
es un campo con gran potencial de crecimiento. Este tipo de estudios permite alcanzar
varios objetivos de salud pública: ampliar y enfocar el desarrollo de nuevos
medicamentos para enfermedades cuyo tratamiento actual sea inexistente o mejorable y
lograr un uso óptimo y seguro en la población general de los medicamentos ya
comercializados
Como ejemplo, en la actualidad, a partir de la BIFAP se está evaluando el efecto de los
diferentes tratamientos antidiabéticos orales en la evolución de los pacientes crónicos.
CMBD
Recientemente se ha recurrido a la utilización de la base de datos CMBD (Conjunto
Mínimo Básico de Datos) gestionada por el Ministerio de Sanidad y Consumo y que reúne
los datos de alta hospitalaria de la mayor parte de los hospitales públicos del país, para
identificar casos de coagulación intravascular diseminada postparto y los hospitales
donde ocurrieron. De este modo se pudo realizar un estudio de casos y controles, para
evaluar la asociación de dinoprostona con este trastorno, de una forma más eficiente a lo
que habría sido un puro estudio de campo de base hospitalaria. La extracción de los
datos de la enfermedad para su validación posterior, así como de la exposición a
30 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
medicamentos y posibles factores de confusión y modificadores de efecto, se realizó, no
obstante, a través de la propia historia clínica en papel.
La base de datos CMBD se utiliza profusamente para la evaluación de la gestión
sanitaria, pero ha sido escasamente utilizada hasta ahora con fines de investigación
etiológica en general y en farmacoepidemiología en particular. Entre las razones que se
pueden dar para ello se encuentran las dificultades impuestas por la Ley Orgánica de
Protección de Datos para acceder a la identificación de los pacientes sin la cual es
imposible el acceso a la historia clínica, ni a su conexión con otras posibles fuentes de
información.
Un ejemplo de estratificación es el trabajo de Orueta y colaboradores que con el objetivo
de estratificar la población se empleó el Conjunto Mínimo Básico de datos (CMBD) de
hospitales y datos extraídos de las historias clínicas informatizadas (HCI) de atención
primaria. El modelo de está organizado en episodios de atención. Cada episodio incluye
un diagnóstico, registrado como texto libre, y su correspondiente código CIE-9-MC,
introducido por los clínicos cuando establecen o modifican el diagnóstico.
Para clasificar a los pacientes se utilizaron: edad, sexo, códigos CIE-9-MC de los
diagnósticos, códigos ATC de los fármacos prescritos, necesidad de tratamiento crónico
con diálisis y número de hospitalizaciones durante los 12 meses observados. Se
consideraron diagnósticos de atención primaria los de los episodios donde algún médico
realizó alguna anotación. Las prescripciones corresponden a los formularios que al efecto
se cumplimentaron. Los diagnósticos de hospital comprenden tanto los principales como
los secundarios.
Para la categorización prospectiva de la población se empleo el sistema Johns Hopkins
Adjusted Clinical Groups Predictive Model (ACG-PM).
Este trabajo plantea las ventajas de la utilización combinada de diferentes fuentes de
información para la estratificación de pacientes crónicos con distinta carga de
comorbilidad.
31 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
8. REPRESENTACIÓN GRÁFICA DE DATOS APLICADA A LA EXPLOTACIÓN DE
DATOS SANITARIOS.
Una vez que los datos han sido recogidos y registrados en la base de datos, comienza el
procesamiento de estos. Este procesamiento contempla el uso de programas
estadísticos.
La realización de los estudios clínicos-epidemiológicos implica finalmente emitir unos
resultados cuantificables de dicho estudio. La claridad en la representación de estos
resultados es vital para la interpretación de los mismos.
Cuando se dispone de datos de una población, y antes de abordar análisis estadísticos
más complejos, un primer paso consiste en presentar esa información de forma que ésta
se pueda visualizar de una manera más sistemática y resumida.
Los datos que interesan dependen, en cada caso, del tipo de variables que se manejen.
Para variables categóricas, como el sexo, estadio, profesión, etc., se quiere conocer la
frecuencia y el porcentaje del total de casos de cada categoría. Una forma muy sencilla
de representar gráficamente estos resultados es mediante diagramas de barras o
diagramas de sectores. En los gráficos de sectores, también conocidos como diagramas
de "tartas", se divide un círculo en tantas porciones como clases tenga la variable, de
modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia
absoluta o relativa.
Como se puede observar en la gráfica siguiente, la información que se debe mostrar en
cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje
del total que estos representan. Si el número de categorías es excesivamente grande, la
imagen proporcionada por el gráfico de sectores no es lo suficientemente clara, por lo que
se considera ideal cuando se disponen de 3 a 6 categorías.
32 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Los diagramas de barras son similares a los gráficos de sectores. Se representan tantas
barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea
proporcional a la frecuencia o porcentaje de casos en cada clase .
Estos mismos gráficos pueden utilizarse también para describir variables numéricas
discretas que toman pocos valores (número de hijos, número de recidivas, etc.).
33 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Para variables numéricas continuas, tales como la edad, la tensión arterial o el índice de
masa corporal, el tipo de gráfico más utilizado es el histograma.
Para construir un gráfico de este tipo, se divide el rango de valores de la variable en
intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a
este segmento como base. El criterio para calcular la altura de cada rectángulo es el de
mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en
cada intervalo y el área de los rectángulos.
Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene
una imagen que se llama polígono de frecuencias. Dicha figura pretende mostrar, de la
forma más simple, en qué rangos se encuentra la mayor parte de los datos.
Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el
concepto de percentiles, mediante diagramas de cajas.
34 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
La caja central indica el rango en el que se concentra el 50% central de los datos. Sus
extremos son, por lo tanto, el 1er y 3er cuartil de la distribución. La línea central en la caja
es la mediana. De este modo, si la variable es simétrica, dicha línea se encontrará en el
centro de la caja. Los extremos de los "bigotes" que salen de la caja son los valores que
delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores
extremos de la distribución. Se suelen también representar aquellas observaciones que
caen fuera de este rango (atípicos o valores extremos). Esto resulta especialmente útil
para comprobar, gráficamente, posibles errores en los datos. En general, los diagramas
de cajas resultan más apropiados para representar variables que presenten una gran
desviación de la distribución normal.
Cuando se quieren comparar las observaciones tomadas en dos o más grupos de
individuos una vez más el método estadístico a utilizar, así como los gráficos apropiados
para visualizar esa relación, dependen del tipo de variables que se esten manejando.
35 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
Cuando se trabaja con dos variables cualitativas se puede seguir empleando gráficos de
barras o de sectores.
9. BIBLIOGRAFIA
• Andérez, A.: Aspectos Legales de la Historia Clínica Informatizada. V Informe Seis
2003. SEIS. 2003.
• Bachman, Charles W. «The programmer as navigator» (en inglés).
http://assets.mheducation.es/bcv/guide/capitulo/8448148797.pdf
• Constitución Española 1978
• Dan Riskin, The Next Revolution in Healthcare en Forbes. 1 de octubre de 2012.
www.forbes.com/sites/singularity/2012/10/01/the-next-revolution-in-healthcare/
• Decreto número 34/1999, de 26 de mayo, por el que se crea el Registro Regional del
Conjunto Mínimo Básico de Datos del Alta Hospitalaria.
• Diego Macías Saint-Gerons, Cesar de la Fuente Honrubia, Fernando de Andres-
Trelles, Ferran Catala Lopez. Prevencion primaria de las enfermedades
cardiovasculares con estatinas en pacientes con diabetes. Med Clin (Barc).
2015;144(6):282-287.
36 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS
• Enciclopedia de Clasificaciones. (2016). Tipos de base de datos. Recuperado de:
http://www.tiposde.org/informatica/139-tipos-de-base-de-datos/ (Consultado Agosto
2016)
• Garbayo, J.A., Sanz, J., Carnicero, J. y Sánchez, C.: La seguridad, confidencialidad y
disponibilidad de la información clínica. V Informe Seis 2003. SEIS. 2003.
• Institute of Medicine (2012). ―Best Care at Lower Cost: The Path to Continuously
Learning Health Care in America.‖ Smith M,Saunders R, Stuckhardt L y McGinnis JM
(editores). Washington, D.C. The National Academies Press. Disponible en:
www.iom.edu/Reports/2012/Best-Care-at-Lower-Cost-The-Path-to-Continuously-
Learning-Health-Care-in-America.aspx
• CKusnetzky, Dan. What is "Big Data?". ZDNet.
http://blogs.zdnet.com/virtualization/?p=1708
• Ley General de Sanidad 14/ 1986, de 25 de abril. Boletín Oficial del Estado de 29 de
abril de 1986, núm. 102.
• Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de carácter
personal. Boletín Oficial del Estado de 14 de diciembre de 1999, núm. 298.
• Ley 41/2002, de 14 de noviembre, básica reguladora de la Autonomía del Paciente y
de derechos y obligaciones en materia de información y documentación clínica. Boletín
Oficial del Estado de 15 de noviembre de 2002, núm. 214..
• Ley 14/2007, de 3 de julio, de Investigación biomédica.
• Orueta,Juan F., Mateos Del Pino,Maider, Barrio Beraza,Irantzu, Nuño Solinis,Roberto
Estratificación de la población en el País Vasco: resultados en el primer año de
implantaciónAtención Primaria 2013;45:54-60
• Real Decreto 994/1999, de 11 de junio, por el que se aprueba el Reglamento de
medidas de seguridad de los ficheros automatizados que contengan datos de carácter
personal. Boletín Oficial del Estado de 25 de junio de 1999, núm. 151