DISEÑO Y MANEJO DE BASES DE DATOS...

36
DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS Dr. Raúl Ferrando Piqueres. Sergio García Muñoz Hospital General Universitario de Castellón

Transcript of DISEÑO Y MANEJO DE BASES DE DATOS...

DISEÑO Y MANEJO DE BASES DE

DATOS SANITARIOS

Dr. Raúl Ferrando Piqueres.

Sergio García Muñoz

Hospital General Universitario de Castellón

2 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

ÍNDICE

1. Resumen

2. Introducción

3. Objetivos.

4. Marco legal de la explotación de datos sanitarios. Confidencialidad.

4.1. ¿Qué es un dato personal?

4.2. Ley orgánica de protección de datos

4.3. Ley de investigación biomédica

4.4. ¿Puedo utilizar los datos de mis pacientes para analizar resultados de salud

en practica clínica?

4.5. ¿Puedo utilizar los datos de mis pacientes para publicar estudios?

4.6. Valoración ética de las bases de datos

5. Bases de datos.

5.1. Características de una base de datos

5.2. Clasificación de bases de datos

5.3. Herramientas informáticas para el tratamiento de datos. sistemas de gestión

de bases de datos

6. Creación de bases de datos.

6.1. Pasos para la creación de una base de datos

7. Ejemplos de bases de datos sanitarias y su utilidad en la estratificación de

pacientes para el abordaje de la cronicidad.

7.1. Base de datos de investigación farmacoepidemiológica en atención primaria –

BIFAP

7.2. Conjunto mínimo básico de datos (CMBD)

7.3. Utilidad de las bases de datos sanitarias

8. Representación gráfica de datos aplicada a la explotación de datos sanitarios.

9. Bibliografía.

3 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

1. RESUMEN

La información es el recurso más importante para cualquier organización incluida la

sanitaria, ya que con esta información se pueden controlar procesos, hacer estudios y

mejorar la atención a los pacientes.

Una Base de Datos es un conjunto exhaustivo, no redundante, de datos estructurados y

organizados independientemente de su utilización.

Es importante saber utilizar una base de datos al ser una ayuda para el almacenamiento

de datos cruciales para la gestión de la información sanitaria, evitando la redundancia de

los mismos y permitiendo un movimiento mucho mas eficaz y rápido entre la información

disponible, por medio de tablas, claves y relaciones.

En definitiva, el diseño de una base de datos consiste en definir la estructura de los datos

que debe tener un sistema de información determinado. En el caso relacional, esta

estructura será un conjunto de esquemas de relación con sus atributos, claves primarias,

etc

A su vez, un sistema gestor de bases de datos (SGBD) consiste en una colección de

datos interrelacionados y un conjunto de programas para acceder a dichos datos. La

colección de datos, normalmente denominada base de datos, contiene información

relevante para una organización. El objetivo principal de un SGBD es proporcionar una

forma de almacenar y recuperar la información de una base de datos de manera que sea

tanto práctica como eficiente

En este capítulo se presenta una breve introducción a los principios de los sistemas de

bases de datos y su posible utilidad en la atención de pacientes crónicos.

4 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

2. INTRODUCCIÓN

La actividad sanitaria genera un gran volumen de información, tanto clínica del paciente,

como propia de su funcionamiento; datos que muchas veces no están disponibles para su

interpretación en el momento en el que se requieren para ser explotados, ya sea por que

se ha utilizado una metodología errónea de recopilación o un sistema de procesamiento

muy variado, al utilizarse multitud y muy distintos programas informáticos, cuya capacidad

de integrarse entre sí es muy limitada.

El cada vez más de moda ―Big data‖ (grandes volúmenes de datos) se refiere al conjunto

de datos e información tan grandes y tan complejos que hace muy difícil su

procesamiento utilizando herramientas de gestión de bases de datos convencionales.

No hay duda, éste es el futuro de los sistemas sanitarios y el análisis de la salud de

nuestros pacientes, según ha publicado la prestigiosa revista Forbes: ―los big data

representan una oportunidad para los innovadores y todos los que se preocupan por la

salud, aumentan substancialmente la posibilidad de obtener información más efectiva de

los datos y menores tasas de mortalidad de los pacientes”.

Las necesidades actuales de información a partir de los datos existentes que garanticen

una correcta toma de decisiones, ya sea para el conocimiento del propio sistema, manejo

de datos epidemiológicos, explotación de datos clínicos o su propia organización

administrativa, hace necesario tener un conocimiento mínimo del papel de la informática

en estos ámbitos.

La National Library of Medicine (NLM),define a la Informática Médica como: ―El campo de

las ciencias de la información que se ocupa del análisis y diseminación de los datos

médicos, a través de aplicar la informática a varios aspectos del cuidado de la salud y la

medicina‖

La Informática Médica es una especialidad interdisciplinaria que se alimenta y relaciona

con diferentes áreas de la investigación, educación médica, práctica clínica, ciencias de la

información e informática.

5 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Los cuatro pilares en los que se basa la Informática Médica para el manejo de la

información sanitaria son:

➢ Producir estructuras para representar datos.

➢ Desarrollar métodos para una correcta y ordenada adquisición y representación de

los datos.

➢ Manejar el cambio entre los procesos y las personas involucradas para optimizar

el uso de la información.

➢ Integrar la información de diferentes fuentes.

Para evolucionar en el desarrollo de estos cuatro pilares es necesario definir previamente

una seria de conceptos que garanticen un óptimo resultado de la gestión de la

información:

DATO: representación simbólica de alguna situación o conocimiento, sin ningún sentido

semántico, describiendo situaciones y hechos sin transmitir mensaje alguno. Puede ser

un número, una letra o un hecho. (ejemplo: cualquier formulario que rellenamos, la

historia clínica, diagnóstico, etc…)

INFORMACIÓN: conjunto de datos, los cuales son adecuadamente procesados, para que

de esta manera, puedan proveer un mensaje que contribuya a la toma de decisión a la

hora de resolver un problema, además de incrementar el conocimiento, en los usuarios

que tienen acceso a dicha información (ejemplo: los grupos de edad con un diagnóstico

determinado, individuos con un riesgo determinado, grupos de edad según determinado

diagnóstico, etc…).

Estos datos que han sido sometidos a un proceso, que han sido clasificados, ordenados

sintetizados y/o asociados, y que nos permiten concluir algo, son transformados en

información útil para la mejora del sistemas sanitarios.

6 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

El modelo informático de salud consta de tres partes esenciales: datos, información y

conocimiento. Estos elementos ordenados en una jerarquía, en la que los datos se

encuentran en la base del modelo, una vez ordenados, producen información pudiendo

llegar a la potencial generación de conocimiento. Este modelo informático se acerca

mucho a los objetivos de la medicina basada en la evidencia (MBE).

El análisis de los datos permite evaluar una situación o proceso, implementar actuaciones

de mejora que posteriormente serán reevaluadas para valorar su eficacia.

En los últimos años se ha observado un incremento de la prevalencia de enfermedades

crónicas debido, en parte, al incremento de la esperanza de vida, al envejecimiento de la

población y a la mejora de la atención sanitaria. Estos factores también han propiciado la

aparición de pacientes con un elevado número de patologías concomitantes, con un

DATOS —> INFORMACIÓN —> CONOCIMIENTO —> ACCIONES DE MEJORA —> DATOS—> INFORMACIÓN—> REEVALUACIÓN

7 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

elevado riesgo de descompensación y con un elevado número de medicamentos

destinados a su tratamiento. Estos pacientes representan un porcentaje cada vez más

significativo del total de la población, y realizan una elevada utilización de los recursos

sanitarios. De hecho, se puede afirmar que, con respecto a los pacientes crónicos, la

multimorbilidad es la norma, no la excepción.

Atendiendo a estas circunstancias, la estratificación de la población en grupos de riesgo,

que permita conocer y prever las necesidades futuras de recursos sanitarios, resulta

especialmente relevante en la transformación de los modelos asistenciales (haciéndolos

más proactivos), en el tratamiento de la cronicidad (estableciendo poblaciones diana para

determinadas actuaciones) y en la integración de los niveles asistenciales, tanto

sanitarios como sociales.

La Sociedad Española de Farmacia Hospitalaria (SEFH), en su plan estratégico sobre

Atención Farmacéutica del paciente crónico, definió como eje 2, la ―Orientación centrada

en el paciente: la estratificación como herramienta del nuevo modelo de atención‖,

constituyendo un marco esencial para avanzar en una mejor atención a los pacientes

crónicos desde la posición del farmacéutico especialista en Farmacia Hospitalaria y para

el desarrollo de futuras actuaciones en este sentido

En resumen, la estratificación puede ser una herramienta útil en varios procesos, con

objetivos tan diversos como la mejora de la calidad asistencial, la eficacia y la eficiencia

del sistema sanitario, la detección y disminución de la variabilidad de la práctica clínica, la

8 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

mejora de las técnicas de evaluación y, en definitiva, para la toma de decisiones, tanto a

nivel micro como macro.

Un elemento fundamental para poder llevar a cabo la estratificación de la población por

grupos de riesgo son los sistemas de información. Es necesario, pues, disponer de una

base de datos que integre la información recogida en los diferentes registros sanitarios y

de respuesta a esta demanda.

La cuestión es que cada vez se hace más hincapié en la necesidad de proporcionar a los

pacientes una atención social y sanitaria integral e integrada, pero el análisis y la

evaluación de esta atención no se puede llevar a cabo correctamente con unos sistemas

de información fragmentados, sino que se debe hacer a partir de la integración de los

datos que contienen.

3. OBJETIVOS

El principal objetivo de este módulo es adquirir las nociones básicas sobre la importancia

de las Bases de Datos sanitarias destinadas a la organización de la documentación

clínica obtenida en el paciente crónico (conceptos, diseño, explotación, representación de

datos).

Para ello se ha de tener en cuenta la legislación sanitaria aplicada a la confidencialidad

de los datos, que de validez y seguridad a las herramientas diseñadas para explotar la

información sanitaria, así como las connotaciones éticas derivadas de la utilización de

datos clínicos de pacientes.

Como complemento a la información aportada también se presentarán bases de datos

relacionadas con el ámbito sanitario y su potencial utilidad en la estratificación de los

pacientes crónicos.

9 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

4. MARCO LEGAL DE LA EXPLOTACIÓN DE DATOS SANITARIOS.

CONFIDENCIALIDAD

La normativa que vincula la salvaguarda de la información sanitaria es doble, la normativa

sanitaria a la que hay que añadir la de protección de datos. La legislación vigente en

nuestro país es la Ley General de Sanidad de 25 de abril de 1986 y la Ley 41/ 2002, de

14 de noviembre, reguladora de la Autonomía del Paciente y de derechos y obligaciones

en materia de información y documentación clínica. A todo ello hay que añadir las

normativas autonómicas.

La regulación en materia de protección de datos de carácter personal se constituye por la

Ley Orgánica 15/1999, de 13 de diciembre de Protección de Datos de carácter personal

(LOPD) y las normas dictadas en su desarrollo, quizás la más importante, el Real Decreto

994/1999, de 11 de junio, por el que se aprueba el Reglamento de medidas de seguridad

de los ficheros automatizados que contengan datos de carácter personal.

4.1 ¿QUÉ ES UN DATO PERSONAL?

Según el marco normativo nacional, es toda información relativa a una persona física

identificada o identificable. Además se considera cesión o comunicación de datos a toda

revelación de datos realizada a una persona distinta del interesado.

Confidencialidad, según la Real Academia Española, es lo que se hace o se dice en

confianza o con seguridad recíproca entre dos o más personas, y esta se rompe cuando

alguien confía algo a otra persona y éste le da la información a un tercero. Según nuestra

legislación la Protección de datos, ya en el Art. 18 de la Constitución Española se

contempla como derecho fundamental y se aparta de la intimidad desde el principio, pues

está concebido para proteger datos personales (sean o no íntimos). La intimidad se

quiebra cuando se obtiene información de un documento fichero.

4.2 LEY ORGÁNICA DE PROTECCIÓN DE DATOS

10 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de carácter personal

(LOPD) tiene como objetivo proteger a las personas físicas contra el tratamiento de datos

que permita la vulneración de la intimidad por asociación de datos. Obliga a distintos

niveles de seguridad según el tipo de dato, estableciendo un nivel alto para los datos en

relación con la ideología, religión, creencias, origen racial, salud o vida sexual y datos

policiales.

En la Ley se establecen los principios generales en los que se basa dicha protección, los

derechos y deberes de los usuarios de los datos y de las personas o entidades

contenidas en los mismos, la clasificación de los ficheros de datos y la constitución de la

Agencia de Protección de Datos como entidad reguladora. La LOPD se aplica cuando hay

una serie de datos organizados sobre personas y afecta tanto a ficheros de papel como

automatizados, excluyéndose ficheros de personas físicas con fines domésticos.

En este ámbito, también hay que tomar en consideración el Reglamento de Medidas de

Seguridad de los Ficheros Automatizados que contengan datos de carácter personal:

"Los ficheros que contengan datos de ideología, religión, creencias, origen racial, salud o

vida sexual, así como los que contengan datos recabados para fines policiales sin

consentimiento de las personas afectadas, deberán reunir, además de las medidas de

nivel básico y medio, las calificadas como de nivel alto―.

4.3 LEY DE INVESTIGACIÓN BIOMÉDICA

La ley 14/2007, de 3 de julio, de Investigación Biomédica presenta numerosos artículos

que afectan a las bases de datos. Caben destacar los artículos 50, 51 y 52 sobre el

acceso a datos genéticos por personal sanitario, la confidencialidad y derecho a la

protección de datos genéticos y sobre la conservación de los mismos.

En concreto el apartado 50.2.señala. "Los datos genéticos de carácter personal sólo

podrán ser utilizados con fines epidemiológicos, de salud pública, de investigación o de

docencia cuando el sujeto interesado haya prestado expresamente su consentimiento, o

cuando dichos datos hayan sido previamente anonimizados".

11 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Y el 52.3: "Fuera de estos supuestos, los datos únicamente podrán conservarse, con

fines de investigación, de forma anonimizada, sin que sea posible la identificación del

sujeto fuente".

Esta Ley entiende por anonimización: (art. 3 c) " «Anonimización»: proceso por el cual

deja de ser posible establecer por medios razonables el nexo entre un dato y el sujeto al

que se refiere. Es aplicable también a la muestra biológica" .

y por dato anonimizado: (art. 3. i): " «Dato anonimizado o irreversiblemente disociado»:

dato que no puede asociarse a una persona identificada o identificable por haberse

destruido el nexo con toda información que identifique al sujeto, o porque dicha

asociación exige un esfuerzo no razonable, entendiendo por tal el empleo de una

cantidad de tiempo, gastos y trabajo desproporcionados".

4. 4 ¿PUEDO UTILIZAR LOS DATOS DE MIS PACIENTES PARA ANALIZAR

RESULTADOS DE SALUD EN PRACTICA CLÍNICA?

En septiembre de 2012 el Instituto de Medicina de EE.UU publicó el informe ―Best

Care at Lower Cost: The Path to Continuously Learning Health Care in America‖,

donde señalaba el gran potencial que tenían para la medicina los avances

informáticos y el análisis de los datos de salud, por las mejoras que introducen en

la práctica clínica.

La búsqueda de algoritmos computerizados para tomar decisiones clínicas

proporciona resultados que llevan a elaborar guías, recomendaciones útiles y sólidas

desde el punto de vista estadístico.

Por mucha experiencia que tenga un profesional, siempre estará basada en un número

limitado de casos, mientras que la recopilación de datos facilita cierta ―objetivación‖. Se

trata de una cuestión que conecta con el debate sobre la subjetividad u objetividad en que

se ha de basar la decisión clínica.

12 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

En este sentido, hay que advertir que los métodos estadísticos no eliminan la

responsabilidad del profesional. Tampoco eliminan totalmente la incertidumbre

propia de la decisión clínica. El razonamiento médico ha de tener en cuenta los

valores, las necesidades y las prioridades de los pacientes individuales, lo cual no es una

habilidad computable.

Por lo tanto, la búsqueda de algoritmos computerizados para tomar decisiones

clínicas es una estrategia importante, pero no debe ser sobreestimada porque no

puede determinar, de antemano, una decisión particular. Lo que sí ofrece son

pautas basadas en evidencias estadísticas que aunque han de ser muy tenidas en

cuenta, en ocasiones pueden no ajustarse a los casos concretos.

4. 5 ¿PUEDO UTILIZAR LOS DATOS DE MIS PACIENTES PARA PUBLICAR

ESTUDIOS?

Como regla general, para poder utilizar los datos de pacientes para finalidades distintas a

la asistencia médica, se debe contar con el consentimiento expreso del paciente.

Es decir, se debe informar al paciente de que sus datos se van a utilizar para actividades

de investigación, docentes o científicas y éste deberá consentir. Para tener prueba de

este consentimiento se deberá solicitar por escrito.

Otra opción, y es la que prevé la Ley 41/2002, de 14 de noviembre, básica reguladora de

la Autonomía del Paciente y de derechos y obligaciones en materia de información y

documentación clínica, cuando los datos se quieran emplear para estas finalidades,

consiste en almacenar los datos identificativos del paciente separados de aquéllos de

carácter clínico-asistencial, de manera que se garantiza el anonimato de estos.

Así, se tendría una base de datos de historias clínicas que se podrían manejar para fines

científicos y que no permitirían identificar al paciente al que pertenecen.

Un aspecto, que habitualmente conduce a confusión, es la custodia y mantenimiento de

los ficheros específicos de investigación cuando la información en ellos contenida no

tiene ningún valor para el manejo clínico del paciente. Con fines de la investigación sí

13 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

parece prudente custodiar y mantener un fichero con los datos primarios durante un

periodo razonable, por posibles auditorías científicas (muy poco probables, salvo en el

caso de ensayos clínicos). Ante un fichero declarado debería pedirse autorización para su

destrucción a la Agencia Española de Protección de Datos (AEPD). Un fichero no

declarado no debería existir.

4.6 VALORACIÓN ÉTICA DE LAS BASES DE DATOS

En la valoración ética interesa distinguir entre lo que es ético y lo que es legal, pero hay

que advertir que, en general, las regulaciones y reglamentaciones aprobadas han

tenido en cuenta los requisitos éticos derivados de la protección de datos de los pacientes

y de los profesionales, aunque también se han puesto de relieve las notables

diferencias entre las distintas legislaciones nacionales sobre esta cuestión.

Hay quien considera que la explotación de los grandes datos sería, en sí misma,

éticamente neutra, como puede serlo cualquier otro tipo de metodología estadística. Sin

embargo, el uso de datos biológicos y de salud puede tener efectos tanto beneficiosos

como perjudiciales. Así, por ejemplo, la explotación de los grandes conjuntos de

datos puede llevar a comprender mejor los patrones de las enfermedades, de

modo que puede facilitar el diagnóstico o el pronóstico y tratamiento médicos, pero, al

mismo tiempo, puede dar lugar a abusos en el respeto debido a la confidencialidad de las

personas.

Se ha de promover la utilización de los datos de forma ética y responsable, que

busque el interés público y que, al mismo tiempo, concilie los intereses relevantes

de los individuos y otros grupos de personas, y respete sus derechos fundamentales.

Principios recomendados por el Nuffield Council

El principio de respeto a las personas

El principio de respeto de los derechos humanos

El principio de la participación de las personas con intereses moralmente relevantes

14 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Principios recomendados por el Nuffield Council

El principio de la responsabilidad de las decisiones

Fuente: Nuffield Council. The collection, Linking and Use of Data in Biomedical Research and Health care: Ethical Issues 2015, p.8

5. BASES DE DATOS.

BASES DE DATOS: bancos de información que contienen datos relativos a diversas

temáticas y que están categorizados de manera concreta, pero que comparten entre sí

algún tipo de vínculo o relación que busca ordenarlos y clasificarlos en su conjunto.

Las bases de datos para investigación constituyen el soporte de los estudios científicos.

De la calidad e integridad de los datos que en ella estén almacenados, dependerá en

gran medida la calidad, integridad y validez final de dichos estudios. Si los datos de

partida contienen una tasa significativa de errores o son incompletos, todo el trabajo

posterior se verá afectado. Por todo ello suele ser necesario un cierto preproceso de

estos datos, que permita almacenar y explotar la información obtenida.

Las bases de datos pueden ser de niveles diferentes en función de los objetivos que se

persiguen, desde un pequeño fichero para ordenar libros y revistas por clasificación

alfabética, hasta una compleja base que contenga datos de índole sanitario.

Recientemente, el término base de datos comenzó a utilizarse casi exclusivamente en

referencia a bases construidas a partir de software informático, que permiten una más

fácil y rápida organización de los datos. Las bases de datos informáticas pueden crearse

a partir de software o incluso de forma online usando Internet. En cualquier caso, las

funcionalidades disponibles son prácticamente ilimitadas.

El entorno tecnológico y el flujo de información en el que el mundo sanitario se encuentra

inmerso hace absolutamente necesaria el desarrollo de Bases de Datos que sumadas a

las ya existentes, potencien la estratificación, clasificación y explotación de la información

sanitaria.

5.1 CARACTERISTICAS DE UNA BASE DE DATOS

15 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Toda base de datos debe tener una serie de características básicas que garanticen su

utilidad:

➢ Seguridad (sólo personas autorizadas podrán acceder a la información).

➢ Integridad (la información se mantendrá sin pérdidas de datos).

➢ Independencia (esta característica es fundamental, ya que una buena base de

datos debería ser independiente del sistema operativo o programas que

interactúen con ella).

➢ Consistente (es decir, que la información se guarde sin duplicidades y de manera

correcta).

5.2 CLASIFICACIÓN DE BASES DE DATOS

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al contexto en

que se esté manejando, la utilidad de las mismas o las necesidades que satisfagan.

a. Según la variabilidad de la base de datos:

Bases de datos estáticas.

Son bases de datos únicamente de lectura, utilizadas primordialmente para almacenar

datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de

un conjunto de datos a través del tiempo, realizar proyecciones, tomar decisiones y

realizar análisis de datos para inteligencia empresarial.

Bases de datos dinámicas.

Son bases de datos donde la información almacenada se modifica con el tiempo,

permitiendo operaciones como actualización, borrado y edición de datos, además de las

operaciones fundamentales de consulta.

16 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

b. Según el contenido:

Bases de datos bibliográficas.

Sólo contienen un subrogante (representante) de la fuente primaria, que permite

localizarla. Un registro típico de una base de datos bibliográfica contiene información

sobre el autor, fecha de publicación, editorial, título, edición de una determinada

publicación, etc. Puede contener un resumen o extracto de la publicación original, pero

nunca el texto completo.

Bases de datos de texto completo.

Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las

ediciones de una colección de revistas científicas.

Directorios.

Un ejemplo claro de este tipo de base de datos son las guías telefónicas en formato

electrónico.

Estos directorios se pueden clasificar en dos grandes tipos dependiendo de si son

personales o empresariales (llamadas páginas blancas o amarillas respectivamente).

Bases de datos o "bibliotecas" de información química, biológica o

médica.

Son bases de datos que almacenan diferentes tipos de información proveniente de la

química, biología o medicina. Se pueden considerar en varios subtipos:

Las que almacenan secuencias de nucleótidos o proteínas.

Las bases de datos de rutas metabólicas.

Bases de datos de estructura, comprende los registros de datos experimentales

sobre estructuras 3D de biomoléculas.

Bases de datos clínicas.

Bases de datos bibliográficas (biológicas, químicas, médicas y de otros campos).

17 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

5.3 HERRAMIENTAS INFORMÁTICAS PARA EL TRATAMIENTO DE DATOS.

SISTEMAS DE GESTIÓN DE BASES DE DATOS.

La gestión de la información obtenida debe transformarse en datos introducidos en bases

de datos, cuyo desarrollo y creación requiere de herramientas informáticas que faciliten

esta tarea y garanticen la calidad del sistema diseñado. Las principales herramientas

informáticas que se pueden utilizar para el tratamiento de los datos en investigación se

pueden clasificar en tres grupos:

✓ Hojas de Cálculo: Excel, Lotus.

✓ Programas estadísticos: SAS, EpiInfo, SPSS, STATA, Splus, Minitab,etc.

✓ Sistemas de Gestión de Bases de datos (SGBD): Access, Dbase, File

Maker, MySQL, SQL Server, Oracle, etc.

De estos tres grupos, los sistemas de gestión de bases de datos tienen una mayor

capacidad para la manipulación y relación de datos que las hojas de cálculo, permiten un

mejor acceso a los mismos y llevar a cabo consultas más complejas. Si bien es cierto que

estos sistemas requieren programas estadísticos que se aplican sobre los datos de las

tablas o consultas de las bases de datos durante el proceso de análisis de la información.

Sistemas de Gestión de Bases de Datos (SGBD)

Los Sistemas de Gestión de Base de Datos (DataBase Management System) son un tipo

de software muy específico, dedicado a servir de interfaz entre la base de datos, el

usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición de

datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta.

Los SGBD permiten generar sistemas de información: ―conjunto de datos organizados

listos y preparados para su posterior uso, generados por una necesidad‖, gracias a una

colección de datos interrelacionados y un conjunto de programas para acceder a dichos

datos.

La gestión de los datos implica, tanto la definición de estructuras para almacenar la

información, como la provisión de mecanismos para la manipulación de la información. Es

18 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

por ello que los SGBD se diseñan para gestionar grandes cantidades de información, con

un objetivo principal, proporcionar una forma de almacenar y recuperar la información de

una base de datos de manera que sea tanto práctica como eficiente.

Además, los sistemas de bases de datos deben proporcionar la fiabilidad de la

información almacenada, a pesar de las caídas del sistema o los intentos de acceso sin

autorización, permitiendo definir estructuras de almacenamiento de información y acceder

a lo datos de forma eficiente y segura.

Las características básicas de un sistema gestor de bases de datos son:

1. Independencia: Los datos se organizan independientemente de las aplicaciones

que los vayan a usar (independencia lógica) y de los ficheros en los que vayan a

almacenarse (independencia física).

2. Los usuarios y las aplicaciones pueden acceder a los datos mediante el uso de

lenguajes de consulta (p.ej. SQL, Query…).

3. Centralización: Los datos se gestionan de forma centralizada e independiente de

las aplicaciones.

4. Consistencia e integridad de los datos.

5. Fiabilidad (protección frente a fallos) y seguridad(control de acceso a los datos).

Entre los diferentes tipos de gestores de bases de datos destacan:

MySql: es una base de datos con licencia GPL basada en un servidor. Se

caracteriza por su rapidez. No es recomendable usar para grandes volúmenes de

datos.

PostGreSql y Oracle: Son sistemas de base de datos poderosos. Administra muy

bien grandes cantidades de datos, y suelen ser utilizadas en intranets y sistemas

de gran calibre.

Access: Es una base de datos desarrollada por Microsoft. Esta base de datos,

debe ser creada bajo el programa access, el cual crea un archivo .mdb.

Microsoft SQL Server: es una base de datos más potente que access desarrollada

por Microsoft. Se utiliza para manejar grandes volúmenes de informaciones.

19 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

6. CREACIÓN DE BASES DE DATOS

Una base de datos es un conjunto de datos relacionados y organizados a través de una o

más tablas.

Las tablas son las unidades básicas de almacenamiento de los datos. Normalmente, los

datos se organizan en una o varias tablas que se distribuyen en columnas,

correspondiendo cada una de ellas a una variable o campo.

Cada registro (fila) es un paciente, de modo que la tabla representa a un conjunto de

pacientes a través de un conjunto de registros. Y cada variable o campo es un dato que

se ha recogido para cada paciente (edad, fiebre, fecha, imc, etc).

La robustez y versatilidad de una base de datos esta basada en la capacidad de

relacionar tablas que incorporen información diferente. Una base de datos relacional es

aquélla que permite que diferentes tablas de datos estén relacionadas a través de un

campo o variable común:

• El uso de las relaciones es útil cuando varios registros de una tabla están vinculados

con otros registros de una o varias tablas: comparten información.

• La utilización de bases de datos relacionales evita la duplicación de registros.

6.1 PASOS PARA LA CREACIÓN DE UNA BASE DE DATOS

La clave para diseñar una base de datos eficaz radica en comprender exactamente qué

información se quiere almacenar y organizar correctamente los datos existentes.

1. Definir el objetivo y la finalidad de la base de datos:

El primer paso para la elaboración de bases de datos es analizar y desarrollar el diseño

de la misma, pensando los datos necesarios, como se va a emplear y que información se

desea obtener de la misma. ¿Qué, Cómo y Para qué?.

2. Organizar la información:

20 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Se han de recopilar todos los datos que se desean incluir en la base de datos.

Se ha de analizar y definir el tipo de información que se desea extraer a posteriori de la

base de datos, ya que así se podrán identificar los elementos que se han de incluir en la

misma. Es conveniente realizarse todas las preguntas posibles y así añadir el máximo de

elementos disponibles con el objetivo de que posteriormente esta base de datos sirva

para resolver cuestiones no definidas con antelación.

3. Estructura de una base de datos:

El tercer paso para crear bases de datos es elegir los temas principales de la base de

datos para dividir la información en tablas. Este proceso evita la duplicación de los datos

y sirve de ayuda a la hora de tener que actualizar alguno de ellos.

Una base de datos, a fin de ordenar la información de manera lógica, posee un orden que

debe ser cumplido para acceder a la información de manera coherente. Cada base de

datos contiene una o más tablas, que cumplen la función de contener los campos.

Para determinar las columnas de una tabla, se debe decidir qué información se necesita

recopilar sobre el tema que va a representar cada tabla.

4. Seleccionar el Tipo de Dato Adecuado:

Una vez identificadas todas las tablas y columnas que necesita la base de datos, se debe

determinar el tipo de dato de cada campo. Existen tres categorías principales que pueden

aplicarse prácticamente a cualquier aplicación de bases de datos: Texto, Números, Fecha

y hora.

Cada uno de éstos presenta sus propias variantes, por lo que la elección del tipo de dato

correcto no sólo influye en el tipo de información que se puede almacenar en cada

campo, sino que afecta al rendimiento global de la base de datos.

5. Normalización de las tablas:

La primera es de sentido común, evitar duplicar información para minimizar incoherencias

y errores y no malgastar espacio. La segunda premisa es que la información debe ser

completa y correcta

21 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Es necesario que al realizar la estructura de una base de datos, esta sea flexible. La

flexibilidad está en el hecho de que se puedan agregar datos al sistema posteriormente

sin tener que rescribir lo que ya se han incorporado inicialmente. Por ejemplo, si se

quisiera agregar la información de vía de administración de cada fármaco, lo único que se

deberia hacer es crear una tabla vía de administración que estuviese relacionada a la

tabla fármaco de la misma manera que la tabla dosis. Por lo tanto, no se tendría que

modificar la estructura de las tablas actuales, simplemente agregar la que hace falta.

El objetivo principal del diseño de bases de datos es generar tablas que modelan los

registros en los que se guarda la información. Es importante que esta información se

almacene sin redundancia para que se pueda tener una recuperación rápida y eficiente

de los datos.

6. Relaciones de tabla:

El concepto "relacional" significa que grupos parecidos de información son almacenados

en distintas tablas que luego pueden ser "juntadas" (relacionadas) basándose en los

datos que tengan en común. La aplicabilidad de la relación entre tablas y datos es clara:

• Una relación permite trabajar con varias tablas relacionadas a través de un campo

común o varios campos comunes.

• El objetivo de crear relaciones entre dos o más tablas es poder trabajar con ellas como

si fueran una sola.

• Al crear formularios, consultas e informes es probable que se tenga que extraer

información de más de una tabla: esto funciona mejor o es imprescindible, cuando

existe una relación entre las tablas.

• Se crean a través de Herramientas/Relaciones: primero se agregan las tablas y luego

se establecen las relaciones entre sus campos.

Aunque cada tabla almacena datos sobre un tema diferente, las tablas de una base de

datos suelen almacenar datos sobre asuntos que están relacionados entre sí. Por

ejemplo, puede que una base de datos contenga:

Una tabla de fármacos, con el código nacional, las dosis y sus vías de

administración.

22 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Una tabla de pacientes , con numero de historia clínica, nombre de paciente y

código nacional fármaco.

Una tabla de niveles de colesterol, con identificación analítica, nivel de colesterol e

identificador del paciente.

Dado que almacena datos sobre diferentes temas en tablas independientes, necesita

alguna manera de vincular los datos para que pueda combinar fácilmente datos

relacionados de esas tablas independientes. Para conectar los datos almacenados en

tablas diferentes, cree relaciones. Una relación es una conexión lógica entre dos tablas

que especifica los campos que las tablas tienen en común.

Los campos que forman parte de una relación de tabla se denominan claves.

La correspondencia de valores entre campos principales es la base de la relación de una

tabla. La relación de una tabla se puede usar para combinar datos de tablas relacionadas.

Mantener los datos separados en tablas relacionadas ofrece las siguientes ventajas:

Coherencia: Dado que cada elemento de datos se registra solo una vez en una

sola tabla, existen menos posibilidades de ambigüedad o incoherencia.

Eficacia: Registrar los datos en una sola ubicación implica el uso de menos

espacio en disco. Además, las tablas de menor tamaño tienden a proporcionar

datos más rápidamente que las de mayor tamaño.

Comprensibilidad: El diseño de una base de datos es más fácil de comprender si

los asuntos está separados en tablas de manera apropiada.

7. Creación de Formularios:

Los formularios dentro de una base de datos se utiliza para la introducción de la

información

Desde el formulario se puede modificar el contenido de un campo, borrarlo, añadir nuevos

registros, calcular campos, crear y utilizar gráficos, mostrar datos de varias tablas al

23 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

mismo tiempo. Todos los cambios que se realicen en el Formulario se ejecutaran en la

tabla relacionada.

Enlaces recomendados para el diseño de BASES DE DATOS:

Ejemplo de diseño de bases de datos relacionales:

https://www.fdi.ucm.es/profesor/fernan/MTIG_/Práct.%202.%20Diseño.pdf

Creación y diseño de una base de datos con Access

https://rua.ua.es/dspace/bitstream/10045/12769/8/Tutorial_Base_de_datos.pdf

7. EJEMPLOS DE BASES DE DATOS SANITARIAS Y SU UTILIDAD EN LA

ESTRATIFICACIÓN DE PACIENTES PARA EL ABORDAJE DE LA

CRONICIDAD.

Dado que las bases de datos pueden almacenar gran cantidad de información, permiten

su recuperación rápida, la información está organizada y puede obtenerse en distintos

formatos, se han convertido en una herramienta muy importante para la atención sanitaria

y el área de la investigación.

En España dos de las bases de datos clínicas más potentes para su aplicación en la

atención a la cronicidad y la investigación son descritas a continuación.

7.1 Base de datos de Investigación Farmacoepidemiológica en Atención Primaria -

BIFAP (www.bifap.org):

24 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

BIFAP es una base de datos informatizada de registros médicos de Atención Primaria

para la realización de estudios farmacoepidemiológicos, perteneciente a la Agencia

Española del Medicamento y Productos Sanitarios (AEMPS), y cuenta con la

colaboración de Comunidades Autónomas y el apoyo de las principales sociedades

científicas implicadas.

La Misión de BIFAP es promover la Salud Pública mediante la creación y mantenimiento

de una base de datos automatizada de ámbito nacional y base poblacional, a partir de la

información facilitada por los médicos de familia y pediatras de atención primaria del

Sistema Nacional de Salud, con el objetivo de realizar estudios farmacoepidemiológicos

orientados fundamentalmente a la evaluación de la efectividad y seguridad de los

medicamentos.

BIFAP esta especialmente comprometido en:

Proteger la confidencialidad de la información de los pacientes incluidos en la base de

datos de acuerdo con la legislación de protección de datos vigente.

Promover la colaboración de los médicos de Atención Primaria y mantener unos altos

niveles de calidad de la información y prestaciones.

Estimular la investigación de calidad desde la Asistencia Primaria de Salud,

asegurando unos altos niveles de calidad científica.

Desarrollar líneas de investigación independientes sobre aspectos relevantes para la

Comunidad científica y la Salud Pública de la población.

25 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

7.2 Conjunto mínimo básico de datos (CMBD):

Los hospitales nacionales registran desde principios de los años 1990, por normativa

ministerial, el denominado Conjunto Mínimo Básico de Datos (CMBD) de cada paciente

atendido en cada hospital del país, especialmente los de carácter público. En los últimos

años, además de los episodios de ingreso hospitalario convencional, se registran también

los episodios de Cirugía sin Ingreso y, más recientemente, los de Hospital de Día.

El CMBD contiene información muy valiosa para conocer la realidad sanitaria de una

población, ya que además de recoger los datos demográficos habituales (edad, sexo,

localidad de residencia), registra el diagnóstico que ha motivado el ingreso (diagnóstico

principal), los factores de riesgo, comorbilidades y complicaciones que presenta el

paciente durante el ingreso (diagnósticos secundarios), algunas técnicas diagnósticas

relevantes y las intervenciones terapéuticas, sobretodo de tipo quirúrgico, que han sido

utilizadas para tratar al paciente (los procedimientos). Finalmente, en el CMBD consta la

fecha de ingreso y de alta del paciente, así como su circunstancia de ingreso (urgente,

programada) y la circunstancia de alta del paciente (alta a su domicilio, defunción,

traslado a otro hospital, etc…).

Los diagnósticos y los procedimientos recogidos se codifican siguiendo la Clasificación

Internacional de Enfermedades, en su modificación clínica (CIE-9-MC). Esta codificación

es la que permite en última instancia agrupar los distintos episodios asistenciales

atendidos por un hospital en Grupos Relacionados con el Diagnóstico (GRD).

El CMBD se ha consolidado como una importante fuente de datos clínico-administrativos

para la investigación epidemiológica, así como para la planificación, gestión y evaluación

de la calidad clínico-asistencial, donde, además, su explotación mediante los sistemas de

clasificación de pacientes, como los GRD, lo convierten en una potente herramienta de

gestión dentro del sector hospitalario. Sin embargo, es importante mencionar que existe

la posibilidad de emplear el CMBD como fuente de información de otro tipo, como puede

ser la identificación de los pacientes crónicos, así como, para el análisis de las

26 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

características clínicas y epidemiológicas como son la mortalidad y el reingreso

hospitalario.

Esta base de datos se crea a través del Sistema de Información Sanitaria establecido por

la Ley de Cohesión y Calidad del Sistema Nacional de Salud, y proporciona información

sobre la actividad asistencial, las patologías atendidas, su complejidad, el abordaje clínico

y los costes que suponen. Los datos que ofrece son de carácter estadístico y sus

objetivos principales son tres:

1. Conocer la demanda asistencial y las enfermedades atendidas y favorecer los

estudios de investigación clínica, epidemiológica y de evaluación de servicios

sanitarios y resultados en salud.

2. Proporcionar a los registros autonómicos la información necesaria para la

evaluación y control de la atención prestada en el conjunto del Sistema Nacional

de Salud a sus ciudadanos.

3. Facilitar la realización de estadísticas del sector salud a nivel estatal, así como las

que deriven de compromisos con organismos oficiales internacionales, tales como

los indicadores de calidad de la OCDE o los indicadores de la Unión Europea.

La última modificación del sistema CMBD se aprobó en 2015 (Real Decreto 69/2015, de 6

de febrero, por el que se regula el Registro de Actividad de Atención Sanitaria

Especializada) y en ella, se extiende la recogida de datos a otras áreas de hospitales,

como el hospital de día, gabinetes de técnicas y procedimientos de alta complejidad y

urgencias. Por otra, se abarca el análisis de la demanda atendida en el sector privado, lo

que permitirá no sólo cubrir la información estadística, sino también conocer sus

resultados.

El sistema, además, incorpora nueva información destinada a mejorar los análisis de

calidad y seguridad de los pacientes. Entre los nuevos datos que recoge se encuentran

una serie de condiciones en el momento del ingreso hospitalario, procedencia del

paciente, determinadas circunstancias de la atención, ingresos en la UCI o aspectos de

continuidad asistencial.

Otra novedad es que se sustituye la Clasificación Internacional de Enfermedades que se

viene utilizando, la CIE 9MC, por la CIE 10 ES, de mayor alcance y especificidad, en línea

con la Organización Mundial de la Salud.

27 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

El Real Decreto garantiza la confidencialidad de los datos, la identidad del paciente

seguirá estando sometida a procesos de ―anonimización‖ y el tratamiento de los datos, a

la Ley 15/1999 de Protección de Datos de Carácter Personal.

En definitiva, con la implantación del Registro de Atención Especializada:

Se homogeneizará por primera vez toda la actividad del sector hospitalario, de

hospitalización y ambulatorio, público y privado.

Se mejorarán los análisis sobre calidad y seguridad del paciente.

Se podrán perfeccionar resultados sobre consumo de recursos y costes de los

procesos atendidos.

Las CC AA dispondrán de estadísticas sobre el flujo de pacientes entre territorios.

Será la fuente de datos más importante para la investigación epidemiológica y de

servicios sanitarios del nivel especializado.

La estructura del nuevo modelo RAE-CMBD, que tendrá una implantación paulatina entre

los años 2016 y 2018 en función de las modalidades asistenciales y titularidad de los

centros, contará con tres tipos de datos:

1. Datos de identificación del paciente

2. Datos de identificación del episodio

3. Datos clínicos

7.3 Utilidad de las bases de datos sanitarias:

La estratificación de la población en grupos de riesgo, que permita conocer y prever sus

necesidades futuras de recursos sanitarios, es un objetivo contemplado por la Sociedad

Española de Farmacia Hospitalaria (SEFH), en su plan estratégico sobre Atención

Farmacéutica del paciente crónico, definió como eje 2, la ―Orientación centrada en el

paciente: la estratificación como herramienta del nuevo modelo de atención‖ y resulta

28 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

especialmente relevante en la transformación de los modelos asistenciales (haciéndolos

más proactivos), en el tratamiento de la cronicidad (estableciendo poblaciones diana para

determinadas actuaciones) y en la integración de los niveles asistenciales.

La cuestión es que cada vez se hace más hincapié en la necesidad de proporcionar a los

pacientes una atención social y sanitaria integral e integrada, pero el análisis y la

evaluación de esta atención no se puede llevar a cabo correctamente con unos sistemas

de información fragmentados, sino que se debe hacer a partir de la integración de los

datos que contienen.

En la actualidad existen bases de datos institucionales, de las que se pueden obtener

datos diagnósticos y epidemiológicos (BIFAP, CMBD…), bases de datos de historias

clínicas, que habitualmente difieren de unas comunidades autónomas a otras y se puede

disponer de bases de datos de fabricación propia.

La base de datos para la estratificación de pacientes se fundamenta sobre un sistema de

tablas relacionadas que pivotan alrededor de la tabla de usuarios, que recoge los

principales datos del asegurado (demográficas o estado de salud, por poner dos

ejemplos).

Se puede concluir que, por el volumen de datos que integra, estas bases de datos tiene

las características de un ―big data‖ con una considerable capacidad de crecimiento y de

adaptación a nuevos requerimientos y fuentes de datos y ofrece unas enormes

posibilidades de análisis.

BIFAP

En la actualidad, se están llevando a cabo una serie de estudios de validación de la

información contenida en BIFAP. Su finalidad es asegurarse de que los datos registrados

en BIFAP se corresponden con datos reales en cuanto al diagnóstico, fecha del mismo,

medicación asociada y demás información relacionada. Del resultado de los mismos

dependerá el momento en que la base de datos entre en fase de producción. Si

finalmente BIFAP se consolida como herramienta de investigación se pondrá a

disposición del Sistema Nacional de Salud y de la comunidad científica una base de datos

integrada, para realizar estudios epidemiológicos. No es descabellado decir que BIFAP es

29 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

una base de datos única en España y que puede marcar un hito en la historia de la

investigación farmacoepidemiológica.

La epidemiología aporta en el campo farmacéutico una metodología que permite

proporcionar datos en la mayoría de las áreas de investigación y seguimiento de

fármacos. Ha resultado especialmente útil en la evaluación de las señales generadas a

través de los sistemas de farmacovigilancia. Las bases de datos informatizadas

proporcionan una gran cantidad de datos que se recogen de forma rutinaria para realizar

estudios epidemiológicos que evalúan el uso y los efectos de los medicamentos en

grandes grupos de la población general que normalmente no participan en los ensayos

clínicos durante la fase de desarrollo.

También permiten realizar estudios para ampliar el conocimiento de las enfermedades y

su historia natural. El uso de las bases de datos informatizadas en farmacoepidemiología

es un campo con gran potencial de crecimiento. Este tipo de estudios permite alcanzar

varios objetivos de salud pública: ampliar y enfocar el desarrollo de nuevos

medicamentos para enfermedades cuyo tratamiento actual sea inexistente o mejorable y

lograr un uso óptimo y seguro en la población general de los medicamentos ya

comercializados

Como ejemplo, en la actualidad, a partir de la BIFAP se está evaluando el efecto de los

diferentes tratamientos antidiabéticos orales en la evolución de los pacientes crónicos.

CMBD

Recientemente se ha recurrido a la utilización de la base de datos CMBD (Conjunto

Mínimo Básico de Datos) gestionada por el Ministerio de Sanidad y Consumo y que reúne

los datos de alta hospitalaria de la mayor parte de los hospitales públicos del país, para

identificar casos de coagulación intravascular diseminada postparto y los hospitales

donde ocurrieron. De este modo se pudo realizar un estudio de casos y controles, para

evaluar la asociación de dinoprostona con este trastorno, de una forma más eficiente a lo

que habría sido un puro estudio de campo de base hospitalaria. La extracción de los

datos de la enfermedad para su validación posterior, así como de la exposición a

30 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

medicamentos y posibles factores de confusión y modificadores de efecto, se realizó, no

obstante, a través de la propia historia clínica en papel.

La base de datos CMBD se utiliza profusamente para la evaluación de la gestión

sanitaria, pero ha sido escasamente utilizada hasta ahora con fines de investigación

etiológica en general y en farmacoepidemiología en particular. Entre las razones que se

pueden dar para ello se encuentran las dificultades impuestas por la Ley Orgánica de

Protección de Datos para acceder a la identificación de los pacientes sin la cual es

imposible el acceso a la historia clínica, ni a su conexión con otras posibles fuentes de

información.

Un ejemplo de estratificación es el trabajo de Orueta y colaboradores que con el objetivo

de estratificar la población se empleó el Conjunto Mínimo Básico de datos (CMBD) de

hospitales y datos extraídos de las historias clínicas informatizadas (HCI) de atención

primaria. El modelo de está organizado en episodios de atención. Cada episodio incluye

un diagnóstico, registrado como texto libre, y su correspondiente código CIE-9-MC,

introducido por los clínicos cuando establecen o modifican el diagnóstico.

Para clasificar a los pacientes se utilizaron: edad, sexo, códigos CIE-9-MC de los

diagnósticos, códigos ATC de los fármacos prescritos, necesidad de tratamiento crónico

con diálisis y número de hospitalizaciones durante los 12 meses observados. Se

consideraron diagnósticos de atención primaria los de los episodios donde algún médico

realizó alguna anotación. Las prescripciones corresponden a los formularios que al efecto

se cumplimentaron. Los diagnósticos de hospital comprenden tanto los principales como

los secundarios.

Para la categorización prospectiva de la población se empleo el sistema Johns Hopkins

Adjusted Clinical Groups Predictive Model (ACG-PM).

Este trabajo plantea las ventajas de la utilización combinada de diferentes fuentes de

información para la estratificación de pacientes crónicos con distinta carga de

comorbilidad.

31 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

8. REPRESENTACIÓN GRÁFICA DE DATOS APLICADA A LA EXPLOTACIÓN DE

DATOS SANITARIOS.

Una vez que los datos han sido recogidos y registrados en la base de datos, comienza el

procesamiento de estos. Este procesamiento contempla el uso de programas

estadísticos.

La realización de los estudios clínicos-epidemiológicos implica finalmente emitir unos

resultados cuantificables de dicho estudio. La claridad en la representación de estos

resultados es vital para la interpretación de los mismos.

Cuando se dispone de datos de una población, y antes de abordar análisis estadísticos

más complejos, un primer paso consiste en presentar esa información de forma que ésta

se pueda visualizar de una manera más sistemática y resumida.

Los datos que interesan dependen, en cada caso, del tipo de variables que se manejen.

Para variables categóricas, como el sexo, estadio, profesión, etc., se quiere conocer la

frecuencia y el porcentaje del total de casos de cada categoría. Una forma muy sencilla

de representar gráficamente estos resultados es mediante diagramas de barras o

diagramas de sectores. En los gráficos de sectores, también conocidos como diagramas

de "tartas", se divide un círculo en tantas porciones como clases tenga la variable, de

modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia

absoluta o relativa.

Como se puede observar en la gráfica siguiente, la información que se debe mostrar en

cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje

del total que estos representan. Si el número de categorías es excesivamente grande, la

imagen proporcionada por el gráfico de sectores no es lo suficientemente clara, por lo que

se considera ideal cuando se disponen de 3 a 6 categorías.

32 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Los diagramas de barras son similares a los gráficos de sectores. Se representan tantas

barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea

proporcional a la frecuencia o porcentaje de casos en cada clase .

Estos mismos gráficos pueden utilizarse también para describir variables numéricas

discretas que toman pocos valores (número de hijos, número de recidivas, etc.).

33 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Para variables numéricas continuas, tales como la edad, la tensión arterial o el índice de

masa corporal, el tipo de gráfico más utilizado es el histograma.

Para construir un gráfico de este tipo, se divide el rango de valores de la variable en

intervalos de igual amplitud, representando sobre cada intervalo un rectángulo que tiene a

este segmento como base. El criterio para calcular la altura de cada rectángulo es el de

mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en

cada intervalo y el área de los rectángulos.

Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene

una imagen que se llama polígono de frecuencias. Dicha figura pretende mostrar, de la

forma más simple, en qué rangos se encuentra la mayor parte de los datos.

Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el

concepto de percentiles, mediante diagramas de cajas.

34 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

La caja central indica el rango en el que se concentra el 50% central de los datos. Sus

extremos son, por lo tanto, el 1er y 3er cuartil de la distribución. La línea central en la caja

es la mediana. De este modo, si la variable es simétrica, dicha línea se encontrará en el

centro de la caja. Los extremos de los "bigotes" que salen de la caja son los valores que

delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores

extremos de la distribución. Se suelen también representar aquellas observaciones que

caen fuera de este rango (atípicos o valores extremos). Esto resulta especialmente útil

para comprobar, gráficamente, posibles errores en los datos. En general, los diagramas

de cajas resultan más apropiados para representar variables que presenten una gran

desviación de la distribución normal.

Cuando se quieren comparar las observaciones tomadas en dos o más grupos de

individuos una vez más el método estadístico a utilizar, así como los gráficos apropiados

para visualizar esa relación, dependen del tipo de variables que se esten manejando.

35 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

Cuando se trabaja con dos variables cualitativas se puede seguir empleando gráficos de

barras o de sectores.

9. BIBLIOGRAFIA

• Andérez, A.: Aspectos Legales de la Historia Clínica Informatizada. V Informe Seis

2003. SEIS. 2003.

• Bachman, Charles W. «The programmer as navigator» (en inglés).

http://assets.mheducation.es/bcv/guide/capitulo/8448148797.pdf

• Constitución Española 1978

• Dan Riskin, The Next Revolution in Healthcare en Forbes. 1 de octubre de 2012.

www.forbes.com/sites/singularity/2012/10/01/the-next-revolution-in-healthcare/

• Decreto número 34/1999, de 26 de mayo, por el que se crea el Registro Regional del

Conjunto Mínimo Básico de Datos del Alta Hospitalaria.

• Diego Macías Saint-Gerons, Cesar de la Fuente Honrubia, Fernando de Andres-

Trelles, Ferran Catala Lopez. Prevencion primaria de las enfermedades

cardiovasculares con estatinas en pacientes con diabetes. Med Clin (Barc).

2015;144(6):282-287.

36 DISEÑO Y MANEJO DE BASES DE DATOS SANITARIOS

• Enciclopedia de Clasificaciones. (2016). Tipos de base de datos. Recuperado de:

http://www.tiposde.org/informatica/139-tipos-de-base-de-datos/ (Consultado Agosto

2016)

• Garbayo, J.A., Sanz, J., Carnicero, J. y Sánchez, C.: La seguridad, confidencialidad y

disponibilidad de la información clínica. V Informe Seis 2003. SEIS. 2003.

• Institute of Medicine (2012). ―Best Care at Lower Cost: The Path to Continuously

Learning Health Care in America.‖ Smith M,Saunders R, Stuckhardt L y McGinnis JM

(editores). Washington, D.C. The National Academies Press. Disponible en:

www.iom.edu/Reports/2012/Best-Care-at-Lower-Cost-The-Path-to-Continuously-

Learning-Health-Care-in-America.aspx

• CKusnetzky, Dan. What is "Big Data?". ZDNet.

http://blogs.zdnet.com/virtualization/?p=1708

• Ley General de Sanidad 14/ 1986, de 25 de abril. Boletín Oficial del Estado de 29 de

abril de 1986, núm. 102.

• Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de carácter

personal. Boletín Oficial del Estado de 14 de diciembre de 1999, núm. 298.

• Ley 41/2002, de 14 de noviembre, básica reguladora de la Autonomía del Paciente y

de derechos y obligaciones en materia de información y documentación clínica. Boletín

Oficial del Estado de 15 de noviembre de 2002, núm. 214..

• Ley 14/2007, de 3 de julio, de Investigación biomédica.

• Orueta,Juan F., Mateos Del Pino,Maider, Barrio Beraza,Irantzu, Nuño Solinis,Roberto

Estratificación de la población en el País Vasco: resultados en el primer año de

implantaciónAtención Primaria 2013;45:54-60

• Real Decreto 994/1999, de 11 de junio, por el que se aprueba el Reglamento de

medidas de seguridad de los ficheros automatizados que contengan datos de carácter

personal. Boletín Oficial del Estado de 25 de junio de 1999, núm. 151