Sesion_01_GDI_I

50
Gestión de Datos e Información I Escuela Académica Profesional de Ingeniería de Sistemas

description

Base de Datos

Transcript of Sesion_01_GDI_I

Gestión de Datos e Información I

Escuela Académica Profesional de Ingeniería de Sistemas

Sesión 01

Introducción a Base de DatosConceptos Básicos de Base de

Datos

2

..Es un conjunto de elementosinterrelacionados formando un todo, quebuscan alcanzar un conjunto de objetivos.

Sistemas naturales

Sistemas hechos por el hombreClasificaciónde Sistemas

Sistema planetario solar

Sistema circulatorio humano

Sistema eléctrico interconectado del sur

Sistema de Contabilidad

Conjunto de componentes interrelacionados que permitencapturar, almacenar, procesar y distribuir la información paraapoyar la toma de decisiones y el control en una organización.

Entradade datos

Procesamientoclasificaciónordenamientocálculos

Salida de lainformación

retroalimentación

SISTEMA DE INFORMACION

ORGANIZACIONCLIENTES PROVEEDORES

COM

PETIDO

RES

ACCIONISTAS

MEDIO AMBIENTE

PRECISANo es lo mismo el cálculo de notas de unalumno que las transacciones bancariasa nivel de empresas multinacionales

OPORTUNA La información resulta oportuna si estadisponible en el momento requerido.

SIGNIFICATIVAHa de ser comprensible e importante. Elvolúmen mostrado debe ser lo justo.

COHERENTELos resultados obtenidos deben parecerse a loesperado y la relación entre ellos debe ser lógica

SEGURA Debe estar protegida contra daños físicos,errores lógicos o de accesos no autorizados.

Datos

Hardware

Software

Administrador

Usuarios

Referenciales

DirectosEstructuradosNo estructurados ( texto, video, sonido )

CPU

Dispositivos periféricos

Sistema OperativoSistemas de gestión de Bases de Datos (SGBD)Control de ComunicacionesAplicaciones específicas

Area de datos

Area Desarrollo

InformáticosNo informáticos

Area Soporte

El gráfico siguiente ilustra el comportamiento de lainformación, dentro de las organizaciones, desde los puntosde vista de su procesamiento y de su uso :

MAYOR

MENOR

MENOR

MAYOR Cantidad deinformaciónprocesada ygenerada

Cantidad deinformaciónutilizada en latoma dedecisionesProcesamiento de la

información Uso de la información

ETAPAS PARA LA GESTION DE DATOS

En este enfoque las aplicaciones recurren a archivos separadospara cada aplicación. Si se toma como ejemplo un Banco, bajo estecriterio se tendrían por separado las operaciones bancarias enáreas funcionales, como cuenta corriente, ahorros y prestamos,donde cada área funcional tiene su propio archivo.Si Juan Pérez es un cliente del Banco y tiene cuenta corriente,cuenta de ahorros y un préstamo que actualmente esta pagando,los datos concernientes a Juan, estarían repetidos en los tresarchivos, cada uno de los cuales se actualiza con programasdiferentes. Ver gráfico sgte.

1. Aplicaciones con manejo de datos independiente( Sistema de archivos )

Archivo de cuentascorrientes

Num. Cliente nombre cliente DatosCuentaCorriente

2056 juan pérez ........ ........ ....... .......

Archivo de Ahorros

Archivo de prestamos

Num. Cliente nombre cliente Datos de Ahorros

2056 juan pérez ........ ........ ....... .......

Num. Cliente nombre cliente Datos de Prestamos

2056 juan pérez ........ ........ ....... .......

SISTEMADE

ARCHIVOS

redundancia

Aplicación 1

inconsistencia

Aplicación 2 Aplicación 3

Usando el ejemplo anterior a fin de facilitar la explicación, seestablece un solo archivo de clientes para las tres cuentas y elregistro de cliente contiene los datos básicos de cada cliente .También se crea un archivo para cada actividad bancaria :Cuenta corriente, Cuenta de ahorros y Prestamos. Cada registrode cliente contiene un campos especiales que lo asocian a losdatos de las cuentas y prestamos que posee este cliente.Una de las características mas importantes es que los datos soncompartidos por todas las aplicaciones. Asi por ejemplo esposible transferir dinero entre una cuenta y las otras, o prepararun solo estado mensual para las tres cuentas de un cliente o detodos los clientes. Ver gráfico sgte.

2. Gestión centralizada de los datos

( Sistema de Bases de Datos )

ETAPAS PARA LA GESTION DE DATOS

Archivo de Clientes

Num. Cliente nombre cliente

2056 juan pérez

Datos deCuentas

Corrientes

Datos deCuentas de

AhorrosDatos de

Prestamos

Archivo deCuentasCorrientes

Datos decuentas

corrientesArchivo dePréstamos

Datos depréstamos

Archivo deCuentas deAhorros

Datos decuentas de

ahorros

ENFOQUEDE BASESDE DATOS

Aplicación 1

Aplicación 2 Aplicación 3

Alto nivel de redundancia

Un mismo dato puede estar repetido en diferentes archivos.Riesgo de inconsistencias

Las diversas copias de los mismos datos pueden nocoincidir ( por ejemplo el cambio de dirección de uncliente )

Uso excesivo de recursos humanos

Una alta proporción de recurso humano, se dedica aactividades de mantenimiento de software.

Las aplicaciones dependen de los archivos

Si se hacen cambios en los formatos de archivos,también deben modificarse los programas( falta deindependencia ).

Los archivos pueden ser incompatibles

Un archivo en Cobol no es igual que un archivo hecho enC++. Los archivos no pueden combinarse o compararse.

Datos separados y aislados

En ocasiones es necesario obtener información de dos omas archivos.

Costos elevadosEs muy costoso hacer cambios a las aplicaciones, uncambio trivial provoca una reacción en cadena de otroscambios. Además el almacenamiento redundanteincrementa los costos.

Tendencia a crear más y más archivos

Proliferación constante de nuevos archivos y por tantodificultad en la actualización de los mismos.

Es una colección compartida de datos sin redundanciasinnecesarias, almacenados en un soporte informático no volátil,independiente de los programas que los usen, interrelacionados yestructurados de acuerdo a un modelo de datos con el objeto deatender todas las necesidades de los diferentes usuarios.

Es un software o conjunto de programas que permite a losusuarios crear y mantener una base de datos.

De hecho un SGBD debe facilitar la definición, construcción ymanipulación de una base de datos.

En inglés : DBMS ( database management system )

ADMINISTRADOR DE BASE DE DATOS ( DBA )

Supervisa y controla la forma como laspersonas utilizan los mismos recursos deinformación.En un entorno de BD, el recurso primario es lapropia base de datos y el secundario es elSGBD comercial que se emplea.El responsable de la administración de estosrecursos es el DBA (database Administrator)

ADMINISTRADOR DE BASE DE DATOS ( DBA )

Se encarga de autorizar el acceso a la base de datos,de coordinar y vigilar su empleo y de solicitar laadquisición de los recursos necesarios de software yhardware.

Es el responsable cuando suceden problemas deviolaciones a la seguridad o a una respuesta lentadel sistema.

DISEÑADOR DE BASE DE DATOS

Se encarga de identificar los datos que sealmacenarán en la base de datos y de elegir lasestructuras apropiadas para representar yalmacenar dichos datos.

Debe interactuar con todos los futuros usuarios dela base de datos a fin de comprender susverdaderos requerimientos de información y poderasí representar un diseño que los satisfaga.

USUARIOS FINALES

Son las personas que necesitan tener acceso a labase de datos para consultarla, actualizarla ygenerar informes.La base de datos se diseña y se implementaprecisamente para que ellos la usen.

ANALISTAS DE SISTEMAS Y PROGRAMADORES

LOS ANALISTAS : determinan los requerimientos de losusuarios finales y desarrollan especificaciones paratransacciones que deben ser programadas, a fin desatisfacer dichos requerimientos.

LOS PROGRAMADORES : implementan estasespecificaciones en forma de programas.

Para cumplir con estas labores, tanto analistas, comoprogramadores deben conocer muy bien lascapacidades del SGBD

Programadores

Usuarios normales

Administrador de la Base de Datos

Escriben aplicaciones, donde incrustan comandos DMLpara interactuar con el sistema

Interactúan con el sistema mediante el uso deaplicaciones que han sido escritos por informáticos.

Usuarios sofisticados

Interactúan con el sistema creando consultas con unlenguaje de consulta, las cuales entran al procesadorde consultas que transforma las instrucciones DML,para ser entendidas por el gestor dealmacenamiento.

Crea BD, define métodos de acceso, concedeautorizaciones, etc

Para la gestión de las bases de datos los SGBD brindansoporte a un lenguaje de BD estándar (SQL) parapermitir la definición, construcción y manipulación de una base dedatos

sentencias parapoder especificarcampos, los tiposde datos y lasrestricciones

sentencias parapoder guardarlos datos enalgún medio dealmacenamientocontrolado por elSGBD

sentencias parapoder consultaro actualizar labase de datos ygenerar informes

Los SGBD al soportar un lenguaje de BD, permiten accedera conjuntos de comandos :

uno para especificar la base de datos

de la BD.Otro para expresar las consultas y actualizacionesDDL

DML

( Data definition language )

( Data manipulation language )

( Data definition language )

Da al DBA los recursos para describir los datos,especificando sus diversas estructuras.

Cuando se ejecutan instrucciones DDL, resultantablas que se almacenan en el DDD (diccionario dedatos).

Para especificar la estructura de almacenamiento(esquema interno) y los métodos de acceso, se usaun tipo especial de DDL llamado Lenguaje dedefinición de almacenamiento (SDL)

( Data manipulation language )

Permite realizar las principales operaciones demanipulación de datos, como son la recuperación,inserción, eliminación y la modificación.

Naturaleza autodescriptiva de losSGBDEl SGBD contiene además de la BD,una definición o descripcióncompleta de la base de datos. Estadefinición se almacena en elDiccionario de Datos o Catalogo(Metadatos ). Aquí va lainformación de la estructura decada archivo, el tipo y formato delos datos elementales y las diversasrestricciones que se aplican a nivelde columna o de archivo.

Independencia respecto a programas y datos

Los programas que accesan a los SGBD se puedenescribir de modo que sean independientes decualquier archivo específico. Esto es posible gracias ala abstracción de los datos, lo que se explica cuando elSGBD ofrece a los usuarios una representaciónconceptual de los datos que no incluye muchos de losdetalles de cómo se almacenan.

La independencia se debe a que las estructuras de losarchivos están almacenados en el diccionario de datosdel SGBD y no en los programas.

Manejo de múltiples vistas de los datos

Varios usuarios pueden desear ver datos de la base dedatos, cada uno de los cuales puede requerir unaperspectiva o vista diferente.

Una vista normalmente es un subconjunto de la basede datos o puede contener datos derivados.

Control de Concurrencia

Un SGBD incluye software de control deconcurrencia ( gestor de transacciones ) paraasegurar que cuando varios usuarios intentenactualizar los mismos datos, lo hagan de manerasincronizada.

Control de Redundancia

Queda minimizada o controlada la repetición delmismo dato en diferentes archivos. De esta forma yano se desperdicia espacio de almacenamiento ni seproducen inconsistencias.

Restricción de accesos no autorizados

Normalmente algunos usuarios tienen autorizaciónsolo para leer los datos de la base de datos, mientrasque otros pueden leer y actualizar. Un SGBD tiene unsubsistema de seguridad y autorización que permite alAdministrador de la BD crear cuentas y especificarrestricciones para ellas

Restricciones de integridad

El SGBD debe ofrecer recursos para definir y hacercumplir ciertas restricciones de integridad sobre losdatos. Veamos algunos ejemplos : definir un tipo dedato(entero o String), las edades de colegiales ( 13 a 17), que un valor sea único ( código de trabajador ), etc

Respaldo y Recuperación

Todo SGBD debe contar con un subsistema de respaldoy recuperación, a fin de enfrentar exitosamente fallasde hardware o de software. La idea es que después deuna caida, se restaure la base de datos al estado en elque estaba.

Representa el diseñoglobal de la Base deDatos. Los esquemascambian muy raras veceso nunca. El concepto deesquema se puede asociarpor analogía con ladeclaración de arreglos enlos lenguajes deprogramación (el arreglono existe).

codEstud nombre ciclo espec

codCurs nomCur cred depto

ESTUDIANTE

CURSO

codCurs CodCursRequisitoREQUISITOS

codCurs nomProfPROFESOR

NOTAScodCurs codEstud parc trab fin

codProf fechIngre

Existen tres esquemas que describen la arquitectura de una BD

ESQUEMA DERELACION

ESQUEMA DE BASE DEDATOS

También conocida comoestado de la base de datos

Es el conjunto de registros almacenados en la base dedatos, en un instante dado.

Las bases de datos cambian a lo largo del tiempo, según seañade o elimina información.

Una instancia de BD se puede comparar por analogía a losdatos colocados en arreglos ya declarados.

codEstud nombre ciclo espec

codCurs nomCur cred depto

ESTUDIANTE

CURSO

codCurs CodCursRequisitoREQUISITOS

codCurs nomProfPROFESOR

NOTAScodCurs codEstud parc trab fin

codProf fechIngre

codEstud nombre ciclo espec codCurs nomCur cred deptoESTUDIANTE

CURSO

codCurs CodCursRequisitoREQUISITOS

PROFESOR

NOTAScodCurs codEstud parc trab fin

codCurs nomProfcodProf fechIngre

100 Ana 3 Contabilidad

150 Alex 3 Sistemas

250 Inés 1 Contabilidad

350 Max 2 Sistemas

M100 Matemática I 7 3

S200 Algoritmos I 4 1

S200 M100

S310 Algoritmos II 5 1

S310 S200M100 _

350 11 16 13S200

06S310 100 1217

17M100 250 1813

S200 PradoP100 22/01/90M100 HornaP200 14/01/93

El diseño de una base de datos es un proceso complejo que involucradecisiones en diferentes niveles.

Esta complejidad se simplifica descomponiendo el proceso enfases, aplicando métodos y técnicas específicas.

Así el diseño de la base de datos se descompone en lassiguientes fases :

Diseño Conceptual

Diseño Lógico

Diseño Físico

Se inicia con la labor de levantamiento de información de laorganización, para luego realizar la especificación de requerimientos delusuario.

El resultado de este trabajo será el esquema conceptual de la base dedatos.

Es una descripción de muy alto nivel de la estructura de la base de datos,independiente del SGBD que se use posteriormente para manipularla.

Unicamente describe cuales son los diferentes elementos deinformación dentro de una organización y como se relacionanestos.

No es relevante centrarse en la forma como se estructura sualmacenamiento.

Empieza el trabajo tomando como base el esquemaconceptual y terminada la labor debe generarse elesquema lógico. Por tanto es una transformación deldiseño conceptual.

Un esquema lógico es una descripción de laestructura de la base de datos que puede serprocesada por un SGBD

El diseño físico, es una adaptación del diseño lógico en unsistema de gestión de base de datos donde representaría elesquema físico.

Un esquema físico es una descripción de la implantación de unabase de datos en algún medio de almacenamiento; describe lasestructuras de almacenamiento, los métodos y restriccionesusados para tener un acceso confiable a los datos. Por estarazón un diseño físico esta firmemente atado a un SGBDespecífico.

El esquema físico se expresa mediante el uso del lenguaje dedefinición de datos del SGBD elegido, así la base de datos puedeser creada y probada.

Es un conjunto de conceptos para describir la estructura de unabase de datos, es decir, a las entidades involucradas, susrelaciones, semántica asociada a los datos y restricciones deconsistencia.

Los modelos de datos se clasifican :

1. Modelo Jerárquico

2. Modelo de Redes

3. Modelo Entidad Relación

4. Modelo Relacional

5. Modelo de Objetos

6. Modelo Objeto-Relacional

Tomando como criterio el nivel de abstracción, a losmodelos de datos se les puede ubicar en tres grupos :

1. Modelos de alto nivel o conceptuales

2. Modelos de implementación o lógicos

3. Modelos de bajo nivel o físicos

Los modelos como los lenguajes de programación,poseen un conjunto fijo de construcciones linguisticasque se pueden usar en la descripción de la información ysus interrelaciones dentro de una organización .

Todo modelo puede ser representado gráficamentemediante la utilización de una notación.

Los modelos graficados deben ser fáciles de leer yentender y constituyen la esencia del trabajo de diseño.

El modelo Entidad - Relación

El modelo orientado a objetos

basado en una percepción del mundo real que consta deobjetos llamados entidades y de relaciones entre ellos

Similar al modelo E/R, pero los objetos contienen además dedatos, segmentos de código ( métodos) que manipulan estosdatos.

Utilizan conceptos como entidades, atributos yrelaciones. Entre los modelos mas difundidostenemos :

Son muy usados en los SGBD comerciales. Representan losdatos valiendose de estructuras de registros, por eso se lesconoce tambien como Modelos basados en registros. Losmodelos mas representativos de esta categoría son :

El modelo de datos Relacional

El modelo de datos Jerárquico

El modelo de datos de Redes

Se basa en el uso de tablas (filas y columnas) para representar los datos ysus relaciones

Se basa en el empleo de colecciones de registros y las relaciones serepresentan mediante enlaces como punteros, en forma de grafos.

Similar al modelo de redes, pero los registros se organizan en forma deárbol.

Describen como se almacenan los datos en elcomputador al representar información como losformatos, ordenamientos de los registros quehacen mas eficiente de acceso, etc.

01/09/2014Análisis y Diseño SISTEMAS 48

01/09/2014Análisis y Diseño SISTEMAS 49

GRACIAS POR SU ATENCION

01/09/2014Análisis y Diseño SISTEMAS 50