Analista-programador Cobol - Módulo 1.2

13
TIPOS DE ARCHIVOS DE INFORMACIÓN © élogos Conocimiento, S.L. Madrid 2009. Todos los derechos de Propiedad Intelectual e Industrial de esta obra pertenecen a élogos Conocimiento, S.L.

Transcript of Analista-programador Cobol - Módulo 1.2

Page 1: Analista-programador Cobol - Módulo 1.2

TIPOS DE ARCHIVOS DE

INFORMACIÓN

© élogos Conocimiento, S.L. Madrid 2009. Todos los derechos de Propiedad Intelectual e Industrial de esta obra pertenecen a élogos Conocimiento, S.L.

Page 2: Analista-programador Cobol - Módulo 1.2

ÍNDICETIPOS DE ARCHIVOS DE INFORMACIÓN

1. FICHEROS Y BASES DE DATOS Y OPERACIONES TÍPICAS DE ENTRADA/SALIDA . . . . . . . . . . . . . . . .32. CONCEPTO DE ORGANIZACIÓN DE FICHEROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .53. CONCEPTO DE METODO DE ACCESO A LA INFORMACION DE LOS FICHEROS . . . . . . . . . . . . . . . . .74. OPERACIONES TIPICAS QUE SE HACEN CON LOS FICHEROS . . . . . . . . . . . . . . . . . . . . . . . . . . .105. LAS BASES DE DATOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

Page 3: Analista-programador Cobol - Módulo 1.2

1. Ficheros y Bases de Datos y operaciones típicas de Entrada/salida.

Todas las aplicaciones necesitan almacenar y recuperar información. En una computadora, cuando se ejecutauna aplicación (un proceso) la información se almacena en la memoria principal electrónica del computador;este es un tipo de memoria volátil, de forma que cuando la aplicación termina la información se pierde. Estoes inaceptable para muchas aplicaciones, que pueden requerir que la información permanezca disponibledurante largos periodos de tiempo.Con respecto a la memoria principal de las computadoras, se trata de un tipo de memoria electrónicas cuyasprincipales características son:

- La memoria principal tiene poca capacidad de almacenamiento. No se pueden manipular grandescantidades de datos, ya que puede haber casos en los que no quepan en la memoria principal.

- La memoria principal es volátil.

- Acceso rápido a la información.

Otro problema es que varios procesos pueden necesitar acceder a una misma información de formaconcurrente.

Como los espacios de memoria de los procesos son privados, un proceso no puede acceder a los datos en elespacio de memoria de otro. La solución es hacer que la información sea independiente de los procesos.

Por tanto, hay tres requisitos esenciales para almacenar información durante un tiempo indefinido:

- Debe ser posible almacenar una gran cantidad de información.

- La información debe mantenerse (persistir) tras la terminación de los procesos que la usan.

- Varios procesos deben de ser capaces de acceder a la información de forma concurrente.

La solución a estos problemas consiste en almacenar la información en discos magnéticos u otros dispositivosen unas unidades llamadas ficheros o archivos.

Podemos definir un fichero como “la abstracción de un mecanismo que permite almacenar informaciónen un dispositivo y leerla posteriormente”. De igual forma podemos definir un fichero “como unacolección de información que tiene un nombre”.

TIPOS DE ARCHIVOS DE INFORMACIÓN

3

Page 4: Analista-programador Cobol - Módulo 1.2

Los fichero pueden ser leídos y escritos por cualquier proceso. Son una forma de almacenamientodenominada memoria secundaria. Sus principales cualidades son:

- Capacidad de almacenamiento sólo limitada por el soporte físico de que se disponga.

- La información está almacenada permanentemente.

- Acceso lento a la información, ya que tiene que ser transportada desde el dispositivo externo hastala memoria principal para su tratamiento. Existe un área de memoria principal destinada a recibiresta información procedente del dispositivo secundario. Esta área se denomina Buffer.

De la definición vista de fichero, se deduce que existen diferentes tipos de ficheros en función de:

- El tipo de información que contienen.

- El método de organización de la información.

En función del tipo de información que contienen los ficheros y según el método usado para guardarlacodificarla dentro de estos podemos diferenciar entre :

- Ficheros de texto: Se guarda la información en caracteres, tal y como se mostraría en pantalla.

- Ficheros binarios: Se guarda la información en binario, tal y como está en memoria

TIPOS DE ARCHIVOS DE INFORMACIÓN

4

Page 5: Analista-programador Cobol - Módulo 1.2

2. CONCEPTO DE ORGANIZACIÓN DE FICHEROS

La organización hace referencia a la forma en que los registros lógicos están almacenados, o se van aalmacenar, dentro del dispositivo de memoria auxiliar para ese fichero.

La elección de la organización de un fichero determina un mayor o menor uso de recursos del sistema, o unamayor o menor velocidad de procesamiento así como el tipo de acceso a la hora de procesar los registros.

La organización es decidida por el analista en función del tamaño del fichero y de la volatilidad y actividadde los registros lógicos.

Para soportar las distintas organizaciones, los sistemas operativos contienen un conjunto de rutinasespecializadas llamadas métodos de acceso (secuencial, aleatorio o los dos).

ORGANIZACIONES STANDARD DE FICHEROS (ANSI)

Son tres las organizaciones que suelen estar implementadas en todos los compilado res. (ANSI = AMERICANNATIONAL STANDARD INSTITUTE).

- Organización Secuencial- Organización Indexada - Organización Relativa

ORGANIZACION SECUENCIAL (SEQUENTIAL)

Los registros lógicos son almacenados unos detrás de otros, por orden de llegada.

Sólo se pueden procesar en forma secuencial.

Se pueden colocar en cualquier tipo de almacenamiento auxiliar.

El archivo sólo contiene registros lógicos (ninguna información secundaria).

ORGANIZACION INDEXADA (INDEXED)

Los registros son almacenados en orden ascendente de acuerdo con el contenido de un CAMPO CLAVEpredefinido, que identifica a cada registro lógico.

TIPOS DE ARCHIVOS DE INFORMACIÓN

5

Page 6: Analista-programador Cobol - Módulo 1.2

Se pueden procesar tanto secuencialmente como aleatoriamente y sólo son posible en dispositivos de accesodirecto.

También se conoce a esta organización como SECUENCIAL-INDEXADA.

Los ficheros indexados están compuestos de un área de datos y un área de índices en la cual se guarda laclave de registro y la dirección de su posición en el área de datos. Esto permite el acceso directo a él.

ORGANIZACION DIRECTA O ALEATORIA O RELATIVA (RELATIVE)

Se basa en la división del espacio físico de que disponga el fichero, en celdas destinadas a contener un sóloregistro. Estas celdas están numeradas por el número de posición relativa en el fichero, y podrán o nocontener registro.

El usar archivos con organización relativa requiere que el programador desarrolle un algoritmo dedireccionamiento que asocie la clave de los registros lógicos con el número de posición del registro en elfichero.

Es posible el proceso secuencial (en el orden del número de registro); también es posible el acceso directoa un registro, ya que, el sistema operativo es capaz de calcular la dirección en el disco a partir del númerode registro.

Es imprescindible dispositivo de almacenamiento de acceso directo. Esta organización también recibe elnombre de “aleatoria“.

TIPOS DE ARCHIVOS DE INFORMACIÓN

6

Page 7: Analista-programador Cobol - Módulo 1.2

3. CONCEPTO DE METODO DE ACCESO A LA INFORMACION DE LOS FICHEROS.

Los métodos de acceso a ficheros son el conjunto de técnicas que tienen por objeto facilitar la búsquedade información dentro de la organización física de los ficheros.

Esta función la realizan el Subsistema de Gestión de Ficheros integrado en el Sistema Operativo, que actúacomo intermediario entre la “organización física” y la “organización lógica” (lo cual, es transparente alusuario).

Los principales métodos son: ACCESO SECUENCIAL, ACCESO DIRECTO y ACCESO DINAMICO. El acceso Dinámico,se usa, para procesar un mismo fichero empleando los dos métodos de acceso anteriores a la vez.

ACCESO SECUENCIAL (SEQUENTIAL)

Permite procesar registros secuencialmente, es decir, se leen o actualizan en el mismo orden en el que seencuentren. Para acceder a un determinado registro es imprescindible, recorrer todos los anteriores hastallegar a él.

Es el tipo de acceso que se asume por defecto.

ACCESO DIRECTO (RANDOM)

Permite acceder directa y aleatoriamente a cualquier registro del fichero.

Es posible el acceso directo con ficheros Indexados (ISAM, y VSAM-KSDS) y también en ficheros Relativos (yVSAM-RRDS).

SECUENCIAL Y DIRECTO A LA VEZ (DYNAMIC)

Este tipo de acceso en realidad es una mezcla de los dos anteriores.

Nos permite acceder directamente a un determinado registro lógico y después secuencialmente, todos losque estén grabados a continuación de él, hasta el final del fichero.

TIPOS DE ARCHIVOS DE INFORMACIÓN

7

Page 8: Analista-programador Cobol - Módulo 1.2

CONCEPTOS BÁSICOS SOBRE FICHEROS

La información almacenada en ficheros debe ser persistente, es decir, no debe verse afectada por la creacióny finalización de los procesos. La gestión de ficheros es tarea del sistema operativo, y la parte del mismo querealiza dicha gestión se conoce como sistema de ficheros.

Desde el punto de vista de los usuarios, el aspecto más importante de un sistema de ficheros es cómo éstese presenta a ellos. Es decir, qué es un fichero, cómo se nombra, qué operaciones se permiten, etc. Endefinitiva, al usuario le interesa saber qué es lo que puede hacer. Desde el punto de vista de los diseñadoresde sistemas, lo interesante es saber cómo está implantado el sistema de ficheros.

Veamos ahora una serie de conceptos básicos:

- Registro lógico: Un registro es una colección de información relativa a una entidad particular. Portanto, el registro va a contener a todos aquellos campos lógicamente relacionados, referentes a unadeterminada entidad, y que pueden ser tratados globalmente por un programa. Por ejemplo lainformación de un determinado alumno, que contiene los campos DNI, nombre, apellidos, fecha denacimiento, etc.

- Clave de un registro lógico: Una clave es un campo o conjunto de campos de datos que identificaal registro lógico y lo diferencia del resto de registros lógicos del fichero. Por tanto, esta clave debeser distinta para cada registro.

- Registro activo: El registro lógico que va a procesarse en la siguiente operación del fichero.

- Apuntador: Marca interna que siempre apunta al registro lógico activo. Se incrementaautomáticamente cada vez que se procesa un registro (se lee o se escribe).

- Marca de fin de fichero: Una marca situada al final de cada fichero, para no acceder mas allá delúltimo registro lógico existente, ya que el tamaño del fichero no está limitado y no se conoce apriori. Existe una función lógica, eof (end of file), que toma el valor verdadero cuando llegamos alfinal del fichero y falso en caso contrario.

TIPOS DE ARCHIVOS DE INFORMACIÓN

8

Page 9: Analista-programador Cobol - Módulo 1.2

- Registro físico o bloque: Un registro físico o bloque es la cantidad más pequeña de datos que puedentransferirse en una operación de entrada/salida entre la memoria principal del ordenador y losdispositivos periféricos o viceversa. El tamaño del bloque o registro físico dependerá de lascaracterísticas del ordenador. En la mayoría de los casos el tamaño del bloque suele ser mayor queel del registro lógico. La adaptación consiste en empaquetar en cada bloque tantos registros lógicoscomo se pueda. El empaquetamiento puede ser de tipo fuerte o débil, según que se permita o noaprovechar el sobrante de un bloque, situando registros a caballo entre dos bloques contiguos.

- Factor de bloqueo: Factor de bloqueo es el nº de registros lógicos que puede contener un registrofísico.

TIPOS DE ARCHIVOS DE INFORMACIÓN

9

Page 10: Analista-programador Cobol - Módulo 1.2

4. OPERACIONES TIPICAS QUE SE HACEN CON LOS FICHEROS

Una vez visto lo que es un fichero y los principales conceptos al hablar de ellos, pasemos ahora a estudiarlosdesde un punto de vista operativo. Básicamente se trata de responder: ¿qué operaciones se pueden realizarsobre un fichero?. La respuesta es:

- Creación: Para poder realizar cualquier operación sobre un fichero es necesario que haya sido creadopreviamente, almacenando sobre el soporte seleccionado la información requerida para su posteriortratamiento, como por ejemplo el nombre del dispositivo, el nombre del fichero, etc. Conanterioridad a la creación de un archivo se requiere diseñar la estructura del mismo mediante loscampos del registro, longitud y tipo de los mismos.

- Apertura: Para poder trabajar con la información almacenada en un fichero, éste debe estar abierto,permitiendo así el acceso a los datos, dando la posibilidad de realizar sobre ellos las operaciones delectura y escritura necesarias.

- Cierre: Una vez finalizadas las operaciones efectuadas sobre el fichero, éste debe permanecercerrado para limitar el acceso a los datos y evitar así un posible deterioro o pérdida de información.Para cerrar un fichero previamente debe estar abierto.

- Actualización: Esta operación permite la puesta al día de los datos del fichero mediante la escriturade nuevos registros (alta) y la eliminación (baja) o modificación de los ya existentes. La actualizaciónpuede afectar a parte o la totalidad de los registros del fichero. Cuando se escribe un nuevo registroen el fichero se debe comprobar que no existe previamente. La baja de un registro puede ser lógicao física. Una baja lógica supone el no borrado del registro en el archivo. Esta baja lógica se manifiestaen un determinado campo del registro con una bandera, indicador o “flag”, o bien con la escriturao rellenado de espacios en blanco en el registro específico. Una baja física implica el borrado ydesaparición del registro, de modo que se crea un nuevo archivo que no incluye al registro dado debaja.

- Consulta: Tiene como fin visualizar la información contenida en el fichero, bien de un modocompleto, bien de modo parcial.

- Borrado o destrucción: Es la operación inversa a la creación de un fichero. Consiste en la supresiónde un fichero del soporte o dispositivo de almacenamiento. El espacio utilizado por el archivo borradopuede ser utilizado por otros archivos. Para borrar un fichero tiene que estar cerrado.

TIPOS DE ARCHIVOS DE INFORMACIÓN

10

Page 11: Analista-programador Cobol - Módulo 1.2

- Ordenación o clasificación: Consiste en lograr una nueva disposición sobre el soporte de los registrosde un archivo, con una secuencia de ubicación determinada por el valor de uno o varios campos.

- Compactación o empaquetamiento: Esta operación permite la reorganización de los registros de unfichero eliminando los huecos libres intermedios existentes entre ellos normalmente ocasionados porla eliminación de registros.

TIPOS DE ARCHIVOS DE INFORMACIÓN

11

Page 12: Analista-programador Cobol - Módulo 1.2

5. LAS BASES DE DATOS.

Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto yalmacenados sistemáticamente para su posterior uso. En este sentido, una biblioteca puede considerarse unabase de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para suconsulta. En la actualidad, y debido al desarrollo tecnológico de campos como la informática y la electrónica,la mayoría de las bases de datos están en formato digital (electrónico), que ofrece un amplio rango desoluciones al problema de almacenar datos.

Existen unos programas denominados sistemas gestores de bases de datos, abreviado SGBD, que permitenalmacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de estosSGBD, así como su utilización y administración, se estudian dentro del ámbito de la informática.

Tipos de bases de datos.Las bases de datos pueden clasificarse de varias maneras, de acuerdo al criterio elegido para su clasificación:

Según la variabilidad de los datos almacenados:

Bases de datos estáticas: Éstas son bases de datos de sólo lectura, utilizadas primordialmente paraalmacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de unconjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.

Bases de datos dinámicas: Éstas son bases de datos donde la información almacenada se modifica con eltiempo, permitiendo operaciones como actualización y adición de datos, además de las operacionesfundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema deinformación de una tienda de abarrotes, una farmacia, un videoclub, etc.

Según el contenido:

Bases de datos bibliográficas: Solo contienen un surrogante (representante) de la fuente primaria, quepermite localizarla. Un registro típico de una base de datos bibliográfica contiene información sobre el autor,fecha de publicación, editorial, título, edición, de una determinada publicación, etc. Puede contener unresumen o extracto de la publicación original, pero nunca el texto completo, porque sino estaríamos enpresencia de una base de datos a texto completo (o de fuentes primarias—ver más abajo). Como su nombrelo indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis delaboratorio, entre otras.

TIPOS DE ARCHIVOS DE INFORMACIÓN

12

Page 13: Analista-programador Cobol - Módulo 1.2

Bases de datos de texto completo: Almacenan las fuentes primarias, como por ejemplo, todo el contenidode todas las ediciones de una colección de revistas científicas.

Modelos de bases de datos:

Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de acuerdoa su modelo de administración de datos.

Un modelo de datos es básicamente una “descripción” de algo conocido como contenedor de datos (algo endonde se guarda la información), así como de los métodos para almacenar y recuperar información de esoscontenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementaciónde un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos matemáticos.

Algunos modelos con frecuencia utilizados en las bases de datos:

- Base de datos relacional- Bases de datos orientadas a objetos- Gestión de bases de datos distribuida- Bases de datos jerárquicas- Base de datos de red- Bases de datos documentales- Bases de datos documentales- Bases de datos multidimensionales

TIPOS DE ARCHIVOS DE INFORMACIÓN

13