Concepto Basico de Archivos

31
“ Conceptos Básicos de Archivos” Instituto Tecnológico de Instituto Tecnológico de Hermosillo Hermosillo

description

Se explicaràn los diferentes tipos de archivos y su utilizacion

Transcript of Concepto Basico de Archivos

Page 1: Concepto Basico de Archivos

“ Conceptos Básicos de Archivos”

Instituto Tecnológico de HermosilloInstituto Tecnológico de Hermosillo

Page 2: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Al igual que en otras disciplinas la información se esquematiza como un sistema de Entrada, Proceso y Salida.

En donde los datos (entrada) son el insumo que requieren del procesamiento (proceso) para producir la Información (salida).

Page 3: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

                             

Entrada de Datos

Procesamiento de Datos

Salida de Información

Page 4: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Datos: Sucesos, hechos, eventos que son REGISTRADOS a través de medición (cuantitativa o cualitativa), observación, etc.

Información: Son datos manipulados o procesados que son presentados de manera adecuada a los usuarios para servir de soporte a la toma de decisiones (organizaciones) con las características de Exactitud, Relevancia y Oportunidad

Page 5: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

• Capacitación.

•Captura.

•Registro.

• Ordenamiento.

• Op. Aritméticas.

• Op. Lógicas.

• Presentaciones de Reportes.

• Condensados.

• Consultas.

• Sumarios

• Usuarios Directos.

•Usuarios Indirectos

Page 6: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Tipo de Datos Estructura de Datos Organización de Archivos

Primitivos

Compuestos

Simple Compuesto

Entero Arreglo Lineal No lineal

Secuencial

Booleano Registro Cola Árbol Binario

Relativo

Carácter Cadena Pila B-Tree Indexado

Real Lista B+Tree Multillave

Árbol General

Page 7: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Campo: Los datos pueden ser representados por números y caracteres, de tal manera que un dato como el nombre de un empleado, el número de control de un alumno o un precio pueden ser identificados por un elemento que se le llama campo, entonces obtendríamos los campos, nombre, control y precio.

Registro: Un registro es el conjunto completo de datos relacionados pertenecientes a una entrada, tal como un cheque bancario. Al ser considerado como una unidad única, el cheque bancario es, por lo tanto, un registro que consta de 7 campos separados, todos ellos relacionados con la transacción de pago.

Archivo: Un archivo es una colección de registros relacionados. Se incluye cada registro en un archivo ya que pertenece a la misma entidad. Por ejemplo un archivo de cuentas está formado solamente por las cuentas de los clientes.

Page 8: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

En computación el término Archivo tiene varios significados y clasificaciones:

Archivos de texto: secuencia de caracteres (ASCII).

Archivos de datos: Son estructurados, o también conocido como FORMATEADOS ( con comas, espacios fijos puntos y comas etc.)

Page 9: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Archivo Maestro: Contiene los datos que representan el estado actual de una organización o empresa.

Archivo Trabajo: Son los archivos auxiliares utilizados por los programas y que son regularmente borrados por estos una vez que son utilizados. Se dice que son transparentes para el usuario.

Archivo Respaldo: Es una copia obtenida del archivo maestro con el sentido de proteger los datos en caso de que el maestro se deteriore.

Archivo Fuente: Contiene el código de algún lenguaje de programación que utiliza los datos para procesarlos en alguna solución para la empresa

Archivo de Transacciones: También es auxiliar en el proceso de Actualización del archivo maestro (siempre y cuando sea archivo Secuencial).

Page 10: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Archivos de Entrada (input): Son los archivos que “alimentan” un procesamiento de datos, o sea solo son leídos, ejemplo: El archivo de transacciones en el procesamiento de la actualización del maestro en la organización secuencial.

Archivos de Salida (output): son los archivos que solo son escritos, y son donde los datos de salida de un procesamiento son escritos. Ejemplo el archivo de transacciones rechazadas en la actualización del maestro en la organización secuencial.

Archivo de Entrada/Salida (input/output): Estos archivos son leídos y escritos en el procesamiento de datos, o sea proporcionan los datos de entrada al proceso y también los datos procesados son escritos en el mismo. Ejemplo los archivos directos implementados en dispositivos de acceso aleatorio, presentan esta característica.

Page 11: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Archivos Secuenciales: (datos en forma contigua, se puede guardar tanto cinta, como en discos magnéticos, impractico para el acceso directo de un dato)

Archivos Directos: Necesitan se guardados en dispositivos de acceso directo( disco, etc.) , el acceso directo a un  solo dato si puede ser efectuado.

Archivos Indexados: También se puede conseguir el acceso directo a un dato especifico sobre un archivo secuencial que es el de datos, aunque se requiere para hacerlo de un archivo auxiliar llamado índice.

Archivos Multillave: El acceso directo puede realizarse con características distintas de los datos, para hacerlo requiere de varios índices organizados en un archivo.

Page 12: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Creación: Esta operación hace “nacer” un archivo con los datos que son escritos por algún procesamiento. Existen dos formas: Cargado de registros y Creación de estructura(esqueleto) previa al guardado de datos.

Actualización: Es el procesamiento en el cual los registros pueden tener las siguientes modificaciones: baja o eliminación de registros de datos, modificación de registros de datos o Alta o agregación de registros.

Mantenimiento: Es el proceso que permite agregar, modificar o eliminar CAMPOS del archivo. Existen dos tipos de mantenimiento: Reorganización: cambiar la organización a otra. Reestructuración: cambios con los tipos y/o tamaños de

campos Recuperación: Es el acceso a un archivo con el propósito de

extracción de información, si el volumen a extraer es bajo se dice que es una consulta y normalmente se despliega por pantalla, su modo de procesamiento es interactivo. Si el volumen es alto, es la generación de reportes, el modo de procesamiento

es en Lote.

Page 13: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Volatilidad: se refiere a las supresiones, adiciones y cambios que se efectúan en un periodo determinado. Cuando se acceda a un archivo varias veces en una jornada, se dice que tiene elevada volatilidad. Ejemplo: sistemas de reservación, bancos, etc.

Actividad: Es la medida de proporción de registros que se accedan en un lote de actualización. La proporción de actividad es igual al numero de registros procesados en un Lote, comparado con el numero de registros total del archivo.

Tamaño: Se refiere al espacio ocupado por el archivo en el medio de almacenamiento. Debe considerarse no solo la ocupación actual del archivo sino también la posibilidad de un crecimiento futuro.

Page 14: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Abrir: Esta operación permite tener acceso posteriormente a los registros de datos para acceder.

Cerrar: esta operación busca proteger los datos de los archivos a posibles accesos por error.

Leer registro: Esta operación de lectura lleva información (bloque de datos) del registro leído en el medio de almacenamiento a la memoria.

 Grabar registro: Esta operación lleva un (bloque de datos) registro de la memoria hasta el medio de almacenamiento.

Saltar al registro N: Esta operación lleva el puntero hasta un registro especifico (N). Solo para archivos organizados directos.

  Reinicio de apuntador: esta operación lleva el apuntador a hasta el inicio del archivo.

Page 15: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

El registro es un tipo de dato estructurado  constituido por un conjunto de elementos (campos) que pueden ser de diferentes tipos de datos, ejemplo:

Registro: empleado             Elementos del registro empleado:       Numero (Entero)                                                                        Nombre (Cadena[30])                                                                        Departamento (Entero)                                                                        Puesto (Entero)                                                                        Sueldo (Real)Definición de registros:                        Declaraciones                                    Variables                                                NomRegistro: Registro                                                            Dato1: Tipo de dato                                                            Dato2: Tipo de dato                                                            .                                                            DatoN: Tipo de dato                                                FinRegistro

Page 16: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Abrir archivo Escritura “X”Leer datos A , BDO ESCRIBIR REGISTRO CON DATOS A Y B EN EL ARCHIVO            “X” Leer datos A, BWHILE A <> 0                        El siguiente algoritmo permite agregar registro a un archivo previamente

creado: Abrir archivo Agregación “X” Leer datos A , B DO AGREGAR REGISTRO CON DATOS A Y B EN EL ARCHIVO “X” Leer datos A, B WHILE A <> 0

Page 17: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

INICIOAbrir el archivo para lectura X.LEER REGISTRO DEL ARCHIVO. WHILE no sea fin de archivo            1. IF es una bandera de control                        THEN                                    A. Imprimir resumen  y

pie de página            2. ENDIF            3. Imprimir detalle para este registro            4. Acumular a totales            5. Leer siguiente registro DEL ARCHIVOENDWHILEImprimir resumen y pie de páginaFin

Page 18: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Al estar utilizando un  archivo secuencial como MAESTRO, el realizar las operaciones de actualización se llevará con el auxilio de un archivo de transacciones, debido a que se realizará el proceso en lote para que sea mas eficiente. El proceso se muestra en la siguiente figura:

Archivos Transaccion

es Modificado

Archivo Maestro Nuevo

Archivo Maestro

Viejo

Archivo Transaccion

es Rechazadas

Actualización

Page 19: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Abrir archivo Lectura “X”Colocar puntero al inicio del archivoSolicitar Numero registro a buscarLeer NMover puntero hasta registro NIF existe Registro THEN            Leer Registro Datos en el archivo en

REG            |Imprimir REGelse            Imprimir “no se encontró el registro

buscado”endiffin

Page 20: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

La transmisión de información entre memoria primaria y secundaria se lleva a cabo a través de operaciones básicas de lectura y escritura de registros pero con unidades de tamaño fijo denominados lotes, de tal manera que se pueden definir de la siguiente manera:

Bloque:  Es la cantidad más pequeña de datos que puede ser transferida entre memoria secundaria y primaria en un acceso a un archivo.

Page 21: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Los datos son arreglados de acuerdo a alguna relación abstracta, esto es, depende de la aplicación requerida. El usuario siempre ve el archivo como una secuencia de registro continuo o elementos lógicos.

            Los registros pueden ser de longitud fija o longitud variable, los cuales pueden tener llave o no tenerla, los registros fijos son elementos lógicos del mismo tamaño, y los registros variables son elementos lógicos de diferentes tamaños.

            La longitud fija en el tamaño del campo produce un desperdicio de espacio, pero en cambio facilita la localización y extracción de la información en dicho campo, al no tener que preocuparse por su tamaño.

           

Page 22: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

En el caso de longitud variable sucede al revés, hay un mejor aprovechamiento en espacio, pero se complica la localización y extracción de información.

·         Si el registro contiene un número fijo de campos de longitud fija cada uno de ellos, entonces será de longitud fija.

·         Si el registro contiene un número variable de campos de longitud fija cada uno de ellos, entonces será de longitud variable.

·         Si el registro contiene un número variable de campo en que alguno de ellos sea de longitud variable, entonces será de longitud variable.

Page 23: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Los datos son arreglados por su adyacencia física, esto es, dependiente del dispositivo de almacenamiento secundario; cintas magnéticas o discos magnéticos (discos flexibles, discos duros, paquete de disco, etc.). Los registros son de tamaño fijo o tamaño variable y pueden organizarse de varia formas para constituir archivos físicos.

Page 24: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

En este dispositivo el archivo físico está formado por un conjunto de registros físicos, los bloques están organizados en forma contigua, ya que se asignan en forma consecutiva.

            La cinta magnética es uno de los medios más conocidos y menos caros de almacenar datos en sistemas de todos los tamaños. Este método de almacenamiento secundario de archivos tiene ventajas y desventajas específicas que se deben superar.

            Los datos se almacenan a lo largo de la superficie de la cinta en una densidad específica, medida en bytes/pulgada (bpi). La densidad estándar del registro se mide por el número de bpi. La densidad de los sistemas de red principal es de 1600 y 6250 bpi.

Page 25: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

La densidad de registros de una unidad de cinta magnética es fija y no se puede alterar, pero muchos modelos tienen la opción de almacenar en dos tipos de densidad distintas.

  Los datos se leen o se miden en la cinta en bloques de registros físicos y solo cuando la cinta se mueve hacia delante, a través de la unidad de cinta, esta pasa por la cabeza de lectura y escritura de la unidad. La cinta, para y recomienza cuando el sistema le dice ala unidad cinta que lea el siguiente registro físico.

   Con el fin de permitir un espacio para que la unidad de cinta se detenga y recomience el movimiento de la cinta sin perder datos, se utiliza espacios entre los bloques para separar cada bloque. Un espacio entre los bloques (también llamado espacio entre los registros) es un longitud de cinta en blanco que mide 0.3 pulgadas.

Page 26: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Para hacer un mejor uso del espacio de almacenamiento, usualmente los analistas en sistemas reducen el número de los espacios necesarios entre los lotes mediante la creación de bloques.

            Cada registro físico, ya sea que contenga 1 byte de datos o una entidad mucho mayor, es precedido y seguido por un espacio entre los bloques.

La creación de bloques ocurre cuando el sistema almacena varios registros lógicos dentro de un único  registro físico. El número de registro en el bloque se llama factor de bloqueo. Si almacenar un archivo de registros médicos en una cinta magnética, el analista especifica un factor de 30, el sistema almacenará 30 registros lógicos dentro de cada bloque.

            Todos los bloques en un archivo de cinta magnética utilizan el mismo factor de bloqueo.  Así, si un bloque es registrado con un factor de 30, todos juntan en bloques de 30.un bloque puede ser tan grande como sea necesario, siempre que se pueda leer en la memoria principal aun tiempo.

            La longitud máxima de cualquier bloque esta determinada, por el

número que puede contener el buffer.

Page 27: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Los datos se escriben o se leen de los discos solo cuando esta girando dentro de la unidad de disco. La rotación del disco varía de aproximadamente 200 a varios miles de revoluciones por minuto, dependiendo del drive que se utilice

            Las cabezas de lectura y escritura detectan en forma electrónica los datos almacenados en la superficie del disco. Normalmente, las cabezas de lectura y escritura son parte del drive, sin embargo en los sistemas Winchester, las cabezas vienen sellados en el mismo paquete del disco para mejorar la velocidad de acceso.

            Los datos se almacenan en la superficie del disco en una o mas pistas, que son círculos concéntricos con una capacidad fija de almacenamiento medido en bytes con pista. Los disquetes pequeños tienen menos de 34 pistas por superficie, mientras que los grandes tienen varios cientos de pistas por superficie. Cada pista se identifica mediante un número (desde 0 en orden ascendente con movimientos de 1) y un número de superficie.

Page 28: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Las cabezas de lectura y escritura en un disco están instaladas juntos.

Las cabezas en cada superficie pueden accesar una sola pista en esa superficie. Por lo tanto, si existen 20 superficies en un paquete de disco, el sistema puede escribir o leer de cualquiera de las 20 pistas. Cuando el brazo de acceso se posiciona. Las pistas identificadas con el mismo número forman  lo que se conoce como un cilindro.

  Para accesar aun registro específico, el programa debe terminar y especificar el cilindro y superficie donde se encuentra el  registro.

Este concepto es un aspecto importante de los dos métodos de direccionamiento utilizadas en dispositivos de acceso directo:

Direccionamiento de pista y de sector.

Page 29: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

La forma de direccionamiento de uso más común en la computadoras grandes utiliza el concepto de direccionamiento, pista /cilindro.

Punto Índice: La distribución general de una pista bajo el concepto de pista /cilindro, consiste de un punto índice, dirección inicial, registro descriptor de la pista y registro de datos. El punto índice señala el comienzo de una pista, todas las pistas del disco están sincronizadas con el punto índice.

Dirección Inicial: Durante la inicialización, el sistema escribe la dirección inicial y la pista.

            Si por alguna razón el sistema no se puede escribir una dirección inicial, el dispositivo no se puede utilizar. La dirección inicial consta de 4 datos.

·         El byte bandera indica si la pista es una pista primaria o alternativa.

·         El cilindro y más número de carga de lectura y escritura identifican juntos una pista específica en el disco, característica esencial para los métodos de direccionamiento directo y por hashing.

·         Los bytes de verificación son par la detección de errores.

Page 30: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Es el registro descriptor de la misma, el cual describe como se organizan los datos de la parte restante de la misma. Se incluyen nueve datos. Bytes bandera, número de cilindros, número de cabeza de lectura y escritura, se repiten en el registro descriptor. Ya  que en caso de que surja la necesidad, se puedan mover los datos de una pista primaria a una alternativa.

            El número de registro es el número secuencial del registro en la pista.

            Los números de cilindro, cabeza y registro conforman la identificación del registro, la cual distingue un registro en un disco de otro y, junto con los detalles de longitud de los datos, describe el área tomada en cuenta.

            El byte de longitud de la llave y los bytes de longitud de los datos describe la cantidad de espacio abarcado por cada registro. Los bytes de longitud de los datos son instrumentos para almacenar los registros de longitud variable, los bytes de verificación son para control de errores.

Page 31: Concepto Basico de Archivos

Unidad I: “Conceptos Básicos de Archivos” Organización de Datos

Regresar a Índice de Unidades