Archivo Secuencial-Indexado

14
“ Archivo Secuencial Indexado ” Instituto Tecnológico de Instituto Tecnológico de Hermosillo Hermosillo

description

Se mostrara la estructura de los archivos secuencial-indexado asi como la representacion de indices y las operaciones relacionadas con este tipo de archivos

Transcript of Archivo Secuencial-Indexado

Page 1: Archivo Secuencial-Indexado

“ Archivo Secuencial Indexado ”

Instituto Tecnológico de HermosilloInstituto Tecnológico de Hermosillo

Page 2: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Una de las organizaciones de archivos más ampliamente usada es la secuencial indexada, la cual es posible el acceso a un registro en particular (aleatoria) y el proceso secuencial a partir del inicio del archivo en cualquier otro registro del archivo.

     Cada registro en el archivo se identifica por medio de un número o un grupo de caracteres exclusivos; la llave primaria.

     Los registros se almacenan según una secuencia física dada, este ordenamiento mas usualmente es de disponerlos en el orden indicado por la llave, con lo cual permite un procesamiento secuencial de los registros precisamente en el orden en que están distribuidos en el archivo y también es posible el procesamiento aleatoria, en el que se llega a los registro en un orden cualquiera.

Page 3: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

El índice puede definirse como una entidad que opera con un procedimiento que acepta información acerca de cierto valor de atributo, como entrada, y provee como salida una información que permite la rápida localización del registro de le llama primario al índice que utiliza como entrada la llave primaria y da como salida una información referente a la ubicación física del registro.

       Para que la búsqueda sea más eficiente y reducir el tamaño del archivo índice, los campos referentes a la información asociada se almacenan separadamente, con los cual se tendrá que considerar una colección ante la llave y los datos asociados, esta es a través de un apuntador.

Page 4: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Al tener un apuntador fuera de la estructura califica al archivo como índice, en cual básicamente es una colección de pares, llaves-dirección.

     Si este archivo contiene un par llave-dirección para cada registro de la colección de datos se le llama índice denso, de otra  manera índice no denso se le llama índice disperso.

Índice Datos

Page 5: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Una forma sencilla de ver la estructura de un archivo índice es la de un árbol de búsqueda binaria, el cual es usado para cumplir el requerimiento de acceso particular a un registro, esta es una organización no secuencial indexada 

Page 6: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

D

B

G

A

C

E

J

1

2

3

Datos no ordenados

D 1

B 2 G 3

A 4 C 5 D 6 J 7

Llave Dirección

Page 7: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Ventajas: Permite procesar el archivo secuencialmente por orden

lógico y también procesarlo al azar.  La organización secuencial indexada es conveniente para

archivos con mediana volatilidad, actividad variable y tamaño relativamente estable.

Desventajas: Los índices requieren espacio extra, se necesita una doble

búsqueda; una en el índice y otra en el archivo. Los registros deben ser de longitud fija. El archivo debe estar separado por un dispositivo de acceso

aleatorio; no se puede utilizar en cintas magnéticas.

Page 8: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Muchas técnicas para organizar un archivo como índice han sido propuestas. No todos los esquemas sencillos pueden ser óptimos para todas las aplicaciones, se utilizan principalmente las técnicas para implementar un índice Árbol y Árbol B+.

ARBOL B Una de las estructuras que más ampliamente se ha 

usado para organizar un índice en un sistema de base de datos y en administradores de archivos tradicionales es el árbol B. (B Tree).

Un árbol B es una clase especial de árbol multicamino equilibrado que permite recuperar, eliminar e insertar registros de un archivo extremo con buen rendimiento en el peor caso.

Page 9: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

ABC EF HDK MN PQ ST VW Y7

DG ORUX

LÁrbol B (Orden 5)

Page 10: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Formalmente, un árbol de M vías es un árbol de búsqueda de orden M con las siguientes propiedades:

1.- Cada nodo del árbol, excepto la raíz y las hojas tienen al menos [ ½ * M] subárboles y no más de M subárboles.

2.- La raíz del árbol tiene al menos dos subárboles, si es que no es una hoja. 

3.- Todas las hojas del árbol están al mismo nivel.  Las estructuras que se usan en el árbol B están

basadas en tres tipos de nodos: 1.- Un bloque para el nodo raíz 2.- Nodos bloque para las ramas 3.- Nodos bloque para las hojas

Page 11: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

El nodo raíz inicia la estructura del árbol. Una hoja es un nodo terminal sin hijos. El tamaño de un nodo (bloque) es usualmente elegido para reflejar algún múltiplo del tamaño del bloque del disco.

     Hay varias formas de organizar las hojas, una de ellas es que el archivo principal esta almacenado solo en las hojas, y que cada hoja ocupa un bloque. También es importante hacer notar si se trata de un índice denso, en tal caso se tendrá que mantener en cada nodo la dirección de la información asociada al valor de la llave, o sise trata de in índice disperso donde se tendría ciertos valores de llaves en el índice y en las hojas existirían todos los valores de llaves que propiamente es el archivo principal.

Page 12: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Búsqueda Aleatoria

Búsqueda SecuencialÍndice como Árbol B

Page 13: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

En un árbol B+, todas las llaves en las hojas. Los niveles superiores, los cuales están organizados como un árbol B, consisten únicamente de un índice para localizar rápidamente. 

Los nodos índices y los nodos hoja pueden tener diferentes formatos o tamaños. Los nodos hoja son usualmente encadenados juntos de izquierda a derecha, ósea por el valor de la llave.

 La lista de hojas es referida como el conjunto secuencia, lo cual permite un fácil procesamiento secuencial.

  Para el proceso de búsqueda se realiza desde la raíz del

árbol a través del índice hasta una hoja. Ya que todas las llaves residen en las hojas, no todos los valores de llaves son encontrados en la trayectoria de búsqueda, si no hasta llegar a la hoja correcta

Page 14: Archivo Secuencial-Indexado

Unidad III: “Archivo Secuencial-Indexado” Organización de Datos

Regresar a Índice de Unidades