Cap1.2 Estructuras de Almacenamiento Secundario

39
1.2. Estructuras de Almacenamiento secundario

description

Cap1.2 Estructuras de Almacenamiento Secundario

Transcript of Cap1.2 Estructuras de Almacenamiento Secundario

  • 1.2. Estructuras deAlmacenamiento secundario

  • ESTRUCTURAS DE ALMACENAMIENTO SECUNDARIO

    Objetivos:

    Describir la estructura fsica de los dispositivosde almacenamiento secundario y terciario

    Explicar las caractersticas de los dispalmacenamiento masivo y sus prestaciones

    Analizar los servicios que el SO proporcionapara el almacenamiento masivo

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Hay varios tipos de buses:

    EIDE

    ATA

    ATA serie

    USB

    Fiber channel

    SCSI

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • 1.2.1. Estructura de Discos

  • Estructura de un disco Las unidades de discos se direccionan como grandes

    matrices unidimensionales de bloques lgicos, bl es la unidad mas pequea de transferencia, 512 -1024 bytes

    1.-Sectores defectuosos, el proceso de mapeo usa sectores libres

    2.- el numero de sectores por pista no es constante en algunas unidades de disco (CLV deber)

    Numero de s/p aumentado, numero de cilindros por disco incrementado, los discos tienen decenas de miles de cilindros

    Como es la estructura de SSD ??

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Conexin de un disco

    Almacenamiento conectado al host (discos respaldo, scsi)

    Almacenamiento conectado a la red (NAS)

    Redes de rea de almacenamiento (SAN)

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Almacenamiento conectado al host

    Se conecta a travs de puertos de e/s locales, Arquitecturas: IDE, ATA, SATA, SCSI, FiberChannel.

    (Inv-exposicion: sata, scsi, fiber channel)

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Un dispositivo NAS (Network Attached Storage) es un sistema de almacenamiento de propsito especial que se accede remotamente a travs de una red de datos.

    Los clientes acceden por RPC Computadoras en una LAN comparten un pool de

    almacenamiento con la misma facilidad de naming y acceso como si fuera almacenamiento local

    Qu es iSCSI? inv-exposicin

    Jorge Crespo Cedeo. Note some content based on 2009 Silberschatz.

    Almacenamiento Conectado a Red (NAS)

  • SAN (Storage Area Network) es una red privada que conecta servidores con unidades de almacenamiento Soluciona problema de NAS: operaciones de

    almacenamiento consumen BW de red de datos

    Flexibilidad

    Jorge Crespo Cedeo. Note some content based on 2009 Silberschatz.

    Redes de rea de Almacenamiento (SAN)

  • Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • 1.2.2. Planificacin deDiscos

  • Planificacin de disco

    Una responsabilidad del SO es utilizar de maneraeficiente el hardware disponible

    Los discos tienen un Tiempo de Acceso consta de: Tiempo de bsqueda es tiempo requerido para

    que el brazo del disco mueva los cabezales hastael cilindro que contiene el sector deseado.

    Latencia rotacional es tiempo adicional que eldisco rote y site el sector deseado bajo el cabezaldel disco.

    Ancho de banda del disco es numero total debytes transferidos.

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Solicitud tiene varios elementos de informacin

    La operacin es una entrada o salida

    Cual es la direccin de disco para la transferencia

    Cual es la direccin de memoria para la transferencia

    Cual es el numero de sectores a transferir

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Microdrive IBM/Hitachi

    Western Digital Drivehttp://www.storagereview.com/guide/

    Cabeza Read/WriteVista Lateral

    Disco Duro

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Sector

    Pista

    Plato Propiedades

    La cabeza se mueve para dirigirse a una pista circular de informacin Elemento direccionable independientemente: sector

    SO siempre transfiere grupos de sectores juntosbloques

    Items direccionables sin la cabeza movil: cilindro Un disco puede ser re-escrito: es posible leer/modificar/escribir un

    bloque desde el disco

    Nmeros tpicos (dependiendo del tamao del disco): 500 a ms de 20.000 pistas por superficie 32 a 800 sectores por pista

    Grabacin de bits acorde a la zona Densidad de bit constante: ms sectores en pistas externas Velocidad vara con la localizacin de la pista

    Pista

    Sector

    Cilindro

    Cabeza

    Propiedades de un Disco Magntico Duro

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Rendimiento del disco/sistema de arhivos Mtricas: Tiempo de Respuesta, Throughput

    Factores que contribuyen alatencia: Software paths (pueden ser

    flojamente modelados poruna cola)

    Controlador de Hardware

    Medio del disco fsico

    Comportamiento de la Cola: Lleva a grandes incrementos de latencia

    en cuanto la utilizacin se acerca al 100%

    100%

    ResponseTime (ms)

    Throughput (Utilization)(% total BW)

    0

    100

    200

    300

    0%

    Propiedades de un Disco Magntico Duro (Cont.)

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Datos de lectura/escritura es un proceso de 3 etapas: Tiempo de bsqueda: posicin de la cabeza/brazo sobre la pista

    apropiada (en el cilindro correspondiente)

    Latencia rotacional: esperar por el sector deseadoa que rote bajo la cabeza de lectura/escritura

    Tiempo de transferencia: transfiere un bloque de bits (sector)bajo la cabeza de lectura/escritura

    Latencia del disco = Tiempo en cola + Tiempo del controlador +Tiempo de bsqueda + Tiempo de rotacin + Tiempo de transferencia

    Mximo Ancho de Banda: Transfiere un gran grupo de bloques secuencialmente desde una pista

    Cola deSoftware

    (Device Driver)

    Co

    ntro

    lado

    r

    de

    HW

    Tiempo del Medio(Seek+Rot+Xfer)

    Reque

    st

    Result

    Modelo del Rendimiento

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Existen algoritmos de planificacin de discos para que el SO procese las solicitudes

    Planificacin FCFS, first come, first server

    Planificacin SSTF, shortest seek time first

    Planificacin SCAN o exploracin

    Algoritmo C-SCAN, scan circular

    Planificacin LOOK

    Asignar para exposicin en clase

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Disco slo puede hacer un requirimiento en un momento; Qu ordenescoges para procesar los requerimientos en cola?

    Orden FIFO Justo entre los que requieren, pero orden de arrivo podran ser lugares

    aleatorios en el disco Bsquedas muy largas SSTF: Shortest seek time first

    Escoge el requerimiento ms cercano en el disco Aunque llamado SSTF, hoy en da debe inclur delay

    rotacional en el clculo, dado que la rotacin puedeser tan larga como la bsqueda

    Con: SSTF es bueno en reducir las bsquedas,pero podra llevar a starvation

    SCAN: Implementa el Algoritmo Elevador: toma elrequerimiento ms cercano en la direccin de viaje No starvation, pero retiene parecido con SSTF

    C-SCAN: Circular-Scan: slo va en una direccin Se salta cualquier requerimiento cuando regresa Ms justo que SCAN, no es biased a las pginas en el medio

    2,3

    2,1

    3,1

    0

    7,2

    5,2

    2,2

    HeadRequerimientosde usuario

    1

    4

    2

    Disk

    Head

    3

    Scheduling del Disco

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • 1.2.3. Administracin deDiscos

  • Administracin o gestin de disco

    El SO es responsable de otros temas de administracin del disco:

    Inicializacin del disco,

    Bloque de arranque o Arranque desde el disco y

    Recuperacin de bloques defectuosos.

    Instalar un disco en linux

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Inicializacin del disco: Disco en blanco, formato en cero

    Bloque de arranque: inicia los aspectos del sistema: registros del cpu, controladores de dispositivos, contenido de memoria principal y arranca el SO, esta en ROM

    Caso Windows

    Inv-Exposicion: Linux

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Bloques defectuosos

    El SO trata de leer el bloque lgico 87

    La controladora accede y comprueba que el bloque es defectuoso, informa al SO

    La sig vez que reinicie el sistema, se ejecuta un comando que informe a la controladora SCSI, para que utilice un sector reservado

    Desde ah la controladora utiliza el sector reservado

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • 1.2.4. Administracin delEspacio de Intercambio

  • Gestin del espacio de intercambio

    Es otra actividad de bajo nivel del SO

    La memoria virtual utiliza el espacio de discocomo una extensin de memoria principal.

    Es acceso a memoria es rpido.

    El objetivo es proporcionar mejor tasa detransferencia para el sistema de memoriavirtual.

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Forma extrema de Switch de Contexto: Swapping A fin de hacer espacio para el siguiente proceso, algunos o todos

    los procesos previos son movidos al disco Posiblemente se necesite enviar segmentos completos

    Esto incrementa bastante el costo de context-switching

    Alternativa deseable? Alguna forma de mantener slo porciones activas de un proceso

    en memoria en cualquier tiempo determinado Necesita control de granularidad ms fina sobre la memoria fsica

    Vista Esquemtica de Intercambio (Swapping)

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Utilizacin del espacio de intercambio Se usa para guardar la imagen completa de un

    proceso, incluyendo cdigo y segmento de datos Varia de la cantidad de memoria fsica RAM, de la

    cantidad de memoria virtual y forma que se utilice la mv.

    Desde megas a gigas Solaris sugiere que el E.I. igual al doble de

    memoria fisica disponible Linux utiliza un menor espacio, linux utiliza E.I. en

    disco separados, para que los mecanismos de paginacin se distribuya entre los dispositivos de e/s del sistema

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Ubicacin del espacio de intercambio

    Puede residir en dos lugares:

    En el sistema de archivos normal, puede crearlo, nombrarlo y asignarle el espacio, es poco eficiente

    En una particin de disco separada, para asignar y desasigmar bloques de la particion. Utilizando algoritmos optimizados para mayor velocidad

    Al E.I. se accede mas frecuente que a sistemas de archivos.

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Gestin del E. I:

    En linux solo se utiliza para la memoria annima o para las regiones de memoria compartidas por varios procesos.

    Permite establecer una o mas reas de intercambio

    Estan compuesta por ranuras de pagina de 4Kb

    Tambin usa un mapa de intercambio

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • 1.2.5. Confiabilidad de losDiscos

  • Suposiciones: Ignorar tiempos de controlador y colas por ahora Tiempo de bsqueda promedio de 5ms, delay rotacional promedio de

    4ms Tasa de transferencia de 4MByte/s, tamao de sector de 1 KByte

    Lugar aleatorio en el dico: Bsqueda (5ms) + Detaly Rot. (4ms) + Transferencia (0.25ms) Casi 10ms para buscar/poner datos: 100 KByte/sec

    Lugar aleatorio en el mismo cilindro: Delay Rot. (4ms) + Transferencia (0.25ms) Casi 5ms para buscar/poner datos: 200 KByte/sec

    Siguiente sector en la misma pista: Transferencia (0.25ms): 4 MByte/sec

    Clave para usar el disco eficintemente (esp. para sistemas de archivos) es minimizar los delays de bsqueda y rotational

    Rendimiento del Disco

    Kubiatowicz, CS162: Operating Systems and Systems Programming. http://www.cs.berkeley.edu/~kubitron/courses/cs162-F10/. Copyright 2010 UCB.

  • Algunas mejoras conllevan el uso de mltiplesdiscos trabajando coperativamente

    Disk Striping: Grupo de discos usados como unaunidad

    RAID (Redundant Array of Independent Disks) mejora el rendimiento y la confiabilidad del sistemade almacenamiento por medio de guardar datosredundantes

    Mirroring o shadowing mantiene un duplicado por cadadisco

    Block interleaved parity de bloque usa mucha menorredundancia

    Confiabilidad de discos (Reliability)

    Copyright Fred Kuhns (6/2/2015)

  • 1.2.6. Implementacin delAlmacenamiento Estable

  • Implementacin de almacenamiento estable

    La informacin que reside en un almacenamientoestable no se pierde NUNCA.

    Se necesita replicar la informacin en mltiplesdispositivos de almacenamiento con modosindependientes de fallo.

    Hay 3 posibles resultados:

    Terminacin con xito: los datos se escribieroncorrectamente

    Fallo parcial: fallo en la mitad transferencia

    Fallo total: ocurri antes de empezar la escrituraen disco, datos anteriores estn intactos.

    Msig. Flix Mendoza. Note some content based on 2009 Silberschatz.

  • Tolerancia a Fallas: enmascara fallas locales HW o SW redundante Discos RAID Fuente de Poder Ininterruptible Cluster Failover

    Tolerancia a Desastre: enmascara fallas de sitios Protege contra fuego, inundaciones,

    sabotajes,.. Sistemas redundantes y servicio en

    sitio(s) remoto(s) Uso de diversidad en el diseo

    Tolerancia a Fallas vs Tolerancia a Desastres

    Joseph, A. CS162: Operating Systems and Systems Programming. http://inst.eecs.berkeley.edu/~cs162/sp14/. Copyright 2013 UCB.

  • RAID Drive 1 failed!

    Replace immediately

    Qu sali mal??

    Fallas de Operaciones

    Joseph, A. CS162: Operating Systems and Systems Programming. http://inst.eecs.berkeley.edu/~cs162/sp14/. Copyright 2013 UCB.

  • RAID Drive 1 failed!

    Replace immediately

    Fallas de Operaciones (Cont.)

    Joseph, A. CS162: Operating Systems and Systems Programming. http://inst.eecs.berkeley.edu/~cs162/sp14/. Copyright 2013 UCB.

  • http://blog.backblaze.com/2013/11/12/how-long-do-disk-drives-last/

    78%

    sobrevivi 4

    aos

    Implica 6

    aos de

    tiempo de

    vida media

    Tasas de Fallo de Discos de Consumidores

    Joseph, A. CS162: Operating Systems and Systems Programming. http://inst.eecs.berkeley.edu/~cs162/sp14/. Copyright 2013 UCB.