Sie sind auf Seite 1von 5

.

Sistemas RAID (Redundant Array of Independent Disks)


Fabian Bastidas
e-mail: fa_bage@hotmail.com

ABSTRACTO: Se explica sobre los sistemas


RAID o arrays redundantes de disco independientes. Todo lo que tiene que ver con esta tecnologa sus clasificaciones, ventajas y desventajas, aplicaciones. Ejemplos de las principales tecnologas RAID.

megabytes. Las bandas de todos los discos estn interpaginadas (interleaved) y se accede a ellas en orden. En un sistema de un solo usuario donde se almacenan grandes registros (como imgenes mdicas o de otro tipo), las bandas generalmente se establecen para ser muy pequeas (quiz de 512 bytes) de modo que un solo registro est ubicado en todos los discos y se pueda acceder a l rpidamente leyendo todos los discos a la vez. En un sistema multiusuario, un mejor rendimiento demanda que se establezca una banda lo suficientemente ancha para contener el registro de tamao tpico o el de mayor tamao. Esto permite acciones I/O superpuestas en los distintos discos.

PALABRAS CLAVE: Explicacin, Desventajas, Sistemas RAID

Ventajas

1 INTRODUCCIN
Los datos en la actualidad representan una parte importante dentro de los sistemas informticos. Los sistemas de almacenamiento de datos evolucionan constantemente ofrecindonos diversas alternativas dentro del hardware y software. Los sistemas RAID son una alternativa que ha surgido para el almacenamiento de datos que nos ofrece soluciones dentro del software y hardware para un seguro almacenamiento de datos.

4 NOMBRES DE LOS INTEGRANTES Y SUS E-MAIL


Milton Fabian Bastidas Guerra fa_bage@hotmail.com Nota: Inicie con su(s) nombre(s) de pila seguido de sus apellidos.

2 OBJETIVOS
2.1 GENERALE

Explicar sobre la tecnologa RAID


2.2 ESPECIFICOS

5 Porque usara RAID?


Las operaciones de I/O a disco son relativamente lentas, primordialmente debido a su carcter mecnico. Una lectura o una escritura involucra, normalmente, dos operaciones. La primera es el posicionamiento de la cabeza lector/grabadora y la segunda es la transferencia desde o hacia el propio disco. El posicionamiento de la cabeza est limitado por dos factores: el tiempo de bsqueda (seek time) y el retardo por el giro del disco hasta la posicin de inicio de los datos (latencia rotacional). La transferencia de datos, por su parte, ocurre de a un bit por vez y se ve limitada por la velocidad de rotacin y por la densidad de grabacin del medio. Una forma de mejorar el rendimiento de la transferencia es el uso de varios discos en paralelo, esto se basa en el hecho de que si un disco solitario es capaz de entregar una tasa de transferencia dada, entonces dos discos seran capaces, tericamente, de ofrecer el doble de la tasa anterior, lo mismo sucedera con cualquier operacin. La adicin de varios discos debera extender el fenmeno hasta un punto a partir del cual algn otro componente empezar a ser el factor limitante. Muchos administradores o encargados de sistemas intentan llevar a cabo esta solucin en forma bsicamente manual, distribuyendo la informacin entre varios discos de tal forma de intentar asegurar una carga de trabajo similar para cada uno de ellos. Este proceso

Buscar las ventajas y desventajas de esta tecnologa Utilizar medios de investigacin para obtener informacin de la tecnologa

3 Sistemas RAID
RAID es una forma de almacenar los mismos datos en distintos lugares (por tanto de modo redundante) en mltiples discos duros. Al colocar los datos en discos mltiples, las operaciones I/O (input/output, de entrada y salida) pueden superponerse de un modo equilibrado, mejorando el rendimiento del sistema. Dado que los discos mltiples incrementan el tiempo medio entre errores (mean time between failure, MTBF), el almacenamiento redundante de datos incrementa la tolerancia a fallos. Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico. El RAID emplea la tcnica conocida como "striping" (bandeado o creacin de bandas), que incluye la particin del espacio de almacenamiento de cada disco en unidades que van de un sector (512 bytes) hasta varios

de "sintona" podra dar buenos resultados de no ser por dos factores principales: 1 No consigue mejorar las velocidades de transferencia de archivos individuales, slo mejora la cantidad de archivos accedidos en forma concurrente. 2 Es obvio que el balance no es posible de mantener en el tiempo debido a la naturaleza dinmica de la informacin. Una forma bastante ms efectiva de conseguir el objetivo es el uso de un arreglo de discos, el cual segn la definicin del RAID Consultory Board es "una coleccin de discos que integran uno o ms subsistemas combinados con un software de control el cual se encarga de controlar la operacin del mismo y de presentarlo al Sistema Operativo como un slo gran dispositivo de almacenamiento". Dicha pieza de software puede ser integrada directamente al Sistema Operativo o estar en el propio arreglo; as como el arreglo puede ser interno o externo. Novell Netware incluye, desde hace algn tiempo, soporte para arreglos de discos. El espejado y la duplicacin de discos son ejemplos de arreglos basados en software. Las soluciones de arreglos basadas en hardware son principalmente implementadas mediante el uso de controladoras SCSI (Small Computer System Interface) especializadas, las cuales a menudo estn dotadas de procesadores propios para liberar a la CPU del sistema de la tarea de control y de cachs para mejorar an ms el desempeo. Para Netware cualquiera de las dos soluciones, software o hardware, ser visualizada como un nico y gran disco virtual. As pues un arreglo de discos ofrecer un mejor desempeo debido a que dividir en forma automtica los requerimientos de lectura/escritura entre los discos que lo conforman. Por ejemplo, si una operacin de lectura/escritura involucra a cuatro bloques de 4 Kb cada uno, entonces un arreglo de 4 discos podra, tericamente, entregar cuatro veces la tasa de operacin de un disco nico, esto debido a que el disco nico slo podra atender a un bloque en forma simultnea, mientras que en el arreglo cada disco podra manejar un slo bloque operando ellos al mismo tiempo En la prctica, sin embargo, dichos niveles no se obtienen debido, principalmente, a la carga de trabajo inherente al control del propio arreglo. Adems el uso de varios discos se emplea para construir cierto nivel de redundancia de los datos y es este nivel de redundancia y la forma de implementarlo lo que crea los niveles de RAID

6 TIPOS DE RAIDS
RAID basado en software El RAID Software implementa los diferentes niveles de RAID en el cdigo del kernel que tienen que ver con la gestin del disco (block device). Ofrece adems la solucin menos costosa, el RAID software funciona con discos IDE menos costosos as como con discos SCSI. Con las rpidas CPU de hoy en da, las prestaciones de un RAID software pueden competir con las de un RAID hardware. RAID basado en hardware Las soluciones hardware gestionan el subsistema RAID independientemente del host, presentndole a este un solo disco. Un ejemplo de RAID hardware podra ser el conectado al controlador SCSI que presenta al sistema un nico disco SCSI. Un sistema RAID externo se encarga de la gestin del RAID con el controlador localizado en el subsistema externo de los discos. Todo el subsistema est conectado a un host a travs de un controlador SCSI normal y se le presenta al host como un solo disco.

7 Niveles RAID
1 Niveles RAID estndar 1.1 RAID 1 1.2 RAID 2 1.3 RAID 3 1.4 RAID 4 1.5 RAID 5 1.6 RAID 6 1.7 RAID 5E y RAID 6E 2 Niveles RAID anidados 2.1 RAID 0+1 2.2 RAID 1+0 2.3 RAID 30 2.4 RAID 100 2.5 RAID 10+1 3 Niveles RAID propietarios 3.1 RAID 50EE 3.2 Paridad doble 3.3 RAID 1.5 3.4 RAID 7 3.5 RAID S o RAID de paridad 3.6 Matrix RAID 3.7 Linux MD RAID 10 3.8 IBM ServeRAID 1E 3.9 RAID Z.

8 Niveles RAID estndar


8.1 RAID 1
Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o ms discos. Esto resulta til cuando el rendimiento en lectura es ms importante que la capacidad. Un conjunto RAID 1 slo puede ser tan grande como el ms pequeo de sus discos. Un RAID 1 clsico consiste en dos discos en

espejo, lo que incrementa exponencialmente la fiabilidad respecto a un solo disco; es decir, la probabilidad de fallo del conjunto es igual al producto de las probabilidades de fallo de cada uno de los discos (pues para que el conjunto falle es necesario que lo hagan todos sus discos). Adicionalmente, dado que todos los datos estn en dos o ms discos, con hardware habitualmente independiente, el rendimiento de lectura se incrementa aproximadamente como mltiplo lineal del nmero del copias; es decir, un RAID 1 puede estar leyendo simultneamente dos datos diferentes en dos discos diferentes, por lo que su rendimiento se duplica. Para maximizar los beneficios sobre el rendimiento del RAID 1 se recomienda el uso de controladoras de disco independientes, una para cada disco (prctica que algunos denominan splitting o duplexing). Como en el RAID 0, el tiempo medio de lectura se reduce, ya que los sectores a buscar pueden dividirse entre los discos, bajando el tiempo de bsqueda y subiendo la tasa de transferencia, con el nico lmite de la velocidad soportada por la controladora RAID. Sin embargo, muchas tarjetas RAID 1 IDE antiguas leen slo de un disco de la pareja, por lo que su rendimiento es igual al de un nico disco. Algunas implementaciones RAID 1 antiguas tambin leen de ambos discos simultneamente y comparan los datos para detectar errores. Al escribir, el conjunto se comporta como un nico disco, dado que los datos deben ser escritos en todos los discos del RAID 1. Por tanto, el rendimiento no mejora. El RAID 1 tiene muchas ventajas de administracin. Por ejemplo, en algunos entornos 24/7, es posible dividir el espejo: marcar un disco como inactivo, hacer una copia de seguridad de dicho disco y luego reconstruir el espejo. Esto requiere que la aplicacin de gestin del conjunto soporte la recuperacin de los datos del disco en el momento de la divisin. Este procedimiento es menos crtico que la presencia de una caracterstica de snapshot en algunos sistemas de archivos, en la que se reserva algn espacio para los cambios, presentando una vista esttica en un punto temporal dado del sistema de archivos. Alternativamente, un conjunto de discos puede ser almacenado de forma parecida a como se hace con las tradicionales cintas.

pero no son independientes (no se puede leer y escribir al mismo tiempo).

8.3 RAID 3
Un RAID 3 divide los datos a nivel de bytes en lugar de a nivel de bloques y usa un cdigo de Hamming para la correccin de errores. Los discos son sincronizados por la controladora para funcionar al unsono. ste es el nico nivel RAID original que actualmente no se usa. Permite tasas de transferencias extremadamente altas. Tericamente, un RAID 3 necesitara 39 discos en un sistema informtico moderno: 32 se usaran para almacenar los bits individuales que forman cada palabra y 7 se usaran para la correccin de errores. En el ejemplo del grfico, una peticin del bloque A formado por los bytes A1 a A6 requerira que los tres discos de datos buscaran el comienzo (A1) y devolvieran su contenido. Una peticin simultnea del bloque B tendra que esperar a que la anterior concluyese.

8.4 RAID 4
Diagrama de una configuracin RAID 4. Cada nmero representa un bloque de datos; cada columna, un disco. Un RAID 4, tambin conocido como IDA (acceso independiente con discos dedicados a la paridad) usa divisin a nivel de bloques con un disco de paridad dedicado. Necesita un mnimo de 3 discos fsicos. El RAID 4 es parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a nivel de bytes. Esto permite que cada miembro del conjunto funcione independientemente cuando se solicita un nico bloque. Si la controladora de disco lo permite, un conjunto RAID 4 puede servir varias peticiones de lectura simultneamente. En principio tambin sera posible servir varias peticiones de escritura simultneamente, pero al estar toda la informacin de paridad en un solo disco, ste se convertira en el cuello de botella del conjunto. En el grfico de ejemplo anterior, una peticin del bloque A1 sera servida por el disco 0. Una peticin simultnea del bloque B1 tendra que esperar, pero una peticin de B2 podra atenderse concurrentemente.

8.5 RAID 5
Un RAID 5 es una divisin de datos a nivel de bloques distribuyendo la informacin de paridad entre todos los discos miembros del conjunto. El RAID 5 ha logrado popularidad gracias a su bajo coste de redundancia. Generalmente, el RAID 5 se implementa con soporte hardware para el clculo de la paridad. RAID 5 necesitar un mnimo de 3 discos para ser implementado. En el grfico de ejemplo anterior, una peticin de lectura del bloque A1 sera servida por el disco 0. Una peticin de lectura simultnea del bloque B1 tendra que esperar, pero una peticin de lectura de B2 podra atenderse concurrentemente ya que seria servida por el disco 1. Cada vez que un bloque de datos se escribe en un RAID 5, se genera un bloque de paridad dentro de la misma divisin (stripe). Un bloque se compone a menudo de muchos sectores consecutivos de disco.

8.2 RAID 2
Diagrama de una configuracin RAID 3. Cada nmero representa un byte de datos; cada columna, un disco. Un RAID 2 usa divisin a nivel de bits con un disco de paridad dedicado. El RAID 2 se usa rara vez en la prctica. Uno de sus efectos secundarios es que normalmente no puede atender varias peticiones simultneas, debido a que por definicin cualquier simple bloque de datos se dividir por todos los miembros del conjunto, residiendo la misma direccin dentro de cada uno de ellos. As, cualquier operacin de lectura o escritura exige activar todos los discos del conjunto, suele ser un poco lento porque se producen cuellos de botella. Son discos paralelos

Una serie de bloques (un bloque de cada uno de los discos del conjunto) recibe el nombre colectivo de divisin (stripe). Si otro bloque, o alguna porcin de un bloque, es escrita en esa misma divisin, el bloque de paridad (o una parte del mismo) es recalculada y vuelta a escribir. El disco utilizado por el bloque de paridad est escalonado de una divisin a la siguiente, de ah el trmino bloques de paridad distribuidos. Las escrituras en un RAID 5 son costosas en trminos de operaciones de disco y trfico entre los discos y la controladora. Los bloques de paridad no se leen en las operaciones de lectura de datos, ya que esto sera una sobrecarga innecesaria y disminuira el rendimiento. Sin embargo, los bloques de paridad se leen cuando la lectura de un sector de datos provoca un error de CRC. En este caso, el sector en la misma posicin relativa dentro de cada uno de los bloques de datos restantes en la divisin y dentro del bloque de paridad en la divisin se utilizan para reconstruir el sector errneo. El error CRC se oculta as al resto del sistema. De la misma forma, si falla un disco del conjunto, los bloques de paridad de los restantes discos son combinados matemticamente con los bloques de datos de los restantes discos para reconstruir los datos del disco que ha fallado al vuelo. Lo anterior se denomina a veces Modo Interino de Recuperacin de Datos (Interim Data Recovery Mode). El sistema sabe que un disco ha fallado, pero slo con el fin de que el sistema operativo pueda notificar al administrador que una unidad necesita ser reemplazada: las aplicaciones en ejecucin siguen funcionando ajenas al fallo. Las lecturas y escrituras continan normalmente en el conjunto de discos, aunque con alguna degradacin de rendimiento. La diferencia entre el RAID 4 y el RAID 5 es que, en el Modo Interno de Recuperacin de Datos, el RAID 5 puede ser ligeramente ms rpido, debido a que, cuando el CRC y la paridad estn en el disco que fall, los clculos no tienen que realizarse, mientras que en el RAID 4, si uno de los discos de datos falla, los clculos tienen que ser realizados en cada acceso. El fallo de un segundo disco provoca la prdida completa de los datos. El nmero mximo de discos en un grupo de redundancia RAID 5 es tericamente ilimitado, pero en la prctica es comn limitar el nmero de unidades. Los inconvenientes de usar grupos de redundancia mayores son una mayor probabilidad de fallo simultneo de dos discos, un mayor tiempo de reconstruccin y una mayor probabilidad de hallar un sector irrecuperable durante una reconstruccin. A medida que el nmero de discos en un conjunto RAID 5 crece, el MTBF (tiempo medio entre fallos) puede ser ms bajo que el de un nico disco. Esto sucede cuando la probabilidad de que falle un segundo disco en los N-1 discos restantes de un conjunto en el que ha fallado un disco en el tiempo necesario para detectar, reemplazar y recrear dicho disco es mayor que la probabilidad de fallo de un nico disco. Una alternativa que proporciona una proteccin de paridad

dual, permitiendo as mayor nmero de discos por grupo, es el RAID 6. Algunos vendedores RAID evitan montar discos de los mismos lotes en un grupo de redundancia para minimizar la probabilidad de fallos simultneos al principio y el final de su vida til. Las implementaciones RAID 5 presentan un rendimiento malo cuando se someten a cargas de trabajo que incluyen muchas escrituras ms pequeas que el tamao de una divisin (stripe). Esto se debe a que la paridad debe ser actualizada para cada escritura, lo que exige realizar secuencias de lectura, modificacin y escritura tanto para el bloque de datos como para el de paridad. Implementaciones ms complejas incluyen a menudo cachs de escritura no voltiles para reducir este problema de rendimiento. En el caso de un fallo del sistema cuando hay escrituras activas, la paridad de una divisin (stripe) puede quedar en un estado inconsistente con los datos. Si esto no se detecta y repara antes de que un disco o bloque falle, pueden perderse datos debido a que se usar una paridad incorrecta para reconstruir el bloque perdido en dicha divisin. Esta potencial vulnerabilidad se conoce a veces como agujero de escritura. Son comunes el uso de cach no voltiles y otras tcnicas para reducir la probabilidad de ocurrencia de esta vulnerabilidad.

8.6 RAID 6
Diagrama de una configuracin RAID 6. Cada nmero representa un bloque de datos; cada columna, un disco; p y q, cdigos Reed-Solomon. Un RAID 6 ampla el nivel RAID 5 aadiendo otro bloque de paridad, por lo que divide los datos a nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del conjunto. El RAID 6 no era uno de los niveles RAID originales. El RAID 6 puede ser considerado un caso especial de cdigo Reed-Solomon.1 El RAID 6, siendo un caso degenerado, exige slo sumas en el Campo de galois. Dado que se est operando sobre bits, lo que se usa es un campo binario de Galois (). En las representaciones cclicas de los campos binarios de Galois, la suma se calcula con un simple XOR. Tras comprender el RAID 6 como caso especial de un cdigo Reed-Solomon, se puede ver que es posible ampliar este enfoque para generar redundancia simplemente produciendo otro cdigo, tpicamente un polinomio en (m = 8 significa que estamos operando sobre bytes). Al aadir cdigos adicionales es posible alcanzar cualquier nmero de discos redundantes, y recuperarse de un fallo de ese mismo nmero de discos en cualquier punto del conjunto, pero en el nivel RAID 6 se usan dos nicos cdigos. Al igual que en el RAID 5, en el RAID 6 la paridad se distribuye en divisiones (stripes), con los bloques de paridad en un lugar diferente en cada divisin. El RAID 6 es ineficiente cuando se usa un pequeo nmero de discos pero a medida que el conjunto crece y se dispone de ms discos la prdida en capacidad de almacenamiento se hace menos importante, creciendo al mismo tiempo la probabilidad de que dos discos fallen simultneamente. El RAID 6

proporciona proteccin contra fallos dobles de discos y contra fallos cuando se est reconstruyendo un disco. En caso de que slo tengamos un conjunto puede ser ms adecuado que usar un RAID 5 con un disco de reserva (hot spare). La capacidad de datos de un conjunto RAID 6 es n-2, siendo n el nmero total de discos del conjunto. Un RAID 6 no penaliza el rendimiento de las operaciones de lectura, pero s el de las de escritura debido al proceso que exigen los clculos adicionales de paridad. Esta penalizacin puede minimizarse agrupando las escrituras en el menor nmero posible de divisiones (stripes), lo que puede lograrse mediante el uso de un sistema de archivos WAFL.

RAID 1

9 Niveles RAID anidados


Muchas controladoras permiten anidar niveles RAID, es decir, que un RAID pueda usarse como elemento bsico de otro en lugar de discos fsicos. Resulta instructivo pensar en estos conjuntos como capas dispuestas unas sobre otras, con los discos fsicos en la inferior. Los RAIDs anidados se indican normalmente uniendo en un solo nmero los correspondientes a los niveles RAID usados, aadiendo a veces un + entre ellos. Por ejemplo, el RAID 10 (o RAID 1+0) consiste conceptualmente en mltiples conjuntos de nivel 1 almacenados en discos fsicos con un nivel 0 encima, agrupando los anteriores niveles 1. En el caso del RAID 0+1 se usa ms esta forma que RAID 01 para evitar la confusin con el RAID 1. Sin embargo, cuando el conjunto de ms alto nivel es un RAID 0 (como en el RAID 10 y en el RAID 50), la mayora de los vendedores eligen omitir el +, a pesar de que RAID 5+0 sea ms informativo. Al anidar niveles RAID, se suele combinar un nivel RAID que proporcione redundancia con un RAID 0 que aumenta el rendimiento. Con estas configuraciones es preferible tener el RAID 0 como nivel ms alto y los conjuntos redundantes debajo, porque as ser necesario reconstruir menos discos cuando uno falle. (As, el RAID 10 es preferible al RAID 0+1 aunque las ventajas administrativas de dividir el espejo del RAID 1 se perderan.)

11 REFERENCIAS
[1] Annimo, Arreglos de discos RAID, [en lnea] http://publiespe.espe.edu.ec/articulos/sistemas/raid/raid.htm [2] Annimo, Administracin arrays de disco,[en lnea] http://www.lab.dit.upm.es/~arqo/p/raid/raid.html [3] H. Peter Anvin, Las matemticas del RAID 6. (PDF en lnea) [4] Jeffrey B. Layton: "Intro to Nested-RAID: RAID-01 and RAID10"; Linux Magazine, 6 de enero del 2011 [5] RAID-DP: NetApp Implementation of RAID Double Parity for Data Protection (PDF, ingls) [6] Jeff Bonwick: RAID-Z, Jeff Bonwick's Blog; acceso 2011-0107

10 GRAFICOS, FOTOGRAFAS Y RAID 0

Adaptado por: Ing. William Marn, para los cursos de laboratorio. Escuela de Ingeniera Electrnica Instituto Tecnolgico de Costa Rica 2007

Das könnte Ihnen auch gefallen