Sie sind auf Seite 1von 39

RAID (Redundant Array of

Independent Disk)
Grupo 3
Contenido

▪ Introducción a RAID
▪ Niveles de RAID
❖ RAID 0 (Conjunto dividido)
❖ RAID 1 (Conjunto en espejo)
❖ RAID 2
❖ RAID 3
❖ RAID 4
❖ RAID 5
▪ Calculo de Paridad
▪ Posibilidades de RAID
Introducción

▪ Afirmar que la información es el activo más valioso e importante de cualquier


empresa y que los datos han de estar disponibles en todo momento
(24x7x365) y asegurados contra incidencias, es un hecho sumamente aceptado
hoy en día. Más tarde o más temprano, todas las unidades de discos duros
fallan, lo que puede tener consecuencias catastróficas. El coste de una posible
pérdida de información y el tiempo durante el cual el sistema no está en
explotación mientras se soluciona el problema es un lujo que cada vez menos
empresas pueden permitirse. Así pues, disponer de un sistema de
almacenamiento seguro y tolerante al fallo se hace indispensable.
QUE ES RAID

▪ El término RAID es un acrónimo del inglés "Redundant Array of Independent


Disks". Significa matriz redundante de discos independientes. RAID es una
forma de combinación de varios discos duros para formar una única unidad
lógica en la que se almacenan los datos de forma redundante. Ofrece mayor
tolerancia a fallos y más altos niveles de rendimiento que un sólo disco duro o
un grupo de discos duros independientes.
VENTAJAS

▪ Tolerancia a fallos: Un RAID protege contra la pérdida de datos y proporciona


recuperación de datos en tiempo real con acceso interrumpido en caso de que
falle un disco.
▪ Mejora del Rendimiento/ Velocidad: Un RAID consta de dos o más discos
duros que ante el sistema principal funcionan como un único dispositivo. Los
datos se desglosan en fragmentos que se escriben en varias unidades de forma
simultánea. Este proceso, denominado fraccionamiento de datos, incrementa
notablemente la capacidad de almacenamiento y ofrece mejoras significativas
de rendimiento. RAID permite a varias unidades trabajar en paralelo, lo que
aumenta el rendimiento del sistema.
VENTAJAS

▪ Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para aumentar la
fiabilidad: la redundancia de datos y la información de paridad. La redundancia
implica el almacenamiento de los mismos datos en más de una unidad. De esta
forma, si falla una unidad, todos los datos quedan disponibles en la otra
unidad, de inmediato. Aunque este planteamiento es muy eficaz, también es
muy costoso, ya que exige el uso de conjuntos de unidades duplicados. El
segundo planteamiento para la protección de los datos consiste en el uso de la
paridad de datos. EL RAID utiliza un algoritmo matemático para generar
información de paridad. Cuando se produce un fallo en una unidad se leen los
datos correctos que quedan y se comparan con los datos de paridad
almacenados por la matriz. El uso de la paridad para obtener fiabilidad de los
datos es menos costoso que la redundancia, ya que no requiere el uso de un
conjunto redundante de unidades de disco.
VENTAJAS

▪ Alta Disponibilidad: El RAID aumenta el tiempo de funcionamiento y la


disponibilidad del sistema. Para evitar los tiempos de inactividad, debe ser
posible acceder a los datos en cualquier momento. La disponibilidad de los
datos depende de dos aspectos: la integridad de los datos y tolerancia a fallos.
La integridad de los datos se refiere a la capacidad para obtener los datos
adecuados en cualquier momento. La mayoría de las soluciones RAID ofrecen
reparación dinámica de sectores, que repara sobre la marcha los sectores
defectuosos debidos a errores de software. La tolerancia a fallos, el segundo
aspecto de la disponibilidad, es la capacidad para mantener los datos
disponibles en caso de que se produzcan uno o varios fallos en el sistema.
Introducción a RAID

● Un grupo/matriz redundante de discos independientes1​ (también, RAID, del inglés redundant array of
independent disks) .

● Dependiendo de su configuración (a la que suele llamarse nivel), los beneficios de un RAID respecto a un único
disco son:
mayor integridad, tolerancia frente a fallos, tasa de transferencia y capacidad.

● Los RAID suelen usarse en servidores y normalmente (aunque no es necesario) se implementan con unidades de
disco de la misma capacidad.

● los sistemas basados en software son mucho más flexibles y los basados en hardware añaden un punto de fallo
más al sistema (la controladora RAID).

● Todas las implementaciones pueden soportar el uso de uno o más discos de reserva (hot spare).
Niveles de RAID
RAID Estandar
RAID 0 (distribución por igual)

▪ Llamado conjunto dividido, volumen dividido.


▪ Distribuye los datos equitativamente entre dos o más discos.

▪ Posee un alto rendimiento de escritura ya que los datos se escriben


en dos o más discos de forma paralela.

▪ Puede ser creado con discos de diferentes tamaños, pero el espacio


de almacenamiento añadido al conjunto estará limitado por el
tamaño del disco más pequeño

▪ Fiabilidad total —medida como MTTF o MTBF— es


(aproximadamente) inversamente proporcional al número de discos INSERT INTO …..
del conjunto SELECT * FROM …
COMMIT
RAID 1 (espejo)

▪ Un RAID 1 crea una copia exacta (o espejo) de un conjunto de datos en dos o más
discos.

▪ Un conjunto RAID 1 sólo puede ser tan grande como el más pequeño de sus discos.

▪ para que el conjunto falle es necesario que lo hagan todos sus discos.

▪ El rendimiento de lectura se incrementa aproximadamente como múltiplo lineal del


número de copias

▪ Al escribir, el conjunto se comporta como un único disco, dado que los datos deben
ser escritos en todos los discos del RAID 1.

▪ El RAID 1 tiene muchas ventajas de administración. Por ejemplo, en algunos entornos INSERT INTO …..
24/7 es posible «dividir el espejo»: marcar un disco como inactivo, hacer una copia de SELECT * FROM …
seguridad de dicho disco y luego «reconstruir» el espejo. COMMIT
RAID 2 (código haming)

▪ Separa datos en nivel de bits y guarda en discos


redundantes diferentes.
▪ Utiliza el código Hamming para calcular la paridad de
bits redundantes para verificar y corregir errores.
▪ En su momento fue caro (requiere mucho disco) y
difícil de implementar por lo que casi nunca se uso.
▪ La mayoría de lo que el raid 2 ofrece ya esta
disponible en discos modernos como algo estándar
como es el ECC (Código corrector de errores)
▪ Mejora en la velocidad de transferencia de lectura,
pero es baja en la velocidad de escritura.
RAID 3 (división por bloques)

▪ Divide los datos a nivel de bytes en lugar de a nivel


de bloques.
▪ Necesita un mínimo de 3 discos, utilizando uno
para datos de paridad.
▪ El disco de paridad permite identificar los errores
(recuperar datos)
▪ Ofrece altas tasas de transferencia y confianza en
la información.
▪ Pero si perdemos el disco de paridad se pierde la
información redundante. INSERT INTO …..
▪ También tipo de escritura es muy lenta. SELECT * FROM …
COMMIT
RAID 4 (discos dedicados para paridad)

▪ Conocido como IDA


(Acceso independiente)
con discos dedicados a la
paridad
▪ Usa división a nivel de
bloques
▪ Permite el funcionamiento
independiente de cada
miembro del conjunto
INSERT INTO …..
SELECT * FROM …
COMMIT
RAID 5(distribución de la paridad)

▪ División de datos a nivel de


bloques
▪ Distribuye la información
de paridad entre todos los
discos miembros del
conjunto
▪ Se implementa con soporte
hardware para el cálculo de
paridad
INSERT INTO …..
SELECT * FROM …
COMMIT
RAID 6 (distribución doble de paridad)

▪ Comparte características con Raid


5 como el acceso a los datos
mientras hay discos fallados
▪ Todas las unidades de disco
contienen paridad que se
escriben en dos unidades
▪ Puede soportar dos unidades que
mueren simultaneamente
▪ Las transacciones de escritura de
datos son más lentas que en RAID
5
VARIANTES 5E Y 6E

▪ Raid 5e:
▪ Similar a raid 5 pero con disco
de repuesto dinámico
▪ El disco dinámico puede usarse
para lectura y escritura
▪ La unidad de repuesto solo
puede usarse dentro de la
matriz raid 5e

▪ Raid 6e:
▪ Similar a raid 6 pero con la
integración de disco dinámico
▪ Contiene los mismos beneficios
que se mencionan para raid 5e
Variante raid 53

▪ La misma tolerancia a fallos que


raid 3
▪ se implementa como una matriz
seccionada raid 0 pero con
segmentos raid 3
RAIDS ANIDADOS

▪ Definición: un RAID pueda usarse como elemento básico de


otro en lugar de discos físicos
▪ Raid 0+1: distribución de matrices espejo
▪ Raid 1+0: división de matrices espejo
▪ Raid 30: replicación de matrices raid 3
▪ Raid 100: distribución de una matriz raid 10
▪ Raid 10+1: replicación de una matriz raid 10
▪ Raid 50: replicación entre un conjunto de raid 5
VARIANTES RAID PROPIETARIO

▪ Se definen como propietarios puesto que sus implementaciones tienen especificaciones que
son requeridas por las compañías que las crearon. Son las siguientes:
▪ Raid 50ee: usado por Himperia. Es un Raid 0 de dos pools cada uno de ellos con Raid 5ee
▪ Paridad doble: uso de dos spare
▪ Raid 1,5: raid 1 implementando correctamente recuperación de datos
▪ Raid 7: uso de caches para raid 3 y raid 4
▪ Raid S: usado por EMC corporation. Raid de paridad. Cada volumen reside en un único disco físico
▪ Matrix raid: no es un nuevo nivel de Raid. utiliza dos o más discos físicos, asignando partes de
idéntico tamaño de cada uno de los diferentes niveles de RAID
▪ Linux md raid 10: kernel de Linux ofrece un controlador Raid software para construir un Raid 1+0
convencional
▪ Ibm serverRaid 1E: creado por IBM. Soporta un espejado doble de un número arbitrario de discos
▪ Raid Z: implementado por Sun Microsystems para su sistema de archivos ZFS
Calculo de Paridad
RAID 4 y 5
Calculo de Paridad

▪ Hace uso del operador booleano XOR

Ejemplo en RAID 4T
Recuperación de Datos

FALLO EN EL DISCO 3 !!!!

Ejemplo en RAID 4T
Recuperación de Datos

¿Cómo recupero los datos del Disco 3?

Malogrado

Ejemplo en RAID 4T
Recuperación de Datos

¿Cómo recupero los datos del Disco 3?


Haciendo uso de los datos de paridad y el operador XOR

Malogrado

Ejemplo en RAID 4T
Recuperación de Datos

Datos recuperados

Malogrado

Malogrado

Ejemplo en RAID 4T
Tipos de RAID
• Puede estar
• Se limitan al RAID basado en host o
0 (Stripping) RAID externo
• No son • Es independiente
Basada implementaciones Basada del sistema
adecuadas en la
en mayoría de los en operativo
• La solución más
software casos y cada vez hardware profesional y
son menos
empleados por su recomendada es la
bajo rendimiento solución hardware
RAID externa.
Cuadro comparativo entre Raid-Software y Raid-Hardware

SOFTWARE HARDWARE
Bajo costo de entrada. Todo lo que Compatible en diferentes sistemas
necesita hacer es conectar las unidades y operativos. Esto es crítico si planea
luego configurarlas dentro de su sistema acceder a su sistema RAID desde una
operativo Mac y Windows. Hardware RAID sería
reconocible por cualquier sistema.
VENTAJAS Las computadoras de hoy en día son tan Tiene más opciones de configuración de
potentes que los procesadores pueden RAID, incluidas configuraciones híbridas
manejar fácilmente el procesamiento que pueden no estar disponibles con
RAID 0 & 1 sin ningún golpe de ciertas opciones de sistema operativo.
rendimiento notable.
El RAID de software a menudo es Como hay más hardware, la instalación
específico del SO que se está utilizando, inicial implica más costos.
por lo que generalmente no se puede
usar para matrices de unidades
DESVENTAJA compartidas entre sistemas operativos.
S
Estará restringido a los niveles de RAID El software RAID se utiliza exclusivamente
que su SO específico puede admitir. en sistemas grandes (mainframes,
sistemas RISC, Itanium y SAN de Solaris)
que se encuentran en la informática
empresarial.
Implementación de RAID 5
Implementación desde Linux
ESCENARIO

▪ Tenemos 5 discos duros; uno de 10 GB para el sistema operativo Ubuntu y


otros 4 discos de 1GB cada uno. En donde 3 discos lo usaremos para el RAID en
estado activo y el ultimo en estado de espera lo usaremos en caso de que falle
uno de los 3 discos para que reemplace al defectuoso.
▪ La configuración se hará todo desde la consola y usando Virtual Box para
facilitar la inserción de discos.
▪ Los discos están nombrados por el SO:
▪ Sda (del SO)
▪ Sdb (raid5 activo)
▪ Sdc (raid5 activo)
▪ Sdd (raid5 activo)
▪ Sde(raid5 en espera)
PASO 1 , 2 , 3

1. Ejecutamos el “sudo su”, para ejecutar todo a nivel de super usuario.


2. Usamos el fdisk –l para ver los discos y empezar la configuración.
3. Generamos las tablas de particiones:
1. Fdisk /dev/sdb
2. m // para ver las opciones
3. n // añade una nueva partición
1. p // para una partición primaria
4. w // para guardar la configuración y salir

4. Lo mismo para los discos sdc, sdd, sde


Paso 4: Cambiamos el tipo de partición Linux a Linux RAID

▪ fdisk /dev/sdb
▪ t // da opciones para el tipo de particiones que le quieres dar
▪ fd // le da un tipo de partición Linux RAID Autodetected
▪ w // guarda los cambios y salimos

▪ Lo mismo para los demás discos:


▪ Sdc
▪ Sdd
▪ Sde
Paso 5 y 6

5. Activamos los módulos que usaremos para el RAID5


1. modprobe linear
2. modprobe multipath
3. modprobe raid5

6. Creamos Modulo donde se montara el RAID5


1. mknod /dev/md0 b 9 0
Paso 7, 8, 9:

7. Creamos el raid:
1. mdadm --create /dev/md0 --level=raid5 --raid-devices=3 /dev/sdb1 /dev/sdc1
/dev/sdd1 --spare-devices=1 /dev/sde1

8. Mostramos los detalles:


1. mdadm --detail /dev/md0

9. Generamos la tabla de particiones del modulo RAID creado


1. fdisk /dev/md0
2. n
3. w
Paso 10 y 11.

10. Damos el formato ext4


1. mkfs -t ext4 /dev/md0

11. Hacer fallo disco sdc


1. mdadm --fail /dev/md0 /dev/sdc1

Das könnte Ihnen auch gefallen