Beruflich Dokumente
Kultur Dokumente
- El objetivo en sistemas que requieren alta disponibilidad para sus tareas es el de funcionar aun
cuando falle alguno de sus componentes.
- En caso de alguna falla otro componente o proceso especial tome el control de este y reduce los
efectos producidos por el fallo.
- Un sistema tolerante a fallos es cuando continúa brindando el servicio aún si se tiene fallas ya
sea de hardware o de software.
- Cuando Falla
- Como Falla
- Funcionamiento Lento: proceso funciona bien pero cada vez es más lento y esto
afecta de igual manera al sistema.
Confiabilidad
- Factores de la Confiabilidad
ADS
- Atributos de la confiabilidad:
- Medios para aumentar la confiabilidad: todos los medios buscan evitar, prevenir
amenazas o en caso de darse saber controlar la situación.
- Prevención de Fallas
- Tolerancia a Fallos
- Eliminación de Fallas
- Predicción de Fallas
- Redundancia de HDD: más conocida como de tipo RAID, en este método la información se
reparte entre varios discos, mediante técnicas como:
- RAID 0: Entrelazado de bloques (Disk Striping), tiene la mas alta transferencia pero sin
tolerancia a fallos, requiere un mínimo de 2 unidade de disco.
Detección de Fallas
las fallas no pueden ser detectadas directamente, se deducen a partir de la detección de errores por lo
que la tolerancia a fallos del sistema dependerá de la efectividad del mecanismo de detección de errores
que se usa.
ADS
Un sistema que no falle aun si existen errores por lo que debe ser confiable (disponibilidad, fiabilidad,
seguridad, mantenibilidad).
- Tipos de Fallos
- Modelos de Fallos
- La tolerancia a fallos de software permite obtener una alta fiabilidad en componentes de menor
fiabilidad.
Redundancia en el Software
- señales
- excepciones
- checkpoint
- asserts
- Redundancia Estática
- Redundancia Dinámica
Técnicas Principales:
1. Detección de Errores:
Técnicas Principales:
Tipos de Sistemas
- Transparentes a la aplicación: los puntos de recuperación están a cargo del hardware o del SO
ADS
Primitivas Necesarias
Conceptos
Datos Activos: datos que accede el sistema luego del punto de recuperación.
Región de Recuperación: tiempo que los datos de recuperación de un punto de recuperación están
disponibles y pueden ser restaurados.