Sie sind auf Seite 1von 106

Tcnicas para el diseo de

sistemas electrnicos
tolerantes a fallas
(Evaluacin y Clculo de la Confiabilidad)

Fulvio Corno, Maurizio Rebaudengo,


Matteo Sonza Reorda
Politecnico di Torino
Dipartimento di Automatica e Informatica
Introduccin
Para obtener un producto confiable se debe
partir de un diseo confiable a travs de:
Lineas gua durante el diseo
Previsin de la confiabilidad y anlisis de
riesgo.
Mejoramiento de la confiabilidad.

2
Resumen
Medidas Cuantitativas de Confiabilidad
Tcnicas para la evaluacin de la confiabilidad.
Clculo de la confiabilidad de un sistema.

3
Resumen
Medidas Cuantitativas de Confiabilidad
Tcnicas para la evaluacin de la confiabilidad.
Clculo de la confiabilidad de un sistema.

4
Clculo de la Confiabilidad
Se analizarn algunos conceptos
cuantitativos que buscan calcular la
confiabilidad como caracterstica de un
objeto, a travs de la funcin matemtica
de confiabilidad
El objetivo es un tratado matemtico que
pueda definir la confiabilidad a nivel de
sistema, partiendo de la confiabilidad de
cada componente.
5
Confiabilidad
La confiabilidad es un campo relativamente
nuevo cuyo nacimiento se debe
principalmente a la creciente complejidad
de las tecnologas modernas y al rpido
progreso de la microelectrnica.

6
Un poco de historia
Los problemas de escasa confiabilidad se
hicieron evidentes en los equipos militares
usados por los norteamericanos desde los
aos 60.
Algunos estudios revelaron que:
Los equipos electrnicos eran operativos slo el
50% del tiempo.
2/3 de los equipos del ejrcito estaban en
reparacin.

7
Tasa de Falla y Funcin de
Confiabilidad
Intuitivamente:
Tasa de Falla = nmero esperado de fallas (de
un DISPOSITIVO de o de un SISTEMA) por
unidad de tiempo.
Funcin de Confiabilidad = Probabilidad de que
un nico componente NO est daado en el
tiempo t
Se deben proveer definiciones formales

8
Funcin de Confiabilidad
R(t) = Probabilidad condicional de que el
componente funcione correctamente
durante el intervalo (t0,t), dado que en el
tiempo t0 l funcionaba correctamente.

9
Derivacin de la Funcin de
Confiabilidad
Se someten a prueba N componentes
idnticos en el tiempo t0
Despus de un tiempo t tendremos N0
componentes funcionantes (operational) y
Nf componentes daados (failed): N = NO +
NF .
NO (t ) NO (t )
R (t ) = =
N NO (t )+ N F (t )
10
Interpretacin
R(t) es la probabilidad de que el
componente sobreviva al intervalo (t0, t)
Prolongando el tiempo, el nmero de
componentes funcionantes NO disminuye,
como consecuencia la Funcin de
Confiabilidad disminuye.
NO (t )
R (t ) =
NO (t )+ N F (t )
11
Funcin de No-Confiabilidad (I)
Q(t) es la probabilidad de que un
componente NO sobreviva al intevalo (t0,
t). Se llama tambin Funcin de Densidad
de Malfuncionamiento.
Los eventos
Componente
Componente
mentarios:

12
Funcin de No-Confiabilidad (II)

N F (t )
Q (t ) =
NO (t )+ N F (t )

13
Ritmo de Decaimiento (I)
Calculamos la derivade de R(t) con
respecto al tiempo
N F (t )
R(t ) = 1 Q(t ) = 1
N
dR(t ) 1 dN F (t )
=
dt N dt
dN F (t ) dR(t )
= ( N )
dt dt
14
Ritmo de Decaimiento (II)
dNF/dt se puede interpretar como el
nmero de componentes que sufren daos
durante un intervalo de tiempo dt,
comprendido entre t y t+dt; que equivale a
la velocidad de dao en el tiempo t.

dN F (t ) dR(t )
= ( N )
dt dt
15
Tasa de Dao (I)
Dividiendo ambos miembros de la ecuacin
entre NO(t) se obtiene z(t), conocida como
Funcin de Peligro o Tasa de Dao o Tasa
de Falla

1 dN F (t ) N dR(t )
z (t ) = =
N O (t ) dt N O (t ) dt

16
Tasa de Dao (II)
Siendo R=NO/N , la Tasa de Dao se puede
expresar como:

dR(t )
z (t ) = dt
R(t )

17
Frmula matemtica de la
Confiabilidad
Manipulando e integrando se obtiene la
frmula matemtica de Confiabilidad:
d R (t )
z (t ) d t =
R (t )
t R ( t ) d R (t ) R d R (t )
0 z (t )dt = R ( 0) R (t ) = 1 R (t )
t
z (t )dt = ln R (t )
0


R (t ) = exp z (t )dt
t

0 18
Comportamiento de la Tasa de Dao

z(t) no es constante sino que evoluciona


atravezando 3 fases.
mortalidad infantil (o peligro de asentamiento)
vida til
envejecimiento
En la regin de vida til:
z(t) ~ constante = (tasa de falla)

19
Comportamiento de la Tasa de Dao
Funcin Tasa de Falla

z(t)

Curva en forma
de Tina de
bao

Tasa de
Fallas
Constante Fase de Periodo de vida til Fase Senil
Mortalidad
Infantil

T1 T2
Tiempo
20
Tasa de Dao
Representa un tasa de dao constante en
la vida til del producto.
Se expresa como el nmero de daos por
unidad de tiempo
Es conveniente hacer funcionar el sistema
en la zona en la cual z(t)=

21
Tiempo de Misin
Es la cantidad de tiempo que se necesita
para garantizar que el sistema satisfaga un
cierto grado de servicio.
Ejemplos de tiempo de misin:
Misil: pocas horas
PC: 5 aos
Satlite: 10 aos
Central telefnica: 20/25 aos

22
Ciclo de vida de un producto
El comportamiento de la tasa de dao, en
forma de tina de bao aparece
sistemticamente cada vez que se analiza
por completo el ciclo de vida de un gran
nmero de sistemas de diferente tipo:
mecnicos, elctricos, electrnicos, etc.

23
Ciclo de vida de un producto
Se analizan los tres periodos
separadamente.

24
Periodo de Asentamiento
La tasa de dao decrece debido a que los
elementos dbiles se daan.
Despus del tiempo T1 todos los elementos
de constitucin dbil cesan de funcionar.

25
Daos Infantiles (I)
El perodo de asentamiento se caracteriza
por daos debidos a la calidad del proceso
productivo, se atribuyen tpicamente a la
rotura de componentes que presentan
algn defecto intrnseco.
En el caso de los semiconductores:
soldaduras mal hechas, contenedores no
hermticos, grandes defctos tecnolgicos,

26
Daos Infantiles (II)
Estos componentes se daan durante las
primeras horas (das o meses) dado que
son ms dbiles que los dems (mortalidad
infantil) y los daos que producen se
llaman Daos Infantiles (early fault).

27
Prevencin de Daos Infantiles
Los Daos Infanties relacionados con el
periodo de asentamiento:
Pueden ser reconocidos y eliminados
fcilmente usando procedimientos (pruebas
aceleradas, burn-in) que permitan forzar la
manifestacin del defecto intrnseco en el
sistema.

28
Las Pruebas Aceleradas (I)
Buscan acelerar la degradacin del sistema
en un tiempo dado, aumentando las
condiciones de exigencia con respecto a
aquellas de uso normal.
Resultan vlidas y significativas cuando no
introducen modos o mecansmos de dao
diferentes a los que se verificaran en la
condiciones de uso normal.
29
Las Pruebas Aceleradas (II)
Las exigencias que se exaltan para acelerar
la vida de los dispositivos pueden ser de
tipo:
Ambiental (temperatura, humedad)
Elctrico (voltaje, corriente)
Mecnico (vibraciones, golpes).

30
Burn-in
Aproximadamente, la vida operativa
vivida se duplica cada vez que la
temperatura supera el 10% de la
temperatura nominal de trabajo.
El burn-in ms utilizado es:
Para aparatos: funcionamiento a 45C de 12 a
45 horas.
Para componentes: funcionamiento a 125C
por 168 horas.
31
Periodo de Vida til
Despus del asentamiento, la tasa de dao
se estabiliza sobre un valor casi constante
por un periodo de tiempo relativamente
largo (periodo de vida til)
Este es el periodo ms interesante para el
usuario, porque se caracteriza por el valor
ms bajo de tasa de dao.

32
Daos en la Vida til (I)
El periodo de vida til se caracteriza por
daos causados por eventos que,
relacionados tpicamenten con el ambiente,
alcanzan incrementos imprevistos de
exigencia, ms all de la resistencia
mxima establecida por el diseo.

33
Daos en la vida til (II)
Como consecuencia:
Tales daos se pueden verificar durante
intervalos casuales, de manera imprevista, del
todo inesperada (daos casuales)
Ningn asentamiento ni ningn mantenimiento
es capaz de eliminarlos

34
Periodo de Desgaste
La Tasa de Dao crece rpidamente.
Los daos son debidos al envejecimiento
progresivo de los componentes: Daos
Seniles (wearout fault)

35
Daos Seniles
Durante este periodo se hacen evidentes
los mecansmos de dao intrnsecos de
cada tecnologa e independientes de la
construccin especfica de cada
componente.

36
Ejemplo
La utilizacin de un sistema metlico Au-Al
para la realizacin de soldaduras hace
inevitable el hecho de que, despus de
algunos aos (por ejemplo 10), la
soldadura se despegue, debido a la
formacin de compuestos intermetlicos
frgiles.

37
Prevencin de Daos por Desgaste (I)

Si la utilizacin del sistema no es contnua y


ste se puede apagar peridicamente, es
conveniente reemplazar, a intervalos
regulares y de duracin apropiada, los
componentes accesibles que se sabe estn
sometidos al desgaste (mantenimiento
preventivo).

38
Prevencin de Daos por Desgaste (II)

Si los componentes sometidos a desgaste son


inaccesibles entonces deben ser diseados larga
vida, de tal forma que el desgaste suceda
despus del tiempo de misin.
La aplicacin de este segundo mtodo comprende
los sistemas de un solo intento (one shot) que se
utilizan solo una vez, por ejemplo misiles o
satlites.

39
Ley Exponencial de Daos
Aplicando la frmula matemtica de la
confiabilidad durante el periodo de vida
til, con z(t)=:
R(t ) = e t
R(t)
1

1/ t
40
Medidas de Confiabilidad
Ms all del comportamiento estadstico de
R(t), es posible definir algunas medidas
particularmente representativas del nivel de
disponibilidad de un sistema.
Estas medidas son vlidas exclusivamente
cuando z(t)= (Daos Casuales).

41
Tiempo Medio antes de la Falla
(MTTF Mean Time To Failure)

Es el tiempo previsto durante el cual el


sistema funcionar antes de la primera
Falla.

42
Relacin entre MTTF y Confiabilidad

Despreciando algunos pasos:



MTTF = R(t )dt
0

Durante la vida til:



MTTF = e dt = 1
t

0

43
Relacin entre MTTF y Tiempo
de Misin

t R(t) R(t)
MTTF 0.368 1

MTTF / 10 0.905
MTTF / 20 0.951
1/=MTTF t
MTTF / 100 0.990
MTTF / 1000 0.999

44
Consecuencias (I)
La confiabilidad de un sistema que posee
una MTTF igual al su tiempo de misin es
igual a 0.368.
Esto implica que: haciendo funcionar 100
dispositivos del mismo tipo, al final del
tiempo de misin funcionarn ~37,
mientras que ~63 se habrn daado antes.

45
Consecuencias (II)
Para obtener, al final del tiempo de misin,
una confiabilidad del 99.9%, se debe
garantizar un MTTF 1000 veces superior al
Tiempo de Misin.

46
Sistemas Reparables (I)
Se define un Sistema Reparable a aquel,
despus de un malfuncionamiento, se
puede restablecer gracias a alguna accin
de mantenimiento o reparacin.

47
Sistemas Reparables (II)
El mantenimiento de un Sistema Reparable
se puede hacer de 2 modos:
Accin Correctiva: realizada como respuesta a
un malfuncionamiento
Accin Preventiva: realizada para prevenir o
retardar un malfuncionamiento.

48
Modelado de un Sistema
Un Sistema Reparable se encuentra en 2
estados posibles:
Funcionante (up)
En reparacin (down).
Ntese que el sistema puede estar en
Reparacin por una Accin Correctiva o por
una Accin Preventiva.

49
Tiempo Medio antes de la Reparacin
(MTTR Mean Time To Repair)

Se define como el tiempo medio necesario


para reparar el sistema.
Es difcil modelarlo matemticamente;
generalmente se recurre a datos
estadsticos medidos en laboratorio.

50
Tiempo Medio Entre Fallas
(MTBF Mean Time Between Failure )
Es el tiempo medio que pasa entre dos
fallas del sistema
Es diferente al MTTF, porque el MTTF hace
referencia a la Primera Falla
Toma en cuenta tambin el tiempo de
reparacin
Si navg es el nmero medio de fallas en un
periodo T, se tiene: T
MTBF =
navg
51
Relacin entre MTTF, MTBF, MTTR

Se supone que las reparaciones son


siempre posibles y perfectas (good as new)
Luego de cada reparacin, el sistema
funcionar durante el MTTF
Cuando el sistema falle, restar inactivo
durante el MTTR
Como consecuancia: MTBF = MTTF + MTTR

52
Disponibilidad
Proporcin de tiempo durante el cual el
sistema est disponible

MTTF
A=
MTTF +MTTR

53
Ejemplo
Considerando un sistema con:
MTTF = 886 horas
MTTR = 25 horas
A = 886/911 = 0.972

54
Resumen
Medidas Cuantitativas de Confiabilidad
Tcnicas para la evaluacin de la confiabilidad.
Clculo de la confibilidad de un sistema.

55
Calculo de la Confiabilidad de un
Sistema
Problema
Calcular la Confiabilidad de un sistema,
conociendo las tasa de dao de los
componentes que lo constituyen.

56
Modelo de Previsin de
Confiabilidad
Expresin matemtica que permite calcular
un valor esperado dada la tasa de dao de
un componente como funcin de las
caractersticas tecnolgicas, de las
exigencias elctricas, trmicas y
ambientales en las cuales el componente
trabaja.

57
Finalidad de un Modelo de Previsin

Verificar el cumplimiento de los objetivos


del diseo
Establecer los valores contractuales
Confrontar ms soluciones.

58
Modelos de Previsin: los Bancos
de Datos
Las tasas de dao son elencadas en
manuales
La tasa de dao se expresa a travs de un
modelo que contiene todo lo conocido
sobre las leyes de degradacin de los
componentes y la dependencia de factores
importantes.

59
Condiciones Habituales de
Funcionamiento
La estimacin correcta de la confiabilidad
calculada para un sistema, depende de la
exctitud de los valores de tasa de dao
adoptadas para los componentes.

60
Condiciones No Habituales de
funcionamiento
La Tasa de Dao sufre fuertes variaciones
con la variacin de los niveles de exigencia.
La Tasa de Dao de los componentes
electrnicos son fuertemente influenciadas
por los niveles de voltaje, corriente y
temperatura.

61
Valor de la Tasa de Dao
El valor asumido como Tasa de Dao de los
componentes se refierea un conjunto de:
Condiciones de funcionamiento (ej.: valores de
voltaje, corriente y temperatura).
Niveles de exigencia mecnica (ej.: las
vibraciones y los golpes).

62
Manuales
MIL-HDBK-217: Departamento de la
Defensa a partir de 1962
RDF: CNET Francia 1974
HRD: British Telecom UK 1974
RPP: Bell Core USA 1984
AT&T: USA 1990
IRPH93: Italtel, CNET e BT EU - 1993

63
MIL-HDBK-217
En el mbito electrnico, la referencia ms
conocida y usada es el manual MIL-HDBK-
217, publicado por el Departamento de la
Defensa USA en 1962 y actualizado
peridicamente. De este manual es posible
extraer la tasa de falla de cualquier
componente electrnico bajo cualquier
condicin de uso.

64
MIL-HDBK-217: Objetivo
Definir y mantener mtodos consistentes y
uniformes para estimar la confiabilidad de
los sistemas electrnicos en el mbito
militar.
Proveer modelos para el clculo de tasas de
dao.

65
MIL-HDBK-217
Presenta 2 mtodos:
Part stress analysis: presupone el conocimiento
de la informacin detallada del sistema y por
tanto se utiliza al final del diseo.
Parts count: necesita menos informacin y se
utiliza en la fase preliminar del diseo para
obtener una primera estima.

66
MIL-HDBK-217: Part Stress
Analysis (I)
Se debe disponer de una lista detallada de
las partes utilizadas en el sistema y de los
esfuerzos (stress) a los cuales se somenten
Hiptesis:
Componentes independientes.
Tasa de dao constante.

67
MIL-HDBK-217: Part Stress
Analysis (II)
p = b Q E A
p: Tasa de dao de la componente
b: Tasa de dao base
i : Factores que modifican la tasa de dao
base en funcin de los parmetros que
pueden influenciar la confiabilidad de la
parte.

68
MIL-HDBK-217: Part Stress
Analysis (III)
Principales factores utilizados:
Q: Factor de Calidad: depende del seleccin
(screeining) sufrida por la parte
E: Factor Ambiental: Toma en cuenta los
efectos de las condiciones ambientales (sobre
la tierra, sobre una nave, al vuelo, en el
espacio, sobre un misil, etc.)

69
MIL-HDBK-217: Part Stress
Analysis (IV)
Otros factores utilizados solo en modelos
especficos:
L: Factor de Aprendizaje, tiene en cuenta la madurez
de la tecnologa.
T: Factor de Temperatura.
E: Factor de Aplicacin
R: Factor de Potencia
S: Factor de Esfuerzo Elctrico
C: Factor de Construccin del Contacto
S: Factor de Funcin.

70
MIL-HDBK-217: Ejemplo
GAL (Generic Array Logic) y
Microprocesadores:
p = (c1 T + c2 E) Q L

71
Ejemplo de condiciones de referencia

Para la definicin del factor ambiental (E)


se definen 3 clases de ambiente:
Protegido climatizado E = 0
No protegido E = 2.5
Mvil E = 4

72
MIL-HDBK-217: Parts Count
Informacin necesaria:
Tipo y cantidad de partes:
Nivel de calidad de las partes:

= N i (G Q )i
n

i =1

73
Limitacin de las previsiones de
Confiabilidad a travs de manuales

Limitacin de los bancos de datos que


normalmente contienen poca informacin
acerca de los mecanismos de dao.
Hipotesis de tasa de dao constante.
La tecnologa electrnica est en constante
evolucin cosa que aumenta la dificultad de
evaluar la confiabilidad.

74
Estimacin de la Confiabilidad de un
Sistema

Instrumentos de software disponibles en el


mercado, permiten calcular los parmetros
de confiabilidad partiendo del modelo de
descripcin del sistema.

75
Diagrama de Bloques de Confiabilidad
(RBD Reliability Block Diagram)

Diagrama de eventos
Muestra como el dao de cualquier
componente influenciara el desempeo del
sistema.
Un sistema subdividido en unidades lo
suficientemente pequeas para poder
calcular la confiabilidad.

76
RBD: anlisis del sistema
En el diseo de un sistema cada parte
puede ser:
nica (el dao de tal elemento implica la falla
del sistema); tales elementos son necesarios
para realizar la funcin del sistema
Repetida (el dao de una de estas las partes se
compensa con el funcionamiento de sus
iguales)

77
Esquema de Confiabilidad
A partir del diseo se puede realizar un
sistema de bloques, conocido como
esquema de confiabilidad, en el cual:
Los elementos nicos se conectan en serie
Los elementos repetidos se conectan en
paralelo.

78
Ejemplo
in El sistema est formado por C1,
c1
C2 e C3 que son esenciales para
el funcionamiento del sistema.
c2 C5 es una repeticin de C4.
c3

c4 c5

out
79
Sistemas Serie (I)
En los sistemas Serie es suficiente con que
un solo elemento se dae para interrumpir
toda la cadena.

R1 R2 R3

80
Sistemas Serie (II)
La probabilidad de sobrevivencia del
sistema es el producto de la probabilidad
de sobrevivencia de cada bloque en serie.
Rs(t) = R1(t) R2(t) R3(t) = e -(1+2+3) t

81
Sistemas Serie (III)
En un sistema Serie la confiabilidad est
dada por el producto de la confiabilidad de
cada bloque y la Tasa de Dao es la suma
de las Tasas de Dao
s = i
Rs = Ri

82
Ejemplo 1
Analizando una central de conmutacin
compuesta por 10.000 componentes y
asumiendo que cada componente tenga
una Tasa de Dao = 10-7 = 0.1
ppm/hora.
La confiabilidad del sistema es:
Rs = e -(10^4 10^-7) t =e - t / 1000

MTTF = 1000 horas

83
Ejemplo 2 (I)
Consideremos un circuito electrnico
compuesto por:
4 transistores de silicio,
10 diodos de silicio
20 resistencias de aglomerado.
10 condensadores cermicos.

84
Ejemplo 2 (II)
Supongamos adems que:
El cableado (circuito impreso) y las soldaduras
sean 100% confiables.
Que los componentes trabajan bajo sus niveles
nominales de voltaje, corriente y temperatura.

85
Ejemplo 2 (III)
Supongamos que las tasas de dao sean
las siguientes para cada componente:
diodos: d = 0.000002
transistores: t = 0.00001
resistencias: r = 0.000001
condesasdores: c = 0.000002

86
Ejemplos 2 (IV)
Para evaluar la confiabilidad del circuito se
deben sumar las tasas de dao:
s = 10 d + 4 t + 20 r + 10 c
s = 0.0001
MTTF = 1 / s = 10.000 horas

87
Sistemas Paralelo (I)
Un conjunto de elementos tales que cada
uno es suficiente para asegurar el
funcionamiento del sistema.

R1 R2

88
Sistemas Paralelo (II)
Un sistema paralelo est constituidos por
dos aparatos similares, uno de los cuales es
redundante y entra en funcionamiento
cuando el otro se daa.
Un sistema paralelo se daa cuando ambos
aparatos se daan.

89
Sistemas Paralelo (III)
La probabilidad de dao de un sistema
paralelo se debe a la probabilidad del dao
contemporneo de cada aparato.
Suponiendo que los daos en cada aparato
sean independientes:
Qp(t) = Q1(t) Q2(t) Q3(t)
Qp(t) = [1 - e -1 t ] [1 - e -2 t ] [1 - e -3 t ]

90
Ejemplo
Un aparato constituido por dos bloques
redundantes de 10.000 componentes,
posee una tasa de dao de 10-7 la
probabilidad de dao del sistema es:
Qs = ( 1 - e -t/1000 )(1-e -t/1000 )
Rs = 1 Qs

91
Duplicacin
En un sistema duplicado:
Q (t) = [1 - e - t ]2 = 1 - 2 e - t + e 2 t

R(t) = 1 - Q (t) = 2 e - t - e 2 t

MTTF = R(t )dt
0
MTTF = 1.5 / = 1.5 MTTF0

92
M1

Redundancia 2-de-3
M2 V

M3

Como hipotesis el comparador de votos (voter) est


libre de daos.
La confiabilidad se determina enumerando los casos
disyuntos de funcionamiento correcto.
Los 3 estn libres de daos (probabilidad R03)
M1 y M2 funcionante, M3 daado (probabilidad R02(1-R0))
M1 y M3 funcionante, M2 daado (probabilidad R02(1-R0))
M2 y M3 funcionante, M1 daado (probabilidad R02(1-R0))
R = R03 + 3R02(1-R0) = 3R02 2R03 = 3e-2t 2e-3t
MTTF = 3/2-2/3=5/6= 5/6 MTTF0

93
Cut Set
Es el conjunto de componentes, cuyo dao
provocara unmalfuncionamiento del
sistema
1 2
4
3

Cut Set: {(1,3), (2,3), (4)}


94
Tie Set
Es el conjunto de componentes, cuyo
funcionamiento asegura el funcionamiento
del sistema.
1 2
4
3

Tie Set: {(1,2,4), (3,4)}


95
Redundancia (I)
Activa: los elementos redundantes son sometidos
a la misma carga que el resto de los elementos
operativos, durante todo el tiempo de misin.
(R= 0)
Caliente: los elementos redundantes son
sometidos a una carga ms baja hasta que uno
de los elementos operativos se daa (R < 0)
Stand-by: los elementos redundantes no se
somenten a ninguna carga hasta que uno de los
elementos operativos se daa (R= 0).

96
Redundancia (II)
En los casos de redundancia caliente y
stand-by se existe de un interruptor
(switch) que permite el cambio
maestro/esclavo (master/slave) en el
momento en el que se presenta el dao en
el maestro (master).

97
Caso de studio
Calcule la confiabilidad del sistema ilustrado
en la figura.
A1

CS S

A2
98
Descripcin del sistema
Los dos aparatos A1 y A2 don redundantes.
Un interruptor S (accionado usando un
comando de cambio CS) permite
seleccionar uno de los dos aparatos.

99
Construccin del Esquema de
Confiablidad
Para obtener el esquema de confiabilidad
se deben buscar los eventos que pueden
conducir al dao del sistema. Tales
eventos son:
1. Se daan ambos, A1 y A2
2. Se daa S
3. Se daan ambos, A1 y CS.

100
Esquema de Confiabilidad
Cada uno de los eventos considerados es
suficiente para bloquear el sistema,
entonces se conectan confiabilsticamente
en serie.
Los sub-eventos que componen los eventos
1 y 3 se deben conectar en paralelo porque
deben suceder los dos para que el sistema
se dae.
101
Esquema de Confiabilidad
El esquema de Confiabilidad es el
siguiente:

1 1
s
2 cs

102
Ejercicio
El servidor de una base de datos necesita
315GByte de disco, tal espacio se obtiene usando
9 discos de 35GByte. Por cuestiones de
desempeo, no se conectan ms de 3 discos a un
mismo controlador.
Considere los siguientes sistemas:
Sistema no tolerante a fallas: el sistema se daa
cuando se daa un disco o un controlador o el servidor.
Sistema tolerante a fallas: Con esta arquitectura el
malfuncionamiento de un disco debido al controlador
es compensado por el sistema.

103
Ejercicio (continuacin)

Disear el esquema confiabilstico


Calcular las funciones de confiabilidad
asumiendo los siguientes valores de MTTF:
Disco, MTTFD = 200.000 horas
Controlador, MTTFC = 500.000 horas
Servidor, MTTFS = 25.000 horas.

104
Solucin (I)
Sistema no tolerante:
s c1 d1 d2 d3

c2 d4 d5 d6

c3 d7 d8 d9

s = S + 3 C + 9 D =
4*10-5 + 6*10-6 + 4.5*10-5 = 9.1*10-5
MTTF = 1 / s = 1098 horas
105
Solucin (II)
Sistema tolerante:
d1 d4

s c1 d2 c2 d5
d3 d6
d7 d10

c2 d8 c4 d11
d9 d12

s = S + 4 C + 4*6/5 D + =
4*10-5 + 8*10-6 + 2.4*10-5 = 7.2*10-5 = 1388 horas
106

Das könnte Ihnen auch gefallen