Sie sind auf Seite 1von 31

Tolerncia a Falhas

Reviso de Confiabilidade

Medidas
Taxa de Defeitos
Curva da banheira
Tempos Mdios (mean times)
MTTF, MTBF, MTTR
Exemplos de clculos de tempos mdios

Confiabilidade
Disponibilidade
Cobertura

Comportamento ideal x real


Ideal

Real

O que medir ?

Com que freqncia ocorrem defeitos?


Qual o tempo entre um defeito e outro?
Qual o tempo at o primeiro defeito?
Qual o tempo gasto para reparar cada defeito?
Quais as chances do sistema funcionar sem defeitos durante um
determinado perodo de tempo?
Quais as chances dos sistema estar funcionando em um determinado
instante?

Curva da Banheira
fases de mortalidade infantil e envelhecimento muito
pequenas comparadas ao perodo de vida til

vlido para hardware

Mortalidade Infantil
Alta taxa de defeitos que diminui rapidamente no tempo
componentes fracos e mal fabricados

mortalidade infantil uma fase de curto perodo de durao


burn-in: remoo de componentes fracos
operao acelerada de componentes antes de coloc-los no produto final
s entram em operao componentes que sobreviveram mortalidade infantil

Envelhecimento
taxa de defeitos aumenta rapidamente com o tempo
devido ao desgaste fsico do componente

conhecendo o incio da fase de envelhecimento possvel


substituir o componente
sistema volta a operar na fase de vida til
envelhecimento tambm uma fase de curto perodo de durao

ideal evit-la

Tempo de vida til


Corresponde ao tempo em que um componente pode
ser utilizado antes que comece a apresentar uma alta
taxa de falhas
Tempo de vida em operao normal
essa fase apresenta um servio mais previsvel em relao a falhas

relao exponencial entre confiabilidade e tempo


usa - taxa de defeitos constante

O que medir ?

Com que freqncia ocorrem defeitos?


Qual o tempo entre um defeito e outro?
Qual o tempo at o primeiro defeito?
Qual o tempo gasto para reparar cada defeito?
Quais as chances do sistema funcionar sem defeitos durante um
determinado perodo de tempo?
Quais as chances dos sistema estar funcionando em um determinado
instante?

Medidas
mean time to failure

MTTF

tempo esperado at a primeira ocorrncia de defeito

mean time to repair

MTTR
Tempo mdio para reparo do sistema

MTBF
tempo

mean time between failure


mdio entre defeitos do sistema

MTTF mean time to failure

tempo esperado de operao do sistema antes da ocorrncia do


primeiro defeito
exemplo:
considera-se N sistemas idnticos colocados em operao a partir do
tempo t=0
mede-se o tempo de operao ti de cada um at apresentar defeito
MTTF o tempo mdio de operao
N

MTTF =

ti
N
i=1
quanto maior a quantidade de
Amostras N, mais prximo do
Valor real ser o MTTF estimado

MTTF

MTTF = ti
i=1

ou MTTF = 1/

Para um nico sistema o


procedimento semelhante:
ti passa a ser Dti, o intervalo de
tempo em operao entre os
defeitos, e N o nmero de defeit

Considerando R(t) = e-t

MTTF: Exemplo

MTTF = (Dt1 + Dt2 + Dt3)/n defeitos


MTTF = 46,5/3 = 15,5 h
Taxa de defeitos () = 1/MTTF = 0,064 def/h

MTTR mean time to repair


Tempo mdio de reparo do sistema
Inclui:
O tempo gasto identificando o erro (80% do tempo total)
O tempo gasto resolvendo o erro
O tempo gasto em espera para o erro de ser resolvido

Sistema
completamente
operacional

Difcil de estimar
Geralmente usa-se injeo de falhas
Injeta-se uma falha de cada vez e mede-se o tempo
Nova constante - Taxa de reparos

= taxa de reparos por hora

Em sistemas de alta disponibilidade,


importante diminuir o tempo de
reparo
para aumentar a disponibilidade do
sistema

ou ento

MTTR
Ri = tempo de reparo da falha i
n = nmero de falhas

Quanto maior o nmero de amostras, melhor

MTTR: exemplo

Tempo de reparo do 1 defeito (R1) = 0,5 h


Tempo de reparo do 2 defeito (R2) = 1 h
MTTR = (R1 + R2) / n reparos
MTTR = 1,5 / 2
MTTR = 0,75 h

MTBF mean time between failure

MTBF = MTTF + MTTR


diferena numrica pequena em relao a MTTF
os tempos de operao so geralmente muito maiores que os tempos
de reparo
na prtica valores numricos muito aproximados (tanto faz usar um
como outro)
considera-se:
reparo coloca sistema em condies ideais de operao

MTBF

MTBF: Exemplo

Tempo entre o incio e o 1 defeito (Dd1) = 6 h


Tempo entre 1 e 2 defeitos (Dd2) = 26 h
Tempo entre 2 e 3 defeitos (Dd3) = 16 h

MTBF = (Dd1 + Dd2 + Dd3)/n defeitos


MTBF = 48/3
MTBF = 16 h

Demais medidas

Com que freqncia ocorrem defeitos? Taxa de defeitos


Qual o tempo entre um defeito e outro? MTBF
Qual o tempo at o primeiro defeito? MTTF
Qual o tempo gasto para reparar cada defeito? MTTR
Quais as chances do sistema funcionar sem defeitos durante um
determinado perodo de tempo?
Quais as chances dos sistema estar funcionando em um determinado
instante?

Confiabilidade
probabilidade de que um sistema funcione corretamente
durante um intervalo de tempo [t0,t]

Reliability
Considerando um sistema contendo N componentes idnticos
S(t) = numero de componentes sobreviventes no tempo t
F(t) = numero de componentes falhos no tempo t

Confiabilidade
para um taxa de defeitos constante a confiabilidade R(t)
varia exponencialmente em funo do tempo
sistema na fase de vida til: taxa de defeitos constante

R(t) = e-t

exponential failure law

a mais usada relao entre confiabilidade e tempo


vlida principalmente para componentes eletrnicos
discutvel se vale para software: conforme o software vai sendo usado,
bugs vo sendo descobertos e a confiabilidade do software aumenta

Confiabilidade, MTTF e Taxa de defeitos

Qualquer sistema tem 37% de chance de funcionar corretamente


durante um perodo de tempo = MTTF (63% de falhar)

Confiabilidade: distribuio de Weibull


Expresso semi-emprica desenvolvida por Ernest Hjalmar Wallodi
Weibull, fsico sueco, que em 1939 apresentou o modelo de
planejamento estatstico sobre fadiga de material.
Sua utilidade decorre do fato, de permitir:
representar falhas tpicas de partida (mortalidade infantil), falhas
aleatrias e falhas devido ao desgaste.
obter parmetros significativos da configurao das falhas.
representao grfica simples.

Confiabilidade: distribuio de Weibull


se taxa de defeitos varia com o tempo
z(t) distribuio de Weibull
importante para modelagem de software onde a confiabilidade pode inclusive
aumentar com o tempo
z(t) = (t)-1 para >0 e >0

R(t) = e (t)

e so constantes que
controlam a
variao de z(t) no tempo

para =1

z(t) = constante =

para >1

z(t) = aumenta com o tempo

para <1

z(t) = diminui com o tempo

Confiabilidade
Para: =1

=0,1

taxa de defeitos constante

confiabilidade diminui com o tempo

Confiabilidade
Para: =0,6 =0,1

taxa de defeitos diminui


Como tempo

confiabilidade diminui com o tempo


mas no to acentuadamente

Confiabilidade
Para: =2

=0,1

taxa de defeitos aumenta


linearmente com o tempo

confiabilidade diminui com o tempo


acentuadamente

Disponibilidade

A(t): Availability

probabilidade do sistema estar operacional no instante t (disponvel


para o trabalho til)
alternncia entre perodos de funcionamento e de reparo
A(t) = R(t) quando reparo tende a zero

lembrar que MTBF = MTTF + MTTR


intuitivamente

A(t) = top / (top+ treparo)


genericamente

A(t) = MTTF / (MTTF + MTTR)

top = tempo de operao norma


Treparo = tempo de reparo

nessa relao, o significado de alta disponibilidade fica ma


diminuindo o tempo mdio de reparo, aumenta a disponibilida

Cobertura

Cobertura de falhas
Habilidade do sistema de realizar deteco, confinamento, localizao, recuperao...
Geralmente se refere a habilidade de realizar recuperao de falhas

Extremamente difcil de calcular

Significado matemtico:

Geralmente assumido um valor constante


Probabilidade condicional que dada uma falha o sistema se recupere
Determinao: listar falhas possveis e falhas que o sistema pode tolerar e
calcular o percentual
Muito usada tambm em experimentos de injeo de falhas

Problemas com medidas

Defeitos so eventos aleatrios


Podem demorar muito para ocorrer, no ocorrer ou ocorrer em um momento no
apropriado

Custo de avaliao experimental alto


Necessria uma grande quantidade de amostras
Necessrio tempo grande de avaliao

importante avaliar durante o projeto do sistema


Injeo de falhas

Das könnte Ihnen auch gefallen