Sie sind auf Seite 1von 13

METODOS PROBABILSTICOS

Los mtodos aplicados a continuacin se aplicarn a la seguridad de sistemas, midiendo probabilidades de fallas de software y de hardware en tiempos dados.

Procesos Estocsticos
En estadstica, y en concreto teora de la probabilidad, un proceso aleatorio o proceso estocstico es un concepto matemtico que sirve para caracterizar; es una sucesin de variables aleatorias (estocsticas) que evolucionan en funcin de otra variable, generalmente, el tiempo. Cada una de las variables aleatorias del proceso tiene su propia funcin de distribucin de probabilidad y, entre ellas, pueden estar correlacionadas o no. Cada variable o conjunto de variables sometidas a influencias o impactos aleatorios constituye un proceso estocstico

Distribucin de Poisson
Definicin: Expresa la probabilidad de un nmero k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una frecuencia media conocida y son independientes del tiempo discurrido desde el ltimo evento. Frmula:

Donde es un parmetro positivo que representa la frecuencia esperada del fenmeno modelado por la distribucin. Ejemplo: Si 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas En este caso concreto, k es 5 y , , el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad deseada es

Variables Aleatorias

Una variable aleatoria es un valor numrico que corresponde al resultado de un experimento aleatorio, como la suma de los puntos obtenidos al lanzar dos dados, el nmero de lanzamientos de un dado hasta que aparece el cuatro, el nmero de personas que suben en un determinado ascensor al mes, el tiempo de espera en la sala de un doctor. Momentos de una Variable Aleatoria Sea X es una variable aleatoria. El r-simo momento de X consiste en obtener los valores esperados de X hasta de orden r:

En la teora de probabilidad y estadstica, una distribucin de probabilidad identifica bien la probabilidad de cada valor de una variable aleatoria no identificados (cuando la variable es discreta), o la probabilidad de que el valor que corresponda a un determinado intervalo (cuando la variable es continua). [1 ] La distribucin de probabilidad describe el rango de valores posibles que una variable aleatoria se puede alcanzar, y la probabilidad de que el valor de la variable aleatoria dentro de un (medibles) subconjunto de ese rango. Cuando la variable aleatoria toma valores en el conjunto de los nmeros reales, la distribucin de probabilidad es completamente descrito por la funcin de distribucin acumulada, cuyo valor en cada real x es la probabilidad de que la variable aleatoria es menor o igual que x. El concepto de la distribucin de probabilidad y las variables aleatorias que describen la base de la disciplina matemtica de la teora de la

probabilidad, y la ciencia de la estadstica. Hay dispersin o variabilidad en el valor de casi todos los que se puede medir en una poblacin (por ejemplo, la altura de las personas, la durabilidad de un metal, etc), casi todas las mediciones se hacen con algn error intrnseco, en muchos procesos de la fsica se describen de forma probabilstica, de de las propiedades cinticas de gases a la descripcin de la mecnica cuntica de las partculas fundamentales. Por estas y muchas otras razones, nmeros simples son a menudo inadecuados para describir una cantidad, mientras que las distribuciones de probabilidad son a menudo ms apropiados. Hay varias distribuciones de probabilidad que aparecen en diversas aplicaciones. Uno de los ms importantes es la distribucin normal, que es tambin conocida como la distribucin de Gauss o curva de campana y se aproxima a muchas distribuciones diferentes de origen natural. El lanzamiento de una moneda de rendimiento justo de distribucin de otro familiar, donde los valores posibles son a cara o cruz, cada uno con una probabilidad de 1 / 2. Distribucion Exponencial Distribucin de la vida exponencial (o modelo HPP) las pruebas de Pruebas exponencial son comunes en la industria para verificar que las herramientas, sistemas o equipos cumplen con sus requisitos de fiabilidad a tiempo medio entre fallos (MTBF). El supuesto es que el sistema tiene una falla constante (o reparacin) tarifa, que es el recproco de la MTBF. El tiempo de espera entre las fallas sigue el modelo de distribucin exponencial. Una situacin tpica prueba podra ser: una pieza compleja de equipo nuevo o herramienta se instala en una fbrica y un estrecho seguimiento por un perodo de varias semanas a varios meses. Si no tiene ms que un pre-determinado nmero de fallos durante ese perodo, el equipo "pasa" su prueba de aceptacin de la fiabilidad. Este tipo de prueba de fiabilidad a menudo se denomina prueba de aptitud o de un producto de aceptacin de prueba de confiabilidad (PRAT). Sanciones contractuales puede ser invocada si el equipo no supera la prueba. Todo est vinculado a una reunin de los clientes MTBF requisito en un nivel de confianza especificado.

Cunto tiempo debe probar una pieza de equipo o un sistema para asegurar un MTBF especificado a una confianza dado? Se comienza con un objetivo determinado MTBF, m, y un nivel de confianza, por ejemplo, 100 (1-alfa). Usted necesita una pieza ms de informacin para determinar la longitud de la prueba: cuntos no lo quiere permitir y an "pasar" el equipo? Cuanto ms no autorizados, la ms larga es la prueba requerida. Sin embargo, un largo ensayo que permite ms fallos tiene la caracterstica deseable de lo que es menos probable que una buena pieza de equipo ser rechazado por suerte al azar "malo" durante el perodo de prueba. El procedimiento recomendado es para iterar sobre r = el nmero de no admisibles, hasta un mayor r exigira una longitud de prueba inaceptables. Para cualquier eleccin de r, la longitud de la prueba correspondiente se calcular multiplicando rpidamente M (el objetivo) por el factor en el siguiente cuadro correspondiente a la fila r-o columna deseada y el nivel de confianza. Por ejemplo, para confirmar un objetivo de 200 horas de MTBF de confianza del 90%, lo que permite hasta 4 fallos en la prueba, la duracin del ensayo debe ser de 200 7,99 = 1598 horas. Si este es un tiempo excesivamente largo, trate de no permitir que slo el 3 por un perodo de ensayo de 200 6,68 = 1336 horas. El ms corto de prueba no permitira ninguna falla y el ltimo 200 2,3 = 460 horas. Todas estas pruebas de garanta de 200 horas de MTBF de confianza de 90%, cuando el equipo pasa. Sin embargo, la prueba ms cortos son mucho menos "justo" para el proveedor en que tienen una gran oportunidad de fallar un pedazo marginalmente aceptable de los equipos. Ejemplo 1: Suponga que un sistema contiene cierto tipo de componente cuyos tiempo de falla en aos est dada por T. La variable aleatoria T se modela bien mediante la distribucin exponencial con tiempo medio para la falla =5. Si se instalan cinco de estos componentes en diferentes sistemas. Cul es la probabilidad de que al menos dos an funcionen al final de ocho aos? Solucin: La probabilidad de que un componente dado an funcione despus de ocho aos est dada por:

Distribucion Gamma En la teora de probabilidad y estadstica, la distribucin gamma es una familia de dos parmetros de las distribuciones de probabilidad continua. Tiene un parmetro de escala y un parmetro de forma k. Si k es un entero entonces la distribucin representa la suma de k variables independientes de distribucin exponencial al azar, cada una de ellas tiene una media de (que es equivalente a un parmetro de tasa de -1). La distribucin gamma es con frecuencia un modelo de probabilidad para los tiempos de espera, por ejemplo, en las pruebas de la vida, el tiempo de espera hasta que la muerte es una variable aleatoria que a menudo se modela con una distribucin gamma [1]. Distribuciones Gamma se ajustaban a las cantidades de lluvia de las tormentas diferentes , y las diferencias en las cantidades de semillas y las tormentas de preclasificacin se reflejan en las diferencias de k y los parmetros estimados [2] La frmula general para la funcin de densidad de probabilidad de la distribucin gamma es de

Donde es la forma del parametro, es la ubicacion del parametro, es la escala del parametro, y es la funcin gamma que tiene la formula

El caso donde = 0 y = 1 se llama la distribucin gamma estndar. La ecuacin para la distribucin gamma estndar se reduce a la

La siguiente es la trama de la funcin gamma de densidad de probabilidad.

Distribucin Beta En la teora de probabilidad y estadstica, la distribucin beta es una familia de distribuciones de probabilidad continua definida en el intervalo (0, 1) con parmetros de los dos parmetros forma positiva, por lo general denota por y . Es el caso especial de la distribucin de Dirichlet con slo dos parmetros. Dado que la distribucin de Dirichlet es el conjugado antes de la distribucin multinomial, la distribucin beta es el conjugado antes de la distribucin binomial. En la estadstica bayesiana, puede ser visto como la distribucin posterior del parmetro p de una distribucin binomial despus de observar - 1 eventos independientes con probabilidad p y - 1 con probabilidad 1 p, si la distribucin antes de p fue uniforme. La frmula general para la funcin de densidad de probabilidad de la distribucin beta

donde p y q son la forma de parmetros, A y B son los lmites inferior y superior, respectivamente, de la distribucin, y B (p, q) es la funcin beta. La funcin beta tiene la formula

El caso en que a = 0 y b = 1 se llama la distribucin beta estndar. La ecuacin para la distribucin beta estndar es

Generalmente se define la forma general de una distribucin en trminos de ubicacin y los parmetros de escala. La versin beta es diferente en que se define la distribucin general en trminos de los lmites inferior y superior. Sin embargo, la ubicacin y los parmetros de escala pueden ser definidas en trminos de los lmites inferior y superior de la siguiente manera: ubicacin = a escala = b a La siguiente es la trama de la beta de la funcin de densidad de probabilidad para los cuatro valores diferentes de la forma de parmetros.

Mtodos probabilsticas para la deteccin de defectos en software

a) Probabilidad Condicional Las probabilidades estn conformadas por 3 axiomas bsicos p(A), la probabilidad de la ocurrencia de un evento. A, es un nmero entre 0 y 1; p(A)=0 significa que A no se dar nunca, p(A)=1 significa que A se dar ciertamente; p(A or B) = p(A) + p(B) dado que A y B son distintos. Sin embargo al referirnos a una probabilidad p(H) de un evento o hiptesis estamos refirindonos a una probabilidad bastante simplificada, ya que por lo general la probabilidad de un evento se da en un contexto sensitivo es decir que la probabilidad de que se de un evento o hiptesis tambin depende de otro evento(evidencia) que esta en el mismo contexto y es su condicional, por lo general esta probabilidad se denota as p(H|E) y se lee la probabilidad de H dada la evidencia E. Un avance significativo en la teora de probabilidades ha sido la demostracin de una equivalencia formal entre la estructura de un modelo grfico y las dependencias que son expresadas por una distribucin de probabilidad numrica. En trminos numricos podemos decir que el evento A es independiente del evento B si observamos que B no influye en A lo cual hace que p(A|B) = p(A). En trminos de grafos podemos indicar que A es independiente de B si no hay una conexin o arista entre los nodos A y B.

b) Teorema de Bayes y los modelos grficos El teorema de Bayes bsicamente se enfoca de un universo U a un subconjunto B restringido que se mantiene, es decir que se enfoca en una fraccin de eventos B para los que A es tambin verdad.

Este teorema es importante ya que muestra que podemos razonar en ambos sentidos para obtener una probabilidad, es decir

podemos obtener probabilidades de las causas a efectos y de los efectos a las causas En trminos probabilsticos , dos variables X e Y son independientes si p(X,Y) = p(X)p(Y) la distribucin de probabilidad sobre 2 variables factorizadas en 2 distribuciones independientes. Esto se expresa en un grfico mediante la ausencia de una arista expresando la influencia entre las 2 variables. Tambin se puede agregar una tercera variable con lo cual se le da la siguiente expresin de probabilidad p(X,Y | Z) = p(X | Z)p(Y | Z).

De modo similar, se puede descomponer la distribucin de probabilidad asociadas con los nodos DD, TE y SQ tal que la probabilidad p(DD, TE, SQ) = p(DD | TE,SQ)p(TE)p(SQ). Esto nos da una serie de casos de ejemplos donde un grafo puede admitir una simple factorizacin correspondiente a distribucin de probabilidad. Si el grafo es dirigido y no hay ciclos en el grafo, entonces esta propiedad es general.

c) Modelo Probabilstico para la prediccin de defectos Los modelos probabilsticos son buenos candidatos para un modelo efectivo de prediccin de defectos de software por las siguientes razones: Pueden modelar fcilmente la influencia entre las variables de un dominio especfico. El enfoque bayesiano permite la inferencia estadstica para ser ampliado por expertos en aquellas reas de un dominio del problema en que los datos empricos son escasos Como resultado de lo anterior, es posible incluir las variables en un modelo de fiabilidad del software que corresponden a proceso, as como los atributos del producto La asignacin de probabilidades a las predicciones de fiabilidad significa que la toma de decisiones correcta utilizando la teora de los enfoques clsicos puede ser apoyada.

d) Estructura de una red probabilstica Los modelos probabilsticos son ejecutados usando la maquina de inferencia probabilstica de Hugin, sin embargo el tamao y la complejidad de la red no hizo posible la construccin de la red usando directamente herramientas Hugin, sin embargo se pudo usar Agena Ltd la cual consta de 2 metodos y herramientas que son construidos en maquina de propagacin de Hugin. La SERENE, que es un mtodo y herramienta la cual permite que grandes redes sean construidas desde las mas pequenas en un punto de vista modular,y las grandes tablas de probabilidad sean construidas usando funciones matematicas predefinidas y distribucin de probabilidad. El IMPRESS, que es un mtodo y herramienta la cual extiende a SERENE para permitir a los usuarios generar simplemente distribuciones e probabilidad complejos.

e) Las Tablas de probabilidad El trabajo en la construccin de modelos grficos de probabilidad se factoriza en dos escenarios. Escenarios Cualitativos: Consideran la relacin general entre las variables de inters en trminos de relevancia de una variable a otra en circunstancias especficas. Escenarios Cuantitativos: Es la especificacin numrica de parmetros de los modelos.

f) Conclusiones Un modelo de probabilidad para de prediccin de defectos en software puede no ser solamente usado para evaluar proyectos en ejecucin, sino tambin puede ser usado para explorar posibles efectos de un rango de actividades de mejora en los procesos de software. Si los costos pueden ser asociados con mejora de procesos, y beneficios evaluados para las mejoras previstas en la calidad de software, entonces el modelo puede ser usado para soportar la toma de decisiones para SPI(Software Process Improvement). Una desventaja de un modelo de confiabilidad de esta complejidad es la cantidad de data que es necesario para soportar estadsticamente estudios de validacin significativos.

Das könnte Ihnen auch gefallen