Sie sind auf Seite 1von 12

INTRODUCCION A LAS REDES BAYESIANAS

A. Hananel
Definicin.- Una red Bayesiana consiste de:
Un conjunto de enlaces dirigidos entre variables
Cada variable tiene un conjunto finito de estados
Las variables junto con los enlaces dirigidos forman un grfico dirigido aciclico (DAG)
Para cada variable A con padres B
1
,... B
n
existe una funcin de probabilidad
condicional p(A/ B
1
,... B
n
).

Si A no tiene padres, entonces la expresin anterior se reduce a la probabilidad no
condicional P (A). En la figura 01, se necesita especificar las probabilidades a priori P(A),
P(B), P(C\A,B), P(E\C), P(D\C), P(F\E) y P(G\D,E,F).













Figura 01 : Un grfico dirigido ciclico

Como se podr intuir, la transmisin de evidencia es un trabajo muy laborioso, ms an
cuando el nmero de variables involucradas es muy grande.

Afortunadamente, existen herramientas que pueden hacer el trabajo por nosotros. Una de
ellas es HUGIN, software para modelacin y procesamiento de redes Bayesianas.







A
B
C
E D
F
G
Ejemplo 01: El rbol de manzana.
En este ejemplo, el problema consiste en una pequea plantacin de manzanas. Uno de los
das, el dueo descubre que una de sus plantas ms apreciadas, est perdiendo sus hojas. El
quiere conocer cul es la causa de esto. Sabe que si el rbol esta seco a causa de la sequa,

Solucion
No hay misterio (es muy comn que los rboles pierdan sus hojas durante una sequa). Por
otro lado, la prdida de hojas puede ser un indicio de enfermedad. La situacin puede ser
modelada en la figura 02.






Figura 02 : Problema de la manzana

La red Bayesiana consiste en tres nodos Enf, Seq, Prd, los cuales pueden estar en dos
estados Enf=Si o No: Seq=Si o No y Prd=Si o No. La red Bayesiana nos dice que existe
una dependencia causal de Enf a Prd y de Seq a Prd. Esto es representando por las dos
flechas.

La representacin anterior, solamente es la representacin cualitativa de la red Bayesiana.
La parte cualitativa es la funcin de probabilidad condicional, la cual esta representada por
las siguientes tablas de probabilidades:
Enf=si Enf=no
0.1 0.9
Tabla 1 : P(Enf)

Seq=si Seq=no
0.1 0.9
Tabla 2 : P(Seq)

Seq=si Seq=no
Enf=si Enf=no Enf=si Enf=no
Perd=si 0.95 0.85 0.9 0.02
Perd=no 0.05 0.15 0.1 0.98

Tabla 3 : P(Perd Enf,Seq)


Enf
Seq

E n f

Prd

Se observa que las tres tablas exhiben la probabilidad de que un nodo se encuentre en un
estado especifico dependiendo de los estados de los nodos de sus padres. Como ni Enf ni
Seq tienen padres, las tablas 1 y 2 no estn condicionadas por algo.

Con la informacin anterior, las probabilidades asociadas a diferentes combinaciones de
estados se pueden calcular utilizando la regla fundamental del calculo de probabilidades y
y la regla de Bayes.

Para calcular la probabilidad conjunta P(Perd,Enf,Seq) se utiliza la regla fundamental:

P(Perd,Enf,Seq)=P(Enf,Seq)P(Perd Enf,Seq)

Como Enf y seq son independientes, tenemos:

P(Perd,Enf,Seq)=P(Enf)P(Seq)P(Perd Enf,Seq)

Los resultados se muestran en la tabla 4.

Seq No Seq
Enf (0.0095,0.0005) (0.081,0.009)
No Enf (0.0765,0.0135) (0.0162,0.7938)
Tabla 4: P(Perd, Enf, Seq)


Ejemplo 02
Dibujar el grafo de una red bayesiana para un dominio que considere las siguientes
variables:

R : renta per capita de un pas
E : extensin en km
2
del mismo
I : nmero de casos por 1000 habitantes (o prevalencia) de enfermedades infantiles en ese
pas
K : kilmetros de autopista en el pas


Comentar las dependencias e independencias probabilsticas representadas (implcita o
explcitamente) en la red y enumerar, adems, que tablas de probabilidad intervienen en la
misma.

Solucin:
Qu pretende este problema? . Estudiar ejemplos de representacin de conocimiento
causal de un dominio mediante redes bayesianas.

Parece lgico pensar que la extensin de un pas influir en el nmero de kilmetros de
autopista y que la renta per cpita lo har sobre las enfermedades infantiles y sobre los
kilmetros de autopista del mismo, sin que exista ninguna otra relacin de dependencia
entre las cuatro variables consideradas (la renta per cpita de un pas, as como la
proporcin de casos de enfermedades infantiles en el mismo, son independientes de su
extensin y los kilmetros de autopista tampoco influyen en la prevalencia o proporcin
de enfermedades infantiles que se presentan).

De acuerdo con las relaciones que se han establecido, el grafo pedido seria el siguiente:












Figura 03

En cuanto a las probabilidades que intervienen en la red son :

P ( r ), P ( e ), P (i / r ), P (k /r, e)

Donde las dos primeras son probabilidades a priori y las restantes son probabilidades
condicionadas (las letras maysculas representan variables y las minsculas los valores
que stas toman)





RENTA PER
CAPITA
EXTENSIN
PROPORCIN
ENFERMEDADES
INFANTILES
KMS. AUTOPISTA
E
K
I
R

Ejemplo 03
Dibujar el grafo de una red bayesiana que considere el sexo de una persona, su edad, sus
ingresos mensuales, su estatura, el nmero de calzado que usa y el tipo de coche que
posee. Comentar las dependencias e independencias probabilsticas representadas
(implcita o explicitamente) en la red. Enumerar, adems, qu tablas de probabilidad
forman parte de dicha red.
Solucin
Las variables que van a ser consideradas son:
S : Sexo
E : Edad
I : Ingresos
T : Estatura
C : Coche
N : Nmero de calzado

Evidentemente el sexo de una persona influira ensus ingresos (todavia en nuestra
sociedada una importante parte de las profesiones siguen considerandose tipicas de un
determinado sexo e incluso dentro de la misma profesion las mujeres suelen ganar menos
que los hombres), tipo de coche (en general los hombres prefieren coches potentes ,
mientras que las mujeres optan por aquellos que les facilitan la conduccion), la estatura (la
estatura media es liligeramente superior a la de la mujer) y el numero de calzado (las
mujeres suelen usar numeros menores). Tambien el sexo influye enla edad que una
persona va alcanzar; de hecho, las mujeres tienen una esperanza de vida varios as mas
que la de los hombres. Esto dara lugar a que, dada cierta persona de un determinado sexo,
la probabilidad de que sea de avanzada edad sera mayor si se trata de una mujer y no de un
hombre.

Como consecuencia de todo lo comentado con anterioridad, se podria ir trazando los
siguientes enlaces.
















Figura 04

En cuanto a la edad, sta va a influir en el nivel de ingresos de una persona (en general,
con la edad cualquier trabajador alcanza una mayor experiencia y cualificacin en su
trabajo, que le permite elevar su nivel de ingresos), en el tipo de coche que posea (mientras
que la gente de ms edad prefiere coches ms seguros, los jvenes ven en la velocidad una
cualidad importante) y en su estatura. Por tanto, se podra ampliar el grafo anterior de la
siguiente forma:


















Figura 05


Obsrvese que no se ha trazado ningn enlace desde E hasta N. Esto es as debido a que
dada una determinada estatura para una persona, la edad de la misma no influir en su
nmero de calzado (por tanto, tal como se hace ms adelante, habr que trazar un enlace
entre T y N). Finalmente, fijado el sexo, la estatura determina el nmero de calzado de una

SEXO EDAD
INGRESOS ESTATURA
COCHE
N CALZADO
E
T
N
S
C
I
SEXO EDAD
INGRESOS ESTATURA
COCHE
N CALZADO
E
T
N
S
C
I

persona y, por otra parte, sus ingresos influyen sobre el tipo de coche que posee. La red
final, por tanto, sera :














Figura 06

Obsrvese, por ejemplo, que no se ha trazado ningn enlace desde Ingresos hasta N
calzado, ya que estas dos variables son condicionalmente independientes entre si. Por otra
parte, se podra haber supuesto que la estatura influye en el nivel de ingresos de una
persona, pues una estatura adecuada contribuye a una mejor presencia fsica, requisito
necesario para determinados puestos de trabajo (aqu, sin embargo, se ha considerado que
un puesto donde se requiera buena presencia fsica no es sinnimo de puesto bien
remunerado y por eso no se ha trazado un enlace de T a I). Tampoco se ha tenido en
cuenta que la estatura ni el nmero de calzado influyan en el tipo de coche de una persona
y, por tanto, no se han trazado los enlaces de T a C y de N a C. Las probabilidades que
habra que aadir al grafo anterior para completar la red bayesiana son :
P ( s )
P ( e | s )
P ( i | s, e)
P ( t | s, e)
P ( c | i, s, e )
P ( n | s, t )




SEXO EDAD
INGRESOS ESTATURA
COCHE
N CALZADO
E
T
N
S
C
I



Notas sobre Redes Bayesianas

1.- Las redes Bayesianas constituyen una de las herramientas ms poderosas en el diseo
de sistemas expertos probabilsticos. Desde un punto de vista grfico una red Bayesiana
es un Grafo Dirigido Acclico, donde los nodos representan las variables del problema
que queremos resolver. Estas estructuras nos permiten representar el conocimiento
desde dos puntos de vista :

Cualitativo : Expresa las relaciones de dependencia e independencia entre las
variables. De forma grfica se representa mediante la presencia de conexiones o
caminos entre variables. As, si tenemos dos variables X e Y conectadas por un arco
X Y podemos deducir que X es Y son variables que estn relacionadas (por
ejemplo, X puede ser una causa de Y). Cuando dicho arco no existe, entonces
podemos decir que existe una relacin de independencia (bien marginal o bien
condicional) entre X e Y.

Cuantitativo : Expresa la fuerza con la que nos creemos las relaciones de relevancia o
dependencia. Nos permite representar la incertidumbre que tenemos sobre la
ocurrencia de los sucesos (supuesto que conocemos un conjunto determinado de
hechos). Este tipo de conocimiento se proporcionar mediante un conjunto de
distribuciones de probabilidad condicionadas.










2.- Pasamos a ver de una forma ms detallada la red Bayesiana como un formalismo que
permite representar la base de conocimiento de un sistema experto probabilstico.

Construccin de Sistemas Expertos Probabilsticos
La base de conocimiento de un sistema experto probabilstico esta formada por un
conjunto de variables y una distribucin de probabilidad conjunta sobre ellas. Tenemos
dos alternativas para especificar la base de conocimiento: la primera en la cual hacemos
uso de una tabla de la distribucin conjunta (esta aproximacin resulta inabordable incluso
para problemas con un nmero de variables pequeo) o bien hacer uso de modelos ms
sofisticados que (utilizando relaciones de independencia entre variables) factorizen la
distribucin en funciones de tamao menor.

En este caso, los pasos que tenemos que seguir a la hora de disear el sistema experto son:

1. Planteamiento del Problema : Tener una buena definicin del problema es un paso
crucial a la hora de obtener un buen sistema experto, ya que de ello dependern en
gran medida la calidad de los resultados que obtengamos.

Consideremos el siguiente ejemplo:

Ejemplo 05.
En una consulta mdica estamos interesados en la construccin de un sistema experto
que, ante un conjunto de sntomas que presenta un determinado paciente, nos ayude a
determinar
(a) Cul es la enfermedad ms probable?
(b) Qu tratamiento tenemos que suministrar?.



En concreto imaginemos la siguiente situacin hipottica:
Tenemos dos posibles enfermedades, amigdalitis y la otra ms extrema, como el
padecer de un cncer en el cerebro.

Si consideramos los sntomas que pueden aparecer encontramos:
- Cuando un paciente tiene amigdaltis los sntomas que aparecen son dolor de
cabeza y fiebre.
- Si el paciente tiene cncer en el cerebro, no aparecen los sntomas hasta que
no se ha producido una metstasis de las clulas cancerosas. En este caso, los
sntomas son dolor de cabeza y mareos.

Por otro lado, si consideramos los tratamientos de las enfermedades tenemos que
- Si un paciente tiene amigdalitis, entonces se propone un tratamiento en base a
penicilina (TA) con un costo bajo. Sin embargo, si este tratamiento es
proporcionado a un paciente alrgico a la penicilina podemos provocarle
fuertes reacciones. En este caso, se prefiere aplicar un segundo tratamiento,
(TB), ms costoso, pero que no le es perjudicial.
- Por otro lado, si un paciente padece de cncer, tenemos que el tratamiento
TA carece de eficacia, siendo el tratamiento TB el ms aconsejable.

2. Seleccin de Variables: El siguiente paso consiste en seleccionar el conjunto de
variables que son relevantes para tener una buena definicin del problema (esta tarea
debe ser realizada por los expertos en el problema a analizar).

Ejemplo 06. En el ejemplo anterior, las variables de inters sern :
Alerga a la Penicilina A con valores }) , ({ a a ; Cancer C con los casos } , { c c ;
amiGdalitis G } , { g g ; Metstasis M }) , ({ m m ; ; Fiebre F }) , ({ f f ; Dolor de Cabeza
D }) , ({ d d ; Mareo Mr }) , ({ mr mr ; Tratamiento A T A }) , ({ ta ta y Tratamiento B T
B }) , ({ tb tb .

De forma genrica, para una variable X el caso X = x expresa la idea de que se hace
cierta la relacin y x X expresa que la relacin es falsa, por ejemplo C = c expresa
la idea de que el paciente tiene cncer y c C indica que no tiene cncer.

3. Adquisicin de la informacin cualitativa : Si disponemos de un experto le
pediremos que muestre las relaciones de relevancia entre las variables que definen el
problema. En este proceso es importante que el experto tambin determine las
relaciones de independencia entre variables. Es de gran utilidad en esta etapa el
apoyarse en modelos grficos ya que permiten de forma explcita mostrar las
relaciones de relevancia entre las variables.
Cuando no disponemos de un experto para disear la estructura de dependencias,
podemos utilizar tcnicas que, partiendo de una base de ejemplos, permiten construir
de forma automtica la red.

Ejemplo 07. Para nuestro problema, el experto nos puede dar la siguiente red:















4. Adquisicin de la informacin cuantitativa : Este ltimo paso consiste en asignarle
valores a las distribuciones de probabilidad conjunta que tenemos que almacenar en
cada nodo en la red. En los ltimos dos pasos es muy conveniente que el experto
pueda colaborar con especialistas en Estadstica ya que el uso de mtodos especficos
puede ayudar a mejorar la calidad de los datos y validar el modelo construido.



Alergia
Penicilina
Amigdalitis
Cncer
Tratamiento
B
Tratamiento
A
Fiebre
Dolor
Cabeza
Metastasis
Mareos

Ejemplo 08.

Para nuestro problema, supongamos que tenemos las siguientes distribuciones de
probabilidad condicionadas.

C P(C)
c 0.05
c_ 0.95














TB P(TB/C,G,A)
C c c_
G g g_ g g_
A a a_ a a_ a a_ a a_
tb 0.99 0.95 0.98 0.95 0.9 0.01 0.01 0.01
tb_ 0.01 0.05 0.02 0.05 0.1 0.99 0.99 0.99

Para este ejemplo, si quisiramos presentar la tabla completa de la distribucin
conjunta necesitaremos de 512 valores, mucho mayor que los 25 que realmente
hemos tenido que proporcionar.
G P(G)
g 0.35
g_ 0.65
A P(A)
a 0.25
a_ 0.75
M P(M/C)
C c c_
m 0.7 0.01
M_ 0.3 0.99
F P(F/G)
G g g_
f 0.95 0.15
f_ 0.05 0.85
Mr P(Mr/M)
M m m_
mr 0.9 0.09
mr_ 0.1 0.91
TA P(TA/G,A)
G g g_
A a a_ a a_
ta 0.01 0.99 0.01 0.2
ta_ 0.99 0.01 0.99 0.8
D P(D/G,M)
G g g_
M m m_ m m_
d 0.99 0.7 0.85 0.15
d_ 0.01 0.3 0.15 0.85

Das könnte Ihnen auch gefallen