Sie sind auf Seite 1von 11

CAPITULO 4

4. SISTEMAS EXPERTOS DE TIPO PROBABILISTICO


4.1. BASE DE CONOCIMIENTO

El centro de este tipo de sistemas lo constituye el espacio probabilstico, que forma lo que se ha llamado conocimiento abstracto o de aplicacin general. Para facilitar el entendimiento de esta parte se utiliza la nomenclatura que se usa en el caso de diagnstico mdico, es decir, que habr referencia a enfermedades y sntomas, si bien debe quedar bien entendido que su alidez es mucho ms general y a bastante mas all del simple caso mdico.

4.1.1.

SNTOMAS BINARIOS

El problema que se plantear

es el de diagnosticar, en una poblacin, un

con!unto de enfermedades suponiendo que los datos son sntomas binarios de un con!unto dado. "on ob!eto de ser mas concreto, supngase que se tiene una poblacin de personas, representada en la siguiente figura #$.%& por los puntos interiores al rectngulo que limita su contorno. 'upngase tambin que cada uno de los indi iduos de esa poblacin tienen una y sol una de las enfermedades que se muestran, y ninguno, uno o arios de los sntomas (, ), " y * que aparecen en la misma figura. Elegido un indi iduo, que endr representado por un punto del rectngulo, resulta muy fcil decir la enfermedad y los sntomas que tiene, ya que basta obser ar a que con!unto de enfermedades o sntomas pertenece. (s el indi iduo Pedro de la figura tiene gripe con los sntomas ( y ). 'i fuera posible conocer la frecuencia #n+mero de indi iduos& de todos los con!untos #huecos& en que queda di idida la poblacin #rectngulo& por las interacciones de los con!untos que definen las enfermedades y los sntomas, se tendra la m,ima informacin posible para definir las enfermedades en funcin de los sntomas y se estara en unas condiciones ptimas para hacer el diagnstico. *icho de otra manera si para cada enfermedad y cualquier con!unto de sntomas se conociera cuantos indi iduos hay en la poblacin con esa enfermedad y esos sntomas, se tendra el me!or conocimiento posible de las enfermedades en funcin de esos sntomas. Pues bien, la

base de conocimientos de un 'istema E,perto basado en la posibilidad consistira, simple y llanamente, en el con!unto de estas frecuencias. 'in embargo, esos, que es la situacin ideal, solo es posible cuando se trata pocos sntomas. En el caso de %-- enfermedades y .-- sntomas #caso no muy complicado&, el n+mero de huecos resultante y, por tanto, el n+mero de frecuencias a almacenar #parmetros&, es %-/. que es tan grande que ning+n ordenador de los actuales sera capaz de almacenar. ( este modelo que es el ms general posible, es decir, el que tiene total libertad en sus parmetros, se llama modelo de dependencia general.

NEUMONIA A
GRIPE

INFARTO DE MIOCARDIO

3 PEDRO
TUBERCULOSIS

ARTROSIS

ULCERA DUODENAL

C
ADENOCARCIONA GASTRICO

Fig. 4.1 0na de las simplificaciones ms corrientes consiste en suponer que los sntomas son independientes, lo cual equi ale a suponer una reduccin muy notable del n+mero de parmetros. (s, en el caso del e!emplo anterior quedara reducido a .-1-%, que ya es almacenable por cualquier ordenador. ( este le llamaremos modelo de independencia general. 'i adems se selecciona para cada enfermedad en con!unto reducido de sntomas #solo sus sntomas rele antes&, este n+mero se reduce a+n ms pudiendo llegar a alores del orden de /-- o 2--, que ya es muy mane!able. *e esta manera se llega al modelo de independencia con sntomas rele antes, en cuya base de conocimiento se almacenar las frecuencias de cada sntoma rele ante aislado y para determinar la frecuencia de un con!unto cualquiera de sntomas se utilizara la frmula del producto #independencia&.

"omo alternati a a la hiptesis de independencia, puede utilizarse el modelo de sntomas rele antes al caso general, que consiste en admitir, para cada enfermedad, las dependencias solo dentro del con!unto de sus sntomas rele antes y suponer la independencia entre los sntomas no rele antes y de estos con los rele antes. Ello da lugar al modelo de dependencia con sntomas rele antes y reduce mucho el n+mero de parmetros conser ando la generalidad en los sntomas ms importantes para cada enfermedad. 4asta ahora se ha tratado con sntomas binarios, es decir, con sntomas con solo dos opciones #fiebre o no fiebre, tos o no tos, etc.&. 'in embargo, en muchos casos la solucin de dos opciones no es satisfactoria y hay que acudir a los sntomas con arias opciones o ni eles #fiebre alta, media, ba!a o nula&.

4.2.

MOTOR DE INFERENCIA

El motor de inferencia probabilstico por e,celencia es el que se basa en las probabilidades condicionadas y consistentes en actualizar las probabilidades de que el paciente en estudio tenga las diferentes enfermedades que padece o se an incorporando nue os datos, con los anlisis clnicos, por e!emplo.

4.2.1. PROBABILIDADES INICIALES

"uando un paciente acude a la consulta, tendr unas probabilidades iniciales de poseer cada una de las n enfermedades posibles E%, E., .... En , dadas simplemente por5 #Ec $.%& P#E%& 6 |E% | 7 8 9 i 6 %,.,...,n

*onde 8 y |E% | representan el n+mero total de pacientes que han asistido anteriormente a la consulta y l n+mero de ellos que tena la enfermedad i:sima, respecti amente. *os aspectos importantes son de destacar en esta ecuacin #Ec %& a& ;as probabilidades P#E%& son las que corresponden a un paciente que asiste a la consulta antes de conocer sobre l informe alguna, ni probabilidad inicial se basa en la historia anterior sin atender a ninguna caracterstica de los pacientes y significa que de 8 indi iduos, |E% | tiene la enfermedad i:sima.

b& "uando el paciente en cuestin haya sido diagnosticado, tanto el alor de 8 como el de |E!|, donde ! es la enfermedad que posea, se incrementa en una unidad, produciendo una modificacin en las probabilidades iniciales para el pr,imo paciente, ya que se dispone en ese aprendiza!e. 8tese que momento de la informacin adicional suministrar por el paciente anterior. En ste sentido, puede hablarse de el archi o de historias clnicas de un doctor principiante es muy pobre o est aco y que la base de datos que posee se a enriqueciendo #cree 8 y |E%|&.

4.2.2.

PROBABILIDADES CONDICIONADAS

<an pronto como el paciente aparece a nuestra ista, nue os datos5 se,o, edad apro,imada, aspecto, etc. son ya conocidos, producindose una modificacin en las probabilidades de las diferentes enfermedades. Por ello es necesario actualizar las probabilidades iniciales anteriores con los nue os datos. Es aqu donde las probabilidades condicionadas !uegan un papel muy importante. (hora nos interesa saber cual es la probabilidad de que el paciente en cuestin tenga las enfermedades E %, E., .... En , sabiendo que, por e!emplo, es arn, tiene una edad media, etc. #Ec $..& P#E% 7 '% '. ... '= & 6 |E% '% '. ... '= | 7 |'% '. ... '= | donde P#E% '% '. ... '=& es la probabilidad de que tenga la enfermedad i:sima supuesto que tiene los sntomas '%, '., .., '= , |E% '% '. ... '= | es el n+mero de pacientes en nuestro archi o que posee la enfermedad i:simma > los sntomas '%, '., ....'=, es decir, la frecuencia de aparicin de la citada enfermedad con esos sntomas #en nuestro caso =6., '%6? arn? y '.6?edad media?& y @ '% '. .....'=@ es el n+mero de pacientes que poseen los sntomas '%, '., .... '= o tambin la frecuencia de aparicin de esos sntomas. ;a e,presin #Ec $..& puede escribirse tambin #Ec $.1& P#E%7'% '..... '=&6 @E%'%..'=@78 6 @'%'....'=@78

P#E%'%'.'=& P#'%'....'=& 6P#E%&

P#'%'...'=7E%& P#'%'.........'=&

*onde ahora en el cociente aparecen probabilidades en ez de frecuencias. En teora los alores ptimos deberan ser % para una #o arias& de las enfermedades #la E%, por e!emplo& y cero para el resto, indicando ello que la decisin5 diagnosticar la enfermedad !:sima no contradice nunca la e,periencia anterior. 'in embargo ste caso se da pocas eces en la prctica y alores inferiores a la unidad pueden ser mas que satisfactorios. ;a probabilidad de la enfermedad E% condicionada por el sntoma (% que se designa por P#E.7(%& se define como el cociente P#E% (%&7P#(%& de la probabilidad de la enfermedad E% y el sntoma (% y de la probabilidad del sntoma (%. ;as probabilidades condicionales anteriores descritas no son mas que una e,plicacin del <eorema de )ayes5 P#(%7E%&P#E%& #Ec $.$& P#(%7E%&P#E%& *onde P#E%& es la prioridad a priori #antes de conocer los sntomas& de lo que un paciente elegido al azar tenga la enfermedad E%, P#E%7(%& es la probabilidad a posteriori #despus del conocimiento del sntoma (%& de que el paciente tenga la enfermedad E%, P#(%7E%& son las erosimilitudes , es decir, las probabilidades de que un paciente elegido al azar entre los que tienen la enfermedad. ;a importancia del <eorema de )ayes est, precisamente, en que permite determinar las probabilidades aposteriori en funcin de las posibilidades a priori y de las erosimilitudes. E!emplo5 : supngase que un mdico por datos pre ios que le suministra un paciente, tiene sospecha de que padece adenocarcinoma gstrico #a.g& y que en funcin de esos datos estima que tiene una probabilidad -.2 de padecer adenocarcinoma gstrico #esto significa que el *olor 2- A de personas con esos datos pre ios tienen a.g&y una .%C Prdida de Peso E probabilidad de -.1 de no padecer. Ber la representacin de este e!emplo en la CD %1 $ siguiente figura .D#$..&. Esta es la ley de probabilidad a priori por suponerse conocida 2/ D .%C 1. antes de realizar la e,perimentacin. . D D
%% Bomitos .%C %% CD

P#e%7(%&6

Adenocarc ono!a "#$%r co

1.
$C %%1

2/

mitos %% $C %%1

F ". 4.2 %%

"omo el mdico considera que una probabilidad de -.2 no es suficiente para que el paciente padezca de adenocarcinoma gstrico, decide interrogarle y hacerle una e,ploracin para me!orar su conocimiento sobre la enfermedad. : E,perimentan prdida de peso el C- A de los pacientes con adenocarcinoma gstrico y el $- A de los pacientes sin adenocarconoma gstrico. : E,perimentan dolor el 2- A de los pacientes con adenocarcinoma gstrico y el %- A de los pacientes sin adenocarcinoma gstrico. : tienen mito el D- A de los pacientes con adenocarcinoma gstrico y el 1- A de los pacientes sin adenocarcinoma gstrico. El mdico por tanto, decide determinar sucesi amente5 a& 'i el paciente tiene mito. b& 'i el paciente e,perimenta prdida de peso. c& 'i el paciente tiene dolor. (hora bien a medida que a conociendo nue os datos sobre el enfermo, la ley de probabilidad a cambiando, dando lugar a las llamadas leyes de probabilidad aposteriori, cuyo nombre hace referencia a que dichas leyes son posteriores al conocimiento de la informacin. 'iguiendo con el e!emplo el mdico a conociendo sucesi amente los siguientes datos5 % . 1 $ *atos iniciales El enfermo no tiene mito El enfermo e,perimenta prdida de peso El enfermo tiene dolor

En este caso las probabilidades de que el enfermo tenga adenocarcinoma gstrico en cada etapa pueden calcularse fcilmente mediante la frmula #Ec $.$&. P%#a.g&6 P#a.g7no mitos&6 P#no mitos7a.g&P#a.g& P#no mitos7a.g&P#a.g& F P#no mitos7no a.g& P#no a.g&

6 -.D , -.2 6 -.D , -.2 F -.2 , -.1 Para encontrar P%#no a.g& manera5 P%#no a.g& 6 P#no a.g7no mitos& 6 %: P#a.g7no mitos& 6 -.12D *e la misma manera como encontramos P% deducimos PG y P1. Hbteniendo los siguientes resultados5 P.#a.g& 6 -.2ECD P1#a.g& 6 -.C/1$ *onde P%, P. y P1 se refieren a las probabilidades condicionadas a uno, dos o los tres sntomas indicados respecti amente. Hbsr ese que en cada etapa #cada nue o sntoma& se utilizan como probabilidades a priori, las que resultan #las aposteriori& de la etapa anterior. (l final de la etapa $, el paciente tiene una probabilidad de -.C/1 de padecer adenocarcinoma gstrico y, puesto que el mdico solo se equi ocara al hacer esa afirmacin en $ enfermos cada %--. 6 -.1D -.D/ 6 -./.D

que amos a necesitar en P.#a.g& hallamos de la siguiente

4.&.

MODELOS DE DEPENDENCIA

4.&.1.

MODELO DE DEPENDENCIA GENERAL

Puesto que el ob!eti o del motor de inferencia es determinar las probabilidades P#E%7'%'....'=&, la e,presin #Ec 1& pone de manifiesto que un modelo general debera tener como parmetros las frecuencias @E% '%'....'=@ y @'%'....'=@. ( este modelo con el n+mero m,imo de parmetros se lo llama modelo de dependencia general.

4.&.2.

MODELO DE DEPENDENCIA CON SINTOMAS RELE'ANTES

0na reduccin importante del n+mero de parmetros presentes, en el modelo consiste en fi!ar para cada enfermedad E% su con!unto de sntomas rele antes I% 6 J'%%, '.%, K,'%%L y suponer que el resto de sntomas son independientes entre si y con los rele antes. Esto supone que el clculo de frecuencias se hace mediante la frmula5 #Ec. $.D& ( E1 S1 S2 ... SE()(E1 *( S+, ( II (P+ .E/1S+ .E/1S+

*onde I% es el con!unto de sntomas rele antes para la enfermedad iMsima y P! es la probabilidad del sntoma ! #no rele ante&. 8tese que esta e,presin supone la independencia estadstica de los sntomas no rele antes para cada enfermedad. ( este modelo se llama Nodelo de *ependencia con sntomas rele antes. 4.4. MODELOS DE INDEPENDENCIA

;os modelos ms comunes son los modelos de independencia, as llamados por basarse en la hiptesis de independencia estadstica de los sntomas. *e entre stos, el ms utilizado es el Omodelo general de independenciaG, que se pasa a describir a continuacin. Por la hiptesis de independencia, la e,presin #Ec $.1& puede describirse. *Ec 4.-, P#E%& 6 P#'%'....'=& (E (
NII0 (S+(

P#E%7'%'....'=& 6

P#'%7E%& P#'.7E%&... P#'=7E%& @Ei'.@ (E S1( (E S0( (E ( (E ( (E (

P6% N *e esta forma queda ilustrado claramente como el conocimiento de cada sntoma a modificando las probabilidades de cada enfermedad, que inicialmente son P#E%& y luego son proporcionales a llos factores P#'%7E%& para !6%,.,..,=. 8tese que la influencia de cada sntoma nue o se traduce en un nue o factor y en la modificacin del factor de proporcionalidad P#'%'....'m&.

( pesar de todo, elm n+mero de parmetros es toda a muy ele ado #para n6C- y m6%$1 resulta %1%-$&. Esta es la razn por la que el mtodo general no ha sido muy utilizado en la prctica. 0na posible salioda a este problema es suponer que las probabilidades P#'%7E%& para ciertos con!untos de sntomas son nulas o, ms concretamente se fi!an para cada enfermedad E% los smbolos '%%, '.%,...,'l% #unos pocos en compararcin con el total& rele antes a esa enfermedad y se supone que las probabilidades P#'%7E%&, son nulas si '% no uno de los sntomas, rele antes.

4.1.

OTROS MODELOS BASADOS EN LA PROBABILIDAD

0na forma de disminuir a+n ms el n+mero de parmetros de los modelos anteriores es considerar enfermedades dis!untas, es decir, suponer que no hay enfermos con arias enfermedades simultneamente. Esto tiene el incon eniente practico de que con cierta frecuencia se dan pacientes con mas de una enfermedad y de sta forma el 'istema E,perto o detecta slo una de ellas o da probabilidades le!anas a la unidad. 'in embargo, ello conduce a una reduccin de parmetros que puede tener su importancia. ( parte de los modelos escritos en los temas anteriores hay otros muchos que tambin se basan en la probabilidad. Entre ellos se destacan los basados en los modelos logartmicos lineales, mar=o ianos, etc. en la regresin, el anlisis discriminante, los modelos

4.-.

APLICACION2

Q4P;ENE8<("QH8 *E; NH<HR *E Q8SERE8"Q( P(R( E; NH*E;H *E *EPE8*E8"Q( TE8ER(;.

4.3.

CONCLUSION

El

centro de los sistemas e,pertos de tipo probabilstico lo constituye

especialmente la estructura del espacio probabilstico #)ase de "onocimiento& y el motor de inferencia, que se basa en las probabilidades condicionales. En ste captulo se present los diferentes modelos con los que se puede traba!ar9 cada uno de ellos presenta sus enta!as y des enta!asU. Pero el m(s utilizado entre ellos es el NH*E;H *E Q8*EPE8*E8"Q(9 independencia estadstica de los sntomas. "abe seValar que la hiptesis de independencia es poco realista en muchos casos ya que hay grupos de sntomas que aparecen para determinadas enfermedades y el modelo de independencia conduce a probabilidades errneas. Por ste moti o es mWs con eniente utilizar un modelo de dependencia. #En el captulo quinto se demostrar las probabilidades errneas a que se llega por las restricciones tomadas&. as llamado por basarse en la hiptesis de

Das könnte Ihnen auch gefallen