Beruflich Dokumente
Kultur Dokumente
Prlogo
Basado en el trabajo de [Aamodt & Plaza], [Kolodner], [Mitra & Basak], [Watson]
[Sankar & Simon], entre otros, este trabajo pretende ser una sntesis del apasionante
tema del Razonamiento Basado en casos, permitiendo al lector tener una visin general
del mismo a la par que cierta profundizacin en aspectos clave. Adems, se proporciona
un ejemplo propio, empleando la herramienta ReMind.
Con las pocas nociones vistas hasta ahora ya podramos aventurarnos a dar una primera
definicin para el Razonamiento Basado en Casos: Resolver un problema nuevo
recordando una situacin similar previa y reutilizando su informacin y conocimiento.
Si bien el paradigma, como tcnica de inteligencia artificial, es novedoso, el
Razonamiento Basado en Casos es bien conocido entre los psiclogos muchos aos
-1-
atrs. Pensemos en un mdico que examinando un nuevo paciente recuerda un caso
parecido unas semanas atrs; encuentra una similitud importante de los sntomas y
decide asumir que posee la misma enfermad y le trata de la misma manera, pues el
tratamiento result efectivo en la ocasin anterior.
De la misma manera, a un broker de la bolsa le recomiendan una aparente buena
inversin pero ciertos sntomas del mercado le recuerdan que hace un ao con una
situacin parecida perdi mucho dinero y decide no invertir en esta ocasin.
-2-
Estas premisas sugieren que la calidad de un razonador basado en casos depende de:
La mayora de las herramientas CBR disponible dan un soporte aceptable para las tareas
de clasificacin, que suelen estar relacionadas con la recuperacin de casos. Existe una
gran variedad de tareas de clasificacin, como por ejemplo:
Las tareas de sntesis intentan crear una nueva solucin combinando partes de
soluciones previas. stas son inherentemente complejas a causa de las restricciones de
los elementos usados durante la sntesis.
Los Sistemas CBR que realizan tareas de sntesis deben realizar adaptacin y son
normalmente sistemas hbridos que combinan CBR con otras tcnicas. Algunas de las
tareas que realizan estos sistemas son:
Por norma general, los sistemas que implementan tareas de sntesis son ms difciles de
construir que los que implementan tareas de clasificacin.
-3-
1.2.1 Tareas de clasificacin
Qu tipo de casa es esta? (de lujo, chalet, adosado, cabaa, apartamento, etc.)
Qu tipo de tratamiento debe darse al paciente? (observacin, esteroides,
antibiticos, etc.)
Hay petrleo bajo esta tierra? (es posible, es imposible, muy probablemente, no
es probable)
Cunto tiempo llevar acabar este proyecto? (3 meses, 6 meses, 1 ao, etc.)
Si bien alguna clasificacin no tiene valores discretos, s es posible dar un cierto rango.
Por ejemplo, una casa de lujo no tiene porqu ser la que vale exactamente 1 milln de
Euros, pero s las que pueden valer entre 1 y 3 millones de Euros.
Como vemos, las tareas de clasificacin son fciles de implementar porque se ajustan al
ciclo CBR, los casos tienden a ser ms fciles de representar y recuperar, y los
algoritmos de recuperacin utilizados en la mayora de las herramientas CBR son
clasificadores.
Estas tareas son comunes en el comercio pero difciles de implementar. Esto se debe a
que es ms fcil ajustar un artefacto a un conjunto de artefactos prototpicos que
construir un artefacto a partir de una especificacin.
-4-
Para los diseadores, esto es ms rpido que empezar un diseo desde una hoja en
blanco. Se asume que modificar un buen diseo o plan inicial es ms fcil que crear uno
desde el principio.
En muchas circunstancias esto es cierto, sin embargo hay muchas situaciones en que se
debe empezar desde cero sin tener referencia de ningn ejemplo pasado. Por ejemplo,
muchos cohetes espaciales se disean desde cero para no cometer los mismos errores.
Las razones por las que los sistemas de sntesis son difciles de construir son:
Los modelos de memoria empleados en cada uno de estos sistemas son explicados en
detalle en la seccin 3.1.
CHEF
CHEF es un planificador basado en casos que toma como entrada una conjuncin de
submetas que necesita lograr para conseguir un plan como salida. Su dominio es la
creacin de recetas. Las recetas son vistas como planes. Las recetas proporcionan la
secuencia de pasos a seguir para preparar un plato. Por tanto la entrada de CHEF son las
metas que se pueden conseguir con las recetas (por ejemplo, incluye pescado, sofrer,
sabor salado) y la salida es una receta (plan), que puede obtener esas metas.
Como planificador basado en casos, CHEF crea sus planes a partir de viejos planes que
funcionaron en situaciones similares y los modifica para adaptarlos a la nueva situacin.
Por tanto el primer paso en la creacin de un plan es recuperar una vieja receta que
cumpla el mayor nmero posible de metas de la entrada. Para recordar esta clasificacin
indexa los planes por las metas que logra. Ternera con brcoli es indexado por varias
metas, entre ellas, incluye carne, incluye una verdura fresca, sofrer y lograr sabor
salado.
El siguiente paso es adaptar el viejo plan a la nueva situacin. Esto se hace en dos
etapas. Primero, se reinstancia el viejo plan, es decir, crea una instancia en la que
-5-
sustituye los nuevos objetos por los del viejo plan. Por ejemplo, si est creando una
receta de pollo con guisantes desde la receta de ternera con brcoli, sustituye ternera por
pollo y brcoli por guisantes. Para poder hacer esto, necesita conocer los roles que
desempean los objetos en la vieja receta. CHEF tiene un conocimiento bastante
limitado sobre esto y para saber qu objetos sustituir y por cules busca las similitudes
entre los objetos del viejo plan y los del nuevo y sustituye los objetos del nuevo plan por
los ms similares del viejo plan. Por ejemplo, si el pollo y la ternera estn definidos
como carne, los sustituye.
En la segunda etapa, aplica criticas de objeto para adaptar el viejo plan a la nueva
situacin. Un ejemplo es, el pato no debe tener grasa antes de sofrerlo. Se expresara de
la siguiente manera:
Esta crtica est asociada al objeto pato, y cada vez que se usa el pato en una receta se
dispara la crtica. Si hay un paso de deshuesar el pato en la receta que se est creando, se
aadira detrs un paso indicando que se debera de quitar la grasa al pato.
Los TOPS son importantes porque capturan conocimiento a veces independiente del
dominio de resolucin de problemas. En CHEF, una solucin al problema es dividir la
accin en dos etapas de modo que los objetivos no interfieran entre s (cocinar los
ingredientes en dos etapas). Otra solucin basada en un TOP sera aadir otra accin
que contrarrestara el efecto de la anterior (aadir algo que absorbiera el agua que
reblandece el brcol). Es importante observar que estas estrategias son bastante
-6-
generales y podran constituir sugerencias interesantes para la reparacin de planes en
otros muchos dominios.
CHEF emplea tres tipos de estrategias de reparacin: (1) dividir y reformular los pasos
del plan, (2) alterar el plan para que se ajuste a la solucin esperada o (3) buscar un plan
alternativo.
CASEY
-7-
CASEY diagnostica los pacientes aplicando heursticas de adaptacin y emparejamiento
basado en el modelo independientes del dominio y son tan precisas como el modelo del
dominio en el que se aplican. La diagnosis la realiza en dos pasos: primero busca en la
memoria casos y utiliza reglas de evidencia basadas en el modelo para determinar
cuales de los casos que ajustan parcialmente son suficientemente similares al nuevo
problema para proporcionar una diagnosis precisa. Despus aplica reglas de reparacin
basadas en el modelo (estrategias de adaptacin) para adaptar el diagnstico antiguo a la
nueva situacin.
JULIA
HYPO
-8-
de secretos son ilegales y la tarea del programa es decidir, para cualquier caso, si es o no
legal y crear un argumento que avale la decisin.
Analizar el caso para determinar cuales son sus factores relevantes de entre
todos sus descriptores.
Recuperar casos que compartan estos factores.
Separar los casos anteriores en los que apoyan a la defensa y en los que apoyan a
la acusacin de la nueva situacin.
Seleccionar los casos que comparten el mayor nmero de caractersticas con la
nueva situacin.
HYPO crea los argumentos, llamados argumentos de tres capas. Se elige el caso
que ms ajusta de los de la defensa y el que ms ajusta de la acusacin. Se
buscan diferencias entre estos dos casos y se eligen casos que den soporte a estas
diferencias para crear argumentos y contrargumentos. Este es el principal paso
de este proceso, se analizan diferencias y similitudes entre casos antiguos y
nuevos y entre varios casos antiguos.
El anlisis realizado en el proceso de argumentacin es empleado para justificar
la decisin tomada por HYPO.
Se crean casos hipotticos que nunca han ocurrido y se usan para validar el
anlisis realizado y determinar el alcance del anlisis.
PROTOS
El proceso llevado a cabo por PROTOS es, primeramente, determinar la categora del
nuevo problema buscando, en las categoras de problemas auditivos que conoce, aquella
cuyas caractersticas importantes coinciden con las caractersticas importantes del nuevo
problema. A continuacin, verifica esta hiptesis intentando ajustar su nuevo caso a
ejemplares de la categora de hiptesis para ver si puede encontrar un buen
emparejamiento. Si lo encuentra el proceso acaba. Si no, utiliza los resultados de este
proceso de ajuste para seleccionar una hiptesis mejor. Este proceso se gua por su
conocimiento sobre los tipos de errores de clasificacin ms comunes en este dominio.
Cuando se hace una clasificacin incorrecta debido a la fuerte coincidencia del caso con
los casos de la categora, PROTOS aade enlaces de diferencia (el modelo de memoria
-9-
de PROTOS es categora-ejemplar y es explicado en detalle en la seccin 3.1) desde la
categora incorrecta a la correcta para evitar cometer el mismo error en el futuro.
Un ciclo de vida CBR est formado esencialmente por los cuatro procesos siguientes
(ver figura 2):
Los cuatro procesos no son tareas nicas, es decir, cada uno de ellos implica
llevar a cabo una serie de tareas ms especficas, que sern descritas en el
apartado siguiente.
Si bien se ha dado a entender que en el proceso de reutilizacin se lleva a cabo
toda la problemtica de adaptacin del caso casos recuperados para el nuevo
problema, en muchas aplicaciones prcticas las fases de reutilizacin y revisin
apenas se distinguen, y muchos investigados hablan de fase de adaptacin, que
combina ambas. No obstante, la adaptacin es quiz uno de los frentes ms
abiertos en los sistemas CBR debido a su complejidad.
-10-
PROBLEMA
RECUPERACIN
nuevo
Caso
Caso Caso
Caso
aprendido recuperado
similares
nuevo
Caso
Caso e
ndices
ALMACENAMIENTO Base REUTILIZACIN
de
adaptaciones
Datos
previas
Conocimiento
General del Dominio
resultados previos
Caso propuesta
corregido de
Caso
EVALUACIN resuelto
Adems, la figura nos muestra cmo el conocimiento general juega un papel importante
en el ciclo, dando soporte a los procesos CBR. Dependiendo del tipo de mtodo CBR,
este soporte puede variar, desde una consideracin dbil ( nula) a un soporte muy
fuerte. Se trata, por tanto, de un conocimiento general, frente al conocimiento especfico
encerrado en los casos. Por ejemplo, en el diagnstico mdico por analoga con casos de
pacientes previos, el conocimiento general podra consistir en un modelo de anatoma
junto con relaciones causales entre estados patolgicos, formulados quiz a modo de un
conjunto de reglas.
-11-
2.2. Jerarqua de tareas
La visin orientada a procesos del ciclo de vida CBR nos da una buena idea de la
secuencia de pasos que se siguen, pero para ver realmente el mecanismo que subyace es
necesario tomar una visin orientada a tareas, donde cada paso, o subproceso, se ve
como una tarea que el razonador CBR tiene que conseguir. Las tareas se agrupan por las
metas del sistema, y una tarea particular se realiza aplicando uno varios mtodos.
En la figura 3, las tareas se muestran con los nombres de los nodos en negrita, mientras
que los mtodos estn en cursiva. Los enlaces entre nodos de tarea (lneas continuas)
representan varias descomposiciones de la tarea implicada.
Por ejemplo, la tarea de ms alto nivel que es la resolucin del problema y aprendizaje
de la experiencia se descompone en cuatro tareas, que se corresponden con los cuatro
procesos de la figura 2, recuperacin, reutilizacin, revisin y almacenamiento. Es
necesario llevar a cabo las cuatro tareas para poder alcanzar el objetivo de ms alto
nivel. A su vez, la tarea de recuperacin se descompone en las tareas de identificar,
buscar, emparejar y seleccionar. Y as sucesivamente.
Los mtodos de cada tarea (lneas discontinuas) indican diferentes formas de llevar a
cabo la tarea. Un mtodo especifica un algoritmo que identifica y controla la ejecucin
de la subtarea particular, utilizando el conocimiento e informacin necesarios. Por
ejemplo, para la tarea de ms alto nivel (recordemos que es la resolucin de un
problema y el aprendizaje de la experiencia), el mtodo para llevarla a cabo es el
razonamiento basado en casos.
Sin embargo, la figura no es completa en cuanto a los mtodos, es decir, uno de los
mtodos que se indican puede ser suficiente para resolver la tarea, o puede que se deban
combinar varios de ellos, o en el caso ms extremo se deban utilizar otros mtodos aqu
no indicados.
-12-
-13-
Figura 3. Una descomposicin tarea-mtodo de CBR
2.3. Representacin del conocimiento y mtodos bsicos
Los mtodos bsicos de representacin del conocimiento son (1) las bases de datos,
tanto relacionales como orientadas a objetos, (2) la lgica de predicados y (3) los
sistemas basados en reglas, que explicaremos brevemente en este apartado.
Las bases de datos imponen una estructura a los datos que almacenan. Esta estructura
hace que el significado no est en un nico nivel sino que se encuentre contenido en las
relaciones entre datos. En las BD relacionales los datos se almacenan una nica vez para
que sea consistente, las relaciones entre datos se definen usando tablas relacionales y
claves primarias y forneas. Podemos realizar consultas para obtener informacin y
modificar los datos de una tabla sin tener que alterar otra.
Los sistemas basados en reglas permiten definir reglas IF-THEN con una serie de
ventajas:
A pesar de parecer simple, el proceso se complica porque puede que ms de una regla
pueda ser aplicada en un momento dado, y la aplicacin de una regla hace aplicable
muchas ms. Por tanto estos sistemas necesitan una estructura de control para decidir la
siguiente regla a aplicar y como encadenar reglas.
-14-
funcionan adecuadamente cuando se carece de un modelo explcito de conocimiento.
Estas dos limitaciones impiden construir sistemas de soporte de decisin tiles.
En este punto podramos pensar que entonces las BD son una tecnologa adecuada para
la tarea de recuperacin de soluciones conocidas de problemas: pueden almacenar gran
cantidad de informacin, mantienen relaciones entre elementos, y proporcionan un
rpido acceso a la informacin. Pero hay que tener en cuenta que antes de recuperar una
solucin hay que identificar el problema y esto no es soportado eficientemente por las
BD convencionales. Para encontrar el problema correcto y su solucin conocida
debemos de ajustar el nuevo problema a todos los de la base de datos. Sin embargo la
representacin de los problemas reales es compleja, hay que incluir muchas
caractersticas, y la representacin de la BD puede no ser adecuada. Las BD son
excelentes para ajustes exactos pero muy pobres para ajustes parciales.
3. La biblioteca de casos
Dependiendo de cmo el sistema razone con los casos, esta descripcin puede incluir
nicamente los hechos que llevan a la solucin o informacin sobre pasos adicionales
en el proceso de obtencin de la solucin. Adems la descripcin de la solucin tambin
podr incluir:
-15-
Expectativas acerca del resultado de la solucin.
Tambin es importante incluir una medida del xito si en la base de casos se han
logrado soluciones con diferentes niveles de xito o fracaso.
Los casos pueden representar distintos tipos de conocimiento y pueden ser almacenados
en diferentes formatos. Esto depender del tipo de sistema CBR, por ejemplo los casos
pueden representar personas, objetos, diagnsticos, planes, etc.
-16-
En una representacin orientada al objeto, el caso sera como muestra la siguiente
figura.
Paciente
edad
altura
peso
Visita 1
Sntoma 1
Sntoma 2
Diagnstico
Tratamiento
Visita 2
Visita 3
Una de las ventajas del razonamiento basado en casos es la flexibilidad que ofrece
respecto a la representacin. Se puede elegir la implementacin adecuada dependiendo
del tipo de informacin a representar, variando desde un simple boolean, un nmero,
datos dependientes del tiempo, relaciones entre datos, ficheros, frames, redes
semnticas, etc.
A la hora de elegir una representacin para un caso se deben tener en cuenta los
siguientes factores:
-17-
Independientemente de la representacin que elijamos siempre debemos tener en cuenta
que la informacin que almacene un caso debe ser relevante tanto para el propsito del
sistema como para asegurar que siempre ser elegido el caso ms apropiado para
solucionar un nuevo problema en un determinado contexto.
En muchos sistemas CBR no se necesitan almacenar todos los casos existentes, sino que
se sigue un criterio para decidir que casos almacenar y cuales descartar.
Por ejemplo, si disponemos de dos casos muy similares para una misma situacin slo
almacenaremos uno de ellos, o podramos crear un caso artificial que fuese una
generalizacin de dos o ms casos concretos.
Una vez elegida la representacin de los casos, la eleccin del modelo de memoria es el
siguiente paso. Existen principalmente dos estructuras de memoria, plana y jerrquica.
Este tipo memoria presenta la ventaja de que aadir nuevos casos resulta muy barato
(rpido y fcil de implementar). No ocurre as con la recuperacin de casos, ya que
resulta muy lento cuando el nmero de casos en la base es alto.
Nuestra base de frutas sera de la siguiente manera:
-18-
Por ejemplo, considerando que el sabor es ms importante que el color y la temporada y
que ROJA y NARANJA pueden emparejarse parcialmente, ante el caso de entrada
ROJA, CIDA, INVIERNO, el sistema operara de la siguiente manera:
-19-
El algoritmo de bsqueda del caso que mejor se ajusta al de entrada es tambin sencillo:
Inicializar N = nodo padre
Repetir hasta que N sea un caso:
Encontrar el nodo bajo N ms similar a la entrada.
Devolver N.
Figura 8
Figura 9
Figura 10
-20-
Los tipos de sistema anteriores no resuelven el problema de bsqueda cuando la entrada
est incompleta. En las redes de discriminacin con prioridades cada nodo contiene una
pregunta para la cual los subnodos correspondientes ofrecen respuestas alternativas. Las
preguntas ms importantes se formulan primero, situndose ms arriba en la jerarqua.
-21-
Las redes de discriminacin redundantes resuelven este problema organizando los casos
mediante varias redes de discriminacin, cada una con una ordenacin diferente de las
preguntas. La variedad ms comn de las redes redundantes incluye en su organizacin
las propiedades de las redes de caractersticas compartidas para mantener su tamao
bajo control. Explicaremos ms en detalle este modelo de memoria dinmica por
tratarse del ms comnmente identificado con los sistemas RBC, desarrollado a partir
de la teora general de MOPs (del ingls, Model Organisation Packets: paquetes de
organizacin de memoria) de Schank. En este modelo la memoria de casos es una
estructura jerrquica de episodios generalizados.
La idea bsica es organizar los casos que comparten propiedades similares en una
estructura ms general (el episodio generalizado o MOP).
Un episodio generalizado (GE) contiene tres tipos de objetos: normas, casos e ndices.
Las normas son caractersticas comunes a todos los casos indexados bajo un GE. Los
ndices son las caractersticas que nos diferencian entre los casos de un GE.
Un ndice puede apuntar a un GE ms especfico o directamente a un caso. Un ndice
consta de dos trminos: un nombre y un valor.
-22-
El esquema de indexacin es redundante, puesto que existen mltiples caminos hasta un
caso concreto o un GE. Esto se aprecia en la figura en la indexacin del caso 1.
La mayora de los sistemas que usan este esquema de indexacin ponen algunos lmites
a la hora de seleccionar ndices para casos. En CYRUS, por ejemplo, slo se permite un
pequeo vocabulario de ndices.
CASEY almacena una gran cantidad de informacin en sus casos. Adems para todas
las caractersticas observadas, almacena la explicacin causal para el diagnstico
encontrado, as como una lista de estados en el modelo de ataque al corazn, para los
cuales haba evidencia en el paciente. Estos estados, denominados estados causales
generalizados, son los ndices primarios de los casos.
1
Este criterio de similitud se usa para ilustrar el mtodo pero podra ser otros como priorizar el
emparejamiento de un subconjunto de caractersticas o valorar la similitud de otra manera.
El criterio de valoracin de similitudes se puede emplear para guiar la bsqueda, por ejemplo
identificando qu ndices se siguen primero si se hace una eleccin .
-23-
El principal rol de un episodio generalizado es representar una estructura indexada para
el emparejamiento y recuperacin de casos.
Las propiedades dinmicas de esta organizacin de memoria podran ser vistas como un
intento de construir una memoria que integra conocimiento de episodios especficos con
conocimiento generalizado de los mismos episodios.
Por tanto, esta organizacin del conocimiento es adecuada para el aprendizaje tanto de
conocimiento generalizado como de conocimiento especfico y es un modelo admisible ,
aunque simplificado, del razonamiento y aprendizaje humano.
-24-
Comparar la entrada con cada elemento del conjunto para
identificar los mejores casos
En este modelo los casos se denominan ejemplares. Las bases psicolgicas y filosficas
de este mtodo son la visin de que el mundo real, los conceptos naturales, deberan
ser definidos de forma extensiva. Adems, se asignan diferentes importancias a las
distintas caractersticas al definir la pertenencia de un caso a una categora. Cualquier
intento de generalizar un conjunto de casos debe hacerse cautelosamente.
Esta visin de representar los conceptos es la base de este modelo de memoria.
-25-
Figura 14. Composicin de una categora
Los ndices annimos son recuerdos desde las caractersticas a una categora. Dentro de
la organizacin de la memoria las categoras son entrelazadas en una red semntica la
cual tambin contiene las caractersticas y estados intermedios (subclases de los
conceptos objetivo) pero referenciadas de otra forma.
Esta red representa la base del conocimiento general del dominio, el cual da soporte
explicativo para algunas tareas del CBR. Por ejemplo, un mecanismo clave de
emparejamiento de casos es un mtodo llamado emparejamiento de patrones basado
en conocimiento.
-26-
3.1.3 Memoria plana, bsqueda paralela
En conclusin, se asume que los casos tienen dos componentes: la especificacin del
problema y la solucin. Normalmente, la especificacin del problema suele consistir en
un conjunto de atributos y valores. Los atributos de un caso deben definir el caso de
forma nica y deben ser suficientes para pronosticar una solucin. La representacin
puede ser una estructura de datos plana o una compleja jerarqua de objetos.
La indexacin de casos consiste en asignar ndices a los casos para una futura
recuperacin y comparacin. Los ndices de un caso determinarn en que contexto el
caso ser recuperado, por tanto, los ndices de un caso deben reflejar las caractersticas
importantes del caso y los atributos que influyen en el resultado del caso y describir las
circunstancias en las que se espera que un caso ser recuperado.
-27-
Por ejemplo, si una comida resulta un fracaso porque un invitado vegetariano no poda
comer carne, ser conveniente indexar tal comida por las caractersticas vegetariano y
carne. Del mismo modo, si un diagnstico result especialmente problemtico por la
presencia de un conjunto de sntomas atpicos, tal caso debera indexarse mediante los
citados sntomas.
Los ndices deben ser lo suficientemente abstractos como para permitir recuperar un
caso en todas las circunstancias en las que es til pero no demasiado abstracto. Cuando
los ndices de un caso son demasiado abstractos, el caso puede ser recuperado en
muchas situaciones, o se requiere demasiado procesamiento para el emparejamiento de
casos.
Criterios de indexado:
4. Recuperacin de casos
-28-
estudiaremos con ms detalle las cuatro etapas de la recuperacin as como los
principales criterios de similitud y algunos de los algoritmos ms utilizados.
En el apartado 3.1 explicamos en detalle los distintos modelos de memoria y para cada
modelo vimos un pequeo esquema del algoritmo de recuperacin empleado, en este
apartado veremos ms en profundad las dos principales clases de algoritmos existentes.
Los procesos involucrados en la recuperacin de un caso de una base de casos son muy
dependientes del modelo de memoria y de los procedimientos de indexacin usados.
Los algoritmos de recuperacin utilizados varan desde una bsqueda del vecino ms
cercano hasta el uso de agentes inteligentes.
Una tpica funcin de evaluacin empleada para encontrar el vecino que mejor
empareja es la mostrada a continuacin
w sim( f
i
I
i , f iR )
similarity(CaseI , CaseR ) = i =1
n
w
i =1
i
-29-
feature2
NC - New Case
NC
similarity(NC, case3)
case3
Este enfoque es muy til cuando se requiere un nico caso como solucin y
cuando la caracterstica del caso depende de otras.
En las siguientes figuras mostramos el rbol de decisin generado para los datos
de la tabla. La tarea es predecir el estado de un prstamo a partir de las
caractersticas del solicitante del prstamo (ingresos, estado de su trabajo y la
devolucin).
-30-
Repayment < $400
Yes No
El vecino ms cercano es una tcnica muy simple que proporciona una medida de cmo
de similar es un caso objetivo a un caso de la base. Pero su principal desventaja es la
velocidad de recuperacin ya que para encontrar el caso que mejor ajusta, el caso
objetivo debe compararse con cada caso de la base de casos. Esto quiere decir que una
comparacin de similitud (distancia) debe calcularse para cada caracterstica indexada.
Esto hace que el algoritmo sea ineficiente la a medida que aumenta la base de casos.
Por ejemplo para una base de 100 casos con 10 caractersticas indexadas habra que
realizar 1000 clculos de similitud. Si el tamao de la base aumenta a 10000 casos
tendramos que realizar 100000 clculos de similitud.
-31-
Una solucin parcial es calcular, antes de la recuperacin, una posicin para cada caso
de la base en el espacio n-dimensional y usarlo como ndice. En tiempo de ejecucin se
identifican los casos que no ajustan por estar a una cierta distancia del caso objetivo. De
esta manera se consigue un tiempo de recuperacin aproximadamente constante, a pesar
del tamao de la base. De todas formas hay que tener en cuenta que el clculo de los
ndices es un proceso que consume recursos y habra que recalcularlos cada vez que un
nuevo caso es aadido a la base.
2
Los mtodos sintcticos tambin pueden contener un montn de conocimiento general del dominio,
implcito en sus mtodos de emparejamiento. La distincin entre conocimiento-pobre y conocimiento-
intensivo est relacionada con la representacin explcita del conocimiento del dominio. Es decir, se
refiere al conocimiento generalizado del dominio, ya que los casos tambin contienen conocimiento
explcito, pero ste es conocimiento especfico del dominio.
-32-
Un factor a tener en cuenta cuando elegimos una estrategia de recuperacin es el
propsito de de la tarea de recuperacin. Si el propsito de la recuperacin es adaptar el
caso recuperado para una futura reutilizacin, esto puede llevarse a cabo en el mtodo
de recuperacin. La recuperacin para adaptacin ha sido utilizada en el
razonamiento por analogas y en la resolucin de problemas de diseo.
4.2.2. Etapas
Para entender el problema es necesario filtrar el ruido de los descriptores del problema,
para inferir las caractersticas relevantes, para comprobar si los valores de las
caractersticas tienen sentido dentro del contexto, para generar expectativas de otras
caractersticas, etc.
Se pueden obtener descriptores adicionales a los dados como entrada, usando un modelo
del conocimiento general o recuperando una descripcin del problema similar de la base
de casos y usar las caractersticas de ese caso como caractersticas esperadas.
La comprobacin de expectativas puede ser hecha en el modelo del conocimiento (casos
y conocimiento general) o preguntando al usuario.
Existen tres formas de recuperar un caso o un conjunto de casos: (1) Siguiendo los
ndices directos desde las caractersticas del problema, (2) buscando una estructura de
ndices o (3) buscando un modelo del conocimiento general del dominio.
-33-
PROTOS utiliza las estrategias 1 y 3, los punteros directos son usados para
proporcionar un conjunto de candidatos los cuales son considerados emparejamientos
posibles por el uso de conocimiento general.
Los casos pueden ser nicamente recuperados desde las caractersticas de entrada o
tambin desde las caractersticas inferidas de la entrada.
Los casos que emparejan con todas las caractersticas de entrada son buenos candidatos
dependientes de la estrategia, pero los casos que emparejan con una parte de las
caractersticas del problema (de entrada o inferidas) pueden ser tambin recuperados.
Se necesita un mtodo para valorar el grado de similitud como por ejemplo mtricas de
similitud basadas en las similitudes superficiales del problema y las caractersticas del
caso.
Otra opcin es asignar un peso a los descriptores del problema de acuerdo con su
importancia par la caracterizacin del problema, durante la fase de aprendizaje.
4.2.2.3 Seleccin
-34-
Los mtodos de seleccin de conocimiento-intensivo generan explicaciones que
soportan este proceso de clasificacin y el caso cuya explicacin es lo ms prxima al
nuevo problema es seleccionado.
Otras propiedades de un caso que son consideradas en algunos sistemas CBR son:
A la hora de elegir entre seguir una u otra estrategia para la reutilizacin, se debe tener
en cuenta:
Los mtodos de sustitucin dan valores apropiados para la nueva situacin dependiendo
de los valores de la solucin previa. Se puede sustituir slo un componente de la
solucin, varios de ellos, o todos los componentes de una solucin.
-35-
5.1.1 Reinstanciacin
Con este pequeo ejemplo podemos darnos cuenta que muy posiblemente la mayor
complejidad est en que el sistema pueda llegar a inferir la gran similitud de los casos.
Por ello, un razonador que pretenda poder emplear el mtodo de la reinstanciacin debe
conocer:
Con ello, cuando encuentre que los roles del nuevo caso son iguales pero con valores
distintos al caso recuperado, sustituir los valores en 3 pasos:
En este punto, es de mencionar que si bien es normal que existan diferencias entre
autores en cuanto a nmero o forma de llevar a cabo mtodos, tambin se ha constatado
una diferencia entre autores con respecto a la propia clasificacin de mtodos. Segn
algunos, por ejemplo [Aamodt & Plaza], el mtodo de Reinstanciacin en realidad
debera denominarse de Copia y debe ser distinguido del resto, que s son
considerados de Adaptacin. Otros autores, [Sankar & Simon], s consideran la
reinstanciacin un mtodo de adaptacin pero no lo consideran un mtodo de
sustitucin.
Aqu seguiremos la visin de [Kolodner], que adems de considerarlo de adaptacin, lo
considera tambin de sustitucin.
Este mtodo se emplea para interpolar los valores de una solucin previa a una nueva
solucin. Es decir, dada una solucin previa y un caso nuevo que difiere en algn grado
del caso previo, la solucin previa se modifica para la extensin en que difieren los dos
casos.
-36-
Por ejemplo, en un posible sistema de justicia, un nuevo crimen semejante pero ms
cruel que uno previo ya almacenado, requiere una sentencia ms dura.
Para realizar los cambios en los parmetros de la solucin previa, se debe tener en
cuenta qu grado de diferencia hay con el nuevo caso y en qu consisten estas
diferencias. Esto se lleva a cabo en dos fases:
Se denomina bsqueda Local al proceso de buscar en una jerarqua abstracta (en los
entornos de un concepto), algo relativamente similar que pueda ser sustituido.
Se suele usar cuando una solucin previa es casi correcta para el caso nuevo, y puede
ajustarse con alguna sustitucin menor. As, para recorrer esa jerarqua mencionada,
este mtodo busca primero en los hermanos del elemento previo para ver si alguno sirve
como sustitucin. Si no tiene xito busca en los primos, y as sucesivamente.
La bsqueda local debe restringirse puesto que de otro modo sera ineficiente. Adems
se suele incorporar ciertas guas de movimiento hacia arriba y hacia abajo en la
jerarqua.
Una variante de este mtodo es la Memoria de Consulta, til cuando un simple mtodo
de bsqueda local no es capaz de predecir adecuadamente las relaciones entre
conceptos, lo que conlleva una bsqueda ineficiente e incluso sin garantas de xito.
-37-
Para estos casos, la variante de la memoria de consulta construye una descripcin
parcial de un elemento que sera una buena sustitucin e intenta buscarlo. El mtodo
particular de bsqueda depender de la organizacin de la memoria (si por ejemplo
fuera indexada, se utilizaran los ndices como gua).
Un ejemplo de heurstica sencilla sera, en el caso del sistema de cocina, para encontrar
qu utensilios de cocina se puede haber usado para cocinar un alimento para una cierta
cultura (mediterrnea, oriental, etc.), bsquese en qu recetas puede aparecer el
alimento, de entre estas, se seleccionan las recetas de la cultura deseada y para estas
ltimas qu utensilios se usan.
Los mtodos de sustitucin son apropiados cuando ya existe una base de casos
aproximadamente slida. En otro caso, los mtodos de transformacin son una
alternativa muy viable, pues generan (derivan) una nueva solucin basndose en las
restricciones y caractersticas de la solucin requerida. Un caso tpico en el que se usan
se observa cuando se intenta buscar una sustitucin pero no se consigue ninguna que
satisfaga los requerimientos exactamente. Entonces se utilizar parte o toda la solucin
recuperada ms similar para generar una nueva solucin.
Este mtodo se aplica cuando alguno de los elementos de la solucin previa no cumplen
las restricciones de la nueva situacin (y por supuesto no existe sustitucin posible). La
accin que se lleva a cabo es transformar la solucin usando reglas de sentido comn,
reglas que utilizan el conocimiento acerca de la importancia relativa y funciones de
diferentes componentes.
-38-
Debemos considerar ciertas premisas:
Un ejemplo muy comn se da en ciertos tipos de enfermedades; debido que una elevada
presin sangunea y ciertas arritmias se conoce que son resultado de tener arterias
taponadas, la elevada presin sangunea puede ser reemplazada por arritmia en una
solucin previa en la que se trataba con arritmia como resultado de arterias
taponadas.
La reparacin guiada por modelo es una coleccin de heursticas que acceden a modelos
causales para transformar una solucin previa de tal modo que se ajuste a la nueva
situacin.
-39-
Como en el mtodo de ajuste de parmetros, este mtodo debe evaluar las diferencias
entre la descripcin del problema previo y el nuevo. Se tratara de un proceso es 3
pasos:
Aunque parezca similar, podemos observar dos diferencias importantes entre el mtodo
de ajuste de parmetros y la reparacin guiada por modelo:
Los mtodos presentados hasta este momento son bsicamente de propsito general., e
independientes del dominio. Podemos denominarlos mtodos dbiles de adaptacin. Sin
embargo, la experiencia en inteligencia artificial nos ensea que, all donde estos
mtodos se utilizan, la aplicacin de conocimiento especfico del dominio, suele
producir mejores resultados con menos esfuerzo.
-40-
Un ejemplo podra ser, en el sistema de cocina, asegurar un pre-proceso de algunos
alimentos. Esto es, creamos heursticas que nos digan qu condiciones se deben dar para
cocinar un plato. Podemos decir por ejemplo, que en las recetas en que se cocine pato,
este debe estar antes desplumado adecuadamente, y escribimos la heurstica como:
cuando se cocine pato, desplumarlo antes de cocinarlo. Y antes de comenzara cocinar
una receta que incluya pato, se comprobara que se cumple la heurstica y se lleva a
cabo.
Otra posibilidad es agrupar las heursticas por funcin. Por ejemplo, podemos agrupar
las heursticas que sirvan para ajuste temprano de parmetros, otras para anticipacin a
problemas potenciales, etc.
En los mtodos anteriores, se usa una solucin previa para fijar una solucin al nuevo
problema. Sin embargo, hay ciertas situaciones en las que es ms apropiado re-computar
una nueva solucin o una parte de una solucin usando los mismos medios que se
usaron para computar la solucin previa. Denominamos a este mtodo repeticin
derivacional ( reutilizacin derivacional, segn autores)
Ejemplos tpicos que se dan en la propia vida real son muchas de las lecciones en el
colegio, instituto e incluso universidad. Primeramente el profesor nos ensea la teora y
hace algunos ejercicios. Para comprobar que los alumnos lo han entendido, plantea otra
serie de cuestiones muy parecidas a los ejercicios vistos en clases. Estos, obviamente se
pudieran resolver directamente con la teora, pero lo ms cmodo es tomar un ejercicio
ya realizado y aplicar a la nueva cuestin los mimos pasos que se utilizaron para
resolverlo.
Para poder aplicar este mtodo, los casos almacenados deben mantener informacin a
cerca del mtodo usado para resolver el problema, incluyendo una justificacin de los
operadores usados, submetas consideradas, alternativas generadas, caminos de bsqueda
fallidos, etc. Cuando se recupera un caso, se reinstancia adecuadamente para la nueva
situacin y se repite, para el nuevo contexto, el plan que se llev a cabo.
La experiencia no dice que este mtodo se suele emplear para computar ciertas partes de
la solucin, mientras que para el resto se utiliza alguno de los mtodos anteriormente
descritos. En concreto, ciertos valores intermedios de la solucin se computan de esta
manera (los que se consideren ms indicados para aplicar este mtodo).
Como se ha indicado, puesto que hay casi tantas clasificaciones de mtodos como
autores, se ha seguido la lnea marcada por [Kolodner]. Otro punto de vista interesante y
novedoso, lo aporta [Mitra & Basak], que realiza tres tipos de clasificaciones
dependiendo del requerimiento de conocimiento del dominio para formular reglas de
adaptacin, la capacidad de adaptacin de las reglas y el tipo de requerimiento de
conocimiento del dominio. Quiz lo ms interesante es que introduce algn mtodo que
difiere de los anteriores y que mencionaremos brevemente.
-41-
Adaptacin usando algoritmos genticos: En un algoritmo gentico, la base de
casos forma la poblacin inicial de los genotipos. Primero, el algoritmo recupera
casos con un emparejamiento parcial de la base de casos con la ayuda de ciertos
requerimientos de diseo especificados. A continuacin, los casos recuperados
se mapean en una representacin de genotipo para que se apliquen ciertos
operadores de mutacin. Finalmente, los nuevos genotipos generados se mapean
en los correspondientes fenotipos/casos infiriendo valores para los atributos y
aadiendo el contexto del nuevo diseo.
La coleccin de atributos que se emplean para describir un caso viene a ser la
coleccin de genes que forman un genotipo.
-42-
soporte multi-plataforma para la mayora de sistemas operativos actuales. As como
para plataformas hardware (por ejemplo, se puede desarrollar en una plataforma
aplicaciones para otras).
No obstante, tambin tiene sus inconvenientes, como por ejemplo que los atributos de
los casos en general son pares atributo:valor planos y no se ofrece soporte para indexado
inductivo.
6.2 Case-1
Case-1 es una herramienta CBR desarrollada por Astea Internacional, y toma muchas
ideas de CBR3.
Los casos se representan como texto de forma libre que describe un problema, un
conjunto de cuestiones predispuestas que pueden confirmar o rechazar un caso, y un
conjunto de soluciones. Adems, los casos pueden ser manipulados por cualquier
persona, sin necesidad de experiencia en programacin, y se almacenan en una base de
datos relacional.
Quiz no sea una herramienta tan madura como CBR3, ni mejora sustancialmente su
funcionalidad, pero es una herramienta a seguir, sobre todo porque se puede integran
muy bien con otros productos, como el PowerHelp de Astea.
6.3 CaseAdvisor
-43-
El componente CaseAdvisor Authoring es una herramienta muy sencilla, con un
entorno amigable que nos permitir introducir detalles como el nombre del caso, su
descripcin la solucin. Junto con el componente CaseAdvisor Problem Resolution (el
motor de recuperacin de casos) y el CaseAdvisor WebServer (utilidad para Web)
forman los tres componentes bsicos del sistema.
Los Casos pueden tener aadidos como ficheros de texto o incluso multimedia que se
abre con el navegador (Netscape)
-44-
Precisamente, un inconveniente de este producto reside en que esta caracterstica
hubiese sido ms aprovechable si se acompaase de una representacin grfica de los
rboles de decisin.
Una vez ms, la interfaz del sistema de recuperacin est dividida en tres secciones,
descripcin del problema, cuestiones y solucin. El usuario introduce una descripcin al
problema y CaseAdvisor recupera los casos que ms se ajustan. Se muestran las
preguntas para ayudar al usuario a que escoja un caso particular del conjunto de
recuperados. Posteriormente el usuario deber confirma la diagnosis con un nivel de
puntuacin
-45-
6.4 CasePower
CasePower es una herramienta especfica para construir hojas de estilo Microsoft Excel
que puedan ser analizadas usando CBR. CasePower provee la funcionalidad bsica de
CBR y se enfoca principalmente a aplicaciones numricas.
6.5 CBR3
Desarrollado por Inference Corp., los productos de la familia CBR3 son, para muchos,
los ms exitosos y mayormente trabajados.
CBR3 usa una estructura de registros simple que son almacenados en una base de datos
relacional. Los casos incluyen un ttulo, una descripcin, un conjunto de cuestiones con
un cierto peso, y un conjunto de acciones. Los casos pueden compartirse a travs de la
red de una organizacin.
-46-
Figura 25. Caso CBR3 exportado como informe
CBR3 usa recuperacin del vecino ms prximo, buscando un ajuste entre la consulta
del usuario en texto libre y el ttulo y descripcin de los casos en la base de casos. De
hecho, uno de los puntos fuertes de CBR3 es su habilidad para tratar texto en formato
libre.
-47-
Figura 27. Editor de Casos de CBR Express
Los casos pueden heredar caractersticas de otros casos. Podemos decir un subconjunto
de casos donde todos ellos cumplen ciertas propiedades.
-48-
Si no se halla una solucin satisfactoria, se usa el concepto de caso sin resolver, lo que
significa que se guarda la trascripcin de consulta a ficheros incluso se puede mandar
un mensaje o e-mail al administrador del sistema para que verifique el resultado.
CasePoint tambin permite utilizar reglas que identifiquen palabras claves en el texto de
consulta para discriminar ms la bsqueda y presentar las soluciones ordenando por
utilidad (cmo de til se considera que puede ser la solucin) o por coste (cmo de
costosa se considera que puede ser la solucin).
6.6 ReCall
Esto permite al usuario trabajar muy cmodamente, puesto que puede especificar
conocimiento complejo estructurando mdulos ms sencillos, y dejar ciertas
descripciones o caractersticas incompletas puesto que pueden derivarse del sistema de
herencia. Para una mejor organizacin y para ganar eficiencia en la recuperacin, se
complementa el sistema con un sistema de ndices de herencia mltiple, permitiendo la
comparacin de casos.
-49-
Figura 30. Comparando Casos en ReCall
6.7 ReMind
ReMind es una herramienta que inicialmente fue desarrollada con el soporte del famoso
programa DARPA de Estados Unidos por la empresa Cognitive Systems.
-50-
ReMind ofrece varias posibilidades de recuperacin:
-51-
6.7.1 Ejemplo propio en ReMind: Venta de Mviles
Para probar muchos de los puntos que se han expuesto en los apartados anteriores, as
como para ampliar la informacin disponible sobre ReMind y extrapolarla al resto de
herramientas CBR, se ha creado un ejemplo propio usando ReMind. Se ha
implementado un sistema de Venta de Mviles.
Nuestro sistema est dirigido a un supuesto vendedor de mviles que recibe del cliente
cierta informacin de las caractersticas del mvil que desea. El vendedor introducir en
ReMind las caractersticas ms reseables y aplicar un proceso de recuperacin para
obtener los mviles ms similares al deseo del cliente. Adems, gracias a la adaptacin,
podr crear un nuevo prototipo de mvil que podr almacenar en la base de datos para,
por ejemplo, hacerse una idea del mvil prototpico deseado por sus clientes y realizar
nuevos pedidos.
Cada campo tiene unos atributos comunes y otros que dependen del tipo del campo.
Todos los campos deben tener:
-52-
Adems estn los atributos que dependen del tipo del campo. Por ejemplo en la figura
anterior, al ser de tipo Real, podemos definir la precisin (n de decimales que se
tratan), el mnimo y el mximo de los valores. La media y la desviacin estndar son
valores calculados por ReMind automticamente.
Para poder emplear los distintos mtodos de recuperacin y adaptacin hay que
introducir cierta informacin. La siguiente figura muestra el editor de importancia.
-53-
determinan en buena medida el precio del mvil (esto se indicar en el Q-Model). Para
Outcome, como slo permite uno, se ha optado por el Precio alta, muy de inters para el
cliente.
-54-
Figura 38. Editor de Clusters
La figura anterior nos indica que ciertos campos, Tecnologa, Cmara, BlueTooth, MP3
y Tarjeta Memoria, influyen positiva o negativamente en el Precio alta. En estos
modelos tambin existe la posibilidad de indicar que ciertos campos solo influyen
positiva o negativamente e incluso de aadir nodos virtuales.
-55-
Figura 40. Recuperacin Vecino ms Cercano
El vendedor podr adaptar el caso que desee de entre los recuperados, guardando en x
Adaptation Case una referencia al caso del que se adapt.
-56-
Figura 42. Grfico de camino en recuperacin por induccin
Otra posibilidad es crear un patrn y recuperar los casos que se ajusten a l. Por
ejemplo, creamos el patrn Amplia Memoria que recuperar todos los casos cuyo campo
Memoria sea > de 5 (indicando 5 MB).
7. Ventajas e inconvenientes
El razonamiento basado en casos provee numerosas ventajas:
2. Evita la repeticin de errores del pasado. En los sistemas que guardan tanto los
fallos como los xitos, as como las causas de los fallos, se utiliza la informacin
acerca de qu caus el fallo en el pasado para predecir posibles fallos futuros. El
sistema puede incluso alertar al razonador para que tome las acciones necesarias
para no repetir errores.
-57-
3. Provee gran flexibilidad en el modelado del conocimiento. En contraste con los
sistemas basados en modelos, donde muchos problemas no se resuelven por
considerarlos fuera de su mbito no se entiende el problema a poco que los
datos estn incompletos, los sistemas CBR usan las experiencias pasadas como
dominio de conocimiento y dan una solucin razonable, previa adaptacin, de
este tipo de problemas.
5. Permite hacer predicciones del posible xito de una solucin propuesta. Cuando
la informacin se almacena teniendo en cuenta el nivel de xito de las soluciones
previas, el razonador basado en casos puede ser capaz de predecir el xito de una
solucin propuesta para el problema actual. Obviamente, el razonador tendr en
cuenta no slo esos niveles de xito almacenados sino las diferencias entre el
caso casos recuperados y la situacin actual.
6. Aprende con el tiempo. Esto que parece obvio, por ejemplo en la vida de un ser
humano, no lo es en la mayora de los sistemas de resolucin de problemas. Sin
embargo, como ya se ha citado, a medida que los razonadores basados en casos
son ms usados, encuentran ms situaciones de problemas y crean ms
soluciones. Tras las evaluaciones, determinando un nivel de xito en las
soluciones, los casos se aaden al sistema y el sistema tendr ms variedad de
situaciones y ms grado de refinamiento y xito.
-58-
9. Se puede utilizar para muchos propsitos, como crear planes, diagnosis,
argumentacin de puntos de vista, etc., de formas muy distintas, dependiendo
bsicamente de los mtodos de recuperacin y adaptacin que implementen.
10. Es un reflejo del razonamiento humano, ya que nosotros usamos una forma de
razonamiento basado en casos. Esto es una gran ventaja a la hora de poder
entender el funcionamiento del sistema, as como la justificacin de una
solucin propuesta por un sistema basado en casos.
1. Puede haber una tendencia a usar los casos previos ciegamente, confiando en la
experiencia previa sin validarla en la nueva situacin.
2. Los casos previos pueden predisponer demasiado al razonador a la hora de
resolver un nuevo problema.
3. Las personas, especialmente los principiantes, a menudo no se acuerdan del
conjunto de casos ms apropiados cuando estn razonando.
Ciertos sistemas basados en casos son los sistemas de ayuda o apoyo de toma de
decisiones, que aumentan la memoria humana proveyendo los casos apropiados, al
tiempo que siguen dejando al usuario humano un margen de razonamiento. Podemos
hacer ms seguros estos y otros sistemas evitando los comportamientos negativos
descritos.
Referencias y Bibliografa
[Aamodt & Plaza] A. Aamodt, E. Plaza (1994); Case-Based Reasoning: Foundational Issues,
Methodological Variations, and System Approaches. AI Communications. IOS Press, Vol. 7: 1, pp. 39-
59.
[Sankar & Simon] Sankar K. Pal, Simon C. K. Shiu (2004); FOUNDATIONS OF SOFT CASE-
BASED REASONING. Editorial JOHN WILEY & SONS, INC.
[Watson] Ian Watson1 (1997); Applying Case-Based Reasoning: Techniques for Enterprise Systems.
Esitorial Morgan Kaufmann
[Mitra & Basak] Rudradeb Mitra, Jayanta Basak; Methods of Case Adaptation (2005): A Survey.
INTERNATIONAL JOURNAL OF INTELLIGENT SYSTEMS, VOL. 20, 627645
y simples referencias a:
ReCall: http://www.alice-soft.com/html/prod_recall.htm
Angeles Manjarrs Riesco; Razonamiento Basado en Casos. UNIVERSIDAD NACIONAL DE
EDUCACIN A DISTANCIA (ESPAA)
-59-