Sie sind auf Seite 1von 8

Agentes Conversacionales como un Sistema de Diálogo

María Lucila Morales-Rodríguez1, Jesús Raymundo Domínguez-Martínez.1


1
Dpto. de Posgrado e Investigación, Instituto Tecnológico de Cd. Madero,
Av. 1o. de Mayo esq. Sor Juana Inés de la Cruz s/n Col. Los Mangos, Cd. Madero, Tamaulipas
{lmoralesrdz, jrdm02}@gmail.com

Resumen

En este documento se presentan los diferentes tipos de agentes conversacionales como lo


son: los Agentes Conversacionales Animados, Humanos Virtuales Creíbles, Asistentes Virtuales,
así como sus características, áreas de aplicación, y roles. Existen diversas empresas que se
dedican a crear dichos agentes, los cuales deben contar con una base de conocimientos en un
tema en específico. Para lograr que un agente conteste coherentemente se puede llevar a cabo un
análisis de la comunicación, el cual es importante en la interacción cara-a-cara, con el fin de
analizar la conversación y el discurso; los que tienen como base los actos del habla, para este
caso en particular: los actos locutivos. Esto con el objetivo de llegar a crear un Sistema de
Diálogo que tenga el rol de un Asistente Virtual.

Palabras clave: agentes conversacionales, asistentes, virtuales, sistema de diálogo

1. Agentes Conversacionales

Un agente conversacional es una entidad viviente artificial diseñada para tener


conversaciones con seres humanos reales. Estas conversaciones se pueden expresar vía texto, de
forma oral o incluso una conversación no verbal. Los agentes conversacionales también son
conocidos como chatbots [1], pueden encontrarse en pantallas, mundos virtuales, pero también
en el mundo real, a través de proyecciones (por ejemplo con proyección holográfica) o
físicamente hablando y respondiendo como marionetas, juguetes y robots [2].

Los agentes inteligentes tienen las características: Autonomía, Proactividad, Sociabilidad:


esto quiere decir que un agente debe de tener: Comunicación, Cooperación, Negociación. Sin
embargo, cuando los agentes presentan personalidad y emociones se considera un agente
conversacional [3][4].

1.1 Agentes Conversacionales Animados

Existen diferentes tipos de Agentes Conversacionales, uno de ellos son los ECA’s
(Embodied Conversational Agents por sus siglas en inglés), en español son conocidos como
Agentes Conversacionales Corpóreos o Agentes Conversacionales Animados. Estos son
interfaces gráficas con la capacidad de utilizar modos de comunicación verbal y no verbal para
interactuar con usuarios en ambientes virtuales.
Aunque algunas veces los agentes son sólo un rostro parlante animado, o pueden
desplegar expresiones faciales simples, o pueden utilizar síntesis de voz con algún tipo de
sincronización labial, y algunas veces tienen sofisticadas representaciones gráficas en 3D con
movimientos corporales y expresiones faciales complejos. Esto con el fin de reconocer y
responder a las entradas verbales y no verbales por parte del usuario, generar salidas verbales y
no verbales, realizar funciones conversacionales y dar señales que indiquen el estado de la
conversación así como contribuir con nuevas proposiciones [5].

1.2 Humanos Virtuales Creíbles

El construir ECA’s es una tarea multidisciplinaria, ya que reúne problemas tradicionales


de la Inteligencia Artificial con las Ciencias Sociales. Estos deben actuar y reaccionar en sus
ambientes simulados, basándose en las disciplinas de razonamiento automático y planeación. Lo
cual para mantener una conversación, se debe hacer uso de las diferentes investigaciones
realizadas sobre Lenguaje Natural, Reconocimiento de Voz, y Comprensión del Lenguaje para la
Generación de Síntesis del Habla, así como un cuerpo humano con movimientos reales, tal como
los haría uno mismo, solamente por mencionar algunas características de estos son las siguientes:
utilizan síntesis de voz con algún tipo de sincronización labial, son representaciones gráficas en
3D con movimientos corporales y expresiones faciales complejas [6].
Un Asistente Virtual es una herramienta informática, con la apariencia de un personaje
virtual, puede ser capaz de brindar atención en un sitio web. Este es puede ser un ejemplo
representativo de los humanos virtuales creíbles. Por lo tanto, puede ser una herramienta
fundamental para reducir los costes de atención, mientras que se incrementa la calidad de esta
atención.
Los Asistentes Virtuales, permiten responder de forma automática, las necesidades de
información de sus usuarios. De este modo podrá tanto aportar en todo momento, la información
que estos precisan, como también encauzar la conversación de la forma más provechosa para su
organización o institución. Los asistentes virtuales creíbles son una mezcla de agentes
autónomos y personajes por computadora basados en las artes, como lo son la animación,
películas o literatura. Son una extensión, tanto en la investigación de agentes autónomos en la
ciencia de la computación y la idea de los asistentes virtuales creíbles de las historias
tradicionales. Los asistentes virtuales creíbles son una versión de los agentes autónomos [7].

1.3 Aplicaciones

Ahora en día, los agentes conversacionales son de mucha utilidad, tal que se pueden
encontrar en diversas áreas, realizando funciones como: Wizards; en aplicaciones de escritorio,
Asistentes Virtuales; en sitios web de comercio electrónico y negocios, Tutores; en Educación
por lo general en Escuelas, entre otras.

Las áreas de aplicación de los asistentes virtuales pueden ser: Industrial, Comercial, en la
Educación, en la Medicina, etc. De las cuales, se pueden destacar dos áreas de aplicación, la
Industrial y la Comercial.
Finanzas, banca Seguridad, AA, PP, Sanidad Telecomunicacio
y seguros industria y y Turismo nes
- Portales Web logística - Kioscos - Aplicaciones de
financieros con - Sistemas de SV autoservicio guía servicios
asistencia AVI (Speaker en aeropuertos, telefónicos 3G.
como guía Verification) o de estaciones, etc. - Campañas
- Cajeros huella de voz. – Paneles publicitarias
automáticos. Funciones de informativos MMS en móvil.
Ayuda a personas autentificación/ centros médicos, Servicio
con problemas de identificación. aeropuertos. contestador.
accesibilidad. - Portales Web - Doctor virtual. - Información
- Banca UMTS. de logística del Portal Web de TDT.
estado de las atención sanitaria,
Consulta de
entregas cita previa.
saldos y cuentas
.Preguntas
mediante asistente
técnicas.
virtual en móvil.

Ocio, utilidades y enseñanza


- Paneles informativos en comercios, - Videojuegos de fidelización. Acercan a
usuarios. No e-Generation a
Recomendador de productos. Empresa.
- Portales Web de e-learning Profesor virtual.

Figura1. Usos de los Asistentes Virtuales


En la figura 1 se puede apreciar a que áreas se aplican los asistentes virtuales con más
facilidad. Así de este modo los Asistentes Virtuales pueden tener diferente rol en las diversas
áreas de aplicación como por ejemplo:
• Asistentes Virtuales Sociales: Su propósito es conversar libremente acerca de algo con
cualquier usuario, así como lo haría con un amigo. Son usados en línea para
entretenimiento.
• Asistentes Virtuales Educacionales: Su propósito es ayudar a aprender acerca de algo,
como un nuevo lenguaje, historia, geografía, etc. Son usados en las escuelas.
• Asistentes Virtuales Orientados a Servicios: Estos generalmente son utilizados por
empresas que ofrecen servicios en línea. Su propósito es ayudar a los clientes a encontrar
el camino en el sitio web, así como contestar preguntas acerca de sus productos y
servicios [8].
A continuación se mencionarán ejemplos de algunas empresas que se dedican al
desarrollo de asistentes virtuales, son: Asistentes Virtuales México, ATOS ORIGIN, Response,
Artificial Solutions Iberia, The Reuse Company, INBENTA, Intuit MyProSeries, CAJA
MADRID y Next IT. A continuación se presentan algunos de los asistentes virtuales realizados
Next IT [9].
Estos tienen diferente función por ejemplo Alex y Jenn se dedican a brindar información
sobre vuelos de diferentes Aerolineas, SGT STAR es un tutor que fue puesto en marcha en el
ejercito de EU, y SPIKE brinda información sobre la universidad de Gonzaga en la que fue
puesto en línea para sus estudiantes y maestros (véase figura 2).
ALEX JENN SGT STAR SPIKE CAMILA
Figura2. Ejemplos de Asistentes Virtuales

2. Las Interacciones en el Procesos de la Comunicación

La conversación cara-a-cara involucra la expresión de comportamientos no-verbal y de


lenguaje. Los comportamientos durante la conversación no solo funcionan en paralelo, sino
interdependiente.
Una conversación cara-a-cara, es una actividad en la que la sincronización entre los
participantes parece ocurrir de manera natural. Esto se ve facilitado por el número de canales o
modalidades que tenemos a nuestra disposición para transmitir información. Estos canales
incluyen las palabras, la entonación de la voz, gestos, expresión facial, la postura, la
orientación y la mirada. La conversación cara-a-cara es muy importante, ya que se puede lograr
una mejor comunicación a través de los diferentes canales ya mencionados anteriormente. Con
esto se puede lograr un análisis de la comunicación, la cual se enfoca en el análisis
conversacional y el análisis del discurso; el análisis conversacional tiene como base la
Etnometodología, la cual tiene como objetivo identificar las normas y principios que sustentan el
funcionamiento de las conversaciones y los diferentes tipos de intercambios que se producen en
la interacción comunicativa, el análisis del discurso tiene por fundamento la teoría de los actos
del habla [6] [10].

2.1 Análisis de la Conversación

El análisis de la conversación se interesa por analizar la acción humana, entendida como un


sistema que permite que las personas actúen en múltiples ocasiones de la vida cotidiana de forma
regular, utilizando “métodos” que les permiten dar sentido a las estructuras sociales. Se
considera que el habla es un vehículo para la acción social y también uno de los principales
medios con que se construye y se mantiene mutuamente la organización social en la interacción
entre las personas [11]. Según [11], hay cuatro dimensiones que abarcan los elementos no
lingüísticos presentados en una conversación:

• La localización
Marco socioespacial (escena psicosocial)
Deixis (de persona, de tiempo, de lugar, textual y social).

• El comportamiento no verbal
Oral (vocalizaciones, Kinesia, proxemia)
Escrito (soporte, formato, tipografía, lo icónico).
• La lengua como contexto
o marcas de cohesión (relaciones. fónicas, conexión...)
o géneros discursivos
o (proto), tipos textual/es
o variedad/es lingüística/s
o intertextualidad.

• El contexto extrasituacional
o aclara la estructura de las presuposiciones (conocimiento previo).
o tanto lo lingüístico como lo no lingüístico se articulan para crear el contexto
o puede cambiar a lo largo de una conversación.

El análisis de la conversación nos permite darnos cuenta de cómo las formas, tanto lingüísticas
como no lingüísticas en la interacción social crean y dan sentido a nuestras actividades cotidianas. Su
objetivo es entender cómo se construyen, se negocian y reproducen determinados papeles sociales.

2.2 Análisis del Discurso y Actos del Habla

Tanto el discurso hablado como el discurso escrito (texto), se consideran hoy en día como
una forma de interacción contextualmente situada. Si se quiere entender en su totalidad los
mensajes que nos transmiten, es necesario hacer un análisis de lo que nos dicen, es decir, tomar
cada parte de esos mensajes y saber cuál es su significado, conocer que se obtiene de la unión de
todo lo que una persona habló o escribió de cualquier tema; de esa manera tendremos la certeza
de conocer el trasfondo de lo que se está diciendo.
La teoría de actos del habla es iniciada por John L. Austin en 1962 y desarrollada
posteriormente por John R. Searle en 1969. Por actos del habla se refieren a los momentos en los
que los enunciados se producen en el acto comunicativo, dentro de un contexto dado, es decir,
los tipos de enunciados que existen, identificándose 3 tipos de Actos: locutivos, ilocutivos y
perlocutivos.
El acto locutivo es el que se realiza al decir aquello que se dice, el acto ilocutivo es la
intención o finalidad que se tiene al decir algo, el acto perlocutivo es el efecto que se produce en
el oyente por haber dicho algo.
Ejemplos:
(1) ¿Saldrá Juan de la habitación?
(2) Juan saldrá de la habitación.
(3) ¡Juan, sal de la habitación!
(4) Ojala Juan saliese de la habitación.
(5) Si Juan saliese de la habitación, yo también saldría.
Cada una de estas oraciones en una ocasión dada constituiría realizaciones de diferentes
actos ilocucionarios. La primera sería, una pregunta, la segunda una aserción sobre el futuro, la
tercera una petición o una orden, la cuarta la expresión de un deseo, y la quinta una expresión
hipotética de intención. Con todo en la realización de cada uno de ellos el hablante realizará
algunos actos subsidiarios que son comunes a los cinco actos ilocucionarios. Al emitir cada uno
de estos el que habla se refiere a una persona en específico, Juan, y predica el acto de salir de la
habitación de esa persona. Por lo tanto, en cada uno de esos casos, aunque los actos
ilocucionarios sean diferentes, al menos uno de los actos no-ilocucionarios de referencia y
predicación son los mismos [12]. La teoría de los actos del habla permite caracterizar las
locuciones que serán expresadas por un agente conversacional como parte de un sistema de
diálogo.
3. Los Sistemas de Diálogo

Los sistemas de diálogo o sistemas conversacionales (SLS, Spoken Language Systems)


son una tecnología concebida para facilitar la interacción natural entre una persona y un
ordenador mediante el habla. Estos también son conocidos como sistemas conversacionales, y se
han convertido hoy en día en una herramienta esencial para el desarrollo de servicios de atención
al cliente, banca telefónica o de venta de productos.

La tendencia actual de esta tecnología esté orientada a desarrollar sistemas para dominios
de aplicación restringidos, los cuales permiten utilizar información acerca de las posibles
palabras, tipos de frases e intenciones de los usuarios. Los sistemas de diálogo desarrollados han
sido aplicados principalmente a tareas como las siguientes: información y reserva de viajes,
información meteorológica, control de terminales telefónicos, compra de productos, ayuda a la
comunicación entre personas que hablan distintos idiomas, acceso al correo electrónico, etc.
Según [13], las características que deben tener los Sistemas de Diálogo para que sean
"amigables" y efectivos para los usuarios son las siguientes: 1) tener reconocimiento del habla,
2) extraer información semántica de las frases, 3) gestionar el diálogo, 4) generar respuestas y 5)
contar con síntesis de voz.

3.1 Gestión del diálogo


El éxito de un sistema de diálogo depende mucho del cuidado que se tenga con el diseño de la
interacción. Normalmente un gestor de diálogo cumple cuatro funciones principales:

• Actualizar el contexto del diálogo


• Proveer el contexto en el que basarán las interpretaciones.
• Coordinar el resto de los módulos.
• Decidir qué información dar al usuario y cuando hacerlo.

Un gestor de diálogo puede consultar distintas fuentes de información, tales como;


resultados del procesamiento del lenguaje natural, resultados de consultas a bases de datos,
conocimiento acerca del dominio de aplicación, conocimiento acerca de los usuarios y la historia
del diálogo. Existen diferentes lenguajes de programación, los cuales sirven para generar
lenguaje natural como expresiones verbales, un ejemplo es AIML.

3.2 Aiml
Es un lenguaje que sirve para crear diferentes frases de diálogo escrito, y así mantener un
diálogo de texto coherente con el usuario en lenguaje natural, para esto debe existir un módulo
de gestión del diálogo que haga uso del lenguaje AIML (Artificial Intelligence Markup
Language, Lenguaje, por sus siglas en ingles) el cual es un lenguaje compatible con XML que es
fácil de aprender, y permite crear una base de conocimientos.
Los objetos AIML están formados por unidades llamadas categorías y temas. La unidad
básica de conocimiento en AIML son las categorías indicadas con la etiqueta <category>. Cada
categoría se compone de una pregunta de entrada, una respuesta de salida y un contexto
opcional. La pregunta o estimulo se llama patrón y se señala con la etiqueta <pattern>, el
patrón debe de estar en mayúsculas y debe coincidir con lo que un usuario pueda dar como
entrada. La respuesta se llama plantilla y está especificada por la etiqueta <template> [14].
Existen diferentes lenguajes de programación que permiten crear bases de conocimientos.
Estas pueden ser creadas con lenguajes de reconocimiento de patrones tales como: Elizabeth,
QED editor, SNOBOL, SASL, NPL, KRC, AIML, entre otros. Por otro lado existen también los
lenguajes como: Prolog, Clips, LISP, OPS5, los cuales, que hacen uso de la lógica de predicados
y permiten crear la base de conocimientos por medio de reglas.

3.3 La Base de Conocimientos de un Agente Conversacional

Las bases de conocimiento surgen a partir de la investigación en IA como respuesta a las


necesidades que las aplicaciones de esta disciplina planteaban. Estas son la evolución lógica de
los sistemas de bases de datos tradicionales, que plasman elementos de conocimiento
(normalmente en forma de hechos y reglas) así como la manera en que estos elementos han de
ser utilizados. Las bases de conocimientos deben manejar diferentes niveles de conocimiento, y
tener una estructura organizada por contextos, puede ser definida para un tema en particular o se
puede hacer general.

4. Conclusión

En este artículo se presentó la concepción de agentes conversacionales y sus diferentes


tipos, así como también las áreas de aplicación y sus roles. Sin embargo, no importa qué tipo de
agente conversacional sea, éste siempre hará uso de las tecnologías del habla, como lo son: el
reconocimiento del habla, la generación de lenguaje natural y Text-to-Speech o texto a voz.

Para lograr que un agente conteste de manera coherente, se debe realizar un análisis de la
comunicación, con el fin de analizar la conversación y el discurso, para así tratar de reproducir la
interacción cara-a-cara y tenga más credibilidad.

Si se mantiene el vínculo de lo anterior con los actos del habla de Searle, esto ayudará a que un
agente conversacional se exprese más claramente y simule comportamientos naturales para que
un usuario comprenda mejor lo que se le contestó, con esto se comprueba que se emplearon
correctamente estas tecnologías.

Por último, un agente conversacional puede incorporar estas tecnologías del habla, para tener la
capacidad de conversar con un usuario, y entonces se puede considerar un sistema de diálogo, el
cual puede tener el rol de asistente virtual.
5. Referencias

[1] Lun, E. Van. (2010a). Conversational Agent - a program that acts on behalf of humans and
chats. Recuperado Abril 8, 2011, a partir de http://www.chatbots.org/conversational_agent/
[2] Lun, E. Van. (2010b). Chatbots.org 2.6: Forum and even smarter account pages | News.
Recuperado Abril 8, 2011, b a partir de
http://www.chatbots.org/community/buzz_stop/welcome_to_chatbot.org_2.0/
[3] Monroy, G. López. (2008). Interfaz grafica para la edicion de cuentos interactivos para
ninos. Recuperado Abril 6, 2011, a partir de
http://catarina.udlap.mx/u_dl_a/tales/documentos/lis/lopez_m_g/index.html
[4] Kopp, S. (2009). Social Resonance and Embodied Coordination inFace-to-Face
Conversation with Artificial Interlocutors. Speech Communication, 12 pp.
[5] Cassell, J., Bickmore, T., Campbell, L., Vilhjálmsson,, H., & Yan, H. (2000). Conversation
as a System Framework: Designing EmbodiedConversational Agents.
[6] Gratch,, J., Rickel, J., André, E., Badler, N., Cassell, J., & Petajan, E. (2002). Creating
interactive Virtual Humans some assembly requided. IEEE Inteligent Systems, pp 10.
[7] dTinf, S.L. (2008). Asistente Virtual Semántico (pág. pp 15).
[8] Jenkins, M.-C. (2010). Using construction grammar in conversational systems. Recuperado
Abril 5, 2011, a partir de http://www.slideshare.net/mcjenkins/using-construction-grammar-
in-conversational-systems
[9] Next IT Corporation. (2010). Next IT - Providing Intelligent Customer Experience
Solutions. Recuperado Abril 14, 2011, a partir de http://www.nextit.com/
[10] Morales-Rodríguez, M. L. (2007). Modèle d’interaction sociale pour des agents
conversationnels animés Application à la rééducation de patients cérébro-lésés.
L’UNIVERSITÉ TOULOUSE III: PAUL SABATIER.
[11] Duranti, A., & Goodwin, C. (1992). Rethinking context: language as an interactive
phenomenon. Cambridge University Press.
[12] Searle, J. R. (1977). Qué es un acto de habla? Revista Teorema.
[13] Ayuso, A. J. R., & Rioja, I. H. (2005). Libro blanco de tecnologías del habla. Universidad
de Granada.
[14] Bush, N. (2001). AIML 1.0.1 (A.L.I.C.E. AI Foundation). Recuperado Abril 8, 2011, a
partir de http://www.alicebot.org/TR/2001/WD-aiml/#section-introduction

Das könnte Ihnen auch gefallen