Beruflich Dokumente
Kultur Dokumente
Resumen
1. Agentes Conversacionales
Existen diferentes tipos de Agentes Conversacionales, uno de ellos son los ECA’s
(Embodied Conversational Agents por sus siglas en inglés), en español son conocidos como
Agentes Conversacionales Corpóreos o Agentes Conversacionales Animados. Estos son
interfaces gráficas con la capacidad de utilizar modos de comunicación verbal y no verbal para
interactuar con usuarios en ambientes virtuales.
Aunque algunas veces los agentes son sólo un rostro parlante animado, o pueden
desplegar expresiones faciales simples, o pueden utilizar síntesis de voz con algún tipo de
sincronización labial, y algunas veces tienen sofisticadas representaciones gráficas en 3D con
movimientos corporales y expresiones faciales complejos. Esto con el fin de reconocer y
responder a las entradas verbales y no verbales por parte del usuario, generar salidas verbales y
no verbales, realizar funciones conversacionales y dar señales que indiquen el estado de la
conversación así como contribuir con nuevas proposiciones [5].
1.3 Aplicaciones
Ahora en día, los agentes conversacionales son de mucha utilidad, tal que se pueden
encontrar en diversas áreas, realizando funciones como: Wizards; en aplicaciones de escritorio,
Asistentes Virtuales; en sitios web de comercio electrónico y negocios, Tutores; en Educación
por lo general en Escuelas, entre otras.
Las áreas de aplicación de los asistentes virtuales pueden ser: Industrial, Comercial, en la
Educación, en la Medicina, etc. De las cuales, se pueden destacar dos áreas de aplicación, la
Industrial y la Comercial.
Finanzas, banca Seguridad, AA, PP, Sanidad Telecomunicacio
y seguros industria y y Turismo nes
- Portales Web logística - Kioscos - Aplicaciones de
financieros con - Sistemas de SV autoservicio guía servicios
asistencia AVI (Speaker en aeropuertos, telefónicos 3G.
como guía Verification) o de estaciones, etc. - Campañas
- Cajeros huella de voz. – Paneles publicitarias
automáticos. Funciones de informativos MMS en móvil.
Ayuda a personas autentificación/ centros médicos, Servicio
con problemas de identificación. aeropuertos. contestador.
accesibilidad. - Portales Web - Doctor virtual. - Información
- Banca UMTS. de logística del Portal Web de TDT.
estado de las atención sanitaria,
Consulta de
entregas cita previa.
saldos y cuentas
.Preguntas
mediante asistente
técnicas.
virtual en móvil.
• La localización
Marco socioespacial (escena psicosocial)
Deixis (de persona, de tiempo, de lugar, textual y social).
• El comportamiento no verbal
Oral (vocalizaciones, Kinesia, proxemia)
Escrito (soporte, formato, tipografía, lo icónico).
• La lengua como contexto
o marcas de cohesión (relaciones. fónicas, conexión...)
o géneros discursivos
o (proto), tipos textual/es
o variedad/es lingüística/s
o intertextualidad.
• El contexto extrasituacional
o aclara la estructura de las presuposiciones (conocimiento previo).
o tanto lo lingüístico como lo no lingüístico se articulan para crear el contexto
o puede cambiar a lo largo de una conversación.
El análisis de la conversación nos permite darnos cuenta de cómo las formas, tanto lingüísticas
como no lingüísticas en la interacción social crean y dan sentido a nuestras actividades cotidianas. Su
objetivo es entender cómo se construyen, se negocian y reproducen determinados papeles sociales.
Tanto el discurso hablado como el discurso escrito (texto), se consideran hoy en día como
una forma de interacción contextualmente situada. Si se quiere entender en su totalidad los
mensajes que nos transmiten, es necesario hacer un análisis de lo que nos dicen, es decir, tomar
cada parte de esos mensajes y saber cuál es su significado, conocer que se obtiene de la unión de
todo lo que una persona habló o escribió de cualquier tema; de esa manera tendremos la certeza
de conocer el trasfondo de lo que se está diciendo.
La teoría de actos del habla es iniciada por John L. Austin en 1962 y desarrollada
posteriormente por John R. Searle en 1969. Por actos del habla se refieren a los momentos en los
que los enunciados se producen en el acto comunicativo, dentro de un contexto dado, es decir,
los tipos de enunciados que existen, identificándose 3 tipos de Actos: locutivos, ilocutivos y
perlocutivos.
El acto locutivo es el que se realiza al decir aquello que se dice, el acto ilocutivo es la
intención o finalidad que se tiene al decir algo, el acto perlocutivo es el efecto que se produce en
el oyente por haber dicho algo.
Ejemplos:
(1) ¿Saldrá Juan de la habitación?
(2) Juan saldrá de la habitación.
(3) ¡Juan, sal de la habitación!
(4) Ojala Juan saliese de la habitación.
(5) Si Juan saliese de la habitación, yo también saldría.
Cada una de estas oraciones en una ocasión dada constituiría realizaciones de diferentes
actos ilocucionarios. La primera sería, una pregunta, la segunda una aserción sobre el futuro, la
tercera una petición o una orden, la cuarta la expresión de un deseo, y la quinta una expresión
hipotética de intención. Con todo en la realización de cada uno de ellos el hablante realizará
algunos actos subsidiarios que son comunes a los cinco actos ilocucionarios. Al emitir cada uno
de estos el que habla se refiere a una persona en específico, Juan, y predica el acto de salir de la
habitación de esa persona. Por lo tanto, en cada uno de esos casos, aunque los actos
ilocucionarios sean diferentes, al menos uno de los actos no-ilocucionarios de referencia y
predicación son los mismos [12]. La teoría de los actos del habla permite caracterizar las
locuciones que serán expresadas por un agente conversacional como parte de un sistema de
diálogo.
3. Los Sistemas de Diálogo
La tendencia actual de esta tecnología esté orientada a desarrollar sistemas para dominios
de aplicación restringidos, los cuales permiten utilizar información acerca de las posibles
palabras, tipos de frases e intenciones de los usuarios. Los sistemas de diálogo desarrollados han
sido aplicados principalmente a tareas como las siguientes: información y reserva de viajes,
información meteorológica, control de terminales telefónicos, compra de productos, ayuda a la
comunicación entre personas que hablan distintos idiomas, acceso al correo electrónico, etc.
Según [13], las características que deben tener los Sistemas de Diálogo para que sean
"amigables" y efectivos para los usuarios son las siguientes: 1) tener reconocimiento del habla,
2) extraer información semántica de las frases, 3) gestionar el diálogo, 4) generar respuestas y 5)
contar con síntesis de voz.
3.2 Aiml
Es un lenguaje que sirve para crear diferentes frases de diálogo escrito, y así mantener un
diálogo de texto coherente con el usuario en lenguaje natural, para esto debe existir un módulo
de gestión del diálogo que haga uso del lenguaje AIML (Artificial Intelligence Markup
Language, Lenguaje, por sus siglas en ingles) el cual es un lenguaje compatible con XML que es
fácil de aprender, y permite crear una base de conocimientos.
Los objetos AIML están formados por unidades llamadas categorías y temas. La unidad
básica de conocimiento en AIML son las categorías indicadas con la etiqueta <category>. Cada
categoría se compone de una pregunta de entrada, una respuesta de salida y un contexto
opcional. La pregunta o estimulo se llama patrón y se señala con la etiqueta <pattern>, el
patrón debe de estar en mayúsculas y debe coincidir con lo que un usuario pueda dar como
entrada. La respuesta se llama plantilla y está especificada por la etiqueta <template> [14].
Existen diferentes lenguajes de programación que permiten crear bases de conocimientos.
Estas pueden ser creadas con lenguajes de reconocimiento de patrones tales como: Elizabeth,
QED editor, SNOBOL, SASL, NPL, KRC, AIML, entre otros. Por otro lado existen también los
lenguajes como: Prolog, Clips, LISP, OPS5, los cuales, que hacen uso de la lógica de predicados
y permiten crear la base de conocimientos por medio de reglas.
4. Conclusión
Para lograr que un agente conteste de manera coherente, se debe realizar un análisis de la
comunicación, con el fin de analizar la conversación y el discurso, para así tratar de reproducir la
interacción cara-a-cara y tenga más credibilidad.
Si se mantiene el vínculo de lo anterior con los actos del habla de Searle, esto ayudará a que un
agente conversacional se exprese más claramente y simule comportamientos naturales para que
un usuario comprenda mejor lo que se le contestó, con esto se comprueba que se emplearon
correctamente estas tecnologías.
Por último, un agente conversacional puede incorporar estas tecnologías del habla, para tener la
capacidad de conversar con un usuario, y entonces se puede considerar un sistema de diálogo, el
cual puede tener el rol de asistente virtual.
5. Referencias
[1] Lun, E. Van. (2010a). Conversational Agent - a program that acts on behalf of humans and
chats. Recuperado Abril 8, 2011, a partir de http://www.chatbots.org/conversational_agent/
[2] Lun, E. Van. (2010b). Chatbots.org 2.6: Forum and even smarter account pages | News.
Recuperado Abril 8, 2011, b a partir de
http://www.chatbots.org/community/buzz_stop/welcome_to_chatbot.org_2.0/
[3] Monroy, G. López. (2008). Interfaz grafica para la edicion de cuentos interactivos para
ninos. Recuperado Abril 6, 2011, a partir de
http://catarina.udlap.mx/u_dl_a/tales/documentos/lis/lopez_m_g/index.html
[4] Kopp, S. (2009). Social Resonance and Embodied Coordination inFace-to-Face
Conversation with Artificial Interlocutors. Speech Communication, 12 pp.
[5] Cassell, J., Bickmore, T., Campbell, L., Vilhjálmsson,, H., & Yan, H. (2000). Conversation
as a System Framework: Designing EmbodiedConversational Agents.
[6] Gratch,, J., Rickel, J., André, E., Badler, N., Cassell, J., & Petajan, E. (2002). Creating
interactive Virtual Humans some assembly requided. IEEE Inteligent Systems, pp 10.
[7] dTinf, S.L. (2008). Asistente Virtual Semántico (pág. pp 15).
[8] Jenkins, M.-C. (2010). Using construction grammar in conversational systems. Recuperado
Abril 5, 2011, a partir de http://www.slideshare.net/mcjenkins/using-construction-grammar-
in-conversational-systems
[9] Next IT Corporation. (2010). Next IT - Providing Intelligent Customer Experience
Solutions. Recuperado Abril 14, 2011, a partir de http://www.nextit.com/
[10] Morales-Rodríguez, M. L. (2007). Modèle d’interaction sociale pour des agents
conversationnels animés Application à la rééducation de patients cérébro-lésés.
L’UNIVERSITÉ TOULOUSE III: PAUL SABATIER.
[11] Duranti, A., & Goodwin, C. (1992). Rethinking context: language as an interactive
phenomenon. Cambridge University Press.
[12] Searle, J. R. (1977). Qué es un acto de habla? Revista Teorema.
[13] Ayuso, A. J. R., & Rioja, I. H. (2005). Libro blanco de tecnologías del habla. Universidad
de Granada.
[14] Bush, N. (2001). AIML 1.0.1 (A.L.I.C.E. AI Foundation). Recuperado Abril 8, 2011, a
partir de http://www.alicebot.org/TR/2001/WD-aiml/#section-introduction