JB, Gkujb

4.
ANTECEDENTES
4.1. Realidad aumentada
La realidad aumentada complementa el mundo real con objetos virtuales generados a partir de un
ordenador, Smartphone o consola, los objetos creados parecen coexistir en el mismo espacio del
mundo tangible, esta tecnologa fue reconocida como emergente en 2007 y a partir de ese ao se
ha estado moviendo en diversas partes del mundo, en diferentes industrias y mercados,
adquiriendo un inmensa fuerza [1]. La realidad aumentada (AR) ser la encargada de crear la
Prxima generacin, la interfaz basada en la realidad. [2]
Existen bsicamente tres formas de presentar visualmente la realidad aumentada; el ms cercano

a la realidad virtual, el ver-a-travs, en el cual el entorno virtual se sustituye por un canal de video
al cual se le superponen las imgenes de realidad aumentada. La segunda forma incluye un
enfoque ptico a travs de hojas y la percepcin del mundo real en el cual se muestra la
superposicin de la AR a travs de espejos y lentes transparentes. La ltima forma de presentacin
visual consiste en proyectar la superposicin de AR en objetos que resulten en pantallas. [3]
4.2 Cdigos QR
Cdigo QR o cdigo de respuesta rpida es uno de los ms usados en los campos de identificacin
automtica, cuyas aplicaciones se encuentran orientadas a los usuarios de telfonos mviles [4,6],
las ventajas de hacer uso de estos cdigos son que permiten almacenar una gran cantidad de
datos, y pueden implementarse en espacios reducidos [5], estos contienen patrones aleatorios y
pueden encontrarse en pginas web o al final de algunos anuncios publicitarios. Los usuarios
pueden hacer uso de las cmaras de sus telfonos mviles para capturar el cdigo QR, luego este
les permitir acceder a la informacin correspondiente, la cual en las aplicaciones convencionales
es un enlace de internet. [3] Existen algunas aplicaciones de realidad aumentada las cuales se
basan en estos cdigos ya que estos son los marcadores tradicionales de realidad aumentada. [7]
Los sistemas de realidad aumentada suelen hacer uso de un patrn especial el cual recibe el
nombre de marcador, este permite adquirir una escena 3D e identificar el objeto que se mostrara
en esta escena. En estos sistemas el marcador es usado solo para seguimiento e identificacin ya
que estos no trasmiten informacin provocando que las aplicaciones se vean limitadas. [7]
4.3 Marcadores fiduciales
Los marcadores fiduciales consisten en patrones que se superponen al ambiente [8], estos son
aadidos para facilitar la localizacin del punto de correspondencia entre imgenes [9] y son
detectados automticamente por las cmaras digitales al hacer uso de un algoritmo de deteccin
de acompaamiento. Presentan gran utilidad para la realidad aumentada, la navegacin de un
robot y aplicaciones donde se requiere una posicin relativa entre la cmara y el objeto. [8]
Estos marcadores poseen menos esttica pero aun as, siguen siendo muy usados por los usuarios
puesto que resultan confiables, constan de un borde negro de un ancho determinado y un patrn
de color negro en su interior. Esta tecnologa permite el uso de diversos marcadores
simultneamente, si algn pedazo del marcador llegase a ser cubierto el modelo virtual generado
por este desaparecer. [10]
4.4 Markerless
La tecnologa markerless resulta ser la ms deseada debido a su resultado esttico y la capacidad

de generar sorpresa, para lograr que esta funcione de un modo eficiente se requiere que el
marcador sea una imagen detallada, para esto se pueden usar fotos o imgenes. Los markerless
permiten hacer uso de mltiples imgenes en tiempo real a partir de una base de datos, permiten el
uso de botones virtuales y poseen la ventaja de que aunque se cubra parcialmente el marcador el
objeto 3D que este representa no desaparecer. [10]
4.5 Percepcin computacional
Es la percepcin hecha por mquinas. Pero, qu es la percepcin? Segn el diccionario de la

Real Academia la percepcin es sensacin interior que resulta de una impresin material hecha en
nuestros sentidos, es decir, lo que nuestra mente produce a partir de lo que llega a nuestros
rganos sensoriales. En este sentido tenemos que distinguir entre varias cosas:
1. El objeto en s que produce la informacin que percibimos.
2. La informacin que recibe el rgano sensorial, es decir, el estmulo.
3. La traduccin de la informacin recibida a estmulos electro-qumicos que son propagados por

las neuronas sensoriales hasta el cerebro.
4. La interpretacin que hace el cerebro de esos estmulos.
En general, el problema de la percepcin computacional se descompone en varias fases y se

aborda cada una de ellas por separado. Estas fases son las siguientes: captacin, pre-proceso,
segmentacin, descripcin, reconocimiento, actuacin.
Captacin: En esta fase el dispositivo transductor convierte la informacin en seal elctrica y esta
es digitalizada.
Pre-proceso: En esta fase se mejora la informacin ya digitalizada. Por ejemplo si es sonora se

intenta eliminar el ruido o si el sonido es dbil se intentar incrementarlo. En esta fase tambin se
pueden aplicar filtros para eliminar parte de la seal que no nos interese.
Segmentacin: Es una de las fases ms importantes. Aqu se trata de separar la figura del fondo,
es decir, el objeto que queremos reconocer de todo lo dems. En una foto, por ejemplo, podra
consistir en separar la cara de una persona del resto de la foto: cuerpo, paisaje, etc., o en una
cancin separar la meloda del acompaamiento.
Descripcin: Una vez segmentado el objeto de inters, en la fase de descripcin se intenta

representar este objeto utilizando menos informacin, y si es posible ms relevante que la original.
Por ejemplo, en el caso de la meloda podramos intentar representarla por la secuencia de notas
musicales que suenan en ella, o en el caso de la fotografa podramos intentar representar la cara
por nmeros como la altura de los ojos, la distancia que los separa, la posicin de la nariz, el tipo
de nariz, etc.
Reconocimiento: Una vez que tenemos la descripcin del objeto a reconocer, estamos en
condiciones de intentar reconocerlo, es decir, saber qu objeto es: saber qu persona es la que
est en la fotografa, saber a qu cancin pertenece la meloda que est sonando, etc. Otras veces
el objetivo no es tan ambicioso. Quiz nos baste con determinar si en la pieza que estoy
explorando hay una grieta, por ejemplo, o si la medida del lado de una tuerca que se ha fabricado
es correcta o no. Esta fase depende muchsimo del objetivo final que tenga el sistema que estemos
desarrollando.
Actuacin Generalmente, una vez reconocido el objeto, en sistema debe tomar algn tipo de
decisin, ms o menos compleja. A modo de ejemplo, si un sistema de ayuda a la conduccin ha
determinado que hay un peatn en la calzada y que el automvil va a una velocidad en la que
podra atropellarlo, puede tomar la decisin de frenar automticamente. Si una pieza es defectuosa
tomar la decisin de enviarla a la zona de piezas defectuosas, etc. [11]
5.3. Asistentes virtuales para dispositivos mviles
Los asistentes personales de voz estn mejorando cada da generando as que un mayor nmero
de usuarios confen en este tipo de software para llevar a cabo un sin nmero de sus tareas
diarias, pero todava existen deficiencias en su desempeo, cuando un usuario realiza una consulta
que el asistente no puede manejar la calidad del resultado disminuye. [12]
Los asistentes personales incluyen un reconocimiento de voz y un procesador de lenguaje natural.

Este reconocedor est configurado para transformar una expresin verbal en un tipo diferente de
informacin, por ejemplo, convertirla en un texto. El procesador de lenguaje natural se configura
para procesar la informacin que se extrae para ser comparada con una base de datos. En el
procesamiento se analiza la expresin gramatical para transformar al menos una parte de esta en
una instruccin. Este dato puede ser una lista, la informacin en el calendario de la persona o la
informacin de la libreta de direcciones, cosas por hacer, nmeros de telfono entre otros [13]. El
reconocimiento de voz tambin proporciona una interfaz natural para recuperar la informacin
registrada anteriormente. [14]
Los asistentes virtuales se adaptan al usuario en funcin de la informacin que reciben, esta
informacin podra ser del usuario, sobre la experiencia de este, el tiempo entre las sesiones, la
cantidad de tiempo en que se hace una pausa durante la grabacin de un mensaje, el estado
emocional, esto para que pueda responder un modo gil a las funciones requeridas por el usuario
[15,16]
5.3.1. Cortana
Desarrollado por Microsoft 14 de Abril de 2014. Es la versin que ofrece Microsoft como asistente
personal, su nombre se deriva del asistente que existe en el conocido juego Halo. Cortana se
ver en Windows 10, es un asistente virtual capaz de reconocer el lenguaje natural el cual puede
realizar tareas y responder preguntas mediante la bsqueda en el equipo local, es capaz de
acceder a la nube y realiza las bsquedas de internet haciendo uso de Bing. Ser integrada al
nuevo navegador Spartan. [17]
En lo que se refiere al programa en s, Microsoft se centra en el reconocimiento de la voz,

capacidad de bsqueda y aprendizaje. La idea es lograr un asistente que en verdad pueda
anticiparse a las necesidades del usuario. [18]
La primera vez que se hace uso de este asistente resultara necesario responder una serie de
preguntas para que este pueda conocer los intereses del usuario, a medida que descubra ms
cosas de este, registrara los datos en un notebook, al cual se tendr acceso para la modificacin o
eliminacin de datos. Adems, este software tendr su propia personalidad es decir, si tu equipo
pierde, en teora podrs notar tristeza y enfado en la voz de Cortana. Hasta canta alguna cancin si
se lo pides.
Ser capaz de responder a rdenes y bsquedas bsicas, como las relacionadas al tiempo, a
resultados deportivos, etc., Microsoft ha hecho que Cortana pueda establecer recordatorios sobre
acciones. Pero no recordatorios cualesquiera: Cortana podr recordar el que debas preguntarle a
tu hermana por su nueva mascota la prxima vez que ella llame una vez se configuren los trminos
hermana mujer Cortana ser capaz de entender a qu se refiere con cada una de estas
palabras y as poder actuar. De modo que en el momento de recibir la llamada recibirs la
notificacin.
5.3.2. SIRI
Siri fue fundada en 2007, se incub en SRI International, como parte de un proyecto de inteligencia
artificial financiado por DARPA llamado CALO o cognitivo agente que aprende y organiza, que
posteriormente fue adquirido por Apple el 28 de abril de 2010. [19]
Siri es capaz de acceder a una base de datos de informacin de ontologas activas como por
ejemplo, la ontologa comedor contiene la base de datos de restaurantes, cocinas y platos, junto
con la informacin sobre el concepto de una comida, la cual se trata de una o ms personas que se
renen para comer; Siri escucha palabras clave para identificar la ontologa y resuelve si se pedir
ms informacin o si tiene suficientes datos para acceder a un sitio web especifico o cumplir una
orden. Este ltimo paso es posible debido a que la mayora de los servicios web ahora ofrecen
interfaces de programacin de aplicaciones (API) que permiten aplicaciones alimentan la
informacin a ellos. [19] La aplicacin traduce el comando hablado y utiliza un conjunto de
algoritmos para buscar la respuesta. [20]
Siri aprender ms sobre su usuario y adaptar sus resultados sobre la base de sus preferencias
conforme pasa el tiempo, se debe a que se trata de "reconocimiento de voz con un cerebro, esta
es la primera versin de una asistencia de computadoras que entiende la lengua, tiene la
capacidad de delegar tareas y aprender", dijo el Sr. Kittlaus (co-creador de SIRI). [20]
5.3.3. Google now
Desarrollado por Google el 9 de julio de 2012, El objetivo del proyecto era crear asistente personal
inteligente valindose de las ya existentes aplicaciones Google Search y Google Voice. A diferencia
de cualquier otra aplicacin, Google Now es proactiva. Utiliza la informacin que recoge para
actuar usando tarjetas para hacer sugerencias o mostrar contenido de inters, esta sera la forma
pasiva de recibir informacin, el modo activo, se obtendr a travs de comandos de voz. [21]
Google Now utiliza una interfaz de usuario de lenguaje natural para responder preguntas, hacer
recomendaciones y realizar acciones mediante la delegacin de las solicitudes a un conjunto de
servicios web. Junto con la respuesta a las consultas iniciadas por el usuario, esta herramienta
ofrece de forma pasiva informacin al usuario que predice va a querer, en funcin de sus hbitos
de bsqueda. [21]
5.4. Geolocalizacin y navegacin
Narzt discute los paradigmas de navegacin para peatones al aire libre y para coches los cuales
cubren rutas, salidas de la autopista, peligros, etc Es un prototipo de video a travs de PDAs
(Personal Digital Assistant), telfonos mviles y se planea implementar displays en el parabrisas
del coche [22] Tnnis investiga el xito de usar advertencias en realidad aumentada para dirigir la
atencin de un piloto hacia un peligro [23]. Un servicio de orientacin 2D puede ser hecho en 3D a
partir de datos para la navegacin con realidad aumentada. [24]. Estas aplicaciones muestran
como el uso de pantallas para la realidad aumentada disminuyen los errores de navegacin. [25]
5.4.1. Pioneers Cyber Navi GPS
Desarrollado por Pionner el 9 de Mayo de 2013, el objetivo era desarrollar un sistema de

navegacin inteligente con realidad aumentada para Japn. [26]
Cyber Navi est equipado con el nuevo Smart eye Loop y hace uso de la unidad de velocidad
Scouter. Este GPS inteligente con realidad aumentada, funciona a partir de una cmara la cual se
encuentra situada hacia la carretera en el cristal del vehculo, que pasa las imgenes al display
sobre las que se superponen las indicaciones. Adems de esto, permite realizar bsquedas
comandadas por voz y ser capaz de detectar los pasos de los peatones, podr superponer avisos
y seales en la pantalla para llamar nuestra atencin, tambin podr hacer seguimiento del coche
que se encuentre delante para mantener una distancia segura. Las alarmas o indicaciones que
presenta este facilitaran el lugar donde debe efectuarse un cambio de giro, la distancia que falta
entre otras indicaciones ya que permite usar la imagen de la carretera real con indicaciones en
realidad aumentada. [26]
Cyber Navi recopila informacin del trfico y otras informaciones de utilidad de forma automtica y
la distribuye en forma de imgenes fijas lo que permite que sea compartida entre los usuarios, esto
significa que la situacin del trfico puede ser comprobada con la imagen real, permitiendo a los
conductores disfrutar de la conduccin segura y confortable. [26]
7. BIBLIOGRAFA
[1] T. Jebara, C. Eyster, J. Weaver, T. Starner, and A. Pentland. Stochasticks: Augmenting the
billiards experience with probabilistic vision and wearable computers. In ISWC97: Proc. Intl Symp.
on Wearable Computers, pp. 138145, Cambridge, MA, USA, Oct. 13-14 1997. IEEE CS Press.
ISBN 0-8186-8192-6.
[2] S. Julier and G. Bishop. Tracking: how hard can it be? IEEE Computer Graphics and
Applications, 22 (6):2223. Diciembre 2002.
[3] D. Schmalstieg, A. Fuhrmann, and G. Hesina. Bridging multiple user interface dimensions with
augmented reality. In [3], pp. 2029.
[4] LIU, Yue; YANG, Ju; LIU, Mongjum. Recognition of QR Code with mobile phones. En Control
and Decision Conference, 2008. CCDC 2008. Chinese. IEEE, 2008. p. 203-206.
[5] J.J, Galiyawala, Dept. of E & C,C.G.P.I.T., Bardoli,India, K.H, Pandya, To increase data capacity
of QR code using multiplexing with color coding: An example of embedding speech signal in QR
code, 2013. IEEE 2014
[6] HUANG, Hsiang-Cheh; CHANG, Feng-Cheng; FANG, Wai-Chi. Reversible data hiding with
histogram-based difference expansion for QR code applications.Consumer Electronics, IEEE
Transactions on, 2011, vol. 57, no 2, p. 779-787.
[7] KAN, Tai-Wei; TENG, Chin-Hung; CHOU, Wen-Shou. Applying QR code in augmented reality
applications. En Proceedings of the 8th International Conference on Virtual Reality Continuum and
its Applications in Industry. ACM, 2009. p. 253-257.
[8] FIALA, Mark. ARTag, a fiducial marker system using digital techniques. EnComputer Vision and
Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005. p.
590-596.
[9] FIALA, Mark. Designing highly reliable fiducial markers. Pattern Analysis and Machine
Intelligence, IEEE Transactions on, 2010, vol. 32, no 7, p. 1317-1324.
[10] Aumentaty Author, Qu es la realidad aumentada? [online] Julio 2015. Disponible en:
http://author.aumentaty.com/acerca-de-aumentaty-author?qt-info=1#
[11]GARCA, Texto de D. Francisco Serradilla. GUA ESPECFICA DE TRABAJO SOBRE

PERCEPCIN ARTIFICIAL. 2012
[12] ELWANY, Emad; SHAKERI, Siamak. Enhancing Cortana User Experience Using Machine
Learning. Recall, 2014, vol. 55, no 54.61, p. 24.24.
[13] TSIAO, James Chi-Shun; CHAO, David Yinkai; TONG, Peter P. Natural-language voice-
activated personal assistant. U.S. Patent No 7,216,080, 8 Mayo 2007.
[14] F. H. Raab, E. B. Blood, T. O. Steiner, and H. R. Jones. Magnetic position and orientation
tracking system. Trans. Aerospace and Electronic Systems, 15 (5):709717, 1979.
[15] P. JIMENEZ MARTN, J. SANCHEZ ALLENDE, De Eliza a Siri: la evolucin Revista de

ciencia tecnologa y medio ambiente [online]. Vol 13, pp 21. Febrero 2015. Disponible en:
http://www.uax.es/publicacion/de-eliza-a-siri-la-evolucion.pdf
[16] COOPER, Robert S., et al. Personal virtual assistant. U.S. Patent No 6,757,362, 29 Jun. 2004.
[17]TUFFLEY, David. Hello Windows 10: could this be a winner for Microsoft?. Marzo 2013
[18] RedUSERS. Cortana llega a ios y android. The Redusers [online]. Marzo de 2015. Disponible
en: http://www.redusers.com/noticias/cortana-llega-a-ios-y-android/?
utm_source=Newsletter_de_noticias&utm_medium=Newsletter&utm_term=Bloque_noticias_0&utm
_campaign=Newsletter_15_03_13
[19] ARON, Jacob. How innovative is Apple's new voice assistant, Siri?. New Scientist, vol. 212, no
2836, pp. 24. 2011.
[20] J. WORTHAM. A Personal Assistant on Your iPhone. The New York times [online]. Febrero
de 2010. Disponible en: Http://bits.blogs.nytimes.com/2010/02/05/a-personal-assistant-on-your-
iphone/?_r=0
[21] SpainMOVIL. Scale todo el partido a Google Now, tu asistente Android. Spainmovil [online].
Noviembre de 2013. Disponible en: http://www.spainmovil.es/android/apps/sacale-partido-google-
now-asistente-android_r76.html
[22]N. Navab, A. Bani-Hashemi, and M. Mitschke. Merging visible and invisible: Two camera-
augmented mobile C-arm (CAMC) applications. Vol 2, pp. 134141.
[23] T. Ogi, T. Yamada, K. Yamamoto, and M. Hi-rose. Invisible interface for immersive virtual world.
In IPT01: Proc. Immersive Projection Technology Workshop, pp. 237246, Stuttgart, Germany,
2001.
[24] K. Kiyokawa, M. Billinghurst, B. Campbell, and E. Woods. An occlusion-capable optical see-

through head mount display for supporting co-located collaboration. pp. 133141.
[25] S. Kim, H. Kim, S. Eom, N. P. Mahalik, and B. Ahn. A reliable new 2-stage distributed interactive
TGS system based on GIS database and augmented reality. IEICE Transactions on Information and
Systems, E89-D(1):98105. Enero 2006.
[26] J. LVIZ. Pioneer Cyber Navi, el GPS inteligente con realidad aumentada. Clipset [online].
Junio de 2013. Disponible en: http://clipset.20minutos.es/pioneer-cyber-navi-el-gps-inteligente-con-
realidad-aumentada/

JB, Gkujb

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

JB, Gkujb

Hochgeladen von

Copyright:

Verfügbare Formate

4.

4.1. Realidad aumentada

Existen bsicamente tres formas de presentar visualmente la realidad aumentada; el ms cercano

4.3 Marcadores fiduciales

La tecnologa markerless resulta ser la ms deseada debido a su resultado esttico y la capacidad

4.5 Percepcin computacional

Es la percepcin hecha por mquinas. Pero, qu es la percepcin? Segn el diccionario de la

1. El objeto en s que produce la informacin que percibimos.

2. La informacin que recibe el rgano sensorial, es decir, el estmulo.

3. La traduccin de la informacin recibida a estmulos electro-qumicos que son propagados por

4. La interpretacin que hace el cerebro de esos estmulos.

En general, el problema de la percepcin computacional se descompone en varias fases y se

Pre-proceso: En esta fase se mejora la informacin ya digitalizada. Por ejemplo si es sonora se

Descripcin: Una vez segmentado el objeto de inters, en la fase de descripcin se intenta

Los asistentes personales incluyen un reconocimiento de voz y un procesador de lenguaje natural.

En lo que se refiere al programa en s, Microsoft se centra en el reconocimiento de la voz,

5.3.3. Google now

5.4. Geolocalizacin y navegacin

5.4.1. Pioneers Cyber Navi GPS

Desarrollado por Pionner el 9 de Mayo de 2013, el objetivo era desarrollar un sistema de

[11]GARCA, Texto de D. Francisco Serradilla. GUA ESPECFICA DE TRABAJO SOBRE

[15] P. JIMENEZ MARTN, J. SANCHEZ ALLENDE, De Eliza a Siri: la evolucin Revista de

[24] K. Kiyokawa, M. Billinghurst, B. Campbell, and E. Woods. An occlusion-capable optical see-

Das könnte Ihnen auch gefallen