Beruflich Dokumente
Kultur Dokumente
UNICAMP Universidade Estadual de Campinas FT Faculdade de Tecnologia Rua Paschoal Marmo, 1888 - Jardim Nova Itlia - CEP: 13484-370 - Limeira/SP E-mail: ceset@ceset.unicamp.br - Telefone: (19) 3404-7139
Resumo
Este artigo tem por objetivo apresentar uma introduo sobre Viso Computacional de forma clara e objetiva. Sero apresentados alguns aspectos gerais, alm de aplicaes e tcnicas utilizadas, dando destaque ao rastreamento de olhar.
Abstract
This article aims to introduce in a clear and objective way the general aspects of Computer Vision. Some techniques and applications commonly used are introduced and it's given special attention to the field of eye tracking.
Palavras-Chaves
Inteligncia Artificial, Viso Computacional, Rastreamento de olhar
1. Introduo
1.1 O que Viso Computacional?
Viso computacional a cincia responsvel pela viso de uma mquina, pela forma como um computador enxerga o meio sua volta, extraindo informaes significativas a partir de imagens capturadas por cmeras de vdeo, sensores, scanners, entre outros dispositivos. Estas informaes permitem reconhecer, manipular e pensar sobre os objetos que compem uma imagem [1]. Podemos considerar viso computacional como uma cincia muito recente. Uma das primeiras menes sobre viso computacional data de 1955, onde Selfridge destacou ...eyes and ears for the computer [2]. Por volta da dcada de 70 iniciaram-se os primeiros trabalhos de Viso Computacional aliada a Inteligncia Artificial. Na poca acreditava-se que em pouco tempo seria possvel representar o sentido da viso de
forma completa em uma mquina. Entre os estudos realizados, destacam-se The Psychology of Computer Vision [3], e A framework for representing knowledge [4], ambos de 1975. Com o desenvolvimento de novas pesquisas nas dcadas subseqentes, verificou-se uma complexidade muito maior do que imaginado inicialmente, principalmente pela falta de informaes e de modelos que representassem a forma como as imagens so interpretadas no crebro humano. O olho humano consegue perceber e interpretar objetos em uma imagem de forma muito rpida. Isso acontece no cortex visual do crebro, uma das partes mais complexas no sistema de processamento do crebro. Alguns cientistas concentram seus estudos na tentativa de entender o funcionamento dessa parte do crebro, para ento trazer tais idias para a viso computacional. o que pesquisadores do MIT definem como "ensinar computadores a enxergarem como humano" [5]. Dessa forma, a viso computacional fornece ao computador uma infinidade de informaes precisas a partir de imagens e vdeos, de forma que o computador consiga executar tarefas inteligentes, simulando e aproximando-se da inteligncia humana.
obtidos
em
Com uma organizao semelhante, e uma base de conhecimentos muito grande que possvel Sistemas de Recuperao de Imagens com Base no Contedo (RIBC). Estes permitem buscas de imagens com base em atributos como cores, formas ou texturas. o caso, por exemplo, do site do Museu Hermitage [7], de So Petersburgo, que permite consulta virtual s obras do acervo, atravs das seguintes buscas: Busca por exemplo: uma imagem de exemplo fornecida como base para a busca Busca por distribuio de cores: fornecido como parmetro a distribuio de cores esperada Busca por formas: a forma esperada fornecida
3. Tcnicas de Viso Computacional para Rastreamento de Olhar em Vdeos. 3.1. Deteco do olho
Uma das reas mais recentes que despertam estudos em viso computacional o rastreamento (tracking) de objetos. O rastreamento a tcnica utilizada para detectar um objeto no plano da imagem enquanto este se move durante uma cena [8]. O rastreamento do movimento humano permite por exemplo uma maior interao homem-computador (IHC). Para o rastreamento necessrio detectar como o objeto em anlise ser representado, quais as caractersticas que serviro de parmetros para o rastreamento e qual a estratgia utilizada para o rastreamento [9]. Yilmaz[8] apresenta as formas de representao que so mais utilizadas, como pontos, formas geomtricas, silhueta e contorno do objeto, modelos de forma articulada e modelos de esqueleto. Como o rastreamento por pontos analisa o estado anterior, esta tcnica apresenta falsas deteces, quando o objeto rastreado tem muita entrada e sada da cena. Outra tcnica utilizada o rastreamento por kernel, onde dado um modelo geomtrico ou um template analisado o movimento de kernel desse objeto nos quadros consecutivos, sendo esse movimento por exemplo uma translao ou rotao do objeto. J o rastreamento por silhueta ou contorno permite que objetos de formas complexas possam ser detectados por meio de correspondncia de formas ou evoluo de contorno. Entre as diversas pesquisas de rastreamento existentes, damos destaque ao rastreamento de olhar, conhecido como eye tracking, que consiste no processo de acompanhar o olho de uma pessoa e detectar para onde ela est olhando. Dessa forma seria possvel por exemplo controlar o cursor do mouse atravs do olho,
um avano em termos de usabilidade e acessibilidade. O processo de rastreamento do olhar pode ser dividido em deteco ativa (active eye detection) e deteco passiva (passive eye detection).
A partir da emisso de um ponto pontual de luz fora do eixo ptico da cmera, possvel presenciar outro evento, denominado Glint. O Glint um ponto de reflexo sobre a crnea, com alto destaque visual numa imagem, o que facilita o rastreamento do olhar [5].
A Deteco baseada em modelos visa minimizar uma funo de energia, obtida atravs da juno de um dado modelo com uma imagem. O padro geralmente composto por um crculo e duas curvas parablicas, modelando assim o aspecto de um olho. A diferena bsica nos mtodos que utilizam essa tcnica est na forma de se encontrar a localizao inicial de um padro. Na busca pelos olhos, o modelo deslocado de acordo com um processo de minimizao de uma funo de energia. O deslocamento do modelo permite a deteco at mesmo de olhos rotacionados e apresenta tolerncia a variaes de abertura dos olhos. Algumas desvantagens do uso desta abordagem so as dificuldades para encontrar os pontos iniciais para encaixe do modelo e o alto custo computacional. (Leite -2008, apud F. H. C. Tivive and A. Bouzerdoum - 2005 ).
(a) Eletrodos: eletrodos so colocados em volta do olho do usurio, captando movimentos do olho detectados entre a crnea e a retina. A vantagem do mtodo que ele bem preciso. Porm, ele s pode ser executado em laboratrio, impedindo a propagao da tecnologia para um usurio comum, e necessita que o rosto esteja parado, no rastreando com preciso caso haja movimentos da cabea, alm de ser invasivo. A figura 4 mostra como funciona o mtodo de rastreamento por meio de eletrodos.
(b) Lentes de Contato: lentes de contato so inseridos no olho do usurio, de forma a rastrear o movimento do olho. Apesar de ser bem preciso e captar bem o movimento do olho, o mtodo muito invasivo, gerando incmodos como coceira e piscar excessivo do olho.
Figura 3 Mtodo do Modelo Deformvel [5]
(c) Processamento de Imagens: Mtodos de deteco ativa e passiva, descritos na seo anterior.
4. Rastreamento do Olhar
Como a maioria das aplicaes que utilizam viso computacional, inicialmente necessrio executar uma calibrao no sistema, de forma a parametrizar caractersticas, como distncia, cores, luz, etc. Para o rastreamento do olhar, a distancia em que o usurio est olhando para um dado monitor deve ser estimada a partir da direo do olhar, considerando que o monitor esteja parado. Essa distncia pode ser analisada a partir da posio de apenas um olho, considerando que ambos os olhos estejam no mesmo foco e que no seja necessrio a percepo de profundidade.
5. Aplicaes
Aplicaes que utilizam viso computacional podem ser encontradas em diversas reas, como fsica, biologia, indstria, foras armadas, entre outras. Como ilustrao podemos citar: deteco de terroristas em aeroportos, atravs de reconhecimento de face (biometria), deteco de unidades inimigas ou msseis teleguiados em aplicaes militares, anlise morfolgica de clulas, montadoras de veculos, posicionamento de braos de robs em reparos de submarinos e futebol de robs. Quanto a rea de reconhecimento de imagens, aplicaes baseadas em futebol de robs sempre ganham destaque, devido a possibilidade de realizao de experimentos reais para o desenvolvimento e testes de robs [10]. Algoritmos so criados tendo a necessidade de localizar e detectar elementos do mesmo time de forma precisa e em tempo real, alm do campo, da bola e dos adversrios, determinando e orientando o rob jogador. Estes algoritmos devem sempre considerar ateno especial quanto s cores dos objetos, influenciada pela iluminao do campo, que
4.1. Mtodos
Alguns mtodos surgiram para o rastreamento da direo do olhar de uma pessoa. Entre eles Rehem e Trindade [6] destacam Eletrodos, Lentes de Contato e Processamento de Imagens.
nem sempre uniforme. Com a atual preocupao quanto a interveno da ao humana no ambiente e, consequentemente, sua futura existncia, aplicaes ligadas ao meio ambiente tambm se propagam. Utilizando viso computacional possvel detectar mudanas ambientais em tempo real, analisando imagens de satlites, tomando medidas de forma automtica. possvel tambm analisar eventos especficos, como migrao ou confinamento de aves em situaes de estresse trmico [11], influenciadas pelo aquecimento global. Outra rea que ganha muito destaque a Medicina. Como o olho humano limitado em relao percepo de alguns padres em imagens e na deteco de imagens com rudos ou contraste muito baixo, muitas vezes interpretando-as de forma diferente, o uso de recursos computacionais pode ajudar neste reconhecimento, servindo, por exemplo, como um auxiliar no diagnstico de algumas doenas, evitando um diagnstico impreciso ou equivocado. Dessa forma seria uma espcie de segunda opinio para o mdico, com o intuito de confirmar uma suspeita ou abrir novos horizontes deteco de certa doena. Tais sistemas so conhecidos por Sistemas Computacionais de Apoio ao Diagnstico (CAD), como sistemas de apoio ao diagnstico de fraturas cranianas [12], sistemas de apoio a leses pulmonares [13] e sistemas de apoio a mamografia. Nestes sistemas a viso computacional utilizada para detectar anomalias, caracterizando-as e classificando-as, baseando-se num vasto conjunto de imagens e informaes. Outro fato que contribui para a utilizao da viso computacional que a anlise de uma radiografia torna-se mais precisa quando utilizam-se dois radiologistas para a deteco de anomalias[14]. Dessa forma, poderia ser utilizado um sistema automatizado no lugar de um dos radiologistas, fazendo uma juno do resultado para um diagnstico mais preciso. Outra rea de forte utilizao na indstria, onde a viso computacional pode ser utilizada desde o controle da qualidade de determinado produto fabricado, at em reas mais especficas, como caracterizao e classificao de minrio de ferro [15]. Os sistemas de controle autnomo tambm ganham destaque, como por exemplo os veculos autnomos Remote Agent e o Mars Exploration Rover da Nasa [16]. Outro que ganhou notoriedade foi o sistema de viso computacional Alvinn [17], incorporado numa minivan que percorreu mais de 4500km nos Estados Unidos de forma autnoma em 98% do tempo. H ainda o The
6. Concluso
Pudemos, nesse trabalho inicial, verificar que Viso Computacional em Inteligncia Artificial um campo vasto, no apenas de trabalho, mas de pesquisa, uma vez que, so vrias reas de atuao que necessitam desse tipo de aplicao, e quase nem todas tm recebido a ateno necessria, nesse caso, podemos citar os sistemas de navegao automtica de veculos, cujas pesquisas ainda no atingiram um nvel de maturao que os habilite no uso domstico e comercial. Conclumos, com isso, que as possibilidades de pesquisa nessa rea so muito promissoras, afinal visvel o avano cada vez maior da tecnologia em nossas vidas.
7. Referncias Bibliogrficas
[1] Ballard, Dana Harry, Computer Vision, PrenticeHall, 1982. [2] David, E.E., Selfridge, O.G., Bell Telephone Laboratories, Murray Hill, N.J. This paper appears in: Proceedings of the IRE Issue Date: May 1962 Volume: 50 Issue:5 On page(s): 1093 - 1101 ISSN: 0096-8390 Digital Object Identifier: 10.1109/JRPROC.1962.288011 Date of Current Version: 22 Janeiro 2007 [3] Winston, P.H.,The Psychology of Computer Vision, McGraw Hill, 1975
[4] Minsky,Marvin, A Framework for Representing Knowledge,MIT-AI Laboratory Memo 306, 1974. [5]http://www.scientificamerican.com/article.cf m?id=visionary-research acessado em18/09/2010 [6] Rehem, Almerindo e Trindade, Fernando H. V.,Tcnicas de Viso Computacional para Rastreamento de Olhar em Vdeos. Publicado em 03/02/2009. Disponvel em:http://almerindo.devin.com.br/ index.php? option=com_content&view=article&id=78%3 Atecnicas-de-computacao-visual-pararastreamento-de-olhar emvideos&catid=43%3Atrabalhos-dealunos&Itemid=86&showall=1 acessado em 18/09/2010 [7] http://www.hermitagemuseum.org/ acessado em 18/09/2010 [8] Yilmaz, A; Javed, O; Shah, M. Object Tracking: A survey. ACM Comput. Surv. v. 38, n. 4, p.13, 2006 [9] Conti, Caroline, Gonzaga, Adilson, Rastreamento dos dedos da mo para interao humano-computador Laboratrio de Viso Computacional (LAVI), Departamento de Engenharia Eltrica, Escola de Engenharia de So Carlos (EESC), Universidade de So Paulo (USP). [10] Bianchi, A.C., Reali-Costa, A.H.O Sistema de Viso Computacional do time Futepoli de futebol de. Anais do Congresso Brasileiro de Automtica 2000. [11] Rodrigues, Valria Cristina, Distribuio especial e bem-estar de aves poedeiras em condies de estresse e conforto trmico utilizando viso computacional e inteligncia artificial Piracicaba 2006 [12] Eric da Silva, Saulo Araujo de Carvalho, Wagner dos Santos C. de Jesus, Alderico Rodrigues de Paula Junior Sistema Especialista de Viso Computacional para diagnstico de Fraturas Cranianas em Imagens de Tomografia Computadorizada. Universidade do Vale do Paraba/Instituto de Pesquisas e Desenvolvimento IP&D [13] Tcnicas de Inteligncia Artificial Aplicadas ao Desenvolvimento de Sistema de Apoio ao Diagnstico de Leses Pulmonares. Paulo Eduardo Ambrsio, Paulo M. de
Azevedo-Marques, Clvis Simo, Centro de Cincias das Imagens e Fsica Mdica (CCIFM), Faculdade de Medicina de Ribeiro Preto (FMRP), Universidade de So Paulo (USP), Brasil Centro Universitrio Baro de Mau (CeUBM), Brasil [14] Vyborny , Carl J. and Giger , Maryellen L., Computer Vision and Artificial Intelligence in Mammography Received September 2, 1 993; accepted after revision November 1 5, 1993. American Roentgen Ray Society [15] Frick, Andr DellAglio, Caracterizao de Minrio de ferro por Viso, 2008 [16] http://marsrovers.jpl.nasa.gov/home/index.html acessado em 20/09/2010 [17] ALVINN: an autonomous land vehicle in a neural network Source Advances in neural information processing systems 1 book contents Pages: 305 - 313 Year of Publication: 1989 ISBN:1-558-60015-9 Author : Dean A. Pomerleau Publisher: Morgan Kaufmann Publishers Inc. San Francisco, CA, USA [18] http://www.pbs.org/wgbh/nova/darpa/ acessado em 18/09/2010 [19]Pinho, Raquel R., Tavares, Joo Manuel R.S.;Correia, Miguel V. F.P.; 2004 [20]Leite, Bruno B. Deteco de Olhos em Imagens com Faces Humanas, Universidade Federal de Campina Grande, 2008 [21]Tivive,F. H. C. and Bouzerdoum,A., A fast neuralbased eye detection system. In Proceedings of International Symposium on Intelligent Signal Processing and Communication Systems, pages 641 644, 2005. [22]Q. Ji, H. Wechsler, A. Duchowski, and M. Flickner. Editorial. Computer Vision and Image Understanding - Special Issue on Eye Detection and Tracking, 98:13, 2005. [23]Bianchi, Reinaldo A.C; Rillo, Ana Helena R.C., Uma Arquitetura de Controle para Sistemas Complexos de Viso Computacional. [24]Bradski;G. R.;Kaehler, A.; Pisarevsky, V.; Learning-based computer vision with intels open source computer vision library. Intel Technology Journal - Compute-Intensive, Highly Parallel Applications and Uses, 2005. [25]T. Morris, P. Blenkhorn, and F. Zaidi. Blink
detection for real-time eye tracking. Journal of Network and Computer Applications, 25:129 143, 2002. [26]D. H. Yoo and M. J. Chung. A novel nonintrusive eye gaze estimation using cross-ratio under large head motion. Computer Vision and Image Understanding- Special Issue on Eye Detection and Tracking, 98:2551, 2005.