Sie sind auf Seite 1von 7

VISO COMPUTACIONAL

Danilo de Milano Luciano Barrozo Honorato

UNICAMP Universidade Estadual de Campinas FT Faculdade de Tecnologia Rua Paschoal Marmo, 1888 - Jardim Nova Itlia - CEP: 13484-370 - Limeira/SP E-mail: ceset@ceset.unicamp.br - Telefone: (19) 3404-7139

Resumo
Este artigo tem por objetivo apresentar uma introduo sobre Viso Computacional de forma clara e objetiva. Sero apresentados alguns aspectos gerais, alm de aplicaes e tcnicas utilizadas, dando destaque ao rastreamento de olhar.

Abstract
This article aims to introduce in a clear and objective way the general aspects of Computer Vision. Some techniques and applications commonly used are introduced and it's given special attention to the field of eye tracking.

Palavras-Chaves
Inteligncia Artificial, Viso Computacional, Rastreamento de olhar

1. Introduo
1.1 O que Viso Computacional?
Viso computacional a cincia responsvel pela viso de uma mquina, pela forma como um computador enxerga o meio sua volta, extraindo informaes significativas a partir de imagens capturadas por cmeras de vdeo, sensores, scanners, entre outros dispositivos. Estas informaes permitem reconhecer, manipular e pensar sobre os objetos que compem uma imagem [1]. Podemos considerar viso computacional como uma cincia muito recente. Uma das primeiras menes sobre viso computacional data de 1955, onde Selfridge destacou ...eyes and ears for the computer [2]. Por volta da dcada de 70 iniciaram-se os primeiros trabalhos de Viso Computacional aliada a Inteligncia Artificial. Na poca acreditava-se que em pouco tempo seria possvel representar o sentido da viso de

forma completa em uma mquina. Entre os estudos realizados, destacam-se The Psychology of Computer Vision [3], e A framework for representing knowledge [4], ambos de 1975. Com o desenvolvimento de novas pesquisas nas dcadas subseqentes, verificou-se uma complexidade muito maior do que imaginado inicialmente, principalmente pela falta de informaes e de modelos que representassem a forma como as imagens so interpretadas no crebro humano. O olho humano consegue perceber e interpretar objetos em uma imagem de forma muito rpida. Isso acontece no cortex visual do crebro, uma das partes mais complexas no sistema de processamento do crebro. Alguns cientistas concentram seus estudos na tentativa de entender o funcionamento dessa parte do crebro, para ento trazer tais idias para a viso computacional. o que pesquisadores do MIT definem como "ensinar computadores a enxergarem como humano" [5]. Dessa forma, a viso computacional fornece ao computador uma infinidade de informaes precisas a partir de imagens e vdeos, de forma que o computador consiga executar tarefas inteligentes, simulando e aproximando-se da inteligncia humana.

2. Organizao de um Sistema de Viso Computacional


As aplicaes que utilizam viso computacional so, em sua maioria, provindas de outras reas de pesquisa, resolvendo problemas particulares de forma especfica. Tais sistemas so conhecidos como sistemas especialistas, que necessitam de conhecimento especfico para a soluo de um determinado problema. Dessa forma, no existe um modelo padro bem definido para implementao de aplicaes que utilizam viso computacional. Porm, basicamente todos os sistemas de viso computacional envolvem reconhecimento de objetos em imagens e transformaes destes objetos em informaes que sero processadas e utilizadas por algum sistema especialista. A seguir so apresentados algumas das funcionalidades comuns na maioria dos sistemas de viso computacional, conforme indicado por Rehem e Trindade [6]: Aquisio de Imagem: o primeiro passo para um sistema de viso computacional. Trata-se do processo de aquisio de uma imagem ou de um conjunto de imagens a partir de sensores de cameras, onde os pixels de cada imagem obtida indicam coordenadas de luz e propriedades fsicas. A imagem pode ser bidimensional, tridimensional ou uma sequncia de imagens. Pr-processamento: Processo realizado antes de obter informaes de uma imagem, de forma a aplicar mtodos especficos que facilitem a identificao de um objeto, como por exemplo destaque de contornos, bordas, destaque de figuras geomtricas, etc. Extrao de caractersticas: Extrao de caractersticas matemticas que compem uma imagem, como textura, bordas, formatos, movimento. Deteco e segmentao: Processo realizado para destacar regies relevantes da imagem, segmentado-as para processamento posterior. Processamento de alto nvel: Processo que inclui validao da satisfao dos dados obtidos, estimativa de parmetros sobre a imagem e

classificao dos objetos diferentes categorias.

obtidos

em

Com uma organizao semelhante, e uma base de conhecimentos muito grande que possvel Sistemas de Recuperao de Imagens com Base no Contedo (RIBC). Estes permitem buscas de imagens com base em atributos como cores, formas ou texturas. o caso, por exemplo, do site do Museu Hermitage [7], de So Petersburgo, que permite consulta virtual s obras do acervo, atravs das seguintes buscas: Busca por exemplo: uma imagem de exemplo fornecida como base para a busca Busca por distribuio de cores: fornecido como parmetro a distribuio de cores esperada Busca por formas: a forma esperada fornecida

3. Tcnicas de Viso Computacional para Rastreamento de Olhar em Vdeos. 3.1. Deteco do olho
Uma das reas mais recentes que despertam estudos em viso computacional o rastreamento (tracking) de objetos. O rastreamento a tcnica utilizada para detectar um objeto no plano da imagem enquanto este se move durante uma cena [8]. O rastreamento do movimento humano permite por exemplo uma maior interao homem-computador (IHC). Para o rastreamento necessrio detectar como o objeto em anlise ser representado, quais as caractersticas que serviro de parmetros para o rastreamento e qual a estratgia utilizada para o rastreamento [9]. Yilmaz[8] apresenta as formas de representao que so mais utilizadas, como pontos, formas geomtricas, silhueta e contorno do objeto, modelos de forma articulada e modelos de esqueleto. Como o rastreamento por pontos analisa o estado anterior, esta tcnica apresenta falsas deteces, quando o objeto rastreado tem muita entrada e sada da cena. Outra tcnica utilizada o rastreamento por kernel, onde dado um modelo geomtrico ou um template analisado o movimento de kernel desse objeto nos quadros consecutivos, sendo esse movimento por exemplo uma translao ou rotao do objeto. J o rastreamento por silhueta ou contorno permite que objetos de formas complexas possam ser detectados por meio de correspondncia de formas ou evoluo de contorno. Entre as diversas pesquisas de rastreamento existentes, damos destaque ao rastreamento de olhar, conhecido como eye tracking, que consiste no processo de acompanhar o olho de uma pessoa e detectar para onde ela est olhando. Dessa forma seria possvel por exemplo controlar o cursor do mouse atravs do olho,

um avano em termos de usabilidade e acessibilidade. O processo de rastreamento do olhar pode ser dividido em deteco ativa (active eye detection) e deteco passiva (passive eye detection).

3.2. Deteco Ativa


O mtodo de deteco ativa utilizado em diversos tipos de aplicaes, como robtica, sistemas militares, sistemas mdicos, entre outros. Ele tem como premissa ser simples e eficiente e possuir robustez e confiabilidade para executar os processos. Dentre as tcnicas de deteco ativa temos a deteco de piscadas de olhos e a utilizao de iluminao infravermelha intermitente. Estas tcnicas so frequentemente utilizadas na deteco de olhos a partir de vdeo. A deteco de olhos atravs de piscadas realizada a partir da busca de padres temporais que surgem nas imagens resultantes da subtrao de quadros consecutivos em uma sequncia de vdeo (Leite 2008, apud G. R. Bradski, A. Kaehler, and V. Pisarevsky - 2002). A deteco de olhos com iluminao infravermelha realizada a partir da incidncia de um feixe de luz sobre os olhos. A crnea reflete a luz, produzindo o efeito conhecido como olhos vermelhos, muito comum em fotos produzidas com o uso de flash. Este fenmemo produz pupilas com alto brilho em imagens em nveis de cinza. A posio dos olhos determinada atravs destas regies de alto brilho (Leite 2008, apud D. H. Yoo and M. J. Chung - 2005).
Figura 2 Glint [5]

3.3. Deteco Passiva


A deteco passiva baseada em fontes naturais de sinal, como por exemplo luz visvel ou outros comprimentos de onda eletromagnticos, no sendo necessrio a integrao de dispositivos no vesturio, com exceo da utilizao de marcadores que so colocados no sujeito de forma a facilitar a captura de movimento (Pinho, et al. - 2004, apud Moeslund, 2001). A deteco passiva normalmente utilizada em imagens estticas. Os mtodos passivos podem ser subdivididos em 3 categorias, conforme o tipo de estratgia utilizada: anlise da aparncia, aprendizagem; e modelos (Leite -2008, apud Wechsler et. al - 2005) No mtodo baseado na anlise da aparncia, caractersticas como cor, textura e formas presentes na imagem so sempre levadas em conta. Na maioria dos casos, a deteco dos olhos baseado na analise da aparncia no requer tantos recursos computacionais, devido no necessidade de clculos complexos. Isso ocorre devido a rea de busca ser relativamente pequena, sem contar a pouca variao de cores e nuances. Contudo essa tcnica torna-se insuficiente quando feita uma anlise baseada na cor da pele, afinal existem no mundo inmeras etnias e raas. No mtodo baseado em aprendizagem, um conjunto de imagens de exemplos e contra exemplos so utilizados para treinamento de um classificador. Os sistemas que utilizam este tipo de abordagem usualmente diferem nas caractersticas usadas para treinamento, nas tcnicas empregadas para extrao destas caractersticas a partir das imagens e no tipo de classificador adotado, como por exemplo: Redes Neurais, Modelos Escondidos de Markov (Hidden Markov Models - HMM), Mquinas de Vetores de Suporte (Support Vector Machi- 7 nes - SVM), entre outros. Os olhos correspondem s regies da imagem que produzem uma resposta positiva do classificador. Esta abordagem pode apresentar invarincia a rotaes, mudanas de escala e iluminao, atravs da gerao sinttica de exemplos e contra exemplos para utilizao no treinamento. A dificuldade deste procedimento se encontra na falta de critrios especficos para gerao de contra exemplos em imagens genricas (Leite -2008, apud F. H. C. Tivive and A. Bouzerdoum - 2005 ).

Figura 1 Retro-Reflexo [5]

A partir da emisso de um ponto pontual de luz fora do eixo ptico da cmera, possvel presenciar outro evento, denominado Glint. O Glint um ponto de reflexo sobre a crnea, com alto destaque visual numa imagem, o que facilita o rastreamento do olhar [5].

A Deteco baseada em modelos visa minimizar uma funo de energia, obtida atravs da juno de um dado modelo com uma imagem. O padro geralmente composto por um crculo e duas curvas parablicas, modelando assim o aspecto de um olho. A diferena bsica nos mtodos que utilizam essa tcnica est na forma de se encontrar a localizao inicial de um padro. Na busca pelos olhos, o modelo deslocado de acordo com um processo de minimizao de uma funo de energia. O deslocamento do modelo permite a deteco at mesmo de olhos rotacionados e apresenta tolerncia a variaes de abertura dos olhos. Algumas desvantagens do uso desta abordagem so as dificuldades para encontrar os pontos iniciais para encaixe do modelo e o alto custo computacional. (Leite -2008, apud F. H. C. Tivive and A. Bouzerdoum - 2005 ).

(a) Eletrodos: eletrodos so colocados em volta do olho do usurio, captando movimentos do olho detectados entre a crnea e a retina. A vantagem do mtodo que ele bem preciso. Porm, ele s pode ser executado em laboratrio, impedindo a propagao da tecnologia para um usurio comum, e necessita que o rosto esteja parado, no rastreando com preciso caso haja movimentos da cabea, alm de ser invasivo. A figura 4 mostra como funciona o mtodo de rastreamento por meio de eletrodos.

Figura 4 Mtodo do Eletrodo [5]

(b) Lentes de Contato: lentes de contato so inseridos no olho do usurio, de forma a rastrear o movimento do olho. Apesar de ser bem preciso e captar bem o movimento do olho, o mtodo muito invasivo, gerando incmodos como coceira e piscar excessivo do olho.
Figura 3 Mtodo do Modelo Deformvel [5]

(c) Processamento de Imagens: Mtodos de deteco ativa e passiva, descritos na seo anterior.

4. Rastreamento do Olhar
Como a maioria das aplicaes que utilizam viso computacional, inicialmente necessrio executar uma calibrao no sistema, de forma a parametrizar caractersticas, como distncia, cores, luz, etc. Para o rastreamento do olhar, a distancia em que o usurio est olhando para um dado monitor deve ser estimada a partir da direo do olhar, considerando que o monitor esteja parado. Essa distncia pode ser analisada a partir da posio de apenas um olho, considerando que ambos os olhos estejam no mesmo foco e que no seja necessrio a percepo de profundidade.

5. Aplicaes
Aplicaes que utilizam viso computacional podem ser encontradas em diversas reas, como fsica, biologia, indstria, foras armadas, entre outras. Como ilustrao podemos citar: deteco de terroristas em aeroportos, atravs de reconhecimento de face (biometria), deteco de unidades inimigas ou msseis teleguiados em aplicaes militares, anlise morfolgica de clulas, montadoras de veculos, posicionamento de braos de robs em reparos de submarinos e futebol de robs. Quanto a rea de reconhecimento de imagens, aplicaes baseadas em futebol de robs sempre ganham destaque, devido a possibilidade de realizao de experimentos reais para o desenvolvimento e testes de robs [10]. Algoritmos so criados tendo a necessidade de localizar e detectar elementos do mesmo time de forma precisa e em tempo real, alm do campo, da bola e dos adversrios, determinando e orientando o rob jogador. Estes algoritmos devem sempre considerar ateno especial quanto s cores dos objetos, influenciada pela iluminao do campo, que

4.1. Mtodos
Alguns mtodos surgiram para o rastreamento da direo do olhar de uma pessoa. Entre eles Rehem e Trindade [6] destacam Eletrodos, Lentes de Contato e Processamento de Imagens.

nem sempre uniforme. Com a atual preocupao quanto a interveno da ao humana no ambiente e, consequentemente, sua futura existncia, aplicaes ligadas ao meio ambiente tambm se propagam. Utilizando viso computacional possvel detectar mudanas ambientais em tempo real, analisando imagens de satlites, tomando medidas de forma automtica. possvel tambm analisar eventos especficos, como migrao ou confinamento de aves em situaes de estresse trmico [11], influenciadas pelo aquecimento global. Outra rea que ganha muito destaque a Medicina. Como o olho humano limitado em relao percepo de alguns padres em imagens e na deteco de imagens com rudos ou contraste muito baixo, muitas vezes interpretando-as de forma diferente, o uso de recursos computacionais pode ajudar neste reconhecimento, servindo, por exemplo, como um auxiliar no diagnstico de algumas doenas, evitando um diagnstico impreciso ou equivocado. Dessa forma seria uma espcie de segunda opinio para o mdico, com o intuito de confirmar uma suspeita ou abrir novos horizontes deteco de certa doena. Tais sistemas so conhecidos por Sistemas Computacionais de Apoio ao Diagnstico (CAD), como sistemas de apoio ao diagnstico de fraturas cranianas [12], sistemas de apoio a leses pulmonares [13] e sistemas de apoio a mamografia. Nestes sistemas a viso computacional utilizada para detectar anomalias, caracterizando-as e classificando-as, baseando-se num vasto conjunto de imagens e informaes. Outro fato que contribui para a utilizao da viso computacional que a anlise de uma radiografia torna-se mais precisa quando utilizam-se dois radiologistas para a deteco de anomalias[14]. Dessa forma, poderia ser utilizado um sistema automatizado no lugar de um dos radiologistas, fazendo uma juno do resultado para um diagnstico mais preciso. Outra rea de forte utilizao na indstria, onde a viso computacional pode ser utilizada desde o controle da qualidade de determinado produto fabricado, at em reas mais especficas, como caracterizao e classificao de minrio de ferro [15]. Os sistemas de controle autnomo tambm ganham destaque, como por exemplo os veculos autnomos Remote Agent e o Mars Exploration Rover da Nasa [16]. Outro que ganhou notoriedade foi o sistema de viso computacional Alvinn [17], incorporado numa minivan que percorreu mais de 4500km nos Estados Unidos de forma autnoma em 98% do tempo. H ainda o The

Great Robot Race, campeonato anual de carro autnomos [18].

Figura 5 - Mars Exploration Rover [16].

6. Concluso
Pudemos, nesse trabalho inicial, verificar que Viso Computacional em Inteligncia Artificial um campo vasto, no apenas de trabalho, mas de pesquisa, uma vez que, so vrias reas de atuao que necessitam desse tipo de aplicao, e quase nem todas tm recebido a ateno necessria, nesse caso, podemos citar os sistemas de navegao automtica de veculos, cujas pesquisas ainda no atingiram um nvel de maturao que os habilite no uso domstico e comercial. Conclumos, com isso, que as possibilidades de pesquisa nessa rea so muito promissoras, afinal visvel o avano cada vez maior da tecnologia em nossas vidas.

7. Referncias Bibliogrficas
[1] Ballard, Dana Harry, Computer Vision, PrenticeHall, 1982. [2] David, E.E., Selfridge, O.G., Bell Telephone Laboratories, Murray Hill, N.J. This paper appears in: Proceedings of the IRE Issue Date: May 1962 Volume: 50 Issue:5 On page(s): 1093 - 1101 ISSN: 0096-8390 Digital Object Identifier: 10.1109/JRPROC.1962.288011 Date of Current Version: 22 Janeiro 2007 [3] Winston, P.H.,The Psychology of Computer Vision, McGraw Hill, 1975

[4] Minsky,Marvin, A Framework for Representing Knowledge,MIT-AI Laboratory Memo 306, 1974. [5]http://www.scientificamerican.com/article.cf m?id=visionary-research acessado em18/09/2010 [6] Rehem, Almerindo e Trindade, Fernando H. V.,Tcnicas de Viso Computacional para Rastreamento de Olhar em Vdeos. Publicado em 03/02/2009. Disponvel em:http://almerindo.devin.com.br/ index.php? option=com_content&view=article&id=78%3 Atecnicas-de-computacao-visual-pararastreamento-de-olhar emvideos&catid=43%3Atrabalhos-dealunos&Itemid=86&showall=1 acessado em 18/09/2010 [7] http://www.hermitagemuseum.org/ acessado em 18/09/2010 [8] Yilmaz, A; Javed, O; Shah, M. Object Tracking: A survey. ACM Comput. Surv. v. 38, n. 4, p.13, 2006 [9] Conti, Caroline, Gonzaga, Adilson, Rastreamento dos dedos da mo para interao humano-computador Laboratrio de Viso Computacional (LAVI), Departamento de Engenharia Eltrica, Escola de Engenharia de So Carlos (EESC), Universidade de So Paulo (USP). [10] Bianchi, A.C., Reali-Costa, A.H.O Sistema de Viso Computacional do time Futepoli de futebol de. Anais do Congresso Brasileiro de Automtica 2000. [11] Rodrigues, Valria Cristina, Distribuio especial e bem-estar de aves poedeiras em condies de estresse e conforto trmico utilizando viso computacional e inteligncia artificial Piracicaba 2006 [12] Eric da Silva, Saulo Araujo de Carvalho, Wagner dos Santos C. de Jesus, Alderico Rodrigues de Paula Junior Sistema Especialista de Viso Computacional para diagnstico de Fraturas Cranianas em Imagens de Tomografia Computadorizada. Universidade do Vale do Paraba/Instituto de Pesquisas e Desenvolvimento IP&D [13] Tcnicas de Inteligncia Artificial Aplicadas ao Desenvolvimento de Sistema de Apoio ao Diagnstico de Leses Pulmonares. Paulo Eduardo Ambrsio, Paulo M. de

Azevedo-Marques, Clvis Simo, Centro de Cincias das Imagens e Fsica Mdica (CCIFM), Faculdade de Medicina de Ribeiro Preto (FMRP), Universidade de So Paulo (USP), Brasil Centro Universitrio Baro de Mau (CeUBM), Brasil [14] Vyborny , Carl J. and Giger , Maryellen L., Computer Vision and Artificial Intelligence in Mammography Received September 2, 1 993; accepted after revision November 1 5, 1993. American Roentgen Ray Society [15] Frick, Andr DellAglio, Caracterizao de Minrio de ferro por Viso, 2008 [16] http://marsrovers.jpl.nasa.gov/home/index.html acessado em 20/09/2010 [17] ALVINN: an autonomous land vehicle in a neural network Source Advances in neural information processing systems 1 book contents Pages: 305 - 313 Year of Publication: 1989 ISBN:1-558-60015-9 Author : Dean A. Pomerleau Publisher: Morgan Kaufmann Publishers Inc. San Francisco, CA, USA [18] http://www.pbs.org/wgbh/nova/darpa/ acessado em 18/09/2010 [19]Pinho, Raquel R., Tavares, Joo Manuel R.S.;Correia, Miguel V. F.P.; 2004 [20]Leite, Bruno B. Deteco de Olhos em Imagens com Faces Humanas, Universidade Federal de Campina Grande, 2008 [21]Tivive,F. H. C. and Bouzerdoum,A., A fast neuralbased eye detection system. In Proceedings of International Symposium on Intelligent Signal Processing and Communication Systems, pages 641 644, 2005. [22]Q. Ji, H. Wechsler, A. Duchowski, and M. Flickner. Editorial. Computer Vision and Image Understanding - Special Issue on Eye Detection and Tracking, 98:13, 2005. [23]Bianchi, Reinaldo A.C; Rillo, Ana Helena R.C., Uma Arquitetura de Controle para Sistemas Complexos de Viso Computacional. [24]Bradski;G. R.;Kaehler, A.; Pisarevsky, V.; Learning-based computer vision with intels open source computer vision library. Intel Technology Journal - Compute-Intensive, Highly Parallel Applications and Uses, 2005. [25]T. Morris, P. Blenkhorn, and F. Zaidi. Blink

detection for real-time eye tracking. Journal of Network and Computer Applications, 25:129 143, 2002. [26]D. H. Yoo and M. J. Chung. A novel nonintrusive eye gaze estimation using cross-ratio under large head motion. Computer Vision and Image Understanding- Special Issue on Eye Detection and Tracking, 98:2551, 2005.

Das könnte Ihnen auch gefallen