Sie sind auf Seite 1von 53

Introduo

Inteligncia Artificial
Agentes Inteligentes
Leliane Nunes de Barros
leliane@ime.usp.br
1
O que Inteligncia Artificial?
O estudo e a construo de sistemas
computacionais inteligentes
Nossa definio de sistemas inteligentes:
sistemas que pensam e agem racionalmente
Em IA sistemas inteligentes so vistos
(modelados) como agentes inteligentes

2
Agente em IA
sensores
Percepo (entradas)
ambiente
agente
?
Ao (sadas)

atuadores

Objetivo de IA: escrever o programa do agente


3
Agente
Percebe seu ambiente atravs de sensores e
age sobre o ambiente atravs de atuadores
Agente humano:
Sensores: olhos, ouvidos,
Atuadores: mos, pernas, boca,
Agente robtico:
Sensores: cmeras, detector infra-vermelho
Atuadores: vrios tipos de motores
E um agente de software? 4
Agente em IA
Agente qualquer entidade que:
percebe seu ambiente atravs de sensores (ex:
cmeras, microfone, teclado, contedo de arquivos ou
de BD,...)
age sobre o ambiente atravs de atuadores (ex: garra de
um rob, vdeo, auto-falante, impressora, chamada a
um programa, escrita em arquivos, ...)
Agente

ambiente
percepo
sensores
Relao entre ambiente e agente
ambiente fsico/robs ??
ao
ambiente de software/softbots atuadores

5
Modelagem de agente
Um problema definido atravs de:
percepes, aes, metas e ambiente (e outros agentes)

Tipo de conhecimento que o programa do agente pode conter:


quais so as propriedades relevantes do mundo
como o mundo evolui
como identificar os estados desejveis do mundo
como interpretar suas percepes
quais as conseqncias de suas aes no mundo
como medir o sucesso de suas aes
como avaliar seus prprios conhecimentos
como capturar (aprender) mais conhecimento sobre o ambiente
como colaborar ou competir com outros agentes
etc
6
Medida de Desempenho
Critrio que define o grau de sucesso de um
agente na realizao de uma dada tarefa

a escolha errada da medida de desempenho pode


acarretar num comportamento indesejado

7
Agente autnomo
capacidade de interagir com o ambiente e
extrair informaes sobre o mundo
um agente autnomo possui algum
conhecimento inicial e a abilidade de inferir ou
aprender novos conhecimentos
o comportamento do agente pode depender
de dois fatores: do conhecimento embutido
em seu programa e de sua prpria
experincia
8
Agente onisciente
agente que percebe quando executa aes
agente que conhece todos os efeitos de suas
aes
em certos ambientes impossvel modelar
completamente a realidade
relaxar os critrios de sucesso de um agente ==>
ambientes artificiais

9
Mapeamento ideal entre
sequncias de percepes e aes
mapeamento percepo/ao: tabela das
aes que o agente toma em resposta a cada
possvel sequncia de percepes
cada mapeamento percepo/ao descreve
um tipo diferente de agente
mapeamentos ideais descrevem agentes
ideais
possvel especificar um mapeamento sem
a enumerao exaustiva
10
Funo do agente
sensores Agente
Tabela
ambiente percepes aes
. .
. .

atuadores

Limitaes
Mesmo para problemas simples tabelas muito grandes
ex. xadrez 30^100
Nem sempre possvel, ou por ignorncia ou por
limitao de tempo e espao, construir a tabela 11
A B

PERCEPO AO
[sala, estado]
[A, limpo] Ir para a direita
[A, sujo] Aspirar
[B, limpo] Ir para a esquerda
[B, sujo] Aspirar
[A, limpo], [A, limpo] Ir para direita
[A, limpo], [A, sujo] Aspirar
... ...
[A, limpo], [A, limpo], [A,limpo] Ir para a direita 12
Qual a melhor medida de
desempenho para o aspirador de p?
Maximizar a quantidade de sujeira aspirada
em 8 horas ou
Minimizar a quantidade de sujeira no cho
em 8 horas

13
Agente racional
Agente que para cada seqncia de percepes possvel,
seleciona uma ao que ele espera que maximize sua medida
de desempenho.
Agente que faz a coisa certa enquanto age em seu ambiente
a ao correta aquela que faz o agente obter o mximo de
sucesso
Questo: como e quando avaliar o sucesso do agente?
como: atravs da definio de uma medida de
desempenho objetiva e imposta por um observador
externo
quando: ao longo das tarefas realizadas pelo agente
14
Racionalidade depende de ...

(1 ) da medida de desempenho que define o


sucesso do agente
(2) da sequncia de percepes do agente
(3) do que o agente sabe sobre o ambiente
(4) das aes que o agente pode realizar
Agente racional ideal: para cada sequncia de percepes o
agente escolhe a ao que maximiza seu desempenho baseado
nas informaes de percepo e de seu conhecimento sobre o
mundo
15
Estrutura de agentes inteligentes
IA se preocupa em projetar o
programa do agente: funo que implementa o
mapeamento entre percepo e ao
O programa do agente roda em uma arquitetura:
dispositivo de computao que inclue sensores e
atuadores.
agente = arquitetura + programa
Componentes de especificao de agentes: PEAS
(Performance, Environment, Actuators, Sensors)
16
Ambiente de tarefa:

P - Performance
E - Environment
A - Actuators
S - Sensors

17
Exemplos de ambientes de tarefa
Agente Dados Aes Objetivos Ambiente
perceptivos
Diagnstico Sintomas, Perguntar, realizar Maximizar a sade Paciente,
mdico resultados de ou prescrever do paciente, consultrio,
exames, ... exames, ... minimizar custos Laboratrio, ...
Anlise de Pixels imprimir uma classificar Imagens de
imagens de classificao corretamente satlite
satlite
Tutorial de Palavras Imprimir exerccios, Melhorar o Conjunto de
portugus digitadas sugestes, desempenho do estudantes
correes, ... estudante
Filtro de mensagens Aceitar ou rejeitar Aliviar a carga de Mensagens,
emails mensagens leitura do usurio usurios

Motorista de Imagens, brecar, acelerar, Segurana, Ruas, pedestres,


taxi velocmetro, virar, falar com rapidez, economia, carros, ...
sons passageiro, ... conforto,...
Msico de jazz Sons, seus e de Escolher e tocar Tocar bem, se Msicos,
outros msicos, notas no andamento divertir, agradar pblico, grades
grades de de acordes
acordes
18
Agente: esqueleto geral

funo Agente-Esqueleto (perceo) devolve ao


esttico: memria, a memria do agente sobre o mundo

memria ATUALIZA-MEMRIA (memria, percepo)


ao ESCOLHE-MELHOR-AO (memria)
memria ATUALIZA-MEMRIA (memria, ao)
devolve ao

19
Agente baseado em tabela
funo Agente-olha-tabela (percepo) devolve ao
esttico: percepes, sequncia de percepes
inicialmente vazia
tabela, uma tabela indexada pelas sequncias de
percepes, inicialmente completamente
especificada

append percepo no final da sequncia de percepes


ao LOOCKUP(percepes, tabela)
devolve ao
20
Agente baseado em tabela:
dificuldades
Nmero muito grande de entradas na tabela
Levaria muito tempo para o projetista construir a tabela
Agente sem autonomia: decises compiladas na fase de
projeto. O agente se perde diante de qualquer mudana no
ambiente
Algoritmos de aprendizagem de mquina levariam muito
tempo para atualizar a tabela

Porque um agente que raciocina, em oposio a


olhar uma tabela do tipo percepo/ao, pode evitar
as dificuldades acima? 21
Exemplo:
agente motorista de taxi
Tipo de Percepo Aes Goals Ambiente
agente

Motorista de Cmeras Virar as rodas, Viagem segura, Estradas, trfego


Taxi controlveis, acelerar, freiar, rpida e de outros
velocmetro, conversar com confortvel. veculos,
odmetro, sonar, o passageiro Maximizar lucros. pedestres,
microfone, GPS fregueses.

Medidas de desempenho:
chegar ao local correto
minimizar o gasto de combustvel
minimizar o custo da viajem
minimizar violaes de trnsito
maximizar a segurana e conforto do passageiro
maximizar os lucros 22
Quatro tipos de programas de agentes
Agente Reativo Simples
Agente Reativo baseado em Modelo
Agente Baseado em Meta
Agente Baseado em Utilidade
Agente Aprendiz

autonomia
23
Agentes reativos
Motorista de taxi:
Percepo visual: 50 MB/sec ==> Tabela de
Consulta para uma hora de carro em movimento:
2^60x60x50M entradas
Pores da tabela podem ser sumarizadas
Regra CONDIO-AO
Tambm chamada de regra situao-ao ou
regras de produo ou regras se-ento
Ex.: Se carro-em-frente-freia Ento inicia-freiar
24
Agente reativo simples

Agente Sensores
A
m
Qual o estado
atual do mundo b
i
e
n
Qual seria a melhor t
Regras condio-ao
ao a ser executada e

Atuadores
25
Se carro-da-frente-freia Ento comece-a-freiar
Agente reativo baseado em regras
funo Agente-Reativo-Simples (percepo) devolve ao
esttica: regras, um conjunto de regras condio-ao

estado INTERPRETA-ENTRADA(percepo)
regra CASA-REGRA (estado, regras)
ao AO-DA-REGRA(regra)
devolve ao

Descrio abstrata do estado do


mundo a partir da percepo 26
A B

function Agente-Reativo-Aspirador ([local, status]) return uma ao

if status=Sujo then return Aspira


else if local=A then return Direita
else if local=B then return Esquerda

27
Agente reativo simples baseado
em regras
Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e
eficiente
Mas ainda pode sofrer das mesmas limitaes da tabela

28
Arquiteturas reativas para
robs
Combinam vrios tipos diferentes de
agentes reativos simples (tambm
chamados de diferentes comportamentos
reativos)
Podem realizar tarefas complexas atravs
do comportamento global dos agentes
reativos

29
Arquiteturas reativas para
robs
Surgidas no final dos anos 80.
Fundamentadas em estudos do
comportamento animal (Etologia)
baseada em comportamentos.
Baseadas em processamento paralelo
(vrios comportamentos simultaneamente
ativos).
30
Arquiteturas Reativas

SENSE ACT

SENSE ACT

SENSE ACT

Mecanismo de
coordenao
31
Mecanismos de coordenao
Coordenao Competitiva: a ao resultante num dado
instante selecionada a partir de uma competio entre
os comportamentos ativos (um vence).
Coordenao Cooperativa: a funo de coordenao
produz uma ao resultante para a qual contribuem
todos os comportamentos ativos.

32
Arquitetura REACT

Comportamentos Reativos para


Robs Mveis (LTI Poli)

33
Agentes reativos baseados em
modelo
agentes que possuem percepo parcial do mundo podem
acompanhar as mudanas do mundo atravs de uma
representao interna do estado do mundo
percepes isoladas no fornecem acesso ao estado
completo do mundo
existem estados do mundo diferentes que fornecem a mesma
percepo
o agente necessita manter informao interna para distinguir
estados do mundo aparentemente iguais

34
Necessidade de um modelo
Para imaginar a parte do mundo que no est observvel no
momento o agente mantm um estado interno que depende
do histrico de percepes.
Neste novo agente, para determinar como o mundo est num
determinado momento, ele usa:
informaes perceptuais atuais (como o agente reativo)
seu estado interno
informaes a respeito de como o mundo evolui,
independentemente de suas aes (modelo do mundo)
informaes a respeito do impacto/efeito de suas prprias
aes no mundo e, com isso, atualiza seu estado interno.

35
Agente Reativo baseados em modelo

Estado Sensores
A
Como o mundo muda m
Qual o estado
atual do mundo
b
O que minhas aes i
fazem e
n
Qual seria a melhor
t
Regras condio-ao
ao a ser executada e

Agente Atuadores
36
Agente Reativo com Estado Interno
funo Agente-Reativo-com-Memria (percepo) devolve ao
esttica: estado, descrio interna do estado do mundo
regras, conjunto de regras condio-ao
ao, a ltima ao executada, inicialmente nula

estado ATUALIZA-ESTADO (estado, ao, percepo)


regra CASA-REGRA (estado, regras)
action AO-DA-REGRA(regra)
devolve ao

37
Agente baseado em metas
o mapeamento entre percepes e aes pode ser muito
grande ou pode haver mudanas no ambiente ou na medida
de desempenho do agente, nesse caso, um agente reativo
no funcionaria
Agente baseado em metas mais flexvel pois contm o
conhecimento explcito necessrio para a escolha de aes
Informao da meta: o que acontece se essa ao for
executada?
Pode ser simples quando uma nica ao realiza a meta;
outras vezes pode requerer busca e planejamento (sub-
reas de IA). Pode envolver projeo de aes para prever
se a meta satisfeita.
Limitao: consome tempo; o mundo pode mudar enquanto
se tenta prever o futuro (raciocnio sobre o futuro).
38
Agente baseado em metas
Estado Sensores
A
Como o mundo muda m
Qual o estado atual
do mundo b
O que minhas aes
i
fazem e
Como seria o mundo
depois da ao A n
t
e
Qual seria a melhor
metas ao a ser executada

Agente
Atuadores 39
Agente baseado em utilidade
Funo utilidade: mapeia um estado (ou uma
sequncias de estados) a um nmero real, que
descreve o grau de satisfao do agente com
relao a ao tomada.
Informa se um estado do mundo prefervel
(mais til) que outros. Avalia metas
competitivos e guia a busca.
Jogos caem nessa categoria
Gera comportamento de alta qualidade
40
Agente baseado em utilidade
Sensores
Estado

Como o mundo muda Representao do A


estado atual do mundo m
b
O que minhas aes Como seria o mundo i
fazem depois da ao A e
n
Utilidade Quo feliz eu ficaria em tal estado t
e
Qual seria a melhor
ao a ser executada

Agente Atuadores 41
Ambientes
agentes operam dentro de um ambiente
robs percebem o mundo
simuladores podem fornecer dados ambientais
ambientes possuem grande influncia sobre
o projeto de agentes
existem ambientes padres para avaliao
de agentes

42
Propriedades do ambiente
acessvel versus inacessvel
determinstico versus no-determinstico
esttico versus dinmico
discreto versus contnuo

43
Acessvel versus inacessvel
se o sistema de sensoriamento do agente
d acesso ao estado completo do
ambiente, isto , todos os aspectos
relevantes para a escolha da ao.

44
Determinstico versus no-
determinstico
Determinstico: se o prximo estado do
mundo completamente determinado
pelo estado atual e as aes do agente.
Do ponto de vista do agente, se o
ambiente no accessvel ele no
determinstico

45
Episdico versus no
episdico
Tarefa se divide em sub-tarefas
independentes mais simples. Metas
independentes no requerem
deliberao.

46
Esttico versus dinmico
Dinmico: muda enquanto o agente
raciocina (delibera).
Esttico: o agente no precisa se
preocupar com a passagem de tempo
(alguns tipos de jogos ou problemas de
escalonamento).

47
Discreto versus contnuo
no. limitado de percepes e aes
(definidas e distintas).
Xadrez: ambiente discreto. Possue no. fixo
de possveis movimentos em cada jogada e
nmero fixo de posies para cada pea
Taxi: ambiente continuo com relao
velocidade e localizao

48
Tipos de ambientes
diferentes tipos de ambiente requerem
programas de agente diferentes
Agente complexo: ambiente inacessvel,
dinmico e contnuo.
Mundo real: no-determinstico

49
Tipos de ambientes

Ambiente Acess. Determ. Episoc. Estat. Discreto


Xadrez S S N S S
Motorista N N N N N
de taxi
Diagnstico N N N N N
mdico
Anlise de S S S S N
imagens

50
Programas de ambiente
Relao entre agentes e ambientes
Ambiente simulador (para um ou mais
agentes)
o simulador atualiza o ambiente de acordo
com as aes dos agentes e dinmica do
prprio ambiente
ambiente:
estado inicial
funo de atualizao 51
RUN-ENVIRONMENT
procedure RUN-ENVIRONMENT (state, UPDATE-FN, agents, termination)
inputs state, UPDATE-FN, agents, termination

repeat
for each agent in agents do
PERCEPT[agent] GET-PERCEPT(agent, state)
end
for each agent in agents do
ACTION[agent] PROGRAM[agent](PERCEPT[agent])
end
state UPDATE-FN(actions, agents, state)
until termination(state) 52
Sumrio
Agente: arquitetura + programa do agente;
Agente ideal: escolhe a ao que maximiza sua medida
de desempenho, dada a sequncia de percepo;
Agente autnomo: experincia prpria ao invs de
depender do conhecimento pr-codificado sobre o
ambiente;
Projeto (design) do agente depende do tipo de
informao disponvel e usada no processo de deciso;
O projeto apropriado depende da descrio PEAS do
agente.
53

Das könnte Ihnen auch gefallen