Beruflich Dokumente
Kultur Dokumente
Inteligncia Artificial
Agentes Inteligentes
Leliane Nunes de Barros
leliane@ime.usp.br
1
O que Inteligncia Artificial?
O estudo e a construo de sistemas
computacionais inteligentes
Nossa definio de sistemas inteligentes:
sistemas que pensam e agem racionalmente
Em IA sistemas inteligentes so vistos
(modelados) como agentes inteligentes
2
Agente em IA
sensores
Percepo (entradas)
ambiente
agente
?
Ao (sadas)
atuadores
ambiente
percepo
sensores
Relao entre ambiente e agente
ambiente fsico/robs ??
ao
ambiente de software/softbots atuadores
5
Modelagem de agente
Um problema definido atravs de:
percepes, aes, metas e ambiente (e outros agentes)
7
Agente autnomo
capacidade de interagir com o ambiente e
extrair informaes sobre o mundo
um agente autnomo possui algum
conhecimento inicial e a abilidade de inferir ou
aprender novos conhecimentos
o comportamento do agente pode depender
de dois fatores: do conhecimento embutido
em seu programa e de sua prpria
experincia
8
Agente onisciente
agente que percebe quando executa aes
agente que conhece todos os efeitos de suas
aes
em certos ambientes impossvel modelar
completamente a realidade
relaxar os critrios de sucesso de um agente ==>
ambientes artificiais
9
Mapeamento ideal entre
sequncias de percepes e aes
mapeamento percepo/ao: tabela das
aes que o agente toma em resposta a cada
possvel sequncia de percepes
cada mapeamento percepo/ao descreve
um tipo diferente de agente
mapeamentos ideais descrevem agentes
ideais
possvel especificar um mapeamento sem
a enumerao exaustiva
10
Funo do agente
sensores Agente
Tabela
ambiente percepes aes
. .
. .
atuadores
Limitaes
Mesmo para problemas simples tabelas muito grandes
ex. xadrez 30^100
Nem sempre possvel, ou por ignorncia ou por
limitao de tempo e espao, construir a tabela 11
A B
PERCEPO AO
[sala, estado]
[A, limpo] Ir para a direita
[A, sujo] Aspirar
[B, limpo] Ir para a esquerda
[B, sujo] Aspirar
[A, limpo], [A, limpo] Ir para direita
[A, limpo], [A, sujo] Aspirar
... ...
[A, limpo], [A, limpo], [A,limpo] Ir para a direita 12
Qual a melhor medida de
desempenho para o aspirador de p?
Maximizar a quantidade de sujeira aspirada
em 8 horas ou
Minimizar a quantidade de sujeira no cho
em 8 horas
13
Agente racional
Agente que para cada seqncia de percepes possvel,
seleciona uma ao que ele espera que maximize sua medida
de desempenho.
Agente que faz a coisa certa enquanto age em seu ambiente
a ao correta aquela que faz o agente obter o mximo de
sucesso
Questo: como e quando avaliar o sucesso do agente?
como: atravs da definio de uma medida de
desempenho objetiva e imposta por um observador
externo
quando: ao longo das tarefas realizadas pelo agente
14
Racionalidade depende de ...
P - Performance
E - Environment
A - Actuators
S - Sensors
17
Exemplos de ambientes de tarefa
Agente Dados Aes Objetivos Ambiente
perceptivos
Diagnstico Sintomas, Perguntar, realizar Maximizar a sade Paciente,
mdico resultados de ou prescrever do paciente, consultrio,
exames, ... exames, ... minimizar custos Laboratrio, ...
Anlise de Pixels imprimir uma classificar Imagens de
imagens de classificao corretamente satlite
satlite
Tutorial de Palavras Imprimir exerccios, Melhorar o Conjunto de
portugus digitadas sugestes, desempenho do estudantes
correes, ... estudante
Filtro de mensagens Aceitar ou rejeitar Aliviar a carga de Mensagens,
emails mensagens leitura do usurio usurios
19
Agente baseado em tabela
funo Agente-olha-tabela (percepo) devolve ao
esttico: percepes, sequncia de percepes
inicialmente vazia
tabela, uma tabela indexada pelas sequncias de
percepes, inicialmente completamente
especificada
Medidas de desempenho:
chegar ao local correto
minimizar o gasto de combustvel
minimizar o custo da viajem
minimizar violaes de trnsito
maximizar a segurana e conforto do passageiro
maximizar os lucros 22
Quatro tipos de programas de agentes
Agente Reativo Simples
Agente Reativo baseado em Modelo
Agente Baseado em Meta
Agente Baseado em Utilidade
Agente Aprendiz
autonomia
23
Agentes reativos
Motorista de taxi:
Percepo visual: 50 MB/sec ==> Tabela de
Consulta para uma hora de carro em movimento:
2^60x60x50M entradas
Pores da tabela podem ser sumarizadas
Regra CONDIO-AO
Tambm chamada de regra situao-ao ou
regras de produo ou regras se-ento
Ex.: Se carro-em-frente-freia Ento inicia-freiar
24
Agente reativo simples
Agente Sensores
A
m
Qual o estado
atual do mundo b
i
e
n
Qual seria a melhor t
Regras condio-ao
ao a ser executada e
Atuadores
25
Se carro-da-frente-freia Ento comece-a-freiar
Agente reativo baseado em regras
funo Agente-Reativo-Simples (percepo) devolve ao
esttica: regras, um conjunto de regras condio-ao
estado INTERPRETA-ENTRADA(percepo)
regra CASA-REGRA (estado, regras)
ao AO-DA-REGRA(regra)
devolve ao
27
Agente reativo simples baseado
em regras
Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e
eficiente
Mas ainda pode sofrer das mesmas limitaes da tabela
28
Arquiteturas reativas para
robs
Combinam vrios tipos diferentes de
agentes reativos simples (tambm
chamados de diferentes comportamentos
reativos)
Podem realizar tarefas complexas atravs
do comportamento global dos agentes
reativos
29
Arquiteturas reativas para
robs
Surgidas no final dos anos 80.
Fundamentadas em estudos do
comportamento animal (Etologia)
baseada em comportamentos.
Baseadas em processamento paralelo
(vrios comportamentos simultaneamente
ativos).
30
Arquiteturas Reativas
SENSE ACT
SENSE ACT
SENSE ACT
Mecanismo de
coordenao
31
Mecanismos de coordenao
Coordenao Competitiva: a ao resultante num dado
instante selecionada a partir de uma competio entre
os comportamentos ativos (um vence).
Coordenao Cooperativa: a funo de coordenao
produz uma ao resultante para a qual contribuem
todos os comportamentos ativos.
32
Arquitetura REACT
33
Agentes reativos baseados em
modelo
agentes que possuem percepo parcial do mundo podem
acompanhar as mudanas do mundo atravs de uma
representao interna do estado do mundo
percepes isoladas no fornecem acesso ao estado
completo do mundo
existem estados do mundo diferentes que fornecem a mesma
percepo
o agente necessita manter informao interna para distinguir
estados do mundo aparentemente iguais
34
Necessidade de um modelo
Para imaginar a parte do mundo que no est observvel no
momento o agente mantm um estado interno que depende
do histrico de percepes.
Neste novo agente, para determinar como o mundo est num
determinado momento, ele usa:
informaes perceptuais atuais (como o agente reativo)
seu estado interno
informaes a respeito de como o mundo evolui,
independentemente de suas aes (modelo do mundo)
informaes a respeito do impacto/efeito de suas prprias
aes no mundo e, com isso, atualiza seu estado interno.
35
Agente Reativo baseados em modelo
Estado Sensores
A
Como o mundo muda m
Qual o estado
atual do mundo
b
O que minhas aes i
fazem e
n
Qual seria a melhor
t
Regras condio-ao
ao a ser executada e
Agente Atuadores
36
Agente Reativo com Estado Interno
funo Agente-Reativo-com-Memria (percepo) devolve ao
esttica: estado, descrio interna do estado do mundo
regras, conjunto de regras condio-ao
ao, a ltima ao executada, inicialmente nula
37
Agente baseado em metas
o mapeamento entre percepes e aes pode ser muito
grande ou pode haver mudanas no ambiente ou na medida
de desempenho do agente, nesse caso, um agente reativo
no funcionaria
Agente baseado em metas mais flexvel pois contm o
conhecimento explcito necessrio para a escolha de aes
Informao da meta: o que acontece se essa ao for
executada?
Pode ser simples quando uma nica ao realiza a meta;
outras vezes pode requerer busca e planejamento (sub-
reas de IA). Pode envolver projeo de aes para prever
se a meta satisfeita.
Limitao: consome tempo; o mundo pode mudar enquanto
se tenta prever o futuro (raciocnio sobre o futuro).
38
Agente baseado em metas
Estado Sensores
A
Como o mundo muda m
Qual o estado atual
do mundo b
O que minhas aes
i
fazem e
Como seria o mundo
depois da ao A n
t
e
Qual seria a melhor
metas ao a ser executada
Agente
Atuadores 39
Agente baseado em utilidade
Funo utilidade: mapeia um estado (ou uma
sequncias de estados) a um nmero real, que
descreve o grau de satisfao do agente com
relao a ao tomada.
Informa se um estado do mundo prefervel
(mais til) que outros. Avalia metas
competitivos e guia a busca.
Jogos caem nessa categoria
Gera comportamento de alta qualidade
40
Agente baseado em utilidade
Sensores
Estado
Agente Atuadores 41
Ambientes
agentes operam dentro de um ambiente
robs percebem o mundo
simuladores podem fornecer dados ambientais
ambientes possuem grande influncia sobre
o projeto de agentes
existem ambientes padres para avaliao
de agentes
42
Propriedades do ambiente
acessvel versus inacessvel
determinstico versus no-determinstico
esttico versus dinmico
discreto versus contnuo
43
Acessvel versus inacessvel
se o sistema de sensoriamento do agente
d acesso ao estado completo do
ambiente, isto , todos os aspectos
relevantes para a escolha da ao.
44
Determinstico versus no-
determinstico
Determinstico: se o prximo estado do
mundo completamente determinado
pelo estado atual e as aes do agente.
Do ponto de vista do agente, se o
ambiente no accessvel ele no
determinstico
45
Episdico versus no
episdico
Tarefa se divide em sub-tarefas
independentes mais simples. Metas
independentes no requerem
deliberao.
46
Esttico versus dinmico
Dinmico: muda enquanto o agente
raciocina (delibera).
Esttico: o agente no precisa se
preocupar com a passagem de tempo
(alguns tipos de jogos ou problemas de
escalonamento).
47
Discreto versus contnuo
no. limitado de percepes e aes
(definidas e distintas).
Xadrez: ambiente discreto. Possue no. fixo
de possveis movimentos em cada jogada e
nmero fixo de posies para cada pea
Taxi: ambiente continuo com relao
velocidade e localizao
48
Tipos de ambientes
diferentes tipos de ambiente requerem
programas de agente diferentes
Agente complexo: ambiente inacessvel,
dinmico e contnuo.
Mundo real: no-determinstico
49
Tipos de ambientes
50
Programas de ambiente
Relao entre agentes e ambientes
Ambiente simulador (para um ou mais
agentes)
o simulador atualiza o ambiente de acordo
com as aes dos agentes e dinmica do
prprio ambiente
ambiente:
estado inicial
funo de atualizao 51
RUN-ENVIRONMENT
procedure RUN-ENVIRONMENT (state, UPDATE-FN, agents, termination)
inputs state, UPDATE-FN, agents, termination
repeat
for each agent in agents do
PERCEPT[agent] GET-PERCEPT(agent, state)
end
for each agent in agents do
ACTION[agent] PROGRAM[agent](PERCEPT[agent])
end
state UPDATE-FN(actions, agents, state)
until termination(state) 52
Sumrio
Agente: arquitetura + programa do agente;
Agente ideal: escolhe a ao que maximiza sua medida
de desempenho, dada a sequncia de percepo;
Agente autnomo: experincia prpria ao invs de
depender do conhecimento pr-codificado sobre o
ambiente;
Projeto (design) do agente depende do tipo de
informao disponvel e usada no processo de deciso;
O projeto apropriado depende da descrio PEAS do
agente.
53