Sie sind auf Seite 1von 19

O que é Heurística?

MARCH H. J. ROMANYCIA
Serviços de Informação, Engenharia e Planejamento, Gulf Canada, Calgary, Alta., Canadá T2P
2H7
E
FRANCIs JEFFRY PELLETIER
Departamentos de Filosofia, Ciências da Computação, University of Alberta, Edmonton, Alta.,
Canadá T6G2E5
Recebido em 5 de fevereiro de 1985
Revisão aceita em 29 de março de 1985

A partir de meados da década de 1950 até o presente, a noção de heurística desempenhou um


papel crucial nas descrições dos autores de pesquisas do trabalho. O que geralmente não foi
notado é que diferentes pesquisadores freqüentemente aplicaram o termo a aspectos bastante
diferentes de seus programas. As coisas que seriam chamadas de heurísticas por um
pesquisador não seriam assim chamadas por outros. Isso ocorre porque muitas heurísticas
incorporam uma variedade de características diferentes, e os vários pesquisadores enfatizaram
que diferentes dessas características são essenciais para ser uma heurística. Este artigo
retrocede de qualquer programa de pesquisa específico e investiga a questão de quais coisas,
historicamente, foram consideradas fundamentais para a noção de heurística e quais as quais
estão em conflito com outras pessoas. Depois de analisar as definições anteriores e examinar o
uso atual do termo, é fornecida uma definição de síntese. A esperança é que, com este relato
mais amplo de "heurística" na mão, os pesquisadores podem se beneficiar mais plenamente
com os insights dos outros, mesmo que essas idéias sejam formuladas em um vocabulário um
tanto exótico.
Palavras-chave: heurística, regra geral, algoritmo, resolução de problemas, inteligência artificial,
ciência cognitiva, implicações filosóficas da IA, história da AI.

I – Introdução

Que o conceito de heurística foi, e continua a ser central na IA, é muito conhecido por exigir
documentação. Menos conhecido, talvez, é o fato de que este conceito central sempre teve uma
série de distinto com ele, e ao longo da história de uso em AI diferentes teóricos enfatizaram
diferentes dessas dimensões, de modo que o que uma vez foi pensado para ser um Uma
instância clara de uma heurística seria mais tarde vista como apenas uma instância marginal.
Neste artigo, abordamos a história com o objetivo de provocar esses significados. Apresentamos
quatro dimensões: incerteza de resultado, base em conhecimento incompleto, melhoria de
desempenho e orientação de tomada de decisão. Uma investigação minuciosa é então feita de
cada dimensão para ver exatamente a forma como o conceito é colocado ao longo de cada
dimensão. Finalmente, com toda a análise atrás de nós, concluímos, fornecendo nossa própria
definição de "heurística", que acreditamos resumir com precisão o que a maioria dos teóricos
da IA entende como uma definição sólida necessária, pode ser perguntado.
Nós podemos passar sem um conceito? É verdade que muito poucos dos esforços de
pesquisa que empregam heurísticas realmente oferecem qualquer análise detalhada do
conceito. As heurísticas individuais são descobertas, testadas e modificadas em conjunto com
uma tarefa particular ou subtarefa, mas o conceito de uma heurística em si raramente é
refletido. Em regra, a definição por exemplo é a principal Método de introdução do conceito a
um recém-chegado. Mesmo trabalhos tão notáveis como os de Lenat (1982, 1983a, b) não são
uma exposição cuidadosa dos conceitos relevantes, mas sim uma mistura variada de idéias-
chave hipotéticas e especulações apresentadas como uma conta de sua (e os seus colegas) as
últimas reflexões sobre o assunto. Isso não é uma crítica: obviamente, esse trabalho é de grande
valor quando aborda questões na vanguarda da pesquisa científica. Mas nós pensamos que uma

1
tarefa igualmente valiosa é tentar desvendar a rede de pronunciamentos distintos feitos sobre
o conceito sem referência específica a qualquer projeto de pesquisa em andamento, tanto para
que futuros pesquisadores possam encontrar uma base para a comparação em seu trabalho
como diferenciar-se do trabalho dos outros, e também para que os recém-chegados ao campo
sejam mais capazes de comparativamente julgar o sucesso dos projetos que empregam (o que
seus autores chamam) heurísticas. E também serão mais capazes de avaliar até que ponto esse
sucesso é genuinamente devido às heurísticas, em oposição a qualquer outra técnica.

História
Heuriskein (grego antigo) e heurística (latin): "descobrir, encontrar
Heurético: o ramo da lógica que trata da arte de descoberta ou
invenção. 1838 Sir W. Hamilton Logic App (1866) II, 230. O que trata
dessas condições de conhecimento que são a natureza, não do
próprio pensamento, mas daquilo que pensa sobre tem sido
chamado Heuretic, na medida em que expõe as regras de invenção
ou descoberta. Whewell em Heuristic: 1860 Acc. Wks. (1876) II.
418 Se você não me deixa tratar a Arte da Descoberta como um
tipo de Lógica, devo ter um novo nome para ele, heurístico, por
exemplo. 1877 E. Caird Philos, Kant II 662 as idéias do motivo são
heurísticas não ostensivas: elas nos permitem fazer uma pergunta,
não dar a resposta. [Oxford Dictionary of the English Language].

A bibliografia de Minsky (1961 b) lista Polya (1945) como a primeira referência à


heurística na literatura sobre AI. É claro que a Polya estava preocupada em ensinar aos alunos
da matemática "como pensar", e suas recomendações devem ser vistas nessa luz. Mas é inegável
que a Polya tem uma influência profunda sobre os primeiros pesquisadores da AI: Allen Newell,
por exemplo, era um estudante dele e reivindica (1980, p.1) que "Polya é reconhecida em Al
como a pessoa que colocou heurísticas De volta ao mapa das preocupações intelectuais e
Gelernter (1959; Feigen baum e Feldman, 1963, p.135) aconselha seus leitores a consultar w
Polya para um "tratamento definitivo de heurísticas e descobertas matemáticas. A explicação
de Polya (1945, p. da seguinte forma (Polya capitaliza palavras que são entradas separadas em
seu dicionário)
O objetivo da heurística é estudar os métodos e regras de
descoberta e invenção. Alguns dos traços desse estudo podem ser
encontrados pelos comentaristas de Euclid; Uma passagem do
PAPPUS é particularmente interessante a este respeito. As
tentativas mais famosas para construir um sistema de heurística
são devidas a DESCARTES grandes matemáticos e filósofos. Bernard
BOLZANO apresentou uma nota detalhada sobre a heurística. O
presente folheto é uma tentativa de reviver a heurística de forma
moderna e modesta.
Veja Heurística MODERNA.
como um adjetivo, significa "servir para descobrir”.

Polya é bastante definida em sua visão de que as heurísticas não são infalíveis e que
devem ser contrastadas com o raciocínio dedutivo.
O raciocínio heurístico é um raciocínio não considerado tão final e
rigoroso quanto único e plausível, cujo objetivo é a solução do
problema atual. Muitas vezes somos obrigados a usar o raciocínio
heurístico. Devemos alcançar uma certeza completa quando
teremos obtido a solução completa, mas antes de obter certeza
devemos nos contentar com uma suposição mais ou menos

2
plausível. Podemos precisar do provisório antes de alcançar a final.
Precisamos de raciocínio heurístico quando construímos uma prova
rigorosa, pois precisamos de andaimes quando erigimos um
edifício. O raciocínio heurístico é muitas vezes baseado na indução
ou na analogia. Ipp. 112, l13]
É importante a descoberta da RAZÃO HEURISTA provisória,
meramente plausível, na descoberta da solução, mas você não
deve aceitar uma prova que deve adivinhar, mas também EXAMINE
SEU SUPORTE (p. 132).
Também é enfatizado que inf RULES OF DISCOVERY (regras da
descoberta) são infalíveis e estão além do alcance do campo de
pesquisa sério. [Ip. 132]

Então, Polya vê-se como revivendo "heurística” no estudo de métodos e regras de


descoberta. Ele deseja fazer isso de uma forma moderna". Para explicar sua versão moderna,
ele diz que
os esforços heurísticos modernos são para entender o processo de
resolução de problemas, especialmente nas típicas operações
mentais usadas no processo.
... uma lista de operações mentais normalmente úteis na resolução
de problemas inclui perguntas e sugestões particulares [like]: O
QUE É DESCONHECIDO? É POSSÍVEL SATISFAZER A CONDIÇÃO?
PODE DESENHAR UMA FIGURA? PODE USAR O RESULTADO? Volte
para as definições PODERIA RESTAURAR O PROBLEMA? (pp. 129-
1311).
A heurística discute o comportamento humano em face dos
problemas: isso tem estado na moda. Provavelmente, desde o
início da sociedade humana, e a quinta essência de tal discussão
antiga parece ser preservada (WISDOMOF PROVERBS.ip. 132)

Portanto, parafrasear Polya, a heurística é uma ciência do comportamento de


resolução de problemas que se concentra em operações mentais provisórias, úteis, mas
falíveis, para descobrir soluções. O conceito de heurística começou a aparecer na literatura de
IA da década de 1950 e era bem conhecido no início da década de 1960. Esta era uma era de
fornecer definições, onde Al estava lutando com o termo e tentando absorvê-lo nos trabalhos
de quadros atuais. Todos os que empregaram o termo durante este período pareciam obrigados
a dar a sua própria definição. Era uma coisa correta a fazer por sua parte porque a definição de
dicionário comum do termo "encontrar/descobrir (to find out, Discovery) " não estava sendo
seguida. Agora vamos fornecer algumas definições desta época. Escolhemos a nossa amostra
da antologia representativa dessa época, Feigenbaum e Feldman (1963). Nós poderíamos ter
feito o contrário, mas todas as vertentes que desejamos retirar estão presentes aí.
Newell et al (Feigenbaum e Feldman 1963, p. 114, veja também Newell 1980, p. 17)
foram os primeiros a usar heurística como um substantivo que significa processo heurístico. Eles
afirmam estar usando heurística aqui de acordo com a definição padrão do dicionário "servindo
para descobrir ou descobrir", mas também se opõem ao seu significado para o algoritmo. A
pesquisa relatada aqui é destinada a compreender os processos complexos (heurísticas) que são
efetivos em Solução de problemas.

Portanto, não nos interessamos por métodos que garantam


soluções, mas que exigem grandes quantidades de computação.
Em vez disso, desejamos entender como um matemático, por
exemplo, é capaz de provar um teorema, mesmo que ele não saiba

3
quando ele começa como, ou se, ele vai ter sucesso. Feigenbaum e
Feldman 1963, p. 109].

Uma propriedade muito especial e valiosa que um gerador de


soluções às vezes tem é garantia de que o problema tenha uma
solução, o gerador, mais cedo ou mais tarde, produzirá. Chamamos
um processo que tenha esta propriedade para algum problema, um
algoritmo para aquele problema.

Um processo que pode resolver um determinado problema, mas


não oferece garantias de fazê-lo, é chamado de heurística para esse
problema [Feigenbaum e Feldman 1963, p. 114].

Um deles se reúne com isso que eles acreditam que existem apenas duas maneiras de
resolver um problema: um por um seguidor insensatamente de um algoritmo de segurança, o
outro empregando processos complexos (heurísticas) que são genuinamente criativos na
exploração de caminhos para uma solução. O conhecimento prévio do sucesso ou da falha
parece ser a maneira principal de distinguir esses dois métodos de resolução de problemas. A
eficiência de qualquer dos métodos não parece ser uma preocupação fundamental. No papel do
programa de geometria de Gelernter (1959), encontramos uma definição que lembra Polya. Um
método heurístico é um procedimento provisório e plausível, cujo objetivo é descobrir a solução
de um problema específico em mãos [Feldman 1963, p. 135]

Gelernter enfatiza que a necessidade de evitar a busca exaustiva do algoritmo é a razão


para a introdução de heurísticas em uma situação problemática. Gelernter também é um dos
fora que as heurísticas funcionam efetivamente eliminando opções de um conjunto impraticável
de possibilidades. Uma heurística é muito sensata, um filtro interposto entre o gerador da
solução e a avaliação da solução [Feigenbaum e Feldman 1963, p. 137l

Esta observação é digna de nota como um exemplo de algo comum em Al: um programa
de pesquisador ou uma teoria do problema que influencia sua concepção de heurística. Polya e
Newell, falou de um matemático para um e, mas aqui, postulamos um "avaliador de solução"
formal de "gerador de solução". Estes têm equivalentes reais no programa de computador de
Gelernter, mas duvidamos se existem alguns componentes processuais identificáveis nos
processos de pensamento de um matemático. Na discussão de Tonge (1960) de seu programa
heurístico para minimizar o número de trabalhadores necessários em uma linha de montagem,
o elemento não garantido desempenha um papel menor na definição de heurística e o elemento
de filtragem não está presente. Ele enfatiza eficiência e redução de esforço para alcançar uma
solução satisfatória. Sua definição também mostra a tendência de abstrair o significado de
heurística longe do "processo" e muitas vezes a parte de seu programa com uma função
identificável. Ele também fala de heurísticas como fornecendo "atalhos e como empregando"
sim. Além disso, compara vários métodos algorítmicos que teoricamente garantem soluções.
Sua definição oficial é: Nós, por heurísticas, nos referimos a princípios ou dispositivos que
contribuem com a média, para reduzir a busca na atividade de resolução de problemas. As
admoestações "desenham um diagrama" em geometria. "reduzir tudo para senos e cosenos"
na prova de identidade trigonométrica, ou sempre fazer uma verificação. pode ser um
companheiro no xadrez, são todas as heurísticas familiares. Os procedimentos de resolução
de problemas heurísticos são procedimentos organizados em torno de dispositivos de
economia de esforços. Um programa heurístico é a mecanização em um computador digital de
algum procedimento heurístico [Feigenbaum e Feldman, 1963. p. 172l

4
Minsk (1961a) foi um dos primeiros a usar heurística no contexto da "busca" através de
um grande "espaço problemático". Falando em xadrez, o que Shannon estimou ter 10 caminhos
através da árvore do jogo, ele diz (Feigenbaum e Feldman 1963 p.) “Nós precisamos descobrir
quais os resultados incompletos que podem ser usados para mais eficiência. Sua definição
oficial, para tornar a pesquisa mais parecida com a de Tonge , eles enfatizam a eficiência ao invés
de uma oposição aos algoritmos usados aqui e amplamente nos meios relacionados aos nomes
também melhorando o desempenho de resolução de problemas, como um aprimoramento do
usado em relação a qualquer método ou truque usado para a eficiência de uma solução de
problemas sistema.

Um "programa heurístico" para ser considerado bem sucedido, deve funcionar bem em uma
variedade de problemas, e muitas vezes pode ser desculpado se ele falhar em alguns, muitas
vezes achamos que vale a pena apresentar um método heurístico que ocasiona falhas
ocasionais, se houver uma melhoria geral no desempenho. Mas os métodos imperfeitos não são
necessariamente heurísticos nem vice-versa. Por isso, "heurística" não deve ser considerada
como oposta à "infalível". causou alguma confusão na literatura. [Feigenbaum e Feldman 1963
p 408.

Aqui, Minsky está dizendo que um algoritmo infalível poderia ser chamado de heurística, desde
que mostre uma melhora na eficiência em relação a algum outro método. Ele também está
enfatizando como Polya, que uma heurística deve ser aplicável a mais do que apenas um
conjunto restrito de problemas. Um método de economia de esforço que funcionou em apenas
um problema seria mais propriamente chamado de ferramenta específica em vez de um método
heurístico. A descrição de lagle (1963) de seu programa para resolver problemas de integração
em matemática usa heurística principalmente para defender qualquer uma classe de regras que
transforme um problema em um ou mais subproblemas. Exemplos de tais regras seriam "tentar
a integração por parte" substituição ". Distingue algoritmos de heurística, sendo esta última
definida como segue.

Uma transformação de um objetivo é chamada de heurística quando, embora seja aplicável e


plausível, existe um risco significativo de que ele O próximo passo para o uso certo (Feigenbaum
e Feldman, 1963, pág. 197), em desacordo com a definição de forma, onde a heurística
realmente toma a decisão em oposição a ser uma regra passiva escolhida pelo executivo:
embora muitos autores tenham dado muitos as definições neste método heurístico (ou
simplesmente uma heurística) são um método que ajuda na descoberta da solução de um
problema, fazendo suposições plausíveis, mas falíveis, sobre o que é melhor fazer a seguir
lFeigenbaum e Feldman 1963, p. vamos voltar a discutir isso tipo de confusão mais tarde.

Finalmente, chegamos à definição de Feigenbaum e Feldman (1963), os editores de


Computadores e Pensamentos A heurísticos (regras heurísticas, método heurístico) são uma
regra de tegy, truque, simplificação ou qualquer outro tipo de dispositivo que limite
drasticamente a busca de soluções em grandes espaços problemáticos. As heurísticas não
garantem soluções ótimas; na verdade, eles garantem qualquer solução; Tudo o que pode ser
dito para uma utilidade é que oferece soluções que são suficientemente boas o tempo todo.
[Feigenbaum e Feldman 1963, p. 6.

Esta definição combina muitos dos recursos presentes nas outras definições que discutimos.
Contém os elementos de falta de garantia, de dispositivo arbitrário, de redução de esforço, de
eliminação de opções e de solução satisfatória. Seguindo sua definição, Feigenbaum e Feldman
também trazem um novo elemento, o da dependência do domínio. Algumas heurísticas são de
propósito muito especial e específicas de domínio, como heurísticas de xadrez, enquanto outras,
como "análise de finalização de meios" e "planejamento", se aplicam a uma classe de domínios

5
de problemas muito mais ampla. Isso nos leva ao fim do que poderíamos chamar de "período
de AI inicial". À medida que a percebemos, nesse período os pesquisadores tentaram com o
conceito de heurística e sentiram-se compelidos a fornecer aos leitores definições de termo.
Após este período, os pesquisadores já não sentiram que era um conceito tão novo que exigia
qualquer explicação ou justificativa especial, exceto talvez quando conversasse com o público
leigo. Já se pode ver, apenas a partir dos exemplos citados, como o conceito de heurística foi
traduzido desde a sua introdução original à comunidade AI via Polya.

Polya usou "heurística" principalmente no contexto da lógica ou psicologia da descoberta.


Seus métodos heurísticos eram para aplicar processos de raciocínio úteis, como fazer
perguntas, desenhar diagramas, adivinhar, analisar o problema de uma perspectiva diferente,
etc. De alguma forma, esses métodos direcionam a mente para ver uma solução. 'Discovery'
é usado aqui muito muito no sentido da invenção; Presume uma espécie de prospecção
exploratória antes da descoberta. No final deste início da AI, a heurística foi reformulada para
a paisagem Al. Ao invés de uma vaga tentativa psicológica de uma solução, nos apresentamos a
noção de uma exploração guiada ao longo de caminhos em uma estrutura ou espaço formal de
resolução de problemas. Por esta razão, a "descoberta" é usada menos no sentido de explorar
um caminho de solução anteriormente não transitado do que no sentido de encontrar um
caminho bem sucedido entre aqueles já especificamente ou implicitamente predefinidos na
estrutura predefinida de espaço de estados. Outra ressalva é que, em vez de ter métodos
heurísticos derivados da psicologia geral de resolução de problemas e aplicáveis a domínios
específicos, como a matemática, nós temos domínios de problemas específicos que dão origem
a sua própria marca de métodos heurísticos. De fato, em Al, toda a força motriz para a
introdução de heurísticas e a descoberta de novas é melhorar o desempenho de um programa
em um determinado domínio problemático. Em contraste, para Polya o motivo para introduzir
heurísticas era fazer com que alunos de matemática aprendessem como pensar, eu. para
adquirir o tipo de psicologia necessário para fazer uma boa matemática. É claro que há uma
razão para essa diferença. Em Al, as heurísticas são muitas vezes decorrentes da insatisfação
com um algoritmo exaustivo, enquanto que as técnicas heurísticas de Polya são aplicadas
desde o início ao investigar um problema totalmente desconhecido. e sua aplicação pode até
resultar na descoberta de uma técnica de solução algorítmica. Por esse motivo, o "algoritmo"
e o "heurístico" não se opõem à Polya, eles não estão na mesma categoria de ferramentas. Polya
acredita que simplesmente não existem algoritmos para investigar problemas totalmente
novos, este é o domínio das heurísticas. Algoritmos, se lá Seja o primeiro, venha depois de ter
visto uma maneira de resolver o problema e analisamos a solução. A análise e a invenção do
algoritmo são outro trabalho para a década de 1960, após o início da Alera de definições de
audição, houve outro uso de heurística introduzido como parte da frase "busca heurística". Tão
popular, esse uso tornou-se que alguns autores, e g., Bam e Feigenbaum (1981), preferem a
mera "heurística" e outros não usam "heurística em nenhum outro" Formato. e g .. Winston
(1977).

De acordo com Newell e Simon (1972, p. 888), em 1965, Emst e Newell introduziram o conceito
de "pesquisa heurística que, em si, era simplesmente uma tentativa de formular o que parecia
comum a muitos dos primeiros programas de inteligência artificial Mais tarde, Ernst e Newell
escreveram PESQUISA HEURÍSTICA. Esta pesquisa aborda a construção de um solucionador de
problemas geral por meio de um paradigma geral de resolução de problemas: busca heurística
(Newell e Ernst, 1965). Em forma simplificada, o paradigma de pesquisa heurística postula
objetos e operadores, onde um operador pode ser aplicado a um objeto para produzir um novo
objeto ou um sinal que indica capacidade inativa. Os operadores são regras para gerar objetos
e, assim, definir uma árvore de objetos. O problema está procurando um método para resolver
um heurístico - busque a árvore, definida pela situação inicial e os operadores, para um
caminho para a situação desejada. (1969, pp. 247 248)

6
Como observa Barr e Feigenbaum (1981, p. 30), "heurística" parece ser Um papel estranho aqui.
Se a pesquisa heurística é apenas pesquisar através de uma árvore, então mesmo a busca cega
é uma forma de pesquisa heurística. Hoje em dia, é mais comum chamar a "pesquisa de espaço
de estado" de Emst e Newell e reservar uma pesquisa heurística para pesquisa através de um
espaço de estados que se baseie em processos de decisão heurísticos. Em outras palavras,
como usado hoje em dia, não envolve um novo uso aleatório de heurística. Para exemplos do
modem, veja Bam e Feigenbaum 1981, pp. 28-30). Winston (1977, p. 122ff e Nilsson (1980, p.
72).)
Após a era Al precoce, existem poucas definições, exceto quando os autores estão escrevendo
para um público principalmente leigo. Nestes casos, o termo é tipicamente definido de forma
muito superficial, de modo a incluir todas as definições padrão. Amostras destes são métodos
heurísticos, ou seja, características que melhoram a eficiência de resolução de problemas de
sistemas ou o alcance da capacidade. Estes variam de truques ad hoc para tipos específicos de
problemas a princípios muito gerais de administração eficiente e alocação de recursos. Minsky
1968, p. 81

Uma heurística é uma regra geral. estratégia, método ou truque para melhorar a eficiência de
um sistema que busca descobrir soluções de problemas complexos. ISLAGLE 1971. p. 3J
programação heurística "refere-se a programas de computador que empregam
procedimentos não necessariamente (mas possivelmente se mostraram corretos, mas que
parecem ser plausíveis. A maioria dos problemas que foram considerados pelos pesquisadores
do Al são do tipo em que ninguém conhece procedimentos práticos e completamente corretos
para aprimorá-los, uma certa habilidade no uso de intuições e procedimentos de busca
parcialmente verificados é necessária para projetar programas que possam resolvê-los.

Por meio de uma heurística, entende-se um nule de humb que geralmente reduz o trabalho
necessário para obter um solução para um problema. Jackson 1974, pág. 95
O programa de análise de cenários de Guzman usa um conjunto de regras de raciocínio informal
(às vezes chamadas de heurísticas) que foram derivadas por um método empírico e
experimental. Embora os programas resultantes possam não ser explicáveis em termos de
profundidade A teoria da instrução que eles realizam adequadamente na maioria das situações
e, portanto, em um sentido muito prático, eles resolvem o problema Raph ael 1976, p, 237, 238
A heurística é um estratagema para imputar a execução de um programa de inteligência arti-
cical. A programação heurística que se aproxima da inteligência artificial é talvez a mais popular
e ativa hoje. Isso contrasta com outra abordagem importante a simulação do humano, embora
n esta abordagem o objetivo é mais compreender e usar as características da inteligência
humana do que aplicar qualquer técnica que funcione. ISampson 1976. p 128

Uma heurística é um método que direciona o pensamento ao longo dos caminhos mais
importantes para levar ao objetivo e as avenidas promissoras deixadas inexploradas. Boden
1977. P. 347j Uma distinção importante subjacente a grande parte do trabalho em Al é que entre
dois tipos de métodos usados para resolver problemas. Um método é chamado algorítmico, o
outro, heurístico. Algoritmos são comumente definidos como procedimentos que garantem
uma solução dada tipo de problema. as heurísticas são conjuntos de estratégias de regras
empíricas que operam, na verdade, uma regra de ouro, lSolso 1979. p, 436) As heurísticas,
como todos os Aler sabem, são regras básicas e conhecimentos, ful (embora não garantidos)
para fazer vários seleções e avaliações, (Newe 980, p. 16).

As heurísticas são critérios, métodos ou princípios para decidir quais dentre vários cursos de
ação alternativos prometem ser os mais eficazes para alcançar algum objetivo. Eles
representam compromissos entre dois requisitos, a necessidade de tornar os critérios sach

7
simples e, ao mesmo tempo. o desejo vê-los discriminar corretamente entre boas e más escolhas
Pearl 1984. p. 3]

As interpretações emergentes, que, no entanto, existem novelas de Nome parecem ser "idéias
de segunda geração" sobre o que as verdadeiras nunca são claramente definidas e, infelizmente,
explicadas. Por exemplo, Hofstadter (19 tem uma visão heurística como "experiência
comprimida" ou curso, as regras para a fórmula dos planos de xadrez necessitam
necessariamente de heurísticas que são, em certo sentido, "natte versio de olhar para frente".
E o equivalente a muitos jogos " A experiência de olhar para a frente é "espremido, o que,
aparentemente, não envolve olhar para a frente. Em certo sentido, este é um jogo de palavras
de Korfhage. Mas se o conhecimento" achatado "dar respostas, de forma mais eficiente e eficaz
mesmo se a ocasião (pág. 604). Outro exemplo de uma apresentação apresentada de forma
acentuada vem dos procedimentos de interpretação de Albus (1981) para decidir quais
estratégias de pesquisa e quais funções de avaliação se aplicam em que situações são chamadas
heurísticas.
As heurísticas são essencialmente um conjunto de regras que residem hierarchica acima da
seleção de movimento e processo de arco de avaliação. Ele seleciona as regras, i e p. 284: veja
também pp. 222, 223 E, finalmente, Lenat (1982) parece ter uma visão de heurista Os aspectos
semelhantes à Heurística de Hofstadter são retrospectivos: são nuggets de sabedoria que, se
apenas tivéssemos tido antes, nos levaram ao nosso estado presente. Isso significa que alguns
dos cegos que todos teriam sido algumas das descobertas poderosas faria mais cedo, lp. 223 É
nossa convicção de que definições como essas últimas, o suficiente, três não são populares na
comunidade geral de Al para garantir que incluímos como parte de uma definição abrangente
de "heurística". Esta situação pode mudar com o tempo de Até agora, acabamos de revisar
algumas das definições heurísticas que surgiram nos últimos 40 anos. vimos que pesquisadores
diferentes enfatizaram propriedades diferentes como relevantes para saber se uma heurística
está sendo empregada, e vimos uma mudança na ênfase no conceito. Gostaríamos agora de
distinguir mais cuidadosamente as "dimensões do significado" (mas inter-relacionadas) que o
conceito incorpora. Podemos distinguir quatro dimensões ao longo das quais vários
pesquisadores julgaram se um processo é uma incerteza de resultado, base em conhecimento
incompleto, melhoria do desempenho e orientação de tomada de decisão.

O papel da incerteza: heurísticas versus algoritmos

Vimos como, em muitas das definições, se opuseram a termos como heurística "tem"
algorítmico "," garantido e "completo". Vamos argumentar nesta seção que a idéia central
subjacente a essas definições é que as heurísticas existem em um contexto de incerteza
subjetiva quanto ao sucesso de sua aplicação. Vamos explicar em que aspectos esses, como
Minsky, que pensam que as heurísticas são perfeitamente compatíveis com os algoritmos são
corretos, mesmo que exista um conflito genuíno entre essas duas noções. Na ilustração,
devemos dar o sentido de que, mesmo a força bruta, o Algoritmo do Museu Britânico é um
heuristi central para essa propriedade-chave da incerteza e, como vimos presente nas primeiras
adoções do conceito de heurística por Al é a noção de algoritmo . "Algoritmo" tem muitos
significados, embora seja duvidoso que a ambiguidade tenha causado qualquer desacordo sobre
a definição, se definimos o algoritmo como meramente "um conjunto de regras formalmente
definidas e interpretadas de forma única que nos dizem, momento a momento, precisamente
como se comportar" (Minsky 1968, pág. 106), então qualquer procedimento para fazer as
decisões são algorítmicas e, portanto, todas as heurísticas implementadas no computador, ou
formuladas de outra forma estritamente, são algorítmicas. Usamos "algoritmo de procedimento
o significa esse tipo de algoritmo. No entanto, quando a" heurística "foi considerada oposta ao
algoritmo algorítmico, sempre teve muito mais forte sentido que inclui um elemento de garantia
sobre a busca de uma solução Korfhage (1976, página 48), seguindo o uso normal, caracteriza

8
um algoritmo da seguinte maneira: 1. A aplicação do algoritmo a uma entrada específica da
descrição do problema é uma sequência finita de ações 2 . A sequência de ações tem uma ação
inicial única. 3. Cada ação na seqüência possui um sucessor único. 4. A seqüência termina com
uma solução para o problema ou uma afirmação O problema é insolúvel. Se a última restrição
for muito forte, podemos definir "semi em um algoritmo numbe finito" da seguinte forma: "um
método que terá passos se o problema representado tiver uma solução, mas não irá parar
necessariamente se não houver solução". Para alguns problemas, sempre há uma solução, por
exemplo, adicionando dois inteiros, e essa distinção não se aplica. Nós chamamos esses
algoritmos, "algoritmos simples" heurísticos "muitas vezes se opuseram a alguma noção de
algoritmo, embora não seja universalmente b todos os autores. Newell eta Feigenbaum e
Feldman 1963, p. 4) opostos o sem (Feigenbaum e Feldman 1963, algoritmos, enquanto Tonge
p. 172) e slagde I963, p, 194) opuseram-se aos algoritmos simples Feigenbaum e Feldman (1963,
p.6) implicaram um contraste com algoritmos simples e também pareciam dizer que não há
problema e Sampson negou aqui. Vimos que Minsky, Raphae qualquer oposição com os
algoritmos e que Nilsson (1980, p. 72) e Jackson (1974, p. 95) negaram que as heurísticas
precisam de sacrifício uma garantia de encontrar uma solução (embora nem tenha dito nada
sobre começar com uma garantia, ou o que acontece se achar que a heurística puta garante
encontrar uma solução). Boden (1977, pp. 347, 348) argumentou, por um lado, que não há
oposição com algoritmo simples ou com semi-algoritmo , mas, por outro lado, existe uma
contraste, na medida em que os programas heurísticos adiam a tomada de decisão, enquanto
as decisões são precisamente especificadas antes que os algoritmos exigem mão. Dada essa
mistura de reivindicações conflitantes, simplesmente poderia fazer como Barr e Feigenbaum
(1981, pp. 28, 29), ou seja, é um ambiguo prazo e isso para manter as coisas claras, um heuris
está usando tal e tal definição. Esta resposta é muitas razões para não ser adequada, no entanto,
porque eving que existe uma definição correta. Estes são os únicos trabalhos de origem do
termo na Polie A erature; o fato de que os autores de Al colocaram tanto peso teorético neste
termo específico, e o fato de que Alautores não tenham dado suas definições com o ar de "por
conveniência use o ...
Dada esta combinação de afirmações conflitantes, simplesmente poderia fazer-se como Barr e
Feigenbaum (1981, pp. 28, 29), a saber, afirmar que a heurística é um termo ambíguo e que,
para manter as coisas claras, uma delas usará tal e tal definição. Esta resposta é inadequada, no
entanto, porque ignora várias razões para acreditar que existe uma definição correta. Estas são
a origem única do termo na literatura Al, ou seja, o trabalho de Polya; o fato de que os autores
de Al colocaram tanto peso teórico neste termo específico; e o fato de que os autores de Al não
deram suas definições com o ar de "por conveniência eu uso o termo, mas com a impressão de
que eles capturaram o que é realmente importante e comum a esse ramo de pesquisa, ou seja,
o uso de regras que salvam esforço, ou fornecer soluções satisfatórias, ou não tem garantia, ou
o que você tem. Portanto, acreditamos que uma análise adequada da heurística deve resultar
em uma definição, e essa definição deve mostrar uma apreciação adequada para todas as idéias
que foram associadas a e deve ser capaz de explicar qualquer incompatibilidade entre essas
ideias.

Como isso é possível com todas as opiniões conflitantes sobre esse contraste com os algoritmos?
Para responder a isso, devemos chegar ao núcleo da idéia de algoritmo e ver exatamente onde
as opiniões conflitantes estão focadas. Um algoritmo presume um problema e um procedimento
passo a passo preciso que soluciona o problema ou o mostra insolúvel. Por isso, se tivermos um
problema e temos um algoritmo para esse problema, então, por assim dizer, não devemos ter
nenhum problema. Então, por que não eram Newe et al. satisfeito com o British Museum
Algorithm? Porque, obviamente, o problema real não foi resolvido, nomeadamente, fornecer
uma solução dentro de certos limites de código. Tais recursos incluem tempo e tipo sor, e o
esforço para lembrar como usar esse algoritmo. Então, o problema real era muito mais
complicado do que apenas o de fornecer provas - era, fornecer uma prova dentro dos limites de

9
recursos. E para esse problema, o Algoritmo do Museu Britânico não forneceu uma solução não
era um algoritmo. Uma vez que vemos que os problemas reais são os "problemas praticos,
podemos ver como resolver o algoritmo versus conflito: a heurística e os algoritmos
normalmente não se opõem porque eles geralmente aplicam-se a diferentes classes de
problemas. As heurísticas aplicam-se ao problema real ou prático, enquanto que os algoritmos
aplicam-se ao problema abstrato "teorético" de qualquer problema. As heurísticas nunca foram
significativas para os casos em que (a) o algoritmo fornece uma fraca solução para o problema
prático e (b) o algoritmo afirma garantir a resolução do problema prático. Um como o conjunto
de suporte como empregado pelos provadores de teor algorítmicos para o problema de
abstração de provar teoremas, mas, por melhor que o algoritmo do Museu Britânico para
resolvendo o verdadeiro problema de provar teoremas em um tempo razoável, e porque eu não
reivindico infalibilidade ao fazer isso, também pode se qualificar como um heur istic. Do mesmo
modo, o algoritmo A * é heurístico porque não é praticamente otimizado para encontrar
caminhos otimizados no espaço, mesmo que no tempo encontre um caminho ótimo. Portanto,
Minsky e outros estavam certos ao dizer que os algorítimos práticos podem ser heurísticos. é,
ou claro, uma razão pela qual os autores naturalmente escolheram algoritmos para contrastar
com as heurísticas. Isso ocorre porque a solução de garantia é baseada no elemento e na tomada
de decisões assegurada, o que é antitético à noção de heurística. Agle estava certo quando em
sua definição de heirismo ele enfatizou a propriedade de não saber se a próxima ação é a melhor
coisa a fazer agora. Se soubéssemos disso, saibamos que nosso programa iria tomar as melhores
ações possíveis a cada passo, então, claramente, nosso programa não seria um heurístico. As
heurísticas são, entre outras coisas, regras que oferecem compromissos: um pequeno custo
(muitas vezes, esta é a omissão de uma garantia) na esperança de uma maior recompensa. Mas
se em cada passo sabemos que o nosso programa está funcionando otimamente, então as
compensações e as expressões de esperança estariam fora de questão, por isso não poderia ser
um programa heurístico. Claro que isso não significa que uma estratégia ótima não pode ser
uma heurística para nós, só que, se a conhecemos, seja otimizada, não pode ser uma heurística.
Se tal heurística fosse mais tarde descoberta como ideal, então a única desculpa para continuar
a chamá-lo de heurística seria uma baseada no hábito, pois até então seu caráter inteiro teria
mudado para nós. Nossa discussão estabeleceu um limite claro entre o melhor e estratégias não
ótimas quanto ao uso da heurística. Acreditamos que isso seja suficiente para estabelecer uma
Nós, portanto, afirmamos que as heurísticas são uma tomada de decisão e uma propriedade de
definição não são compatíveis com o conhecimento de que esta é uma propriedade essencial
das heurísticas. heurísticas são Note que esta propriedade equivale a dizer esse problema.
Pensado para garantir uma solução para o significado prático, a otimidade é um critério. No
entanto, por ser menos incerto o elemento de praticidade. da otimização inclui obrigar-nos a
assumir o contexto prático, enquanto a garantia da solução arrisca a confusão da solução
problemática e da solução prática. É nossa alegação que essa confusão é responsável pelas
diferentes opiniões sobre se um algoritmo pode ser heurístico são apenas opostas aos
algoritmos que garantem fornecer uma solução prática para um problema; são opostos aos
quais meramente garantem uma solução, não garantem que esta solução seja praticamente
realizável. Em suma, podemos concluir que esta propriedade das heurística.

A incerteza também pode explicar parcialmente outras idéias que muitas vezes se opõem a
heurísticas como "busca exaustiva" e "análise completa". Se somos completos e completos,
temos certeza de uma resposta. O epítome da minuciosidade é o algoritmo de estilo do Museu
Britânico, que busca sistematicamente, mas indiscriminadamente, em toda parte, uma solução.
Esta é uma das razões pelas quais os algoritmos do tipo British Museum são tão frequentemente
contrastados com métodos heurísticos incompletos, inconstantes e incompletos. Por outro lado,
os algoritmos do British Museum podem ser heurísticos para problemas reais e práticos. A falta
de inteligência nesses algoritmos significa que eles geralmente podem procurar por mais
possibilidades em um determinado período de tempo do que um método heurístico, uma vez

10
que aplicar discriminação requer esforço. É concebível que, em domínios problemáticos onde
as soluções não sejam distribuídas escassamente, o algoritmo do Museu Britânico poderia
funcionar bastante bem (ver, por exemplo, Siklossy et al., 1973). Daí o algoritmo do Museu
Britânico pode, de modo plausível, ser chamado de estratégia bem sucedida, que, no entanto,
não acreditamos ser otimizada. Portanto, também pode se qualificar como uma heurística.

Heurísticas como baseadas em conhecimento incompleto


No outro extremo, a partir de uma tomada de decisão confiante é uma tomada de decisão cega,
aleatória e ignorante. No entanto, a heurística oferece seletividade, orientação, soluções
plausíveis, suposições intelectuais, etc., que indicam, pelo menos, uma visão parcial da situação
do problema. Do conhecimento a-priori de que uma regra é baseada em uma compreensão de
alguma faceta do problema, pode-se obter alguma confiança; daí um dará algum crédito, alguma
plausibilidade, a esta regra. No entanto, o desempenho real eventualmente afetará essa
sensação de plausibilidade e, se o desempenho for fraco, a visão parcial em si será posta em
causa. A visão parcial é o que faz com que hctivismo de tal interesse para o lado da ciência
cognitiva de Al. Se alguém tiver alguma informação sobre a estrutura de um problema de
domínio, mas não o suficiente para fornecer um algoritmo eficiente para resolver todos esses
problemas, essa informação ainda pode ser usada sob a forma de heurísticas para melhorar o
desempenho de resolução de problemas. Uma vez que tantos problemas do mundo real são
desta forma, não é de admirar que as heurísticas se tornaram tão populares e valem a pena
estudar Lenat (1982, p.222) observou de maneira semelhante o domínio da aplicabilidade
heurística. Num estágio anterior (de conhecer uma domínio], pode ter sido muito pouco
conhecido para expressar muitas heurísticas, muito mais tarde, o ambiente pode ser
suficientemente bem entendido como algoritmo, no meio, a pesquisa heurística é um
paradigma útil. A previsão de eclipses passou para esta etapa final de algoritmo , o diagnóstico
médico está no estágio intermediário onde as heurísticas são úteis, a construção de programas
para a busca de novas representações do conhecimento ainda é pré-heurística. Assim, temos
um espectro de níveis de confiança na tomada de decisões. Em um extremo são algoritmos
eficientes e outros processos de decisão que nós acreditamos serem ótimos (garantindo ou não
uma solução) e, no outro extremo, temos os algoritmos mais ineficientes e outros processos não
lucrativos em que Hamos pouca confiança. As heurísticas caem, são plausíveis sem ter certeza.
A colocação de um processo particular ao longo deste espectro, no entanto, em relação à nossa
percepção dos extremos. Por exemplo, Newell et al their British e Feldman 1963, p. 16
originalmente falou do algoritmo do Museu como produzindo expressões "simples e baratas"
que não podiam ser heurísticas enquanto elas (Newell e Simon 1972, pp. 120, 12 l) mais tarde a
chamam de heurística porque seu gerador é aparentemente "cego" teste e erro, uma vez que
gerando apenas teoremas é muito mais seletivo do que aquele que gera todas as fórmulas bem
formadas Como um ingrediente determinante em heurísticas, a visão parcial oferece mais do
que apenas confiança. O insight é o núcleo da inteligência heurística, é razão de ser. Uma
heurística particular é representada por sua visão particular, sem uma compreensão genuína de
algum aspecto do problema, um dispositivo não deve contribuir para a solução de problemas.
Só poderia se disfarçar de heurística até que a sorte estivesse perdida. É com essa dimensão do
significado da heurística em mente que Polya, Gelernter, Slagle e Jackson ofereceram suas
definições. Aqui estão dois exemplos simples do sentido em que as heurísticas podem
representar uma visão parcial de um domínio problemático. Na lógica simbólica, sabemos que -
n A é equivalente a A Este é um conhecimento sobre como as fórmulas lógicas se relacionam
entre si. Sabemos também que os provadores de teoremas estão descendo com fórmulas cada
vez mais complexas, e que uma grande parte da prova do teorema é combinar padrões similares
em outras fórmulas. Podemos empregar todos esses insights para construir uma heurística que
simplifique a correspondência de padrões: "sob tais e mais hipóteses, elimina o excesso de
negações". Outras heurísticas podem fazer uso de outras equivalências (por exemplo,
expressadas pelas regras de DeMorgan) para recomendar a conversão de fórmulas para algum

11
tipo de forma normal. No xadrez, o conhecimento que, em um ponto em jogo, o bispo pode em
dois movimentos, ir para mais quadrados possíveis do que a rook, pode permitir gerar o uso
heurístico temporário do bispo neste turno. Como pode ser visto a partir desses simples
exemplos, as possibilidades de gerar heurísticas são infinitas. Um descobre algo sobre o
problema e constrói um dispositivo para usar essa visão. A regra será, portanto, plausível, e se
alguém não sabe o suficiente sobre o problema para saber se o dispositivo é ótimo, então
também pode ser uma heurística. Quando analisamos a visão, vemos que ela vem em uma
variedade de uma vez que há uma simples que é essa lógica, que é equi é simplesmente simples,
mas A em expressível, descrito expressamente pode ser não pode, uma vez que a visão do
intuito simples simbólico é o exemplo é o The There A, formas. termos. No entanto, o presente
não é válido. Por exemplo, o programa de seleção de verificador de Samuel (Feigenbaum e
Feldman 1963, pp. 71-105) empregou uma função de avaliação polinomial que incluía
características como movimentação de controle central, número de trocas, etc. Este polinômio
de 16 elementos representa uma visão de damas, mas como se expressaria simplesmente? Por
um lado, a visão é altamente dependente do programa específico de Samuel e de suas amostras
de teste. Pode-se argumentar que, portanto, é realmente apenas uma visão de como jogar bons
damas com este programa específico. Nós pensamos, no entanto, que a visão é mais universal
que nos diz, entre outras coisas, que, como regra geral, os reis, o centro são mais poderosos do
que esperávamos. Estes dois exemplos também nos mostram que alguns conhecimentos são
conhecidos antes de suas heurísticas enquanto outros são descobertos examinando heurísticas.
Assim, essas duas formas de conhecimento, os aspectos do problema (conhecimento factual) e
como usar esses aspectos (conhecimento processual) podem existir de forma bastante
independente. Alguns pesquisadores de AI refletiram sobre a natureza abstrata da visão
heurística. Boden (1977, p. 351), Minsky (Feigenbaum e Feldman 1963, pág. 409), e Newell et
al. (Feigenbaum e Feldman 1963, p. 122) falam de passar do estado de início para o estado do
objetivo e evitar muitos caminhos infrutíferos ao detectar se um está ficando mais quente ou
frio. Um tipo de feedback negativo mantém um no caminho certo. Ateach ponto em que os
nativos são apresentados uma decisão é tomada. Apenas algumas dessas decisões precisam ser
frutíferas para impedir que alguém se desvie demais. As funções de avaliação correspondem a
esta descrição bem Outro conjunto de reflexões vem de Boden (1977, pp. 341-344), Minsky
(1968, p. 425ff Pearl (1984, pp. 113-118), da Polya (1945, pp. 37-46, 180), que falam e as
Analogias podem ser tão complicadas como ou mais complicadas do que o problema original.
existe um paralelismo suficiente entre os dois casos, então, permite-nos transferir os insights e
as heurísticas com base nestes, ao invés de ser forçado a redescobrir estes mesmos insights e
heurísticas. Os modelos são uma forma de analogia. Eles simplificaram as representações que
nos permitem focar. ou tornar mais saliente, alguns dos aspectos mais relevantes de um
problema. Eles oferecem uma representação mais compacta dos sentiais de um problema e,
portanto, são uma forma de visão parcial. Sua simplicidade também pode facilitar a descoberta
de novos conhecimentos. E aqueles descobertos provavelmente abordarão os aspectos mais
essenciais do problema Heurística como melhoradores do desempenho. As heurísticas são
muitas vezes vistas como um melhor desempenho, como algumas das nossas definições acima
ilustradas. Mas como eles fazem isso? Nesta seção, mostraremos o que pode parecer óbvio, mas
não deve ser, que as heurísticas são usadas para ajudar a melhorar o desempenho de um
sistema de solução de problemas. A este respeito, são como ferramentas introduzidas para
consertar ou aprimorar um sistema. A noção de melhoria de desempenho em consideração é a
de aumentar a eficiência, ou seja, receber mais benefícios para o esforço colocado. Nós
acreditamos, mas não devemos discutir detalhadamente aqui, que as várias permutações de
esforço decrescente e aumento de benefício mostram muitos dos formas em que as heurísticas
ocorrem. Antes de tudo, deve ficar claro que não estaríamos usando heurísticas na resolução de
problemas, na descoberta de soluções, orientação pesquisa, etc., se não acreditássemos que
fossem úteis que contribuíam com algo. Isso é tão patente que quase não vale a pena
mencionar. No entanto, não é o mesmo dizer que um é útil e melhora o desempenho. Um

12
volante auto s é útil, mas não melhora o desempenho - é um acessório padrão, já presente no
próprio automóvel padrão. Uma ignição eletrônica, por outro lado, sendo uma opção superior
à ignição eletromecânica padrão, pode ser dito melhorar o desempenho. Parece haver duas
opiniões distintas em A quanto a um heurístico que um dispositivo deve melhorar o
desempenho, ou se ele precisa simplesmente ser útil. Minsky e Sampson incluíam
explicitamente a melhoria de desempenho em suas definições. Na verdade, para eles, esta é a
única propriedade significativa de heurísticas. Junto com Minsky e Sampson são todos aqueles
que expressam melhoria de desempenho sob a forma de redução de esforço ou redução de
pesquisa. Estes incluem Barr e Feigenbaum, Chang e Lee, Feigenbaum e Feldman, Hofstadter,
Hunt Jackson, Nilsson, Raphael, Slagle, Tonge e Winston. No outro campo, encontramos as
heurísticas introduzidas para não melhorar o sistema, mas sim, por seu lado, desde o início. Para
este grupo, as heurísticas podem ser mecanismos padrão, e não apenas recursos superiores
recentemente introduzidos. Este campo inclui Albus, Boden, Newell et al., Pearl, Polya e Solso.
É interessante notar que o segundo grupo contém aqueles pesquisadores cujo principal
interesse é o aspecto da "ciência cognitiva" de Al- o uso de um computador para simula a
psicologia, enquanto aqueles no primeiro grupo são pesquisadores principal preocupação é na
produção de programas para realizar determinadas tarefas (tradicionalmente humanas). Esta
observação sugere que o que está subjacente aos diferentes usos desses dois campos é uma
espécie de ênfase diferente: o primeiro acampamento em direção a um problema de resolução
de problemas prática e orientado a tarefas por computador, o segundo acampamento em
direção a um tipo mais global de teor de homem-máquina de resolução de problemas. Isso
também é sugerido pelo fato de que mesmo alguém como Minsky, que faz com que a melhoria
do desempenho seja a principal característica de sua definição, usa "heuris tic" independente
da melhoria do desempenho ao discutir heurísticas humanas (Minsky 1968, p.27).
Em suma, parece que a maioria dos membros da comunidade Al emprega "heurística" para se
referir a algum dispositivo aplicado como adição a algum sistema de resolução de problemas na
expectativa de melhoria de desempenho. Portanto, a melhoria do desempenho é uma
propriedade incluída no uso mais popular da heurística ". No entanto, devemos reconhecer uma
tradição legítima de usar "heurística" para defender um mecanismo interno preexistente de
algum sistema de resolução de problemas, antes de quaisquer adições serem feitas. Nós
pessoalmente preferimos este último uso. Na leitura de descrições de programas que os autores
dizem para empregar heurísticas, um deles é atingido pelo uso de certos termos na
caracterização das propriedades possuídas por essas heurísticas putativas. Essas propriedades
pressupõem o elemento de adicionar algo a um sistema que não estava presente antes, e todos
são comumente atribuídos a heurísticas. Essas propriedades são refletidas no uso dos seguintes
adjetivos ao descrever heurísticas: práticas (ao contrário do teórico) específicas do domínio, ad
hoc e empírica e no uso dos seguintes substantivos em lugar de "heurística": truque, remendo,
e ferramenta Acreditamos que esse uso de heurísticas é devido à estrutura de pesquisa
experimental em que a AI ocorre comumente no investigador Al planeja uma teoria elegante de
como alguma classe de problemas é resolvida. Quando testado na forma de um programa de
computador, verifica-se que essa teoria tem faillings. Não pode lidar com algumas formulações
problemáticas, leva muito tempo aos outros, etc. Para superar essas dificuldades, o autor
começa a dobrar, corrigir e, de outra forma, modificar a teoria para que seu desempenho
melhore. Na verdade, isso ocorre com tanta frequência em IA que o termo especial parece ser
o melhor para as inovações ad hoc, empiricamente introduzidas, por razões de praticidade. Para
melhor ou pior, a "heurística" foi elaborada para justificar alguns. As heurísticas não têm o papel.
Pode-se ver certeza formal e confiança dada a um mecanismo de decisão teoricamente
derivado. As heurísticas usam informações parciais e pequenas informações para ajudar a
orientar uma solução. Sua principal justificativa é a praticidade que eles oferecem, e não a
elegância ou adequação da teoria subjacente a eles. Assim, onde Polya e Newell et al. teria usado
heurística para se referir a métodos gerais que são inicialmente parte do equipamento do
solucionador de problemas, como análise de meios-finais, teste e teste, raciocínio análogo e

13
raciocínio indutivo, outros em AI introduzem heurísticas como pensamentos quando um
problema particular A teoria da solução tem falhas práticas e, quando ainda é desejável salvar
as boas partes da teoria, o teorema da resolução provar fornece alguns exemplos. A estratégia
de resolução de ossos desencapados é elegante e mostra muita promessa, pois usa apenas um
princípio de inferência e, portanto, não precisa possuir nenhuma lógica complexa para decidir
qual regra de inferência se aplica a seguir. No entanto, a resolução de ossos desencapados se
revela irremediavelmente ineficaz para a maioria dos teoremas. Então, em vez de rejeitá-lo
inteiramente, buscamos maneiras de salvá-lo. Por exemplo, tentamos solicitar a seleção da
cláusula usando funções de avaliação, tentamos escolher cláusulas simples primeiro, ou
tentamos usar a conclusão negada e seus antepassados (conjunto de suporte). Essas estratégias
são plausíveis, falíveis e, por sua vez, muito úteis para ampliar o teor de prova da teoria pura. É
por isso que a heurística "na AI tende a adquirir um sentido semelhante a praticar e contrário
ao teórico. Esta praticidade é o fundamento para falar da melhoria da estratégia heurística em
relação ao desempenho da estratégia teórica. "Derivado do domínio específico de esta oposição
à teoria. Parte do significado de dizer que a é específico do domínio é que ele responde às
peculiaridades do problema. E, normalmente, só nos incomodamos com Teórico se quisermos
realmente resolver problemas práticos tendem a aplicar de forma mais geral sobre vários
domínios problemáticos.
Outra estrutura de pesquisa dentro da AI em que ocorre um tipo de melhoria de desempenho
baseada em heurística pode ser ilustrada da seguinte maneira. Um esquema de programa
esquelético é escrito para manusear heurísticas para algum domínio problemático. As
heurísticas são então lançadas sempre que o pesquisador entender, pois adquire experiência
com o problema, seu programa e o comportamento das suas heurísticas. Portanto, as heurísticas
em Al são muitas vezes chamadas de ad hoc e empíricas, e isso não é visto de forma negativa,
mas positivamente, como parte de sua propriedade geral de serem melhoradores de
performance. Numerosos sistemas de AI adotam esse mesmo tipo de estrutura esquelética para
anexar heurísticas. Praticamente todos os chamados "sistemas especialistas" são projetados
para facilitar esta melhoria de desempenho aditiva experimental. Eles são construídos para que
a perícia humana possa ser facilmente transferida para eles e, muitas vezes, a experiência é sob
a forma de heurísticas. Por exemplo, o programa de descoberta de conceito matemático AM de
Douglas Lenat, em um ponto, tinha cerca de 250 heurísticas codificadas como regras de
produção. Exemplos de tais regras são Se é uma relação interessante, então olhe para o inverso.
LLenat ar Harris 1978, p. 30l.
Se o conceito G agora é muito interessante, e G foi criado como uma generalização de algum
conceito anterior C. Dê uma consideração extra à generalização de G. e à generalização de outras
formas. Itenat e Harris 1978, p. 43) Ele projetou seu sistema para facilitar a adição de novas
regras e ele esperava adicionar mais tempo (ver Lenat 1982, 1983a, b). Mais uma vez, cada nova
regra é vista como potencialmente melhorando as habilidades de descoberta do programa.
Lenat também experimentou com AM; Ele parece ter adicionado regras de acordo com várias
idéias para aprimorar o desempenho da AM (Lenat 1982, pp. 205-207). Acabamos de ver como
a melhoria do desempenho é uma atividade popular em Aland, como são as heurísticas.
associado a esta atividade, corrigindo teorias impraticáveis ou sendo adicionado a um esquema
geral de resolução de problemas. Estas são formas de expressar a intuição básica - intuição maior
do que o custo e mostrar que um número de propriedades que são atribuídas a heurísticas
podem ser derivadas dela. Por exemplo, a ideia de heurísticas de Gelernter (Feigenbaum e
Feldman 1963, p. 137) como filtros suficientemente não porosos "e a noção popular de" poda
seletiva de árvores de jogo de decisão ", ambos se concentram em nosso desejo de eliminar da
consideração itens mais inúteis do que 1960) atributos valiosos. Também temos simplificações
e "soluções adequadas" de Tonge. Tentamos manter os custos (de ter que realizar análises
detalhadas), mas os benefícios (qualidade das soluções) suficientemente h. Abstrações ou
generalizações de dispositivos de decisão. eles reduzem o número de dispositivos detalhados
que precisam ser memorizados e também reduzem a necessidade de considerar cada um

14
sempre que uma decisão é necessária (mas não manipule demais muitos casos excepcionais),
também são candidatos para beur heurística. Ou, em geral, qualquer área em que possamos
trocar o uso de recursos para uma ligeira perda de número de problemas solucionáveis ou de
qualidade de soluções é uma melhoria da área de desenvolvimento aberto por métodos
heurísticos. Por outro lado, eu, por qualquer meio, podemos aumentar marginalmente os custos
de utilização de recursos (tempo, memória, ferramentas, etc.), mas recuperar um aumento
dramático em problemas solucionáveis ou um aumento significativo de qualidade de algumas
soluções, então isso também pode qualificar a melhoria do desempenho heurístico . Os sistemas
de especialistas são boas fontes para encontrar tais heurísticas de aumento de esforço, pois
normalmente adicionamos regras para elas, o que implica ocupar mais espaço e gastar mais
tempo considerando regras extras. Uma conseqüência da existência desta última série de
heurísticas é que todas essas definições de heurística que usam as frases "redução de esforço"
ou "redução de pesquisa" são enganosas. "Melhoria de desempenho" é a frase mais precisa,
uma vez que abrange todos os casos de custo- melhoria dos benefícios.

Heurísticas como orientadores de decisão


As heurísticas foram apresentadas de diversas formas sob a forma de provérbios, máximas,
dicas, sugestões, conselhos, princípios, polegares, critérios, regras de produção, métodos de
procedimentos de programas, estratégias, simplificações, opções de "filtros", formadores de
metas e sem dúvida há outros. (Consulte a seção Histórico fornecida anteriormente, para um
exemplo de cada uma delas.) O que é comum a esses formulários? Nesta última seção de
propriedades, esperamos mostrar que as heurísticas sempre tentam ajudar o solucionador de
problemas, guiando suas decisões durante o curso do estado inicial para o estado de solução.
Uma vez que este não é realmente um ponto controverso com qualquer um, não o iremos. No
entanto, porque é uma propriedade chave, eu mereço uma declaração clara. No final, vamos
descobrir alguns Novas coisas sobre a orientação da decisão, em particular, esperamos
esclarecer a questão de saber se as heurísticas podem ser opções passivas apresentadas a um
tomador de decisão executivo ou se as regras de decisão que orientam a busca de uma Solução
são a principal função de Mostrar essa decisão orientando heurísticas , mostramos primeiro que
o elemento de escolha está sempre presente quando se discutem as heurísticas, e que as
atividades heurísticas não influenciam consistentemente qualquer outro elemento de um
solucionador de problemas em sua situação. Por exemplo, eles não são dispositivos que
influenciam consistentemente a memória, a clareza da visão, a criatividade, a minuciosidade ou
qualquer outra característica do problema. Nós usamos da heurística "sempre presume a
existência de um ns de decisão e que o efeito heurístico é liderar esse mecanismo em um
caminho em oposição a outro. A influência pode ser direta, ou seja, a heurística realmente
decide onde ir. Por exemplo, as funções de avaliação são diretas. Ou a influência pode ser
indireta, eu sei, a heurística simplesmente muda algum aspecto da situação problemática. Por
exemplo, elimine os teoremas complexos da lista de subproblemas "Não existe uma linha nítida
que divida esses dois tipos de influência, amostra representativa. A título ilustrativo, trazemos
um dos usos e definições para apoiar a reivindicação sobre a universalidade da orientação para
a decisão. Podemos começar com Polya, cujo uso reca era bastante diferente do que prevalece
em AI hoje. Para Polya, qualquer método comportamental considerado útil enquanto a
resolução de problemas poderia ser um método heurístico. Isso inclui perguntar-se certas
questões-chave desenhando um diagrama ou tentando reformular um problema . Uma vez que
Polya não usou o paradigma da pesquisa ao descrever a resolução de problemas matemáticos,
esses métodos comportamentais não precisam afetar qualquer tomada de decisão. Podem
influenciar alguns processos inconscientes que de repente inspiram o solucionador a ver uma
solução No entanto, Polya apenas fala de seus métodos como sendo escolhido por um
solucionador. O aluno deve tentar isso, pensar nisso, fazer-se essa pergunta, etc. Período inicial
de Al, o paradigma do uso heurístico é orientar a pesquisa através de um espaço problemático.
Isso aplica-se ao autor da eve coberto acima. Como Polya, Newell et al. deixar oficialmente

15
aberta a possibilidade de heurísticas serem práticas arbitrárias aplicadas durante a resolução de
problemas. No entanto, eles apenas os usam para influenciar a ordem de desenvolvimento do
caminho da solução ao longo da árvore do subproblema. O valor das heurísticas é explicado pelo
seu efeito no movimento através da árvore subproblema.

O valor da heurística é explanar o seu efeito no movimento através da árvore, e todas as suas
heurísticas são claramente orientadoras de decisão. quatro métodos principais no Teórico da
Lógica escolhem diretamente alguns dos caminhos a serem seguidos, enquanto o teste de "teste
semelhante" alguns antes da correspondência e, portanto, orientando indiretamente o curso de
busca e usa Gelernter empregou um paradigma de pesquisa de árvore similar, suas heurísticas
para filtrar decisão menos promissora, o padrão inteiro usou heurísticas para simplificar sempre
que possível a atividade usada para equilibrar as linhas de montagem. Slagle usa a estrutura do
Teórico da Lógica onde as heurísticas decidem quais as transformações do problema a serem
aplicadas a seguir, além de transformar os próprios problemas, Minsky introduz as heurísticas
em um contexto de busca onde orientam o solucionador gradualmente para uma solução. (Ele
dá escalada em colina "como um exemplo típico.) Feigenbaum e Feldman mencionam a redução
da busca do espaço estadual em sua definição e fornecem regras variadas como exemplos. Para
isso, o solucionador é retratado como tentando uma coisa e não outra e é, portanto, conduzido
um caminho de resolução de problemas diferente.

Após a era da definição inicial, o paradigma orientador da busca do espaço-estado permaneceu


o quadro dominante para falar sobre heurísticas que vemos aplicações. Em praticamente todo
o jogo. Nestas, as heurísticas decidem qual dos legais para executar a seguir. aplicações de prova
de teor. Qual fórmula na expansão de fórmulas deve examinar o sistema próximo, resolva-se
em seguida. qual de um conjunto de regras de simplificação deve tentar em seguida; etc.?
Quando chegamos a sistemas especializados, o paradigma de pesquisa é mencionado menos
frequentemente, não é forte. Normalmente, esse tear funciona em conjunto com um
especialista humano. Pode pedir-lhe mais insumos, pedir testes certos ou explicar por que ele
favorece um certo ser visto como guiando as suas heurísticas, portanto, assim como seus
usuários, como decisões tomadas por foco em uma estrutura de análise de diagnóstico
satisfatória ( DENDRAL), ou geológico. Junto com esta lista de usos, podemos produzir todas as
palavras-chave utilizadas na definição como evidência de que as heurísticas existem para
influenciar escolhas. sugestões, sugestões e conselhos são claramente destinados a influenciar
as regras de decisão de forma adequada todas as regras da norma cntena ", e existem problemas
para conduzir o governo e, no caso da conduta de alguém, é tipicamente consciente. Além disso,
tendo escolhido seguir a regra, as decisões subseqüentes são muitas vezes alteradas pelo novo
rosto que o problema agora apresenta. Programas, complexos, todos estão organizados e quais
são, de fato, conjuntos de quais, no entanto, admite uma única regra. Cada um é apenas um
nulo para o qual pode surgir uma variedade de conduta para circunstâncias variadas durante um
período de tempo. Por isso, eles também governam a conduta, e o solucionador de problemas
decide segui-los ou não. Finalmente, as outras coisas que várias heurísticas foram chamadas,
"filtros", "simplificadores, e assim, parecem sempre tem como finalidade reestruturar a situação
do problema de modo que se tenha um conjunto diferente de opções para escolher.

Das definições de palavras-chave citadas e do uso, é claro que a orientação da função sempre
foi vista como parte de um dispositivo. Mas houve confusões em relação a esta propriedade,
então vamos definir sobre como expor e resolvê-las. Em primeiro lugar, descreveremos como,
no que diz respeito à tomada de decisão, há duas formas distintas de heurística na literatura. É
por causa de sua incapacidade de reconhecer esse fato que alguns autores deram definições
errôneas de heurística. Com relação à função do executivo, que determina a direção geral da
atividade, uma heurística pode ser usada ativamente para decidir qual das várias regras,
conselhos , movimentos de jogo ou soluções para selecionar, ou pode ser referido passivamente,

16
como uma das regras, conselhos, etc., que está sendo oferecido para seleção. Estas duas
categorias não são mutuamente exclusivas, nem precisam de heurística pertencer a pelo menos
uma categoria. Por exemplo, no caso do Teórico Lógico, os quatro "métodos" são heurísticas
passivas selecionadas pelo executivo não-seurista, mas também são heurísticas ativas quando
decidem qual dos teoremas a considerar em seguida. Um exemplo de uma heurística que não
está em nenhuma categoria também pode ser encontrado no Teórico da Lógica. O teste de
similaridade "não faz parte do executivo, já que tudo o que faz é mudar o ambiente do problema,
não decidir o curso da resolução de problemas e, por outro lado, não é selecionado entre as
atividades alternativas a serem executadas, uma vez que é sempre aplicado e não tem
concorrentes.

É difícil dizer se a categoria de um problema é comum do que a outra. Muitos não tomam as
decisões, como "castelo antecipado" ou "tente reformular. Por outro lado, muitas heurísticas
não são uma lista de possíveis coisas a serem feitas nesta fase da resolução de problemas. Estão
trabalhando constantemente recursos do sistema - aqui . Mais uma vez, muitas outras
heurísticas e teoremas direcionam a busca - todas as funções de avaliação provam programas
que empregam heurística disso. Da mesma forma, muitas outras heurísticas têm tabelas longas
para a maioria dos sistemas ou sistemas de produção especializados que decidem quais os
executivos para concluir que atualmente empregar Portanto, tudo em um temos que ambos
esses usos são genuínos e que não domina. Tendo distinguido esses dois que as heurísticas
podem estar envolvidas em uma situação, concluímos para discutir problemas nebulosos como
a organização hierárquica dos sistemas de resolução de problemas, as camadas de tomada de
decisão, o lugar da inteligência n executivo ou subordinado, ou talvez a diferença entre as
estratégias de alta ordem e a decisão tática de baixa ordem criação de iões, etc. Todos estes
podem ser analisados em um contexto de alguns dispositivos heurísticos, alguns eretos e alguns
dispositivos de decisão aleatórios. No entanto, podemos fazer nada disso aqui. Tudo o que
gostaríamos de fazer com essa visão sobre heurísticas executivas e subordinadas é a distância
de algumas declarações problemáticas feitas por Slagle e por Albus. Como vimos anteriormente,
a definição oficial de Slagle exige que as heurísticas sejam ativas. No entanto, acabamos de ver
que definitivamente não é verdade que todas as heurísticas são ativas, ou seja, parte da cutiva;
eles não decidem o que deve ser feito em seguida. Ao longo de uma veia semelhante, a
afirmação de Albus diz que "uma estratégia heurística para selecionar regras e uma regra de
nível mais alto para selecionar regras de nível inferior" (Albus 198 l, p.228) . Então, novamente,
as heurísticas são retratadas como parte do executivo, eu estou no controle do que é feito em
seguida. Em outros lugares, ele faz rcmarks similares. Na maioria dos casos, o espaço de busca
é muito grande para permitir a busca exaustiva de todos os planos possíveis, ou mesmo qualquer
substância para fracioná-los. O conjunto de regras para decidir quais hipóteses avaliam, e em
que ordem, são chamados de heurísticas ... O IHeuristi possui natureza recursiva. Uma heurística
é um procedimento para encontrar [1981, p. 222].

Essas observações sugerem a origem de sua crença de que a heurística deve estar no executivo:
ele acredita que as heurísticas só ocorrem em um contexto que se encaixa no paradigma de
busca do espaço estadual. Eise, onde ele realmente descreve toda a resolução de problemas
como pesquisa de espaço estadual (Albus 1981, pp. 281-285). Quando se tem uma rede formal
de espaço-estado definida, é fácil imaginar que todas as decisões podem ser reduzidas para
responder "que caminho devo seguir ou" que estratégia devo seguir para seguir um caminho?
"As heurísticas tornam-se as estratégias e As estratégias para selecionar as estratégias, que
nos dizem para onde ir em seguida, mas é improvável que todos os problemas possam ser
feitos para se ajustar ao esquema de espaço de estados. Como observa Boden (1977, p. 350),
é difícil definir estados de solução e estados intermediários para problemas como se casar com
ele? " e "como posso escrever uma história de detetive?" E, mesmo dentro deste esquema, as
heurísticas podem ser aplicadas a inúmeras funções de fundo em vez de fazer escolhas diretas

17
sobre a opção a seguir. Como exemplo, mencionamos acima o teste de similaridade do Teórico
da Lógica Outro exemplo são as heurísticas de Lenat (Lenat e Harris 1978, pp. 30-33) em AM,
muitas das quais contribuem de forma incremental para priorizando os projetos na "agenda
escolhendo individualmente o que exatamente é feito em seguida. De fato, o executivo da Lenat
é muito simples e corre sem heurísticas nas expressões declarativas (em oposição ao mesmo
procedimento) do conhecimento heurístico sobre um domínio como o" se a evidência E da
MYCIN " afirmar A com fator de confiança CF, "são heurísticas que não escolhem o que fazer em
seguida. No caso de MYCIN. Um algoritmo de profundidade modificada primeiro faz essas
escolhas (Barr e Feigenbaum 1982, pp. 187-191) Conclusão Nós apresentamos para definir
heurística contra um contexto histórico de definições conflitantes, o que emergiu de nossa
pesquisa de definições foi que a heurística poderia se referir a qualquer dispositivo usado na
resolução de problemas, seja um programa, uma estrutura de dados, um provérbio, uma
estratégia ou um pedaço de conhecimento. Mas não apenas qualquer dispositivo. Deve haver
um elemento de "regra de gentileza" sobre o dispositivo; tinha que ser útil, mas não precisa
garantir o sucesso. Esta falta de garantia, no entanto, aplica-se a toda a imagem prática real de
fornecer uma solução. Um dispositivo heurístico pode garantir uma solução, mas se também é
provável o dispositivo ideal para chegar a uma solução, não é uma heurística. Quanto à utilidade
ts, isso é derivado da ocorrência heurística de fato capturado, alguma visão, sobre o domínio do
problema. Em geral, as heurísticas se encaixam em um espectro de dispositivos entre aqueles
que são aleatórios e sem inspiração e aqueles que são aplicados automaticamente porque eles
nunca deixam de agradar, ou se eles falharem, então nos resignamos a isso porque temos uma
prova de que lá pode não ser um dispositivo melhor Embora essas duas propriedades sejam
suficientes para eliminar a maioria dos dispositivos não-seuristas, a maioria dos Alers usa
heurística ainda mais restritivamente. Eles reservam o termo apenas para aqueles dispositivos
que eles adicionaram ao seu sistema. Embora suspeitamos que eles renunciariam a esta
propriedade em uma pequena reflexão, esse uso restrito é, no entanto, predominante. Por
exemplo, a maioria das definições dadas pelos próprios Alers. Portanto, devemos admitir essa
propriedade se quisermos dar uma "interpretação heurística de Aler sobre" Como melhorar ",
descobrimos que, ao contrário de muitos autores, isso não significava busca ou esforço redução,
que esta era apenas metade da equação, sendo a outra metade a possibilidade de melhorar o
esforço de busca da qualidade da solução em troca de um modesto aumento em Melhorar o
aumento modesto de qualidade no Com a adição de melhoria de desempenho, temos todas as
propriedades necessárias para restringir o conjunto de dispositivos que são Aluris heurísticos.
Tecnicamente, isso seria suficiente como uma definição. No entanto, quando examinamos todas
as observações feitas sobre heurísticas na literatura, descobrimos que existe um tema popular
não coberto pela falibilidade, plausibilidade e melhoria do desempenho, a saber, a função das
heurísticas na resolução de problemas. Eles funcionam guiando a pesquisa, sugerindo
comportamento, tomando decisões ou transformando o problema para que diferentes cursos
de ação estejam abertos. Essas propriedades são refletidas na escolha das palavras utilizadas
para tornar as heurísticas concretas: regras, conselhos, procedimentos, filtros, etc. Sugerimos
que a caracterização da orientação de pesquisa seja tão popular por causa da popularidade em
AI do espaço-estrutura para descrever os problemas. Claro, a estrutura do espaço-estado é tão
popular em Al porque, como cientistas, Alers pode se beneficiar analisando os fundamentos de
um problema em caminhos, nós de opção, estados, etc. As heurísticas nessa estrutura afetam
naturalmente as decisões sobre quais caminhos seguir.
Tendo descrito tudo isso, concluímos a discussão sobre a orientação das decisões ao estabelecer
que as heurísticas poderiam estar envolvidas na tomada de decisão ativa direta, ou apenas
passivamente como opções para executar e, portanto, alguns autores estavam incorretos ao
pensar que todas as heurísticas escolheram o que a solução de problemas de curso seria Seguir
a seguir é qualquer dispositivo, seja ele de forma concisa, uma heurística em Al, que não é
programa, regra, conhecimento, etc., inteiramente confiante será útil para fornecer uma

18
solução prática, mas qual é a razão para acreditar será útil, e que é adicionado a um sistema de
solução de problemas na expectativa de que, em média, o desempenho melhorará.

19

Das könnte Ihnen auch gefallen