Sie sind auf Seite 1von 1

A retrodatação automática no projeto DELPo

Mário Eduardo Viaro (FFLCH-USP/NEHiLP)

Palavras-chave: Dicionário. Etimologia. Terminus a quo. Banco de Dados.

Quem se dedica a aspectos históricos e diacrônicos da língua portuguesa, seja em estudos


filológicos, seja em linguística, se ressente da falta de material especializado à altura do
dicionário etimológico Oxford para a língua inglesa, do Le Robert para o francês, do Cortellazzo
& Zolli para o italiano ou do Corominas para o espanhol. Nesses dicionários, a primeira datação
(ou terminus a quo) é o principal elemento para a formulação de etimologias não fantasiosas e
o melhor índice para se evitarem afirmações anacrônicas acerca do percurso histórico das
palavras. Em língua portuguesa há poucas obras que dispõem dessa informação, entre as mais
conhecidas, a de Cunha (1982) e o dicionário de Houaiss & Villar (2001), que não é
propriamente um dicionário etimológico (e que, além disso, sofreu uma redução dos dados
etimológicos na sua segunda edição). A datação de palavras cuja origem se situa na Idade
Média, nesta última obra, contudo, segue os critérios de Machado (1955-1972), que aceita
textos anteriores ao século XII. Há, além disso, muitas falhas no tocante às primeiras
ocorrências nos séculos XVII, XVIII e XX. As pesquisas do Núcleo de apoio à pesquisa em
Etimologia e História da Língua Portuguesa (NEHiLP/PRP-USP), têm atuado com a questão
do terminus a quo das palavras portuguesas com vista a sanar essa lacuna que cria
impedimentos para o avanço das pesquisas que envolvem sincronias pretéritas e, para tal,
desenvolveu o banco de dados do DELPo (Dicionário Etimológico da Língua Portuguesa),
alimentado por meio de um programa chamado Moedor, desenvolvido pelo Instituto de
Matemática e Estatística da USP (IME-USP), o qual gera moagens, isto é, listas das palavras
extraídas de textos previamente trabalhados, em formato de edições diplomáticas. Esse
programa, que se aprimora à medida que novos dados são inseridos, lematiza essas ocorrências
lexicais, compara-as com as armazenadas e informa se há possíveis retrodatações no texto
investigado ou se inexistem no banco. Por meio de testes e inserções programadas, já foram
inseridos cerca de 7000 verbetes, que incluem datações para variantes ortográficas, flexões e
lemas. Trata-se do primeiro passo para a divulgação dos dados do DELPo.
Referências bibliográficas:

COROMINAS, Joan. Diccionario crítico etimológico de la lengua castellana. 4v. Madrid: Gredos,
1954.
CORTELAZZO, Manlio; ZOLLI, Paolo. Dizionario etimologico dela língua italiana. Bologna:
Zanichelli, 2004.
CUNHA, Antonio G. da. (coord). Dicionário etimológico Nova Fronteira da língua portuguesa.
Rio de Janeiro: Nova Fronteira, 1982.
HOUAISS, Antônio; VILLAR, Mauro (org.). Dicionário Houaiss da língua portuguesa. Rio de Janeiro:
Objetiva/ Instituto Antônio Houaiss, 2001.
MACHADO, José Pedro. Dicionário etimológico da língua portuguesa. 5v. Lisboa: Confluência,
1952-1977. [Lisboa: Horizonte 20038]