Sie sind auf Seite 1von 3

LINGSTICA COMPUTACIONAL:

TEORIA E PRTICA
Marcelo Mdolo

OTHERO, Gabriel de vila & MENUZZI, Srgio de Moura. Lingstica


computacional: teoria e prtica. So Paulo, Parbola Editorial, 2005, 128 p. ISBN: 8588456-39-X

A obra configura-se como uma introduo didtica lingstica computacional,


discutindo-se basicamente dois temas: i) o que lingstica computacional e que tipos
de trabalho ela tem desenvolvido p. 12, nos captulos 1 e 2, respectivamente
Tecnologia e linguagem; Trabalhos em lingstica computacional e ii) como os
conhecimentos da lingstica podem colaborar no desenvolvimento de recursos
computacionais p. 12, nos captulos 3, 4 e 5; por sua vez Desenvolvendo um parser
sinttico I, Desenvolvendo um parser sinttico II e Nossa gramtica. H ainda trs
sees que finalizam esse livro: Palavras finais, Referncias bibliogrficas e um
elucidativo Glossrio.
No primeiro captulo, Tecnologia e linguagem, relatam-se os avanos da
informtica, desde o incio da dcada de oitenta, com a popularizao dos primeiros
computadores pessoais, at a recente criao de uma nova rea de pesquisa, a HCI
(Human Computer Interaction ou Interao Humano-Computador). O desenvolvimento
de pesquisas em HCI apontado como soluo para tentar fazer com que mquinas
sejam capazes de interagir com seres humanos e compreend-los. Entretanto, para que
esses estudos tenham xito, a fim de criar mquinas inteligentes, ainda necessrio
que se avance na anlise das lnguas naturais e na descrio formal dos sistemas
lingsticos, bases indispensveis para que se comece a falar de lingstica
computacional.
Tais pesquisas seriam, portanto, as molas propulsoras para o desenvolvimento da
lingstica computacional, que se divide em: a) lingstica de corpus trabalhos feitos a
partir de corpora eletrnicos, isto , grandes bancos de dados que contenham amostras
de linguagem natural e b) processamento de linguagem natural (PLN) estudo da
linguagem voltado para a construo de softwares e sistemas computacionais
especficos, como tradutores automticos, chatterbots, parsers, reconhecedores
automticos de voz, geradores automticos de resumos, etc.
No segundo captulo, Trabalhos em lingstica computacional, do-se noes de
lingstica computacional e de programao. Primeiramente, em Desenvolvimentos em
lingstica computacional, historia-se o incio da lingstica computacional desde 1950
e o impulso que essa rea ganhou nas dcadas de 50-60 com os programas de traduo
automtica. Em seguida, destacam-se algumas aplicaes que associam lingstica
informtica: os estudos de fontica e de fonologia empregados em aplicativos para
reconhecimento de fala (como em aparelhos celulares, que fazem a discagem a partir do
reconhecimento de voz do proprietrio do aparelho), em programas na rea da sntese de
fala (como aqueles capazes de gerar fala, a partir de dados, caso do Virtual Vision) e em

Ps-doutorando no Departamento de Lingstica, Instituto de Estudos da Linguagem, Unicamp. Caixa


Postal 6045, CEP 13084-971, Campinas, SP. E-mail do autor <modolo@usp.br>

194

outros muito mais sofisticados, que envolvem a interao entre ser humano e mquina
por intermdio de dilogos orais em linguagem natural.
Alm dos estudos de fontica e de fonologia, os estudos de sintaxe e de
semntica so tidos como fundamentais para sistemas que envolvem a compreenso ou
a gerao automtica de frases de uma lngua, caso dos chatterbots, robs (programas)
que simulam a conversao humana. Como exemplo, detalha-se o funcionamento do
primeiro chatterbot desenvolvido no mundo, o ELIZA, criado pelo pesquisador Joseph
Weizenbaum, no MIT (Massachusetts Institute of Technology), em 1966. Alm dos
chatterbots, os tradutores eletrnicos so aplicativos que igualmente precisam de
conhecimentos sintticos e semnticos.
No subcaptulo Processamento sinttico computacional esclarece-se o que um
parser automtico, ou seja, um programa capaz de classificar morfossintaticamente as
palavras e expresses de sentenas em uma dada lngua e, principalmente, de atribuir s
sentenas a sua estrutura de constituintes, baseando-se em um modelo formal de
gramtica. Tal ferramenta pode ser desenvolvida utilizando a linguagem Prolog
(abreviao de Programming in Logic), uma linguagem de programao de natureza
declarativa, baseada na lgica, tema do terceiro subcaptulo. Assim, no terceiro
subcaptulo, O Prolog, esclarece-se que para o Prolog, importante que o
programador d ao programa dados para combinaes representados por proposies
em um formato semelhante ao da lgica de primeira ordem , e o Prolog resolver,
ento, problemas pertinentes a esses dados, tentando demonstrar logicamente
proposies derivadas a partir deles p. 42.
No terceiro captulo, Desenvolvendo um parser sinttico I: noes tericas
importantes, examinam-se noes de teoria lingstica e teoria computacional, os
primeiros passos para se desenvolver um parser sinttico. Em Teoria lingstica, h
noes de gramtica formal baseadas em CHOMSKY (1956 e 1965). De posse dessas
noes, possvel elaborar uma gramtica robusta ou um conjunto de regras que
juntamente com o lxico permitir formar todas as sentenas gramaticais de uma dada
lngua. So examinadas, ainda nesse subcaptulo, noes de uma gramtica sintagmtica
e teoria dos constituintes.
Em seguida, em Teoria computacional, elabora-se uma primeira descrio de
como funciona a programao em Prolog, trabalhando com exemplos de frases em
portugus e mostrando sua construo nessa linguagem. Juntam-se a esse subcaptulo
esclarecimentos sobre DCGs (Definite Clause Grammars), presentes em quase todas as
verses de Prolog distribudas, um formalismo para a representao de gramticas
livres de contexto p. 76, isto , a grosso modo, DCG pode ser entendida como um
recurso que torna mais fcil ao lingista a implementao de regras sintagmticas em
Prolog p. 77.
No quarto captulo, Desenvolvendo um parser sinttico II: colocando a mo na
massa, aprofundam-se as consideraes feitas no captulo anterior por meio de dois
subitens: Sobre as regras gramaticais e Sobre o lxico. Em Sobre as regras
gramaticais, comea-se o desenvolvimento da gramtica em Prolog, implementando
regras sintagmticas relativas descrio de sentenas simples do portugus. Por sua
vez, em Sobre o lxico, refora-se a idia de que o componente lexical o fator primeiro
e bsico para que o parser possa fazer o reconhecimento das palavras que ele tem que
etiquetar, ou seja, primeiramente preciso ensinar a mquina, apresentar-lhe o lxico
para que ela possa realizar as operaes de etiquetagem.
No quinto e ltimo captulo, Nossa gramtica, mostra-se de maneira prtica
como desenvolver um aplicativo computacional voltado para o tratamento da linguagem

195

natural. Com esse objetivo, so aprofundados e aplicados, com maiores detalhes,


conhecimentos sobre Prolog.
O livro recheado com sugestes de leitura e de visitas a homepages, as quais
complementam ou exemplificam as discusses propostas em cada captulo. O trabalho
uma boa oportunidade para professores conhecerem esse novo e promissor ramo da
lingstica, que, respeitando-se as propores, pode ser aplicado ao ensino fundamental
e mdio; haja vista empreendimentos j bem-sucedidos nesse setor como os de Eckhard
Bick1 na Dinamarca. Alm da leitura da obra, tambm recomendvel conferir as
orientaes para montar seu prprio parser, exerccio vlido e igualmente sugerido
pelos autores para bem compreender a teoria exposta.

VISL (Visual Interactive Syntax Learning)

http://visl.sdu.dk/

196

Das könnte Ihnen auch gefallen