Sie sind auf Seite 1von 32

1

UNIVERSIDADE DE SOROCABA

PR-REITORIA ACADMICA

CURSO DE LETRAS PORTUGUS E INGLS

LUCIANA GARBIM LOPES

OS DESAFIOS GRAMTICAIS ENCONTRADOS PELO TRADUTOR AUTOMTICO GOOGLE TRANSLATE.

Sorocaba/SP 2012

LUCIANA GARBIM LOPES

OS DESAFIOS GRAMTICAIS ENCONTRADOS PELO TRADUTOR AUTOMTICO GOOGLE TRANSLATE.

Trabalho de Concluso de Curso apresentado como exigncia parcial para obteno do Diploma de Graduao em Letras Portugus e Ingls, da Universidade de Sorocaba.

Orientador: Prof. Dr. Luiz Fernando Gomes

SOROCABA/SP 2012

LUCIANA GARBIM LOPES

OS DESAFIOS GRAMTICAIS ENCONTRADOS PELO TRADUTOR AUTOMTICO GOOGLE TRANSLATE.

Trabalho de Concluso de Curso aprovado como requisito parcial para a obteno do Diploma de Graduao em Letras Portugus e Ingls, da Universidade de Sorocaba.

Aprovado em:

BANCA EXAMINADORA:

Ass. _______________________________ Pres.:

Ass. _______________________________ 1.exam.:

Ass. _______________________________ 2.exam.:

Dedico este trabalho minha me Marta e meus irmos Felipe e Leandro, e aos meus avs Eneyde e Ernesto, os quais amo e prezo muito. Dedico tambm ao meu orientador Luiz Fernando Gomes que me guiou ao caminho certo para tornar possvel esse trabalho de concluso de curso.

AGRADECIMENTOS
Agradeo primeiramente minha famlia, minha me Marta, que me proporcionou a oportunidade de obter, at o momento, dois diplomas de graduao e sempre apoiou minhas escolhas de estudos. Meus irmos Felipe e Leandro por serem alm de irmos, grandes amigos, minha av Eneyde e meu av Ernesto por serem meu maior exemplo de como uma base familiar unida importante, e todos outros membros de minha famlia. Agradeo tambm meu grande amigo e colega de classe Joo Paulo Hergesel, que me apoiou imensamente durante todos os semestres e foi uma pea fundamental no meu aprendizado. No poderia deixar de fora minhas lindas amigas Paula, Vanessa e Ligia, que foram de extrema importncia durante todo o curso, sempre me ajudaram e apoiaram at nos piores momentos, elas, junto com o Joo Paulo, so pessoas que levarei para sempre no corao. Por fim agradeo ao meu orientador Luiz Fernando Gomes, que me incentivou a pesquisar e ir mais afundo em meu interesse pela traduo, e me fez criar uma nova paixo pelo estudo da traduo automtica. Foi com certeza um timo orientador, e todos meus colegas de classe podem confirmar esse fato.

EPGRAFE

Sometimes Im terrified of my heart; of its constant hunger for whatever it is it wants. The way it stops and starts. - Edgar Allan Poe

RESUMO
Nesta pesquisa, traaremos um paralelo entre a traduo humana e a traduo automtica, mais especificamente a traduo automtica gerada pelo sistema Google Translate. Utilizaremos de um texto jornalstico base, na lngua inglesa, que ser traduzido primeiramente por um humano e depois pelo Google Translate, e, posteriormente os dois resultados sero comparados e tentaremos explicar, gramtica, morfolgica, lxica e semanticamente, atravs do estudo da sintaxe dos dois textos, quais so as falhas, as condies e as limitaes do sistema de traduo automtica utilizado. Nessa pesquisa detectamos os principais erros apresentados pelo Google Translate e explicamos os motivos pelos quais os erros so cometidos. Em um estudo mais profundo pudemos perceber os pequenos, porm significativos, erros em seu sistema. Os erros mais frequentes identificados nessa pesquisa foram os de gnero e os de concordncia, isto aponta que o sistema lxico e sinttico do sistema de traduo, que utiliza da lngua artificial, ainda precrio em relao complexidade da lngua natural, que mais do que vocabulrio, apresentam sintaxe, regras sintticas complexas, sistema lexical complexo e por isso tornam a tarefa de criar uma lngua artificial que possa traduzir de maneira aceitvel a lngua natural bastante distante de nossa atual realidade.

Palavras chave: Google translate, tradutor automtico, tradutor humano, mquina de traduo, morfologia, sintaxe.

ABSTRACT
In this research we`ll draw a parallel between automatic and human translation, more specifically the automatic translation generated by the `Google Translate` system. We will use a journalistic text in English as a base, that will be translated first by the Google Translate system and then by a human translator, the final results will be compared and we will try to explain grammar, morphological, lexical and semantically, through the study of syntax from the two texts which are the failures, conditions and limitations of the translation system used. In this research we detected major errors presented by Google Translate and explained the reasons why these errors are made. In a deeper study we could see that the small, but significant errors of its system. The more frequent errors identified in this research were of gender and agreement, it points out that the lexical and syntactic systems from the translation system, which uses a artificial language is still poor in relation to the complexity of natural language, which is more than vocabulary, presents syntax, syntactic rules, complex lexical system and for that reason makes the task of creating a acceptable artificial language quite distant from our current reality.

Key-words Google Translate, Automatic Translation, Human Translation, Translation Machine, Morphology and synthesis.

SUMRIO

CAPTULO 1 ........................................................................... Error! Bookmark not defined. 1.1INTRODUO ................................................................... Error! Bookmark not defined. 1.2 A HISTRIA DA TRADUO AUTOMTICA ........... Error! Bookmark not defined. 1.3 FERRAMENTAS DE TRADUO BASEADAS EM DICIONRIO Error! Bookmark not defined. 1. 4 DESEMPENHO DAS PESQUISAS DE TRADUO AUTOMTICA ..............Error! Bookmark not defined. 1.5 GOOGLE TRANSLATE ................................................... Error! Bookmark not defined. 1.6 TRADUO HUMANA ................................................... Error! Bookmark not defined. 1.7 MQUINA DE TRADUO ........................................... Error! Bookmark not defined. 1.8 SNTAXE ........................................................................... Error! Bookmark not defined. CAPTULO 2 METODOLOGIA ......................................... Error! Bookmark not defined. 2.1 TEXTO JORNALISTICO BASE ................................... Error! Bookmark not defined. 2.2 TEXTO TRADUZIDO PELA FERRAMENTA DE TRADUCAO GOOGLE TRANSLATE. ...................................................................... Error! Bookmark not defined. 2.3 TEXTO TRADUZIDO POR TRADUTOR HUMANO Error! Bookmark not defined. 2.4 ANLISE GRAMATICAL DOS ERROS ENCONTRADOS NO TEXTO ..........Error! Bookmark not defined. CAPTULO 3 .................................................................... Error! Bookmark not defined. CONCLUSO .................................................................. Error! Bookmark not defined.

10

CAPTULO 1
Nesta pesquisa, traaremos um paralelo entre a traduo humana e a traduo automtica, mais especificamente a traduo automtica gerada pelo sistema Google Translate. Utilizaremos de um texto jornalstico base, na lngua inglesa, que ser traduzido primeiramente por um humano e depois pelo Google Translate, e, posteriormente os dois resultados sero comparados e tentaremos explicar, gramtica, morfolgica, lxica e semanticamente, atravs do estudo da sintaxe dos dois textos, quais so as falhas, as condies e as limitaes do sistema de traduo automtica utilizado.

1.1INTRODUO

A traduo automtica entre lnguas humanas um sonho de enorme importncia social, poltica e cientifica. Foi uma das primeiras utilizaes sugeridas para os computadores, mas tornar esse sonho em realidade se mostrou uma tarefa muito mais difcil e em alguns aspectos muito mais interessante do que parecia. Porm, apesar de permanecerem alguns problemas considerveis, uma pequena parte da traduo automtica uma realidade diria, e provvel que durante a prxima dcada,boa parte das tradues tcnicas e de atividades comerciais sero feitas com algum tipo de ferramenta de traduo automtica,com base de dados

humilde,contendo tradues de termos tcnicos que podem esboar tradues razoavelmente boas.

Alguns problemas so interessantes por serem fceis de resolver, outros, por serem difceis. Os problemas com que iremos lidar so do segundo tipo. Eles so interessantes porque toda teoria e metodologia de traduo apresentaram problemas e tentaram lidar com eles de sua prpria maneira. No se sabe exatamente onde ou quando a preocupao com os problemas de traduo tiveram sua origem. Seu inicio, foi, presumidamente relacionado conscincia que a humanidade estava predestinada pela natureza a falar vrias lnguas diferentes, e que no seria, nem deveria, ser remediada por uma lngua universal. A humanidade poliglota teve grandes consequncias na comunicao, essas consequncias so relatadas na bblia

11

na chamada Torre de Babel. O mito da torre de Babel pode ser visto como a fasca que deu incio a uma discusso permanente sobre a teoria, metodologia e prtica da traduo. Essas trs questes podem ser encaixados no tema de estudos de traduo (translation studies ou TS), um termo que foi criado por James S. Holmes em 1972, na poca em que as pesquisas sobre traduo se apresentavam mais como uma coleo de mtodos e tcnicas do que um esforo fundamentado e intelectual.

Nos ltimos 35 anos, os estudos de traduo tiveram uma exploso enorme, presumidamente porque a comunicao via traduo cientificamente mais difcil que a comunicao monolingual e porque na traduo difcil balancear fontes comunicativas com necessidades comunicativas. Se olharmos a expanso aparente do interesse em traduo durante esse perodo, estaremos inclinados a dizer que os estudos da traduo em sua forma moderna tiveram sua origem em meados do sculo vinte. Enquanto verdade que tericos de traduo anteriores a esse tempo no tinham as ferramentas necessrias para a pesquisa emprica e eram muitas vezes unilaterais em suas suposies,ainda assim,eles nos trouxeram uma quantidade significativa de observaes,hipteses e perspectivas,juntos com muitas observaes perspicazes que sobreviveram a passagem do tempo. At seus erros e becos sem sada foram instrutivos de um jeito ou de outro.Ao mesmo tempo,a magnitude e a complexidade do assunto levaram a perceber que uma combinao de pensamentos tradicionais e conceitos cognitivos autnticos so necessrios e que as observaes mltiplas de dados autnticos devem ser trazidos ao centro de um nmero relativamente pequeno de princpios. O mais importante desses,para ns, o fato de que na performance do tradutor,conhecimento e habilidades so inseparveis.Esse conceito tem consequncias importantes para a organizao dessa pesquisa.

Nesta pesquisa, traaremos um paralelo entre a traduo humana e a traduo automtica, mais especificamente a traduo automtica gerada pelo sistema Google Translate.Utilizaremos de um texto jornalstico base,na lngua inglesa,que ser traduzido primeiramente por um humano e depois pelo Google

Translate,e,posteriormente os dois resultados sero comparados e tentaremos explicar,gramtica,morfolgica,lxica e semanticamente,atravs do estudo da sintaxe dos dois textos,quais so as falhas,as condies e as limitaes do sistema de traduo automtica utilizado.

12

1.2 A HISTRIA DA TRADUO AUTOMTICA

Neste captulo apresentaremos os primeiros registros sobre traduo automtica, desde o ano 1947, a criao dos primeiros sistemas automticos, graas a criao do computador, e os avanos at os dias de hoje, alm dos estudos na rea de inteligncia artificial que podem afetar a traduo automtica.

Existem dvidas em relao a quem teve a primeira ideia de traduzir automaticamente as lnguas humanas, mas o desenvolvimento da traduo automtica pode ser traado nas conversas e correspondncias entre Andrew D. Booth, um cristalgrafo britnico e Warren Weaver, da Fundao Rockfeller em 1947, e mais especificamente em um memorando escrito por Weaver em 1949 para a Fundao Rockfeller que inclua as seguintes frases: Eu tenho um texto em frente de mim que escrito em russo,mas eu vou fingir que ,na verdade,escrito em ingls e que foi codificado em smbolos estranhos.Tudo que eu tenho de fazer desvendar o cdigo,a fim de recuperar a informao contida no texto.

A analogia da traduo e decodificao pode parecer ao leitor sofisticado como simplista e mais tarde no memorando Weaver props algumas teorias mais sofisticadas, mas que tinham a virtude de tornar uma tarefa aparentemente difcil em uma que poderia ser mais facilmente abordada com a tecnologia emergente do computador. Esse memorando desencadeou uma quantidade significante de interesse e pesquisas, e por volta de 1950 existia uma grande quantidade de grupos de pesquisa trabalhando na Europa e nos Estados Unidos,representando um investimento financeiro significante.

Mas, apesar do sucesso e do fato de que muitas perguntas foram levantadas e continuam relevantes at o dia de hoje, houve um desapontamento generalizado por parte das autoridades que investiam financeiramente nas pesquisas, por conta da falta de retorno do investimento que estava sendo feito, e dvidas quanto a possibilidade

13

da automatizao da traduo em geral, ou pelo menos no estado atual do conhecimento.

Quando se tornaram disponveis certos tipos de computadores eletrnicos, ento,a euforia no setor chegou ao seu auge.Mas logo as mquinas deram a entender que eram simples mquinas,por mais complicadas que pudessem parecer,e havia questes banais,como a da escolha entre good evening e good night,que elas no sabiam como resolver.(CAMPOS,1986,p.17)

As dvidas tericas foram apresentadas mais claramente pelo filsofo BarHillel em um relatrio em 1959, onde ele argumentada que tradues automticas completas e de alta qualidade eram impossveis, no s no presente, como em principio.O problema que ele levantou foi o de encontrar a traduo correta da palavra pen, em um contexto como a seguir:

John was looking for his toy box. Finally he found it. The box was in

the pen. John was very happy. O argumento foi que nesse caso pen, s poderia ter a interpretao de playpen (cercado), e no a do instrumento de escrita pen (caneta), isso poderia ser critico na deciso da escolha correta da traduo de pen, pois, descobrir a interpretao correta depende de conhecimentos gerais sobre o mundo e no haveria como construir esse tipo de conhecimento em um computador. Talvez se possa dizer que a traduo humana, feita por seres humanos, por oposio traduo mecnica, tambm dita automtica, feita por mquinas mais ou menos sofisticadas, problemtica sempre, ainda quando mais parece aproximar-se, de pura e simples troca de palavras da lngua da qual se traduz por palavras da lnguas para a qual se traduz.(CAMPOS,1986 ,p.15) Alguns desses pontos apontados por ele foram e ainda so bem aceitos. Talvez, as tradues automticas completas e de alta qualidade sejam impossveis, mas isso no significa que algumas formas mais simples de traduo automtica sejam impossveis ou inteis.

14

No entanto, historicamente, esse fato foi importante pois sugeriu que as pesquisas deveriam se focar mais nos problemas fundamentais no processo e entendimento das lnguas humanas.Com isso, em 1964, o Conselho Nacional de Pesquisa criou o ALPAC(Automatic Language Processing Advisory Comittee) para realizar uma avaliao real dos sistemas de traduo automtica existentes, o qual era liderado pelo cientista John R. Pierce. Dois anos depois,foi redigido um relatrio o qual desconsiderava todos os avanos conseguidos at aquele momento e a traduo automtica foi totalmente desacreditada. Foram reconhecidas as inmeras dificuldades do processo tradutrio atravs do uso de mquinas, dentre as quais o insuficiente conhecimento das lnguas e as tcnicas de informao inadequadas. Nas partes finais do relatrio, que foi bastante condenatrio, foi concludo que no existia escassez de tradutores humanos e que no havia expectativa da traduo automtica produzir tradues eficientes como as que os tradutores humanos produzem. Esse relatrio resultou no fim das investidas financeiras do governo dos Estados Unidos em pesquisas a respeito de traduo automtica. Pior ainda, levou a uma perda geral de moral no campo da traduo, pois as pesquisas foram percebidas como infundadas. O fantasma do relatrio da ALPAC, com suas ameaas de remoo completa de fundos e desmoralizao ainda assombram os que trabalham nas pesquisas sobre traduo automtica. Provavelmente no deveria, pois as realizaes da traduo automtica so reais, mesmo que no alcancem a meta de traduo completa e de alta qualidade em sua totalidade. A traduo automtica no fico cientifica, nem um mero tpico para especulao cientifica, uma realidade diria em alguns lugares, e para alguns fins. No entanto, o medo compreensvel, por causa da concluso do relatrio ser quase inteiramente errnea. Primeiramente, a ideia de que no haveria necessidade de tradues automticas absurda. Similarmente, a sugesto de que no haveria expectativa de uma traduo automtica bem sucedida parece ter sido baseada numa viso restrita da traduo inteiramente automtica e de alta qualidade, em particular, na ideia de que a traduo automtica que necessita de reviso no real. Mas, tendo em mente o ganho considervel de tempo que pode ser alcanado automatizando a etapa de rascunho da traduo, essa viso ingnua.

15

Hutchins (1986, p.15) destaca que: Em contraste com as aspiraes da primeira dcada de pesquisa, os objetivos dos pesquisadores da traduo automtica agora tornaram mais realistas, as tradues j no deveriam ser esteticamente perfeitas, o objetivo era facilitar a leitura e a fidelidade ao original. Ao mesmo tempo, que agora surgiram uma srie de sistemas linguisticamente mais avanados baseados em abordagens indiretas e houve um aumento na variedade de lnguas fonte e alvo. A concluso central de que a traduo automtica no representa um objetivo til de pesquisa ou desenvolvimento tomou conta de todos, e o nmero de grupos e indivduos envolvidos nas pesquisas de traduo automtica diminuiu

dramaticamente. Nos prximos dez anos, as pesquisas permaneceram vivas pelos grupos fundados pela igreja Mormom, que tinham interesse na traduo da bblia (o trabalho deles, que foi feito na Brigham Young University em Provo, Utah, levou aos sistemas WEIDNER e ALPS, dois sistemas comerciais notveis), e alguns grupos no Canad (em especial o grupo TAUM em Montreal, que desenvolveu o sistema METEO), a USSR (em especial os grupos liderados por Melcuk e Apresian), e Europa (especialmente o grupo GETA em Grenoble, o grupo mais influente nesse perodo, e o grupo SUSY em Saarbrucken). Uma pequena frao dos fundos e esforos que foram devotados a traduo automtica foram destinados a pesquisas mais importantes em Lingustica Computacional e Inteligncia Artificial, e parte desses trabalhos teve a traduo automtica como um objetivo em longo prazo, at mesmo nos Estados Unidos (o trabalho de Wilk nas pesquisas de inteligncia artificial notvel nesse aspecto). No foi at o final da dcada de 1970 que as pesquisas em traduo automtica foram submetidas a um renascimento. Campos (1987, p. 22) ressalta que: A verdade, entretanto, que as maquinas por enquanto no atendem as convenincias de quem delas espera espcies de milagre: a fabricao em serie de tradutores mecnicos prontos a traduzirem qualquer texto, de qualquer lngua para qualquer outra, com a velocidade da luz que a velocidade da energia eltrica, com que operam os computadores.

16

Houve vrios sinais em relao ao renascimento das pesquisas,a Comission on the European Communities (CEC) comprou a verso Ingls-Francs do sistema SYSTRAN,um decendente otimizado dos sistemas mais antigos desenvolvidos na universidade de Georgetown ( em Washington,DC),um sistema Russo-Ingls cujo desenvolvimento continuou mesmo aps o relatrio da ALPAC,e o qual foi usado por ambos USAF e NASA.O CEC tambm autorizou o desenvolvimento de uma verso Francs-Ingls e uma Italiano- Ingls do sistema.

Aproximadamente ao mesmo tempo, houve uma expanso rpida na atividade de traduo automtica no Japo, e o CEC tambm comeou a organizar o que se tornaria o projeto EUROTRA, baseado no trabalho dos grupos GETA e SUSY. Esse foi,provavelmente,o maior e com certeza mais ambiciosos projeto em pesquisa e desenvolvimento em processamento de linguagem natural.O objetivo era produzir um sistema de traduo automtica pr-industrial de design avanado(o que ns chamamos de sistema de conhecimento lingustico) para as linguagens EC.No fim da dcada de 70 tambm a Pan American Organization (PAHO) comeou a desenvolver um sistema Espanhol-Ingls (SPANAM), a fora area dos Estados Unidos financiou o trabalho no sistema METAL no centro de pesquisas lingusticas, na universidade do Texas,em Austin,e os resultados das pesquisas do grupo TAUM (Traduction Automatique de LUniversit de Montreal) levaram a instalao do sistema METEO.Na maior parte,o histrico da traduo automtica na dcada de 80 a historia dessas iniciativas e a explorao dos resultados nas disciplinas vizinhas.

17

1.3 FERRAMENTAS DE TRADUO BASEADAS EM DICIONRIO

Arnold (2008) ressalta que, um ponto para manter em mente que o apoio na traduo pode ser dado sem fornecer traduo automtica completa. Todos os sistemas de traduo automtica so ligados dicionrios eletrnicos, que, para a presente discusso, podemos considerar como variveis sofisticadas das suas verses impressas em papel. Esses dicionrios eletrnicos podem ser de imensa ajuda mesmo que sejam usados sem traduo automtica de texto. Em alguns sistemas de traduo automtica o tradutor pode clicar numa palavra do texto origem, onde se abrir uma nova janela com vrios significados, o tradutor clica no mais adequado e a palavra se insere no texto alvo no meio de uma frase em branco, onde o tradutor pode inserir texto antes e depois da palavra, a encaixando no contexto do texto. J que, textos tcnicos, por exemplo, tipicamente contem uma quantidade grande de termos e suas tradues nem sempre so lembradas pelo tradutor. Essa uma forma simples de apoio que pode economizar bastante tempo. Os dicionrios so ferramentas de trabalho do tradutor. Por mais valiosas que possam ser, so ferramentas e s. Depois das, at agora, frustradas tentativas de busca a maquina de traduzir, alguns tradutores podem contar agora com um dicionrio informatizado,como se diz,de rica memria e fcil acesso, rapidssimo no manuseio. claro que um dicionrio em forma de computador eletrnico ter qualidade de suas referencias dependente da aptido de quem o programar para esse fim, mas vamos fazer de conta que o programador foi competentssimo, tanto no uso da maquina quanto no uso da lngua, ou das lnguas, ai teremos como ferramenta, um dicionrio muito til e rpido, mas nem por isso menos dicionrio,e menos ferramenta. (CAMPOS, 1986, p.51)

18

1. 4 DESEMPENHO DAS PESQUISAS DE TRADUO

AUTOMTICA
De acordo com Lehrberger/Borbeau (1988), as pesquisas de traduo automtica tendem a caracterizar quatro nveis de sofisticao (que, ao mesmo tempo, representam quatro geraes em sequncia lgica de traduo automtica) Substituio palavra por palavra Traduo humana assistida por traduo automtica Traduo automtica assistida por humano Traduo completamente automtica

Como a historia da pesquisa de traduo automtica tem demonstrado abundantemente, substituio palavra por palavra, comercialmente sem valor, por que mesmo um expert no assunto ter dificuldade para extrair o significado de um documento que parcial ou inteiramente ininteligvel por causa das distores da traduo palavra por palavra. Uma possivel exceo so frases estruturadas da maneira mais simples possivel,contendo,por exemplo,uma frase que consista de artigo + verbo,como o homem.

19

1.5 GOOGLE TRANSLATE


De acordo com o prprio site, o Google Translate um servio de traduo gratuito que fornece tradues instantneas em 58 idiomas. Foi desenvolvido pelo alemo Franz Josef Och, com o objetivo de facilitar a comunicao entre falantes de diferentes lnguas. O Google Translate surgiu em 2006 e em sua primeira fase, o Google adicionou ao seu banco de dados textos usados pela ONU em seis idiomas diferentes at chegar Internet, onde possvel que os usurios sugiram tradues mais adequadas para aumentar esse banco de dados. Hoje em dia,quando gera uma traduo, o Google Translate procura padres em centenas de milhares de documentos para ajudar a decidir qual a melhor traduo. Ao detectar padres em documentos que j foram traduzidos por tradutores humanos, o Google Translate determina qual a traduo apropriada. Esse processo de procurar padres em grandes quantidades de texto chamado de "traduo automtica estatstica". Porm, como todo tradutor automtico, ele possui muitas limitaes, pois trabalha com um sistema de estatstica e no baseado em regras. um sistema muito simples, pois se resume basicamente em escolher a lngua fonte e a lingua-alvo antes de inserir o texto a ser traduzido. O Google Translate no aplica regras gramaticais, j que seus algoritmos so baseados mais numa anlise estatstica do que na tradicional anlise baseada em regras. Mais especificamente, numa pesquisa feita por Och, que ganhou o concurso DARPA pela velocidade da mquina de traduo em 2003. Seu sistema no traduz de uma lngua para a outra, mas frequentemente traduz primeiramente para a lngua inglesa, e posteriormente para a lngua alvo. No entanto, por que o ingls, como todas lnguas humanas, ambguo e depende do contexto,isso pode causar erros na traduo.

20

1.6 TRADUO HUMANA


De acordo com Arnold (2008),os tradutores humanos precisam de pelo menos cinco tipos diferentes de conhecimentos: Conhecimento da lngua fonte Conhecimento da lngua alvo, que os permite produzir textos aceitveis

na lngua alvo. Conhecimentos das correspondncias entre lngua fonte e lngua alvo,

no nvel mais simples, o conhecimento de como palavras individuais podem ser traduzidas. Conhecimento do assunto a ser traduzido, incluindo conhecimentos

gerais e senso comum. Conhecimento da cultura, convenes sociais, expectativas, e outros

detalhes do cotidiano dos falantes da lngua fonte e da lngua alvo. Esse ltimo tipo de conhecimento o que permite os tradutores serem mediadores genunos, garantindo que o texto alvo comunica genuinamente a mesma mensagem, e tem o mesmo impacto no leitor que o texto fonte. Arnold (2008) tambm ressalta que o conhecimento da lngua alvo importante porque, sem ele, o que um tradutor humano ou automtico produzir ser inaceitvel ou gramaticalmente incorreto. Conhecimento da lngua fonte importante porque a primeira tarefa do tradutor humano descobrir o que as palavras do texto fonte significam (sem saber o que elas significam impossvel descobrir seus equivalentes na lngua alvo). Os vrios tipos de conhecimentos lingusticos so: Conhecimento fonolgico Conhecimento morfolgico: conhecimento sobre como as palavras

podem ser construdas Conhecimento sinttico: conhecimento sobre como frases, e outros

tipos de frases, podem ser formadas com palavras.

21

Conhecimento semntico: conhecimento sobre o que palavras e frases

significam, sobre como o significado de uma frase relacionado ao significado das palavras que a compe. Parte desse conhecimento conhecimento sobre palavras individuais e representado nos dicionrios, por exemplo, o fato de que a palavra escrever soletrada desse jeito, que no feita de outras palavras, que um verbo, que tem um significado relacionado a outros verbos, etc. Os sistemas de traduo automtica podem se classificar segundo: o mtodo ou paradigma. Os mtodos esto divididos em trs classes: Traduo automtica direta Traduo automtica por transferncia Traduo automtica por interlngua.

Os trs nveis correspondem a diferentes nveis de transferncia, dependendo da profundidade da anlise fornecida pelo sistema.

22

1.7 MQUINA DE TRADUO

De acordo com Wilss (1996), as primeiras patentes para mquinas de traduo foram feitas em 1930. Uma proposta, por Georges Artsrouni, foi simplesmente um dicionrio bilngue automtico usando fita de papel. Outra proposta, feita pelo russo Peter Troyanskii foi mais detalhada. Inclua ambos os dicionrios bilngues e um mtodo para lidar com a gramtica diferenciada de cada uma das lnguas, baseadas no Esperanto. O sistema foi dividido entre trs estgios: o primeiro foi para um editor nativo da lngua nas lnguas fonte para organizar as palavras em suas formas lgicas e funes sintticas, o segundo foi para a maquina traduzir essas formas para a lngua alvo, e o terceiro foi para um editor nativo da lngua para a lngua alvo para normalizar o resultado final. O esquema permaneceu desconhecido at o final dos anos 50, poca em que os computadores j eram bastante populares. Muito se estudou a traduo a partir da Informtica (processamento automtico da informao) e da Lingstica, mas a concluso a que se chegou foi a de que qualquer mquina s ser capaz de traduzir bem se for manipulada por um bom tradutor, e isso viria aumentar ainda mais, em vez de diminuir, os custos da traduo. A Lingstica, por sua vez, mostrou-se incapaz de prever ou evitar os erros de traduo, muito embora seja capaz de identific-los onde quer que apaream. (CAMPOS, 1987, p.21)

A mquina de traduzir visa apenas a traduo tcnica, cuja importncia sobreleva-se cada vez mais a traduo artstica. Observese que o bom tradutor tcnico ainda mais raro que o bom tradutor literrio. Quando bom fillogo, pouco entende de cincia, se bom cientista, ignora os recursos e os expedientes da filologia. De mais a mais, o especialista de Fsica, Biologia ou Qumica,quando realmente capaz,preferir de muito o trabalho de laboratrio ao de traduo. (CAMPOS,1987,p.146)

23

1.8 SNTAXE

A Sintaxe a parte da gramtica que estuda a disposio das palavras na frase e a das frases no discurso, bem como a relao lgica das frases entre si. Ao emitir uma mensagem verbal, o emissor procura transmitir um significado completo e compreensvel. Para isso, as palavras so relacionadas e combinadas entre si. A sintaxe um instrumento essencial para o manuseio satisfatrio das mltiplas possibilidades que existem para combinar palavras e oraes. Uma das tcnicas consideradas mais promissoras na rea de traduo automtica so as tcnicas baseadas em sintaxe. Nem sempre as frases se organizam com absoluta coeso gramatical. O empenho de maior expressividade leva-nos, com frequncia, a superabundncias, a desvios, a lacunas nas estruturas frsicas tidas por modelares. Em tais construes, a coeso gramatical substituda por uma coeso significativa, condicionada pelo contexto geral e pela situao. Os processos expressivos que provocam essas particularidades de construo denominam-se figuras de sintaxe. (CUNHA, 1917, p.619) Conforme Wilss (1996, p.221), a complexidade de uma traduo inteiramente automatizada dada devido complexidade sinttica. As estruturas sintticas se provaram extremamente complexas para serem analisadas automaticamente, assim como os exemplos a seguir mostram: a)...the girl who talked to the teacher about the problem... b)the teacher to whom the girl talked about the problem c)the problem that the girl talked to the teacher about Esse exemplo, emprestado de Halle et al.(1978: 132), obviamente muito complexo para uma mquina analisar. A razo para isso que a frase preposicional about the problem marcada pela disconstituncy, com that the girl talked to the teacher intervindo contextualmente entre the problem e a preposio adiada about, assim, tornando impossvel para a mquina determinar corretamente a relao de dependncia entre o sintagma preposicional about the problem.

24

CAPTULO 2 METODOLOGIA
Nesta pesquisa, traaremos um paralelo entre a traduo humana e a traduo automtica, mais especificamente a traduo automtica gerada pelo sistema Google Translate. Utilizaremos de um texto jornalstico base, na lngua inglesa, que ser traduzido primeiramente por um humano e depois pelo Google Translate, e, posteriormente os dois resultados sero comparados e tentaremos explicar, gramtica, morfolgica, lxica e semanticamente, atravs do estudo da sintaxe dos dois textos, quais so as falhas, as condies e as limitaes do sistema de traduo automtica utilizado. A principal questo de pesquisa ser: quais so as principais dificuldades gramaticais encontradas pelo tradutor automtico Google Translate?

25

2.1 TEXTO JORNALISTICO BASE


Never in my 23 years critiquing concerts have I seen such an elaborate entrance. Never in my 23 years critiquing music have I seen a show like Rammsteins. The German industrial metal band, known worldwide for its liberal use of pyrotechnics and theatrics on tour, literally burned its way through two hours and 20 songs that highlighted its 18-year career. The songs were nearly all in German, barely a smidgen of English lyrics slipped in, but the musicianship and the visuals were universal. There was an ongoing feud between lead singer Till Lindemann and keyboardist Christian Flake Lorenz that led to a jaw-dropping moment when Lindemann kept trying to ignite a cauldron-on-wheels with Lorenz inside. But the more he aimed a flame thrower at it, the more Lorenz popped up unscathed. The choreography, the pyrotechnic precision was astounding. The explosions were loud, blazing and plentiful. Lindemann constantly amazed with his fiery contraptions. He had a huge bow that spit out sparkles. He donned wings during Engel that burned at the tips. He stood center stage as a shower of twinkling fireworks engulfed him. He had a mini-torch in his mouth that shot flames about 20 feet into the air. I could write three more pages full of words aimed at retelling all that happened during that performance. But this Rammstein show defies descriptions.Ill be processing it for several days.

26

2.2

TEXTO

TRADUZIDO

PELA

FERRAMENTA

DE

TRADUCAO GOOGLE TRANSLATE.


Nunca, em meus 23 anos criticando concertos vi tal entrada elaborada. Nunca, em meus 23 anos de msica criticando vi um show como Rammstein. A banda de metal industrial alemo, conhecido mundialmente por seu uso liberal de pirotecnia e teatrais em turn, literalmente queimou o seu caminho atravs de duas horas e 20 msicas que destacou sua carreira de 18 anos. As msicas eram quase todos em alemo, mas a musicalidade e os visuais eram universais. Houve uma "briga" em curso entre o vocalista Till Lindemann e Christian tecladista "Flake" Lorenz, que levou a um momento de cair o queixo quando Lindemann continuou tentando acender um caldeiro-em-rodas com Lorenz dentro. Mas quanto mais ele apontou um lana-chamas para ele, o mais Lorenz surgiu ileso. A coreografia, a preciso pirotcnico foram surpreendentes. As exploses as exploses eram altos, ardente e abundantes. Lindemann constantemente espantado com as suas engenhocas de fogo. Ele tinha um arco enorme que cuspir brilhos. Ele vestiu asas durante o "Engel" que ardia nas pontas. Ele ficou no centro do palco como uma chuva de fogos de artifcio cintilantes engolfou. Ele tinha uma mini-tocha em sua boca que atirou chamas cerca de 20 metros no ar. Eu poderia escrever mais trs pginas cheias de palavras destinadas a recontar tudo o que aconteceu durante esse desempenho. Mas este show Rammstein desafia descries.Vou process-lo por vrios dias.

27

2.3 TEXTO TRADUZIDO POR TRADUTOR HUMANO


Nunca, em meus 23 anos criticando concertos, vi uma entrada to elaborada. Nunca, em meus 23 anos criticando msica, vi um show como do Rammstein. A banda de metal industrial, conhecida mundialmente por seu uso deliberado de pirotecnia e THEATRICS em turn, literalmente queimou seu caminho pelas duas horas e vinte msicas que destacaram sua carreira de dezoito anos. As msicas eram quase todas em Alemo, mas a musicalidade e o visual so universais. Houve uma disputa continua entre o cantor Till Lindemann e o tecladista Christian Flake Lorenz, que levou a um momento de cair o queixo, onde Lindemann tentava repetidamente incendiar um caldeiro com rodas, com Lorenz dentro. Mas quanto mais ele mirava um lana chamas no caldeiro, mais Lorenz aparecia ileso. A coreografia, a preciso pirotecnica foram surpreendente. As exploses foram barulhentas, em chamas e em abundancia. Lindemann espantou constantemente com suas engenhocas de fogo. Ele tinha um arco enorme que cuspia faiscas. Ele usou asas durante Engel que queimavam nas pontas. Ele ficou parado no meio do palco enquanto um banho de fascas o engolfou. Ele usou uma mini tocha em sua boca, que lanava chamas a 20 ps. Eu poderia escrever mais trs pginas cheias de palavras direcionadas a recontar tudo que aconteceu durante aquela performance. Mas este show do Rammstein desafia descries. Vou process-lo por vrios dias.

28

2.4 ANLISE GRAMATICAL DOS ERROS ENCONTRADOS NO TEXTO


Original Rammsteins. T.H. T.A. Analise Regncia Nominal. O tradutor automtico no consegue determinar a relao entre um substantivo, adjetivo ou advrbio transitivo e seu respectivo complemento nominal, devido complexidade sinttica da lngua natural, em contraste com a lngua artificial. The German industrial metal band, known worldwide A banda de metal industrial alemo, conhecida mundialmente A banda de metal industrial alemo, conhecido mundialmente Gnero: erro de concordncia nominal, o tradutor automtico no consegue determinar as palavras femininas ou masculinas e no sabe com qual substantivo o adjetivo concorda. Problema sinttico da lngua artificial. (...)20 songs that highlighted its 18-year career 20 msicas que destacaram sua carreira de 18 anos 20 msicas que destacou sua carreira de 18 anos Concordncia: o tradutor automtico no consegue determinar o sujeito com qual o verbo concorda.A lngua artificial no flexiona o verbo para concordar com o sujeito correto. The songs were nearly all in As msicas eram quase todas German em Alemo As msicas eram quase todos em alemo Gnero: erro de concordncia nominal, o tradutor automtico no consegue determinar as palavras femininas ou masculinas e no sabe com qual substantivo o adjetivo concorda. Problema sinttico da lngua artificial.

() have I seen a show like (...) vi um show como o do Vi um show como Rammstein Rammstein.

29

The

choreography,

the A coreografia, a preciso

A coreografia, a preciso pirotcnico foram surpreendentes

Gnero: erro de concordncia nominal, o tradutor automtico no consegue determinar as palavras femininas ou masculinas e no sabe com qual substantivo o adjetivo concorda. Problema sinttico da lngua artificial.

pyrotechnic precision were pirotcnica foram astounding. surpreendentes

The explosions were loud

As exploses foram barulhentas

As exploses eram altos

Gnero: erro de concordncia nominal, o tradutor automtico no consegue determinar as palavras femininas ou masculinas e no sabe com qual substantivo o adjetivo concorda. Problema sinttico da lngua artificial.

Lindemann constantly amazed with his fiery contraptions.

Lindemann espantou constantemente

Lindemann constantemente espantado

Concordncia: o tradutor automtico no consegue determinar o sujeito com qual o verbo concorda. Transformou a palavra de verbo para adjetivo, mudando a classe gramatical. Caso de desvio morfolgico.

30

Original He had a huge bow that spit out sparkles

T.H.

T.A.

Analise Concordncia: o tradutor automtico no consegue determinar o sujeito com qual o verbo concorda, nem o tempo verbal. As estruturas sintticas se provaram extremamente complexas para serem analisadas automaticamente

Ele tinha um arco enorme que Ele tinha um arco enorme que cuspia faiscas. cuspir brilhos

He donned wings during Engel that burned at the tips

Ele usou asas durante Engel que queimavam nas pontas

Ele vestiu asas durante o "Engel" que ardia nas pontas

Ambiguidade: o tradutor automtico reconhece a palavra burned como ardia, pois o lxico da lngua artificial ainda no consegue abarcar toda a complexidade das lnguas naturais, que encontrariam a palavra que se encaixa melhor no contexto da frase.

(...)all that happened during that performance.

tudo que aconteceu durante aquela performance

Tudo o que aconteceu durante esse desempenho

Ambiguidade: o tradutor automtico reconhece a palavra performance como sinnimo de desempenho, mas ela no se encaixa no contexto em que foi inserida devido, novamente, ao lxico da lngua artificial no ser to abrangente quanto o da lngua natural.

()a shower of twinkling fireworks engulfed him.

um banho de fascas o engolfou.

Uma chuva de fogos de artifcio cintilantes engolfou.

Colocao nominal: o tradutor automtico no consegue determinar a quem o verbo est ligado e a relao de dependncia entre as palavras, devido complexidade sinttica da lngua natural.

31

CAPTULO 3 CONCLUSO
Ao mesmo tempo em que a traduo automtica do Google Translate de grande ajuda para aqueles que precisam de uma traduo rpida e que ao menos traduza as palavras chave do texto, em um estudo mais profundo podemos perceber os pequenos, porm significativos, erros em seu sistema. Os erros mais frequentes identificados nessa pesquisa foram os de gnero e os de concordncia, isto aponta que o sistema lxico e sinttico do sistema de traduo, que utiliza da lngua artificial, ainda precrio em relao complexidade da lngua natural, que mais do que vocabulrio, apresentam sintaxe, regras sintticas complexas, sistema lxico extremamente abrangente e por isso tornam a tarefa de criar uma lngua artificial que imite com perfeio a lngua natural bastante distante de nossa atual realidade. Podemos citar um exemplo significativo no caso da frase estudada Lindemann constantly amazed with his fiery contraptions., que foi traduzida pelo Google Translate como Lindemann constantemente espantado, trazendo um caso de desvio gramatical, onde o qualificador (verbo) foi traduzido como um qualificado (adjetivo), mudando completamente o sentido da frase, pois a lngua artificial no consegue determinar o sujeito com qual o verbo concorda, devido a falhas na sintaxe, que um instrumento essencial para o manuseio satisfatrio das mltiplas possibilidades que existem para combinar palavras e oraes. Com esse estudo pudemos perceber ainda mais a complexidade da lngua natural, e como recri-la artificialmente um desafio, resolver ambigidades sintticas e semnticas so deixadas sem resoluo ou resolvidas por alguma regra mecnica, que, como pudemos ver, frequentemente resulta em erros. As estruturas sintticas se provaram extremamente complexas para serem analisadas

automaticamente. A lngua artificial requer a formalizao do conhecimento humano, programado em um sistema que pudesse entender como um humano processa a informao lingstica, e o utilizar para fabricar suas prprias tradues, e tal processo ainda no uma realidade mesmo sessenta e cinco anos aps os primeiros registros da traduo automtica.

32

REFERNCIAS BIBLIOGRFICAS
RONI, Paulo. Escola de Tradutores. 6.ed (rev e ampl). Rio de Janeiro: Nova Fronteira, 1987. Campos, Geir. Como fazer traduo. Petrpolis: Vozes/IBASE, 1986. Campos, Geir. O que traduo. So Paulo: Brasiliense, 1986. Coleo Primeiros Passos, n 166. HUTCHKINS, John. An Introduction to Machine Translation. Academic Press. 1992. LEHRBERGER, John, BOURBEAU, Laurent. Machine Translation: Linguistic Characteristics of Mt Systems and General Methodology of Evaluation. John Benjamins Publishing, 1988 WILLS, Wolfram. Knowledge and Skills in Translator Behavior. [Benjamins Translation Library, 15] 1996 ARNOLD, DOUG . MACHINE TRANSLATION: An Introductory Guide http://www.essex.ac.uk/linguistics/external/clmt/MTbook/ http://dc415.4shared.com/doc/YX81NCf_/preview.html http://www.tecgraf.pucrio.br/~carolina/monografia/funcionamento.html http://www.essex.ac.uk/linguistics/external/clmt/MTbook/PostScript/ http://www.dallasnews.com/entertainment/columnists/mariotarradell/20120523-concert-review-rammstein-fires-up-the-theatrics-during-atamerican-airlines-center.ece

Das könnte Ihnen auch gefallen