Sie sind auf Seite 1von 256

LINGUAGENS ESPECIALIZADAS EM COR P ORA

MODOS DE DIZER E INTERFACES DE PESQUISA

Cristina Lopes Perna Helosa Koch Delgado Maria Jos Finatto (Organizadoras)

LINGUAGENS ESPECIALIZADAS EM COR P ORA


MODOS DE DIZER E INTERFACES DE PESQUISA

Porto Alegre 2010

EDIPUCRS, 2010
CAPA Luciana

Braun Rico Bini REVISO DE TEXTO Cristina Perna e Helosa Delgado EDITORAO ELETRNICA Gabriela Viale Pereira
COLABORAO Luiza

L755 Linguagens especializadas em corpora : modos de dizer e interfaces de pesquisa [recurso eletrnico] / organizadoras, Cristina Lopes Perna, Helosa Koch Delgado, Maria Jos Finatto. Dados eletrnicos. Porto Alegre : EDIPUCRS, 2010. 255 p. Publicao Eletrnica Sistema requerido: Adobe Acrobat Reader Modo de Acesso: < http://www.pucrs.br/edipucrs/> ISBN 978-85-397-0024-0 (on-line) 1. Lingustica Computacional. 2. Processamento da Linguagem Natural. 3. Terminologia. 4. Lingustica Pesquisas. I. Perna, Cristina Lopes. II. Delgado, Helosa Koch. III. Finatto, Maria Jos. CDD 410

SUMRIO
Linguagens especializadas e terminologia: o passado projetando o futuro ............................................................................................................................ 6 Anna Maria Becker Maciel Chutando o balde ou batendo as botas? Processamento de linguagem natural e Expresses Multipalavra na linguagem cotidiana e cientfica ......29 Aline Villavicencio Carlos Ramisch O texto jurdico em traduo e verso: problemas e solues na linguagem dos contratos ............................................................................... 50 Cristina Lopes Perna Fazer Terminologia fazer Lingustica ........................................................ 72 Gladis Maria de Barcellos Almeida A familiarizao sobre o tema da traduo em meio formao para o ensino de lngua estrangeira ......................................................................... 91 Helosa Orsi Koch Delgado Terminologia Textual e Lingustica de Corpus: estudo em parceria ............. 128 Leonardo Zilio Para alm das terminologias: estudos de convencionalidade em linguagens cientficas .................................................................................. 152 Maria Jos Bocorny Finatto Aline Evers Cybele Margareth de Oliveira Alle Processamento de Linguagem Natural e o tratamento computacional de linguagens cientficas. ................................................................................. 183 Renata Vieira Lucelene Lopes O verbo modaL CAN em manuais de aviao em ingls: implicaes para materiais didticos ....................................................................................... 202 Simone Sarmento Macroestrutura e microestrutura do Dicionrio de Lingustica da Enunciao e as balizagens epistemolgicas de um campo: a teoria de mile Benveniste em exame........................................................................ 233 Valdir do Nascimento Flores

LINGUAGENS ESPECIALIZADAS E TERMINOLOGIA: O PASSADO PROJETANDO O FUTURO Anna Maria Becker Maciel 1
Resumo: O objetivo deste texto chamar a ateno para o estreito relacionamento da pesquisa das linguagens especializadas e a pesquisa terminolgica. Para tanto, recorre-se queles que, no perodo ureo da tradio wsteriana, realizaram pesquisa fundamental sobre a ento chamada lngua da cincia e da tecnologia luz de pressupostos da teoria lingustica. De acordo com seus ensinamentos, demonstra-se que a expresso lingustica dos especialistas no se limita ao uso de uma dada terminologia; mas que se conforma ao padro peculiar de comunicao caracterstico de diferentes reas do conhecimento. Tal padro resulta da seleo de itens lexicais e da preferncia de construes sintticas, processos semnticos e propsitos pragmticos, condicionados ao contexto de comunicao prprio da rea especializada. Nessa perspectiva, a integrao que existe entre a linguagem especializada e sua terminologia no permite que pesquisas sejam conduzidas separadamente.

1. Introduo
O que uma linguagem especializada? Existem linguagens especializadas sem terminologia? Existem terminologias fora das linguagens especializadas? As linguagens especializadas se compem apenas de termos? possvel integrar o estudo cientfico das linguagens especializadas, em outras palavras, a lingustica das linguagens especializadas e o estudo cientfico dos termos, isto , a terminologia? Essas so as questes que levanto e busco resposta atravs da releitura do legado dos linguistas que nos precederam na pesquisa da linguagem utilizada na cincia e na tcnica e no estudo da terminologia
Grupo de Pesquisa TERMISUL Projeto Terminolgico Cone Sul Programa de Ps-graduacao Letras - Universidade Federal do Rio Grande do Sul (UFRGS).
1

Linguagens Especializadas em Corpora

nos ltimos cinquenta anos. Dentre esses, sem menosprezar outros investigadores de igual autoridade, nos limites deste trabalho, recorro a Rostilav Kocourek, Juan Carlos Sager, Pierre Lrat e Lothar Hoffmann. Esses mestres, contemporneos nossos, trilharam longos caminhos desde o surgimento da Teoria Geral da Terminologia (TGT), atribuda a Eugen Wster (1974). Cada um ao seu modo, no contexto acadmico em que desenvolveu sua atividade, vivenciou a evoluo da fase pioneira dos estudos terminolgicos normativos exclusivamente centrados na denominao de conceitos para a fase contempornea dos estudos descritivos que contemplam os termos em sua realizao nos textos. Essa ltima fase se estende at nossos dias e se caracteriza pela efervescncia de propostas terico-metodolgicas em que se observa a preocupao com o estudo do texto. Meu objetivo contribuir para dirimir dvidas e mal-entendidos, remover obstculos, vencer preconceitos e estimular o avano da pesquisa das linguagens especializadas e da terminologia antes que acirrar discusses. Proponho uma reflexo desenvolvida em trs momentos: passado, presente e futuro. Para tanto, fao uma breve retomada das obras em que os quatro mestres expem seu pensamento sobre questes que ainda hoje so debatidas. Em seguida, procuro apresentar o que, no meu entendimento, parece ser hoje aceito, se no por todos, pelo menos por muitos dos que procuram resposta para a mesma problemtica. Finalmente, sem ter a pretenso de trazer solues, no sugiro uma volta ao passado, mas um esforo maior de aprofundamento de pressupostos fundamentais que levem reviso de procedimentos metodolgicos do presente com os olhos postos no futuro.

2. O passado
Na perspectiva da teoria da comunicao e sob a luz da teoria dos atos de fala, J. C. Sager, professor do MIST (Manchester Institute of Science and Technology) da Universidade de Manchester, com a colaborao de D.Dungworth e P.F. McDonald, publicou English Special Languages: principles and practice in science and technology, em 1980. Nessa obra, em uma abordagem essencialmente lingustica,

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

os autores procuraram descrever a linguagem especializada em todos os seus aspectos: cognitivo, semntico, pragmtico, sinttico e morfolgico. No se afastaram da tendncia ento vigente de considerar as linguagens especializadas como sistemas de comunicao restritos aos especialistas, mas perceberam a realidade do uso da linguagem especializada em um universo multidisciplinar sem fronteiras bem delimitadas entre os vrios campos de saber. Sem conceder prioridade ao enfoque cognitivo, no o ignoraram, enfatizaram os propsitos visados pelos interlocutores e focalizaram a expresso lingustica da informao transmitida. Fruto da reflexo terica e da prtica de professores de lngua inglesa que fundamentaram, na lingustica, a experincia docente adquirida no manuseio constante de textos especializados, a obra se constitui em um verdadeiro tratado de lingustica da lngua inglesa, usada na cincia e na tecnologia. Sua definio de lnguas especiais, special languages, se tornou clssica: sistemas semiticos complexos semi-autnomos, baseados e derivados da lngua comum, seu uso pressupe educao especial e restrito comunicao entre especialistas da mesma rea e de reas estreitamente relacionadas (SAGER, DUNGWORTH E MACDONALD, 1980, p.69 2; Minha traduo). Hoje, Sager (2007, p. 116), diante das exigncias de um mundo globalizado e da multiplicao das necessidades de informao do grande pblico, admite que essa definio merece ser, em parte, reformulada e que a anlise e a descrio das linguagens especializadas devem ser revisadas, exceto no que diz respeito s disciplinas puramente cientficas. Pierre Lerat, professor de lingustica da Universit Paris-Nord, tambm enfatiza as funes da linguagem especializada e sua pertinncia ao sistema da lngua, mas prefere dizer langues spcialises, lnguas especializadas, ttulo que escolheu para sua obra publicada em 1995. Nela, ele desenvolve um estudo pluridimensional
2

Special languages are semi-autonomous, complex, semiotic systems based and derived from general language; their use presupposes special education and is restricted to communication among specialists in the same and closely related fields. (SAGER, DUNGWORTH, MACDONALD, 1980, p. 69)

Linguagens Especializadas em Corpora

centrado nos pressupostos da lingustica geral, examinando a linguagem da cincia e da tcnica sob o ponto de vista gramatical e semntico. Ele define uma lngua especializada 3 como:
[...] o uso de uma lngua natural para dar conta tecnicamente de conhecimentos especializados [...]. A lngua especializada , em primeiro lugar, uma lngua em situao de uso profissional (uma lngua na especialidade como diz a escola de Praga). a prpria lngua como sistema autnomo, mas ao servio de uma funo maior: a transmisso de conhecimentos. (LERAT, 1995, p.221. Minha traduo).

Como Sager et alii, Lerat tambm enfatiza o aspecto pragmtico da comunicao do conhecimento manifesto na linguagem especializada, mas enquanto aqueles procuraram fundamentao na teoria dos atos de fala de Austin (1978), ele busca apoio na teoria da enunciao de Benveniste (1989). Lerat afirma que seu livro uma reflexo global sobre as lnguas de especialidade, raramente abordadas, com preocupaes de teoria lingustica, e defende que uma teoria das lnguas especializadas s pode ser baseada em uma teoria geral das lnguas que considere os termos como denominaes de conhecimentos (LERAT, 1995, p.24). Em 1982, Kocourek, linguista de origem eslava, professor de lingustica do Departamento de Estudos Franceses da Universidade Dalhousie, em Halifax no Quebec, publicou La Langue Franaise de la Technique et de la Science: vers une linguistique de la langue savante. O subttulo, para uma lingustica da lngua erudita, 4 anuncia uma corajosa empreitada que ainda hoje est em pauta e objeto de
[...] l'usage d'une langue naturelle pour rendre compte techniquement de connaissances spcialises [...] La langue spcialise est d'abord une langue en situation d'emploi professionnel (une langue en spcialit, comme dit l'cole de Prague). C'est la langue ellle-mme (comme systme autonome) mais au service d'une fonction majeure: la transmission de connaissances. (LRAT, 1995, p.21). 4 Cest la langue de la recherche philosophique, sociologique, pdagogique, linguistique, technoscientifique (au sens ci-dessus) gographique et historique (classes CDU) (KOCOUREK ,1991, p.35).
3

10

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

controvertidos debates de terminlogos que somente consideram os termos e de linguistas que s acreditam nos textos. Para Kocourek (1991, 36) 5 a lngua de especialidade (langue de spcialit), que ele coloca como hipernimo de lngua tecnocientfica (langue technoscientifique) e lngua erudita (langue savante),
[...] uma variedade de lngua com predominncia cognitiva, cujos textos, cumulativos, de emotividade, subjetividade, metaforicidade controlados, e delimitados de maneira externa, tm por objetivo significar e comunicar, no seio de uma coletividade restrita, o contedo temtico ponderado e circunstanciado, e cujos recursos, que subjazem a esses textos sobre todos os planos lingusticos, so marcados por caracteres grficos, por tendncias sintticas e sobretudo por um conjunto rapidamente renovvel de unidades lexicais que exigem, e recebem nos textos uma preciso semntica metalingustica (p.42) (Minha traduo).

Kocourek enfatiza em sua obra que a lngua especializada um subconjunto da lngua comum com recursos prprios e de uso restrito a uma coletividade que partilha os mesmos interesses. Tais recursos so os mesmos da lngua comum, mas so selecionados, adaptados e enriquecidos de acordo com as necessidades e os propsitos da rea, tendo em vista a preservao do contedo a ser transmitido. Nessa perspectiva, a linguagem de especialidade antes de tudo um meio de expresso de um contedo temtico.
5

La langue de spcialit est une varit de langue dominante cognitive, dont les textes, cumulatifs, dmotivit, de subjectivit, et de mtaphoricit contrles, et dlimits de manire externe, ont pour but de signifier et de communiquer, ao sein dune collectivit restreinte, le contenu thmatique, raisonn et circonstanci, et dont les resources, qui sous-tendent ces textes sur tous les plans linguistiques, par des tendances syntaxiques, et surtout, par um ensemble rapidement renouvelable des units lexicales qui requirent, et reoivent dans les textes, une prcision smantique mtalinguistique (ibidem, p.36)

Linguagens Especializadas em Corpora

11

Esse contedo transmitido por palavras que referem conceitos especficos e que constituem uma terminologia prpria, que separada do seu meio de expresso natural, o texto especializado, no subsiste. Desse modo, o estudo da terminologia complementa o estudo dos textos especializados, diz Kocourek, (1991b, p.75) 6 e ainda acrescenta que dizer que a abordagem terminolgica foi substituda pela lingustica dos textos especializados no exato. O estudo da linguagem especializada foi ampliado a fim de abranger o plano textual e que esse estudo hoje mais complexo e satisfatrio (minha traduo). Alguns anos depois da primeira edio publicada em 1981, e em 1991, reeditada a obra, o autor ampliou a discusso sobre a necessidade de tal lingustica. Nesse sentido, reforou a proposta calcada sobre as caractersticas da lngua de especialidade e o relacionamento fundamental entre texto e termo, que ele caracteriza como dois fatores irredutveis da linguagem especializada. Justamente esse tpico interessa sobremaneira reflexo aqui empreendida. Deve-se a Lothar Hoffmann e ao grupo de linguistas germnicos por ele encabeados, a publicao de uma obra gigantesca de 1369 pginas, contendo uma coleo de artigos sobre a pesquisa das linguagens especializadas e da terminologia Fachsprachen. Languages for Special Purposes, Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft An International Handbook of Special Language and Terminology Research. . 7 O que chama ateno nessa obra que seu contedo rene a pesquisa das linguagens especializadas e a terminologia. Essa combinao em um empreendimento de tanto flego me leva a acreditar que tambm o grupo germnico no quer afastar o estudo texto especializado da pesquisa de seus termos, corroborando aquilo que tanto Sager, Lerat e Kocourek afirmaram j nos anos 80 como consequncia de seus
6

Dire que lapproche terminologique a et remplace par la linguistique des textes spcialiss nest pas exact. Cest plutt que ltude de la langue spcialise a t largie afin de comprendre le plan textuel, et quelle est aujourdhui plus complexe et satisfaisante (Kocourek, (1991b, p.75) 7 Minha traduo: Lnguas para Finalidades Especficas. Um Manual Internacional para a Pesquisa da Linguagem Especializada e da Terminologia.

12

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

estudos nas dcadas precedentes 80 e que o prprio Hoffmann tambm sempre defendeu. Lothar Hoffmann, que, desde os anos sessenta at 1993, exerceu a docncia de Lingustica Aplicada na Universidade de Leipzig e ainda hoje mantm contacto com alunos e pesquisadores, tambm acredita na necessidade de um estudo lingustico sistemtico das linguagens especializadas, fundamentado em slidos princpios tericometodolgicos. Suas numerosas obras, entre as quais destaco, Kommunikationsmittel Fachsprache (1967) e Zum Fachwort zum Fachtext (1988) 8 apresentam as linhas mestras da rea de estudo que ele denomina Fachsprachenlinguistik (Lingustica das Lnguas Especializadas). Segundo ele, essa lingustica d especial ateno ao texto como um todo funcional e estrutural da lngua comum que usa determinadas formas lexicais, construes sintticas e textuais que caracterizam a comunicao da rea temtica. Ao mesmo tempo, valoriza a terminologia como o ncleo lingustico da linguagem especializada e salienta que a pesquisa das terminologias e das construes sintticas do texto especializado continua necessria e produtiva (HOFFMANN 1988, apud BRUMME, 1998, p,71-78). Nesse contexto, coloca em igual patamar a pesquisa do texto e a pesquisa das palavras nele usadas, afirmando que as unidades lxicas do texto especializado pertencem em sentido mais amplo ao lxico especializado, j que contribuem para o processo de comunicao de uma maneira direta ou indireta. Nesse entendimento, juntamente com as palavras tradicionalmente consideradas termos, as palavras funcionais, como conjunes, preposies e as palavras no tematicamente marcadas merecem ser descritas e analisadas. Em consonncia com Finatto, (2001, p.61), quero destacar que quando se fala em texto especializado, no se pode deixar de mencionar Lothar Hoffmann que, ultrapassando a concepo wsteriana de texto artificial, aproximou-o do texto elaborado na linguagem comum. Assim ensina Hoffmann:

Minha traduo: Linguagem especializada como meio de comunicao (1967). Da palavra especializada para o texto especializado (1988)

Linguagens Especializadas em Corpora

13

O texto especializado o instrumento ou o resultado de uma atividade comunicativa scio-produtiva especializada. Compe uma unidade estrutural e funcional (um todo) e est formado por um conjunto ordenado e finito de oraes coerentes pragmtica, sinttica e semanticamente ou de unidades com valor de orao, que, como signos lingusticos complexos, de enunciados complexos do conhecimento humano e de circunstncias complexas, correspondem realidade objetiva (HOFFMANN, 1988, apud BRUMME, 1998, p.77. 9 Minha traduo) .

Assim, entende-se o texto especializado como o texto configurado na comunicao verbal dialgica de um interlocutor para o outro em um contexto que versa sobre uma especialidade. Ainda que tal comunicao possa ser realizada de muitas maneiras e atravs de mltiplos canais, quando se fala em texto especializado, usualmente se considera o texto escrito, pois, como diz Lerat (1995, p.56) quem diz texto diz suporte (pedra, pergaminho, papel, meio eletrnico) e formalizao da informao (frase, frmula, figura, esquema, diagrama, organograma, etc.). Talvez a noo exclusiva do texto escrito ainda seja uma herana da mentalidade vigente nos primrdios dos estudos terminolgicos modernos, quando se pensava na linguagem da tcnica e da cincia somente como uma realizao escrita. De outro lado, a perenidade, a disponibilidade de acesso e, acima de tudo, as possibilidades de divulgao do texto especializado escrito asseguram sua precedncia sobre o oral. Por isso, considerando que a comunicao e o registro do conhecimento so imprescindveis para a
9

El text especializat s linstrument o el resultat de lactivitat comunicativa exercida en relaci amb una activitat socioproductiva especialitzada. Forma una unitat estructural i funcional (un tot) i est format per un conjunt finit i ordenat doracions coherents pragmticament, sintacticament i semnticament o dunitats amb valor doraci, que, com a signes lingistics complexos denunciats complexos del coneixement hum i de circumstncies complexes, corresponen a la realitat objectiva. HOFFMANN, L. (1988). Grundbegriffe der Fachsprachenlinguistik. In: Der GinkoBaum. Germanistisches Jahrbuch fr Nordeuropa, Siebente Folge. Helsinki.

14

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

constituio de um campo de saber, pode-se dizer que nenhuma rea especializada sobrevive sem o texto escrito. No entanto, isso no significa que o texto oral seja excludo do conceito da linguagem especializada que tanto falada como escrita de acordo com os respectivos recursos e exigncias de cada modalidade de expresso.

3. O presente
O que entendemos por uma linguagem especializada hoje? Linguagem especializada e terminologia parecem conceitos muito prximos que muitas vezes se sobrepem quando se fala em palavras tcnicas, glossrios, vocabulrios e dicionrios terminolgicos ou quando se menciona a comunicao realizada em uma rea do saber ou da experincia humana. O que no de admirar, uma vez que um dos traos que parecem mais salientes nessa comunicao a presena de uma terminologia desconhecida do leigo. Quem se dedica a um ramo da cincia ou da tcnica, exerce uma profisso, desenvolve atividades, seja na mais alta ou mais humilde esfera da sociedade, seja com fins lucrativos, assistenciais ou de simples lazer concorda que, na comunicao de seu conhecimento e de sua experincia, usa palavras especficas cujo sentido precisa ser explicado aos que no compartilham dos mesmos interesses. So palavras temticas prprias da competncia lingustica dos que transitam em uma rea determinada. Tais palavras pertencem lngua materna, elas se comportam morfolgica e sintaticamente como qualquer outro item lexical do vocabulrio do falante comum. No entanto, para saber utilizar essas palavras, preciso recorrer assistncia de quem domina a rea na qual elas so usadas, embora, para isso, no seja necessrio ter acesso aos bancos escolares ou exercer uma ocupao sistemtica e/ou remunerada. A linguagem especializada alvo de interesse tanto dos seus usurios diretos, os especialistas e os mediadores da informao, como dos linguistas e dos informatas. Para os especialistas, ela possibilita a configurao, expresso e comunicao do conhecimento. Para os mediadores da informao, entre esses, incluo professores, tradutores, redatores, comunicadores, ela se constitui na porta de

Linguagens Especializadas em Corpora

15

acesso da informao que ser colocada disposio do pblico interessado. Para os linguistas e informatas, sua anlise, descrio e registro no se constituem em mero exerccio acadmico, mas visa a contribuir para a adequada transmisso do conhecimento e para o avano da pesquisa do processamento da linguagem natural (PLN). O desenvolvimento das linguagens especializadas uma decorrncia natural da especializao da atividade humana e da consequente formao de grupos de trabalho, fenmeno social comum desde os primrdios da histria humana. Segundo Rastier (1995, p.47), na obra de Dante Alighieri, encontra-se a primeira meno de uma lngua falada por profissionais do mesmo ofcio: depois da queda de Babel, apenas os arquitetos conseguiam se comunicar porque falavam uma lngua que somente eles entendiam (De Vulgari Eloquentia, I, 7). Nesse texto datado de 1305, associado ao conceito de especializao, j transparece a ideia, ainda hoje comum, de subsistema lingustico hermtico de uma comunicao no entendida por algum alheio ao crculo dos iniciados. Modos de falar utilizados com o propsito de fazer segredo ou humor, fugindo das convenes linguageiras vigentes, surgem no mbito de todas as camadas sociais e grupos de trabalho e as denominaes de jargo e/ou gria que lhes so atribudas revelam conotao pejorativa. No entanto, preciso enfatizar que no se trata de linguagens especializadas, mas de linguagens corrompidas, que constituem verdadeiras antilinguagens, como a linguagem do submundo das drogas e a linguagem das prises. Alm desses linguajares, tambm so comuns maneiras de falar elitistas, deliberadamente obscuras e incompreensveis para o leigo como os assim chamados juridiqus, economs e jargo mdico. A linguagem especializada no se enquadra nesse conceito, no um jargo, nem uma gria, mas tambm no um subsistema lingustico reservado ao uso dos especialistas. A denominao subsistema atribuda linguagem especializada foi bastante divulgada na segunda metade do sculo passado em publicaes de renomados estudiosos da linguagem especializada, entre os quais Sager e Hoffmann. Contudo, no meu entendimento, o prefixo sub confere ao termo conotao negativa. O

16

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

conceito de sublingua defendido por Zellig Harris (KITTREDGE; LEHBERGER, 1982, p. 01; p.231) que argumenta que em reas de semnticas especializadas se formam, atravs de transformaes da gramtica da lngua comum, subconjuntos fechados de construes que no pertencem lngua geral. Sob essa tica o conceito de sublngua se aproxima dos pressupostos adotados na Lingustica Computacional e utilizados em metodologias que privilegiam as propriedades distribucionais em sistemas e aplicativos de PLN e de TA (Traduo Automtica). A noo de uma linguagem da cincia e da tcnica separada da lngua natural no nova, foi amplamente difundida por ocasio do intenso intercmbio cientfico e tecnolgico posterior Segunda Grande Guerra e consolidada pelos pioneiros da moderna terminologia e mesmo por aqueles que no partilhavam integralmente dos postulados wsterianos. A lenta evoluo desse conceito transparece em uma anlise superficial do termo usado nos diferentes idiomas para a linguagem especializada. Os alemes foram os primeiros a enfatizar o seu aspecto profissional, Fachsprache, de Fach profisso, ofcio e Sprache lngua. Os ingleses se encarregaram de salientar-lhe a especificidade e as funes, difundindo-a internacionalmente como special language e language for specific purposes LSP, lngua especial ou lngua para propsitos especficos. Enquanto os catales e os espanhis parecem marcar j na denominao a distino entre lngua e linguagem, llenguatges despecialitat, lenguajes de especialidad. Atualmente, ponto pacfico, mesmo entre aqueles que continuam preferindo termo sublinguagem, que no se trata de uma lngua diferente dos sistemas lingusticos naturais, mas sim de um uso peculiar da lngua, isto , uma linguagem, cuja configurao depende das mltiplas circunstncias de sua realizao. Outro aspecto da evoluo do conceito que tal linguagem no se limita interao formal entre especialistas que usam um mesmo registro, mas utilizada por interlocutores de diferentes hierarquias e graus de especializao em diferentes nveis de formalidade, desde o mais sofisticado cientista at o estudante e o leigo.

Linguagens Especializadas em Corpora

17

Em alguns meios lingusticos acadmicos, ainda discutida a ideia de que somente merecem a denominao de linguagens especializadas aquelas utilizadas por cientistas e seus pares, por profissionais e tcnicos, isto , somente aquelas que no dispensam um aprendizado formal para serem adquiridas. Essa mentalidade nos faz remontar Academia Francesa do sculo XVII, que rejeitou de seu dicionrio os termos referentes a artes, cincias e profisses porque no eram prprios de um homem de bem. Alm disso, negando carter de especializao a atividades de lazer e a ocupaes exercidas por camadas sociais economicamente desfavorecidas, essa maneira de pensar revela uma tendncia elitista estranha mentalidade pluralista do mundo atual. Ao falar no que se entende por linguagem especializada hoje, busco o apoio de Teresa Cabr, uma das vozes mais ouvidas no domnio da terminologia contempornea. Cabr pondera que, dentro do sistema da lngua geral, subsistem registros funcionais, empregados para realizar determinadas comunicaes. Nesse sentido, o que nos habituamos a chamar linguagem especializada nada mais do que um registro funcional utilizado em uma comunicao especializada. Observa a autora:
[...] as chamadas linguagens de especialidade so registros funcionais caracterizados por uma temtica especfica, empregados em situaes de caractersticas pragmticas precisas, determinadas pelos interlocutores (basicamente o emissor), o tipo de situao em que so produzidas, e os propsitos ou intenes que se prope a comunicao especializada. (CABR, 1999, p.152. Minha 10 traduo).

10

[], els anomenats llenguatges d'especialitat son registres funcionals caracteritzats per una temtica especfica, emprats en situacins de carcterstiques pragmtiques precises, determinades pels interlocutors (bsicamente l'emissor), el tipus de situaci en qu es produeixen, i els propsits o intencions que es proposa la comunicaci especialitzada. (CABR, 1999, p.152)

18

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Neste contexto, cabe lembrar que registro funcional no significa um subsistema lingustico separado, como Rondeau (1984, p.25-29) e alguns autores consideram, muito menos quer dizer jargo da cincia e da tecnologia. Registro funcional, de acordo com Halliday (1978, p.111), a configurao de recursos semnticos que o membro de uma cultura associa com uma situao peculiar de comunicao. A esses recursos semnticos dever-se-ia acrescentar tambm os recursos sintticos e morfolgicos e pragmticos. A noo de registro funcional, aplicada linguagem especializada importante, porque pe em relevo tanto a situao real de uso como os interlocutores da comunicao especializada. Um registro funcional uma variedade da lngua comum associada a uma atividade especfica, utilizada em circunstncias dadas por falantes concretos em situaes comunicativas dadas. Como manifestao da lngua comum, a linguagem especializada partilha de todas as caractersticas do sistema lingustico que denominamos geral, seguindo o mesmo padro e conformando-se aos mesmos parmetros. Assim, ainda que d preferncia a alguns elementos lxicos e/ ou sintticos de maneira particular, o uso especializado conta com o mesmo aparato lingustico da lngua natural. Consequentemente, o profissional e o cientista no se assemelham a programadores que utilizam uma sintaxe desenvolvida especialmente para a linguagem de mquina. Tampouco se expressam como matemticos que usam sistemas peculiares de smbolos algbricos para apresentar o raciocnio e comprovar a soluo dos problemas, tambm no podem ser includos entre os adeptos do formalismo lgico que usam sofisticadas combinaes simblicas. Ao contrrio, os especialistas se comunicam com seus pares e com os leigos, utilizando a ferramenta lingustica comum a todos os falantes, a lngua materna. Suas preferncias lxicas e gramaticais podem ser diferentes daquelas dos no especialistas, no obstante, essas mesmas opes lingusticas poderiam, teoricamente, ser realizadas por qualquer outro usurio da lngua em qualquer contexto de comunicao. Isso no significa que no haja peculiaridades decorrentes dos propsitos de comunicao, uma vez que no se pode deixar de salientar a relevncia dos traos que compem a especificidade e

Linguagens Especializadas em Corpora

19

marcam a especializao. Em primeiro lugar, destacam-se fatores primrios inerentes natureza do campo de conhecimento e da atividade profissional que perfazem o contexto temtico de uma rea dada. Tal contexto articulado pelo estatuto do destinador e o do destinatrio, a adequao dos propsitos da comunicao e os aspectos circunstanciais do evento comunicativo. Em resumo, a especializao se manifesta na expresso lingustica, tomada em sentido lato, levada a efeito em um contexto scio-cultural complexo, no qual aspectos temticos e pragmticos se entrelaam. A especializao resulta de um complexo contexto, no qual no s o aspecto do contedo importante, isto , no o significado lxico o nico e exclusivo fator que lhe confere o carter especfico. A referncia a um conjunto de objetos empricos no suficiente para caracterizar uma rea temtica, posto que um domnio ou campo de conhecimento se compe de um amlgama de elementos que conformam o universo do discurso do especialista. Nesse complexo de elementos, destaca-se, junto ao aspecto semntico, expresso na terminologia, o componente cognitivo, isto , a perspectiva em que o segmento do universo enfocado pelo especialista considerado. Dessa maneira, na matemtica e na filosofia, a realidade contemplada sob a tica formal da conceptualizao. Nas cincias naturais, a necessidade de categorizao dos componentes da natureza se traduz no carter taxonmico predominante. No direito, rea em que a sociedade contemplada com fim de equilibrar, organizar e regulamentar as relaes humanas, a orientao prescritiva privilegiada. Ao passo que a informao sobre a maneira de utilizar os bens do universo se constitui na preocupao principal das reas tcnicas, artsticas, artesanais e ocupacionais, como eletrnica, msica, tecelagem, segurana pblica, disposio do lixo ou coleta de resduos reciclveis. De acordo com o enfoque prprio da rea, o especialista examina o universo e o codifica, modulando sua linguagem conforme as condies circunstanciais do evento comunicacional em curso. Nesse contexto, o assunto tratado pode ser mais ou menos complexo, pode ser abordado em diferentes graus de profundidade, em maior ou menor nvel de especializao. O meio de comunicao pode ser a lngua oral ou a escrita, passando pelo simples boletim de

20

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ocorrncia policial revista acadmica, do manual ao livro texto, da comunicao em encontro restrito conferncia de seminrio de alcance internacional. Enfim, em um leque ilimitado de realizaes, a linguagem especializada reflete os propsitos da comunicao que, por sua vez, atende aos objetivos estabelecidos pela rea temtica em questo. funo denominativa bsica da linguagem especializada se somam outras funes tais como a informativa, a argumentativa, a descritiva e a prescritiva. Nenhuma dessas funes tem exclusividade, porm, para os propsitos de cada rea, uma funo exerce predominncia sobre as outras, conforme as condies efetivas do processo comunicacional. Em suma, o carter especializado da linguagem no conferido pelo tema enfocado, nem pela terminologia empregada, mas antes de tudo pela maneira de trat-lo na comunicao. Como observa Cabr (1999, p.154), um contedo tradicionalmente cientfico, apresentado de maneira banal, sem relao com uma estrutura sistemtica preestabelecida de significao, no se constitui em matria de comunicao especializada. De maneira inversa, quando descrito de maneira precisa, com referncia a um esquema cientfico determinado ou a uma estrutura normativa estabelecida, o contedo torna-se objeto de conhecimento especializado e, portanto, de comunicao em linguagem especializada. Por isso, Alain Rey, o renomado linguista, lexicgrafo dos dicionrios Robert e autor de uma basilar tese sobre terminologia (1992), diz que 11
O que torna especial uma lngua de especialidade no somente seu vocabulrio (no discurso), seu lxico (no sistema), sua terminologia (no plano conceitual e cognitivo), mas antes de tudo enquanto representante linguageiro de uma coerncia conceitual. (REY, 1991, p. ix. Minha traduo.)

Ce qui rend spciale une langue de spcialit, ce nest pas seulement son vocabulaire (em discours),son lexique (en systme), sa terminologie (sur le plan conceptuel et cognitif), mais cest avant tout cela, en tant que reprsentant langagier dune coherence conceptuelle.(REY, 1991, p. ix)

11

Linguagens Especializadas em Corpora

21

De acordo com Guiomar E. Ciapuscio (1998, p.43), linguista argentina cuja autoridade no pode ser contestada, compreendo um texto como uma unidade lingustico-comunicativa, resultado de uma conceptualizao por parte de um falante e proposta, ao mesmo tempo, interpretao de eventuais destinatrios. Assim, ainda que apresente caractersticas que revelam primeira vista sua especificidade, o texto especializado, como manifestao lingustica, no difere essencialmente do texto no especializado. Com efeito, como expresso da linguagem de especialidade, um texto revela o padro sinttico-pragmtico de manifestaes lingustico-textuais na lngua geral, proposto por vrios autores que se debruaram sobre lingustica do texto, entre os quais destaco Beaugrande e Dressler (1981, p.3-11). Tal padro pode ser sintetizado num conjunto mnimo de condies que configuram a comunicao como um texto. So condies bsicas que abrangem aspectos referentes estrutura textual, s qualidades de contedo e atitude dos interlocutores. Assim, pela coeso, os elementos lexicais que compem o texto se interligam mutuamente, compondo uma sequncia lgica de acordo com as convenes gramaticais. A coerncia assegura que o contedo expresso nos conceitos e relaes da tessitura superficial possa ser recuperado a partir do universo cognitivo ativado pelo texto. coeso e coerncia, acrescentam-se a informatividade, a situacionalidade e a intertextualidade como caractersticas que equacionam a informao apresentada com a expectativa do destinatrio, no sentido da novidade e recentidade do que informado e, tambm, quanto sua relevncia para a situao e ainda no que diz respeito sua ligao com outros textos conhecidos. Alm disso, importante que o destinador tenha a inteno de produzir o texto e que o destinatrio o receba como tal. A intencionalidade e a aceitabilidade so condies que dizem respeito s atitudes dos interlocutores. Concebido dentro desses padres, o texto especializado, em suas propriedades essenciais, no difere de um texto no especializado. A especializao do texto se origina da combinao de dois critrios: critrio temtico e o critrio pragmtico, que se conjugam de acordo com a funo comunicativa prpria da rea e especificamente

22

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

visada pelo autor. Mesmo que a funo referencial cognitiva seja predominante, a funo comunicativa do texto especializado no una, mas mltipla, vrias outras funes se manifestam e se entrelaam. Em reas essencialmente cientficas e tcnicas, a funo majoritria apreender os fenmenos naturais para produzir e divulgar conhecimentos. Ao passo que, em outros domnios de natureza humana e social, a funo prescritiva se salienta na emisso de ordens e instrues. Dessa maneira, se constata que h uma estreita relao entre as funes escolhidas e o mbito temtico correspondente como bem observam Mhn e Pelka (1984, p.5) 12, citados por Hoffmann (apud BRUMME, 1998, p.108). Tal relacionamento estreito repercute na organizao textual, na seleo sinttica e no uso da terminologia. Essas preferncias igualmente se condicionam s circunstncias da interao verbal dos atores do evento comunicativo, dependendo, portanto, das peculiaridades do destinador e do destinatrio. O critrio temtico diz respeito, primordialmente, ao tema da rea enfocada, abrangendo no s aspectos semnticos do assunto como as caractersticas cognitivas da rea. A dimenso pragmtica, relativa aos participantes da comunicao, acrescida das vrias e complexas circunstncias que compem o evento, contribui para imprimir traos especficos no texto. Assim, um texto sobre o DNA, com vistas aos procedimentos da ao de investigao da paternidade, concebido na perspectiva das implicaes legais do tpico e redigido conforme os padres ditados pela rea jurdica. Enquanto um texto sobre o DNA, como o composto qumico cido desoxirribonuclico e seu papel na transmisso dos caracteres hereditrios um texto de gentica, e apresenta a composio textual prpria da rea cientfica. Esse texto somente ser considerado jurdico, se for produzido com o enfoque no papel do teste de DNA nos processos judiciais, salientando a implicao do elemento gentico no procedimento legal. Preocupados com o conceito de especializao, muitos autores tm investigado o grau de especificidade do texto, salientando
MHN, D.; PELKA, R. (1984) Fachsprachen. Eine Einfhrung. Tbingen. (apud HOFFMANN, 1998)
12

Linguagens Especializadas em Corpora

23

componentes morfossintticos ou aferindo a gradao da quantidade de informao que o texto contm. No entanto, nem uns, nem outros examinam os elementos que compem a natureza da especificidade. Esses pesquisadores buscam avaliar a extenso e a essncia do conhecimento especializado posto disposio do usurio. Em tal anlise, no visam aos elementos distintivos que caracterizam o texto como expresso do conhecimento de uma rea particular, mas aos elementos que tornam a expresso do conhecimento mais acessvel ao pblico alvo. Esses autores, em sua maioria inspirados em Hoffmann (apud BRUMME, 1998, p.56-69), admitem dois eixos de classificao na avaliao do grau de especificidade de um texto: um horizontal, baseado no critrio temtico, e outro vertical, baseado no grau de abstrao da linguagem. Desse modo, no primeiro eixo alinham-se as mais variadas disciplinas, atividades e profisses, enquanto, na escala vertical se consideram cinco nveis de abstrao e de realizaes discursivas. No patamar mais alto, est a linguagem cientfica de grande sofisticao, usada em reunies de especialistas, como em congressos de Fsica Quntica, ao passo que no nvel inferior, encontra-se a interao verbal da rotina de operrios especializados em seu ambiente de trabalho, como uma fbrica de motores ou uma plataforma de petrleo. Nesse contexto, a clssica anlise de Hoffmann (ibidem, p.6269) procura equacionar o grau de especializao e o grau de abstrao, que aferido pelo uso frequente da terminologia e pela preferncia das construes sintticas utilizadas. De acordo com tais critrios, Hoffmann classifica as linguagens de especialidade em cinco categorias principais, que ele mesmo afirma no serem plenamente satisfatrias: linguagem das cincias fundamentais, das cincias experimentais, das cincias aplicadas e da tcnica, da produo material e do consumo. Ciapuscio (1998, p.43-65) abre novas perspectivas para a questo terico- metodolgica dos graus de especializao do texto. Nesse sentido, prope outro ngulo de anlise, a variao conceitual, e usa, para representar a informao conceitual e formal do signo lingustico, o esquema como instrumento. Dentro da proposta de redes conceituais, o

24

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

esquema permite avaliar como conceitos e relaes so, de um lado, inscritos no texto e de outro, apreendidos pelo usurio medida que ele segue o raciocnio que o autor desenvolve ao longo do texto. Dessa forma, Ciapuscio avalia o grau de abstrao conceitual em diferentes categorias de textos que versam sobre a mesma temtica, mas que se dirigem aos mais diferentes perfis de usurios. Para tanto, a autora mede a profundidade e abrangncia do conhecimento veiculado atravs de dois parmetros. O primeiro revelado pelo uso da terminologia especfica, enquanto o segundo corresponde variao terminolgica realizada na forma de sinnimos, parfrases e explanaes. A autora examina como a variao conceitual do termo se adapta variao discursiva, a fim de modular o grau de densidade da informao a ser oferecida ao usurio, de maneira que o texto se torne mais ou menos transparente. A anlise mostra que, quando no h variao da terminologia, o texto revela um maior grau de densidade do conhecimento especializado proposto ao usurio. Desse modo, o contexto da situao do destinatrio o fator de maior peso na avaliao do grau de especializao do texto, influindo mais na determinao do grau de abstrao do que a temtica. Sob esse prisma, a seleo diferenciada de termos e a variao denominativa caracterizam os textos de divulgao e revelam a imagem que o autor faz das condies cognitivas de seu pblico alvo. Cabr (1993, p.151-156; 1999, p.156-179) distingue os textos de lngua comum e os textos de especialidade, apontando elementos lingusticos e pragmticos. Do ponto de vista lingustico, a autora considera as caractersticas lexicais, morfolgicas e sintticas. Sob o ngulo da pragmtica, analisa produtores e destinatrios, situaes comunicativas e propsitos visados. Quanto funcionalidade, Cabr enfoca as funes prioritrias s quais os textos se propem e destaca as intenes pragmticas do autor. A autora pondera que o texto especializado mostra preferncias que variam segundo as diferentes reas de especializao, desde a seleo do vocabulrio e padres morfossintticos, at estruturas textuais e discursivas. Todavia, ela tambm adverte que no h justificativa para falar da existncia de um cdigo lingustico diferente

Linguagens Especializadas em Corpora

25

daquele usado nos textos no especializados. Porm, mostra que os aspectos pragmticos permitem distinguir um tipo de texto do outro, singularizando o texto especializado no que diz respeito temtica, aos usurios e ao contexto de comunicao. Em resumo, sob a luz do que foi aqui exposto, a realizao lingustica do texto especializado, nela compreendida sua estruturao gramatical, textual e terminolgica e ainda sua formatao grfica, depende de fatores temticos e pragmticos. A influncia desses fatores se faz sentir tanto na ativao do valor especializado das palavras que, no evento comunicativo, desempenham a funo de vetor da transmisso da informao, da instruo, do mandamento, da sugesto e do conselho, como na seleo dos elementos lexicais que os articulam na estrutura sinttica e na configurao discursiva. Tal seleo demonstra a preferncia por itens lexicais que rigorosamente no tm nenhum trao de especializao ou por determinadas construes sintticas, caracterizando a linguagem especializada de uma rea dada e configurando o pano de fundo para a articulao das palavras que exprimem o contedo do texto, os termos.

4. O futuro
Ao discorrer sobre o que me parece consensual hoje no entendimento do conceito de linguagem especializada e do relacionamento de sua pesquisa com a pesquisa terminolgica na poca em que vivemos, recorri a linguistas deste e do outro lado do Atlntico que h longos anos se debruam sobre a rea e que muito tm contribudo para seu avano. O fato de no ter mencionado outros autores no significa menosprezo pelo trabalho dos mais jovens, na pesquisa e/ou na idade, pelo contrrio, eles trazem novas luzes e apontam novos caminhos que enriquecem e fertilizam a rea da lingustica e da terminologia. O tema aqui abordado pode alimentar, como alis j alimenta, inmeras teses, seminrios e encontros, e merece que se formem grupos de trabalho para aprofundar e ampliar os pressupostos tericos que podero orientar a configurao de um estudo cientfico das linguagens especializadas, recorrendo lingustica geral e lingustica aplicada sem ignorar a terminologia.

26

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Em tal contexto, ser fortalecido o entendimento de que o texto especializado um todo complexo no qual no se pode abstrair o contedo temtico da formulao verbal e ser renovada a crena de que um sem o outro no poder subsistir, uma vez que se forem fragmentados perdero seu carter especfico. Assim, se de um lado, no existem textos especializados sem termos, por outro lado, uma terminologia fora da linguagem especializada no tem razo de ser. O estudo cientfico das linguagens especializadas, isto , a lingustica das linguagens especializadas e o estudo cientfico dos termos, isto , a terminologia, no so reas separadas e, sim, intimamente relacionadas e precisam ser integradas. Por essa razo, repito com Sager (2007, p.205) que a separao do estudo das lnguas especializadas e a terminologia no se justifica. guisa de concluso, do artigo fundamental artigo Textes et Termes da revista Meta, transcrevo a citao que rene o pensamento dos dois grandes entusiastas do estudo cientfico das linguagens de especialidade, Kocourek e Hoffman 13:
A tnica sobre o lado textual da lngua erudita foi geralmente caracterizada por um desinteresse do lado terminolgico da lngua erudita, cuja importncia era considerada ultrapassada. Essa tendncia compreensvel na etapa do desenvolvimento que seguiu imediatamente dominao quase absoluta da terminologia nos estudos terminolgicos. Mas, numa tica equilibrada, a marginalizao da terminologia no tem fundamento. (KOCOUREK, 1990a, ch.1.3.4, cf.,HOFFMANN, 1988: 120. Minha traduo)

13

Laccent sur le ct textuel de la langue savante tait gnralement caractris par un dsintrt du cote terminologique de la langue savante, dont limportance tait considere comme dpasse. Cette tendance est comprhensibloe ltape du dvelopment qui suit immdiatement la dominance presque absolue de la terminologie dans les tudes terminolinguistiques. Mais dans une optique quilibre, la marginalisationde la terminologie est sans fondement KOCOUREK, 1990a, ch.1.3.4, cf.,HOFFMANN, 1988: 120).

Linguagens Especializadas em Corpora

27

Referncias
AUSTIN, J. L. (1978) How to do things with words. Cambridge, Mass.: Harvard University Press. 3a ed. 169 p. BEAUGRANDE, R. de; DRESSLER, W. (1981) Introduction to text linguistics. English translation by Robert Beaugrande. New York: Longman. 270 p. BENVENISTE, E. (1989) Problemas de lingustica geral II. Campinas: Pontes. Trad. Eduardo Guimares et alii. 294p. BRUMME, J. (ed) (1998) Lothar Hoffmann. LLengatges despecialitat. Selecide textos Barcelona: IULA/UPF. 284 p. CABR, M.T. (1993) La terminologa: Teoria, aplicaciones. Barcelona: Antrtida/Empries. 529 p. metodologa,

CABR, M.T. (1999) La terminologa: representacin y comunicacin: elementos para una teoria de base comunicativa e otros artculos. Barcelona, IULA, 1999. 369p. CIAPUSCIO, G. E. (1998) La terminologa desde el punto de vista textual: selecci, tratamiento y variacin. Organon, v.12, n.26, 1998. p.43-65. FINATTO, M. J. B. (2001) Definio terminolgica: fundamentos tericos e metodolgicos para sua descrio e explicao. Porto Alegre, UFRGS. 395p. (Tese, Doutorado em Letras, Estudos da Linguagem: Teorias do Texto e do Discurso). HALLIDAY, M. A. K. (1978) Language as social semiotic. London: Edward Arnold, 75p. HOFFMAN, L., KALVERKMPER, WIEGAND, H. E.,(ed.) (1999) : Fachsprachen. Languages for Special Purposes, Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft An International Handbook of Special Language and Terminology Research. Berlin: Walter de Gruyter, coll. Handbcher zur Sprach- und Kommunikationswissenschaft , vol. 14-1, t. 1, 1369 p. HOFFMANN, L (1987). Kommunikationsmittel Fachsprache: eine Einfhrung. Berlin: Akademie. 307p. HOFFMANN, L. (1988) Vom Fachwort zum Fachtext. Tbingen: Gunter Nar. 265 p.

28

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

KITTREDGE, R.; LEHBERGER, J. (1982) Sublanguage: studies of language in restricted semantic domains. Berlin: Walter de Gruyter. 240p. KOCOUREK, R. (1991a) La Langue Franaise de de la Technique et de la Science: vers une linguistique de la langue savante. Wiesbaden: Brandstetter. 327 p. KOCOUREK, R. (1991b) Textes e Termes, Meta, v.36, n.1, 1991, p.71-76. LERAT, P.(1995) Les Langues spcialises. Paris: PUF. 201 p. RASTIER, Franois. (1995) Le terme: entre ontologie et linguistique. La Banque des Mots. n.7, 1995, numro spcial. Premires Rencontres Terminologie et Intelligence Artificielle. p.35-65. REY, Alain. (1991) Avant-Propos. In: KOCOUREK, R. (1991) La Langue Franaise de de la Technique et de la Science: vers une linguistique de la langue savante. Wiesbaden: Brandstetter. p. vii-xiii. REY, Alain. (1992) La terminologie: noms et notions. Paris: P.U.F. Universitaires de France. 127p. (Que sais-je?) RONDEAU, Guy. (1984) Introduction la terminologie. Qubec: Gaetan Morin. 227p. SAGER J. C. (2007) La evolucin de los lenguajes de especialidad y la terminologa. In: LORENTE, M.; ESTOP, R.; MART, J.; TEB, C. Estudis de lingustica i de lingustica aplicada en honor de Mara Teresa Cabr Castellv. Vol. I-De mestres. Barcelona: IULA/UPF, p. 105-122. SAGER, J.C.; DUNGWORTH, D.; P. F. MACDONALD (1980) English Special Languages: Principles and practice in science and technology. Wiesbaden: Brandstetter, 368 p. WSTER, Eugen. (1974) Die allgemeine Terminologielehre - ein Grenzgebiet zwischen Sprachwissenschaft, Logik, Ontologie, Informatik und den Sachwissenshaften. Linguistics, n.119. La Hague: Mouton. p.61-106.

CHUTANDO O BALDE OU BATENDO AS BOTAS? PROCESSAMENTO DE LINGUAGEM NATURAL E EXPRESSES MULTIPALAVRA NA LINGUAGEM COTIDIANA E CIENTFICA Aline Villavicencio 1 Carlos Ramisch 2
Resumo: Expresses Multipalavra so parte integrante das linguagens humanas. Apesar de sua importncia ter sido reconhecida, suas caractersticas heterogneas tm-se revelado um desafio para anlises lingusticas e computacionais. Neste captulo, examinam-se as Expresses Multipalavras e alguns dos desafios que elas representam para essas reas. A seguir, apresenta-se uma variedade de abordagens para detectar e lidar com essas expresses de forma semiautomtica, trazendo exemplos de seu tratamento em corpora de linguagens especializadas.

1. Introduo
Durante uma interao em lngua natural, locutores nativos utilizam majoritariamente construes convencionais adotadas pelas suas comunidades lingusticas para expressar com preciso ideias e conceitos complexos. A expresso bode expiatrio, por exemplo, exprime de maneira compacta o conceito de pessoa escolhida arbitrariamente para levar sozinha a culpa de uma calamidade, crime ou evento negativo (que geralmente no cometeu) 3. Frequentemente tais conceitos, como o de bode expiatrio, no podem ser compactados em uma nica palavra e, consequentemente, Expresses Multipalavras (EMs) so necessrias para transmiti-los de forma eficiente e concisa.
1

Instituto de Informtica, Universidade Federal do Rio Grande do Sul, avillavicencio@inf.ufrgs.br 2 Instituto de Informtica, Universidade Federal do Rio Grande do Sul, ceramisch@inf.ufrgs.br 3 Fonte: pt.wikipedia.org/wiki/Bode_expiatrio

30

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

EMs tm recebido a ateno de pesquisadores em vrias disciplinas, como em Lingustica (Fillmore et al., 1988; Fillmore, 2003; Nunberg et al., 1994; Pawley, 2007), em Psicolingustica (Cacciari, 2003; Jackendoff, 1997; Wray, 1999, 2002), e em Processamento de Linguagem Natural (Calzolari et al. 2002; Katz e Giesbrecht, 2006; McCarthy et al., 2003; Sag et al., 2002). Por serem de natureza diversa, EMs formam um conjunto heterogneo de fenmenos lingusticos que inclui desde colocaes a expresses idiomticas, conforme exemplificado na Tabela 1. Como consequncia, o processamento uniforme das EMs, ou seja, as tentativas de caracteriz-las completamente e de definir precisamente as suas fronteiras, constitui um grande desafio para as disciplinas que as estudam, na medida em que EMs podem ser vistas sob tantos ngulos diferentes quanto as vrias construes lingusticas que o conceito engloba. Para Moon (1998), no h um fenmeno unificado que se possa descrever, mas sim um complexo de atributos que interagem de formas diversas, muitas vezes desordenadas, e que representam um amplo contnuo entre o no composicional (ou idiomtico) e grupos composicionais de palavras. Assim, autores diferem, entre si, nas definies de EM, dependendo dos aspectos particulares que esto sendo enfatizados e dos grupos de palavras e construes considerados. Nesse contexto, Sag et al. (2002) definem EMs como interpretaes idiossincrticas que cruzam os limites (ou espaos) das palavras. Eles se concentram na diferena entre a interpretao de uma EM (ex. bode expiatrio) como um todo e os significados isolados das palavras individuais que compem a EM (bode e expiatrio), e consideram como EMs um grande nmero de fenmenos, tais como expresses fixas, compostos nominais e construes verbo-partcula. Ainda nesta linha, Calzolari et al. (2002) definem uma EM como uma sequncia de palavras que atua como uma nica unidade, em algum nvel de anlise lingustica, e que possui algumas das seguintes caractersticas: 1. transparncia sinttica e/ou semntica reduzida; 2. composicionalidade reduzida; 3. flexibilidade sinttica reduzida; 4. violao de regras sintticas gerais; 5. elevado grau de lexicalizao; 6. elevado grau de convencionalidade.

Linguagens Especializadas em Corpora

31

Tabela 1 Exemplos de alguns tipos de Expresso Multipalavra.


Tipo de EM Colocao Expresso idiomtica Nome prprio Composto nominal Exemplo sal e pimenta, bagagem emocional, strong tea cutucar a ona com vara curta, rock the boat So Paulo, Estao da S, Manchester United Subst + de + subst: pitada de sal, carro de polcia, faca de po, flock of geese Subst + adj: taxas federais, momento cvico, friendly fire cpia de, viagem para VS com sujeito: fire burns VS com objeto: tomar uma deciso, take a shower VS ditransitivo: dar conselho a [SN] VS com adjetivo: ficar biruta, get naked em perigo, at risk VP intransitivo: procurar por [SN], look into [NP] VP transitivo: confiar [SN] a [SN] CVP intransitiva: sit down, shut up CVP transitiva: take [NP] out, take [NP] off put up with take advantage of similar a, fond of Eu gostaria de, I dont know whether ad infinitum, in vitro de cama, em reunio, at school

Substantivo + preposio Verbo de suporte (VS)

Preposio de suporte Verbo preposicionado (VP)

Construo verbo-partcula (CVP)

CVP com preposio Verbo + subst + prep Adjetivo + preposio Sequncia lexical Expresso fixa SP sem artigo

Wray considera como EM qualquer tipo de unidade lingustica que tenha sido considerado formulaica em qualquer campo de pesquisa (1999, p.9), enquanto Fillmore (2003) se concentra na noo de um Falante/Ouvinte Inocente (Innocent Speaker/Hearer - ISH) com o conhecimento apenas sobre palavras individuais e relaes palavra-a-

32

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

palavra. Nesse contexto, EMs englobam qualquer expresso lingustica envolvendo mais de uma palavra que exija que um intrprete - humano ou computacional - tenha mais do que as habilidades de um ISH. Fillmore, Kay e Connor (1988) observam que esta ideia introduz uma distino entre o que um falante de uma lngua capaz de deduzir automaticamente a partir da linguagem e que ele deve conhecer previamente ou armazenar explicitamente. Idealmente, o nmero de informaes as serem previamente sabidas deve ser minimizado, de forma que a maioria dos conhecimentos necessrios ao uso da lngua seja deduzvel. Fillmore considera extremista o seu conceito de EM, pois o mesmo inclui uma ampla gama de construes gramaticais e de configuraes de palavras listveis, at mesmo sequncias como cpia de em Recebi uma cpia de alguns dos memorandos. No entanto, o autor observa que Jackendoff (1997) vai ainda mais longe e incorpora tambm definio de EM poemas memorizados e frases familiares de comerciais de TV. Outros autores utilizam a noo de frequncia e definem EMs como sequncias ou grupos de palavras que co-ocorrem com mais frequncia do que seria esperado se essas palavras fossem totalmente composicionais, e que podem, portanto, ultrapassar fronteiras sintagmticas (Dias et al., 1999; Gil e Dias, 2003; Tremblay et al.; 2007). Isso incluiria tambm frmulas de saudao como Tudo bem? Como vai voc? e sequncias lexicais, como eu no sei se. Portanto, decidir se uma sequncia de palavras forma uma EM ou no pode ser uma tarefa difcil que envolve no somente a avaliao de algumas das propriedades gerais de EMs como tambm a avaliao de caractersticas de tipos especficos. Por exemplo, Nunberg, Sag e Wasow (1994) descrevem as seguintes caractersticas para expresses idiomticas, das quais somente a primeira obrigatria: 1. O seu significado convencionalizado uma vez que no pode ser totalmente inferido a partir dos significados das palavras componentes quando usadas separadamente umas das outras. 2. Elas podem ser sintaticamente mais rgidas e menos flexveis. 3. Elas podem envolver figuras de linguagem como metforas ou hiprboles.

Linguagens Especializadas em Corpora

33

4. Elas podem ser usadas para descrever proverbialmente e informalmente uma situao recorrente, referenciando situaes ou objetos familiares de uma forma mais coloquial. 5. Elas podem expressar um estado afetivo ou um julgamento sobre algum tpico. No contexto de textos de um domnio especfico, tem-se uma definio importante relacionada a EMs, a de termo. Segundo Krieger e Finatto (2004), termos so unidades lexicais que expressam conceitos abstratos do domnio. Existem vrias diferenas entre EMs e termos: termos podem ser compostos por uma nica palavra ou por mltiplas, como locues nominais e verbais, enquanto EMs so inerentemente compostas por duas ou mais palavras. Em segundo lugar, EMs esto presentes tanto na linguagem tcnica e cientfica quanto na linguagem cotidiana de propsito geral, enquanto termos so, em princpio, particulares s linguagens especializadas. Em terceiro lugar, os mtodos computacionais disponveis para lidar com EMs em textos genricos nem sempre podem ser aplicados para lidar com corpora especializados e para extrao de terminologia. Por outro lado, EMs e termos tm tambm alguns aspectos comuns na medida em que ambos possuem uma semntica no convencional e que ambos constituem um desafio para os sistemas de Processamento da Linguagem Natural (PLN). Neste captulo, apresenta-se uma viso geral de EMs, analisando suas dimenses lingusticas, e os desafios que elas representam para seres humanos e para sistemas computacionais (seo 2). Em seguida, descreve-se o estado atual da pesquisa sobre EMs da perspectiva do PLN (Seo 3), e em particular as diferentes abordagens para identificar e modelar EMs em corpora especializados (Seo 4).

2. EMs sob o microscpio


EMs em geral possuem caractersticas idiossincrticas (Baldwin, 2006; Korhonen, 2006; McCarthy, 2006), seja em nvel lexical, sinttico, semntico, pragmtico ou estatstico e, possivelmente, em mais de um nvel, como mostra a Tabela 2 (adaptada de Baldwin, 2006). Nas

34

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

prximas sees, cada um desses nveis de interpretao ser analisado em detalhe, de forma a caracterizar a flexibilidade e variabilidade das EMs a cada um desses nveis. Tabela 2 Exemplo de idiossincrasias de diferentes nveis para algumas EMs.
EM Lxica ad infinitum em casa primeiros socorros ch forte feliz aniversrio cats cradle Sinttica ? ? ? Idiossincrasia Semntica ? Pragmtica ? Estatstica

2.1. Caracterizao lexical


Algumas EMs, como ad infinitum, contm palavras componentes que no podem ser utilizadas isoladamente (Baldwin, 2006; Sag et al., 2002). Em lngua portuguesa, existem diversas expresses lexicalmente idiossincrticas que, a exemplo da anterior, so emprestadas de do latim, como ad hoc, et al., in vitro, stricto sensu. O fato de que a expresso na verdade um emprstimo do latim pode explicar a razo pela qual as palavras componentes no so empregadas isoladamente na linguagem cotidiana. Todavia, existem tambm EMs desse tipo para as quais uma das palavras que a compe no pode ser usada separadamente, apesar de possuir uma semntica bem definida em portugus, como as locues conjuntivas apesar de, no entanto, no obstante (as palavras apesar, entanto e obstante no so encontradas separadamente).

Linguagens Especializadas em Corpora

35

As EMs lexicalmente fixas geralmente podem ser atribudas, como um todo, a uma classe morfossinttica precisa (por exemplo, conjuno), e costumam ser processadas pelos sistemas de PLN como um lexema (ou seja, uma entrada de dicionrio) que contm espaos. Essa certamente a maneira mais eficiente de tratar essas construes, pois qualquer abordagem composicional implicaria num tratamento independente para cada uma das partes da EM. Um sistema de anlise sinttica, por exemplo, seria induzido a cometer erros do tipo superanlise (overgeneration), ou seja, palavras como ad e vitro seriam corretamente reconhecidas mesmo se usadas separadamente. Contudo, esse tipo de abordagem, denominado palavras-com-espaos, no se aplica s EMs lexicalmente flexveis, ou seja, quelas cujas idiossincrasias se manifestam em nveis superiores (sinttico, semntico, etc.).

2.2. Caracterizao sinttica


As EMs sintaticamente idiossincrticas no seguem as regras usuais da gramtica de uma lngua, por exemplo, na expresso em reunio, espera-se encontrar um artigo precedendo o substantivo no sintagma nominal. Os componentes dessas EMs podem apresentar entre si relaes complexas, e vo desde manifestaes produtivas com grande flexibilidade e variabilidade na sua forma at manifestaes que no possuem nenhuma variao possvel, como bater as botas (por exemplo, bateu/bateram/bate as botas,...) e by and large (by and *short/*largest), respectivamente. Apesar de permitirem certo grau de flexibilidade sinttica, as expresses dessa classe no permitem que se apliquem todas as modificaes passveis de serem aplicadas a expresses totalmente composicionais. No caso de bater as botas, por exemplo, pode-se conjugar o verbo bater de acordo com o contexto de uso sem que, entretanto, seja possvel transformar a expresso para a voz passiva (*as botas foram batidas). Alm disso, algumas EMs possuem componentes variveis, mas que devem obedecer a certas restries, como na expresso keep [SN] on [SN]s toes onde tanto o SN objeto quanto o pronome possessivo podem variar, mas devem concordar (por exemplo, She

36

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

kept us on our/*his/*their toes during the whole interview). No entanto, esse grau de flexibilidade parece no ser previsvel a partir da estrutura sinttica em si, como no caso das expresses idiomticas verbais chutar o balde e bater as botas. Ambas so formadas por verbos transitivos com objetos diretos, porm diferem no grau de flexibilidade sinttica: enquanto a primeira aceita variao na forma (chutou mesmo/de vez o balde), a segunda tem forma rgida. Alm disso, o resultado da combinao sinttica de componentes nem sempre previsvel a partir do comportamento dos componentes, como se pode perceber em wine and dine, que uma expresso transitiva (por exemplo, He likes to wine and dine his guests) que resulta da coordenao de dois verbos intransitivos (wine e dine), como apontado por Baldwin (2006). Por outro lado, mesmo nos casos em que as caractersticas sintticas so facilmente estabelecidas, o problema pode estar em decidir qual a categoria morfossinttica que os constituintes devem ter, como o caso da EM ad hoc. Mas ser que o comportamento sinttico das EMs realmente to imprevisvel? Em uma avaliao da distribuio de flexibilidade de EMs, considerando uma amostra aleatria das 100 expresses mais frequentes em ingls, Villavicencio e Copestake (2002) constataram que os 43 casos de expresses verbais se dividiam em 22 grupos, cada um definindo um padro de variao distinto. No entanto, a distribuies das instncias nos grupos no uniforme: os maiores grupos eram aqueles com caractersticas regulares, como o grupo de verbos transitivos com complementos definidos (chutar o balde). Quanto mais variabilidade sinttica, menor o nmero de elementos do grupo, por exemplo, o grupo com verbos variveis e elementos opcionais (touch/find/strike a [raw] nerve). Alm disso, para os casos mais flexveis, mesmo que uma forma cannica da EM possa ser encontrada, frequentemente ela tambm ocorre nas formas no cannicas (por exemplo, na voz passiva). Essas variaes, segundo Riehemann (2001), so responsveis por 25% das ocorrncias de um determinado tipo de expresso em corpora.

Linguagens Especializadas em Corpora

37

2.3. Caracterizao semntica


O significado de uma EM varia desde as mais transparentes semanticamente (por exemplo, bom dia) at casos mais idiomticos (por exemplo, Joo sem brao, que se refere a algum preguioso, malandro ou dissimulado). A distino entre EMs semanticamente opacas e transparentes pode ser formalizada atravs da noo de composicionalidade, que se refere capacidade de inferir a interpretao de uma sequncia de palavras a partir da semntica de cada uma das palavras que a compe. O grau de composicionalidade de uma EM pode ser difcil de aferir: entre as expresses idiomticas e aquelas que podem ser completamente modeladas atravs da polissemia das palavras que as compem, existe um intervalo no qual se encontram aquelas expresses cujas partes composicionais ocorrem em meio a uma expresso globalmente no composicional. Neste contexto Nunberg et al. (1994) propem uma classificao de Ems, utilizando o conceito de decomponibilidade semntica, segundo o qual muitas expresses parecem ser composicionais semanticamente, se considerarmos que alguns dos seus componentes tm significados no-padro. De acordo com os autores, existem trs grandes grupos de EMs do ponto de vista semntico: as expresses no decomponveis como sinal verde (autorizao) e dedo duro (delator), as expresses idiossincraticamente decomponveis como perder as estribeiras (perder a pacincia) e faca de dois gumes (ao com duas consequncias/interpretaes opostas), e finalmente as expresses decomponveis, como panela de presso e entre quatro paredes. O primeiro grupo corresponde s expresses que possuem uma interpretao atmica: no possvel, por exemplo, em sinal verde, definir qual das partes corresponde ao significado de autorizao. J as partes de uma expresso idiossincraticamente decomponvel podem ser interpretadas separadamente se considerarmos que cada um dos componentes assume um sentido no convencional na expresso. Um exemplo a expresso inglesa spill the beans, onde spill entendida como revelar e beans como segredos. O mesmo ocorre, por exemplo, para a EM em portugus engolir um sapo, onde engolir significa acatar e

38

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

sapo pode significar desaforo. Dessa forma, quando se estende a semntica das partes da expresso, ela pode ser interpretada composicionalmente (revelar os segredos, acatar um desaforo). Finalmente, expresses decomponveis so aquelas nas quais as palavras que as compem possuem seu significado usual, porm quando usadas em conjunto, uma camada de significado adicional criada. Isso ocorre, por exemplo, com a expresso entre quatro paredes, que significa intimamente ou privativamente, numa analogia s paredes de uma casa, independente de quantas sejam elas. Isto , o sentido das palavras entre, quatro e paredes no modificado pela expresso, porm quando usadas em conjunto elas assumem uma significao adicional, que complementa o sentido individual de cada uma. Como no caso da flexibilidade sinttica, Villavicencio e Copestake (2002) verificaram, utilizando essa classificao, que a grande maioria das expresses idiomticas em uma amostra de 100 casos eram semanticamente decomponveis (76,5% das expresses verbais).

2.4. Caracterizao pragmtica


Algumas EMs podem apresentar particularidades com relao s situaes nas quais elas so empregadas. Isso significa que, por vezes, apesar de apresentarem caractersticas lexicais, sintticas e semnticas convencionais, determinadas expresses so pragmaticamente idiossincrticas por serem inerentemente dependentes de determinada situao ou circunstncia. Exemplos dessas expresses so bom dia e feliz aniversrio, que so conhecidas como expresses situadas, dependentes de um determinado momento do dia ou data. Por outro lado, expresses no situadas so casos em que, apesar de existir uma dependncia do contexto de uso, a situao temporal independente, por exemplo, first off (em primeiro lugar o uso dessa expresso depende do fato que nada foi dito anteriormente).

2.5. Caracterizao estatstica


Algumas EMs so simplesmente combinaes de palavras que coocorrem com frequncia. Essas combinaes decorrem de diversos

Linguagens Especializadas em Corpora

39

fatores que levam uma determinada comunidade lingustica a preferir determinadas combinaes em detrimento de outras (histricos, polticos, etimolgicos, cognitivos, etc.). Consequentemente, essas combinaes assumem o estatuto de colocaes, ou seja, maneiras convencionais de dizer determinada coisa. Muitas vezes, as colocaes apresentam caractersticas convencionais, ou seja, so combinaes gramaticais de palavras corriqueiras com semntica composicional, de foma que a expresso assume as propriedades das palavras que ela contm. No entanto, apesar de apresentarem semntica transparente, as colocaes no aceitam substituio das palavras componentes por sinnimos ou por palavras semanticamente relacionadas, pois essas ltimas tendem a parecer artificiais ou pouco naturais para um locutor nativo. Exemplos dessas expresses so caf forte, chuva torrencial, muito obrigado, feijo e arroz, caf com leite. Uma forma de identificar colocaes tentar modificar uma das palavras envolvidas. Nesse caso, o resultado o que se chama de anti-colocao, ou seja, uma combinao compreensvel para um locutor nativo, porm pouco natural e por vezes inclusive cmica (Pearce, 2001). Nos exemplos anteriores, algumas anticolocaes seriam arroz e feijo, leite com caf, caf poderoso, bastante obrigado, chuva agressiva. Siyanova e Schmitt mostram que, uma simples busca na Web (atravs do sistema de busca da Google) pelos termos fish and chips (prato tpico ingls) retorna 2.090.000 pginas contra 15.900 pginas para a anti-colocao chips and fish. Analogamente, a expresso em portugus caf com leite aparece em 632.000 pginas segundo Google, enquanto leite com caf ocorre somente 97.700 vezes.

EMs em corpora especializados


Apesar de tratar-se de construes diferentes, os processos de transformao de sentido atravs dos quais uma palavra ou um conjunto de palavras assumem o estatuto de termo e o estatuto de Expresso Multipalavra anlogo. Ambos so guiados por dois princpios: o da preciso e o da conveno. Na linguagem de propsito geral (em oposio quela usada na comunicao especializada a um domnio), EMs so frequentemente empregadas para especificar uma

40

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

situao ou ao que no pode ser descrita apenas com palavras simples. Ao longo do tempo, essas formas usuais ou convencionais tornam-se cada vez mais concretas e se integram linguagem, como se pode facilmente perceber no caso das colocaes. Analogamente, a linguagem especializada tem por particularidade um esforo da parte dos locutores no sentido de minimizar a ambiguidade, a fim de facilitar a transmisso do conhecimento. Por isso mesmo, em textos tcnicos e cientficos, palavras corriqueiras assumem por vezes sentidos novos, ligados a um conceito ou objeto do domnio no qual aquela comunicao se insere. Em Informtica, por exemplo, o termo rvore designa uma estrutura de dados complexa composta por nodos e arestas ligando esses nodos de forma no cclica. A mesma palavra, em Botnica, designa uma planta lenhosa de grande porte, e esse ltimo sentido o que mais se aproxima do uso dessa palavra na linguagem cotidiana. Os fatores que levam atribuio de uma semntica nova, especializada, a uma palavra, so certamente diversos. No entanto, o mesmo princpio de convencionalidade ou at mesmo de idiossincrasia estatstica pode ser usado para explicar porque um determinado termo preferido em detrimento de outro. Existem diversas acepes do que vem a ser um termo, porm sabe-se que, para especialistas de um domnio, termos so a representao do conhecimento da rea especfica (Krieger e Finatto, 2004). Seguindo a linha da Teoria Geral da Terminologia, acredita-se que existe uma relao 1:1 entre termos e conceitos abstratos. Essa definio, no entanto, bastante criticada por ser reducionista e no levar em conta o termo no seu habitat natural: o texto. Independentemente da definio, termos e EMs possuem alguns aspectos semelhantes, conforme exemplificado anteriormente, no seu processo de construo do sentido. Do ponto de vista das aplicaes de PLN, termos e EMs tambm compartilham uma caracterstica: por apresentarem uma grande variedade em sua forma de ocorrncia, ambos constituem um desafio para o tratamento uniformizado em sistemas de PLN. No que diz respeito aos termos, muitas vezes os sistemas computacionais so criados atravs um processo de aprendizado guiado pelos dados (corpora) em formato eletrnico, que

Linguagens Especializadas em Corpora

41

por sua vez possuem cobertura limitada em termos de representatividade. Quando um sistema construdo atravs dessa metodologia aplicado a um texto que pertence a um domnio diferente, muitas vezes ele apresenta dificuldades para lidar com construes desconhecidas, seja no nvel lxico, sinttico ou outro. A construo de recursos lingusticos, tanto para tradutores humanos quanto para sistemas de PLN, um processo oneroso que envolve no somente o trabalho de lexicgrafos e termingrafos como tambm a interao com especialistas do domnio em questo. por isso mesmo que, recentemente, a comunidade de PLN tem dedicado grande interesse aquisio e tratamento automticos ou semi-automticos de termos e EMs. Entretanto, vale lembrar que existem diversos pontos em que o estudo de termos o estudo das EMs divergem. Em primeiro lugar, um termo no necessariamente uma construo formada por mais de uma palavra como o caso de uma EM. Desse fato decorre, por exemplo, que a maioria dos sistemas de PLN atuais que realizam algum tipo de tratamento especializado se concentram em termos simples e desconsideram as interaes entre palavras. Outra diferena essencial, portanto, pode ser observada atravs dos mtodos distintos desenvolvidos para identificar e processar termos e EMs. Por ltimo, EMs esto onipresentes na linguagem cotidiana e especfica, de maneira mais ou menos frequente, porm ubqua. Apesar de existirem divergncias com relao caracterizao da linguagem especializada em si, os termos e o seu estudo so prprios a ela. At mesmo nas cincias que estudam essas estruturas, percebe-se o reflexo dessa distino: enquanto EMs so objeto de interesse da Lingustica geral, os termos so estudados por Terminlogos e Termingrafos. O objeto que pertence interseco entre termo e EM usualmente denominado Termo Multipalavra (TM). Trata-se simplesmente de uma locuo ou expresso multipalavra que possui estatuto terminolgico. Destaca-se, contudo, que o mesmo no corresponde ao conceito de fraseologia do domnio. O primeiro aceita pouca variabilidade (morfolgica, raramente sinttica) enquanto o segundo altamente flexvel. Enquanto o primeiro representa um nico conceito, no raro que o segundo seja uma estrutura complexa que

42

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

associe mais de um conceito. As fraseologias de domnio, portanto, so um tipo de EM bastante comum nos textos especializados, porm no so estudadas no mbito do tratamento automtico de TMs. Da mesma forma que se estima (Jackendoff, 1997) que na linguagem genrica o lxico de EMs corresponde, em nmero de lexemas, ao lxico das palavras simples, Krieger e Finatto (2004) assumem, com base em observaes empricas, que aproximadamente 70% das entradas em uma terminologia so TMs. Por essa razo, qualquer sistema computacional que pretende tratar textos advindos de um determinado domnio deveria possuir um dicionrio contendo os TMs do mesmo. Assim, alguns trabalhos tm sido desenvolvidos nessa rea para a aquisio e processamento computadorizados de TMs.

3. Termos multipalavras em sistemas de PLN


A extrao automtica ou semiautomtica de termos a partir de corpora textuais vem atraindo o interesse de pesquisadores tanto em Lingustica Computacional quanto em Terminologia h bastante tempo. Com efeito, um dos primeiros trabalhos a apresentar uma abordagem pragmtica para esse problema o trabalho de Justeson e Katz (1995). O mtodo proposto por esses autores relativamente simples e consiste em extrair todas as sequncias que obedecem a um certo conjunto de padres morfossintticos para em seguida orden-los por nmero de ocorrncias. Alm da metodologia, os autores tambm sugerem uma lista de sete padres de extrao para a lngua inglesa, que se aplicam a todos os domnios do conhecimento: substantivo-substantivo (tumor cell, ozone layer); adjetivo-substantivo (natural selection, inhibitory enzime); adjetivo-adjetivo-substantivo (endangered animal species, xenoreactive natural antibody); adjetivo-substantivo-substantivo (cumulative distribution function, lymphoblastoid cell line); substantivo-adjetivo-substantivo (mean squared error, colostrum inhibitory factor);

Linguagens Especializadas em Corpora

43

substantivo-substantivo-substantivo (class probability distribution, zinc finger type); substantivo-preposio-substantivo (degree of freedom, History of Art). Apesar da aparente simplicidade, Manning e Schtze (1999) afirmam que esse mtodo bastante eficaz quando se analisa os primeiros termos extrados, e tambm bastante popular em sistemas de PLN em que uma grande revocao no necessria. No entanto, o mtodo no capaz de capturar expresses contendo palavras no adjacentes, e possui um silncio considervel com relao a todos os termos que so ignorados por serem pouco frequentes ou possurem um padro morfossinttico diferente dos enunciados acima. Frantzi, Ananiadou e Mima (2000) introduzem um mtodo hbrido no qual os candidatos so extrados atravs de padres morfossintticos rasos (como no mtodo de Justeson e Katz) e subsequentemente submetidos a um teste estatstico chamado CValue. A vantagem dessa medida que ela capaz de lidar com termos aninhados, ou seja, termos que contm outros termos, sendo assim capaz de extrair TMs arbitrariamente longos. Por outro lado, medidas mais sofisticadas, como aquelas baseadas em tabelas de contingncia usadas na extrao de EMs genricas, poderiam eventualmente levar a melhores resultados. Do ponto de vista da sintaxe, TMs em reas como indstria automotiva, agricultura, qumica ou biomedicina tentem a seguir determinados padres de etiquetas morfossintticas que incluem na maioria dos casos adjetivos e substantivos. Por exemplo, em um corpus biomdico como o Genia, termos costumam ser nomes de doenas, substncias, genes e protenas (OHTA; TATEISI; KIM 2002). Assim sendo, trabalhos que descrevem mtodos para a aquisio automtica de substantivos compostos so tambm relevantes para a identificao de TMs. Alm da tarefa de identificao, existe interesse em organizar e interpretar automaticamente os termos e TMs etrados de forma a hierarquizar os conceitos em uma ontologia ou tesauro do domnio. Nesse sentido, o trabalho de SanJuan et al. (2005) descreve a

44

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

comparao de uma ontologia construda manualmente com uma ontologia construda de forma automtica sobre o corpus Genia. Na construo desta ltima, os autores mesclam trs tcnicas baseadas em recursos lingusticos distintos: associao estatstica, WordNet e mtodos de agrupamento em inteligncia artificial (clustering). Em particular na rea da biomedicina, da medicina e da biologia, diversos trabalhos concentram-se na descrio e indexao de documentos a partir da identificao automtica de termos e TMs, muitas vezes denominados de forma geral Entidades Nomeadas. Hagge et al. (2002) descrevem um sistema baseado em regras lexicais e sintticas para a identificao de genes e protenas. Dada a disponibilidade de recursos como dicionrios e ontologias nesse domnio, em especial em lngua inglesa, no so raros os sistemas que realizam uma simples busca de padres (gerados a partir das entradas do dicionrio) no corpus em questo. Para esclarecer as particularidades relacionadas a esse domnio, mas mais amplamente ao trabalho de identificao e tratamento de TMs em corpora de domnio, apresenta-se na prxima seo um estudo de caso realizado sobre o corpus Genia no sentido de caracterizar os TMs nele encontrados.

4. Estudo de caso: TMs em biomedicina


A fim de exemplificar as EMs de domnio, iremos analisar os TMs em um corpus da rea biomdica. Trata-se do corpus Genia, um conjunto de dois mil resumos de artigos cientficos da rea biomdica extrados da base de artigos Medline com base nas palavras-chave humano, clula sangunea e fator de transcrio (OHTA; TATEISI; KIM 2002). Ele contm 18,5 mil frases e 490,7 mil palavras, anotados com informao de classe morfossinttica. Alm disso, os resumos tambm foram anotados por especialistas com relao a uma terminologia do domnio. Que contm conceitos como nomes de doenas (tumor fibroblstico) e clulas (linfcito T primrio).

Linguagens Especializadas em Corpora

45

Tabela 3 Dimenses do corpus de biomedicina analisado (Genia).


Resumos Frases Palavras (tokens) Nmero mdio de palavras por frase Termos anotados TMs anotados Nmero mdio de termos por frase Nmero mdio de TMs por frase Nmero mdio de palavras por termo Nmero mdio de palavras por TM 2000 18519 490752 26,5 97876 55487 5,29 3 2,06 tokens 2,86 tokens

A Tabela 3 resume algumas das dimenses do corpus, que permitem uma anlise superficial dos seus TMs. Em primeiro lugar, nota-se que, dos 97876 termos anotados no corpus, 55487 so multipalavras, ou seja, em torno de 57%, em conformidade com as estimativas apresentadas anteriormente (entre 50% e 70%). igualmente interessante perceber que o nmero mdio de palavras por frase superior ao que se espera em um corpus genrico de lngua inglesa (que fica em torno de 22 palavras). Alm disso, essas frases contm um nmero surpreendentemente grande de termos e de TMs: cada frase tem em mdia 5,29 termos, dos quais 3 possuem mais de uma palavra. Na tentativa de caracterizar esses termos de acordo com o nmero de palavras, percebe-se que se os termos so considerados de forma homognea, tm um comprimento mdio de 2 palavras, enquanto que os TMs tm um comprimento mdio de quase 3 palavras. Isso significa que no somente os TMs so muito presentes nesse corpus, como tambm eles so relativamente longos (podendo chegar a termos anotados com 22 palavras). Uma explicao possvel para essa onipresena dos TMs o aninhamento de termos.

46

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Figura 1 Exemplo de frase extrada do corpus Genia e sua anotao de termos.

O exemplo apresentado na Figura 1 ilustra bem esse aninhamento, por exemplo, o termo alpha A est contido na expresso alpha A-gene product. Da mesma forma, alpha B-encoded isomers um TM aninhado que contm outro TM. Dessa forma, a frase acima contm oito TMs, o que explica de alguma forma o grande nmero de TMs por frase. Por outro lado, o uso da terminologia em qualquer domnio outro fator que se reflete nessa dimenso de anlise. Dessa forma, uma rpida anlise para caracterizar o corpus mostra alguns dos desafios que devem resolver no somente termingrafos e lexicgrafos mas tambm sistemas de PLN que realizam a identificao de TMs e EMs em domnios especializados. Alm da questo da onipresena e grande nmero de construes multipalavras, adicionam-se tantos outros como a normalizao da grafia (em biomedicina, alguns autores hifenizam T-cell enquanto outros separam as palavras T cell), o uso massivo de acrnimos, abreviaturas e elipses (HIV1, IL2). Finalmente, existem ainda aqueles problemas relacionados com o prprio tratamento lingusticocomputacional dos textos, sejam eles de domnio ou genricos, como a resoluo da ambiguidade semntica e/ou sinttica, a interpretao de anforas e correferncias, a anlise sinttica, etc. Em resumo, um dos grandes desafios na rea de PLN consiste na adaptao de sistemas e recursos para tratar um domnio ou domnios especializados e para auxiliar especialistas a automatizar parte do trabalho de criao de recursos lingusticos como as terminologias.

Linguagens Especializadas em Corpora

47

Referncias
Dimitra Anastasiou, Chikara Hashimoto, Preslav Nakov, and Su Nam Kim (eds). ACL/IJCNLP 2009 Workshop on Multiword Expressions: Identification, Interpretation, Disambiguation and Applications, Singapore. Timothy Baldwin. The deep lexical acquisition of English verb-particles. Computer Speech and Language, Special Issue on Multiword Expressions, 19(4): 398414, 2005. Timothy Baldwin. Compositionality and Multiword Expressions: Six of One, Half a Dozen of the Other? Invited Talk. In Proceedings of the ACL-2006 Workshop on Multiword Expressions: Identifying and Exploiting Underlying Properties, Sydney, Australia, 2006. Cristina Cacciari. A psycholinguistic point of view: are idioms really relevant for theories of language comprehension and production? Presented at Collocations and idioms 2003: linguistic, computational, and psycholinguistic perspectives. 2003. Nicoletta Calzolari, Charles Fillmore, Ralph Grishman, Nancy Ide, Alessandro Lenci, Catherine MacLeod, and Antonio Zampolli. Towards best practice for multiword expressions in computational lexicons. In Proceedings of the 3rd International Conference on Language Resources and Evaluation (LREC 2002), pages 19341940, Las Palmas, Canary Islands, 2002. Gael Dias, Sylvie Guillor and Jos Pereira Lopes. Multilingual Aspects of Multiword Lexical Units. In Proceedings of Workshop on Language Technologies, Ljubljana, Slovenia, pages 1121, 1999. Charles Fillmore, Paul Kay, and Mary C. OConnor. Regularity and idiomaticity in grammatical constructions. Language, 64:501538, 1988. Charles Fillmore. Multiword Expressions: An Extremist Approach. Presented at Collocations and idioms 2003: linguistic, computational, and psycholinguistic perspectives. 2003. Alexandre Gil and Gael Dias. Efficient Mining of Textual Associations. In Proceedings of the International Conference on Natural Language Processing and Knowledge Engineering, Beijing. China, pages 549 555, 2003. Caroline Hagge, Agnes Sndor, and Anne Schiller. Linguistic processing of biomedical texts. In Elisabete Ranchod and Nuno J.

48

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Mamede, editors, PorTAL, volume 2389 of LNCS, pages 197208, Faro, Portugal, June, Springer, 2002. Ray Jackendoff. The Architecture of the Language Faculty. MIT Press, Cambridge, USA, 1997. John S. Justeson and Slava M. Katz. Technical terminology: Some linguistic properties and an algorithm for identification in text. Natural Language Engineering, 1(1):927, 1995. Graham Katz and Eugenie Giesbrecht. Automatic identification of noncompositional multi-word expressions using latent semantic analysis. In Proceedings of the ACL-2006 Workshop on Multiword Expressions: Identifying and Exploiting Underlying Properties, pages 2835, Sydney, Australia, 2006. Anna Korhonen. Current trends and future challenges in computational linguistic research on multiword expressions. Presented at Collocations and idioms 2006: linguistic, computational, and psycholinguistic perspectives. 2006. Chris Manning and Hinrich Schtze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, MA, 1999. Diana McCarthy, Bill Keller, and John Carroll. Detecting a continuum of compositionality in phrasal verbs. In Proceedings of the ACL2003 Workshop on Multiword Expressions: analysis, acquisition and treatment, pages 7380, Sapporo, Japan, 2003. Diana McCarthy. Automatic methods for detecting the compositionality of multiwords. Presented at Collocations and idioms 2006: linguistic, computational, and psycholinguistic perspectives. 2006. Rosamund E. Moon. Fixed Expressions and Idioms in English: A Corpus-based Approach. Oxford University Press, Oxford, UK, 1998. Geoffrey Nunberg, Ivan A. Sag, and Tom Wasow. Idioms. Language, 70:491538, 1994. Andrew Pawley. Developments in the study of formulaic language since 1970: A personal view. In Paul Skandera (ed.) Phraseology and Culture in English, pages 348 Mouton de Gruyter, 2007. Darren Pearce. Synonymy in collocation extraction. In Proceedings of the NAACL 2001 Workshop on WordNet and Other Lexical Resources:Applications, Extensions and Customizations, pages 4146, Pittsburgh, USA, 2001.

Linguagens Especializadas em Corpora

49

Susanne Riehemann. A Constructional Approach to Idioms and Word Formation. PhD thesis, Stanford University, 2001. Ivan A. Sag, Timothy Baldwin, Francis Bond, Ann Copestake, and Dan Flickinger. Multiword expressions: A pain in the neck for NLP. In Proceedings of the 3rd International Conference on Intelligent Text Processing and Computational Linguistics (CICLing-2002), pages 115, Mexico City, Mexico, 2002. Antoine Tremblay, Bruce Derwing, Gary Libben and Chris Westbury. Are Lexical Bundles Stored and Processed as Single Units? In Proceedings of the 25th UWM Linguistics Symposium on Formulaic Language. Milwaukee, Wisconsin, 2007. Aline Villavicencio and Ann Copestake. On the nature of idioms. LinGO Working Paper No. 2002-01. 2002. Alison Wray. Formulaic language in learners and native speakers. Language Teaching, 32:213231, 1999. Alison Wray. Formulaic Language and the Lexicon. Cambridge:CUP, 2002.

O TEXTO JURDICO EM TRADUO E VERSO: PROBLEMAS E SOLUES NA LINGUAGEM DOS CONTRATOS Cristina Lopes Perna 1
Resumo: A linguagem jurdica apresenta peculiaridades entre textos jurdicos de duas culturas, dado o seu carter tcnico e especfico. A traduo de um texto jurdico de um idioma a outro resulta em tarefa rdua para o tradutor, visto que os documentos legais exigem um tipo especial de traduo e o tradutor desse tipo de linguagem especializada fica mais restrito do que em outros tipos de textos. Ao traduzir um texto jurdico, o tradutor deve manter a preciso deste, encontrando equivalentes legais que em sua relevncia, correspondam tanto ao texto original da lngua fonte como ao texto traduzido da lngua alvo. indiscutvel que h conceitos culturais que designam elementos peculiares a cada lngua. Essa crena nos permite afirmar que inevitvel certa perda de sentido no processo de traduo de textos jurdicos, especialmente por pertencerem a diferentes sistemas legais. No caso do presente texto, discutiremos as dificuldades em se traduzir e verter contratos internacionais em portugus- ingls-portugus, visto que os sistemas jurdicos do Brasil e EUA so de naturezas diferentes, a saber, o brasileiro originrio do Civil Law ao passo que o Estadunidense, do Common Law.

1. Textos jurdicos: sua natureza e peculiaridades


No h dvida de que h conceitos culturais especficos para designar elementos peculiares de cada lngua. Esta noo data dos estudos de Sapir, estudioso que afirmou que no h semelhana suficiente entre duas lnguas que nos permita consider-las como representantes da mesma realidade social (1956:69). Portanto, de se esperar que uma perda considervel de significado seja inevitvel
1

Doutora em Letras. Pontifcia Universidade Catlica do Rio Grande do Sul (PUCRS) Faculdade de Letras - Endereo eletrnico: cperna@pucrs.br.

Linguagens Especializadas em Corpora

51

durante o processo tradutrio de textos jurdicos, especialmente porque diferentes culturas apresentam sistemas jurdicos diferentes. Vrios estudiosos de traduo jurdica demonstraram a dificuldade em se garantir o equivalente terminolgico mais prximo do texto fonte (doravante TF) no texto alvo (doravante TA). Newmark (1981) argumentou que textos jurdicos exigem um tipo especial de traduo, pela simples razo de que o tradutor deste tipo de linguagem especializada fica mais restrito do que ao traduzir outro tipo de gnero. Schwartz (1977) chamou ateno para o fato de que quando traduzimos textos jurdicos, a principal tarefa do tradutor garantir que a traduo seja feita da forma mais precisa possvel, procurando encontrar equivalentes lingusticos que, em sua relevncia jurdica, tenham correspondncia tanto no TF como no TA. No obstante, Sarevic (1997) afirma que os tradutores jurdicos no podem ter expectativas de usar equivalentes naturais do sistema jurdico do TA que sejam idnticos aos do TF, pois ocorrem incongruncias inerentes de terminologia devido aos diferentes sistemas jurdicos (1997:235). Entretanto, a autora argumenta que perfeitamente legtimo que se exija que estes tradutores utilizem o equivalente mais prximo do sistema jurdico do TA, em outras palavras, o termo que mais proximamente transmita o sentido jurdico do TF. A autora tambm acrescenta que esta uma tarefa muito rdua. Obenaus (1995) alega que, embora a equivalncia lexical pudesse ser mantida e que possvel designarem-se vrios graus de equivalncia. Os linguistas sabem que uma correspondncia de um a um entre termos de lnguas diferentes a exceo e no a regra. Malmkjr (1998) admite que seja possvel se obter uma equivalncia entre TF e TA em um ou mais nveis distintos, porm, segundo a autora, impossvel que se faa isso, considerando o texto em sua totalidade. A dificuldade em se manter a equivalncia em traduo jurdica reside no fato de que os sistemas jurdicos so diferentes. Estes sistemas so geralmente classificados em grupos ou famlias. H dois grupos principais, dependendo da tradio: o sistema common law e o sistema civil law. Common law (em portugus, "lei comum") um sistema legal oriundo da Inglaterra, utilizado l e na maioria dos pases

52

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

que foram colnias ou territrios britnicos (Perna, 2010). Sua caracterstica principal a valorizao da jurisprudncia em detrimento das leis estatutrias. Civil law no o que denominamos de Direito Civil. No sistema jurdico que adota o civil law, a legislao representa a principal fonte do Direito. Os tribunais fundamentam as sentenas nas disposies de cdigos e leis, a partir dos quais se originam as solues para cada caso. O sistema legal da Gr-Bretanha, dos EUA e da Nova Zelndia, entre outros, pertencem ao primeiro. O segundo, que se originou da lei romana, o sistema jurdico da Alemanha, ustria e Brasil, entre outros. a lei imposta pelo estado, baseada em normas estabelecidas pelo poder legislativo. Exemplos de incongruncias de termos jurdicos advindos de diferentes culturas foram observados primeiramente na rea de direito comparativo. A necessidade de se comparar leis de diferentes pases originou do fato de que, para criar leis nacionais, era necessrio observar cdigos estrangeiros. A rea de Estudos da Traduo beneficiou-se dos estudos do direito comparativo assim como da rea de comrcio exterior, pois estas vm fornecendo subsdios para a identificao das diferenas jurdicas e, portanto, de termos jurdicos que no so equivalentes. Obenaus (1995) chamou ateno para o fato de que mesmo um termo que havia sido considerado como tendo um sentido universal como juiz, deve ser visto a partir de outra perspectiva quando traduzido, visto que em um pas que segue o sistema legal da common law, um juiz tem menos poder do que um juiz de um pas que obedece ao sistema de civil law. Em outras palavras, no primeiro o juiz no pode chegar a um veredicto, o qual obtido atravs do jri, enquanto que no segundo, o juiz que chega a um veredicto, na maioria dos casos. No passado, houve alguns esforos no sentido de aproximar as lacunas entre os dois sistemas jurdicos, graas a uma aceitao de traduo menos literal. Este fato ainda vem ocorrendo no Canad, um dos poucos pases que no somente bilngue, como tambm bilegal, conforme observou Sarevic (1998). Obviamente, a dificuldade l reside no conflito entre o sistema common law, das provncias anglfonas, e o sistema civil law, da provncia de Quebec.

Linguagens Especializadas em Corpora

53

Tambm no Brasil, como em muitos outros pases, a traduo de termos jurdicos apresenta srias dificuldades para o tradutor. H um nmero de conceitos que possuem somente equivalncia parcial, se compararmos os termos jurdicos entre a lngua inglesa e a portuguesa e que podem causar ambiguidade no TA. Theodoro Jr. (1999) citou uma srie de exemplos nos quais um termo do TF no pode ser necessariamente substitudo por outro no TA. Para ilustrar, vejamos o termo joint venture, definido no Black's Law Dictionary como "a business undertaking by two or more persons engaged in a single defined project" 2. Segundo Theodoro Jr., encontram-se algumas tradues de joint venture como empreendimento conjunto o que, segundo o autor, significa "conduzir um negcio junto. Danilo Nogueira (2000) chama ateno dos tradutores quanto traduo de joint venture por sociedade em conta de participao, cujo equivalente em ingls joint adventure. Theodoro Jr. segue sua argumentao apresentando reas problemticas, nas quais o tradutor poder encontrar desafios em relao aos sistemas jurdicos brasileiros e estadunidenses. De acordo com o autor, o termo oficial de justia foi vertido para o ingls de vrias maneiras, que vo desde sheriff ou bailiff at judicial officer, visto que o tradutor no encontrou uma correspondncia no sistema jurdico do TA. No sistema jurdico brasileiro, este servidor responsvel por trazer um certificado de servio, enquanto que no sistema estadunidense a atribuio do bailiff manter a ordem durante os processos judiciais, de acordo com o Black's Law Dictionary. Estes so apenas alguns exemplos de incongruncias entre termos jurdicos que podem acarretar em grandes desafios para os tradutores. Esforos tm sido feitos por parte de tradutores jurdicos na tentativa de reduzir estes desafios (Weston, 1983 e Sarevic, 1985), porm solues eficazes para esta situao ainda no foram encontradas, com exceo de algumas poucas estratgias apresentadas por tradutores clssicos (ver Vinay e Darbelnet, 1958; Wotjak, 1981; Malone, 1988 e Newmark, 1988), para tentar facilitar a ausncia de equivalncia em textos gerais. Para Deslile (1988:72), os procedimentos tradutrios de Vinay &
Um empreendimento no qual uma ou mais pessoas esto envolvidas em um nico e definido projeto [minha traduo].
2

54

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Dalbernet no ajudam o tradutor a encontrar equivalentes para a traduo. Um procedimento um mtodo para se obter resultado, (...) para se conduzir uma atividade at sua concluso. Porm esses procedimentos so, na verdade, fatos atrelados a resultados. 3 Sarevic (1985) apresenta seus procedimentos a partir de uma perspectiva diferente. A autora preocupa-se com o fato de que a maioria das tradues jurdicas sejam originalmente escritas privilegiando os interesses do pas da lngua fonte, de modo que o tradutor, segundo ela, deve aderir ao TF. Devido a esta aderncia, a autora afirma que os tradutores tendem a favorecer o que ela chama de procedimentos tradutrios orientados lngua fonte, ou seja, estratgias denominadas de transcrio e traduo de emprstimo. Para Sarevic, transcrio o procedimento atravs do qual o tradutor repete o termo do TF como se fosse um emprstimo ou transfere-o para a lngua alvo, colocando-o em itlico. Segundo a autora, isto s aceitvel se o termo na lngua fonte j tiver sido naturalizado na terminologia da lngua alvo. Em relao traduo de emprstimo, este um recurso no qual o tradutor utiliza um termo composto ou expresso do TF e o traduz literalmente para o TA. Toda vez que o termo na lngua fonte for semanticamente transparente, haver uma tendncia a se usar palavra-por-palavra; entretanto, ela alerta para que o tradutor se assegure de que esta estratgia no resulte em um termo j existente na cultura alvo, o que neste caso poder se tornar um falso cognato. Segundo a autora, ... j que preciso de importncia primria na traduo jurdica, por vezes uma traduo de emprstimo pode ser prefervel a um equivalente lingustico na lngua alvo, que falha em transmitir o sentido da informao do termo na lngua fonte (1985:129). 4
"Vinay and Darbelnet's translation procedures do not help the translator to find translation equivalents. A procedure is a method to obtain a result, () of carrying an activity through to its conclusion. But these procedures are in fact labels attached to results (Deslile, 1988:72). 4 "Since precision is of primary importance in the translation of laws, sometimes a loan translation may be preferable to a potential target language equivalent that fails to convey the significance of the information content of the source language term" (1985:129).
3

Linguagens Especializadas em Corpora

55

No obstante, Sarevic argumenta que traduo de emprstimo, no caso de termos especficos a uma cultura, pode resultar em incompreenso. Sua principal preocupao determinar at que ponto o tradutor jurdico deve fazer concesses ao leitor, ao usar o que ela chama de procedimentos de traduo orientados lngua alvo. Ela os divide em trs categorias: (1) adaptao, (2) descrio atravs de definies e explicaes e (3) substituio descritiva. Adaptao significa utilizar um equivalente cultural no TA ao invs daquele usado no TF. Visto que a traduo jurdica deve garantir equivalncia de significado, Sarevic argumenta que a adaptao duvidosa e deve ser evitada na traduo jurdica" (1985:131). Entretanto, Sarevic no sugere o que fazer em casos nos quais a forma rgida do documento demanda que a adaptao de certas expresses seja feita no TA, como no caso de documentos como contratos, cujas partes so formadas basicamente por expresses formulaicas. Por exemplo, o tradutor dever atentar para termos como whereas, se estiver vertendo um contrato para o ingls. Segundo a conveno de contratos no Brasil, whereas no deve ser traduzido pelo seu equivalente no portugus enquanto, e sim por considerando que. O segundo tipo de procedimento considerado como orientado ao TA aquele que Sarevic chama de definies e explanaes. De acordo com a autora, este um tipo de overtranslation, frequentemente empregado por tradutores jurdicos quando h muitos termos especficos da cultura fonte. Este procedimento feito por intermdio de glossrios, prefcios, notas de rodap ou comentrios. O terceiro tipo chamado de substituto descritivo, que descreve a forma e/ou funo da instituio ou conceito em questo; entretanto, este no um equivalente cultural. Neste caso, o tradutor deve utilizar um translating couplet, em outras palavras, uma traduo de emprstimo reconhecida, seguida pelo termo do TF em parnteses. De acordo com Sarevic, "no restante do texto a traduo de emprstimo geralmente citada, por exemplo work organization (firm), citado a posteriore como work organization" (1985:131). Sarevic afirma que "no basta que os tradutores meramente identifiquem os equivalentes mais prximos nos sistemas jurdicos fonte e alvo" (1997:149). O que os tradutores devem buscar como

56

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

equivalncia uma perspectiva pragmtica de equivalncia, na qual o contedo proposicional 5 do TF deve estar presente no TA. Para atingir este fim, o tradutor dever procurar uma compensao para quaisquer diferenas conceituais que podem vir a colocar em risco a interpretao e aplicao do contedo proposicional.

2. A traduo de contratos internacionais


Ao contrrio de tradues literrias ou mesmo tradues tcnicas, que possuem autoria e leitores, os contratos internacionais no seguem esta regra. O objetivo principal de um contrato selar um acordo entre duas partes, neste caso cada parte pertence a uma lngua e contexto; portanto, a traduo deve ser construda em duas vias ambas as partes esto comprometidas. De acordo com o Duhaime's Law Dictionary 6, a lei de contratos originria da common law, que posterior tort law 7. Tanto os contratos como os torts levam a obrigaes. Os contratos so veculos atravs dos quais as pessoas voluntariamente criam obrigaes para si mesmas. As promessas so a base dos contratos. Um contrato feito de promessas de uma pessoa (ou partes, ou empresa) para que se cumpra algo em troca de uma promessa de outra pessoa. A lei de contrato existe para assegurar que se cumpram as promessas feitas e, caso contrrio, a lei os obrigar a tal. Quanto forma e estilo, os contratos so de certa forma padronizados, o que os torna mais fceis de serem traduzidos, pois o tradutor se familiariza com o formato. As oraes presentes nos contratos so chamadas pela literatura especializada de boiler plates
Dizer que uma crena uma representao simplesmente dizer que ela tem um contedo proposicional e um modo psicolgico, que o seu contedo determina um conjunto de condies de satisfao sob certos aspectos, que o seu modo psicolgico determina uma direo de ajustamento do seu contedo proposicional, de tal maneira que todas estas noes contedo proposicional, direo de ajustamento, etc. so explicadas pela teoria dos atos de fala. (Searle, 1983: 12) 6 www.duhaime.org/LegalDictionary.aspx 7 cf. Blacks Law Dictionary, Tort Law um ramo da lei que lida com problemas civis para os quais uma soluo deve ser obtida.
5

Linguagens Especializadas em Corpora

57

ou expresses formulaicas, que incluem expresses como fora maior e leis aplicveis. Entretanto, alm destas expresses padres, um contrato pode conter uma linguagem bastante especfica, dependendo do tipo de acordo que est sendo feito. Se for um contrato comercial de distribuio de certo produto, o tradutor deve tambm se familiarizar com a linguagem especializada para aquele produto alm, claro, de possuir um excelente comando da lngua do TA e TF. A fim de garantir requerimentos evidenciais, quando se compara a lei contratual entre contratos brasileiros e estadunidenses, algumas discrepncias aparecem de incio. Os contratos brasileiros possuem prembulos que do detalhes sobre as partes e as razes para selarem o acordo. Por exemplo, ao descreverem as partes 8, o contrato brasileiro incluir informao sobre a nacionalidade da pessoa, estado civil, ocupao, endereo, nmero de identidade e CPF. No caso das partes serem empresas, ele incluir informao sobre o tipo de empresa, onde sua sede, qual seu CNPQ e quem ir represent-la. Em contrapartida, muito pouco informado sobre as partes no contrato estadunidense, pelo simples fato de que os detalhes sero especificados quando necessrio ou em respeito ao direito de confidencialidade do cliente. No obstante, isto parecer muito geral aos olhos do advogado brasileiro, que espera esta informao a fim de garantir a fidedignidade das partes. tambm possvel de se observar diferenas entre os dois sistemas jurdicos quanto ao tipo de organizao de uma empresa. Uma rpida verificada no site da Embaixada Brasileira em Washington D.C. 9 revelar que as tradues dos tipos de empresa no oferecem equivalncia nas duas culturas e sim mencionam que A closely resembles B10, como em Sociedade Annima, cuja definio o site descreve como "closely resembling" uma joint-stock company or corporation e Sociedade Limitada, como sendo semelhante a limited liability quota company.

8 9

In case the parties are individuals and not corporations. Veja o site www.brasilemb.org 10 A se assemelha a B.

58

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Outro problema ao traduzir prembulos est em definir os termos para as posies ou atribuies de certa posio na empresa. Por exemplo, em algumas situaes uma pessoa est representando a Diretoria no ato, cujo termo em ingls pode ser Board of Directors. O problema reside no fato de que no Brasil um diretor algum que est presente na empresa todos os dias, portanto a traduo direta para director no apropriada. Nos EUA, so os officers que esto mais familiarizados com as atividades dirias da empresa e no os directors, portanto a traduo para diretor deveria ser officer e para Board of Directors, ao invs de se traduzir para Diretoria, ou mesmo Quadro de Diretores, a melhor opo seria Conselho Administrativo. Embora haja discrepncias culturais entre conceitos legais e categorias nos diferentes sistemas jurdicos, tem havido esforos para unificar os documentos no seu formato no direito contratual internacional 11. Estes esforos tm sido eficazes em parte; no entanto, ocorrem ainda situaes que podem ser desconcertantes para um tradutor, como no caso de algumas expresses formulaicas em contratos, visto que estas podem ser ambguas em certos contextos e, portanto, dificultarem a transmisso correta do contedo proposicional do TF para o TA. Uma das solues para se diminuir as discrepncias entre os contedos proposicionais do TF para o TA pode ser atravs do uso de estratgias de estreitamento e alargamento de conceito, conforme sugerido por Carston (1996). Sequeiros (2001), ao aplicar as noes de Carston, afirma que as discrepncias originadas na traduo podem ser resolvidas se o tradutor escolher codificar sua interpretao do conceito fonte (a proposio do original). Estreitamento de conceito, que tambm pode ser denominado de enriquecimento, pode ser entendido como a aplicao de um conceito que descreve uma extenso de entidades em geral para designar um conjunto mais restrito de entidades. Quando enunciamos certo conjunto de domnios, na verdade estamos nos referindo a um

Veja Unidroit Principles International Institute for the Unification of Private Law. http://www.unidroit.org/english/principles/contects.htm

11

Linguagens Especializadas em Corpora

59

subconjunto deste domnio. Podemos ilustrar este fenmeno atravs do exemplo (1), de Carston (1996): (1) Ela veste coelho. O tradutor naturalmente reduzir o sentido do substantivo coelho, que inclui o sentido coisas feitas de coelho e o enriquecer para incluir pele de coelho. Portanto, de acordo com Sequeiros, "the use of a concept picks out only those entities to which it is relevant to apply it" (2001:198) 12. Este processo de estreitamento visto no processo tradutrio quando o tradutor precisa enriquecer o contedo lingustico do TF para transmitir o contedo proposicional completo da mensagem no TA, caso contrrio a traduo no ser bem sucedida. O processo de alargamento de conceito oposto ao anterior e pode ser definido como o uso de um conceito que menos literal, i.e. que compartilha algumas implicaes lgicas e contextuais com o original. Este o caso de usos metafricos como em (2): (2) Aquela criana realmente uma peste. No caso de peste, o trao semntico de epidemia, pestilncia seria descartado, ao passo que o trao pessoa m, perniciosa, que pertence a seus traos semnticos, permaneceria. Segundo Sequeiros, usos frouxos de conceitos podem dar margem a discrepncias entre o TF e TA. Para um exemplo de termo jurdico que estreito em portugus, porm mais largo em ingls considere-se o caso do termo prevarication. Segundo o Blacks Law Dictionary, prevarication o ato ou instncia de mentir ou evitar a verdade; subterfgio. Por outro lado, em Portugus o termo prevaricao implica em um conceito bastante estreito, pois descreve um crime especfico, i.e., ato perpetrado por funcionrio publico e que consiste em retardar ou deixar de praticar ato de ofcio, ou em pratic-lo contra disposio legal expressa, para
O uso de um conceito seleciona somente aquelas entidades para as quais relevante aplic-la.
12

60

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

satisfao de interesse ou sentimento pessoal, segundo o Novo Dicionrio Aurlio. Ao verter do ingls para o portugus o tradutor ter de estreitar o conceito a fim de incluir somente o que se aplica ao conceito em portugus.

3. Anlise e discusso
A presente anlise ser baseada nos corpora de textos jurdicos, incluindo Contratos de Licena, Acordos, Contrato para a Transferncia de Unidade Industrial, Acordo de Parceria, Contrato de Vendas e Contrato de Vendas de Imveis. Estes corpora so compostos de contratos tanto no portugus do Brasil como no ingls dos EUA, com suas respectivas tradues. A primeira anlise ser no nvel da orao, quando demonstrarei que as expresses formulaicas (boiler-plate formats) no so to transparentes de uma cultura a outra. Como primeiro exemplo, consideremos uma orao em ingls, tirada de um Contrato de Compra de Imveis (3): (3) This Agreement shall be binding upon and inure to the benefit of the parties hereto and their respective successors and permitted assigns. Todos os conceitos em (3) esto tambm presentes na cultura brasileira, portanto a verso para o portugus no apresenta grandes dificuldades. O tradutor poder optar pela orientao ao TA e traduzir de forma direta, como em (4): (4) Este contrato constituir obrigaes e ter efeito legal para o benefcio das partes aqui citadas e de seus respectivos sucessores e cessionrios legais. Entretanto, o formato boiler plate na cultura alvo para a expresso to be binding upon simplesmente obrigar e para a expresso to inure to the benefit of beneficiar. Ao analisarmos a maioria das expresses nos contratos do portugus do Brasil, observaremos o seguinte (5):

Linguagens Especializadas em Corpora

61

(5) Este contrato obrigar e beneficiar (...) Alguns tradutores podero arguir que, ao escolher o formato (3), o segmento ser muito reduzido no TA (cf. Carson). A soluo poderia ser obtida ao analisarmos as intenses semnticas 13 da expresso em ingls. De acordo com o Blacks Law Dictionary, to bind is to impose one or more legal duties on a person or institution as in < the contract binds the parties> 14 Impor obrigaes legais tem o mesmo efeito legal de obrigar. Quanto expresso to inure to, o Merriam Webster Unabridged Dictionary 15 oferece uma definio que se aproxima do contexto em (3): to become legally effective como em < there is such an identity of interest between the taxpayers that a refund to one will inure to the benefit of the other>. A expresso to become legally effective expressa que haver algumas condies jurdicas que garantiro o benefcio das partes, portanto, neste contexto, se o tradutor optar por verter The contract shall...inure to the benefit of the parties para O contrato...beneficiar, este no estar transmitindo o mesmo contedo proposicional do TF. No primeiro caso, no qual o termo shall be binding pode ser vertido para obrigar, no h discrepncia no TF e TA, visto que ambas as expresses possuem o mesmo contedo proposicional. No entanto, no segundo caso, a expresso to inure to the benefit of the parties possui um escopo semntico maior do que sua contrapartida em portugus beneficiar, portanto a perda em contedo proposicional no TA poder causar uma perda na fora jurdica. Constatamos, ento, que se analisarmos um corpus atravs da perspectiva terminolgica, possvel observar que o tradutor encontrar desafios quanto escolha de termos, devido ao seu grau de
According to Lyons concepts have intensions and extensions. Intensions are "the set of essential properties which determines the applicability of the term (1977:159) and extension is "the class of the things to which it is correctly applied (1977:158). 14 Obrigar impor um ou mais deveres legais a uma pessoa ou instituio, como em <o contrato obriga as partes>. 15 MERRIAM-WEBSTER UNABRIDGED (www.Merriam-WebsterUnabridged.com) copyright 2005 by Merriam-Webster, Incorporated.
13

62

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ambiguidade em certos contextos. Como tais expresses so muito numerosas para criarmos aqui uma lista exaustiva, alguns exemplos devem ser suficientes para ilustrar minha posio. Nestes exemplos, utilizarei as noes de estreitamento e alargamento de conceitos, a fim de demonstrar as discrepncias encontradas nas linguagens jurdicas de contratos entre o portugus do Brasil e o ingls dos EUA, tanto no TA como no TF. Como primeiro exemplo de item lexical, consideremos o termo covenant. Na linguagem de contratos, a palavra covenant pode ser traduzida por acordo, contrato, promessa ou garantia, cujos conceitos compartilham propriedades essenciais (intenses) ou como clusula. Em ingls, o conceito tambm possui outros dois sentidos: (1) um acordo formal ou promessa, geralmente presente em um contrato" ou (2) "clusula" (cf. Blacks Law Dictionary). Podemos observar estas duas situaes na linguagem contratual ilustrada abaixo: (6) Share purchase and sale agreement and other covenants. 16 (7) NOW, THEREFORE, in consideration of the mutual covenants and agreements set below in this Agreement, the parties hereto agree as follows 17: No exemplo (6) parece inquestionvel que a expresso covenant est se referindo ao instrumento em sua totalidade, visto que ela se refere ao tipo de contrato e no a partes especficas deste. A verso para o portugus neste caso ser como em (8): (8) Contrato de compra e venda de aes e outros acordos. No entanto em (7), no est claro se a palavra covenant est se referindo ao contrato no todo ou somente a suas partes, pois o tradutor optou pela seguinte verso:
16 17

Contrato de compra e venda de aes e outros acordos. Para traduo, ver 10.

Linguagens Especializadas em Corpora

63

(9) ISTO POSTO, em contraprestao s promessas e acordos mtuos no presente contrato, as partes do presente tm entre si justo e contratado o seguinte: Ao optar pelo termo promessas (9) para verter o termo covenants (7), o tradutor falhou em observar que a expresso set below, delimita o escopo do termo para o que se segue no texto que, neste caso, uma listagem de clusulas; neste caso, o tradutor deveria ter optado pela palavra clusulas (clauses) ao invs de promessas (promises). Uma segunda questo a ser considerada aqui a anlise de todo o enunciado (7) e sua verso (9). O tradutor optou por usar a expresso formulaica do TA em (9) ao invs de utilizar a forma mais direta, como em (10): (10) AGORA, PORTANTO, em considerao s mtuas clusulas e acordos abaixo estabelecidos no presente Contrato, as partes aqui contratam o que segue: Na tentativa de adaptar ao TA e utilizar um formato convencional dos contratos em portugus, o tradutor no somente omitiu a traduo da expresso set below, o que provavelmente levou-o a traduzir promessa por covenant, como tambm tornou a verso mais longa no portugus, ao escolher a expresso as partes do presente tm entre si justo e contratado o seguinte, o que em retrotraducao 18 seria (11): (11) [t]he parties hereto believe as fair and have mutually agreed the following: Ao invs de as partes aqui contratam o que segue, como em (12): (12) [t]he parties hereto agree as follows:
Retro-traducao uma tcnica sugerida por Mona Baker (1992) para testar a qualidade da traduo.
18

64

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Em outras palavras, como a traduo literal tambm aceitvel na lingaugem brasileira de contratos, no havia necessidade de verter para o portugus atravs de um enunciado mais longo a fim de assemelh-lo ao formato boiler plate do TA. Alm de problemas de polissemia lexical como o descrito acima, h outros de polissemia no nvel do sintagma preposicional. Por exemplo, as of + data uma expresso comum em ingls usada na linguagem de contratos que pode ser vertida em portugus de duas maneiras, dependendo do contexto: na data e a partir da data. Nos exemplos (13) e (14) abaixo, podemos observar estes dois usos: (13) This contract is entered into as of June 2, 2001 by and between A and B. (14) The license hereto is effective as of the sixth month of this Agreement 19. Estes dois diferentes significados podem no parecer claros em uma primeira leitura, especialmente se considerarmos que as caractersticas semnticas de enter em (13) incluem o sentido de tornar-se parte de, como em <the parties entered into an agreement>. Entretanto, no portugus o verbo enter geralmente traduzido por celebrar, um verbo que, neste contexto, no aceita como predicado um sintagma preposicional como a partir de. Portanto, a traduo apropriada para (13) seria (15) e no (16): (15) Este contrato celebrado em 2 de junho de 2001, por e entre A e B. (16)* Este contrato celebrado a partir de 2 de junho de 2001, por e entre A e B.

Os termos Contract e Agreement sero considerados como sinnimos para fins de simplificao, visto que um contrato o numero de termos de um (cf. Black's Law Dictionary).

19

Linguagens Especializadas em Corpora

65

Enquanto em (13) as of deveria ser vertido para em, in (14) a verso correta aquela que considera as of como significando naquela data; portanto, deveria se vertido para o portugus como a partir de. O contexto aqui implica que h um estado de coisas que ainda no se tornou realidade, devido ao contedo proposicional da expresso to be effective, que significa chegar a um resultado; passar a ter fora de lei a partir de uma data especfica. Portanto, a verso correta para (14) deveria ser a partir de, como em (17): (17) A presente licena efetiva a partir do sexto ms de vigncia deste contrato. Observa-se que enquanto as of est corretamente vertido em (17), o tradutor optou por usar uma referncia no presente em portugus ( efetiva), em busca de uma equivalncia sinttica com o TF (14). Neste contexto especfico, entretanto, a referncia no futuro, devido expresso preposicional a partir de. A fim de garantir o contedo proposicional, o tradutor tambm usou um processo de estreitamento de conceito para verter para o TA. Isto foi obtido atravs do acrscimo da expresso de vigncia, para garantir que no TF o sentido fosse seis meses a partir do momento que o contrato foi assinado. Este processo de enriquecimento garantiu o estreitamento do contedo proposicional, graas a um acrscimo lexical no TA (cf. Carston, 1996). Uma ilustrao de como o processo de estreitamento de conceito tambm pode ser usado para desambiguao est em (18), no qual o TF em ingls e foi traduzido por (19): (18) X, a company herein represented by its Managing Quota-Holder, Mr Y. (19) X, empresa representada neste ato por seu Scio -Gerente, Sr. Y. O termo herein, neste contexto, conduz ambiguidade, pois contract polissmico: pode significar "o contrato como o documento

66

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

em si" ou "o contrato como o ato envolvendo direitos e obrigaes". Portanto, em ingls (18) pode ser interpretado como em (20): (20) X, a company herein ( neste contrato o documento) represented by its Managing Quota-Holder, Mr. Y. Ou como em (21): (21) X, a company herein (neste contrato o ato) represented by its Managing Quota-Holder, Mr. Y. Um exemplo do processo de alargamento de conceito no TA (neste caso o TF est em portugus), pode ser observado abaixo, onde a expresso realizou um aporte (23) foi traduzida por has contributed to (24): (23) Antes da Data do Fechamento, o Vendedor realizou um aporte Sociedade de todos os ativos fixos relacionados no Anexo 1. (24) Prior to the Closing Date, the Seller has contributed to the Company all fixed assets listed in Schedule 1. No TA, o uso de has contributed to carrega um significado muito mais amplo, como em <to give (money, time, knowledge, assistance, etc.) along with others to a common supply, fund, etc., as for charitable purposes> 20(cf. Blacks Law Dictionary). Em sentido bem mais especfico, usado na linguagem especializada de contratos de seguros como contribution sendo <the method of distributing liabilities, in case of loss, among several insurers whose policies attach to the same risk> 21. O verbo to realize em direito corporativo significa <to convert noncash assets into cash assets> 22; portanto, to realize a
Dar (dinheiro, tempo, conhecimento, assistncia, etc.) juntamente com outros para um fundo comum, para fins de caridade). 21 O mtodo de distribuir passivos, em caso de perdas, entre vrios segurados cujas aplices tambm se ajustam ao mesmo risco. 22 Converter ativos circulantes em ativos permanentes.
20

Linguagens Especializadas em Corpora

67

supply em ingls, possui o mesmo contedo proposicional de realizar um aporte, em portugus. Neste caso, no ha razo para o tradutor no ter feito a traduo de forma literal, visto que havia esta possibilidade. Uma vez que o significado proposicional de realizar um aporte no foi transmitido no TA, o tradutor falhou em comunicar a ideia do original. O tradutor optou por alargar o conceito, ao transmitir somente alguns, mas no todas as implicaes derivveis do conceito codificado, conduzindo a perdas no contedo proposicional do TA. No caso mencionado acima, o mesmo contedo proposicional poderia ter sido transmitido nas duas culturas ao se optar por uma verso direta, porm a estratgia de alargamento e estreitamento de conceitos geralmente necessria quando h assimetrias parciais entre conceitos de diferentes culturas. J que neste caso havia simetria, a traduo poderia ter sido orientada ao TF, como em (25): (25) Prior to the Closing Date, the Seller realized a supply of all fixed assets listed in Schedule 1 in favor of the Company. 23 No prximo exemplo foi feita uma traduo direta em busca de fidedignidade ao TF (26-27); entretanto, diferentemente do exemplo recm citado em (23-25), no prximo exemplo ocorreu assimetria de conceitos, o que exigiu o uso de um conceito alargado no TA: (26) Todos os pagamentos estabelecidos no presente Contrato sero efetuados no Brasil, em moeda brasileira. (27) All the payments set forth in this Agreement will be effected in Brazil, in Brazilian currency. O conceito alargado em (27) no transmite o contedo proposicional do TF, visto que o verbo to effect, que significa produzir para ter um efeito; realizar; obter; executar no pode ser utilizado com o verbo to pay, como em portugus.
Antes da Data do Fechamento, o Vendedor realizou um aporte Sociedade de todos os ativos fixos relacionados no Anexo 1, em favor da Empresa.
23

68

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Conforme observado, ajustes devem ser feitos a fim de garantir uma traduo fidedigna e isto pode ser obtido se lanarmos mo de estratgias tais como alargamento e estreitamento de conceitos. No entanto, antes de empregar estas estratgias, o tradutor ter de determinar o contedo proposicional do TF e tentar comunic-lo no TA. Considerando-se que um contrato permeado de regras, podese supor que estas regras sejam facilmente traduzveis, pois seguem um padro especfico. Segundo observou Sarevic (1997), a estrutura lgica das regras jurdicas expressa pela formula se P, ento Q, que significa que Q deve ser executado somente nos casos em que as condies que constituem P forem preenchidas. Muitas das clusulas de um contrato tm uma estrutura condicional, como em: (36) Caso a Empresa X no cumpra o prazo estabelecido na Clusula 2.3, passar ento a pagar Empresa Y 50% (cinquenta por cento) acima das quantias descritas na clusula 2.2. Os tradutores jurdicos so orientados a seguirem a sintaxe do TF. Quando esta no transparente, o tradutor poder se confundir e produzir uma orao ambgua no TA. Observemos a orao em (37), na qual o TF em portugus: (37) O saldo da Conta Grfica apurado pelos auditores da Compradora, caso seja positivo, ser revertido Sociedade em 10 (dez) dias teis contados da data de extino da Conta Grfica. A traduo ficou ambgua devido ao deslocamento da orao condicional e resultou em contedo proposicional diferente no TA: (38) The positive balance of the Memorandum Account, ascertained by the auditors, if any, shall accrue to the Company within 10 (ten) business days as from the closing date of the Memorandum Account. A ambiguidade no TA em (36) reside no fato de que o tradutor deslocou o adjetivo da orao condicional para modificar o sujeito e,

Linguagens Especializadas em Corpora

69

portanto, teve de usar o pronome any para transmitir o condicional; no entanto, o pronome any, neste contexto, parece estar se referindo a auditors e no a balance. Sarevic (1997) acredita que estes casos servem como alertas aos tradutores de contratos, para que estes evitem os deslocamentos de elementos na estrutura lgica do TF. Ao seguir-se sua recomendao, o texto original (37) ficaria mais claro se fosse vertido como em (39): (39) Caso o saldo da Conta Grfica apurado pelos auditores da Compradora seja positivo, este ser revertido Sociedade em 10 (dez) dias teis, contados da data de extino da Conta Grfica. Com base no exposto acima, a estrutura lgica de contratos internacionais deve tambm ser mantida, visto que este tipo de texto um instrumento que redigido no TF, mas ir eventualmente ser vertido para o TA. Devido ao seu objetivo principal de fazer com que as duas partes selem um acordo, neste caso cada uma das partes pertencentes a uma cultura diferente e a um sistema jurdico diferente, a situao ideal seria se a elaborao do contrato internacional fosse feita levando-se em conta tanto o TF como o TA. O comrcio exterior e a elaborao de contratos no podero existir sem traduo jurdica e o sucesso de um empreendimento depende de um contrato bem traduzido. Por essa razo, levantei questes a fim de demonstrar que as dificuldades na traduo de contratos podem ser em parte solucionadas se forem abordadas atravs da pragmtica e no somente atravs de meios convencionais de traduo. Descrevi estratgias de alargamento e estreitamento de conceitos (Carston, 1996), que esto na interface pragmticosemntica, a fim de demonstrar que h muito mais envolvido em tradues de linguagens especializadas - neste caso o texto jurdico da rea de contratos internacionais entre Brasil e EUA - do que a preocupao com termos tcnicos, estrutura lgica, aspectos sintticos e semnticos.

70

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Referncias
AUSTIN, J. 1962. How to do things with words. Cambridge, MA: Harvard University Press. BAKER, M. (ed). 1998. Routledge Encyclopedia of Translation Studies. London: Routledge. BLACK'S LAW DICTIONARY (7th ed. 2000) ed. by B. Garner. St. Paul: West Publishing Company. CARSTON, R.; UCHIDA, S. 1998. Relevance Theory: Applications and Implications. Clevedon: Multilingual Matters. CARSTON, R. 1996. 'Enrichment and Loosening: complementary processes in deriving the proposition expressed?' UCL working papers in linguistics. Vol 8: 61-88. CODE OF PROFESSIONAL RESPONSIBILITY FOR INTERPRETERS, TRANSLITERATORS AND TRANSLATORS. 1990. Trenton, NJ: Administrative Office of the Courts, State of New Jersey. DELISLE, P. 1988. Translation: an interpretive approach. In P. LOGAN and M. CREERY. Ottawa: Ottawa University Press. FELLBAUM, C. Semantics Via Conceptual and Lexical Relations. In: VIEGAS, E. (ed.) Breadth and Depth of Semantic Lexicons. The Netherlands, Kluwer Academic Publishers, 1999. GRICE, P. 1975. Logic and Conversation. In P. Cole & J. Morgan (eds), Syntax and Semantics, vol 3: Speech Acts (p. 41-58). New York: Academic Press. ______. 1981. "Presupposition and Conversational Implicature", in P. Cole (Ed.) Radical Pragmatics, New York: Academic Press. GUTT, E. (1991) Translation and Relevance: Cognition and Context. Oxford: Blackwell. LYONS, J. 1977 . Semantics. vol. 1. Cambridge: Cambridge University Press. NEWMARK, P. 1973. 'Twenty-three restricted rules of translation'. The Incorporated Linguist, 12: 1. ______. 1981. Approaches to Translation. London: Pergamon. ______. 1991. About Translation. Clevedon: Multilingual Matters.

Linguagens Especializadas em Corpora

71

NOGUEIRA, D. 2000. Vocabulrio para Direito Societrio Portugus/Ingls. So Paulo: SBS Special Book Services. OBENAUS, G.1995. The legal translator as information broker. in MORRIS, M. (ed) Translation and the Law. Amsterdam: John Benjamins Publishing Co. PERNA, C. 2010. Legal Translation in the light of relevance theory. In: COSTA, J.C. & RAUEN, F.J. (Org.) Topics on Relevance Theory. Porto Alegre: Edipucrs. SAPIR, E. 1956. Culture, Language and Personality. Berkeley: University of California Press. SAREVIC, S. 1985. 'Translation and culture-bound terms in law'. Multilingua 4 (3): 127-33. ______. 1997. New Approach to Legal Translation. The Hague: Kluwer Law International. ______. 1998. Creativity in Legal Translation: How much is too much? In: CHESTERMAN, A, SAN SALVADOR, N & GAMBIER, Y (eds.) Translation in Context. Selected Contributions from the EST Congress, Granada 1998. SEARLE, J. R. 1983. Intentionality: An Essay in the Philosophy of Mind. New York: Cambridge University Press. [Intentionality. Intencionalidade. Tr.: Madalena Poole da Costa. Lisboa: Relgio dgua, 1999.] SEQUEIROS, X. 2001. Types and degrees of interpretive Resemblance in Translation. Revista Alicantina de Estudios Ingleses. In MARTINEZ, J. AND YUS, F. (Eds) Revista Alicantina de Estudios Ingleses (14) November, 2001.Departamento de Filologia Inglesa, Universidad de Alicante. THEODORO JR., E. 1999. 'Translating the Law: when the medium is not the message'. ATA Chronicle. Washington D.C. VINAY, J. P. AND DALBERNET, J. 1958. Stilistique comparee du francais et de l'anglais. Paris: Didier. ______. 1977. Stylistique compare du franais et de langlais: Mthode de traduction. Paris: Didier. WESTON, M. (1983) 'Problems and Principles in Legal Translation'. The Incorporated Linguist. 22(4): 207-11. ______. (1995) in Morris, M. (ed.) (1995): Translation and the Law, Amsterdam, John Benjamins Publishing Co.

FAZER TERMINOLOGIA FAZER LINGUSTICA 1 Gladis Maria de Barcellos Almeida 2


Resumo: H pelo menos 20 anos, a Terminologia, enquanto disciplina autnoma e como um domnio de conhecimento que integra a rea da Lingustica, vem se constituindo um campo de pesquisa promissor no Brasil. Entretanto, ainda no evidente o saber lingustico que sustenta o fazer terminolgico, mesmo quando as pesquisas so realizadas por linguistas, em oposio quelas realizadas por cientistas da informao ou tradutores. Assim, este artigo tem o objetivo de apresentar, de maneira sucinta, esse saber lingustico. Discorre-se sobre algumas tarefas da atividade terminolgica, de maneira a pr em evidncia o conhecimento lingustico nelas implicado. Para tanto, elegeu-se como cenrio o Grupo de Estudos e Pesquisas em Terminologia (GETerm) que, desde 1999, desenvolve pesquisas nessa rea. Espera-se, pois, contribuir para uma maior consolidao da Terminologia como disciplina lingustica. Pretendemos, neste captulo, discorrer sobre o fazer lingustico constitutivo da pesquisa terminolgica. Para tanto, utilizaremos a experincia adquirida nos projetos encerrados e em andamento no mbito do Grupo de Estudos e Pesquisas em Terminologia (GETerm). Para realizar esse intento, iniciaremos por conceituar Terminologia. Em seguida, apresentaremos o GETerm para, ento, percorrermos cada etapa da atividade terminolgica, demonstrando toda a base lingustica que est por trs de cada uma das fases do trabalho.
A autora agradece a Ariani Di Felippo a leitura atenta e as sugestes sempre pertinentes. Eventuais impropriedades so de responsabilidade exclusiva da autora. 2 Universidade Federal de So Carlos (UFSCar) Centro de Educao e Cincias Humanas Departamento de Letras e Ps-Graduao em Lingustica 13565-905 So Carlos SP Brasil. Endereo eletrnico: gladis@ufscar.br
1

Linguagens Especializadas em Corpora

73

1. O que Terminologia?
O termo terminologia pode ter duas acepes distintas. A primeira refere-se ao conjunto vocabular prprio de uma cincia, tcnica, arte ou atividade profissional (TERMISUL 3; O Pavel), como a terminologia da Fisioterapia, do Direito, da Msica, dos Artefatos de Borracha, etc. A segunda acepo designa no s o conjunto de prticas e mtodos utilizados na compilao, descrio, gesto e apresentao dos termos de uma determinada linguagem de especialidade (=terminologia enquanto atividade) (SAGER,1993), como tambm o conjunto de postulados tericos necessrios para dar suporte anlise de fenmenos lingusticos concernentes comunicao especializada, includos a os termos, evidentemente (=terminologia enquanto teoria). Para efeito de clareza, emprega-se normalmente terminologia, com inicial minscula, para designar vocabulrio ou repertrio vocabular; para terminologia enquanto atividade e teoria, empregase Terminologia, mas com a inicial maiscula. O principal objetivo da Terminologia dar conta do funcionamento das unidades lexicais especializadas em situaes comunicativas profissionais, acadmicas ou cientficas (LORENTE, 2004), de modo que essa comunicao se realize de forma compreensvel e sem ambiguidades em ambientes mono e/ou multilngues. (TERMISUL)

2. O GETerm como cenrio


O Grupo de Estudos e Pesquisas em Terminologia 4 (GETerm), formado em 1999 no Departamento de Letras da Universidade Federal de So Carlos, integra o Diretrio dos Grupos de Pesquisa do CNPq. O Grupo tem como objetivos: 1) estudar contedos pertinentes Terminologia; 2) desenvolver pesquisas que gerem produtos
Grupo de Pesquisa do CNPq sediado na Universidade Federal do Rio Grande do Sul. Criado em 1991 no Instituto de Letras. Acesse o site: http://www6.ufrgs.br/termisul/terminologia_terminografia.php 4 http://www.geterm.ufscar.br
3

74

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

terminolgicos em lngua portuguesa, tais como: glossrios, dicionrios, enciclopdias e assemelhados, que satisfaam demandas reais; 3) desenvolver ferramentas computacionais e/ou ambientes que facilitem a prtica terminolgica. O Grupo conta com uma equipe multidisciplinar, envolvendo linguistas, informatas e especialistas de domnio. importante ressaltar que, desde 2002, o GETerm tem recebido valiosas colaboraes de pesquisadores do Ncleo Interinstitucional de Lingustica 5 Computacional (NILC), sediado no Instituto de Cincias Matemticas e da Computao (ICMC) da USP/So Carlos. A meta do GETerm aliar a Terminologia Informtica de forma a gerar produtos terminolgicos mais confiveis e em menor tempo. No mbito de GETerm, vimos tentando sistematizar um mtodo de trabalho que, alm de ser eficiente para a gerao de produtos terminolgicos, estivesse em consonncia com os postulados de uma Terminologia de orientao descritiva, fundamentada em princpios da Lingustica. Essa escolha no sem razo, haja vista que uma teoria descritiva de base lingustica parece ser muito mais adequada ao contexto brasileiro: pas monolngue com grande variedade dialetal sem outra(s) lngua(s) oficial(is) minoritria(s) ou ameaada(s) (ALMEIDA, 2006). Filiar-se a uma teoria de orientao descritiva significa, fundamentalmente, abandonar o tratamento prescritivo das terminologias em favor de enfoques descritivos capazes de entender o lxico especializado como um elemento natural das lnguas naturais (KRIEGER e BEVILACQUA, 2005). E fazer Terminologia fundamentada em princpios da Lingustica significa, como ponto de partida, revisitar a definio de termo. Em razo de o termo ser o objeto por excelncia da Terminologia e de que uma das tarefas mais comuns dessa disciplina construir repertrios terminolgicos, iniciaremos a exposio das etapas de trabalho pela discusso do que vem a ser termo dentro de uma perspectiva lingustica.

http://www.nilc.icmc.usp.br

Linguagens Especializadas em Corpora

75

3. Afinal, o que termo?


Uma das grandes dificuldades enfrentadas pelo terminlogo que pretende desenvolver um produto terminolgico 6 , sem dvida nenhuma, o terreno movedio que h entre termo (unidade dos discursos especializados) e palavra (unidade da lngua geral). Ora, que critrios devemos utilizar para efetuar a contento a tarefa de seleo de termos em textos especializados? Dito de outro modo: como saber, ao certo, se aquela unidade selecionada um termo, j que o terminlogo, na maioria das vezes, no um especialista da rea que est sendo objeto de investigao? Essa dificuldade diz respeito sobretudo: a) queles termos que so utilizados tambm na lngua geral por um no-especialista, b) s lexias complexas que, muitas vezes, so apenas uma combinatria de palavras ou um sintagma discursivo, ex.: suporte queimado, esmalte viscoso, etc. Como saber o que realmente termo num texto especializado, para elaborarmos o inventrio terminolgico acerca de determinado domnio? Esses questionamentos nos levam a revisitar a definio de termo. Para tanto, selecionamos duas obras que tm regulamentado a pesquisa terminolgica em vrios pases, a saber: Terminology work Vocabulary - Part 1: Theory and application, ISO 1087 (2000), Vocabulaire systmatique de la terminologie (Office de la langue franaise, Qubec, 1985). A primeira define termo como sendo Designao de um conceito numa lngua de especialidade por meio de uma expresso lingustica. (trad. nossa). Para a segunda, o termo uma unidade significante constituda de uma palavra (termo simples) ou de mais de uma palavra (termo complexo) e que designa um conceito de maneira unvoca no interior de um domnio de especialidade. (trad. nossa) Por essas definies, percebemos que o aspecto formal o critrio levado em conta, j que ambas se utilizam de unidades lxicas tais como expresso lingustica e unidade significante constituda de uma palavra ou de vrias palavras. Se o critrio formal fosse suficiente,
6

Como produto terminolgico, consideramos: glossrio, dicionrio, base de dados terminolgicos, ontologia, etc.

76

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

no haveria equvocos na identificao de termos em corpus 7, pois de imediato seria possvel reconhecer marcas formais, principalmente no que concerne aos nveis morfolgico e lexical. Essa facilidade se observa quando estamos diante de uma formao marcadamente tcnico-cientfica, como as que utilizam morfemas greco-latinos, posto que o nvel morfolgico j suficiente para indicar que se trata de um termo e no de uma palavra. Observe-se o exemplo na Fig. 1:

Alumina

de alum(nio) + -ina

< lat. aluminium


Figura 1: etimologia do termo alumina

Nesse exemplo, o critrio formal (nvel morfolgico) vlido para distinguir termo de palavra. Outra possibilidade utilizar o nvel lexical e constatar os paradigmas derivacionais. Tabela 1: Paradigmas derivacionais (adaptado de Almeida, 2000)
P B trabalh trabalh flocul e flocul flocul de flocul dispers dispers
7

VT a a a a a a a

SN/SV vel bilidade nte nte r o nte r

Neste artigo, estamos utilizando o termo corpus na acepo de Sinclair (2005): A corpus is a collection of pieces of language text in electronic form, selected according to external criteria to represent, as far as possible, a language or language variety as a source of data for linguistic research.

Linguagens Especializadas em Corpora

77

B esmalt esmalt esmalt viscos viscos

VT e a a i

SN/SV

r o dade metro P = prefixo B = base VT = vogal temtica SN/SV = sufixo nominal; sufixo verbal

Como se observa na Tab. 1, a partir da ocorrncia de um dos termos, podemos inferir que as demais ocorrncias constituam termos tambm. Infelizmente isso no possvel com a grande maioria dos termos originrios da lngua geral, termos esses que no tm marcas formais para facilitar a sua recolha em textos especializados, como por exemplo: forno, secador, peneira, biscoito, unidades da terminologia de Revestimento Cermico. Isso ilustra as dificuldades em identificar termo utilizando critrios estritamente formais. Que critrios devemos levar em conta para distinguir um termo de uma palavra, j que a partir de uma perspectiva lingustica todos so igualmente signos da lngua natural? No existe, pois, um conjunto de termos isolados constituindo uma lngua marginal lngua geral; o que h so signos da lngua natural que se realizam ora como palavras, ora como termos, dependendo da temtica, dos usurios, da situao comunicativa (CABR, 1999; 2003). O que distingue, portanto, termo de palavra so critrios pragmticos. Em outras palavras: quem diz o qu? Para quem? Em que situao? Ou como afirmou Neves (2009 8): Tudo aquilo que se diz, se diz em algum contexto de uso.

Conferncia de Maria Helena de Moura Neves, realizada no mbito do Congresso de Lingustica realizado em sua homenagem, em agosto de 2008 na UNESP/Araraquara, SP. Para maiores informaes, conferir o stio http://www.estudoslinguisticos.ibilce.unesp.br/eventos/congressolinguistica/ind ex.php

78

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Essa redefinio de termo permite-nos, ento, constatar que a denominao lngua de especialidade acaba sugerindo uma fragmentao e uma marginalizao inadequadas, como se fosse um subsistema lingustico separado. O que temos, na verdade, a expresso das cincias e das tcnicas pela lngua natural. Se termo assim concebido, ento a sua identificao deve sempre ser feito nos contextos de uso, isso implica necessariamente a elaborao de um corpus, de maneira que seja possvel observar os termos in vivo (De BESS, 1997), ou nas palavras de Cabr (2004): La terminologia (...) debe recoger los trminos originales a partir de los usos que los especialistas hacen de ellos. Mas o que h de lingustico por trs da tarefa de organizao de um corpus?

4. A organizao de corpus como um exerccio lingustico


A elaborao de um corpus para pesquisas terminolgicas (sobretudo naquelas cujo objetivo a construo de dicionrios, glossrios, vocabulrios, ontologias, bases terminolgicas, etc.) exige o cumprimento de uma srie de requisitos, j que a partir do corpus compilado que: a) se extraem os termos e suas eventuais formas variantes; b) se observam as colocaes e as fraseologias prprias de um discurso especializado; c) se infere as relaes semnticas entre os termos de maneira que seja possvel a elaborao de uma eventual ontologia; d) se observa o termo em todos os seus contextos de ocorrncia, sendo possvel inferir traos semnticos recorrentes para redigir a definio terminolgica. Uma temtica lingustica que posta em evidncia na seleo de textos que comporo o corpus diz respeito s noes de gnero discursivo ou gnero textual, de acordo com a perspectiva de Marcuschi (2008) , j que o cuidado nessa seleo cumpre os requisitos amostragem e representatividade, imprescindveis para a Lingustica de Corpus (BIBER, 1993; KENNEDY, 1998; RENOUF, 1998; BERBER SARDINHA, 2004; SINCLAIR, 2005). Segundo McEnery e Wilson (1996), um corpus deve ter uma amostragem suficiente da lngua ou variedade de lngua que se quer analisar para obter-se o mximo de representatividade desta mesma lngua ou

Linguagens Especializadas em Corpora

79

variedade de lngua. Assim, necessrio ter em conta qual noo de gnero est por trs da seleo dos textos. O pesquisador pode optar, por exemplo, pela perspectiva interacionista e dialgica de Bakhtin (1997), ou pela sistmico-funcional de Halliday e Hasan (1989), ou a socio-retrica de Swales (1990), ou ainda a sociodiscursiva de Bronckart (1999). Aps a escolha da perspectiva terica que fundamentar a seleo dos textos, iniciam-se as atividades de compilao, manipulao e nomeao dos arquivos de textos; pedidos de permisso de uso (quando for o caso); e anotao (se for relevante para a pesquisa) (ALUSIO e ALMEIDA, 2006; ALMEIDA e CORREIA, 2008). Com o corpus compilado e pronto para extrao de termos, podem ser iniciadas as anlises morfolexicais.

5. Aspectos morfolexicais das terminologias


Conforme j observado em Almeida e Vale (2008), nas terminologias que tm sido objeto de estudo do GETerm, constatamos que h padres morfolgicos especficos. A terminologia de Revestimento Cermico, por exemplo, possui uma alta frequncia de lexias complexas (argila refratria aluminosa, anlise granulomtrica por peneiramento, resduo em malha, etc.) e lexias simples com determinados morfemas que podem servir como identificadores de termos, como os sufixos derivacionais -agem, -o, -mento que podem indicar que o conceito veiculado um processo: secagem, moagem, britagem, ensilagem, etc; triturao, atomizao, defloculao, etc; peneiramento, destorroamento, envelhecimento, etc. Na terminologia da Fisioterapia, o que realmente produtivo so as formaes eruditas, j que essa terminologia tem muitos termos emprestados da Medicina, ou seja, contm termos cujos morfemas, tanto radicais quanto afixos, tm origem grega ou latina, como por exemplo: artr(i/o)- (do gr. rthron) elemento de composio que significa 'juntura'; 'articulao': artralgia, artrectomia, artrite, artrocentese, etc.; -ide (do gr. -(o)edos, pelo lat. cient. -des) sufixo que pode significar 'aspecto ou forma de', 'semelhante a', 'relativo a': deltide, escafide, articulao elipside, articulao trocide, etc.; -ose

80

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

(do lat. cient. -osis < gr. -sis) sufixo muito produtivo na Anatomia e na Medicina, utilizado para formar os substantivos de diversos processos patolgicos e doenas, agregando-se a uma base que designa quer o rgo, quer parte dele: artrose, aterosclerose, escoliose, hiperlordose, etc 9. A terminologia da Nanocincia e Nanotecnologia 10, por sua vez, apresenta lexias simples e complexas, entretanto, uma das caractersticas a alta frequncia do prefixo 11 nano- 12 (18.370 ocorrncias num corpus de 2.565.490 palavras) em muitas unidades: nanocompsitos, nanocristais, nanoeletromecnicos, nanossistema biolgico, nanop cristalino, filme nanoestruturado, nanotubo de carbono, nanopartcula de dixido de titnio, imunonanoconchas, etc. Alm de o prefixo nano- figurar como forma presa (unindo-se a uma base com ou sem hfen), aparece tambm como forma livre, neste caso, exercendo as funes de substantivo e de adjetivo. Observem-se os exemplos: 1. substantivo nano-segregao, nanopartculas; e ocorrendo como forma livre: Estima-se tambm que sejam criados mais de cinco milhes de empregos em nano nos prximos cinco anos. 2. adjetivo material nanocristalino, sistema nanoeletromecnico; e ocorrendo como forma livre: escala nano, ou ainda: Para 2014, recente estudo internacional aponta que o mercado de produtos nano ser de cerca de US$ 2,3 trilhes.
As observaes etimolgicas referentes aos morfemas citados no texto foram obtidas nos dicionrios Ferreira (2004) e Houaiss e Villar (2001). 10 Terminologia elaborada no mbito do projeto Terminologia em Lngua Portuguesa da Nanocincia e Nanotecnologia: Sistematizao do Repertrio Vocabular e Elaborao de Dicionrio-Piloto NANOTERM, com apoio do CNPq (cf. COLETI et al., 2007). 11 Foram encontrados no corpus alguns casos em que o formante nano ocorre na posio de base, tais como: escala micro-nano, dispositivos plasmo-nano, catenano, etc, como se poder observar na sequncia deste artigo. 12 O prefixo nano- assim definido pelo dicionrio Houaiss (HOUAISS e VILLAR, 2001): nano-: do SI, simbolizado por n, do gr. nnnos,,on 'de excessiva pequenez' ou nnos 'ano', adotado na 11 Conferncia Geral de Pesos e Medidas, de 1960 (resoluo n 12), equivalente a um multiplicador 10-9, ou seja, milsimo milionsimo (na nomenclatura tradicional brasileira bilionsimo) da unidade indicada.
9

Linguagens Especializadas em Corpora

81

O que observamos nessas anlises de distintas terminologias que os processos de formao de palavras mais produtivos ainda so os vernculos, tais como: derivados prefixais, derivados sufixais, compostos e compostos sintagmticos, confirmando as pesquisas realizadas pelo grupo TermNeo 13 (ALUSIO et al., 2006). Outro aspecto digno de nota que, ao contrrio de que se imagina e do que dizem os discursos miditicos, os emprstimos do ingls no so to preponderantes. Para se ter uma ideia, de 765 termos de Revestimento Cermico, apenas 9 so anglicismos, o que equivale a cerca de 1,2%: ball-clay, china-clay, flint-clay, fire-clay, insert, creta print, euroline, mesh e sistema rotocolor. H na verdade mais termos oriundos do italiano e do francs: muratura, bombatura, festone, mrmore travertino, bordura, mate, tamizao, terracotta/cotto, grs, tozzeto, etc. Na terminologia da Fisioterapia, dos 1.200 termos que compem o repertrio, apenas 9 so anglicismos (ou 0,75%): biofeedback, hot pack, shaking, shuttle test, spray, maitland, leg-press, splint, rash cutnea. No vocabulrio da Nanocincia e Nanotecnologia, Coleti (2009) analisou 10% dos termos mais frequentes de um total de 3.069 termos. Para essa seleo, foram consideradas as listas de uni, bi, tri e tetragramas (termos compostos de 1, 2, 3 e 4 palavras respectivamente), em seguida, foi feita a seleo de 10% dos termos mais frequentes em cada uma das listas, o que correspondeu a: 80 unigramas, 59 bigramas, 60 trigramas, 16 tetragramas, perfazendo um total de 315 termos, desse total, apenas 13 termos so emprstimos ou contm emprstimos em sua composio sintagmtica: campo de stokes, chip, conformao por spray, frequncia do laser, frequncia do laser escravo, frequncia do laser mestre, ingap, laser, laser escravo, laser mestre, laser semicondutor, spin, stokes. Se considerarmos que o item lxico laser 14 j est dicionarizado nos
Acrnimo do projeto "Observatrio de Neologismos Cientficos e Tcnicos do Portugus Contemporneo", coordenado por Ieda Maria Alves, criado em 1988 e sediado no Departamento de Letras Clssicas e Vernculas da Faculdade de Filosofia, Letras e Cincias Humanas da Universidade de So Paulo (FFLCH-USP). 14 Proveniente do ingls laser (1960), acrnimo de Light Amplification by Stimulated Emission of Radiation (amplificao de luz por emisso estimulada de radiao) (HOUAISS e VILLAR, 2001).
13

82

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

grandes repertrios da lngua portuguesa, teramos na verdade 6 emprstimos (todos anglicismos). H ainda que considerar que stokes se repete, pois constitui um unigrama e um bigrama, portanto, temos 5 ocorrncias de emprstimos nos grupos dos 10% mais frequentes, o que corresponde a 1,6%. Assim, ao se analisar terminologias do portugus, desvenda-se na verdade o prprio funcionamento da lngua, o que para ns no constitui uma novidade, uma vez que os termos so signos lingusticos e, portanto, esto afeitos s regras internas da lngua. O que, a propsito, s vem confirmar o fato de que os repertrios terminolgicos no esto separados da lngua geral, mas so parte constitutiva dela:
Parece ser que existe consenso en la idea de que la diferenciacin entre el trmino y el no trmino es pragmtica, puesto que los trminos se forman del mismo modo que el resto de los elementos lxicos de la lengua: siguen los tipos de estructura que el sistema permite, emplean los mismos recursos de formacin de palabras, y se someten a las mismas reglas de combinacin y a sus restricciones. Son, en fin, tan signos lingsticos como cualquier otro. (Castillo, 1998, p.99)

6. A semntica por trs das ontologias de domnio e da redao da definio terminolgica


Os conceitos desempenham importante papel em qualquer projeto terminolgico, j que eles no esto isolados, fazem parte de um campo especializado e relacionam-se com outros conceitos, formando uma rede ou estrutura conceitual ou ontologia. So estas ontologias representando um conjunto sistematizado dos conceitos que descrevem um domnio do conhecimento especializado. Para a elaborao da ontologia, h que se conhecer o campo especializado com o qual se est trabalhando, ou ento, ter assessoria permanente dos especialistas da rea, pois necessrio identificar os conceitos nos textos, agrup-los em distintos campos semnticos e estabelecer as relaes entre eles.

Linguagens Especializadas em Corpora

83

Numa pesquisa terminolgica, a ontologia fundamental para: 1) permitir a modelagem do conhecimento num formato que possa ser reutilizado em outras pesquisas e/ou aplicaes computacionais; 2) possibilitar uma abordagem mais sistemtica de um domnio; 2) circunscrever a pesquisa, j que todas as ramificaes do domnio so previamente consideradas; 3) delimitar o conjunto terminolgico; 4) determinar a pertinncia dos termos, pois separando cada grupo de termos pertencente a um determinado campo semntico, poder-se- apontar quais termos so relevantes para o trabalho e quais no so; 5) prever os grupos de termos pertencentes ao domnio, como tambm os que fazem parte de matrias conexas; 6) definir as unidades terminolgicas de maneira sistemtica; 7) controlar a rede de remissivas (TERMCAT, 1990; ALMEIDA, 2000). H que se enfatizar que essa delimitao do campo necessria porque medida que se vai modelando o conhecimento especializado, vai-se explicitando uma determinada viso cultural e cientfica da realidade (CABR, 1993). Isto porque a delimitao de um campo especializado feita segundo: 1) os objetivos do trabalho terminolgico; 2) o pblico-alvo que se quer atingir; e, sobretudo, 3) os critrios utilizados para recortar o conhecimento de determinada maneira. Portanto, a partir do recorte, tem-se uma ontologia especfica. A ontologia constitui, ento, uma representao da realidade no mbito do domnio que se toma como objeto de estudo. Essa representao procura recolher e organizar todas as ramificaes que so prprias do referido domnio, de modo a refletir, em forma de esquema, a realidade da rea em questo. Assim, a modelagem do conhecimento por meio de ontologias tem-se revelado uma atividade bastante relevante e necessria em distintas reas, uma vez que as relaes semnticas contidas nas ontologias permitem aos sistemas computacionais a recuperao da informao de maneira mais eficiente. Ao organizar esses sistemas semnticos, consideram-se basicamente dois tipos de relaes paradigmticas nos mbitos de especialidade: as relaes de abstrao (gnero-espcie) e as relaes ontolgicas ou partitivas (parte-todo), ambas baseadas num modo de organizao hierrquica. Todavia, na grande maioria dos campos

84

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

especializados, h que se considerar tambm outros tipos de relaes, como as relaes causais (causa-efeito), as relaes genticas (produtor-produto), entre outras, que no esto baseadas nos princpios de dependncia hierrquica. Segundo Sager (1993), atualmente se admite que para aplicaes prticas pode-se estabelecer qualquer tipo de relao conceitual e transform-la, inclusive, num requisito para uma necessidade concreta. Por exemplo, um objeto pode relacionar-se com sua origem geogrfica, sua substncia material, seu mtodo de produo, seu uso e funo, etc. A configurao dos sistemas semnticos com suas complexas relaes depende do objetivo a que se prope a anlise semntica, ou seja, a Terminologia no trata os sistemas como esquemas fechados e absolutos, mas como sistemas criados para o fim especfico de facilitar a comunicao. Um modelo eficiente de representao semntica pode ser, por exemplo, a Estrutura Qualia de Pustejovsky (1995). A Estrutura Qualia (= significado das palavras) como um dos nveis de representao da informao lexical d relevo para o aspecto relacional de uma unidade lxica. Nas palavras de Pustejovsky (1995, p. 76), de algum modo o lxico gerativo considera todos os itens lexicais como relacionais num certo grau, mas a maneira como essa caracterstica expressa funcionalmente ser diferente, claro, de categoria para categoria, assim como entre classes semnticas. (traduo nossa). A Estrutura Qualia especifica quatro aspectos essenciais (ou papis) que auxiliam a determinar o significado de uma palavra: CONSTITUTIVO: estabelece a relao entre um objeto e suas partes constituintes; FORMAL: distingue um dado objeto num domnio mais amplo ou mais geral; TLICO: exprime o propsito e a funo do objeto; AGENTIVO: aponta fatores que envolvem a origem do objeto ou a causa para o objeto acontecer, ocorrer ou existir. Segundo o autor, h dois pontos importantes que devem ser considerados nos papis qualia: 1) toda a categoria expressa uma estrutura qualia; 2) nem todo item lexical tem um valor atribudo para cada papel qualia.

Linguagens Especializadas em Corpora

85

Observem-se, por exemplo, os termos silicato de sdio anidro, silicato de sdio hidratado e silicato de sdio penta-hidratado. Todos fazem parte da classe genrica silicato de sdio; entretanto, a diferena entre eles est na quantidade de gua na sua frmula. Assim, de acordo com os papis qualia, teramos:

A atribuio de valores nos papis qualia vai, portanto, identificando o objeto at o ponto em que ele possa ser distinguido dos demais e individualizado. Assim, a estrutura qualia prov um modelo (template) til para a representao da informao lexical e aplicvel computacionalmente. Como se pode observar, h um conhecimento semntico necessrio no s para a organizao da ontologia como tambm para uma eventual aplicao computacional 15. No que se refere redao da definio terminolgica (DT), cumpre mencionar que constitui uma das tarefas mais complexas do trabalho, j que o terminlogo precisa dominar uma multiplicidade de conhecimentos e habilidades. Primeiramente, fundamental que o pesquisador conhea o domnio para o qual elabora o dicionrio ou glossrio; necessrio, tambm, que domine aspectos tericos e
Podemos citar aqui a dissertao de mestrado de Deni. Y. KASAMA, intitulada Estruturao do Conhecimento e Relaes Semnticas: uma ontologia para o domnio da Nanocincia e Nanotecnologia, defendida em 2009 na Universidade Estadual Paulista Jlio de Mesquita Filho, campus de So Jos do Rio Preto (SP). Nesse trabalho, sob orientao de Claudia Zavaglia, o autor empregou a estrutura qualia para a elaborao de uma ontologia e sua implementao computacional no Protg, programa disponvel gratuitamente a partir da Web e que tem sido largamente utilizado para a gesto de conhecimento e edio de ontologias. O Protg foi desenvolvido pela Stanford Center for Biomedical Informatics Research e pela Stanford University School of Medicine (http://protege.stanford.edu/).
15

silicato de sdio anidro [FORMAL = silicato de sdio]; [CONSTITUTIVO = sem gua] silicato de sdio hidratado [FORMAL = silicato de sdio]; [CONSTITUTIVO = com gua] silicato de sdio penta-hidratado [FORMAL = silicato de sdio]; [CONSTITUTIVO = com 5 molculas de gua]

86

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

metodolgicos da Terminologia enquanto disciplina; alm disso, espera-se que o terminlogo tenha noes de Lingustica, posto que so acionados conhecimentos de Lingustica Textual, Anlise do Discurso e demais subreas que tm o texto como objeto de estudo, afinal, a DT , antes de tudo, um texto; por fim, o pesquisador deve conhecer a lngua em que desenvolve o produto terminolgico, j que a tarefa de elaborao da DT um verdadeiro exerccio de redao (ALMEIDA et al., 2007). Para alm das questes textuais, um fator extremamente relevante a seleo dos traos semnticos dos conceitos cujos termos sero definidos. Deve-se partir inicialmente da ontologia, que permite a visualizao das relaes de hiperonmia, hiponmia e cohiponmia, visto que a localizao do termo facilita sobremaneira a organizao da definio. Assim, para a redao de DT do tipo gnero prximo e diferena especfica 16, selecionam-se os termos de determinado campo semntico (da ontologia) e observam-se seus traos 17 semnticos constitutivos nos contextos de uso, o que se pode facilmente recuperar a partir do corpus. Esse procedimento facilita a observao dos traos recorrentes, para que se possa estabelecer com segurana quais traos so imprescindveis para a adequada descrio do conceito e em que ordem devem ocorrer no texto final da DT. Por isso, quanto maior o nmero de contextos para cada termo, melhor. Em princpio, isso deve ser feito com todos os termos do mesmo campo semntico, com o objetivo de atestar se os traos observados ocorrem com todos ou com a maioria dos
Como afirma Sager (1993), deve haver vrios tipos de definio de conceitos, tipos que devem ser utilizados conforme a natureza do conceito que se deve definir e conforme o fim especfico da definio. Ainda segundo o autor, a posio terica tradicional de que o mtodo adequado para a elaborao da DT o modelo clssico de gnero prximo e diferena especfica (GPDE). De fato, esse modelo tem-se mostrado bastante produtivo em nossas pesquisas no GETerm, desde que combinado com outros tipos, j que a explicitao das diferenas especficas constitui, muitas vezes, outros tipos definitrios, por exemplo sntese, que na tipologia de Sager (1993) equivale descrio do conceito. Entretanto, preciso admitir que h conceitos que exigem outros tipos definitrios, no cabendo, portanto, no modelo GPDE, como na grande rea das cincias humanas (Desmet, 2002). 17 Tais como: aspecto, origem, propriedade, finalidade, emprego, etc.
16

Linguagens Especializadas em Corpora

87

termos daquele campo. A partir do elenco dos traos, estabelece-se uma ordem de relevncia e cria-se uma espcie de modelo ou gabarito que dever orientar a redao da DT de todos ou da maioria dos termos do campo nocional escolhido (ALMEIDA et al., 2007). Nota-se, pois, que a Semntica tambm est subjacente a todas as fases que constituem a redao da DT.

7. guisa de concluso
Em vista de tudo o que foi assinalado at agora, cabe-nos fazer algumas consideraes. Primeiro, importante que se diga que um grupo de pesquisa que desenvolve Terminologia de base lingustica no se confunde com uma editora de dicionrios tcnicos. Pesquisadores que se inscrevem nessa linha esto interessados em fenmenos lingusticos (fonolgicos, morfolgicos, sintticos, semnticos, textuais, pragmticos, discursivos, etc.) da(s) lngua(s) por meio da(s) qual(is) as cincias e as tcnicas veiculam seu conhecimento. Questes de pesquisa que sempre podem ser feitas so: como os discursos especializados se apropriam da estrutura lingustica para comunicar o saber cientfico? Que aspectos da lngua so postos em evidncia? Que diferenas se podem observar de domnio para domnio? H fenmenos lingusticos mais frequentes no discurso da Medicina do que no de Computao? Que estratgias morfolexicais so empregadas para o ato da nomeao? Isso muda de domnio para domnio? Que aspectos retricos caracterizam cada discurso especializado? Quais os modos de dizer de cada domnio? Por fim, fazer Terminologia descritiva de base lingustica exige o cumprimento de diversas e variadas tarefas, mas a diferena que todas elas devem ser sustentadas por quadros tericos provenientes da Lingustica.

8. Referncias bibliogrficas
ALMEIDA, G. M. B. Teoria Comunicativa da Terminologia: uma aplicao. Araraquara, vol. I, 290 p.; vol. II, 86 p. Tese (Doutorado em Lingustica e Lngua Portuguesa) Faculdade de Cincias e Letras, Cmpus de Araraquara, Universidade Estadual Paulista, 2000.

88

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ALMEIDA, G. M. B. A Teoria Comunicativa da Terminologia e a sua prtica. Alfa (Araraquara), v. 50, p. 81-97, 2006. Disponvel em http://www.alfa.ibilce.unesp.br/download/v50-2/06-Almeida.pdf. Acesso em setembro/2009 ALMEIDA, G. M. B.; CORREIA, M. Terminologia e corpus: relaes, mtodos e recursos. In: Stella E. O. Tagnin; Oto Arajo Vale. (Org.). Avanos da Lingustica de Corpus no Brasil. 1 ed. Sao Paulo: Humanitas/FFLCH/USP, 2008, v. 1, p. 63-93. ALMEIDA, G. M. B.; SOUZA, D. S. L.; PINO, D. H. P. A definio nos dicionrios especializados: proposta metodolgica. Debate Terminolgico, v. 3, p. 1-20, 2007. ALMEIDA, G. M. B.; VALE, O. A. Do texto ao termo: interao entre Terminologia, Morfologia e Lingustica de Corpus na extrao semiautomtica de termos. In: Aparecida Negri Isquerdo & Maria Jos Finatto. (Org.). As cincias do Lxico: Lexicologia, Lexicografia e Terminologia. 1 ed. Campo Grande: Editora da UFMS, 2008, v. IV, p. 483-499. ALUSIO, S. M.; ALMEIDA, G. M. B. O que e como se constri um corpus? Lies aprendidas na compilao de vrios corpora para pesquisa lingustica. Calidoscpio (UNISINOS). Vol. 4, n. 3 , p. 155177, set/dez 2006. Disponvel em: http://www.unisinos.br/publicacoes_cientificas/images/stories/pdfs_calid oscopio/vol4n3/art04_aluisio.pdf. Acesso em: setembro/2009. ALUSIO, S. M.; ALVES, I. M.; ARAUJO, M.; MARONEZE, B. O.; PARDO, T. A. S. Corpora e extrao automtica de neologismos. In: Jornada da Rede Panlatina de Terminologia (REALITER06), 2007, Rio de Janeiro. Anais da Jornada da Rede Panlatina de Terminologia (REALITER06). Paris (Frana): Unio Latina, 2006. Disponvel em: http://www.realiter.net/spip.php?article543. Acesso em setembro/2009. BAKHTIN, M. Esttica da criao verbal. 2. ed. So Paulo: Martins Fontes, 1997. BERBER SARDINHA, T. Lingustica de corpus. So Paulo, Manole, 2004. BIBER, D. Representativeness in Corpus Design. Lit Linguist Computing, 8:243-257, 1993. BRONCKART, J. P. Atividades de linguagem, textos e discursos. Por um interacionismo scio-discursivo. So Paulo: Editora da PUC-SP, EDUC. 1999.

Linguagens Especializadas em Corpora

89

CABR, M. T. La terminologa en la traduccin especializada. In: GONZALO GARCA, C.; GARCIA YEBRA, V. (eds.) Manual de documentacin y terminologa para La traduccin especializada. Madrid: Arco/Libros. Coleccin: Instrumenta Bibliolgica, p. 89-122. CABR, M. T. La terminologa - teoria, metodologa, aplicaciones (trad. castelhana de Carles Teb). Barcelona: Editorial Antrtida/Empries, 1993. CABR, M. T. La terminologa: representacin y comunicacin: elementos para una teora de base comunicativa y outros artculos. Barcelona: Institut Universitari de Lingustica Aplicada, 1999. CABR, M. T. Theories of terminology: their description, prescription and explanation. Terminology, v.9, n.2, p.163-200, 2003. CASTILLO, R. A. Ideas sobre el trabajo terminogrfico. In: MATEUS, M. H. & CORREIA, M. (org.) Terminologia: questes tericas, no. 4, Lisboa: Publicaes Europa-Amrica, 1998. COLETI, J. S. A terminologia da Nanocincia e Nanotecnologia: descrio e anlise morfolgica. Trabalho de Concluso de Curso. So Carlos: Curso de Letras, Universidade Federal de So Carlos, 2009. COLETI, J. S.; MATTOS, D. F.; GENOVES JR., L. C.; CANDIDO JR., A.; DI FELIPPO, A.; A., G. M. B.; ALUSIO, S. M.; OLIVEIRA JR., O. N. Compilao de corpus em lngua portuguesa na rea de Nanocincia/Nanotecnologia: problemas e solues. Anais do VI Encontro de Lingustica de Corpus. USP So Paulo, 6 e 7 de setembro de 2007. Disponvel em: http://www.nilc.icmc.usp.br/viencontro/anais.htm. Acesso em: setembro/2009. De BESS, B. 1997. Terminological Definitions. Handbook of Terminology Management. Eds. S. E. Wrighty y G. Budin. msterdam: John Benjamins. 63-74 DESMET, I. A anlise do sentido em terminologia: teoria e prtica da definio terminolgica. TradTerm, 8, 2002, p. 169-188. HOUAISS, A.; VILLAR, M. Dicionrio eletrnico Houaiss da Lngua Portuguesa. Rio de Janeiro: Objetiva, 2001 FERREIRA, A. B. H. Novo dicionrio eletrnico Aurlio verso 5.0. Curitiba: Positivo, 2004.

90

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

HALLIDAY, M. A. K., HASAN, R. Language, context and text: aspects of language in a social perspective. Oxford: Oxford University Press, 1989. KENNEDY, G. An Introduction to Corpus Linguistics. London;New York, Longman, 1998. KRIEGER, M. G.; BEVILACQUA, C. R. A pesquisa terminolgica no Brasil: uma contribuio para a consolidao da rea. Debate Terminolgico, no. 1, 03/2005. Disponvel em http://www.riterm.net/revista/n_1/krieger.pdf. Acesso em setembro/2009 LORENTE, M. A lexicologia como ponto de encontro entre a gramtica e a semntica. In: ISQUERDO, A. N.; KRIEGER, M.G. As cincias do lxico, vol. II. Campo Grande: Editora UFMS, 2004. MARCUSCHI, L. A. Produo textual, anlise de gneros e compreenso. So Paulo: Parbola, 2008. McENERY, T. e WILSON, A. Corpus linguistics. Edinburgh, Edinburgh University Press, 1996. O Pavel: Curso Interativo de Terminologia. Disponvel em: http://www.btb.termiumplus.gc.ca/didacticiel_tutorial/portugues/lecon1/i ndexe_p.html PUSTEJOVSKY, J. The Generative Lexicon. Cambridge: MIT Press, 1995. RENOUF, A. (ed.). Explorations in Corpus Linguistics. Amsterdam, Rodopi, 1998. SAGER, J. C. Curso prctico sobre el procesamiento de la terminologa (trad. castelhana de Laura C. Moya). Madrid: Fundacin Germn Snchez Ruiprez/Pirmide, 1993. SINCLAIR, J. 2005. "Corpus and Text - Basic Principles" in Developing Linguistic Corpora: a Guide to Good Practice, ed. M. Wynne. Oxford: Oxbow Books: 1-16. Disponvel em http://ahds.ac.uk/linguistic-corpora/. Acesso em setembro/2009. SWALES, J. M. Genre analysis: English in academic and research settings. Cambridge: Cambridge University Press, 1990. TERMCAT, Centre de Terminologia. Metodologia terminolgic. Barcelona: Generalitat de Catalunya, 1990. del treball

A FAMILIARIZAO SOBRE O TEMA DA TRADUO EM MEIO FORMAO PARA O ENSINO DE LNGUA ESTRANGEIRA Helosa Orsi Koch Delgado 1
O propsito central da educao tornar os aprendizes responsveis pela sua prpria construo de significados. Esta construo envolve pensar, sentir e fazer, e esses trs aspectos devem estar integrados na construo da aprendizagem significativa, e especialmente na criao de novos 2 conhecimentos (Novak, 2010) .

Resumo: Neste artigo, apresento parte do desenvolvimento de minha pesquisa de doutorado em andamento, que trata da insero do tema da Traduo de linguagem especializada em meio formao especfica para o ensino de lngua estrangeira. Discuto aspectos relacionados aos objetivos gerais do estudo, e procuro articul-los proposta de um modelo didtico para uma familiarizao qualificada do estudante de Licenciatura com o tema, o qual se fundamenta em pressupostos de abordagens construtivistas. Logo aps, descrevo um experimento que testa uma metodologia da aprendizagem de estratgias tradutrias, dentre elas, os mapas conceituais. O estudo mostra o potencial da metodologia proposta, para que o futuro docente de lngua estrangeira tenha uma compreenso inicial sobre o processo tradutrio. Para a discusso da anlise das tradues dos respondentes, fiz uso de conceitos sobre equivalncia tradutria e textualizao e sobre os princpios de livre escolha e idiomtico, que parecem estar em funcionamento em toda a produo textual.
Doutoranda do Programa de Ps-Graduao em Letras da Universidade Federal do Rio Grande do Sul, Professora da Faculdade de Letras da PUCRS, e-mail: heloisa.delgado@pucrs.br. 2 The central purpose of education is to empower learners to take charge of their own meaning making. Meaning making involves thinking, feeling, and acting, and all three of these aspects must be integrated for significant new learning, and especially in new knowledge creation (Novak, 2010). Minha traduo.
1

92

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

1. A Traduo em meio formao para o ensino de lngua estrangeira: proposta de investigao


Nas ltimas dcadas, tem havido um crescente interesse pelos estudos tericos e prticos sobre Traduo no Brasil e no mundo, levando pesquisadores, tradutores e docentes a uma srie de questionamentos e reflexes sobre o ensino e aprendizagem nessa rea. Uma pesquisa feita em 2001 (Darin, 2006), com professores de graduao, teve como objetivo estimular a reviso crtica da prtica didtica e das estratgias de ensino adotadas nos cursos voltados para a formao de tradutores. Embora os resultados mostrem que a intuio, a experimentao, o uso de dinmicas criativas, o compartilhamento local e informal de metodologias bem-sucedidas tenham contribudo para um razovel sucesso do ensino-aprendizagem da traduo, tambm revelaram uma falta de consenso entre os educadores sobre os parmetros utilizados, uma centralizao do processo de aprendizagem e, enfim, uma ausncia de embasamento slido na adoo de metodologias consistentes. A pesquisa de Darin veio ao encontro das inquietaes que trago comigo h mais de vinte anos, perodo em que me dedico ao ensino e aprendizagem da lngua inglesa e traduo de linguagens especializadas. Essas inquietaes dizem respeito formao integral (holstica e especfica) de alunos dos cursos de graduao em licenciatura em Letras e me levam s seguintes perguntas: a) Se existe uma carncia de embasamento slido na adoo de metodologias consistentes nos cursos que so especificamente voltados para a formao de tradutores, como aponta Darin, ser que haveria espao para apresentar o tema da Traduo, de seus processos e produtos, em meio formao para o ensino da lngua inglesa (doravante LI)? b) Em que medida as ementas das disciplinas dos cursos de Licenciatura em Letras, no nosso pas, contemplam o ensino de habilidades e estratgias tradutrias em meio formao para a docncia? c) O estudante de Letras de hoje, docente do amanh, est minimamente preparado para outras tarefas que no apenas a da

Linguagens Especializadas em Corpora

93

docncia de uma lngua estrangeira, estando apto para atuar como um professor de lngua estrangeira (doravante LE), que tambm sabe tratar sobre temas de Traduo? Tentando ensaiar respostas para as perguntas acima citadas, realizei um levantamento inicial sobre o nmero de cursos de licenciatura e bacharelado em Letras (esse ltimo, com habilitao especfica em Traduo), oferecidos no Brasil, por Instituies de Ensino Superior (doravante IES). Aps breve apresentao sobre esses dados, tomando por base o par de lnguas ingls-portugus, trato do quadro no nosso Estado, o Rio Grande do Sul. Primeiramente, em uma sondagem geral, ainda no concluda, feita atravs do portal e-MEC 3 (sistema eletrnico de acompanhamento dos processos que regulam a educao superior no Brasil, do Ministrio da Educao e Cultura), confirmei que existem poucos cursos de Traduo no pas, cerca de 10 no total. Algumas instituies que oferecem esse curso so: Universidade Federal de Braslia, Universidade Federal do Rio Grande do Sul, Pontifcia Universidade Catlica do Rio de Janeiro, Universidade Federal de Minas Gerais e Pontifcia Universidade Catlica de Campinas. Alm desses, existem, tambm, cursos de Traduo ou de Letras com habilitao em Traduo em instituies como o Centro Universitrio Anhanguera, a Universidade do Sagrado Corao, a Universidade Catlica Unisantos, a Universidade Metodista e a Universidade Paulista, todas localizadas em So Paulo. No que tange a cursos de Licenciatura plena em Letras (Portugus/Ingls) que incluem disciplinas ou atividades de ensino de Traduo, tambm h poucas instituies que as oferecem, embora o nmero de cursos de Letras, na modalidade Licenciatura em LE Ingls seja muito grande. o caso da PUC Minas e da PUC Campinas. Na primeira, a disciplina de Prticas de Traduo de Lngua Inglesa oferecida no oitavo semestre do curso e enfatiza o desenvolvimento prtico de estratgias tradutrias (grifo meu). A segunda instituio oferece duas disciplinas chamadas Prtica Autnoma de Traduo de Textos A e B e Prtica Orientada de Traduo de Textos A e B ministradas, respectivamente, no 6 e 7 semestres do curso. Nessas
3

Disponvel no endereo http://emec.mec.gov.br. Acessado em maro de 2010.

94

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

quatro ltimas disciplinas, as ementas preveem o estudo, a aplicao e o aprofundamento da teorizao sobre o processo tradutrio e sua aplicao prtica. Outro exemplo a Universidade Estadual do Rio de Janeiro, a UERJ. Essa IES oferece projetos de extenso na rea da Traduo atravs do Escritrio Modelo de Traduo Ana Cristina Csar. Esse projeto 4 trabalha em perspectiva amplamente universitria, desenvolvendo atividades de Ensino, Pesquisa e Extenso e vem abrindo frentes, at ento no trilhadas, para docentes, pesquisadores e alunos dos cursos de Ingls, Espanhol, Francs, Italiano e Alemo do Instituto de Letras, no que diz respeito aos Estudos de Traduo. Entretanto, cabe dizer, a UERJ no oferece uma graduao especfica para formar tradutores. Falemos, agora, sobre o nmero de cursos de Licenciatura em Letras no RS. Tomando como referncia novamente o e-MEC, foram selecionadas 24 IES que oferecem o curso de Licenciatura em Ingls ou em Portugus-Ingls, em diferentes localidades do nosso Estado. Constatei que, dos 24 cursos de Licenciatura em Letras (sem habilitao em Traduo), apenas um, oferecido pela UNIFRA, em Santa Maria- RS, contempla estudos tericos e prticos da Traduo no 5 e 6 semestres. A PUCRS 5, a UFSM e a UNISINOS esto entre as IES que oferecem disciplinas sobre a prtica de leitura e de expresso escrita. A primeira oferece Leitura e Produo Textual que enfatiza a prtica de leitura e produo de textos descritivos e/ou narrativos com nfase em seus aspectos semnticos, sintticos, pragmticos e discursivos caractersticos. A UFSM, atravs da disciplina de Leitura em Lngua Inglesa, tem como objetivo ler extensivamente textos em lngua estrangeira, utilizando competncias sistmicas, textuais, estratgicas e discursivas e a UNISINOS oferece a disciplina O Leitor e o Texto em Lngua Inglesa que enfatiza aspectos diversos de compreenso leitora em lngua estrangeira.
Sob a coordenao de Maria Aparecida Salgueiro. A PUCRS, no seu novo currculo de 2011, incluir na disciplina Lngua Inglesa VIII, noes sobre estratgias tradutrias.
5 4

Linguagens Especializadas em Corpora

95

A nfase maior dada nas ementas das disciplinas oferecidas pelos 24 cursos investigados a do ensino e da aprendizagem da lngua e da literatura. Os trs cursos que oferecem disciplinas de leitura e produo, como as citadas no pargrafo anterior, no preveem sequer uma familiarizao com contedos que tratem do tema da Traduo, tampouco chegam a explicitar que existe outra profisso ou ocupao relativamente prxima aos temas dos estudos da LE. A minha preocupao central reside no fato confirmado: no h um espao, em meio formao docente de LE, onde os estudantes possam ter algumas noes sobre a natureza da Traduo como atividade profissional, diferenciando-a da atuao no ensino. H, assim, apenas uma lacuna ou silncio que, a meu ver, pode levar percepo errnea de que essa atuao no existe ou a de que seja algo de simples execuo, inerente ao aprendizado da lngua. Apesar desse quadro, penso que o contato do futuro professor de LE com o tema, em especial com o tpico de estratgias tradutrias, poderia ser benfico medida que o levasse a utiliz-las em prol de sua prpria construo do conhecimento. Enfim, a lacuna existente, ainda que possa ser pensada como uma salvaguarda de domnios, visto que formar tradutores e formar professores so processos diferentes, poderia gerar resultados positivos ao ser preenchida com o devido critrio. H, sim, espaos importantes que contemplam a formao do discente em Letras em vrias outras reas do conhecimento (literatura, cultura, etc.) e dentro de sua rea de atuao, que o ensino da lngua inglesa (ensino e aprendizagem, metodologia, etc.), mas ao que parece, h pouco (quase nenhum) interesse na incluso de aspectos relativos aprendizagem de estratgias tradutrias. E, aqui caberia mais uma pergunta: se os cursos de formao especfica para tradutores so to poucos, no seria o caso dos cursos de Licenciatura tratarem do tema nem que fosse para auxiliarem a promover os cursos de Traduo como uma segunda possibilidade de formao profissional em Letras? A pesquisa feita por Darin, referida anteriormente, ressalta que o desenho curricular dos cursos de graduao em Traduo deveria se preocupar com questes que vo alm do contedo

96

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

programtico que, normalmente, respondem a questes do tipo o qu, como, e para qu. Dentro de uma viso menos simplista, ela sugere a insero do papel da argumentao terico-didtica no contexto universitrio (o porqu):
se concebemos o curso universitrio como espao por excelncia destinado ao crescimento intelectual e desenvolvimento do olhar crtico, essencial que o estudante tenha a oportunidade de refletir sobre temas e procedimentos relativos ao papel do tradutor sob a tica de inmeras questes da contemporaneidade. So questes como essas que podem orientar o desenvolvimento da capacidade reflexiva e crtica to necessria para que os futuros profissionais produzam alguma mudana nas formas como nossa sociedade compreende a traduo e a identidade do tradutor. (Darin, 2006, p. 119).

Com base nas reflexes da autora e adequando-as proposta de minha pesquisa de doutoramento, formulei a seguinte situao-problema: Considerando a lacuna de formao existente relativa ao tema /natureza da Traduo em meio formao do docente de LE, e que contribuir para diminu-la algo que pode ser positivo, como se pode introduzir esse tipo de conhecimento para o acadmico de licenciatura em Letras? luz desse questionamento, apresento aqui uma metodologia didtica da traduo de linguagens especializadas em meio licenciatura em LE. Na direo de reconhecer e at de propor modos de fazer essa insero que se move a pesquisa que realizo, ainda que, para tanto, tome por base apenas uma dada situao de aprendizagem, a que envolve o contato com o texto cientfico entre alunos do curso superior de Licenciatura em Letras. Essa metodologia ser avaliada ao final deste texto e perspectivas sero colocadas para o desenvolvimento da pesquisa. Passo agora apresentao das origens para a proposta.

Linguagens Especializadas em Corpora

97

2. Antecedentes da proposta metodolgica


O interesse pelo tema da inter-relao entre formao docente e Traduo vem apoiado numa trajetria de 23 anos como professora de lngua inglesa e tradutora. Esse percurso foi enriquecido pelo trabalho como professora de lngua geral e ESP (English for Specific Purposes Ingls para Fins Especficos) em instituies de ensino e em empresas, alm da experincia como tradutora de textos cientficos e tcnicos. A experincia como professora de ESP para profissionais de Medicina e de Aviao, cujo objetivo principal era o de adquirir a proficincia leitora de artigos cientficos e de manuais de manuteno e operao, fez com que a estreita relao entre o ensino de uma lngua estrangeira e o ensino de estratgias de compreenso leitora desse espao para o tema da Traduo no contexto de sala de aula. Desde o trmino do meu curso de graduao (Bacharelado em Letras - Traduo Portugus/Ingls/Francs) e o incio da minha vida profissional e, principalmente aps a minha dissertao, que foi na rea da Educao, muito tenho refletido sobre as minhas prprias aes pedaggicas. Sigo uma concepo de educao baseada na pedagogia dialtica, construtivista em que o ensino deve estar centrado na relao professor-aluno e no conhecimento que gerado a partir dessa relao. Vejo o papel do professor como um mediador, agente reflexivo, que toma decises e criativo. Essa viso sobre o olhar educativo sempre me causou inquietaes e me conduziu a uma prtica mais flexvel em sala de aula, atravs da insero de temas interdisciplinares e transversais, que contemplassem outros aspectos da aprendizagem e do ensino de uma lngua. Um desses temas diz respeito ao papel do professor, conhecedor de uma lngua estrangeira, frente tarefa da traduo, cada vez mais emergente no mercado de trabalho desse profissional. Levando em considerao esses antecedentes, propus os seguintes objetivos na minha pesquisa, que intenta ratificar a crena no papel positivo da inter-relao entre docncia e Traduo: Apresentar uma metodologia de aprendizagem de estratgias tradutrias da linguagem cientfica, tendo em vista o aluno de licenciatura em lngua inglesa.

98

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Reconhecer e explorar as caractersticas dessa linguagem, apresentadas no mbito do Transtorno do Humor Bipolar (doravante THB). Propor a elaborao de mapas conceituais como facilitadores da aprendizagem desse campo temtico e da traduo de textos cientficos que o veiculam. Tratar do texto traduzido como textualizao, tomando como base o conceito proposto por Costa (2005). Analisar os textos traduzidos dos respondentes, a partir do princpio idiomtico e o do princpio da livre escolha de Sinclair (1991). Pensar em uma proposta de ambiente de aprendizagem virtual que contemple aspectos de familiarizao e aprendizagem de estratgias de traduo de linguagens especializadas, para estudantes de Letras. Dar incio elaborao de um livro, cuja abordagem esteja centrada em estratgias ou aes que conduzam resoluo, de forma satisfatria, de instncias problemticas tradutrias, tendo em vista a formao do docente em LE.

3. Textos e linguagens cientficas


A misso principal do texto cientfico a de informar e isso o distingue de outros tipos de mensagens. O discurso cientfico, segundo Rodilla (1998), possui algumas caractersticas principais tais como: a) Preciso: constitui, sem dvida, a caracterstica mais importante da linguagem cientfica. Est relacionada, em grande parte, com a preciso dos termos empregados para a elaborao da mensagem e que pode ser perdida quanto maior for a sinonmia, a polissemia e a homonmia contidas nestes termos. Esta preciso significa que o valor do termo utilizado no depende de nenhum dos fatores que possam condicionar o ato comunicativo e, graas a ela, se evita a ambiguidade e as falsas interpretaes. Por exemplo, o CID 10 6 tem validade internacional em qualquer lngua para evitar que
6

Classificao Internacional de Doenas.

Linguagens Especializadas em Corpora

99

diagnsticos errneos sejam feitos. Os diagnsticos so feitos a partir de sintomas patognomnicos (sintomas prprios de cada molstia e cuja identificao permite um diagnstico certo) com validade internacional como, por exemplo, para o diagnstico de surto manaco necessria a presena do sintoma euforia, ou seja, humor exaltado. O conceito de preciso da autora parece estar relacionado a um texto onde a polissemia, a ambiguidade no existem. Sabemos, no entanto, que esses aspectos ocorrem em diversos textos cientficos, principalmente aqueles destinados divulgao para leigos. Um exemplo disso so as informaes encontradas no sitio Stabilitas 7, utilizado nesta pesquisa como um procedimento metodolgico (explicao na parte da metodologia). Tambm h de se levar em considerao o estilo do autor, mesmo que escreva textos cientficos com alta densidade terminolgica e que apresentem um maior nvel de preciso semntica. b) Conciso ou economia: outra caracterstica da mensagem cientfica em que se usa o menor nmero de palavras necessrias para expressar a ideia que se deseja comunicar. Logicamente, esta propriedade no pode ir contra uma transmisso clara e eficaz do contedo do conhecimento. Trata-se, por um lado, de uma economia semntica relacionada com o nmero de palavras empregadas, cujo expoente mximo a substituio de frases inteiras por uma nica palavra atravs da inveno de um novo termo (ex.: hipomanaco: surto manaco de menor intensidade no transtorno de humor bipolar). A economia lingustica ressalta as condies implcitas particulares da comunicao tcnica, pois sua aplicao supe uma srie de premissas como, por exemplo, de que os participantes nesta comunicao tenham os mesmos conhecimentos do assunto. No entanto, as frases da linguagem cientfica podem ser longas, mais longas do que outros tipos de linguagem, devido complexidade dos conceitos cientficos, que exige um nmero maior de palavras para que possam ser explicados. Tomamos como exemplo o conceito de depresso que se caracteriza por mais de duas semanas de humor
Disponvel no endereo eletrnico http://www.stabilitas.kit.net. Acessado em janeiro de 2010.
7

100

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

irritado ou profundamente triste, sensao de vazio, desesperana, medo, desnimo e insegurana. c) Peculiaridades do vocabulrio: para muitos autores, a diferena entre a linguagem comum e a de especialidade o lxico, enquanto que para outros, essas diferenas atingem todos os planos da lngua: morfolgico, sinttico ou fontico. No que todos concordam, no entanto, e que o elemento caracterizador da linguagem cientfica, o vocabulrio que emprega 8. Enquanto alguns estudiosos acreditam que o que predomina no lxico cientfico so o verbo e o substantivo (identificar a doena), pois o verbo desempenharia um papel de conector modal entre o sujeito e o objeto; outros, creem que o substantivo e o adjetivo (humor eufrico), os que alcanam uma frequncia mais elevada de uso. H, tambm, as colocaes verbais (substantivos que coocorrem naturalmente com determinados verbos) que se usam na linguagem cientfica como, por exemplo, aderir ao tratamento e transmitir atravs da gentica. Nesses exemplos, os verbos cumprem quase que exclusivamente funes sintticas, pois a informao semntica principal est nos substantivos. Grande quantidade dos termos tcnico-cientficos se constri a partir de prefixos gregos ou latinos, o que beneficia a comunidade internacional, acima das fronteiras lingusticas nacionais ou regionais (maladjustment, premorbid). Existe, alm disso, outro procedimento de formao de termos cientficos, no exclusivo, mas muito tpico, que est relacionado com as diminuies (siglas, abreviaes: THB Transtorno do Humor Bipolar) e com a hiponmia (Tipo 1, Tipo 2 tipos de THB). Outra diferena entre o lxico cientfico e o comum a sua velocidade de crescimento. Tomamos como exemplo, a antiga denominao psicose manaco depressiva, para o atual Transtorno do Humor Bipolar. Com o aumento do conhecimento, hoje, se sabe que existem dois tipos de transtorno de humor. Novas pesquisas j ampliam este conceito para espectro bipolar, incluindo vrios estgios da doena.
Tanto assim, que possvel a comunicao, em lngua inglesa, que veicula o conhecimento cientfico, por profissionais que tenham apenas conhecimentos bsicos da gramtica desta lngua, o que permite entenderem e serem entendidos em congressos profissionais internacionais.
8

Linguagens Especializadas em Corpora

101

No mundo da cincia e da tcnica, as mudanas podem ser espetaculares, inclusive de um dia para o outro. Dessa forma, partindo de um patrimnio lxico tradicional, a linguagem comum cresce num ritmo lento, comparado ao ritmo de crescimento do vocabulrio cientfico. Por outro lado, atualmente, a principal fonte de lxico para a linguagem comum provm do mundo da cincia e da tcnica, democratizado atravs dos meios de comunicao.

4. Mapas conceituais e competncia tradutria


Com o objetivo de contextualizar um estudo piloto que realizei, tomo como ponto de partida algumas noes de aprendizagem significativa, propostas por Ausubel (1968, 2000) e Cabr (1999) e de competncia tradutria, por Hurtado Albir (2005). O conceito proposto por Ausubel, em sua Teoria da Aprendizagem de Assimilao, se fundamenta na Psicologia Educacional, proposta pelo mesmo autor (1968). Ele aponta que aprendemos novos conhecimentos ao relacion-los a uma rede de conceitos que j conhecemos, ou seja, aprender significativamente estar ciente da natureza das relaes que definimos entre objetos ou fatos, ao inseri-los na base de conhecimento j existente. No entanto, o aprendiz que deve procurar uma maneira de integrar essas informaes com aquelas j existentes em sua estrutura cognitiva. O papel fundamental do professor, em sua teoria, o de encorajar seus alunos a isso, fazendo uso de diversas estratgias educacionais, dentre elas, os mapas conceituais, estratgia que utilizei no experimento descrito na seo Desenho inicial da proposta para a insero do tema da traduo em cursos de docncia em LE. A utilizao de mapas conceituais, para minha pesquisa, conforme acredito, pode ser um recurso consistente para facilitar o gerenciamento de informaes escritas nas linguagens especializadas, auxiliando os usurios dessa linguagem que, neste caso, so alunos de Licenciatura em Letras, a distinguir o essencial do dispensvel e a adquirir habilidades determinantes para a compreenso da rea temtica a ser traduzida. Nesse sentido, Cabr (1999) ressalta que a organizao da linguagem utilizada para produzir determinado conhecimento por meio

102

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

de mapas conceituais um recurso eficiente para garantir as bases para a organizao de campos temtico-funcionais. A estudiosa ainda salienta que os conceitos de uma mesma rea especializada, mantm, entre si, diferentes tipos de relaes e todas essas relaes juntas formam o mapa conceitual de determinado campo. Para isso, entendese ser necessria a criao de um macroesquema que relacione os conceitos de uma rea do conhecimento e funcione como esqueleto dos contedos apresentados nos textos cientficos a serem traduzidos pelo especialista da linguagem. O mapa conceitual, portanto, uma estrutura esquemtica usada para representar um conjunto de conceitos imersos numa rede de proposies. Ele considerado como um estruturador do conhecimento, na medida em que permite mostrar como o conhecimento sobre determinado assunto est organizado na estrutura cognitiva de seu autor que, assim, pode visualizar e analisar sua profundidade e extenso. Ele pode ser entendido como uma representao visual utilizada para partilhar significados, pois explicita como o autor entende as relaes entre os conceitos enunciados. Assim, ao dispor sob a forma grfica de um mapa conceitual, com conceitos conhecidos de uma dada especialidade, relacionando-os a outros tambm j conhecidos e estabelecendo uma hierarquia e/ou determinando propriedades, o aprendiz poder organizar o seu conhecimento de maneira autnoma, retificando seu prprio raciocnio em funo da construo do mapa. Para a realizao da aprendizagem significativa, mapas conceituais demonstraram ser uma ferramenta adequada, porque possibilitam ao aluno (e ao professor tambm) desenvolver um processo cognitivo de aprendizagem, em que ele prprio orienta a aquisio de novas informaes, pois elas estaro diretamente relacionadas com a estrutura de conhecimento prvio, aquela que o indivduo possui, no momento da aprendizagem, como produto da sua integrao cultural. Portanto, os mapas conceituais revelam como cada um dos aprendizes estrutura seu conhecimento em relao ao contedo de estudo. Existem inmeras possibilidades de hierarquizar e relacionar os conceitos sob foco e, por isso, dois mapas diferentes sobre o mesmo assunto, podem estar igualmente corretos. Essas representaes so consideradas mais que um artifcio pedaggico, pois reproduzem, de

Linguagens Especializadas em Corpora

103

forma direta, a organizao de conceitos na prpria memria humana. Como exemplo disso, no final deste artigo, apresento os mapas construdos por dois respondentes deste estudo piloto, que tiveram como base os mesmos textos sobre THB. A outra aposta terica que tomo como referncia para o meu estudo a de aquisio de competncia tradutria (Albir, 2005), quando esta ocorre de uma maneira guiada no contexto do sistema educacional: a didtica da traduo. Para meu estudo, dada a peculiaridade do cenrio de formao envolvido, gostaria de me referir a esta aquisio da competncia tradutria como a aprendizagem e familiarizao de estratgias tradutrias. A ideia que os futuros docentes da LE construam um caminho paralelo ao do ensino e que tenham subsdios para compreender a natureza das tarefas de Traduo com propriedade e, quem sabe, se especializar nessa rea to importante nos dias atuais. A autora salienta que qualquer abordagem educacional deve partir necessariamente de dois grandes blocos fundamentais: um enfoque no contedo a ser ensinado e um enfoque sobre a aprendizagem desse contedo. Para sustentar a base da didtica da traduo a que se prope, ela descreve um arcabouo terico duplo: o tradutolgico e o pedaggico, brevemente descritos a seguir. No que diz respeito ao quadro tradutolgico, Albir entende que qualquer abordagem formativa de disciplinas relacionadas com a traduo sustenta-se em um determinado enfoque sobre a traduo (a prtica comunicativa que se deseja ensinar), a competncia tradutria (os conhecimentos e habilidades requeridos para realizar esta prtica) e a aquisio da competncia tradutria (como esta competncia adquirida). Para poder estudar sobre a competncia tradutria em seu conjunto e dar conta da complexidade intrnseca da traduo, props um modelo de investigao emprico-experimental sobre a competncia tradutria e sua aquisio (Hurtado Albir, 2001:394-401), revisado em 2003. Considera que a competncia tradutria um conhecimento especializado que consiste em um sistema subjacente de conhecimentos declarativos e operacionais, necessrios para saber traduzir, que est composto de cinco subcompetncias, a

104

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

saber: i) a bilngue, integrada por conhecimentos pragmticos, sociolingusticos, textuais e lxico-gramaticais; ii) a extralingustica, composta por conhecimentos sobre o mundo em geral e de mbitos particulares; iii) a de conhecimentos sobre traduo, composta por conhecimentos sobre os princpios que regem a traduo e sobre aspectos profissionais; iv) a instrumental, que consiste em conhecimentos operacionais, relacionados ao uso das fontes de documentao e das tecnologias de informao e comunicao (TIC) aplicadas traduo e a v) a estratgica, que controla o processo tradutrio e serve para avaliar o processo e os resultados parciais obtidos em funo do objetivo final, compensar deficincias entre as subcompetncias, identificar problemas e aplicar os procedimentos para a sua resoluo. Naturalmente, como trato dessas competncias em meio a uma formao de docncia em LE, ser preciso relativizar essas indicaes. No que se refere ao quadro terico pedaggico, a autora sugere o enfoque por tarefas de traduo, cujos aspectos principais so: Instrumentaliza o estudante, ao introduzir tarefas facilitadoras (pedaggicas) que o ajudam a resolver a tarefa final (a traduo de um determinado gnero textual, por exemplo, que, neste caso, foi a de um artigo cientfico), obtendo-se, assim, uma pedagogia centrada no acompanhamento de processos (os mapas conceituais elaborados pelos respondentes desta pesquisa foram avaliados pela especialista e por mim e reportados aos mesmos). Refora, constantemente, atravs das tarefas, uma metodologia viva na qual o aluno no apenas aprende fazendo, e capta princpios, como tambm aprende a resolver problemas e adquire estratgias (as tarefas facilitadoras sugeridas, no estudo piloto, tm um carter terminolgico e serviram para que os respondentes, de forma autnoma, buscassem por estratgias de aprendizagem sobre o THB). Revisadas, aqui brevemente, as noes tericas envolvidas, passo agora apresentao de minha proposta.

Linguagens Especializadas em Corpora

105

5. Desenho inicial da proposta para insero do tema da traduo em cursos de docncia em LE


A minha proposta, aqui preliminarmente relatada, est amparada em um estudo piloto que venho desenvolvendo com alunos de um curso de Licenciatura em Letras com habilitao em lngua inglesa. O experimento tambm contou com a participao de uma mdica psiquiatra, especialista em THB 9 e da minha, como tradutora. Os resumos, em lngua inglesa, de artigos cientficos, feitos pelas duas ltimas respondentes, foram utilizados como padro de referncia para fins de anlise. O estudo consistiu em uma srie de procedimentos que tiveram como objetivo a familiarizao do estudante com uma srie de elementos ou questes: 1) A importncia de se conhecer o tema a ser traduzido a priori, partindo de conceitos mais amplos e de fcil compreenso, para conceitos mais especficos e complexos. 2) A natureza e o papel dos mapas conceituais, para auxiliar no entendimento do campo temtico a ser traduzido e na compreenso da leitura dos textos que o veiculam. 3) A busca autnoma por subsdios que auxiliem na tarefa da traduo, ou seja, a captao de estratgias de aprendizagem. 4) A natureza do texto cientfico. 5) A familiarizao com o tema de estratgias tradutrias. A seguir, apresento uma descrio do experimento, comeando pelas caractersticas gerais dos sujeitos da pesquisa e pelos instrumentos e procedimentos para a coleta de dados e, em seguida, pelo corpus utilizado.

Dra. Carmen Vernetti, cuja expertise e prtica dela advindas foram imprescindveis no momento da reviso dos mapas conceituais feitos pelos respondentes e na anlise das suas textualizaes.

106

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

5.1 Os sujeitos da pesquisa


Contei com a colaborao de dez alunos respondentes, acadmicos do curso de graduao e ps-graduao em Letras. Possuem nveis diferentes de proficincia da lngua inglesa e de experincia profissional. Durante o perodo da coleta dos dados (tradues de resumos de artigos cientficos), os estudantes estavam cursando o sexto semestre do curso. Como supracitado, fazem tambm parte do estudo, a especialista e eu, a tradutora. Para fins de descrio dos resultados do estudo piloto, foram selecionadas as tradues de quatro alunos respondentes (R1, R2, R3 e R4), cujos perfis sero descritos brevemente a seguir, conforme respostas fornecidas atravs de um questionrio, da especialista e da tradutora.
Sexo R1 Feminino Formao Acadmica Acadmica de Letras/Hab. Portugus-Ingls (7 semestre) Experincia Profissional Trabalha como bolsista do Programa de Ensino Tutorial/Letras. No possui experincia em traduo. Trabalha como tcnica em uma empresa e como tradutora voluntria para um site que divulga notcias internacionais. Trabalha como bolsista de Iniciao Cientfica. No possui experincia em traduo. Trabalha na Editora Artmed como revisora de ementas. No possui experincia em traduo.

R2

Feminino

Acadmica de Letras/Hab. Portugus-Ingls (7 semestre)

R3

Feminino

Acadmica de Letras/Hab. Portugus-Ingls (7 semestre)

R4

Feminino

Acadmica de Letras/Hab. Portugus-Ingls (7 semestre)

Linguagens Especializadas em Corpora

107

6. Instrumentos e procedimentos para a coleta de dados


A coleta de dados foi conduzida de acordo com procedimentos metodolgicos propostos por mim, inspirados em uma didtica com nfase na aprendizagem autodidata sobre estratgias tradutrias e baseada em tarefas, relacionada aos trabalhos de Albir (2005). Essa autora prope um processo de formao de natureza cognitivoconstrutivista centrado na aprendizagem por tarefas e cujos objetivos levem em considerao trs aspectos: a competncia que se pretende que o estudante possa vir a ter, o desenvolvimento de estratgias de aprendizagem e a aquisio de atitudes e valores. Posso, portanto, luz dessas indicaes, pressupor que vivel e necessrio haver o tratamento da Traduo em meio ao ensino de lngua estrangeira em cursos de Licenciatura em Letras. A hiptese a ser investigada a de que, atravs de um modelo didtico, centrado no aprendiz e baseado em tarefas, pode-se obter uma compreenso sobre a aprendizagem de estratgias tradutrias. Essa compreenso, conforme acredito, poder ser revelada na produo tradutria desses estudantes. A metodologia de ensino que adotei teve as seguintes etapas: a) criao de uma wiki (um conjunto de pginas da web) para os dez respondentes, a especialista, a pesquisadora 10 e a orientadora da pesquisa. A inteno de criar este espao virtual foi a de padronizar as informaes, servir de um repositrio de arquivos, material de consulta e links para as tarefas a serem feitas e as j concludas, e de um canal de comunicao entre o grupo. O endereo da wiki http://pucrsteaching.pbworks.com/. b) solicitao de tarefas para ambos os grupos: b1) leitura de um artigo 11 sobre a construo de mapas conceituais, escrito por Romero Tavares (2007). O objetivo dessa tarefa foi o de apresentar os diferentes tipos de mapas conceituais existentes e suas finalidades dentro de contextos diversos.
10 11

Eu, no papel de pesquisadora e tradutora. Texto disponvel na web (referncia no final do artigo) ou no ambiente da wiki, atravs dos links Grupo A e Construindo Mapas Conceituais.

108

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

b2) acesso ao stio Stabilitas 12 para terem as primeiras noes sobre a rea desconhecida, envolvida nos textos a traduzir e da linguagem empregada nesse mbito (nvel baixo de densidade terminolgica). Importante salientar que a lngua utilizada no material disponibilizado sobre o THB a do portugus brasileiro, pois nessa lngua que os respondentes faro as textualizaes. b3) leitura de um folder que apresenta as principais ideias do THB, atravs de uma linguagem acessvel, fornecido pela especialista (nvel baixo de densidade terminolgica). b4) leitura de material adicional 13 sobre a rea, escrito pelo Dr. Diogo Lara 14 para estudantes e profissionais, alm do acesso ao seu stio http://www.bipolaridade.com.br. O objetivo da tarefa foi ampliar o conhecimento sobre o THB atravs de textos que apresentem um nvel mdio de densidade terminolgica. As tarefas acima foram necessrias para que o grupo tivesse uma ideia sobre a pesquisa como um todo. c) diviso do grupo em dois (trs em cada), para investigar a utilidade da metodologia por mapas conceituais, denominados Grupo A (que construram os mapas e doravante denominados Grupo A/CM com mapa) e Grupo B (que no construram os mapas e doravante denominados B/SM- sem mapa). Para dar ao ambiente (wiki) um olhar mais organizado e gil, foram inseridos dois links: um para o grupo A e o outro para o B. Dessa forma, os sujeitos acessariam apenas pgina indicada aos seus grupos. Alm disso, para cada pgina (grupo A e B), foram inseridos links com os seus nomes para que pudessem usufruir de uma pgina individual para referncia e postagem dos dados.
Esta associao no possui fins lucrativos e formada por portadores do Transtorno do Humor Bipolar, familiares e amigos e surgiu a partir de reunies realizadas no Hospital de Clnicas de Porto Alegre. Tem por objetivo principal a juno de foras em prol da melhoria da qualidade de vida dos portadores desta enfermidade. 13 Depresso e ansiedade resistente: ser bipolaridade? e Bipolaridade, Transtorno de Personalidade, Borderline e Transtorno de Dficit de Ateno e Hiperatividade: semelhanas e diferenas. Textos da revista Bipolaridade, do Dr. Diogo Lara, escrita exclusivamente para a classe mdica. Material disponvel na web e na wiki. 14 O Dr. Diogo Lara uma das maiores autoridades em THB do Brasil.
12

Linguagens Especializadas em Corpora

109

d) instrumentalizao do Grupo A/CM d1) construo de um mapa conceitual sobre o THB, utilizando os conceitos e termos que os sujeitos encontraram nas leituras feitas 15. d2) avaliao do mapa pela especialista e postada na wiki com comentrios sobre cada um dos mapas construdos. d3) reformulao dos mapas j iniciados. d4) avaliao dos mapas reformulados pela especialista e postada na wiki com comentrios. e) solicitao de tarefas para ambos os grupos: e1) solicitao da traduo, de ingls para o portugus, de trs resumos de artigo - foi solicitado o prazo de cerca de um ms para a concluso dessa tarefa. Os respondentes trabalharam em suas residncias e puderam utilizar os recursos que desejassem: dicionrios impressos e/ou eletrnicos, gramticas, os mapas (no caso, o Grupo A, apenas) que construram e material de referncia sobre a doena (impresso e eletrnico), fornecidos pela pesquisadora e pela especialista. Esta tambm se utilizou da wiki como canal de comunicao, fez as tradues em sua residncia e teve prazo de um ms para a realizao da tarefa. f) solicitao, a posteriori, da leitura do texto Processamento Cognitivo Teoria da Mente no Transtorno Bipolar 16, para aprofundar o conhecimento sobre a doena, e da ampliao dos mapas conceituais. Aps, solicitao da traduo de um texto que possui um nvel alto de densidade terminolgica, retirado da Revista Bipolar Disorder, especializada no assunto e internacionalmente reconhecida.

O texto de partida
Os textos de partida que utilizei para a minha pesquisa apresentam um grau de dificuldade crescente (partindo de um texto
Exemplos dos mapas construdos pelos sujeitos, para esta pesquisa, no fim do artigo. 16 Texto escrito por Hlio Tonelli, do Instituto de Psiquiatria do Paran, publicado na Revista Brasileira de Psiquiatria, vol. 31, So Paulo, em dezembro de 2009.
15

110

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

com baixa densidade terminolgica at um nvel alto de densidade terminolgica). Neste artigo, apresentarei a anlise da traduo de um abstract (ou resumo) sobre o THB, com um nvel mdio de densidade terminolgica, considerando que a revista, utilizada nesta etapa, no especializada apenas nessa doena. O texto de partida (no final deste artigo) foi escrito em lngua inglesa e portuguesa, e publicado em 2004, na revista eletrnica Revista Brasileira de Psiquiatria, reconhecida pelo seu excelente nvel cientfico. O texto (em ingls) tem 139 palavras (juntamente com o ttulo) e intitulado The multidisciplinary team approach to the treatment of bipolar disorder: an overview. Trata-se de um texto associado ao gnero resumo, escrito por pesquisadores brasileiros. Embora o texto date de 2004, sua importncia em termos de contedo ainda se faz presente.

7. Discusso do estudo piloto


Para avaliar o rendimento da metodologia empregada, que visa obter uma compreenso dos estudantes sobre a natureza da aprendizagem de estratgias tradutrias, o exame das tradues produzidas uma pea-chave. Para a discusso da anlise das tradues dos respondentes, fiz uso de conceitos sobre equivalncia tradutria e textualizao (Costa, 2005) e sobre os princpios de livre escolha e idiomtico (Sinclair, 1991), que parecem estar em funcionamento em toda a produo textual. Segundo Costa, todos os textos parecem ser dependentes de outros textos, mas um texto traduzido depende de um outro texto especfico, de um modo bastante peculiar. O texto que o tradutor escreve ser baseado numa mensagem que j existe em forma de texto em outra lngua. Portanto, o texto original limita o novo texto de inmeras maneiras, sendo a mais visvel delas o fato de que o texto do tradutor deve ter um alto grau de semelhana com o seu correspondente original, para que seja reconhecido como traduo. Nos estudos de traduo, essa semelhana denominada equivalncia.

Linguagens Especializadas em Corpora

111

Esta ocorre quando um texto na lngua fonte (TLF) e um texto na lngua alvo (que aqui chamarei de traduzido, TT) so relacionveis maior parte das mesmas caractersticas relevantes. Sob esse ponto de vista, o TT considerado uma entidade autnoma, mas que ao mesmo tempo, est intimamente relacionada com a sua fonte. O plano dependente do texto traduzido tem a ver com seu aspecto enquanto traduo e investig-lo significa examinar o relacionamento de um dado par de lnguas em nvel sistmico, de suas idiossincrasias gramaticais e lexicais, assim como de suas incongruncias e incompatibilidades. Por outro lado, o plano autnomo do texto traduzido tem a ver com o seu aspecto enquanto texto, ou seja, com o modo como esto agrupadas as unidades (palavras, oraes, pargrafos, etc.). Conforme observa Costa:
Quando lidamos com equivalncia necessrio distinguir dois momentos ou facetas: uma delas a equivalncia dos itens no nvel da orao, ou equivalncia propriamente dita, e a outra a equivalncia supra-oracional, ou a equivalncia (macro) textual. As escolhas abertas ao tradutor so restritas no primeiro caso e quase infinitas no segundo (Costa, 2005:27).

O problema da equivalncia propriamente dita , sem dvida, central a qualquer traduo. Contudo, um aspecto no menos crucial no processo tradutrio a construo de um novo texto, seu processo e seu produto, denominado pelo autor de textualizao. A textualizao funciona quando o escritor vai do (macro) ideacional para o (macro) textual, ou seja, ele comea com algumas idias e usa o seu acervo de palavras, regras gramaticais, padres retricos e experincias passadas como leitor e escritor e produz um texto que representa, apenas parcialmente, o que desejaria dizer. Ele parte do ideacional para chegar ao textual; ele comea com um conjunto de significados para produzir um texto que, por sua vez, constitui um novo conjunto de significados. Costa, tomando como base as ideias de Hoey e Coulthard (apud Costa, 2005), salienta que, parece haver, em cada texto, blocos ideacionais, alguns deles mais importantes do que outros para o sentido global. Segundo Hoey:

112

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

A primeira frase de um relatrio costuma ter um status especial de frase resumo, por isso, seria possvel argumentar que a capacidade da frase 1 de fazer sentido junto com as outras frases do texto resultado desse status especial (29).

E conforme Costa:
Identificar o bloco ideacional que resume o sentido geral do texto seria muito til, j que, conforme Coulthard, o que precisamos inicialmente um resumo do contedo ideacional (2005: 29).

interessante notar, por exemplo, que, a primeira frase do texto The multidisciplinary team approach to the treatment of bipolar disorder: an overview, funciona como um resumo, e pela comparao e contraste das escolhas dos respondentes 17 (especialista, tradutora, R1 e R2, grupo A/CM, e R3 e R4, grupo B/SM), podemos ter uma ideia das principais decises textuais de cada um deles. A partir daqui, explico a notao utilizada nos exemplos retirados dos textos originais e tradues dos respondentes. Em cada sequncia, o segmento em itlico corresponde ao original em lingua inglesa. Os trechos em fonte normal, em azul e marrom so, respectivamente, os da especialista e da tradutora. Os trechos em cor laranja so do grupo A/CM e os dois ltimos, em cor verde, os dos respondentes do grupo B/SM. Vejamos a seguir: Bipolar disorder is a chronic and recurrent disorder, and many factors have been associated with its course and prognosis. O transtorno bipolar um transtorno crnico e recorrente e muitos fatores tm sido associados com seu curso e prognstico. O transtorno bipolar uma doena crnica e recorrente, e muitos fatores tm sido associados com o seu desenvolvimento e prognstico. Transtorno bipolar um distrbio crnico e recorrente e muitos fatores tm sido associados com seu curso e prognstico (R1, A/CM).

17

Textualizaes, na ntegra, no final deste artigo.

Linguagens Especializadas em Corpora

113

O transtorno bipolar uma doena crnica e recorrente e muitos fatores tm sido associados com o seu curso e prognstico (R2, A/CM). Transtorno bipolar uma crnica e recorrente desordem, e muitos fatores tm sido associados com sua conduta e prognstico (R3, B/SM). Transtorno Bipolar uma crnica e recorrente desordem, e muitos fatores tm sidos associados com a conduta e diagnstico (R4, B/SM). Nas tradues feitas, houve uma equivalncia tradutria, em que informaes relevantes do texto original foram preservadas. No entanto, como se observa acima, os respondentes que no construram os mapas (em verde) apresentaram textualizaes problemticas quanto gramtica e ao lxico, ao traduzirem chronic and recurrent disorder por crnica e recorrente desordem e course and prognosis por conduta e diagnstico, distanciando-se das tradues feitas pela especialista e pela tradutora, utilizadas como referncia nesta pesquisa. Como mencionado anteriormente, o mapa conceitual pode ser entendido como uma representao visual utilizada para partilhar significados, pois explicita como o autor entende as relaes entre os conceitos enunciados. Parece-me que os respondentes que construram os mapas (apresentados nos anexos 1 e 2), como recurso tradutrio, conseguiram reter o ideacional do texto e, consequentemente, tornaram a frase resumo acima, mais compreensvel. Diferentemente do escritor do texto original, o tradutor aquele tipo especial de escritor que cria o texto no a partir do seu prprio ideacional, mas a partir de outro texto. Ele reescreve um texto original, e limitado no apenas pela gramtica, pelos padres lexicais de sua lngua e pela habilidade como textualizador, mas tambm pelas restries impostas pelo texto, pelo seu tom e contedo (Costa, 2005). Segundo o autor, as relaes mais importantes se do entre o ideacional, intertextual e textual que permeiam todos os tipos de texto em qualquer lngua. Nesta discusso, levarei em considerao os aspectos ideacionais e textuais. Textualizar implica diferentes dificuldades em diferentes aspectos. No ideacional, conforme mostrado por Coulthard (apud Costa, 2005), uma das principais dificuldades dizem respeito ao sequenciamento e sinalizao (gramtica). Como o tradutor necessariamente trabalha numa sequncia, ele naturalmente traduz

114

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

orao por orao, grupo por grupo e at mesmo palavra por palavra. Segundo Costa (2005), parece que a maioria dos tradutores trabalha com as menores unidades do discurso, preocupando-se mais com a frase ou a orao do que com a assimilao do ideacional do texto inteiro. Ao se utilizar dessa estratgia, o texto traduzido apresentar limitaes de ordem macrotextual, como coeso e relaes de correspondncia. Importante salientar que isso pode ocorrer nas retextualizaes de diferentes gneros textuais, como por exemplo, de uma obra literria ou de um artigo cientfico. Tomemos, como exemplo, a segunda frase do resumo traduzido para o estudo piloto: Dysfunction in social, professional or family life has been correlated with poor outcomes and increased risk of relapse and recurrence, especially when the patient does not adhere to the treatment regimen. Disfuno na vida social profissional ou familiar tem sido correlacionada com pobres resultados e aumento do risco de recada e recorrncia, especialmente quando o paciente no adere ao tratamento. Disfunes na vida social, profissional ou familiar foram correlacionadas com resultados pobres e aumento do risco de reincidncia e recorrncia, especialmente quando o paciente no adere ao programa de tratamento. Em disfuno social, profissional ou vida familiar tm sido correlacionados a resultados pobres e aumentam o risco de recada e reincidncia, principalmente quando o paciente no adere ao regime de tratamento (R1, A/CM). Disfuno na vida social, profissional ou vida familiar tem sido correlacionadas com resultados pobres e aumento do risco de recada e recorrncia principalmente quando o paciente no adere ao tratamento (R2, A/CM). Disfuno na vida social, profissional ou familiar tem sido correlatado como pobres resultados e aumentado o risco de recada e retorno (da doena), especialmente quando o paciente no segue o regime do tratamento (R3, B/SM).

Linguagens Especializadas em Corpora

115

Disfuno social, profissional ou na vida familiar tm sido correlacionados com insatisfatrio resultado e o aumento do risco de recada e recorrncia, especialmente quando o paciente no conformase com o regime do tratamento (R4, B/SM). Nessa frase, quando os fatores associados (citados na primeira) so explicitados, percebe-se que aqueles que construram o mapa tm uma ideia mais precisa do contedo ideacional do texto, no que se refere s relaes de correspondncia, inclusive fazendo uso de colocaes verbais como, por exemplo, aderir ao tratamento. Suas textualizaes esto mais prximas s da especialista e da tradutora. O termo adhere, nesse contexto especfico, tem adeso como seu equivalente em lngua portuguesa, que significa no apenas fazer uso da medicao prescrita, mas se responsabilizar junto ao terapeuta pelos resultados do tratamento. A pergunta que fica : Por que aqueles que no fizeram o mapa, no usaram o termo cognato (aderir), como se no tivessem entendido o contedo ideacional do texto? Outro trao onipresente em qualquer textualizao a sinalizao que diz respeito gramtica e que varia segundo os hbitos e as habilidades do textualizador, conforme apontado por Coulthard (apud Costa, 2005):
...a reunio de oraes num texto em si cria relaes entre as oraes; mas uma deciso secundria do escritor sinalizar ou no essas relaes por realizao lexical. Se ele escolhe no faz-lo, permitir a possibilidade de ambigidade ou malentendido. (Ibid: 39).

Por exemplo, a R3 traduziu recorrncia como um sinnimo de recada quando, na verdade, recorrncia significa que a doena retorna muitas vezes. Ao traduzir recurrent por retorno da doena e ao associar os conceitos de recada e retorno da doena, a respondente d uma ideia de que uma coisa leva outra, mudando o significado da frase e, possivelmente, causando certa ambiguidade ao texto. Importante lembrar que esta anlise est sendo feita, levando em considerao a textualizao de alunos de Letras em formao, que possuem pouca ou nenhuma experincia em traduo, como o caso

116

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

do grupo B, que no construiu os mapas. Ao mesmo tempo, fica a pergunta: por que a palavra recurrent no foi traduzida por recorrente, a equivalncia mais prxima na lngua portuguesa? Ser que uma consequncia da no assimilao do ideacional do texto inteiro, levando a uma preocupao apenas da frase? Ser que os mapas conceituais que fornecem um entendimento do todo, partindo de proposies mais amplas para as mais especficas e organizando o conhecimento de forma estruturada, fez com que o grupo B, em alguns momentos, tivesse mais dificuldade em fazer uso de conceitos mais precisos? Falemos, agora, sobre o que Sinclair (1991) chama de princpio da livre escolha e princpio idiomtico. O autor defende a ideia de que, para explicar o modo como o significado surge a partir do texto lingustico, teremos que desenvolver dois princpios de interpretao diferentes. O primeiro trata o texto lingustico como resultado de um nmero grande de escolhas complexas. Em cada ponto em que uma unidade est completa (uma palavra, um sintagma ou uma orao), abre-se uma ampla variedade de escolhas, e a nica restrio a gramaticalidade. Este princpio formado por dois tipos de escolha: a lexical e a gramatical. O segundo princpio diz que o usurio da lngua dispe de um grande nmero de sintagmas semi-pr-construdos que constituem opes unitrias, mesmo que possam parecer analisveis em partes. Este constitudo de trs conjuntos diferentes de escolhas mais amplas: a) expresses idiomticas; b) colocaes; c) sequncias lexicogramaticais fixas. Embora os dois princpios digam respeito s mesmas categorias lingusticas (lxico e gramtica) a diferena essencial est no fato de que no princpio da livre escolha, a escolha mltipla e, no principio idiomtico a escolha unitria. Numa traduo literal, o princpio idiomtico tende a desempenhar um papel menor ou a estar ausente, com expresses idiomticas e colocaes naturais, ocorrendo apenas quando houver correspondncia biunvoca entre as palavras das lnguas envolvidas. Tomemos como exemplos, mais alguns trechos do resumo traduzido pelos respondentes, com base nos princpios da livre escolha

Linguagens Especializadas em Corpora

117

(lexical e gramatical) e do princpio idiomtico (colocaes e sequncias fixas): a) Princpio da livre escolha (lexical): The multidisciplinary team approach to the treatment of bipolar disorder: an overview A especialista no traduziu o ttulo. A abordagem da equipe multidisciplinar no tratamento do transtorno bipolar: uma viso geral. A equipe de aproximao multidisciplinar para o tratamento do transtorno bipolar: um panorama (grifo meu) (R1, A/CM) A abordagem multidisciplinar para o tratamento do transtorno bipolar: uma viso geral (R2, A/CM) A Abordagem Multidisciplinar para o Tratamento do Transtorno Bipolar: uma viso geral. (R3, B/SM) A abordagem multidisciplinar de uma equipe no tratamento do transtorno bipolar: uma viso geral. (R4, B/SM) A escolha lexical da tradutora foi reproduzida, nas textualizaes, por todos os respondentes, exceto pelo R1 (Grupo A/CM), que preferiu utilizar a palavra panorama (em negrito). b) Princpio da livre escolha (gramatical): and increased risk of relapse and recurrence e aumento do risco de recada e recorrncia(especialista) e aumento do risco de reincidncia e recorrncia(tradutora) e aumentam o risco de recada e reincidncia (R1, A/CM) e aumento do risco de recada e recorrncia (R2. A/CM) e aumentado o risco de recada e retorno (da doena) (R3, B/SM) e o aumento do risco de recada e recorrncia (R4, B/SM) Nessa passagem, a especialista, a tradutora, a R2 e a R4 optaram pelo uso do substantivo aumento na textualizao, embora increased, nesta frase, seja um particpio, pois est relacionado com o tempo verbal presente perfeito na frase anterior: Dysfunction in social, professional or family life has been correlated with poor outcomes and increased risk of relapse and recurrence. A R1 optou pelo presente simples aumentam, o que no problemtico para o entendimento do texto, pois o presente perfeito, neste caso, pode se referir uma ao que ainda acontece.

118

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

A R3, que optou por aumentado, preservou o paralelismo gramatical sinttico textualizado anteriormente na frase tem sido correlatado como pobres resultados e aumentado o risco de recada e retorno, causando, possivelmente, uma certa estranheza ao leitor de lngua portuguesa. Talvez isso tenha ocorrido devido tentativa de utilizar o equivalente natural mais prximo de correlated e increased. c) Princpio idiomtico (colocaes): especially when the patient does not adhere to the treatment regimen. especialmente quando o paciente no adere ao tratamento. especialmente quando o paciente no adere ao programa de tratamento. principalmente quando o paciente no adere ao regime de tratamento (R1, A/CM). principalmente quando o paciente no adere ao tratamento (R2, A/CM). especialmente quando o paciente no segue o regime do tratamento (R3, B/SM). especialmente quando o paciente no conforma-se com o regime do tratamento (R4, B/SM). Nesse trecho, a colocao aderir ao tratamento, como utilizada na linguagem mdica (sentido explicado anteriormente) foi a escolha tradutria dos quatro primeiros respondentes: a especialista, a tradutora, a R 1 e a R 2 (grupo A/CM). A R3 e a R4 (grupo S/M) optaram por seguir o regime de tratamento e conformar-se com o tratamento, respectivamente. A opo da R3 no revela uma escolha problemtica, ou seja, no interfere no entendimento do texto. A da R4, no entanto, ao utilizar o verbo conformar-se, modifica o sentido da frase, comprometendo o entendimento dessa parte do texto. d) Princpio idiomtico (sequncias lexicogramaticais fixas): early identification of prodromal symptoms identificao precoce dos sintomas prodrmicos identificao precoce dos sintomas prodrmicos identificao precoce dos sintomas das etapas da doena (R1, A/CM) identificao precoce dos sintomas prodrmicos (R2, A/CM)

Linguagens Especializadas em Corpora

119

precoce identificao de prodrmicos sintomas (R3, B/SM) identificao precoce dos sintomas prodrmicos (R4, B/SM) A sequncia fixa no TT, correspondente identification of prodomical symptoms, foi reproduzida por 4 dos 6 respondentes. A R1 traduziu por a identificao precoce dos sintomas das etapas da doena, mudando o significado da frase e comprometendo a informao veiculada pela mesma. A R3 optou por precoce identificao de prodrmicos sintomas, alterando a sequncia lexicogramatical da expresso convencional identificao de sintomas, na lngua portuguesa. A anlise feita acima, em fase inicial, intentou mostrar as diferentes condies de formulao de textualizaes dos estudantes envolvidos, tendo em vista a familiarizao de estratgias tradutrias para um grupo de sujeitos que no possuem um conhecimento experto em Traduo.

8. Sntese das observaes e consideraes finais


A partir da situao problema apresentada neste texto, que foi Considerando a lacuna de formao existente relativa ao tema /natureza da Traduo em meio formao do docente de LE, e que contribuir para diminu-la algo que pode ser positivo, como se pode introduzir esse tipo de conhecimento para o acadmico de Licenciatura em Letras? propus um modelo didtico para a familiarizao e a aprendizagem de estratgias tradutrias para alunos do curso superior de Licenciatura em Letras, que participaram como respondentes da minha pesquisa. A metodologia utilizada no experimento mostrou resultados positivos no que se referem aos textos traduzidos por esses respondentes, no par ingls-portugus, considerando sua pouca ou nenhuma experincia com traduo. Dessa forma, posso afirmar que possvel, sim, familiarizar esses estudantes com o tema da Traduo, atravs de uma metodologia centrada no aprendiz e baseada em tarefas, com nveis graduais de dificuldade, e adotando-se como estratgia cognitiva, a construo de mapas conceituais. Como vimos anteriormente, essa estratgia permite ao indivduo estabelecer uma forma estvel de

120

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

codificao de informaes, que possibilita sua recuperao consciente por meio de redes associativas e a aquisio de habilidades determinantes para a compreenso da rea temtica a ser traduzida. O propsito de incentivar o docente em lngua inglesa em formao a desenvolver estratgias de traduo est imbudo do esprito de conscientiz-lo da possibilidade de tratamento desse tema paralelamente ao do ensino, como uma segunda possibilidade de formao profissional em Letras. No que diz respeito aos dados iniciais obtidos, comparando-se os dois grupos (A/CM e B/SM), observa-se que o grupo que construiu e se utilizou dos mapas para as textualizaes apresentou, de modo geral, produes mais prximas s da tradutora e da especialista, utilizadas como referncia nessa pesquisa. Esses dados parecem indicar que o primeiro grupo fez uso de conceitos mais precisos, identificou o contedo ideacional do texto, apresentou menos problemas de sinalizao e de colocao, em suas textualizaes. Os resultados tambm indicam que a hiptese merece esse estatuto em meio ao trabalho da tese em andamento. Por fim, acredito que uma anlise detalhada sobre como o aluno chega boa soluo na lngua de chegada e o porqu de suas escolhas tradutrias - por meio da descrio da travessia entre a compreenso da rea temtica, a aprendizagem das diferentes estratgias e o texto traduzido - se faz necessria futuramente, para que se possa desenvolver, com mais propriedade, uma pedagogia de traduo voltada para o professor de lngua inglesa em formao.

Referncias
AUSUBEL, D. P. (1968). Educational Psychology: a cognitive view. New York: Holt, Rinehart and Winston, Inc. AUSUBEL, D. P. (2000). "The Acquisition and Retention of Knowledge: A Cognitive View": Kluwer Academic Publishers. CABR, M. T. (1999c). Terminologa: Representacin y Comunicacin. Elementos para uma Teoria de Base Comunicativa y otros Artculos. Srie Monografies, 3. Barcelona: Universitat Pompeu Fabra, Institut Universitari de Lingustica Aplicada.

Linguagens Especializadas em Corpora

121

COSTA, W. (2005). O Texto Traduzido como Re-textualizao. Cadernos de Traduo. Vol. 2, no. 16. Santa Catarina: UFSC. DARIN, L. C. de M. (2006). Questes Polmicas nos Estudos da Traduo: foco no ensino-aprendizagem. Estudos Lingsticos, XXXV. So Paulo: PUC-SP. HURTADO-ALBIR, A. (2001). Caracterizacin de la Tradutologa. Traduccin y Tradutologa. Madrid: Ctedra. ______. (2005). A Aquisio da Competencia Competncia em Traduo. Belo Horizonte: UFMG. Tradutria. In:

MACHADO-VIEIRA, R.; SANTIN, A. e SOARES, J. C. (2004). The Multidisciplinary Team Approach to the Treatment of Bipolar Disorder: an overview. Rev. Bras. Psiquiatr. [online]. vol. 26, suppl.3, pp. 51-53. NOVAK, J. D. (2010). Learning, Creating and Using Knowledge. Second Edition. New York: Routledge. RODILLA, B. M.G. (1998). La Ciencia empieza en la palabra. Barcelona: Ediciones Pennsula. SINCLAIR, J. (1991). Corpus Concordance Collocation. Oxford: Oxford University Press. TAVARES, R. Construindo Mapas Conceituais. Revista Cincias & Cognio (online), Vol 12: 72-85. Acessado em janeiro/2010, no stio http://www.cienciasecognicao.org, 2007.

122

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ANEXOS

Linguagens Especializadas em Corpora

123

ANEXOS

124

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ANEXOS

The multidisciplinary team approach to the treatment of bipolar disorder: an overview


Bipolar disorder is a chronic and recurrent disorder, and many factors have been associated with its course and prognosis. Dysfunction in social, professional or family life has been correlated with poor outcomes and increased risk of relapse and recurrence, especially when the patient does not adhere to the treatment regimen. Within the last decade, new treatments, intended to promote better adherence and minimize the risk of morbidity or hospitalization, have been tested. The multidisciplinary team approach attempts to educate patients and their families about such factors. Herein, we evaluate the therapeutic efficacy of this approach in applying the various psychosocial interventions employed in the treatment of bipolar disorder. The objective of this approach is early identification of prodromal symptoms in order to prevent hospitalization and behavioral dysfunction. Respondente 1 (a especialista): O transtorno bipolar um transtorno crnico e recorrente e muitos fatores tm sido associados com seu curso e prognstico. Disfuno na vida social profissional ou familiar tem sido correlacionada com pobres resultados e aumento do risco de recada e recorrncia, especialmente quando o paciente no adere ao tratamento. Na ltima dcada novos tratamentos tm sido testados na inteno de promover melhor aderncia do paciente ao tratamento e minimizar o risco de morbidade ou hospitalizao. A abordagem da equipe multidisciplinar tenta educar os pacientes e seus familiares sobre tais fatores. Aqui ns avaliamos a eficcia teraputica da nossa abordagem, aplicando varias intervenes psicossociais no tratamento do transtorno de humor bipolar. O objetivo dessa abordagem validar a identificao precoce dos sintomas prodrmicos na preveno da hospitalizao e do comportamento disfuncional

Linguagens Especializadas em Corpora

125

Respondente 2 (a tradutora): A abordagem da equipe multidisciplinar no tratamento do transtorno bipolar: uma viso geral O transtorno bipolar uma doena crnica e recorrente, e muitos fatores tm sido associados com o seu desenvolvimento e prognstico. Disfunes na vida social, profissional ou familiar foram correlacionadas com resultados pobres e aumento do risco de reincidncia e recorrncia, especialmente quando o paciente no adere ao programa de tratamento. Na ltima dcada, novos tratamentos foram testados a fim de promover uma melhor adeso do paciente ao tratamento e minimizar o risco de morbidade ou hospitalizao. A abordagem da equipe multidisciplinar intenta educar os pacientes e suas famlias sobre tais fatores. Neste artigo, ns avaliamos a eficcia teraputica desta abordagem ao aplicarmos as vrias intervenes psicossociais empregadas no tratamento do transtorno bipolar. O objetivo da abordagem que aqui nos referimos a identificao precoce dos sintomas prodrmicos para que se possa prevenir a hospitalizao e a disfuno comportamental. Respondente 1 (Grupo A/CM): A equipe de aproximao multidisciplinar para o tratamento do transtorno bipolar: um panorama Transtorno bipolar um distrbio crnico e recorrente e muitos fatores tm sido associados com seu curso e prognstico. Em disfuno social, profissional ou vida familiar tm sido correlacionados a resultados pobres e aumentam o risco de recada e reincidncia, principalmente quando o paciente no adere ao regime de tratamento. Dentro da ltima dcada, novos tratamentos, com a inteno de promover uma melhor aderncia e minimizar o risco de morbidez ou hospitalizao, tm sido testados. A equipe de aproximao disciplinar tenta educar os pacientes e seus familiares sobre estes fatores. Incluindo, ns avaliamos a eficcia teraputica desta aproximao na aplicao de vrias intervenes psicosociais aplicadas ao tratamento do transtorno bipolar. O objetivo dessa aproximao a identificao precoce dos sintomas das etapas da doena a fim de prevenir a hospitalizao e a disfuno comportamental.

126

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Respondente 2 (A/CM): A abordagem multidisciplinar para o tratamento do transtorno bipolar: uma viso geral. O transtorno bipolar uma doena crnica e recorrente e muitos fatores tm sido associados com o seu curso e prognstico. Disfuno na vida social, profissional ou vida familiar tem sido correlacionadas com resultados pobres e aumento do risco de recada e recorrncia principalmente quando o paciente no adere ao tratamento. Na ltima dcada, foram testados novos tratamentos destinados a promover uma melhor aderncia e minimizar o risco de morbidade ou de internao. A abordagem multidisciplinar para o transtorno bipolar busca educar os pacientes e suas famlias sobre tais fatores. Nesse trabalho, ns avaliamos a eficcia teraputica desta abordagem atravs da aplicao das vrias intervenes psicossociais empregadas no tratamento do transtorno bipolar. O objetivo desta abordagem a, a fim de evitar a hospitalizao e disfuno comportamental. Respondente 3 (Grupo B/SM): A Abordagem Multidisciplinar para o Tratamento do Transtorno Bipolar: uma viso geral Transtorno bipolar uma crnica e recorrente desordem, e muitos fatores tm sido associados com sua conduta e prognstico. Disfuno na vida social, profissional ou familiar tem sido corelatado como pobres resultados e aumentado o risco de recada e retorno (da doena), especialmente quando o paciente no segue o regime do tratamento. Na ltima dcada, novos tratamentos, destinados a promover melhores aderncias e minimizar o risco de morbidade ou hospitalizao, tm sido testados. As tentativas de abordagem multidisciplinar de educar pacientes e suas famlias sobre tais fatores. Nisto, ns avaliamos a eficcia teraputica dessa abordagem na aplicao de vrias intervenes psicossociais empregadas no tratamento do transtorno bipolar. O objetivo dessa abordagem a precoce identificao de prodrmicos sintomas a fim de prevenir a hospitalizao e a disfuno comportamental.

Linguagens Especializadas em Corpora

127

Respondente 4 (Grupo B/SM): A abordagem multidisciplinar de uma equipe no tratamento do transtorno bipolar: uma viso geral O transtorno bipolar uma doena crnica e recorrente, e muitos fatores tm sido associados com o seu curso e prognstico. Disfuno na vida social, profissional ou familiar tem sido correlacionada com resultados ruins e o aumento do risco de recada e recorrncia, principalmente quando o paciente no adere ao tratamento. Na ltima dcada, novos tratamentos tentaram promover uma melhor aderncia e minimizar o risco de morbidade ou de internao, foram testados. A abordagem multidisciplinar tenta educar os pacientes e suas famlias sobre tais fatores. Nisto, ns avaliamos a eficcia teraputica desta abordagem na aplicao das vrias intervenes psicossociais empregadas no tratamento do transtorno bipolar. O objetivo desta abordagem a identificao precoce dos sintomas prodrmicos, a fim de evitar a hospitalizao e disfuno comportamental.

TERMINOLOGIA TEXTUAL E LINGUSTICA DE COR P US : ESTUDO EM PARCERIA Leonardo Zilio 1


Resumo: Este texto mostra algumas possibilidades de cooperao entre a Terminologia Textual e a Lingustica de Corpus. Nosso primeiro passo descrever um pouco as reas abordadas, principalmente por serem reas de estudo relativamente novas. No caso da Terminologia Textual, h ainda toda uma problematizao em relao sua concepo e existncia como rea de estudo, a qual no pode passar em branco. Para mostrar como essas reas podem auxiliar-se mutuamente, apresentamos, posteriormente, dois trabalhos j realizados. O primeiro trabalho diz respeito caracterizao de gneros e tipos textuais. J o segundo trabalho entra no ramo da Fraseologia Especializada e se ocupa de colocaes especializadas. Ambos os trabalhos foram realizados com textos da rea da Cardiologia. Como se pode ver, apesar de mencionarmos inicialmente apenas duas reas de estudo, a Terminologia Textual e a Lingustica de Corpus, a interdisciplinaridade muito maior, abrangendo diversas reas.

1 Terminologia Textual e Lingustica do Texto Especializado


Quando mencionamos a expresso Terminologia Textual, no podemos deixar de esclarecer o que estamos entendendo sob essa denominao. Isso porque, no bastasse a Terminologia j apresentar algumas controvrsias 2, o ttulo Terminologia Textual j foi utilizado para descrever outros tipos de estudo que no so abordados aqui.

Mestre em Estudos da Linguagem pelo PPG-Letras da UFRGS na linha de pesquisa Lexicografia e Lexicografia: Relaes Textuais. 2 O termo Terminologia permite fazer referncia tanto rea de estudos como ao conjunto de termos de uma rea. Alm disso, a rea de estudos pode ser entendida como eminentemente normativa ou descritiva, dependendo da abordagem que se toma como ponto de partida.

Linguagens Especializadas em Corpora

129

Condamines (2005), por exemplo, prope que, na Terminologia Textual, os corpora sejam utilizados para auxiliar o terminlogo na busca por termos. Krieger (2008, p. 6), por outro lado, adota um ponto de partida baseado na semitica greimasiana e deixa claro que, para ela, o termo Terminologia Textual est relacionado integrao de componentes de textualidade e da discursividade no aparato tericometodolgico da Terminologia, cujo objeto primeiro o termo tcnico-cientfico (grifo nosso). Veremos mais adiante que o que estamos entendendo por Terminologia Textual mais abrangente do que essas propostas. Os estudos terminolgicos e as teorias de Terminologia, comeando por Wster, com a Teoria Geral da Terminologia (1974), passando pela Teoria Comunicativa da Terminologia de Cabr (2001) e pela Teoria Sociocognitiva de Temmermann (2000), apresentam-se acentuadamente, ou mesmo totalmente, vinculados ao estudo dos termos. Cada autor apresenta uma perspectiva diferente, embora a base de pesquisa sempre esteja associada quelas unidades que denotam conceitos especializados. Nos anos 80, porm, comearam a se desenvolver estudos, quer se denominassem terminolgicos ou no, que j compreendiam a importncia do texto especializado. Leitchik (2004), em uma coletnea de artigos russos sobre Terminologia do perodo de 1992 a 2002, apresentou uma proposta de trabalho que denominou de Teoria Terminolgica do Texto (Terminological Text Theory), a qual j vinha desenvolvendo desde 1981 (cf. Leitchik, 2004, p. 373). A proposta de Leitchik ainda est vinculada ao conceito de termo e de sua centralidade para o estudo terminolgico. Todavia, j reconhecido pelo autor que o objeto de estudos da Teoria Terminolgica do Texto compreende vrios textos, nos quais termos esto contidos 3 (cf. Leitchik, 2004, p. 371).

Essa oposio do estudo de termos em textos e de textos com termos abordada por Finatto (2004a) em um artigo muito interessante que apresenta, entre outros, uma boa introduo para o que est sendo discutido nesta seo.

130

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Os estudos de textos que contm termos se desenvolveram principalmente no mundo germnico, onde o estudo da Fachsprache 4 (Finatto, 2004a, p. 347), principalmente apoiada nos estudos e propostas de Hartwig Kalverkmper (1983) e Lothar Hoffmann (1988a), aborda o texto especializado como elemento central do estudo das linguagens especializadas. Esses autores no se referem aos seus estudos pelo ttulo Terminologia Textual, mas sim como Lingustica de Linguagens Especializadas ou Lingustica do Texto Especializado. Uma explicao para isso que, na poca, o paradigma da Terminologia era representado pela proposta de Eugen Wster, bem sintetizada em seu artigo pstumo de 1974. Contribui para essa explicao o fato de que o prprio Hoffmann (1988a) no dizia estar fazendo estudos terminolgicos, mas sim estudos na rea da Fachsprachenforschung [Pesquisa de linguagens especializadas], que ele diferenciava do Terminologiearbeit [Trabalho terminolgico], entendido como a rea que se encarregava do estudo dos termos a partir de uma perspectiva normativa. O que nos fascina nos trabalhos de Hoffmann e Kalverkmper a proposta de se estudarem elementos que no dependem diretamente do termo. Eles entendem que, do ponto de vista lingustico, no h como algo que se pretende como lngua ou linguagem ser apenas composto pelo lxico e, apesar de no se oporem diretamente teoria de Wster, percebe-se que a sua posio no favorvel ao que est sendo feito:
O trabalho terminolgico geralmente compreendido como uma parte da lingustica de linguagens especializadas, mas na verdade ele se ocupa apenas de um ncleo das linguagens especializadas se ocupa da terminologia. Esse trabalho se situa num lugar bastante especfico, sobretudo porque, em Esse termo, em alemo, permite a traduo tanto por lngua de especialidade quanto por linguagem de especialidade, ou, ainda, por linguagem especializada. Na nossa compreenso dos fatos, acreditamos que, dependendo do contexto, possa fazer referncia ou lngua de especialidade ou linguagem especializada. Para melhor compreender a distino que fazemos entre lngua de especialidade e linguagem especializada, aconselhamos a leitura de Zilio (2009), principalmente do captulo 1.
4

Linguagens Especializadas em Corpora

131

grande parte, nele no esto envolvidos lingistas, mas apenas engenheiros e tcnicos. Essa situao ainda dever se prolongar enquanto no haja condies favorveis para a lingustica de linguagens especializadas nessas instituies. (Hoffmann, 1988b, p. 87)

Sua proposta, ento, que os termos sejam somente um dos aspectos estudados nas linguagens especializadas. Hoffmann se apega Lingustica de Linguagens Especializadas, qual Kalverkmper (1983, p. 125) define como teoria terminolgica com uma srie de problemticas adicionais *, ou seja, como algo que abrange mais do que o lxico, considerado frequentemente como o Haupttrger der Fachsprachlichkeit [principal portador da especializao lingustica] (cf. Kalverkmper, 1983, p. 125).
Mas, assim como as unidades lexicais esto alojadas em um todo de ordem maior, nominadamente, a orao, tambm a orao uma parte completa de um todo de ordem maior e ainda mais complexo, para cuja constituio ela contribui, nominadamente, * o texto (Kalverkmper, 1983, p. 126).

Assim, o paradigma proposto tem como objeto central de estudo o texto especializado e no mais a unidade terminolgica. Hoffmann (1998a, p. 416) aponta que o especfico das linguagens especializadas se expressa mais visivelmente em seu vocabulrio*, porm, fica claro que essa especificidade no est somente no vocabulrio. Isso representa uma grande ampliao dos estudos relacionados s linguagens especializadas, uma ampliao bastante coerente e importante, j que, se observarmos atentamente, um estudo somente sobre termos no esgota os questionamentos restantes acerca de uma linguagem especializada.
*

No original: Terminologielehre mit einem zustzlichen Fcher von Problemstellungen. * No original: Aber so wie die lexikalischen Einheiten eingebettet sind in ein bergeordnetes komplexeres Ganzes, nmlich in den Satz, so ist der Satz selbst ein ganzheitlicher Teil eines wiederum bergeordneten, noch komplexeren Ganzen, zu dessen Konstituierung er beitrgt, nmlich des Textes. * No original: die Spezifik der Fachsprachen uert sich besonders deutlich in ihren Wortschtzen.

132

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Apresenta-se ento a Fachtextlinguistik 5 (cf. Kalverkmper, 1983). Esse termo, em alemo, pode ser interpretado de duas maneiras: de um lado, temos a Fach-Textlinguistik, que, buscando responder o que uma especialidade, se ocuparia mais especificamente da pragmtica, pois a busca pela especialidade ou especialidades visa s aes humanas * (Kalverkmper, 1983, p. 128); por outro lado, temos a Fachtext-Linguistik, entendida como uma Lingustica de Gneros Textuais e que se ocupa dos textos em funcionamento. essa segunda interpretao que nos interessa aqui de forma mais especfica. Seu objetivo descrever o funcionamento do texto, seja seu funcionamento interno ou externo, de forma que traz para a anlise tambm os participantes da comunicao. Apontar como funciona o gnero textual e como ele se distingue de outros gneros textuais faz parte de um estudo do texto especializado. Para isso, utilizam-se mtodos empricos de anlise, que buscam identificar os pontos que o fazem especializado e o distinguem. Tendo-se o texto como foco, deixa de fazer sentido que se continue estudando somente os termos, de forma que se passa a englobar os modos de dizer peculiares de cada rea de conhecimento (Finatto, 2004a, p. 348). Essa distino do texto como objeto de estudo aparenta ser uma proposta bastante ambiciosa, porm, deve-se levar em conta que ele o objeto da Lingustica do Texto Especializado, a qual engloba vrias outras reas de estudo que tm como objeto as diferentes unidades presentes em um texto especializado. O todo se constri a partir de fonemas, passando por palavras, sintagmas, oraes, sequncias oracionais, sees/captulos, texto, comunidades textuais, at gneros literrios (ou gneros textuais), o que j no pode mais ser observado
5

Fachtextlinguistik, em alemo, se no tiver nenhum sinal grfico que aponte qual a diviso que se deve fazer na palavra, pode ser interpretada de duas formas. A primeira forma Fach-Textlinguistik, seria uma Lingustica Textual Especializada; j a segunda forma possvel, Fachtext-Linguistik, seria uma Lingustica do Texto Especializado. A diferena entre as duas formas mais aprofundada em Kalverkmper (1983). Neste estudo, elas so abordadas somente para apontar as diferenas mais bsicas. * No original: denn die Frage nach dem Fach oder den Fchern zielt auf das menschliche Handeln.

Linguagens Especializadas em Corpora

133

como uma completude * (Kalverkmper, 1983, p. 153). Hoffmann (1988a, p. 22), abordando a Pesquisa de Linguagens Especializadas, apresentanos uma subdiviso em cinco nveis decrescentes: texto (textemas), frase (sintagmas), palavra (lexemas ou sememas), forma (morfemas), letras ou sons (grafemas ou fonemas); e aponta que cada uma dessas reas pode ser estudada a partir de cinco mtodos de estudo: estrutural, semntico, estatstico, comparativo e funcional. Tendo passado por esse quadro terico, cremos que est mais claro o porqu de chamarmos essa rea de estudo de Terminologia Textual. Sabemos que ainda persistem problemas em relao a essa denominao, j que o termo Terminologia, aponta, filologicamente, para um estudo do termo. Por essa mesma perspectiva, fica tambm estranho entender que algo terminolgico possa ser, ao mesmo tempo, textual. Essa discusso no se encerra aqui, mas tambm no em um artigo que ela se esgota e nem esse o objetivo aqui estabelecido. O que deve ficar claro desde j que a proposio de uma Terminologia Textual ainda algo bastante recente no Brasil 6 e merece maior discusso. Tendo apresentado um pouco das bases do que entendemos por Terminologia Textual, passamos nossa outra rea de estudos, a Lingustica de Corpus.

2. Lingustica de Corpus
A Lingustica de Corpus uma rea da Lingustica que vem ganhando cada vez mais fora no mundo acadmico e que tem desenvolvido trabalhos muito importantes no que diz respeito descrio de lngua e linguagem.
No original: baut sich auf aus den Phonemen ber die Wrter, Syntagmen, Stze, Satz-Folgen, Abschnitte/Kapitel, Text, Texte-Gemeinschaft, bis in die Gattungen (oder Textsorten) hinein, was als Ganzheit schon kaum mehr berschaubar ist. 6 Como referncia nessa rea de estudos, podemos mencionar os trabalhos desenvolvidos no mbito do Projeto TEXTQUIM (em breve: TEXTECC; www.ufrgs.br/textquim). Aos poucos tambm se concretiza a criao de um crculo de estudos, sob a coordenao da Prof. Dr. Maria Jos Bocorny Finatto, para debater o assunto.
*

134

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

O grande desenvolvimento da Lingustica de Corpus nos ltimos anos se deve muito (r)evoluo informtica. claro que j existiam trabalhos realizados com corpora antes dos computadores. Porm, a partir do momento em que se pde armazenar textos em um computador e produzir programas capazes de analisar esses textos de forma automtica ou assistida por computador que os trabalhos com corpora se tornaram mais frequentes, criando e dando maior visibilidade rea. Devido possibilidade de se aplicar, em outras reas, mtodos e ferramentas desenvolvidos dentro do mbito da Lingustica de Corpus, existem muitas dvidas quanto ao estatuto dessa rea de estudos: alguns autores acreditam ser ela somente uma metodologia, enquanto outros defendem que ela , de fato, uma disciplina. Como nos aponta Berber Sardinha (2004, p. 36), se entendermos que uma metodologia o instrumental aplicado em uma pesquisa, ento podemos entender a Lingustica de Corpus como tal, j que outras teorias podem recorrer das ferramentas desenvolvidas para o estudo de corpora para seus prprios fins. Porm, a Lingustica de Corpus tambm conta com um aporte terico alm das ferramentas das quais faz uso. Seguindo essa ideia, Rajagopalan (2007, p. 33) escreveu, no incio do livro Um percurso para pesquisas com base em corpus, quem acha que a Lingustica de Corpus no passa de uma ferramenta e nada ou pouco contribui para repensar os fundamentos da Lingustica () est prestes a ser saudado com uma bela surpresa. Uma terceira opo apontada por Berber Sardinha (2004, p. 37) a compreenso da Lingustica de Corpus como uma abordagem. Segundo Hoey (1997, apud Berber Sardinha, 2004, p. 37), Lingustica de Corpus no um ramo da lingustica, mas a rota para a lingustica. Biber et alii (1998) tambm adotam essa terceira posio, denominando seu estudo de abordagem baseada em corpus e propondo quatro principais caractersticas para essa abordagem:
- emprica, analisando os padres de uso existentes em textos naturais; - utiliza uma coleo grande e selecionada de textos naturais, conhecida como corpus, como base para a anlise;

Linguagens Especializadas em Corpora

135

-faz amplo uso de computadores para a anlise, utilizando tanto tcnicas automticas como interativas; - depende de tcnicas de anlise tanto quantitativas * quanto qualitativas (Biber et alii, 1998, p. 4).

Nessa discusso, nos colocamos como adeptos da terceira opo, j que nosso aporte terico, alm de estar baseado na Lingustica de Corpus, tambm est de mos dadas com outras reas da lingustica, de forma que no podemos enquadrar nosso trabalho somente sob o teto de uma delas. Dessa forma, a Lingustica de Corpus ser a porta de entrada para os estudos lingusticos que intentamos, sendo seus pressupostos tericos acolhidos. Segundo Berber Sardinha (2004, p. 30), os dois principais pressupostos da Lingustica de Corpus so: - a linguagem um sistema probabilstico de combinatrias; e - a abordagem deve ser emprica. Comecemos pela observao do segundo pressuposto. Na lingustica, emprico significa primazia aos dados provenientes da observao da linguagem, em geral reunidos sob a forma de um corpus (Berber Sardinha, 2004, p. 30). Percebe-se, portanto, que a Lingustica de Corpus est muito ligada observao do que comumente se chama de uso. Biber et alii (1998, p. 1) apresentam, logo no incio de seu livro Corpus Linguistics: Investigating Language Structure and Use, uma diferenciao entre language structure [estrutura da linguagem] e language use [uso da linguagem]. Os autores mencionam claramente que seu foco o uso: estudamos a linguagem realmente utilizada em textos naturais * (Biber et alii, 1998, p. 1). Isso traz tona uma questo importante: o que uso? Stubbs (2001, p. 1) escreve que a maioria das palavras utilizadas no dia a dia
*

No original: - it is empirical, analyzing the actual patterns of use in natural texts; - it utilizes a large and principled collection of natural texts, known as a corpus, as the basis for analysis; - it makes extensive use of computers for analysis, using both automatic and interactive techniques; - it depends on both quantitative and qualitative analytical techniques. * No original: we study actual language used in naturally occurring texts.

136

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

tem diferentes usos e diferentes significados *, dando a entender que uso e significado no so sinnimos. Porm, um dos lemas frequentemente utilizados pelo autor justamente meaning is use [significado uso] (cf. Stubbs, 2001, p. 13), mesmo admitindo que seja uma forma simplificada de se entender a sua proposta de trabalho (cf. Stubbs, 2001, p. 20). Stubbs (2001) trabalha com frequncia, mas considera que os diferentes significados no so atrelados frequncia, mas sim aos diferentes contextos e s diferentes combinatrias principalmente a essas ltimas em que uma palavra ou lema ocorre e esses fatores so identificados como uso. Portanto, uso entendido no como ocorrncia, mas sim como ocorrncia em diferentes combinatrias. Todavia, no se deve entender que a Lingustica de Corpus est interessada somente na observao da linguagem. Stubbs chama ateno para essa generalizao no seguinte trecho:
Enquanto muitos lingistas (chomskianos) tm se ocupado do que os falantes podem dizer, a Lingustica de Corpus tambm est necessariamente ocupada com o que os falantes efetivamente dizem. Mas que fique marcado o tambm. um equvoco ver somente freqncia de ocorrncias reais. Freqncia se torna interessante quando interpretada como algo tpico, e a competncia comunicativa dos falantes inclui conhecimento tcito * de normas de comportamento (Stubbs, 2001, p. 61).

Voltando aos dois pressupostos citados, vejamos o que se fala do primeiro. No que diz respeito ideia de sistema probabilstico, tem-se que, embora muitos traos lingsticos sejam possveis teoricamente, no ocorrem com a mesma freqncia (Berber Sardinha, 2004, p. 3031). Pelas recm-mencionadas palavras de Stubbs, porm, vemos que essa diferena de frequncia no aleatria, mas sistemtica. Assim, se
* *

No original: most everyday words have diferent uses and diferent meanings. No original: Whereas much (Chomskyan) linguistics has been concerned with what speakers can say, corpus linguistics is also necessarily concerned with what speakers do say. But note the also. It is misleading to see only frequency of actual occurrence (). Frequency becomes interesting when it is interpreted as typicality, and speakers communicative competence includes tacit knowledge of behavioural norms.

Linguagens Especializadas em Corpora

137

pode dizer que a linguagem padronizada. E essa padronizao se evidencia pela recorrncia, isto , uma colocao, coligao ou estrutura que se repete significativamente mostra sinais de ser, na verdade, um padro lexical ou lxico-gramatical (Berber Sardinha, 2004, p. 31). Esses padres representam, segundo Biber et alii (1998, p. 5), os caminhos sistemticos em que os aspectos lingusticos so usados em associao com outros aspectos lingusticos e no-lingusticos *. Por associaes lingusticas, Biber et alii (1998, p. 6) entendem as associaes lexicais e gramaticais; por no-lingustico, entende-se a observao da distribuio desses aspectos lingusticos em diferentes tipos de registro, dialetos ou perodos. Foi baseado nessa padronizao que John Sinclair (1991, p. 110-115) props o princpio idiomtico da linguagem, pelo qual, o usurio de uma lngua tem ao seu dispor um grande nmero de sintagmas semi ou pr-construdos, que constituem em escolhas nicas, mesmo que paream ser analisveis em segmentos. Esse princpio implica no fato de que a existncia ou no de uma palavra em um determinado sintagma dependa de palavras selecionadas anteriormente. Assim, por exemplo, no qualquer verbo que pode preencher a necessidade imposta por um sujeito, mas sim somente um determinado verbo ou grupo de verbos restringidos por ele. Por investigar a linguagem atravs de uma massa de, muitas vezes, milhes ou mesmo bilhes de palavras, a Lingustica de Corpus se apoia, hoje em dia, na investigao automtica ou semiautomtica de corpora armazenados em computadores. Existem muitas ferramentas j desenvolvidas para diversos fins. O que h de mais interessante na Lingustica de Corpus que, por ser uma investigao baseada em corpora, pode-se deixar que os textos nos guiem. a partir dos dados averiguados no corpus que um linguista de corpus pode conduzir sua pesquisa. O corpus no somente um instrumento de confirmao de dados ou de suposies, mas sim uma fonte destes. E isso o que mais nos atrai para nos voltarmos a esse tipo de abordagem.
*

No original: the systematic ways in which linguistic features are used in association with other linguistic and non-linguistic features.

138

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

3. Associando a Terminologia Textual Lingustica de Corpus


Trabalhando com duas reas interdisciplinares, no difcil perceber como elas podem cooperar. Nesta seo, apresentamos, muito rapidamente, alguns pontos de convergncia ou de emprstimo entre as duas reas que ficaro mais salientes ao observarmos resultados de estudos j realizados nessa parceria. Em uma primeira abordagem, vemos que a Terminologia Textual entra com os mtodos e aportes tericos para o trabalho com textos especializados, enquanto a Lingustica de Corpus entra com o aparato informtico, com os pressupostos tericos e com seu modo peculiar de observar a linguagem. O trabalho com corpora tambm tem toque das duas reas, j que a Lingustica de Corpus aponta os melhores modos de organizar um conjunto de textos, enquanto a Terminologia Textual aponta os tipos de texto a serem recolhidos. tambm a partir da observao da linguagem especializada em corpora que se percebe mais francamente como a observao de termos somente um pequeno passo na observao do texto especializado, mesmo que se entenda que esse um passo importante na caminhada. Assim, buscando elementos de uma rea e da outra, se molda um tipo de estudo que j mostra seus frutos. Uma parte dos frutos que j foram colhidos o que veremos nas sees seguintes deste captulo.

4. Estudos em parceria
Nesta seo, apresentamos dois estudos que desenvolvemos, sendo o primeiro deles em colaborao com outros autores. Os trabalhos que apresentamos tm a caracterstica comum de, como enfatizamos neste captulo, mesclar duas abordagens em uma parceria produtiva. O primeiro estudo d conta de uma observao no mbito dos gneros textuais, procurando estabelecer semelhanas e diferenas entre tipos textuais diferentes e entre lnguas diferentes. J no segundo estudo, o assunto abordado e bastante diferente, ocupando-se de colocaes especializadas em alemo e de seus equivalentes em portugus.

Linguagens Especializadas em Corpora

139

Ambos os trabalhos se desenvolveram principalmente a partir de um corpus formado por artigos cientficos da rea da Cardiologia escritos originalmente nas duas lnguas supracitadas. importante ressaltarmos que, apesar de estarem sendo apresentados individualmente, ambos os estudos foram desenvolvidos em parceria entre os autores, durante o perodo de 2007 e 2009.

4.1. Gneros Textuais


O primeiro estudo a ser apresentado diz respeito a uma proposta de delimitao entre tipos textuais e foi desenvolvido paralelamente em dois estudos (Scheeren et alii, 2008; Zilio, 2009). Resultados foram posteriormente juntados e podem ser encontrados em Zilio et aliae (2009). Esse estudo tinha por objetivo mostrar para tradutores iniciantes como textos de subreas da Medicina podem apresentar caractersticas suficientemente diferentes para serem considerados tipos textuais distintos e como existem diferenas importantes entre duas lnguas, visto que o estudo se deu entre o alemo e o portugus. As orientaes tericas relativas aos gneros textuais foram extradas de Ciapuscio (1994; 2003) no que diz respeito diviso entre classes e tipos textuais, advinda da tradio textual alem. Podemos dizer, sinteticamente, que as classes textuais so consideradas como os gneros textuais, so percebidas empiricamente, enquanto os tipos textuais so estabelecidos atravs de estudos baseados em uma teoria lingustica. Essa teoria lingustica foi encontrada em Hoffmann (1988a), que prope que o estabelecimento entre os diferentes tipos textuais deve ser fundamentado em uma anlise que contemple as unidades lingusticas presentes nos textos desde as menores, os grafemas, at as macroestruturas, passando pelos demais nveis microestruturais (morfolgico, lxico e sinttico) nesse caminho. Para levar a cabo essa anlise de diversos nveis textuais, recorreu-se Lingustica de Corpus, que, atravs de sua viso probabilstica da linguagem, permite observar as preferncias lexicais e sintticas em um corpus.

140

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

O estudo comparou, primeiramente, textos de Cardiologia em alemo com textos de Radiologia em alemo e, posteriormente, textos de Cardiologia em alemo com textos de Cardiologia em portugus. Tanto no estudo interlingual quanto no estudo entre as duas subreas, os principais resultados surgiram na observao das microestruturas. As macroestruturas tendiam muito a seguir orientaes dos peridicos estudados e no necessariamente vinculadas s reas estudadas. No contraste entre as subreas, observou-se a presena de substantivos muito diferentes nas listas de palavras 7 (ver tabela 1) das duas reas, tendo em comum somente Patienten [pacientes], Ergebnisse [resultados] e Untersuchung [anlise]. Tabela 1. Os 10 substantivos mais frequentes em Cardiologia e Radiologia.
Posio na lista 06 40 48 56 58 61 65 66 67 70 Total Cardiologia Substantivo Frequncia relativa 8 (%) 1,37 0,24 0,19 0,16 0,16 0,16 0,16 0,15 0,15 0,14 2,88 Posio na lista 11 47 59 61 63 64 67 79 81 88 Total Radiologia Substantivo Frequncia relativa(%) 0,77 0,20 0,17 0,16 0,16 0,16 0,15 0,13 0,12 0,11 2,13

Patienten Studie Ergebnisse Jahre Therapie Gruppe Operation Alter Studien Untersuchung

Patienten Lsionen Untersuchung Kategorie Ergebnisse Fllen Euro Befunde Untersuchungen Vernderungen

As listas de palavras foram geradas a partir do software Wordsmith Tools, utilizando-se a ferramenta WordList. 8 Optamos por apresentar somente as frequncias relativas, visto que as frequncias absolutas podem ser obtidas a partir desse valor, aplicando-o em relao ao tamanho total do corpus (disponvel na seo 5.1).

Linguagens Especializadas em Corpora

141

Aps terem sido observadas essas listas, partiu-se para uma observao de associaes lexicais, mostrando que, no nvel sinttico, as diferenas so ainda maiores. Para essa observao de associaes, foram buscados, em Cardiologia e Radiologia, os compostos estudados por Zilio (2009) para que se pudesse observar o seu comportamento em contexto. Os compostos, assim como suas ocorrncias, podem ser observados na tabela 2. Tabela 2. Frequncia absoluta dos compostos nominais nos corpora de Cardiologia e Radiologia.
Composto Nominal Herzinsuffizienz Risikofaktoren Zeitpunkt Herztransplantation Sinusrhythmus Herzerkrankung Herzkatheteruntersuchung Kontrollgruppe Ejektionsfraktion Leistungsfhigkeit Koronarangiographie Cardiologia 56 27 26 16 14 12 7 5 5 5 1 Radiologia 14 2 6 1 1

Como se pode ver, a presena dos compostos se deu de forma muito dspare, com presena de 100% no corpus de Cardiologia e somente 44% no de Radiologia. Chamou tambm ateno o fato de que compostos de frequncia alta (cf. Zilio, 2009) como Herzinsuffizienz [insuficincia cardaca] e Risikofaktoren [fatores de risco], no apareceram no corpus de Radiologia. Quando se observaram as associaes sintticas dos compostos, percebeu-se que somente Zeitpunkt [momento] apresentou um nmero mais alto de associaes parecidas nos dois corpora. As associaes eram zum Zeitpunkt der(des) [no momento da(do)] e zu(m) (Adjektiv) Zeitpunkt [em(no) (adjetivo) momento]. Porm, nas ocorrncias que no apresentavam essas associaes, enquanto Zeitpunkt, em Cardiologia, parecia apontar para um momento indeterminado, em Radiologia, alguns

142

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

contextos apontaram para um momento especfico em uma linha do tempo, ao ponto de o composto ser acompanhado por numerais. Entre os outros compostos, foi encontrada a associao Bestimmung der (Adjektiv) Ejektionsfraktion [clculo da frao de ejeo (adjetivo)] nos dois corpora e, nesse caso isolado, os contextos eram muito prximos. O ttulo do texto de Radiologia de onde provinha a associao esclareceu essa semelhana, pois se tratava de um artigo que abordava tomografia cardaca. No por acaso, foi tambm nesse artigo que se encontravam as nicas duas ocorrncias de Herzerkrankung [doena cardaca] e a nica ocorrncia de Koronarangiographie. Pode-se dizer que, se no houvesse no corpus de Radiologia um artigo que se ocupasse do corao, somente dois dos compostos estudados seriam comuns aos dois corpora: Zeitpunkt e Kontrollgruppe [grupo controle]. Podemos, assim, perceber que, em uma observao microestrutural, claro que se encontrar alguma mistura entre as subreas, porm, se consegue ver, atravs do lxico empregado, que esto postos dois tipos textuais diferentes. As observaes interlinguais de textos de Cardiologia mostraram resultados ainda mais interessantes. Novamente se observaram as listas de palavras. Primeiro as listas das 10 palavras mais frequentes (tabela 3). Tabela 3. As 10 palavras mais frequentes.
Posio na lista 1 2 3 4 5 6 7 8 9 10 Alemo Palavra Der Die Und Mit In Patienten Bei Eine Von Des Frequncia relativa (%) 3,27 2,93 2,33 1,5 1,45 1,41 1,4 1,15 0,96 0,75 Posio na lista 1 2 3 4 5 6 7 8 9 10 Portugus Frequncia Palavra relativa (%) 5,82 de 2,96 e 2,87 a 1,66 com 1,44 o 1,43 em 1,32 pacientes 1,18 da 1,12 do 1 os

Linguagens Especializadas em Corpora

143

Ao analisar o contraste das palavras mais recorrentes em Cardiologia, em alemo e portugus, observou-se que muitas palavras gramaticais equivalentes nas duas lnguas encontram-se em posies de frequncia semelhantes. Esse o caso de der, des, von, em alemo, e de, da, do, em portugus, artigos e preposies que indicam, em geral, uma presena grande de genitivo. Outros casos so os de mit e com; in, bei e em; und e e. Essa mesma proximidade no se percebeu, de forma to marcante, na comparao entre com a linguagem comum. Esse dado aponta para uma aproximao possivelmente causada pelo tipo textual, vinculado linguagem especializada em questo. Chama a ateno o fato de que o item lexical mais frequente das duas lnguas pacientes/Patienten, ambos com alta frequncia e em posies semelhantes na lista de palavras. Tambm interessante o fato de que, tanto em alemo quanto em portugus, o termo aparece no plural. Mas esse estudo no observou somente semelhanas. Ao se contrastarem os substantivos mais frequentes (tabela 4), diferenas comeam a surgir. Tabela 4. Os 10 substantivos mais frequentes.
Frequncia relativa (%) 1,41 0,29 0,21 0,19 0,19 0,18 0,17 0,12 0,11 0,10 Posio na lista 7 25 27 29 33 37 39 43 47 50

Posio na lista 6 34 42 47 49 52 53 75 86 90

Alemo Substantivo

Patienten Hypertonie Gruppe Daten Therapie Ergebnisse Jahre Transplantation Mitralinsuffizienz Herzen

Portugus Frequncia Substantivo relativa (%) 1,32 pacientes 0,36 tratamento 0,35 estudo 0,33 doena 0,28 grupo 0,26 stents 0,25 resultados 0,22 cirurgia 0,21 risco 0,20 grupos

No portugus, os substantivos ocupam posies de destaque na lista, mostrando uma frequncia muito mais alta do que no alemo. importante ressaltar tambm que, apesar de os textos que

144

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

compuseram o corpus terem sido selecionados em pares temticos, os substantivos em comum na lista so somente aqueles que ocorrem em vrios textos do corpus (Patienten - pacientes, Gruppe/Gruppen grupo, Therapie - tratamento, Ergebnisse - resultados). No caso dos outros substantivos da lista, o portugus e o alemo seguem princpios distintos. No alemo, por exemplo, Hypertonie [hipertenso] e Mitralinsuffizienz [insuficincia mitral] tm todas suas ocorrncias em apenas um artigo. Algo parecido ocorre com Transplantation [transplante]. J no portugus, stens o nico substantivo da lista que ocorre somente em um texto do corpus, enquanto a tendncia geral ocorrer em vrios artigos. A partir dessa observao, pde-se inferir que o vocabulrio geral da Cardiologia muito mais empregado no portugus, com repeties mais frequentes. De outro lado, em alemo, h uma preferncia por se empregar mais o vocabulrio especfico e por no se repetir muito o vocabulrio mais genrico. Seguindo esse tipo de observao, tambm se notou uma riqueza lexical maior no alemo, com um ndice de 19,65, enquanto no portugus, o ndice atingiu apenas 13,03. Isso indica que o portugus tende a exibir um vocabulrio mais restrito e mais repetitivo do que o alemo9. Observando o tamanho das sentenas, o portugus apresentou sentenas muito maiores, com uma mdia de 29,23 palavras cada. J o alemo teve, em mdia, 20,79 palavras por sentena. Esse um indcio de maior complexidade frasal dos textos em portugus em relao aos textos em alemo. Assim como na observao interlingual, foram observados tambm contextos de termos recorrentes em Cardiologia 10, nas duas lnguas. So eles: Herzinsuffizienz / insuficincia cardaca e Risikofaktoren / fatores de risco. A associao mais recorrente para o termo insuficincia cardaca foi o adjetivo congestiva (insuficincia
Esse dado, porm, no deve ser tomado como uma certeza, visto que o alemo uma lngua com casos morfolgicos, o que influencia no nmero de possibilidades de flexo de cada palavra, principalmente no caso dos adjetivos. Para confirmar esse indcio, seria preciso aplicar um lematizador ao corpus. 10 A recorrncia desses compostos em artigos cientficos de Cardiologia foi averiguada em Zilio (2009), em um corpus de mais de 2,8 milhes de palavras.
9

Linguagens Especializadas em Corpora

145

cardaca congestiva). J o termo Herzinsuffizienz , na maioria das ocorrncias, acompanhado pelo adjetivo schwer [grave] (schwere Herzinsuffizienz [insuficincia cardaca grave]). J com o termo Risikofaktoren, a associao mais recorrente foi o adjetivo unabhngig (unabhngige Risikofaktoren [fatores de risco independentes]). valido ressaltar que, alm da busca pelo termo no plural (Risikofaktoren), foi feita a busca pelo termo na forma singular (Risikofaktor). Ainda assim, a associao mais recorrente foi o adjetivo unabhngig e ambas as formas tiveram semelhante nmero de ocorrncias (nove no plural e sete no singular). Com o termo em portugus, por outro lado, no se obteve o mesmo resultado: fator de risco teve apenas 7 ocorrncias e fatores de risco, por outro lado, teve 27 ocorrncias. Alm dessa diferena em relao aos termos em alemo, no foram encontradas associaes recorrentes para os termos em portugus; cada ocorrncia encontrava-se em contextos distintos. Essas observaes permitiram mostrar ao tradutor iniciante que necessrio estar sempre atento ao traduzir textos de Cardiologia do alemo para o portugus, j h indicaes de que o comportamento vocabular seja bastante diferente.

4.2 Colocaes especializadas


Este segundo estudo foi desenvolvido em pesquisa de mestrado, por Zilio (2009) e apresentou uma srie de colocaes especializadas em contraste interlingustico alemo-portugus. O objetivo do estudo foi apresentar para tradutores iniciantes uma srie de associaes lxico-gramaticais que pudesse facilitar o trabalho de traduzir artigos de Cardiologia do alemo para o portugus. Para atingir tal objetivo, tratou-se, primeiramente, de compilar um corpus de tamanho razovel (cerca de 2,8 milhes de palavras), dividido em dois subcorpora: alemo e portugus. Posteriormente, definiu-se o que seria entendido como colocao especializada. Foi nesse passo em que a parceria entre a Terminologia Textual e a Lingustica de Corpus ficou mais bvia. Como no havia mais a predeterminao de que o objeto de estudo deveria ser sempre observado a partir de termos, utilizou-se a lista de palavras do subcorpus alemo e, a partir dela, foram

146

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

selecionados onze compostos nominais, procurando uma abrangncia grande nas ocorrncias. Dessa forma, foram selecionados desde os compostos nominais mais frequentes at aqueles com pouco mais de cem ocorrncias. A observao a partir dos compostos nominais se justificou pela potencial dificuldade que eles apresentam para a traduo (cf. Leipnitz, 2005). Tendo selecionado os compostos nominais selecionados (ver tabela 5), buscaram-se os verbos, substantivos e adjetivos deverbais que os acompanhavam. Para realizar essa tarefa, lanou-se mo da ferramenta Concord, do software Wordsmith Tools. Com essa ferramenta, foi possvel verificar cada contexto do corpus em que ocorriam os compostos nominais selecionados, alm de analisar suas presenas nas formas singular e plural. Tabela 5. Compostos nominais selecionados com as respectivas frequncias, averiguadas na lista de palavras do subcorpus alemo.
Herzinsuffizienz Risikofaktoren Zeitpunkt Herzerkrankung Kontrollgruppe Herztransplantation Ejektionsfraktion Koronarangiographie Sinusrhythmus Leistungsfhigkeit Herzkatheteruntersuchung 914 609 439 378 349 326 221 220 216 213 101

Faltava ento determinar o que seria considerado uma colocao especializada e o que seria reconhecido como ocorrncia comum. Para tal, utilizou-se um critrio de frequncia e distribuio bastante abrangente e um critrio morfolgico. Da seguinte forma: seriam trazidas para o contraste com o portugus todas as estruturas que apresentassem pelo menos 2 ocorrncias em, no mnimo, 2 textos diferentes; sendo que a frequncia dessas estruturas era avaliada atravs da forma lemtica. Por forma lemtica entendeu-se que

Linguagens Especializadas em Corpora

147

Durchfhrung [realizao] e durchfhren [realizar] pertenciam a um mesmo lema. Assim, uma ocorrncia de Durchfhrung [realizao] e outra de durchfhren [realizar] junto a um mesmo composto em textos diferentes j eram suficientes para levar as duas estruturas para um contraste com o portugus. Esse contraste tambm foi feito a partir da ferramenta Concord, j que, aps terem sido estabelecidos os equivalentes em portugus para os compostos (ver tabela 6), buscaram-se os contextos desses equivalentes e pde-se comparar as duas lnguas para o estabelecimento de equivalncias fraseolgicas. Um exemplo o seguinte: an Herzinsuffizienz leiden
Weltweit leiden mehr als 22 Mio. Menschen an einer Herzinsuffizienz.

vs. insuficincia cardaca acomete


A insuficincia cardaca uma sndrome clnica complexa, acometendo aproximadamente 4,7 milhes de pessoas nos Estados Unidos.

Tabela 6. Compostos nominais em alemo e seus equivalentes em portugus


Herzinsuffizienz Risikofaktoren Zeitpunkt Herzerkrankung Insuficincia cardaca Fatores de risco Momento Tempo Doena cardaca - Doena arterial coronariana - Doena isqumica do corao Grupo controle Transplante cardaco Frao de ejeo Angiografia coronariana Ritmo sinusal Capacidade funcional - Funo cardaca Tolerncia ao esforo Cateterismo cardaco

Kontrollgruppe Herztransplantation Ejektionsfraktion Koronarangiographie Sinusrhythmus Leistungsfhigkeit Herzkatheteruntersuchung

148

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Atravs desse estudo, foram encontrados 94 pares de colocaes especializadas e equivalentes, totalizando 190 estruturas fraseolgicas pareadas, contando com centenas de contextos observados. Esse trabalho foi muito satisfatrio, j que, alm de permitir a observao de equivalncias, tambm d acesso aos contextos de ocorrncia das expresses levantadas.

5. Consideraes finais
Neste captulo, procuramos mostrar, atravs de exemplos concretos extrados de trabalhos j realizados, como a Terminologia Textual e Lingustica de Corpus so reas que trabalham muito bem em parceria. Principalmente por serem reas de estudo interdisciplinares, elas se colocam muito bem disposio do linguista para interagir no s entre si, mas com muitas outras reas. Nos estudos que apresentamos, por exemplo, pudemos observar como ambas interagem com os Estudos de Gneros Textuais, com a Lingustica Contrastiva, com os Estudos Fraseolgicos, com os Estudos da Traduo etc. Tambm cremos ter ficado claro como os estudos no se do somente em um nvel mais superficial, mas possibilitam que se observe o comportamento lingustico em contexto, permitindo ao linguista olhar seus dados a fundo. preciso que se reconhea, porm, que tanto a Terminologia Textual quanto a Lingustica de Corpus ainda se apresentam em estgio de desenvolvimento, no tendo recebido grande ateno em nosso pas at o momento. Pode-se perceber, porm, pelos estudos j citados e por muitos outros estudos (Hoffmann, 1998b, 1998c; Finatto et alii, 2003; Finatto, 2004b; Azeredo, 2007; etc.), que essas reas contribuem muito e podem contribuir ainda mais para o desenvolvimento de nossa cincia lingustica. Existem naturalmente alguns questionamentos e posicionamentos que ainda se mantm sem soluo definitiva, como foi comentado neste artigo. Sendo um dos principais deles a deciso sobre a situao da Terminologia Textual: deve ela ser entendida como um tipo

Linguagens Especializadas em Corpora

149

de Terminologia ou talvez como uma rea que engloba a Terminologia (como uma Lingustica de Textos Especializados ou de Linguagens Especializadas)? Para esclarecer esses questionamentos, cremos que o crescimento dessas reas de estudo e a sua maior aceitao entre a comunidade de linguistas a melhor soluo. De forma que uma maior visibilidade dessas reas de estudo e uma discusso em nvel nacional deve ser o melhor caminho para o seu assentamento no quadro terico da Lingustica brasileira.

Referncias bibliogrficas
BERBER SARDINHA, T. (2004) Lingustica de Corpus. Barueri: Manole. BIBER, D.; CONRAD, S.; REPPEN, R. Corpus Linguistics: Investigating language structure and use. Cambridge: Cambridge University Press, 1998. CABR, M.T. (2001) La Terminologia. Representacin y comunicacin. Barcelona: IULA. CIAPUSCIO, G. E. (1994) Tipos textuales. Buenos Aires: Universidade de Buenos Aires. CIAPUSCIO, G. E. (2003) Textos especializados y terminologa. Barcelon: UPF/IULA. CONDAMINES, Anne. (2005) Linguistique de corpus et terminologie. In: http://w3.univLangages, 157, p. 36-47. Disponvel em: tlse2.fr:8880/erss/index.jsp?perso=acondami&subURL=Langagesdef.pdf. Acessado em 10/06/2008. FINATTO, M.J.B.; EICHLER, M.L.; DEL PINO, J.C. (2003) Sujeitos e agentes de poder e dever em textos sobre equilbrio qumico: aspectos lingstico-terminolgicos e aspectos conceituais da enunciao cientfica e o ensino-aprendizagem de Qumica. In: Organon, 32-33, vol.16, p.83-104. FINATTO, M.J.B. (2004a) Termos, textos e textos com termos: novos enfoques dos estudos terminolgicos de perspectiva lingustica. In: ISQUERDO, A.N.; KRIEGER,M.G. (Orgs.). As cincias do lxico: lexicologia, lexicografia, terminologia, volume II. Campo Grande: Ed. UFMS.

150

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

FINATTO, M.J.B. (2004b) Terminologia e Lingustica de Corpus: da Perspectiva Enunciativa aos Novos Enfoques do Texto Tcnico-cientfico. In: Letras de Hoje, Porto Alegre, v.39, n.4, dezembro, p.97-106. HOFFMANN, L. (1988a) Vom Fachwort zum Fachtext: Beitrage zur Angewandten Linguistik. Tbingen: Gunter Narr Verlag. HOFFMANN, L. (1988b) Grundbegriffe der Fachsprachenlinguistik. In: Germanistisches Jahrbuch fr Nordeuropa. 7. Folge. Deutsche Fachsprachen in Forschung und Lehre. Helsinki, Estocolmo: p. 9-16. HOFFMANN, L. (1998a) Syntaktische und morphologische Eigenschaften von Fachsprachen. In: HOFFMANN, L. et al. (Orgs.) Fachsprachen: ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Walter de Gruyter, p. 416-427. HOFFMANN, L. (1998b) Anwendungsmglichkeiten und bisherige Anwendung von statistischen Methoden in der Fachsprachenforschung. In: HOFFMANN, Lothar; KLVERKMPER, Hartwig; WIEGAND, Herbert Ernst (Orgs.). Fachsprachen. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Berlin, New York: Walter de Gruyter, p. 241-249. HOFFMANN, L. (1998c) Anwendungsmglichkeiten und bisherige Anwendung von linguistischen Methoden in der Fachsprachenforschung. In: HOFFMANN, Lothar; KLVERKMPER, Hartwig; WIEGAND, Herbert Ernst (Orgs.). Fachsprachen. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Berlin, New York: Walter de Gruyter, p. 241-249. KALVERKMPER, H. (1983) Textuelle Fachsprachen-Linguistik als Aufgabe. In: Zeitschrift fr Literaturwissenschaft und Linguistik, v. 51/52, n 13, p. 124-166. KRIEGER, M.G. (2008) Porque Lexicografia e Terminologia: relaes textuais? In: FINGER, I. & COLLISCHONN, G. (Orgs.) Anais do 8 Encontro do Crculo de Estudos Lingsticos do Sul - CELSUL, Porto Alegre, de 29 a 31 de outubro de 2008. Pelotas: EDUCAT. ISBN: 97885-7590-115-1. LEIPNITZ, L. (2005) Compostos nominais em lngua alem em medicina em traduo para o portugus. Porto Alegre: UFRGS PPGLetras Estudos da Linguagem. Dissertao de mestrado. Linha de pesquisa: Lexicografia e Terminologia: Relaes Textuais. Orientadora:

Linguagens Especializadas em Corpora

151

Maria Jos Bocorny Finatto. LEITCHIK, V.M. (2002) Elements of Terminological Text Theory. In: SHELOV, S.D.; LEITCHIK, V.M. (eds.) Russian Terminology Science (1992-2002). Viena: Termnet Publisher. Editado com a colaborao de H. Picht e C. Galinski. RAJAGOPALAN, K. (2007) A Lingustica de Corpus no tempo e no espao: viso reflexiva. In: GERBER, R.M.; VASILVSKI, V. Um percurso para pesquisas com base em corpus. Florianpolis: Editora da UFSC. SCHEEREN, F.; MIGOTTO, E. J.; ZILIO, L. (2008) Estudo Exploratrio sobre artigos de Cardiologia em Alemo e Portugus: Macroestruturas e usos dos termos Herzinsuffizienz/insuficincia cardaca. In: XX Salo de Iniciao Cientfica, 2008, Porto Alegre. CD - Resumos do XX Salo de Iniciao Cientfica. Porto Alegre: UFRGS. SINCLAIR, J.M. (1991) Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991. TEMMERMANN, R. (2000) Towards New Ways of Terminology Description. The sociocognitive-approach. Amsterdam, Philadelphia: John Benjamins Pub. Co. WSTER, E. (1974) Die Allgemeine Terminologielehre. Ein Grenzgebiet zwischen Sprachwissenschaft, Logik, Ontologie, Informatik und den Sachwissenschaften. In: Linguistics, v. 119, Janeiro de 1974, p. 61-106. ZILIO, L. (2009) Colocaes especializadas e Komposita: um estudo contrastivo alemo-portugus na rea de cardiologia. Porto Alegre: UFRGS. Dissertao de Mestrado. PPG-LETRAS/UFRGS. ZILIO, L.; SCHEEREN, F.; FINATTO, M.J.B. (2009) Artigos cientficos de Cardiologia: contraste de macro e microestruturas para caracterizao de tipo textual. In: SIGET, Simpsio Internacional de Estudos de Gneros Textuais, 5, 11 a 14 de agosto de 2009, Caxias do Sul, RS, Brasil. Anais do 5 Simpsio Internacional de Estudos de Gneros Textuais. Caxias do Sul: UCS. (no prelo)

PARA ALM DAS TERMINOLOGIAS: ESTUDOS DE CONVENCIONALIDADE EM LINGUAGENS CIENTFICAS Maria Jos Bocorny Finatto Aline Evers Cybele Margareth de Oliveira Alle
Resumo: Este captulo relata algumas exploraes sobre padres de convencionalidade em linguagens cientficas. So examinados conectores causais em corpora de Qumica e de Pediatria, com destaque para PORQUE e BECAUSE em artigos de revistas brasileiras e internacionais de Pediatria. A apresentao de dados ilustrativa e no h pretenso de rigor estatstico. As investigaes foram feitas luz dos enfoques da Lingustica de Corpus e de um tipo de estudo sobre linguagens e textos cientficos que no toma terminologias como elementos de partida. So apresentados os enfoques tericometodolgicos utilizados e situada a causalidade como um tpico de investigao. Em seguida, apresentado um quadro geral da explorao empreendida, na qual foram verificadas as seguintes tendncias: a) usos diferenciados de conectores por reas de conhecimento; b) BECAUSE como forma mais presente entre os conectores causais verificados em revistas internacionais, enquanto h pouco uso de PORQUE nas revistas brasileiras; c) a transferncia da variedade de conectores causais dos artigos brasileiros de Pediatria para suas verses em ingls parece gerar um padro de ingls distinto do ingls internacional. Por fim, o trabalho evidencia o bom potencial de um enfoque mais global para as linguagens especializadas articulado Lingustica de Corpus e valida o exame de conectores causais para o reconhecimento de especificidades dos gnero textuais das linguagens cientficas.

1. Introduo
Este trabalho apresenta dados obtidos em uma srie de pesquisas lingusticas exploratrias com corpora. O interesse das exploraes foi

Linguagens Especializadas em Corpora

153

identificar provveis padres preferenciais para expressar causa em textos cientficos brasileiros. Essas pesquisas integraram o Projeto Causalidade no texto de Qumica: coeso, terminologias e enunciao cientfica, desenvolvido com apoio do CNPq 1. Os materiais estudados pertencem a dois gneros textuais (cf. Swales, 1990): o primeiro gnero o texto didtico universitrio; o segundo o artigo cientfico publicado em revistas especializadas. Como corpora, utilizamos quatro grupos de textos: a) um conjunto de textos que correspondem a captulos completos de livros didticos de Qumica Geral, Fsica, Qumica e Pediatria largamente utilizados em universidades brasileiras; b) um conjunto de artigos de revistas brasileiras de Qumica e de Fsica produzidas com o aval de associaes nacionais de pesquisa; c) um conjunto de textos originais em portugus e suas respectivas verses para o ingls publicados em uma prestigiada revista bilngue brasileira de Pediatria, editada pela associao nacional dessa especialidade; d) um conjunto de textos originais em ingls publicados em duas revistas norte-americanas de Pediatria que tm estatuto internacional. Este texto, alm de dar a conhecer resultados da sua parte experimental, tambm tem o interesse evidenciar a validade de aproximar dois enfoques terico-metodolgicos, da Lingustica de Corpus e o da Lingustica das Linguagens Especializadas. Essa aproximao, conforme acreditamos, pode gerar subsdios interessantes para a qualificao do ensino de traduo em reas cientficas, tais como Qumica e Medicina/Pediatria.

2. Dos enfoques envolvidos


O primeiro enfoque que guiou nossas exploraes sobre conectores causais em textos cientficos tem um prestgio inegvel no cenrio brasileiro (Rajagopalan, 2007). Esse enfoque advm da Lingustica de Corpus (doravante LC).
Mediante Bolsa PQ, Produtividade, processo 301102/2006-6, vigncia at 28/02/2010.
1

154

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

A LC ser aqui caracterizada, muito resumidamente, em seus princpios tericos mais elementares e procedimentos de abordagem estatstica de usos, de combinatrias e de repetio de palavras em corpora. Nossas fontes de referncia so os trabalhos de Berber Sardinha (2004), precursor da LC no cenrio brasileiro, os de Stubbs (1996 e 2001) e os de Sinclair (1991). Voltaremos LC mais adiante, visto que o segundo enfoque a apresentar a Lingustica das Linguagens Especializadas necessita de uma contextualizao um pouco mais detida, dado que bem menos conhecido no Brasil.

2.1. Lingustica das Linguagens Especializadas


Essa perspectiva corresponde, para os fins deste trabalho, reunio de ideias e de propostas de estudo ou de composio de programas tericos identificadas genericamente pelos nomes de Terminologia Textual, Terminologia Textualista, Teoria Terminolgica do Texto, Lingustica das Linguagens Especializadas ou Lingustica do Texto Especializado. Esses estudos, cuja denominao heterognea, tm em comum o emprego de metodologias de investigao centradas na descrio macro e microestrutural de conjuntos de textos de modo extensivo e com apoio estatstico (Hoffmann, 2004 e outros anos; Kocoureck, 1991, Leitchik, 2004). Outro trao partilhado entre as suas diferentes tendncias a funo importante que tem a verificao de um modus dicendi tcnico-cientfico. Seus propsitos so descritivo-explicativos e compartilham tambm a opo por colocarem as terminologias em meio a todo um conjunto de fenmenos da comunicao tcnico-cientfica (Finatto, 2007(a), 2007(b) e 2008), sem que, no entanto, essas terminologias sejam os objetos centrais ou privilegiados das investigaes. De um modo geral, em meio a um ambiente textual sujeito s convenes dos gneros textuais implicados, torna-se central todo um conjunto de elementos sintticos, semnticos e pragmticos que constituem as prticas textuais tcnico-cientficas.

Linguagens Especializadas em Corpora

155

Esse enfoque no despreza as terminologias, vale sublinhar. Apenas no as toma como centro gravitacional, visto que o macroplano do texto assume tal estatuto. A investigao, assim, torna-se mais ampla, abordando-se os usos das linguagens tcnicas ou cientficas, tal como realizadas em textos, orais ou escritos, incluindo as re-elaboraes das linguagens de divulgao cientfica ou tecnolgica para leigos. Outra caracterstica da perspectiva ampliada da Lingustica das Linguagens Especializadas a relevncia atribuda articulao entre a significao da forma ou do modo de dizer do texto e o seu significado nocional. O texto visto como um todo de sentido e de comunicao, constitudo pelo contedo expresso e tambm pelo quadro geral das escolhas ou convenes do seu modo de dizer estabelecidos pela comunidades discursivas e interpretantes envolvidas. A Figura 1 abaixo visa representar essa articulao entre o que dito/posto no texto e as escolhas realizadas para a sua formulao. Desenha-se uma associao entre enunciados e enunciaes conforme j desenvolvido na perspectiva benvenistiana de uma Lingustica da Enunciao (BENVENISTE, 1989 e outros):

Figura 1: Concepo de texto no enfoque global da Lingustica das Linguagens Especializadas.

Nesse entendimento de texto, no se deixam de acolher, com igual importncia dada s terminologias, elementos tais como conjunes, enunciados definitrios, construes frasais, combinatrias de palavras mais ou menos fixas, elementos retricos e

156

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

argumentativos, fraseologismos, condies pragmticas da comunicao, condies do gnero textual, modalizaes e outros recursos. O foco de ateno principal recai sobre usos concretos e padres a partir deles verificveis. Essa concepo de trabalho no deve ser confundida com estudos terminolgicos stricto sensu. Entretanto, justamente por suas diferenas e complementaridades, cremos que h uma boa interface de enriquecimentos e de aprendizagens mtuos entre a Lingustica das Linguagens Especializadas e os estudos terminolgicos. Hoffmann (1988a), por exemplo, j cultivava a ideia de um enfoque global da linguagem cientfica ou tcnica quando apresentounos seu projeto de uma Lingustica de Linguagens Especializadas. Essa Lingustica Kalverkmper (1983, p. 125) j descrevia como uma teoria terminolgica com uma srie de problemticas adicionais 2 (grifo nosso). Desde o incio da dcada de 80, essa perspectiva de estudo das Linguagens Especializadas coloca-se como algo que deveria abranger mais do que o lxico, ainda que o componente lexical tenha sido considerado frequentemente como o Haupttrger der Fachsprachlichkeit [principal portador da especializao lingustica] (cf. Kalverkmper, 1983, p. 125). Sua ideia-base que essa especificidade no est somente no vocabulrio. Leitchik (2004) um outro autor que integra o grupo dos estudiosos de um enfoque mais global das linguagens especializadas, com uma trajetria de reflexo que tambm iniciou nos anos 80. Em uma coletnea de artigos de autores russos sobre Terminologia do perodo de 1992 a 2002, apresenta uma proposta de trabalho que denomina de Teoria Terminolgica do Texto [Terminological Text Theory], a qual j vinha desenvolvendo desde 1981 (cf. Leitchik, 2004, p. 373). No se afasta radicalmente do conceito de termo e de sua importncia para os estudos terminolgicos, porm, reconhece que o objeto de estudo dessa sua Teoria Terminolgica do Texto compreende vrios textos, nos quais termos esto contidos (Leitchik, 2004, p. 371).
2

No original: Terminologielehre mit einem zustzlichen Fcher von Problemstellungen.

Linguagens Especializadas em Corpora

157

Aponta tambm que a sua desejada Teoria se ocupa do conceito de texto propriamente dito e, dessa forma, tambm com os conceitos de outras informaes textuais (categorias, qualidades) necessrias: coeso, completude, separatividade, significado emotivo (direo comunicativa). Essa perspectiva parece afinar-se com a ideia de trabalho com corpora medida que reconhece o papel de vrios textos. Ale, desses dois autores, cumpre registrar a ideia original da Fachtextlinguistik 3 (cf. Kalverkmper, 1983). Esse termo, em alemo, conforme a nfase, poderia ser interpretado de duas maneiras: primeiro, temos uma Fach-Textlinguistik [Lingustica do Texto em Especialidades]. Essa lingustica buscaria responder o que uma especialidade, ocupando-se mais especificamente da pragmtica, pois a busca pela especialidade ou especialidades conduz s aes humanas 4 (Kalverkmper, 1983, p. 128). Na segunda possibilidade de entendimento do termo Fachtextlinguistik, temos uma Fachtext-Linguistik (Lingustica do Texto Especializado), entendida como uma Lingustica de gneros textuais e que se ocupa dos textos em funcionamento. Utilizando o conceito de gnero textual como base, como aponta Kalverkmper (1983, p. 145), a Lingustica do Texto Especializado poderia se apoiar tambm na Lingustica das variedades diassistemticas, que observa e analisa os diferentes nveis, registros e variedades como subsistemas do sistema lingustico 5.
Fachtextlinguistik, em alemo, se no tiver nenhum sinal grfico que aponte qual a diviso que se deve fazer na palavra, pode ser interpretada de duas formas. A primeira forma Fach-Textlinguistik, seria uma Lingustica Textual Especializada; j a segunda forma possvel, Fachtext-Linguistik, seria uma Lingustica do Texto Especializado. A diferena entre as duas formas mais aprofundada em Kalverkmper (1983). Neste estudo, ela abordada somente para apontar as diferenas mais bsicas. 4 No original: denn die Frage nach dem Fach oder den Fchern zielt auf das menschliche Handeln. 5 No original: die Fachtext-Linguistik knnte sich auch () an der Variettenlinguistik [orientieren], die verschiedenen Niveaus/Register/Varietten als Subsysteme des Sprachsystems beachtet und analysiert. Nota da traduo: a opo de traduo por Lingustica de variedades diassistemticas considerou a meno pelo autor s propostas de Eugnio Coseriu, um importante linguista que propunha que um sistema de
3

158

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Esse ltimo entendimento do autor que funda essa perspectiva, acreditamos, resume em boa medida um projeto epistemolgico comum. Ao mesmo tempo, pode nos oferecer um perfil de identidade do enfoque mais global sobre linguagens especializadas. esse projeto comum que identificamos aqui como Lingustica das Linguagens Especializadas. Vai alm do texto, pois abrange vrios textos e gneros textuais, e questiona-se sobre a conformao da linguagem empregada nas situaes de comunicao cientfica, tecnolgica e profissional. Dito isso, voltemos a tratar da LC.

2.2 Lingustica de Corpus


A LC pode ser definida no como uma nova Lingustica, mas como um novo caminho para a Lingustica (Berber Sardinha, 2004, p. 10). Mostra-se como uma metodologia e tambm como uma abordagem diferenciada dos estudos da linguagem que se distingue, fundamentalmente, dos estudos de herana gerativista. A LC marcada pela observao, o mais extensiva possvel, dos usos reais da lngua e pelo apoio de recursos informatizados aplicados a acervos textuais em formato digital criteriosamente organizados. Esses acervos so os corpora. Nesse enfoque, o importante reconhecer, nos corpora, a variedade extensiva dos desempenhos lingusticos com vistas depreenso a posteriori de padres. As fontes de dados devem permitir a identificao de padres e de especificidades dos usos da lngua em diferentes situaes, inclusive na macro-situao dos textos tcnico e cientficos. A lngua, sob a tica da LC, passa a ser entendida como um sistema probabilstico de combinatrias, de modo que uma dada
lngua composto por um continuum de vrios sistemas. Assim, o subsistema da linguagem da Economia em portugus brasileiro integra o sistema geral da lngua portuguesa. Mais tarde, esse tipo de estudo sobre variabilidades seria plenamente desenvolvido em trabalhos que se ocupam da Variao Lingustica, tais como os de W. Labov, autor que levou-nos a um alargamento da noo de competncia proposta por Chomsky ao verificar sistematicidades das variaes de lngua inglesa manifestadas por determinados grupos sociais, tidas at ento apenas como idiossincrticas.

Linguagens Especializadas em Corpora

159

palavra se define pela sua presena e pelos tipos de vinculao com as demais palavras dessa lngua ao longo de todo um continuum de usos. Assim, para as palavras, vale uma adaptao da mxima Diga-me com quem andas e te direi quem [o que] s. Os princpios mais bsicos da LC podem ser assim resumidos: Viso sociolingustica da comunicao; Prioridade dos dados empricos: no h distines ou condies especiais para qualquer palavra a priori, preciso que um corpus as demonstre; Viso probabilstica da linguagem; Configurao sistmico-funcional do significado no contexto. Dois dos principais pressupostos da LC, conforme depreendemos das ideias de Stubbs (1996, p. 46) e de Sinclair (1991, p. xviii), so que: a) um corpus no mera ferramenta de anlise, mas um importante conceito terico; b) a linguagem se mostra diferente quando examinada extensivamente. Feita essa brevssima caracterizao da LC, passamos agora a apresentar o tpico de estudos da causalidade em meio ao nosso tipo de investigao sobre textos cientficos. Tratou-se assim, de uma investigao que apostou e segue apostando na viabilidade de uma cooperao entre LC e o enfoque Lingustica das Linguagens Especializadas.

3. Causalidade
Nas linguagens cientficas, o reconhecimento do modo como as relaes de causa se estabelecem e se expressam fundamental, uma vez que os textos produzidos, tal como os textos de Qumica Geral ou os artigos de Pediatria de que trataremos a seguir, pretendem informar, atualizar, propagar e ampliar conhecimentos cientficos. Considerando os propsitos comunicativos dos textos cientficos em suas diferentes modalidades, cremos que encadeamentos claros, tal como os de coeso e coerncias textuais, por exemplo, so fatores importantes para que sejam compreendidas principalmente as causas e

160

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

os efeitos de procedimentos descritos, testados e validados. Portanto, a causalidade um tpico relevante para quem se procure descrever o funcionamento das linguagem cientficas. Em que pese sua importncia, a causalidade, como bem se sabe, tema vasto e complexo, podendo ser estudado sob inmeras perspectivas diferentes. No mbito dos estudos da linguagem, o tratamento da causalidade geralmente bastante marcado pela descrio de uma lgica proposicional associdada a construes lgico-semnticas. E h, tambm, estudos lingusticos que apontam que haveria uma causalidade do enunciado e outra da enunciao. Na perspectiva dos estudos da linguagem, como assinalam Neves, Souza e Domingos (1999, p. 493), o estudo das construes causais ocorrentes em uma lngua natural no se pode governar apenas pela verificao de esquemas lgicos estritos. Segundo as autoras, um estudo sobre modos de expressar causa ter que, necessariamente, abrigar a investigao do complexo de domnios envolvidos na produo dos enunciados causais. A concepo de causalidade que utilizamos em nossas exploraes de corpora assentou-se sobre as ideias de Neves (2001), autora que nos prope um continuum de funcionamentos causais para uma srie de conectores. Essa sua ideia, ampliamos tambm, posteriormente, para evrbos causais. Entre os conectores causais identificados pela autora, esto alguns cujo sentido cannico, literal ou mais prototpico, no de causa, tal como, por exemplo, PORTANTO ou ASSIM. Nessa direo de heterogeneidades de sentido, a autora chama ateno para o fato de que a noo de casualidade no corresponde a um sentido preciso e bem delimitado. Antes disso, trata-se de sentidos que podem englobar elementos tidos pelos estudos de tradio gramatical como elementos conclusivos, consecutivos, explicativos ou conformativos. Na perspectiva de uma funcionalista em contexto, Neves assume justamente a importncia da verificao contextual de funcionamentos causais (grifos nossos) para que se possam produzir descries do funcionamento da lngua portuguesa. Desse modo, um conector X ou um verbo Y no ou ser necessariamente causal: ele, antes disso, estaria em usos mais ou menos causais.

Linguagens Especializadas em Corpora

161

Entre todo um universo de encadeadores lgicos e textuais e de verbos que exprimem causa, nossa ateno recair aqui apenas sobre os conectores frasais e oracionais reconhecidos como potencialmente causais por Neves (2001). A opo por examinar esses elementos deu-se porque, em ocasio anterior, quando estudamos textos de Qumica (Finatto e Simioni, 2007; Finatto et al., 2006), verificamos que a causalidade se estabelecia, em nosso corpus, muito mais atravs do uso de conectores do que atravs de construes predicativas verbais. Naquela ocasio, guiados pela concepo de que funcionamentos causais deveriam mostrar-se em contextos de uso, examinamos, em cinco livros didticos de Qumica Geral em um corpus que totalizou 429.624 palavras (tokens) e apresentou 11.818 palavras diferentes (types) , a presena de 22 conectores que reconhecemos como potencialmente causais. Os conectores foram os seguintes: 1. PORQUE 2. J QUE 3. UMA VEZ QUE 4. DADO QUE 5. DESDE QUE 6. VISTO QUE 7. SENDO QUE 8. LOGO 9. ENTO 10. PORTANTO 11. ASSIM 12. POR ISSO 13. ENFIM 14. POR FIM 15. CONSEQUENTEMENTE 16. POIS 17. DEVIDO 18. POR CAUSA D* 19. DE MODO QUE 20. DE MANEIRA QUE 21. DE FORMA QUE 22. POR CONSEGUINTE

162

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Quisemos, assim, verificar quo recorrente seria a presena desses elementos e de que modo sentidos causais mais ou menos literais, dados a priori, funcionariam contextualmente no nosso corpus de Qumica. Para localizao dos contextos de cada elemento, utilizamos as ferramentas para anlise de corpora disponveis no site do prof. Tony Berber Sardinha da PUC-SP 6. A partir de uma primeira explorao, apenas quantitativa, percebemos que a frequncia especfica de alguns destacava-se naquela rea e naquele gnero textual didtico. Conclumos que as concentraes de alguns e o rareamento de outros, ao longo de diferentes textos que abordavam diferentes temas de Qumica Geral, poderiam ser fator indicativo da especificidade do gnero e da linguagem cientfica sob exame. Naquele quadro, ENFIM, por exemplo, no ocorria em nenhum texto do corpus. PORTANTO, de modo inverso, atravessava quase todos os textos com percentuais de uso aproximados em relao ao nmero de palavras de cada texto. Ento, para ampliar o contraponto com indcios que associavam temas dos textos, gnero textual e diferentes frequncias de conectores causais, recorremos a uma nova amostra de textos. A nova amostra foi composta por um manual didtico de Fsico-Qumica, artigos de peridicos de Qumica, das revistas Qumica Nova (v. 27, 2004) e Qumica Nova na Escola (n 19 e 20 de maio e novembro de 2004, respectivamente). E, para uma maior amplitude na observao, verificamos tambm a presena desses conectores de causalidade em textos de revistas de popularizao de temas de cincias, os quais tm, em tese, alto grau de didatismo, mas pertencem ao gnero jornalstico. Esse gnero foi representado por matrias sobre Qumica na revista Superinteressante (textos aleatoriamente selecionados, dos anos de 88 a 94). O corpus utilizado para contrastar os dados obtidos em Qumica Geral contabilizou um total de 609.997 tokens e 37.027 types. As expresses mais frequentemente utilizadas nos diferentes gneros textuais foram: ASSIM; PORTANTO; ENTO; POIS; PORQUE; DEVIDO E COMO.
6

http://www2.lael.pucsp.br/corpora/index.htm.

Linguagens Especializadas em Corpora

163

O Quadro 1, a seguir, apresenta os itens mais frequentes, em ordem de utilizao, tanto no corpus de estudo de Qumica Geral como nos textos dos corpora utilizados para contraste.
FONTES DE TEXTO CONECTORES MAIS PRESENTES (POR ORDEM DE USO) ENTO 0,1575% PORTANTO 0,1575% ASSIM 0,13% PORQUE 0,0975% ENTO 0,170% PORTANTO 0,152% ASSIM 0,126% COMO 0,098% DEVIDO 0,0583% POIS 0,0416% ASSIM 0,035% PORTANTO 0,0243% ASSIM 0,087% PORTANTO 0,041% POIS 0,038% DEVIDO 0,02% ASSIM 0,09% PORQUE 0,08% POIS 0,07% ENTO 0,06%

Manuais didticos de Qumica Geral

Manuais didticos de Fsico-Qumica

Artigos revista Qumica Nova

Artigos revista Qumica Nova na Escola

Artigos revista Superinteressante

Quadro 1: conectores mais presentes nos corpora de Qumica por tipo de texto. O percentual a relao, sem ponderao, entre o nmero de ocorrncias do conector e o nmero de palavras do corpus.

Para reavaliar essas tendncias, em novembro de 2008, extrapolamos o mbito da Qumica. Tomamos, do nosso grupo inicial de 22 conectores com provvel sentido de causa, os elementos DEVIDO, ASSIM, POIS, COMO, PORTANTO, LOGO (um item pouco utilizado na explorao anterior), PORQUE e ENTO. O objetivo, na nova busca, foi o de verificar se uma concentrao semelhantemente varivel se daria em outros corpora e se haveria alterao nas

164

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

preferncias e nos usos desses conectores em textos com grau maiores ou menores de didatismo. Foi nossa inteno tambm verificar tendncias com conectores cujo sentido causal tinha interface com um sentido conformativo e/ou conclusivo. Construmos, assim, um novo corpus, composto por cinco artigos de cada uma das seguintes revistas especializadas: Qumica Nova na Escola, 2004 (tokens 11.457, types 2.874); Qumica Nova, 2004 (tokens 19.994, types 2.111); Fsica na Escola, 2007 (tokens 19.060, types 3.448); Fsica Aplicada e Instrumentao, 2005 (tokens 18.010, types 2.967), e Jornal de Pediatria (JPED) nos volumes de 2003 (tokens 12.956, types 2.345). Nesse corpus foram includos cinco captulos (originalmente publicados como artigos) do manual didtico universitrio Pediatria: diagnstico e tratamento, 2005 (tokens 27.136, types 4.565). Foram considerados como textos de maior didatismo os textos das revistas Qumica e Fsica na Escola e os textos do manual didtico de Pediatria. Essa avaliao sobre grau de didatismo dos textos foi feita mediante leitura e a considerao de maior acessibilidade de entendimento para leitores no familiarizados com os temas tratados. Os leitores no familiarizados foram as trs autoras deste trabalho e mais uma bolsista, linguistas-tradutoras sem qualquer formao em Qumica, Fsica ou Cincias da Sade. Do conjunto dos textos com 25 artigos e cinco captulos de um livro, atravs das ferramentas para explorao de corpora disponveis no site www.ufrgs.br/textquim, chegamos a um total de 873 contextos para os conectores causais selecionados para exame. Quisemos, no entanto, no apenas mapear esses conectores e tratar quantitativamente a sua presena. Havia chegado, enfim, o momento do estudo qualitativo sobre o funcionamento do conector com sentido causal. Verificamos, atravs de uma leitura de todos os 873 contextos feita por quatro pessoas 7, que tnhamos, entre ns, vrias divergncias de percepo do sentido de causalidade. Tambm vimos que essas divergncias manifestavam-se mais em contextos de determinados conectores como os de PORTANTO, por exemplo. Buscamos, ento,
7

Alm das trs autoras deste trabalho, contamos com a participao da acadmica de Traduo Paula Marcolin.

Linguagens Especializadas em Corpora

165

verificar, munidas de critrios de julgamento objetivos, quais dos conectores listados pela ferramenta geradora de contextos estariam realmente sendo empregados com um sentido de causa. Vejamos abaixo dois contextos examinados: Importantes correlaes entre o universo macroscpico e o universo atmico, tais como a indestrutibilidade dos tomos ao longo de uma reao qumica, de um lado, e a lei da conservao da matria de Lavoisier, de outro, no so trazidas tona. Perde-se, assim, uma excelente oportunidade de discutir a prpria estrutura metodolgica da Qumica, transitando entre modelos, fatos e sua descrio (Fonte: revista Qumica Nova na Escola) As misturas foram agitadas por 24 h. Em seguida, filtraram-se as amostras em papel de filtro qualitativo, determinando-se ento a concentrao restante dos ons metlicos nas solues, por espectrofotometria de absoro atmica. As quantidades dos ons adsorvidos foram determinadas por diferena entre a quantidade adicionada inicialmente e a presente na soluo aps o tempo de agitao considerado. (Fonte: revista Qumica Nova)

3.1 Da verificao de usos com sentido causal


Para verificar o sentido de causalidade em contextos de ocorrncia, seguimos os procedimentos sugeridos por Neves (2000) e Lopes (2001). Esses procedimentos implicaram leitura e aplicao de testes. Um procedimento sugerido por Neves, que aqui chamamos de teste de topicalizao 8, consiste em modificar a ordem dos eventos da frase, trazendo a causa para o incio da sentena atravs do uso de uma estrutura que segue o seguinte padro: POR CAUSA DE (causa)... QUE (efeito) ou PORQUE (causa)... QUE (efeito). Esse procedimento um dos mecanismos que o enunciador utiliza quando quer enfatizar a causa, movendo-a, portanto, para o comeo da sentena.
Esse procedimento tambm conhecido como teste de clivagem, embora o que utilizamos na pesquisa no seja o processo de clivagem stricto sensu. A autora, ao mencionar a ordem nas construes causais, afirma que quando o enunciador coloca um PORQUE no incio da sentena o faz para focalizar a causalidade. Neves (2008, p. 808) chama esse procedimento, entre outros citados, de clivagem (Verbo Ser + Porque).
8

166

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Encontramos na bibliografia sobre o tema tambm um outro teste de verificao de sentido de causalidade baseado em procedimento de substituio. No trabalho de Freitas e Ramilo (2004) 9, os conectores sob avaliao so trocados por expresses que ajudem a salientar um sentido de causalidade, tais como POR CAUSA DISSO, POR ISSO, EM FUNO DISSO. Aplicamos esses dois tipos de procedimentos para a avaliao de sentido de casualidade. Para ser considerado aprovado o sentido causal do conector, o contexto deveria ser bem-sucedido simultaneamente nos dois testes, topicalizao e substituio. Mas, considerando que ramos quatro avaliadoras, estipulamos que a aprovao de uso com sentido causal deveria ser de pelo menos trs de ns. A partir desses dois testes, examinados os 873 contextos obtidos para os conectores DEVIDO, ASSIM, POIS, COMO, PORTANTO, LOGO, PORQUE e ENTO. Com a aplicao dos dois testes, chegamos ao nmero de 309 contextos em que os conectores estavam sendo usados com sentido causal. O que nos chamou ateno, entretanto, foi a grande massa formada por conectores que, a priori, possuam sentido de causa, mas que, aps passarem pelas leituras e pelos testes, geraram uma percepo de causalidade duvidosa. Essa dvida permanecia, sobretudo, nos casos de reprovao em um dos dois testes ou de desaprovao por duas das quatro examinadoras. Vejamos um dos casos duvidosos: Apesar do pequeno tamanho desta casustica, a consonncia desta distribuio com os resultados relatados por outros investigadores refora a urgncia de se tornar disponvel uma vacina que inclua o sorotipo cinco, para ser utilizada na populao geral, oferecendo assim uma proteo mais ampla. (Fonte: Jornal de Pediatria) Essa flutuao de percepo do sentido apontava talvez para a nossa incapacidade de julgamento e para o fato de nos sermos especialistas nas reas tratadas nos textos. Entretanto, verificamos
9

Nosso teste de substituio foi inspirado no trabalho de tipologizao de FREITAS e RAMILO (2005), autores que remetem a Lopes (2001). Freitas e Ramilo trataram do uso atual do conector PORTANTO e verificaram seus empregos causais entre outros.

Linguagens Especializadas em Corpora

167

particularidades enunciativas das reas estudadas, em que muitos dos conectores de causa pareciam ser utilizados como meros encadeadores ou mesmo com um sentido diferente do de causa, talvez particular daquele discurso especfico. O Grfico 1 ilustra o nmero de contextos possivelmente causais e os confirmados aps os testes.

Grfico 1: Conectores confirmados e prototpicos (prototpicos - antes do teste; confirmados - aps o teste).

Com esses dados em mos, pudemos verificar os conectores causais mais frequentes em cada uma das trs reas contrastadas (POIS em Fsica e Pediatria e DEVIDO em Qumica), obtendo uma espcie de padronizao da causalidade para cada uma delas. Surpreendeu-nos, tambm, o baixo uso do conector PORQUE, um conector comum, at banal, prototipicamente causal, mas com presena quase irrelevante no corpus sob exame tendo-se em vista apenas um nmero bruto de ocorrncias. Isso indicado na Tabela 1.

168

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Tabela 1: nmero bruto de ocorrncias por corpus. O nmero no foi ponderado em relao dimenso do corpus.

Consideramos, assim, ter encontrado um novo indcio de outra particularidade da construo textual. Diferentes reas do conhecimento apresentavam diferentes preferncias no uso desses conectores. Alm disso, o fato de o texto ser mais ou menos didtico parecia poder influenciar uma maior presena desses conectores. Isso que vemos nos grficos a seguir, que mostram a frequncia dos conectores estudados no corpus de maior didatismo e de menor didatismo. O percentual a razo direta entre o nmero de ocorrncias do conector e o nmero de tokens do corpus.

Linguagens Especializadas em Corpora

169

Grfico 2: QNE = Qumica Nova na Escola; FE = Fsica na Escola; MP = Pediatria: Diagnstico e Tratamento.

Grfico 3: QN = Qumica Nova; FAI = Fsica Aplicada e Instrumentao; JPED = Jornal de Pediatria.

170

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

4. Da observao exclusiva em Pediatria


Ao aplicar os testes de topicalizao na explorao anterior, enfrentamos muitas dificuldades na formulao das sentenas modificadas como tambm enfrentamos vrias dvidas ao compartilhar nossos julgamentos heterogneos da causalidade nos contextos lidos. Surgiram, ento, duas novas curiosidades: a) Como os elementos cujo sentido causal foi problemtico para nossa percepo seriam tratados em casos de traduo do portugus para o ingls? b) Contextos de verificao menos problemtica para ns teriam recebido solues de traduo em ingls da mesma avaliao? A partir dessas perguntas, centramos nossas observaes em contextos dos conectores nos materiais bilngues de que dispnhamos.

4.1 Causalidade em traduo do portugus para o ingls: o caso de BECAUSE em Pediatria


Para atender nossa curiosidade, aproveitamos um corpus manualmente alinhado (portugus-ingls) da revista bilngue Jornal de Pediatria composto por 283 artigos. O material foi generosamente cedido ao nosso grupo de pesquisa pelo tradutor R. J. Coulthard para fins de estudo. Coulthard j havia estudado esse material em seu trabalho de mestrado de 2005 (Coulthard, 2005). Em uma primeira fase, examinamos os conectores de apenas 10 artigos desse material do Jornal de Pediatria. So textos originalmente escritos em portugus e suas respectivas verses para o ingls oferecidas pela revista ao longo do ano de 2003. Foram considerados apenas os contextos em que os conectores causais j houvessem sido submetidos a testes de causalidade. Observamos itens com confirmao de sentido causal e aqueles em que houve alguma discrepncia de julgamento, mas que, ainda assim, tinham sido aprovados pelos testes efetuados. Nosso objetivo, nessa etapa, como j dissemos, foi apenas o de verificar se as escolhas tradutrias em ingls teriam mantido um sentido de causalidade mais ou menos preciso ao que percebemos nos textos originais.

Linguagens Especializadas em Corpora

171

Abaixo, na Ilustrao 1, vemos as quantificaes dos conectores e as opes tradutrias correspondentes a cada um. importante observar que um mesmo elemento em portugus (lnguafonte) pode receber vrios tipos de correspondentes em ingls (lnguaalvo). Em verde esto assinalados os elementos de sentido causal.

Ilustrao 1: conectores e opes/preferncias tradutrias.

Pudemos notar que os conectores SINCE, DUE TO e BECAUSE foram as formas preferidas nos textos na lngua-alvo. Chamaram-nos a ateno, no entanto, as escolhas que possuam um sentido de causalidade menor ou quase nulo em relao ao da forma em portugus, marcado, na Ilustrao 1, com cor branca. Em alguns contextos, encontramos uma elipse como traduo de um conector expresso na lngua-fonte. Enfrentando novamente dificuldade de percepo de um sentido de causalidade pelas opes presentes nos textos em ingls, visto que algumas nos pareciam desviantes do sentido de causalidade verificado na frase em portugus, outro questionamento surgiu:

172

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

c) Seriam essas escolhas em ingls diferentes do sentido do texto original condicionadas por alguma conveno de expresso internacional da rea de Pediatria? Realizamos, ento, uma nova comparao. Organizamos um novo corpus com 10 artigos da mesma revista, mas dessa vez apenas com textos publicados em 2007. Coletamos tambm 10 artigos originalmente escritos em ingls publicados na revista internacional Pediatrics: Official Journal of the American Academy Tomamos o cuidado de obter esses 10 artigos internacionais com temticas semelhantes as dos textos brasileiros. Isso naturalmente, rendeu-nos um bom trabalho prvio de preparao do corpus. O objetivo nessa nova etapa foi verificar se as escolhas tradutrias encontradas nas verses brasileiras para o ingls correspondiam ao padro de usos dos conectores causais em artigos de Pediatria originalmente escritos em lngua inglesa. Nessa observao, notamos que os conectores SINCE e DUE TO, escolhas recorrentes nas verses do portugus para o ingls, eram conectores causais de baixo uso ou quase nulo nos textos originalmente escritos em ingls. J o conector BECAUSE, que apresentou uma frequncia mdia baixa nas mesmas verses, mostrou-se extremamente recorrente nos contextos analisados, como podemos observar no Grfico 4.

Linguagens Especializadas em Corpora

173

Grfico 4: Frequncias dos conectores em verses para o ingls do Jornal de Pediatria em artigos originalmente escritos em ingls.

Surpresas com esse resultado e querendo confirmar o que os dados coletados nas verses e textos originalmente escritos em ingls nos apresentaram, nosso corpus de originais em ingls foi mais uma vez ampliado, bem como o corpus de verses do portugus para o ingls. Assim, analisamos mais 37 artigos originalmente escritos em ingls de duas revistas de prestgio internacional em Pediatria: Pediatrics: Official Journal of the American Academy (P. O. J. A. A) e The Journal of Pediatrics: Official Journal of the Association of Medical School Pediatric Department Chairs (J.P), e 37 artigos vertidos para o ingls do Jornal de Pediatria (JPEDL2). Dessa observao, tambm apenas com textos de 2007, extramos os seguintes resultados indicados a seguir na Ilustrao 2 e na Tabela 2.

174

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

IIlustrao 2: Conectores e revistas.

Tabela 2: Conectores nos originais em ingls e nas verses do portugus para o ingls.

Nessa ltima etapa do trabalho de explorao, verificamos que as verses para o ingls dos artigos brasileiros ratificaram alta frequncia dos conectores SINCE e DUE TO, em detrimento de BECAUSE. De modo inverso, nos artigos internacionais de Pediatria originalmente escritos em ingls, BECAUSE foi o conector mais recorrente, enquanto SINCE e DUE TO tiveram uma frequncia baixa.

Linguagens Especializadas em Corpora

175

Assim, pudemos inferir que o padro internacional, aqui representado pelo corpus composto por artigos de Pediatria originalmente escritos em ingls, exibia indcios de preferncia pelo uso do conector BECAUSE. Os artigos brasileiros vertidos para o ingls, por sua vez, no seguiam esse padro, demonstrando uma conveno de expresso de causalidade bastante diferente. Em sntese, os dados observados mostraram as seguintes tendncias: a) usos diferenciados de conectores por reas de conhecimento; b) BECAUSE como forma mais presente de conectores causais em revistas internacionais, enquanto nas revistas brasileiras h pouco uso de PORQUE; c) a variedade de formas de conectores causais dos textos brasileiros de Pediatria em portugus, quando transportada para suas verses em ingls, parece gerar um padro de ingls distinto do ingls internacional. Essa diversidade, ao que nos pareceu, estaria assentada em convenes para expressar causa que so variadas e pouco centradas no elemento PORQUE nos artigos de Pediatria brasileiros. Essas convenes foram transferidas tal qual para a verso em ingls. Houve, naturalmente, uma formulao diferente na lngua de chegada, mas as nuances de sentido e de um estilo mais rebuscado, verificadas no portugus pela escolha de conectores tais como, por exemplo, DEVIDO A em vez de PORQUE, foram mantidas no texto de chegada. A leitura do tradutor da revista e as suas opes de formulao mostram que ele provavelmente no tinha acesso a esse dado sobre uma conveno preferencial para expressar causa no mbito de revistas internacionais.

5. Concluses
Com os resultados obtidos nessas sucessivas exploraes, pudemos extrair indicativos importantes para dar prosseguimento aos nossos estudos, os quais podemos batizar, provisoriamente, de Estudos de Linguagens Especializadas baseados em Corpora. Esse

176

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

tipo de pesquisa, sucednea da antes citada Lingustica das Linguagens Especializadas, no despreza elementos da tessitura textual e abrange tambm as terminologias 10. Dados como os obtidos, que revelaram que h padres especficos para expressar causa em funo das diferentes reas do conhecimento e tambm em funo dos gneros textuais envolvidos, podem contribuir para que se reflita sobre uma nova dinmica, tambm baseada em corpora, para qualificar o ensino de traduo em reas especializadas como a Pediatria. Ao examinar a expresso de causalidade em textos cientficos em lngua portuguesa, foi possvel verificar que os usos dos conectores causais apresentam peculiaridades e particularidades em cada uma das reas de conhecimento estudadas. Ao que parece, existem preferncias das diferentes cincias por determinados conectores de causa, como tambm o grau de didatismo de um texto pode condicionar usos maiores ou menores de determinados elementos coesivos do tipo causal. Quando um padro de expressar causa entre revistas mdicas brasileiras que se publicam tambm em ingls diferente de um padro de causa em ingls internacional, torna-se importante trazer esse dado para as aulas de traduo mdica em favor de uma boa aceitao e do no estranhamento do texto por parte do seu pblico-alvo. Isso pode contribuir, conforme Tagnin (2003), para que o processo decisrio da traduo gere um texto capaz de harmonizar-se com as convenes preferidas pela comunidade discursiva internacional. Os dados obtidos nas nossas sucessivas exploraes, no seu conjunto e tambm nas perguntas renovadas a cada etapa, so enriquecedores porque revelam uma srie de inter-relaes de indcios. A principal validade do que foi feito reside na mobilizao gerada para novas aventuras de pesquisa. Com os devidos aprofundamentos e rigor estatstico ou mesmo que apenas de modo exploratrio, restaria examinar, nos mesmos e em novos corpora, por exemplo, os contextos
Para um exemplo desse tipo de trabalho dedicado temtica das terminologias em Pediatria, sugerimos consultar Silva e Feix (2008). Apresentao disponvel em www.ufrgs.br/textquim, acesso via Biblioteca Virtual.
10

Linguagens Especializadas em Corpora

177

de apagamento de conectores causais no texto de chegada em ingls. Duas novas perguntas poderiam ser formuladas: Nos contextos com elipse, h ainda um sentido de causa? Havendo o sentido causal, que outros recursos teriam sido utilizados pelo tradutor para que esse sentido fosse preservado? Trabalhos a considerar nesse tpico, por exemplo, seriam os de Gagnon e Singer (1999) sobre a deteco de inconsistncias causais, alm de se avaliar o rendimento das indicaes de Hoffmann (1998a) sobre procedimentos estatsticos da Lingustica da Linguagens Especializadas. A nova curiosidade seria a de saber se o sentido de causalidade, em tese desaparecido na lngua de chegada, teria sido mantido por algum outro elemento ou recurso na frase e se tal apagamento seria mais comum em determinados gneros textuais. Seria tambm vlido observar como repercute esse tipo de procedimento de apagamento sobre a compreenso de leitura. Para o ensino de traduo, acreditamos que estudos desse tipo so especialmente teis para alertar sobre particularidades dos textos cientficos. Particularidades que podem no ser to evidentes, e que s sero percebidas por meio de uma observao extensiva dos quadros de usos das lnguas em seus gneros textuais. Elementos lingusticos textuais comuns como conectores, to menos marcados em relao aos termos tcnicos, podem ser, e usualmente so, subestimados pelos tradutores que no tm ainda uma experincia grande no domnio cientfico em que atuam. A considerao desses elementos de conexo frasal estar abrigada em enfoques descritivos que, tal como a LC e o enfoque estendido das Linguagens Especializadas aqui apresentado, considerem a priori tudo importante nos textos-corpora. A extensa vivncia do tradutor experiente ou sua condio de expertise equivaleria a j ter podido conhecer grandes corpora, acumulando um conhecimento igualmente extensivo sobre as convenes das linguagens e das culturas de escrita com que lida. Mas, sem um acesso prvio e real, direto ou indireto, a esses corpora especialmente reunidos, o tradutor somente teria tal sabedoria a partir de um ou mais textos, conhecidos aos poucos e a cada dia, ao longo dos vrios anos de sua prtica diria.

178

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Para alm de um aproveitamento mais imediato do que buscamos exemplificar com as exploraes relatadas, elas tm, sem dvida, uma boa capacidade para provocar inmeras novas curiosidades de pesquisa. Assim, como j afirmou Santos (2007), embora os corpora no permitam responder a todos os problemas, so uma fonte de ideias e de hipteses incansvel e abundante. A reunio da nossa abordagem mais ampla sobre linguagens cientficas, a que denominamos aqui Estudos de Linguagens Especializadas baseados em Corpora, com a LC produz tambm a crena prvia e fundamental de que as respostas para quaisquer perguntas colocadas sobre a linguagem cientficas em uso podem estar nos prprios corpora. Encontrar as respostas e relacionar a elas novas indagaes depender da nossa capacidade de escolher os melhores acervos de dados e de saber navegar em meio aos tantos mares de lngua 11 que os corpora nos oferecem.

Agradecimentos
Este trabalho foi desenvolvido com apoio do CNPq, Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico do Brasil.

Referncias Dos corpora


FERREIRA, Jos Paulo (Org.). 2005. Pediatria: diagnstico e tratamento. Artmed. JORNAL DE PEDIATRIA (JPed). 2003. www.jped.com.br. Acesso em julho de 2008. Disponvel em:

PEDIATRICS: Official Journal of the American Academy of Pediatrics. 2007/2008. Disponvel em: http://pediatrics.aappublications.org/. Acesso em julho 2008. REVISTA FSICA NA ESCOLA. 2007. SBF. www.sbfisica.org.br. Acesso em junho de 2008.
11

Disponvel

em:

Plagiamos aqui uma bela figura de linguagem de autoria de Diana Santos (Santos, 2007).

Linguagens Especializadas em Corpora

179

REVISTA DE FSICA APLICADA E INSTRUMENTAO. 2003/2005. Disponvel em: www.sbfisica.org.br. Acesso em julho de 2008. REVISTA QUMICA NOVA. 2004. FAPESP. Disponvel www.quimicanova.sbq.org.br. Acesso em julho de 2008. em:

REVISTA QUMICA NOVA NA ESCOLA. 2004. FAPESP. Disponvel em: www.quimicanova.sbq.org.br. Acesso em julho de 2008. THE JOURNAL OF PEDIATRICS: Official Journal of the Association of Medical School pediatric department chairs. 2007/2008. Disponvel em: www.amspdc.org. Acesso em julho de 2008.

Das obras e artigos citados


ALLE, Cybele M. O. ; Evers, Aline. 2008 Leituras da causalidade na traduo em Pediatria: elementos de conexo frasal. XX Salo de Iniciao Cientfica. UFRGS. ALMEIDA, G.M.B.; Alusio, S.M.; Teline, M.F. Extrao manual e automtica de terminologia: comparando abordagens e critrios . In: 1o. Workshop em Tecnologia da Informao e da Linguagem Humana, 2003, So Carlos. Anais do TIL'2003. CABR, Mara Teresa. 2001. La Terminologia. Representacin y comunicacin. IULA. ISBN: 978-84-9674259-8. CONDAMINES, Anne. 2005. Linguistique de corpus et terminologie. In: Langages, 157, p. 36-47. Disponvel em: http://w3.univtlse2.fr:8880/erss/index.jsp?perso=acondami&subURL=Langagesdef.pdf. Acesso em junho de 2008. EVERS, Aline ; Alle, C. M. O. ; Marcolin, Paula . Causalidade expressa via conectores em Qumica, Fsica e Pediatria: um estudo exploratrio. In: XX Salo de Iniciao Cientfica, 2008. UFRGS. FINATTO, Maria Jos Bocorny. 2004. Termos, textos e textos com termos: novos enfoques dos estudos terminolgicos de perspectiva lingustica. In: Isquerdo, Aparecida Negri; Maria da Graa Krieger (Orgs.). As cincias do lxico: lexicologia, lexicografia, terminologia, volume II. Ed. UFMS. ISBN: 85-7613-034-3. FINATTO, Maria Jos Bocorny; Jos Cludio Del Pino; Rafaela Guimares Barbosa e Estela Rubia Brugalli Corbellini. 2006. O vocabulrio alm da Terminologia: expresses de causalidade em textos de Qumica. In: MATRAGA. Revista do Programa de Ps-

180

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Graduao em Letras/ UERJ. Ano 13, n19. Editora Caets. ISBN: 1414-7165. FINATTO, Maria Jos Bocorny; Siane Simioni. 2007. A causalidade no texto de Qumica: efeitos da traduo e estrutura coesiva. In: Calidoscpio: Revista de Lingustica Aplicada vol. 05. Unisinos. ISBN: 16798740. FINATTO, Maria Jos Bocorny. 2007(a). Explorao terminolgica com apoio informatizado: perspectivas, desafios e limites. In: Isquerdo, Aparecida Negri; Maria da Graa Krieger (Orgs.). As cincias do lxico: lexicologia, lexicografia, terminologia, volume III. Ed. UFMS. ISBN: 97885-7613-102-1. FINATTO, Maria Jos Bocorny. 2007(b). Explorao terminolgica com apoio informatizado: dilogos entre terminologia e lingustica de corpus. In: Merc Lorente; Rosa Estop; Judit Freixa; Jaume Mart ; Carles Teb. (Org.). Estudis de lingustica i de lingustica aplicada en honor de M. Teresa Cabr Castellv. Institut Universitari de Lingustica Aplicada de la Universitat Pompeu Fabra, v. 2, p. 221-230. ISBN: 978-84-967. GAGNON, Nathalie e Murray Singer. 1999. Detecting causal inconsistencies in scientific text. In: Susan R. Goldman; Arthur C. Graesser e Paul van den Broek (Eds.). Narrative Comprehension, Causality and Coherence: Essays in Honor of Tom Trabasso. Mahwah. Lawrence Erlbaum Associates. p. 179. ISBN: 0-8058-3358-7. GAUDIN, Franois. 1993. Pour une socioterminologie. Des problmess semantiques aux pratiques institutionnelles. Publications de lUniversit de Rouen. ISBN: 2801113190. HOFFMANN, Lothar. 1988a. Vom Fachwort zum Fachtext: Beitrge zur Angewandten Linguistik. Gunter Narr Verlag. ISBN: 978-3-87808-699-4. HOFFMANN, Lothar. 1988b. Grundbegriffe der Fachsprachenlinguistik. In: Germanistisches Jahrbuch fr Nordeuropa. 7. Folge. Deutsche Fachsprachen in Forschung und Lehre. Helsinki, Estocolmo. HOFFMANN, Lothar. 1998. Syntaktische und morphologische Eigenschaften von Fachsprachen. In: Lothar Hoffmann et al. (Orgs.) Fachsprachen: ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Walter de Gruyter. HOFFMANN, Lothar. 2004. Fachsprache / Language for Special Purposes. In: Ammon, Ulrich et al. (Orgs.) Sociolinguistics: an international handbook of the science of language and society /

Linguagens Especializadas em Corpora

181

Soziolinguistik: ein internationals Handbuch zur Wissenschaft von Sprache und Gesellschaft. Walter de Gruyter, vol. 1, 2 ed. revisada e ampliada, edio especial. ISBN-13: 978-3110158847. HOFFMANN, Lothar. 2004. Conceitos bsicos da lingustica das linguagens especializadas. Traduzido por Maria Jos Bocorny Finatto. In: Cadernos de Traduo, n.17 out./dez., UFRGS, p. 79-90. ISBN: 03597210. KALVERKMPER, Hartwig. 1983. Textuelle Fachsprachen-Linguistik als Aufgabe. In: Zeitschrift fr Literaturwissenschaft und Linguistik, v. 51/52, n 13, p. 124-166. ISBN: 0049-8653. KOCOUREK, Rostilav. 1991. Textes et Termes. In: Meta, vol. 36, n.1, mars, Numro Spcial. La Terminologie dans le monde: orientations et recherches, p.71-76. KRIEGER, Maria da Graa. 2008. Por que Lexicografia e Terminologia: relaes textuais? In: Finger, Ingrid & Gisela Collischonn (Orgs.). Anais do 8 Encontro do Crculo de Estudos Lingsticos do Sul - CELSUL, Porto Alegre, de 29 a 31 de outubro de 2008. Pelotas: EDUCAT. ISBN: 978-85-7590-115-1. LEITCHIK, Vladimir M. 2002. Elements Of Terminological Text Theory. In: Shelov, S.D.; Leitchik, V.M. (eds.) Russian Terminology Science (1992-2002). (col. of H. Picht e C. Galinski). Termnet Publisher. ISBN 389913-409-5. LOPES, Ana Cristina Macrio et al. 2001. As construes com portanto no PE e no PB. In: Scripta, volume 5, nmero 9. PUC Minas. NEVES, Maria Helena de M.. 2000. Gramtica de usos do Portugus. Editora UNESP. ISBN: 8571392889) NEVES, Maria Helena de M.. 1999. Gramtica do Portugus falado. Volume VI: Novos estudos. Humanitas FFLCH/USP. NEVES, Maria Helena de M.; Souza, E.M.; Domingos, E. As construes causais. In: Neves, Maria H. M. Gramtica do portugus falado. Volume II: Novos estudos. So Paulo: Humanitas FFLCH/USP, 1999.p. 49-497. ISBN:85-8607-45-09. RAJAGOPALAN, Kanavillil. 2007. Panorama da Lingustica de Corpus (LC) In : Gerber, Regina Mrcia; Vera Vasilvski (Orgs.). Um percurso para pesquisas em base em corpus. Editora da UFSC. ISBN: 9788532-80-409-9.

182

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

ROLIM, Aline Marques. 2000. A reciclagem de resduos plsticos psconsumo em oito empresas do Rio Grande do Sul. Dissertao (Mestrado em Administrao) - Universidade Federal do Rio Grande do Sul, Orientador: Luis Felipe Machado do Nascimento. SAGER, Juan Carlos. 2007. La evolucin de los lenguajes de especialidad y la terminologa. In: Estudis de lingustica i de lingustica aplicada en honor de Mara Teresa Cabr Castellv. Vol. I - De mestres. IULA/UPF, p. 105-122. ISBN: 978-84-96742-08-6. SANTOS, Diana. 2007. Breves exploraes num mar de lngua, Ilha do Desterro 52, 1. UFSC. ISBN: 0101-4846. Sardinha, Tony Berber. 2004. Lingustica de Corpus. Manole. ISBN: 852-0416-764. SILVA, Maria Cristina Alencar; Gustavo Azambuja Feix. 2008. Reconhecimento inicial de usos do termo prevalncia em Pediatria: subsdio para um catlogo de expresses recorrentes na rea. XX Salo de Iniciao Cientfica. UFRGS. Sinclair, John M.. 1991. Corpus, Concordance, Collocation. Oxford University Press. ISBN: 978-0194-3-7144-5. STUBBS, Michael. 1996. Text and corpus analysis: computer-assisted studies of language and culture. Blackwell. 227p. (Language & Society series, v.23). ISBN: 978-0-631-19512-2. STUBBS, Michael.. 2001. Words and phrases: Corpus studies of lexical semantics. Blackwell. ISBN: 978-0-631-20832-7. SWALES, John M. 1990. Genre analysis: English in academic and research settings. Cambridge University Press. ISBN: 978-05-2133-813-4. TEMMERMANN, Rita. 2000. Towards New Ways of Terminology Description. The sociocognitive-approach. John Benjamins Pub. Co. ISBN: 978-15-5619-772-7.

PROCESSAMENTO DE LINGUAGEM NATURAL E O TRATAMENTO COMPUTACIONAL DE LINGUAGENS CIENTFICAS. Renata Vieira Lucelene Lopes FACIN-PUCRS
Resumo: Desde o surgimento das tcnicas de Processamento de Linguagem Natural - PLN, muitos avanos foram obtidos, mas a compreenso plena de linguagem natural por mtodos computacionais est ainda longe de ser resolvida. Apesar disso, o tratamento computacional da lngua e bases textuais um campo muito promissor. Em particular, os usurios das linguagens especficas de domnio, como as linguagens cientficas, podem se beneficiar de PLN, como por exemplo, na busca por informao em colees de documentos. Este captulo apresenta a rea de PLN, fornecendo um breve histrico, objetivos, mtodos e tcnicas computacionais e as suas possveis aplicaes, que incluem, por exemplo, a traduo automtica, a categorizao de textos, o processamento de discurso e a web semntica, que pode ser considerada como o foco atual da rea. Com o desafio da web semntica surge a necessidade de representar formalmente o conhecimento de domnios especficos atravs de ontologias. Dessa forma, apresenta-se tambm uma definio sobre ontologias e exemplos para facilitar a compreenso do leitor. Percebe-se atravs da leitura, que a construo automtica de ontologias a partir do conhecimento representado em textos, no uma tarefa simples. Este processo, denominado Aprendizagem de Ontologias, composto de cinco etapas, sendo que a primeira, denominada Extrao de Termos, abordada em maior detalhe neste captulo. Nesse contexto, so apresentadas abordagens lingustica, estatstica e hbrida para a extrao de termos de bases textuais (corpus). Atravs de trabalhos relacionados, percebe-se que a extrao de termos a partir de corpora em linguagem cientfica bastante relevante. Logo, o tratamento

184

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

computacional de textos cientficos torna-se vivel por tratar-se de uma linguagem objetiva que segue padres lingusticos com a finalidade da circulao do saber. Evidentemente, esse um tpico de pesquisa em aberto e particularmente grande so as expectativas quando se trata de trabalhos sobre a lngua portuguesa. Por esta razo, este captulo no esgota o tema. No entanto, o panorama histrico apresentado e a contextualizao dos problemas a serem atacados servem para delinear o campo onde os avanos cientficos e tecnolgicos devem ocorrer nos prximos anos. Desta forma, espera-se com este captulo motivar o leitor a contribuir nos esforos de pesquisa de PLN nas reas de manipulao de textos cientficos, extrao de termos a partir de corpora e, consequentemente, aprendizagem de ontologias.

Introduo
Processamento de Linguagem Natural (PLN) uma rea de Cincia da Computao que estuda o desenvolvimento de programas de computador que analisam, reconhecem e/ou geram textos em linguagens humanas, ou linguagens naturais. O PLN no uma tarefa trivial devido rica ambiguidade da linguagem natural. Essa ambiguidade torna o PLN diferente do processamento das linguagens de programao de computador, as quais so formalmente definidas evitando, justamente, a ambiguidade. Segundo (Liddy, 2003), alguns objetivos usuais em PLN so (a) recuperao de informao a partir de textos, (b) traduo automtica, (c) interpretao de textos e (d) realizao de inferncias a partir de textos. No entanto, diversos esforos atuais nesta rea congregam vrios destes objetivos, como , por exemplo, o caso de construo de ontologias a partir de textos (Cimiano, 2006). Em (Lopes et alli, 2009a) o trabalho reporta experimentos nessa rea, onde necessrio recuperar informao (a) e fazer inferncias (b). Outro exemplo (Papineni et alli, 2002), onde tcnicas de interpretao de texto (a) e recuperao de informaes (b) para qualificar o processo de traduo automtica so utilizadas. Vrios mtodos ou tcnicas computacionais podem ser usados para analisar e interpretar a linguagem natural. Existe uma clara

Linguagens Especializadas em Corpora

185

distino, por exemplo, entre as tcnicas empregadas na linguagem falada e na linguagem escrita, mas tambm alm destas divises possvel ver diferenas claras entre as tcnicas necessrias para diferentes tipos de aplicao, e que podem envolver diferentes tipos de textos, como por exemplo, textos cientficos, jornalsticos, literrios, etc. Neste sentido, a grande maioria das aplicaes voltada para um tipo especfico de linguagem. Um dos sistemas pioneiros da rea, o Eliza (Weizenbaum, 1966), simula o dilogo do usurio como se ele fosse o paciente de um psiclogo virtual. Neste programa, que data de 1966, as tcnicas de PLN so bastante simplistas, mas servem para ilustrar uma das primeiras aplicaes que, ainda hoje, bastante popular nas aplicaes do tipo chatbot. De um ponto de vista lingustico, o foco das pesquisas em PLN pode estar em um de cinco nveis de anlise: (a) fontico ou fonolgico, (b) morfolgico, (c) sinttico, (d) semntico ou (e) pragmtico. Todos esses nveis possuem suas caractersticas prprias e suas dificuldades associadas, mas cada aplicao de PLN pode ter a preocupao mais voltada para um subconjunto desses nveis. Por exemplo, aplicaes sobre textos cientficos usualmente no tm preocupao com uma anlise fonolgica (a), por outro lado, aplicaes que faam uma interface com reconhecimento de voz focam esse nvel de anlise. Associado ao tratamento de linguagens cientficas pode-se destacar a relevncia das atividades de reconhecimento de entidades nomeadas, identificao de termos, extrao de informao, entre outras. Todas as atividades complexas podem combinar anlise morfossinttica e semntica, que podem ou no estar associadas a recursos lingusticos externos, como tesauros por exemplo. De um ponto de vista prtico, muitas aplicaes de PLN escolhem se dedicar a apenas alguns nveis para reduzir a complexidade de tratamento.

1. Histrico da rea de Processamento de Linguagem Natural PLN


Historicamente, a rea de PLN comeou com tentativas de traduo automtica na segunda metade da dcada de 1940 (Weaver, 1949). Esses trabalhos iniciais estavam relacionados com esforos

186

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

prvios de quebra de cdigos durante a Segunda Guerra Mundial. De um ponto de vista terico, esses trabalhos inicias em traduo automtica estavam baseados na criptografia e teoria da informao (Shannon, 1949). Em 1957 Chomsky desenvolveu trabalhos relevantes sobre o tema. Um trabalho particularmente relevante desta poca o livro Syntactic Structures (Chomsky, 1957) que introduziu a gramtica gerativa, a partir da ficou mais clara como a rea de lingustica poderia auxiliar a rea de traduo automtica. Nessa poca houve tambm a incluso de outras aplicaes de PLN, especialmente a do reconhecimento da fala (speech recognition). Nesta rea houve a primeira grande divergncia que de certa forma permanece at hoje, pois parte da comunidade optou pelo uso de lingustica terica e parte optou por mtodos estatsticos. Infelizmente, cada uma destas partes rechaava os mtodos da outra parte prejudicando a integrao destas duas abordagens. Esse perodo marca tambm o advento da Teoria Sinttica da Linguagem (Chomsky, 1965) e dos Algoritmos de Parsing (Aho e Ullman, 1972). Estes avanos foram muito importantes para a rea, ainda que na poca estes avanos tenham sido recebidos com um entusiasmo excessivo de que em poucos anos tradutores automticos perfeitos estariam disponveis. Esta expectativa se mostrou indevida tanto pelos conhecimentos lingusticos e computacionais da poca, quanto por uma impossibilidade terica da tarefa de traduo automtica perfeita (Bar-Hillel, 1960). Na verdade, consequncia disto ou no, em 1966 o comit assessor para processamento automtico da lngua (ALPAC) da academia americana de cincia recomendou que esta rea no recebesse mais financiamento governamental, pois a traduo automtica estava muito aqum dos conhecimentos cientficos atuais. Em contraste com esta deciso, vrios avanos tericos e prticos foram feitos nos anos seguintes. Entre eles pode ser citado o trabalho terico de Chomsky que introduziu o modelo computacional de competncia lingustica (Chomsky, 1965) que resultou nas gramticas gerativas transformacionais. Diversos trabalhos subsequentes tentaram aproximar estes conceitos de modelos computacionalmente tratveis.

Linguagens Especializadas em Corpora

187

A partir desse perodo, houve uma multiplicao dos estudos sobre PLN com o estabelecimento de diversas subreas que vem sendo pesquisadas at hoje. Estas reas se dedicam a assuntos to variados quanto categorizao de textos e extrao de informaes, passando pelos tradicionais temas de traduo automtica e sistemas de dilogo. Os trabalhos desenvolvidos neste perodo podem, segundo diversos autores (Jurafsky e Martin, 2009), ser agrupados em quatro grupos segundo os paradigmas utilizados: os mtodos estocsticos, os mtodos baseados em lgica, os mtodos de entendimento de linguagem natural, e os mtodos de modelagem de discurso. Os trabalhos do grupo de mtodos estocsticos so baseados em abordagens estatsticas e frequentemente utilizam formalismos com os modelos ocultos de Markov (HMM Hidden Markov Models). Estes mtodos esto na base de diversos trabalhos de reconhecimento e sntese de fala (Rabiner e Juang, 1986). Estes trabalhos esto na origem dos atuais trabalhos em que mtodos estatsticos so empregados para diversas aplicaes de PLN. Os trabalhos baseados em lgica comearam com Q-systems e gramticas metamrficas (Colmeraeur, 1970 e 1975) que foram os precursores da linguagem Prolog (Colmerauer, 1996) e das gramticas denitivas de clusula (Pereira e Warren, 1980). Desta mesma poca datam tambm as iniciativas de gramticas funcionais na sua verso inicial (Kay e McDaniel 1979) e na verso lxica (Bresnan e Kaplan, 1982) que deixaram clara a importncia da unificao da estrutura das caractersticas. Os trabalhos do grupo baseado em entendimento da linguagem natural continuaram na vertente de entendimento do discurso. De um ponto de vista terico, so tpicos deste grupo os trabalhos sobre Gramticas de Caso (Fillmore, 1968), Redes Semnticas (Quillian, 1968), Teoria de Dependncia Conceitual (Schank, 1972), Redes de Transio Aumentada (Woods, 1970) e Semntica de Preferncia (Wilks, 1975). De um ponto de vista prtico, este perodo viu o aparecimento de diversos programas que faziam uso de PLN. Este foi o caso dos sistemas de dilogo ELIZA (Weizenbaum, 1966) e PARRY (Colby, 1973), mas tambm os sistemas de reconhecimento de fala

188

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

SHRDLU (Winograd, 1971), LUNAR (Woods, 1977), LIFER/LADDER (Hendrix, 1977) e PLANES (Waltz, 1978). Finalmente, o grupo focado na modelagem do discurso voltou suas atenes a questes semnticas. Trabalhos significativos desta poca como (Grosz, 1977) visavam dilogos funcionais (dilogos que especificam uma tarefa a ser executada). Os trabalhos subsequentes de Gennari em particular definem uma teoria de partio do discurso baseado em relaes entre a estrutura da tarefa a executar e a estrutura do dilogo que descreve esta tarefa (Gennari et alli, 1986). Nesta mesma poca foi desenvolvida por Mann e Thompson uma Teoria de Estrutura Retrica (Mann e Thompson, 1988) que atribui uma estrutura hierrquica para o discurso com o intuito de gerao automtica de texto. Outros trabalhos deste perodo tambm foram dedicados gerao de linguagem natural, como o caso dos geradores de resposta TEXT (McKeown, 1985) e MUMMBLE (Mcdonald, 1983) que usam predicados retricos para produzir descries declarativas na forma de pargrafos. Desde o incio da dcada de 1990, o crescimento da internet e a profuso de textos disponveis direcionaram os esforos do PLN para o tratamento de textos mais do que para o discurso falado. Nesta poca iniciaram as pesquisas sobre corpora anotados sintaticamente, ou seja, conjuntos de textos sobre um domnio de conhecimento onde cada uma das suas palavras foram identificadas segundo sua funo sinttica. Vrios destes trabalhos foram desenvolvidos para a lngua inglesa, sobre trs corpora bastante populares: Brown corpus (Kucera e Francis, 1967), Lancaster-Olso-Bergen corpus (Garside et alli, 1987) e Penn Treebank (Marcus et alli, 1993). Neste sentido, abordagens simblicas baseadas em conceitos lingusticos utilizadas em conjunto com abordagens estatsticas possibilitaram resultados mais robustos (Manning e Shtze, 1999). Na verdade, esta reconciliao entre mtodos lingusticos e estatsticos que se percebe atualmente desfaz a diviso de abordagens feita na rea quase 50 anos atrs. A grande quantidade de informao a ser tratada que impulsionou a reconciliao dos mtodos estatsticos e lingusticos teve desde a virada do sculo uma outra consequncia interessante com a incorporao de tcnicas de aprendizado de mquina (Witten e Frank,

Linguagens Especializadas em Corpora

189

2005). As tcnicas de aprendizado de mquina so particularmente aplicveis no contexto de conjuntos de dados humanamente intratveis, mas de onde se pode inferir padres e, consequentemente, informao. Naturalmente, os ltimos anos tm testemunhado uma convergncia das tcnicas de PLN baseadas em corpus com tcnicas de aprendizagem de mquina, ou mais especificamente, tcnicas de minerao de dados. Este aumento significativo das ferramentas disposio dos pesquisadores de PLN permitiu tambm um aumento significativo nas ambies da rea. Retomou-se seriamente os trabalhos de traduo automtica, apesar da conscincia de ser inatingvel uma traduo perfeita. Uma quantidade muito grande de tradutores automticos est disponvel na internet como o caso dos sites especializados como o babelfish (http://babelfish.yahoo.com), mas tambm de servios de traduo embutidos como os disponveis automaticamente pelo gigante de pesquisas Google (http://www.google.com/language_tools). Igualmente, a evoluo de outras reas da computao, como o caso da computao pervasiva (recursos computacionais presentes em atividades cotidianas) ou aplicaes web, abriu espao para novos sistemas de reconhecimento e gerao automtica da linguagem. Alguns sistemas recentes utilizam PLN com o objetivo de responder perguntas de forma clara e direta atravs de conhecimento semntico. Exemplos prticos deste tipo de aplicao, disponveis na internet, so os sistemas Ask (http://www.ask.com), Lexxe (http://www.lexxe.com), Powerset (http://www.powerset.com) e Hakia (http://www.hakia.com). Outro exemplo desenvolvido com o mesmo princpio o sistema True Knowledge (http://www.trueknowledge.com), que ao contrrio dos demais que direciona a vrios links relacionados, o True Knowledge com perguntas simples feitas pelo usurio, insere a resposta direta, alm de tambm fornecer links relacionados. Esse sistema permite que os usurios acrescentem informaes, tornando-o cada vez mais completo e acurado. Porm, talvez o objetivo mais ambicioso do processamento de linguagem natural reside atualmente na construo da web semntica que pretende estabelecer uma ponte entre o enorme volume de dados disponvel na internet e as demandas de seus milhes de usurios

190

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

(Berners-Lee et alli, 2001). A web semntica uma iniciativa que busca identificar e representar o significado de pginas na web de forma que tanto pessoas como mquinas possam identific-los. Neste sentido, o grande desafio a representao do conhecimento em um formato adequado, que neste contexto feito atravs de Ontologias (Gruber, 1995).

2. Ontologias para Domnios Especficos


Ontologias so representaes formais de um modelo de domnio. Geralmente, uma ontologia entendida como um conjunto de conceitos organizados hierarquicamente, um conjunto de relaes e um conjunto de atributos. A definio formal de ontologias foge ao escopo deste trabalho, mas o leitor interessado pode encontrar um extenso material em (Ehrig, 2007) e (Buitelaar et alli, 2005). O importante aqui ter em mente o tipo de representao que feito por uma ontologia. Para facilitar o entendimento, vamos considerar uma ontologia que represente um conjunto de pessoas e suas relaes familiares. Para esta ontologia exemplo, vamos admitir os seguintes conceitos: pessoas, homens, mulheres, meninos e meninas organizados hierarquicamente conforme a Figura 1. Neste exemplo, todos homens e mulheres so pessoas, todos meninos so homens e todas meninas so mulheres. Esta hierarquia de conceitos representada na Figura 1 por arcos com linhas contnuas. Para esta ontologia vamos considerar um conjunto de relaes pai_de, me_de, filho_de e filha_de. Estas relaes esto indicadas na Figura 1 por arcos pontilhados. As relaes pai_de e filho_de existem somente entre um homem e qualquer pessoa e analogamente s uma mulher pode ser me_de e filha_de uma pessoa. Completando o ncleo desta ontologia, podemos associar atributos aos conceitos desta ontologia. Por exemplo, podemos associar a cada pessoa um atributo numrico que indique sua idade. Este atributo comum a todas as pessoas, logo na Figura 1 este atributo, idade, est representado associado ao conceito pessoas. De acordo com a aplicao pretendida, e tambm com os autores consultados, a definio de uma ontologia pode se limitar a

Linguagens Especializadas em Corpora

191

descrever a sua estrutura (conceitos, relaes e atributos e suas respectivas hierarquias) como descrito na Figura 1. Em outros casos, a ontologia s considerada completa quando, alm da estrutura, tambm necessrio popular os conceitos com instncias. Um exemplo destes casos, para o exemplo da Figura 1, seria associar diversas pessoas a cada um dos conceitos. Este processo de associar instncias a uma estrutura de uma ontologia chamado de populao de ontologias (Cimiano, 2006). Uma vez um domnio representado em uma ontologia, possvel identificar semanticamente as consultas feitas por usurios, tanto quanto classificar as pginas existentes segundo seus significados. Na verdade, diversos recursos podem ser semanticamente identificados. Porm o processo de construo de uma ontologia , em geral, lento e bastante complexo. E por isso existem diversas tcnicas e ferramentas para a construo de ontologias. No entanto, dada a complexidade do processo, difcil imaginar a construo de uma ontologia relevante sem o auxlio de ferramentas computacionais. Curiosamente, pela mesma razo ainda no existem sistemas capazes de construir uma ontologia de forma completamente automtica.

192

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Figura 1 Exemplo de Estrutura de uma Ontologia

Os esforos semiautomticos mais simples so baseados na utilizao de uma ferramenta que permita organizar ontologias que devem ser projetadas por um usurio que conhea o domnio a ser descrito pela ontologia. Dentre estas ferramentas, provavelmente a mais popular o Protg (Crubzyb et alli, 2003), uma ferramenta que permite ao usurio construir e manipular ontologias quase que s manualmente, pois apenas algumas verificaes e visualizaes automticas so possveis. Porm, uma das funcionalidades muito interessantes do Protg a possibilidade de adicionar plugins capazes de realizar operaes sobre ontologias. Outra funcionalidade interessante do Protg a possibilidade de modelar ontologias segundo dois protocolos: OKBC - Open Knowledge Base Connectivity (OKBC, 2009) e OWL Web Ontology Language (Mcguinness e Van Harmelen, 2009). Maiores detalhes sobre a ferramenta Protg podem ser encontrados em http://protege.stanford.edu.

Linguagens Especializadas em Corpora

193

Outra ferramenta semiautomtica de construo de ontologias o OntoGen (Fortuna, 2007) que combina tcnicas de minerao de textos com uma interface de utilizao que facilita a escolha dos conceitos e relaes. Na verdade, o OntoGen, parte de um corpus e oferece ao usurio conjuntos de termos candidatos a conceitos e cabe ao usurio estabelecer a hierarquia entre os conceitos, bem como as relaes entre eles. Neste sentido, esta ferramenta mais uma ferramenta de edio de ontologias que possui um processo de extrao de termos candidatos integrado. Maiores detalhes da ferramenta OntoGen podem ser encontrados em http://ontogen.ijs.si. O primeiro problema para gerar ontologias a partir de textos identificar quais tarefas so necessrias para a construo efetiva de uma ontologia. Ainda que de acordo com os objetivos, os componentes de uma ontologia possam variar, todas as possibilidades sempre consideram pelo menos um conjunto de conceitos e sua hierarquia (uma taxonomia) e relaes entre estes conceitos. Para adquirir esse conhecimento conceitual dos textos (corpus), aplicam-se vrios mtodos e tcnicas da rea de Inteligncia Artificial que ajudam a automatizar o processo de construo de ontologias. Este processo de construo automtica de ontologias a partir de textos denomina-se Aprendizagem de Ontologias (Buitelaar et alli, 2005). Segundo Buitelaar, este processo divide-se em cinco etapas bsicas: extrao de termos candidatos a conceitos de um domnio; determinao de sinnimos entre os termos candidatos e escolha dos conceitos; identificao da relao hierrquica entre os conceitos; identificao de relaes entre os conceitos; e identificao de instncias (populao da ontologia). A aprendizagem de ontologias pode ser representada em camadas de acordo com a Figura 2.

194

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Figura 2 Etapas de Aprendizagem de Ontologias

Logicamente, os passos descritos na Figura 2 devem ser executados sequencialmente, sendo a extrao de termos candidatos a conceitos a primeira e mais importante tarefa, pois da qualidade dos resultados desta etapa depende a qualidade dos resultados de todas as demais etapas. Note-se que esta afirmao no significa que as outras etapas sejam mais simples, ou que no seja necessria uma grande preocupao com a eficincia de cada uma delas. A qualidade da ontologia completamente dependente das demais tarefas, porm, caso a extrao de termos candidatos seja deficiente, o resultado de todas as demais etapas no poder compensar esta deficincia. Por esta razo, neste captulo focamos nessa etapa do processo de aprendizagem de ontologias.

Linguagens Especializadas em Corpora

195

3. Extrao de Termos Candidatos a Conceitos


A extrao de termos pode ser feita segundo trs abordagens: lingustica, estatstica e hbrida. A abordagem lingustica faz uso de um nvel avanado de processamento lingustico, que geralmente envolve a identificao da organizao das frases dos textos (corpus) sintaticamente. Para essa anlise utilizam-se programas de computador denominados parsers que fazem anotao sinttica, e ocasionalmente tambm semntica, de maneira automtica. A partir da anotao feita pelo parser, outros programas utilizam essas anotaes (geralmente descritas em arquivos XML) como input adicional para a tarefa de identificao dos termos candidatos a conceitos de uma ontologia. Uma informao lingustica relevante para extrair automaticamente os termos de um corpus a identificao dos sintagmas nominais, isso permite a extrao apenas de unidades de sentido previamente identificadas pelo parser. Um sintagma nominal um conjunto de palavras que exerce a mesma funo gramatical que um substantivo. Segundo (Kuramoto, 2002), ao contrrio das palavras isoladas cujo significado depende fortemente do contexto, sintagmas nominais tendem a permanecer com o mesmo significado. Na abordagem estatstica os candidatos a termos so extrados segundo uma anlise da sua frequncia de ocorrncia no corpus. Existem ferramentas especficas que utilizam essa abordagem, por exemplo, o NSP Ngrams Statistic Package (Banberjee, 2003), que possui um conjunto de programas que realizam a tarefa de extrao de termos de um corpus de maneira totalmente estatstica. Esse mtodo de Ngrams extrai termos composto por um nmero fixo de palavras. Usualmente buscam-se bigramas (termos compostos por duas palavras) e trigramas (termos compostos por trs palavras), porm termos com qualquer nmero de palavras, inclusive unigramas, podem ser extrado. A abordagem hbrida a uma combinao das duas outras abordagens, onde tanto conceitos lingusticos, quanto informaes estatsticas so consideradas. Na verdade, apesar das diferenas histricas entre as abordagens lingusticas e estatsticas citadas

196

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

anteriormente, a grande maioria dos mtodos de extrao de termos pode sempre ser visto como um mtodo hbrido. A extrao de termos de corpus em linguagens cientficas um tema bastante relevante abordado em vrios trabalhos de pesquisa como o caso do trabalho de Lopes et alli, 2009b, que faz uma comparao entre duas abordagens, a lingustica e a estatstica. Neste trabalho, so extrados sintagmas nominais utilizando uma abordagem lingustica e o resultado comparado com a extrao utilizando uma abordagem eminentemente estatstica. Em ambos os casos so utilizadas ferramentas automticas de extrao de termos: NSP (Banberjee, 2003) para a abordagem estatstica e EXATOLP (Lopes et alli, 2009c) para a abordagem lingustica. Nesta comparao todo o processo de extrao realizado a partir de um corpus composto de 283 textos extrados do jornal de Pediatria em portugus (http://www.jped.com.br/). Na comparao proposta nesse trabalho, a abordagem lingustica obteve melhores resultados de preciso na extrao segundo a comparao com uma lista de termos de referncia desenvolvida de forma semimanual (projetos TEXTQUIM-TEXTECCwww.ufrgs.br/textecc). Enquanto a extrao atravs de uma abordagem estatstica pode ser utilizada em qualquer tipo de texto e mesmo em qualquer lngua, a extrao com abordagens lingustica tende a ser bastante dependente pelo menos da lngua na qual os textos esto escritos. Um outro exemplo de trabalho cientfico de extrao de termos atravs de uma abordagem lingustica para o tratamento de linguagem cientfica o trabalho de Bourigault que tambm extrai sintagmas nominais de bases textuais acadmico cientficas. Neste trabalho os termos so extrados de um corpus de Direito composto por 12 cdigos de lei da Frana (Bourigault et alli, 2005). Neste trabalho o objetivo a construo de uma hierarquia dos termos para acelerar um motor de busca de informaes em um site de acesso a textos jurdicos em francs. Na verdade, a constante aplicao de tcnicas de PLN, especificamente, extrao de termos, sobre textos escritos em linguagem cientfica se explica pela grande necessidade de um tratamento automtico destes textos para aplicaes to variadas como gerao automtica de glossrios, construo de mecanismos de busca,

Linguagens Especializadas em Corpora

197

categorizao de textos e at construo de ontologias. Textos cientficos so usualmente descritos em uma linguagem objetiva, que possui como finalidade a circulao do saber e, portanto, seguindo determinados padres lingusticos. Estas caractersticas fazem com que esse tipo de texto possa ter um tratamento computacional mais controlvel. O uso de PLN para o tratamento de linguagens cientficas apresenta diversas perspectivas de aplicao e grandes desafios de pesquisa. Os avanos obtidos desde o surgimento do PLN foram enormes, porm o problema de compreenso automtica de linguagem natural, como sempre acontece com as atividades humanas, provavelmente impossvel de ser completamente resolvido. No entanto, o tratamento de idiomas como o ingls, conta com uma diversidade de recursos e ferramentas. Avanos semelhantes precisam ser feitos para a lngua portuguesa. Por isso, o campo de pesquisas em PLN para o tratamento de textos cientficos em portugus mostra-se em constante desenvolvimento, e um campo de pesquisa bastante promissor.

Referncias Bibliogrficas
AHO, A. V.; ULLMAN, J. D. The Theory of Parsing, Translation, and Compiling, Vol. 1, Parsing. Prentice Hall, 1972. BANBERJEE, S.; PEDERSEN, T. The Design, Implementation, and Use of the Ngram Statistics Package. In: Proceedings of the Fourth International Conference on Intelligent Text Processing and Computational Linguistics, Mexico City, 2003. BAR-HILLEL, Y. The present status of automatic translation of languages, Advances in Computers 1(1): 91-163, 1960. BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web, Scientific American, 284(5): 34-43, May 2001. BOURIGAULT, D.; FABRE, C.; FRROT, C.; JACQUES, M.; OZDOWSKA, S. SYNTEX, analyseur syntaxique de corpus, TALN, Dourdan, 2005. BUITELAAR, P.; CIMIANO, P.; MAGNINI, B. Ontology learning from text: An overview. In: Buitelaar, P.; Cimiano, P.; and Magnini, B. (Ed.). Ontology Learning from Text: Methods, Evaluation and Applications, v. 123 of Frontiers in Artificial Intelligence and Applications. IOS Press, 2005.

198

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

BRESNAN, J.; KAPLAN, M.R. Introduction: Grammars as mental representations of language. In: J. Bresnan and M.R. Kaplan (ed.), The Mental Representation of Grammatical Relations, Cambridge, Massachusetts, The MIT Press 1982. CIMIANO, P. Ontology learning and population from text: Algorithms, evaluation and applications. Heidelberg: Springer-Verlag, 2006. COLBY, K. M. Simulation of Belief Systems. Computer Models of Thought and Language. In: R. C. Schank and K. M. Colby. San Francisco, W.H. Freeman and Company: 251-286, 1973. COLMERAUER, A. Total Precedence Relations. Journal of the ACM, 17(1): 14-30, 1970. COLMERAUER, A. Les Grammaires de Metamorphos, Technical Report, Groupe d'Intelligence Artificielle, Marseille-Luminy, November, 1975. COLMERAUER, A.; ROUSSEL, P. The birth of Prolog History of Programming Languages. ACM Press, 1996. CHOMSKY, N. Syntactic Structures. The Hague: Mouton. Reprint. Berlin and New York, 1957. CHOMSKY, N. Aspects of the theory of syntax. Cambridge, Mass.: MIT Press, 1965. CRUBZYB, M.; ERIKSSONC, H.; NOYB, N. F.; TUB, S. W. The evolution of Protg: an environment for knowledge-based systems development. International Journal of Human-Computer Studies, 58(1): 89-123, 2003. EHRIG, M. Ontology Alignment: Bridging the Semantic Gap. University of Karlsruhe Germany, Springer, 2007 FILLMORE, C. J. Lexical entries for verb. Dordrecht, Holland: D. Reidel, 1968. FORTUNA, B.; GROBELNIK, M.; MLADENIC, D. OntoGen: Semiautomatic Ontology Editor. HCI International, Beijing, July 2007. GARSIDE, R., G. Leech and G. Sampson. The Computational Analysis of English: A Corpus Based Approach. London: Longman, 1987. GENNARI, J. H.; MUSENB M A.; FERGERSONB, R. W.; GROSSOD, W. E.; GROSZ, B.; SIDNER, C. Attention, Intentions, and the Structure of Discourse. Computational Linguistics, 12(3): 175-204, 1986.

Linguagens Especializadas em Corpora

199

GROSZ, B. The Representation and Use of Focus in a System for Understanding Dialogs. IJCAI, 67-76, 1977. GRUBER, T. R. Toward principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies, 43 (5-6): 907-928, 1995. HENDRIX, G, G.. Human Engineering for Applied Natural Language Processing. In: Proceedings of the Fifth International Joint Conference on Artificial Intelligence, Cambridge, Massachusetts, 1977. JURAFSKY, D.; MARTIN, J. H. Speech and Language Processing, 2nd ed. Prentice-Hall, 2009. KAY, P.; MCDANIEL, C. K. On the logic of variable rules. Language and Society, 8: 151-187. Cambridge University Press, 1979. KUCERA, H.; FRANCIS, W. N. Computational Analysis of Present-Day American English. Providence: Brown University Press, 1967. KURAMOTO, H. Nominal Groups: a New Purpose to Information Retrieval. DataGramaZero Revista de Cincia da Informao, 3(1), 2002. LIDDY, E. D. Natural Language Processing. In: Encyclopedia of Library and Information Science, 2nd ed. New York: Marcel Decker, Inc., 2003. LOPES, L.; VIEIRA, R.; FINATTO, M. J.; ZANETTE, A.; MARTINS, D.; RIBEIRO Jr., L. C. Extrao automtica de termos compostos para construo de ontologias: um experimento na rea da sade. ReciisRevista Eletrnica de Comunicao Informao & Inovao em Sade. 3: 76-88, 2009a. LOPES, L.; OLIVEIRA, L. H.; VIEIRA, R. Anlise Comparativa de Mtodos de Extrao de Termos: Abordagens Lingustica e Estatstica. Relatrio Tcnico, n. 053, PPGCC, FACIN PUCRS, Porto Alegre, 2009b. LOPES, L.; VIEIRA, R. EXATOLP - Extrator automtico de Termos para Ontologias em Lngua Portuguesa. Relatrio Tcnico, n. 054, PPGCC, FACIN PUCRS, Porto Alegre, 2009c. MANN, W.C.; THOMPSON, S.A. Rhetorical structure theory: Toward a functional theory of text organization. Text, 8(3): 243-281, 1988. MANNING, C. D. SCHUTZE, H. Foundations of statistical natural language processing. Cambridge, Massachusetts: The MIT Press, 1999.

200

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

MARCUS, M. P.; SANTORINI, B.; MARCINKIEWICZ, M. A. Building a Large Annotated Corpus of English: The Penn Treebank. Computational Linguistics, 19(2): 313330, 1993. MCDONALD, D. D. Natural Language Generation as a Computational Problem. In: Brady, M. and Berwick, Bob, editors, Computational Models of Discourse, 209-265. MIT Press, 1983. MCKEOWN, K. R. Text generation: using discourse strategies and focus constraints to generate natural language text, Cambridge University Press, New York, NY, 1985. MCGUINNESS, D.L.; VAN HARMELEN, F. OWL web ontology language overview. World Wide Web Consortium (W3C) recommendation. http://www.w3.org/ Acesso em: 01 Agosto, 2009. OKBC - Open Knowledge Base Connectivity Working http://www.ai.sri.com/~okbc/ Acesso em: 01 Agosto, 2009. Group

PAPINENI, K.; ROUKOS, S.; WARD, T.; ZHU, W. BLEU: a method for automatic evaluation of machine translation. In: Proceedings of the 40th Annual Meeting on Association For Computational Linguistics (Philadelphia, Pennsylvania, July 07 - 12, 2002). Annual Meeting of the ACL. Association for Computational Linguistics, Morristown, NJ, 311318, 2002. PEREIRA, F. C. N. & WARREN, D. H. D. Definite Clause Grammars for Language Analysis A Survey of the Formalism and a Comparison with Augmented Transition Networks. Artificial Intelligence, 13: 231-278, 1980. QUILLIAN, M. Semantic Memory. In: M. Minsky, editor, Semantic Information Processing, 227-270, MIT Press, 1968. RABINER, L. R., HUANG, B. H. An Introduction to Hidden Markov Models, IEEE ASSP Magazine, January 1986. SCHANK, R. C. Conceptual Dependency: A Theory of Natural Language understanding, Cognitive Psychology, 3(4): 532-631, 1972. SHANNON, C. Communication Theory of Secrecy Systems, 1949. WALTZ, D. L. An English Language Question Answering System for a Large Relational Database, Communications of the ACM, 21(7): 526539, 1978. WEAVER, W. Translation. (reproduced in Locke and Booth, eds.: Machine Translation of Languages,Cambridge, MIT Press, 1955), 1949.

Linguagens Especializadas em Corpora

201

WEIZENBAUM, J. ELIZA - A computer program for the study of natural language communication between men and machines. Communications of the ACM, 9: 36-45, 1966. WILKS, Y. Preference semantics. In: E. L. Keenan, editor, Formal Semantics of Natural Language. Cambridge University Press, 329348, 1975. WINOGRAD, T. Procedures as a Representation for Data in a Computer program for Understanding Natural Language. M.I.T. dissertation, 1971. WITTEN, I.H; FRANK, E. Data Mining: Practical machine learning tools and techniques, 2 ed. San Francisco: Morgan Kaufmann, 2005. WOODS, W. A. Transition Network Grammars for Natural language Analysis, Communications of the ACM, 13(10), 1970. WOODS, W. A. Lunar rocks in natural english: Explorations in natural language question answering. In: A. Zampoli, editor, Linguistic Structures Processing, volume 5 of Fundamental Studies in Computer Science, 521-569. North-Holland, 1977.

O VERBO MODAL CAN EM MANUAIS DE AVIAO EM INGLS: IMPLICAES PARA MATERIAIS DIDTICOS 1 Simone Sarmento (UFRGS)
Resumo: De forma quantitativa, e com base nos pressupostos da Lingustica de Corpus, o presente trabalho se dedica a investigar a incidncia dos Verbos Modais no segmento da linguagem da aviao representado pelo texto do tipo manuais de aeronaves em ingls. Alm disso, so observadas as colocaes e os usos de can, o modal mais frequente no corpus. Com base nos resultados da investigao, busco colher subsdios e oferecer sugestes para a elaborao de materiais didticos em ingls com propsitos especficos 2. Este trabalho fruto de uma longa trajetria de estudos e reflexes sobre a rea da aviao, a respeito da qual sempre observei uma grande carncia de pesquisas acadmicas sistematizadas sobre as diversas sublnguas 3 que perfazem o total da rea. No intuito de contribuir para suprir essa lacuna, este estudo se dedica a investigar mais profundamente o segmento da lngua da aviao representado pelo gnero textual 4 manuais de aeronaves em ingls. Com base nos
O presente trabalho baseado em Sarmento (2008). O presente trabalho baseado na minha tese de doutorado intitulada O uso dos verbos modais em manuais de aviao em ingls: Um estudo baseado em corpus, defendida no Programa de Ps-Graduao em Letras da UFRGS em 2008. 3 Uma sublngua uma variedade da lngua usada em certa cincia ou tecnologia que no somente menor do que o total de uma lngua, mas tambm mais sistemtica na sua estrutura e significados. um subsistema que se comporta essencialmente como o total desta lngua, ao mesmo tempo em que limitado a um domnio especfico. Cada sublngua possui uma gramtica e um lxico distinto (KITTREDGE, 1982). Outras sublnguas da rea da aviao so a comunicao oral entre pilotos e controladores de trfego areo, a comunicao via sistema de som entre pilotos e passageiros, entre muitas outras. 4 Os gneros so classes de eventos comunicativos que possuem caractersticas de estabilidade, reconhecimento de termos, etc. Para Swales (1990, p.46) eventos comunicativos compreendem no somente o prprio discurso e seus participantes, mas tambm o papel do discurso e seu ambiente de produo e recepo.
2 1

Linguagens Especializadas em Corpora

203

resultados, busco colher subsdios para elaborar materiais didticos que reflitam a lngua efetivamente usada nos manuais. Pesquisas na rea das lnguas especializadas apontam para o fato de que
Os textos tcnicos so escritos baseados em certas suposies (ou pr-suposies) culturais relacionadas ao tipo e quantidade de informaes gramtico-retricas que os redatores acreditam que os leitores compartilhem. [...] Nossa pesquisa mostra que grande parte dos falantes (leitores) no-nativos de ingls no possui esse background cultural que os habilite a ter essas informaes pressupostas de 5 forma a entender os textos tcnicos . (TRIMBLE, 1985, p. 114)

Dentre os elementos que causam maior dificuldade para alunos no-nativos de ingls, Trimble (1985, p. 115) afirma estar, em ordem decrescente, (a) distines entre voz ativa e passiva em descries e instrues; (b) uso de verbos modais em instrues; (c) uso no-padro (e a ausncia) de artigo definido em descries e instrues; e (d) escolha de tempo verbal em descries. O presente trabalho aborda de forma direta e/ou indireta os dois principais fatores causadores de dificuldades entre os usurios desse tipo de texto, ou seja, o foco principal deste estudo concentra-se na observao dos verbos modais em manuais de aviao. A nfase secundria est na forma em que essas unidades se apresentam: voz ativa ou passiva. Investigaes anteriores (SARMENTO, 2005a; SARMENTO, 2005b; GABRIELATOS e SARMENTO, 2006), mostram que verbos modais (doravante VMs) nos manuais de aviao so regularmente usados em oraes passivas. Os manuais em anlise esto restritos rea da aviao, contudo, existem diferentes classes de profissionais envolvidos. Os manuais so escritos por tcnicos redatores da BOEING 6 e sero lidos, sempre em ingls, por mecnicos e pilotos ao redor do mundo; h uma relao de obedincia entre os interlocutores, tendo-se em mente que
As tardues das citaes so de minha autoria. No h um autor especfico nos crditos dos manuais. A responsabilidade do texto, nesse caso, recai sobre a instituio como um todo.
6 5

204

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

os destinatrios devem executar com preciso as diretrizes postas pelos redatores dos manuais. Pode-se dizer que os destinatrios dos manuais aqui analisados formam duas comunidades discursivas (SWALES, 1990) distintas e ocupam diferentes posies na escala hierrquica de uma empresa area. Os pilotos ocupam a posio mais alta na empresa. O treinamento de um piloto altamente dispendioso, custando s empresas areas alguns milhares de dlares ao ano. Os pilotos tornam-se assim, funcionrios importantes de serem mantidos em uma empresa. Alm disso, eles podem ocupar posies gerenciais e participar de importantes decises em uma empresa, como por exemplo, decidir qual tipo de aeronave comprar. Os mecnicos, no possuem poder semelhante. Hierarquicamente, esto mais prximos base. Outra diferena importante diz respeito ao local de trabalho. Para os pilotos, seguir as instrues em um manual no s uma questo de eficincia, mas literalmente de vida ou morte, uma vez que eles esto sempre a bordo das aeronaves. Os mecnicos realizam seu trabalho no solo. Sendo que uma ao erroneamente executada no colocar a sua vida em risco, mas sim dos passageiros e pilotos. Os textos desses manuais so considerados portadores do conhecimento sobre as aeronaves, e no so passveis de questionamentos por parte dos destinatrios. Possuem um carter altamente dentico. So textos: descritivos, divididos em captulos por partes da aeronave (hidrulica, trem de pouso, escadas, etc.) e/ou procedurais, divididos por tipo de procedimentos (decolagem, pouso, etc.). So ricos em informaes no verbais, com vrias tabelas, figuras e grficos. Assim, os manuais tcnicos determinam, acima de tudo, um tipo de ao, expressando obrigaes, possibilidades e consequncias (SARMENTO, 2005a; SARMENTO, 2005b; GABRIELATOS e SARMENTO, 2006). Entre outras unidades lexicais, os VMs costumam ser usados para expressar essas funes comunicativas. So, assim, elementos lexicais fundamentais nesse cenrio. Com base nas reflexes expostas acima, este estudo tem por objetivo investigar o verbo modal can em dois manuais da aeronave BOEING 737. Busco descrever a incidncia e a funcionalidade do VM nesse corpus. Realizo um contraste entre os manuais que compem o

Linguagens Especializadas em Corpora

205

corpus e termino a anlise com a investigao detalhada de can com o objetivo de oferecer subsdios para a elaborao de material didtico voltado ao ensino de ingls para aviao tendo em vista seus diferentes propsitos. Para dar conta dos objetivos, uso como base os pressupostos da Lingustica de Corpus (doravante LC), das lnguas especializadas e estudos sobre os VMs em ingls baseados em corpora ou com foco especfico na aviao.

1. Verbos Modais
A modalizao 7 um assunto bastante complexo, sendo que em cada lngua h formas diversas de expressar um mesmo tipo de modalidade (cf. OLIVEIRA, 2003 e COATES, 2005). Em contrapartida, uma mesma forma pode expressar diferentes modalidades, ou seja, os conceitos modais podem ser expressos nas lnguas naturais atravs de uma grande variedade de formas. Os VMs em ingls possuem caractersticas bastante especficas no que diz respeito forma, ou seja, possuem um alto grau de gramaticalizao 8. Diferentemente de outras lnguas, tal como a portuguesa, na qual os verbos modais tm marcao de concordncia verbal e de tempo, os auxiliares modais da lngua inglesa contempornea no apresentam essas caractersticas. Para ilustrar as diferenas relacionadas concordncia verbal dos VMs entre portugus e ingls, cito o verbo modal poder em portugus, e can em ingls. Portugus Ingls Ele pode ir festa. He can go to the party. Ns podemos ir festa. We can go to the party. Nos exemplos acima possvel notar que, em portugus, o VM poder concorda com os pronomes que o precede (pode, podemos). J can mantm-se invarivel independentemente do pronome. No h
Modalidade, em um sentido amplo, relacionada s noes de necessidade e de possibilidade (LYONS, 1977). 8 Gramaticalizao aqui entendida como atribuio de um carter gramatical a uma palavra anteriormente autnoma(NEVES, 2004, p. 113).
7

206

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

essa variao em ingls nem mesmo para o pronome he, que, no presente simples dos demais verbos, receberia o morfema s, como em I work e He works. Assim, tem-se can seguindo he e we. Portugus Ingls Eu posso ir festa. I can go to the party. Eu pude ir festa. I could go to the party. Nesses ltimos exemplos observa-se a marcao temporal relacionada a posso (presente do indicativo) e pude (pretrito) na lngua portuguesa. Tal marcao no acontece em ingls, pois can foi utilizado no presente enquanto could foi utilizado no passado. De acordo com Denison (1993) e Bybee (1995), os modais em ingls so derivados de verbos que possuam tempo e faziam concordncia verbal durante um estgio bem anterior da lngua. Dessa forma, os autores reconhecem que a derivao histrica desses verbos ainda traz algumas implicaes semnticas como can-could, will-would, may-might, shall-should, em suas formas de presente e pretrito respectivamente. Apesar de haver essa derivao histrica de could como passado de can, esses dois itens lexicais so geralmente considerados independentes. Essa independncia pode ser notada, por exemplo, em entradas lexicais nos dicionrios. Pude no possui uma entrada prpria em dicionrios como o Aurlio ou o Houaiss, sendo apenas uma conjugao de verbo poder. J could uma entrada individual, totalmente independente de can no Macmillan English Dictionary. Quanto semntica dos VMs, faz-se necessrio, primeiramente, distinguir dois tipos de modalidade: a epistmica e a raiz. A primeira diz respeito s suposies do falante ou avaliao de possibilidades. Na maioria dos casos, esse recurso indica a segurana (ou a sua ausncia) que um falante possui acerca da verdade da proposio expressa (COATES, 1995), por exemplo, They may be in the office ou They must be in the office (PALMER, 2003, p. 7). A modalidade raiz engloba significados como permisso e obrigao, assim como possibilidade e necessidade e pode ser subdividida entre dentica e dinmica. A modalidade dentica expressa uma permisso ou injuno do falante para que um ato seja realizado ou para que uma obrigao seja cumprida (HOYE, 1997). O evento controlado por circunstncias externas ao sujeito da orao

Linguagens Especializadas em Corpora

207

ou, em um sentido mais restrito, pessoa ou s pessoas identificadas pelo sujeito, como nos exemplos They may/can come in now ou They must come in now (PALMER, 2003, p. 7). A dinmica, por sua vez, trata da habilidade/capacidade ou disposio do sujeito da orao (PALMER, 1990); o controle interno ao sujeito, vide exemplos: They can run very fast ou I will help you. Mais recentemente, o fator distribucional, 9 motivado pelo avano das pesquisas realizadas com o auxlio de computadores, tem recebido mais ateno, sendo que um dos mais importantes usos das investigaes baseadas em corpus precisamente fornecer informaes sobre a frequncia do uso (BIBER et al., 1999, p. 8). importante ressaltar que, em consonncia com os pressupostos da LC, a frequncia de itens lexicais no considerada aleatria, e sim motivada por necessidades comunicativas, entre outros fatores. Nesse sentido, torna-se til que professores, acadmicos, alunos e autores/produtores de textos saibam quais padres gramaticais so regulares, merecedores, portanto, de mais ateno. At muito recentemente, essa informao era geralmente baseada na intuio de falantes nativos de uma lngua. Entretanto, as intuies dos falantes nativos so muitas vezes incorretas, ou pelo menos inexatas, pois
cada um de ns possui apenas um conhecimento parcial da prpria lngua, temos nossas preferncias e preconceitos, nossa memria fraca, nossa imaginao poderosa (assim podemos conceber contextos para as ocorrncias mais implausveis), e tendemos a prestar mais ateno nas palavras ou estruturas incomuns e no notar as mais comuns. (McENERY, XIAO & TONO, 2006, p. 147)

De forma a ilustrar a importncia do fator distribucional, o Quadro 1 mostra as diferenas de frequncia de ocorrncia dos VMs em sete diferentes corpora conforme relatado na literatura da rea (COATES, 1983; BIBER et al., 1999; KENNEDY, 2002; GABRIELATOS

Por fator distribucional, refiro-me regularidade de ocorrncia dos VMs em diferentes gneros textuais.

208

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

e SARMENTO, 2006; DERNARDIN, 2008) 10. Os seis primeiros corpora apresentados no quadro so corpora de ingls geral. O OSC, na coluna de nmero sete, um corpus de ingls especfico composto de manuais de sistemas operacionais para computadores pessoais. Os VMs esto apresentados em ordem decrescente de ocorrncia.
Frequncia 1 2 3 4 5 6 7 8 9 1 Survey will can would could must should may might shall 2 Lancaster would will can could may should must might shall 3 LSWE will would can could may should must might shall 4 FROWN would can will could may should must might shall 5 BNC will would can could may should must might shall 6 BROWN would will can could may must should might shall 7 OSC can will may might should would must could shall

Quadro 1: Classificao da frequncia dos VMs entre diferentes corpora

Apesar de os seis corpora de ingls geral representarem diferentes variedades do ingls (americano e/ou britnico, oral e/ou escrito, geral ou especfico), e terem sido compilados em diferentes pocas (dos anos 60 a 90), pode-se notar algumas similaridades com relao frequncia e distribuio dos VMs. Na primeira posio, encontram-se will e/ou would, sendo que will tem a preferncia em quatro corpora. O modal can ocupa a segunda ou terceira posio nos
O Survey utilizado por Coates (1983) continha 725 mil palavras de ingls escrito e oral. O LOB (Lancaster-Oslo/Bergen Corpus), tambm investigado por Coates possui um milho de palavras de ingls escrito em 15 diferentes gneros. O corpus LSWE (Longman Spoken and Written English Corpus) foi estudado por Biber Et al. (1999) contendo mais de 40 milhes de palavras. O FROWN, investigado por Gabrielatos e Sarmento, 2006) um corpus de ingls americano escrito, composto de um milho de palavras compilado nos anos 90. O BNC, analisado por Kennedy (2002), um corpus de aproximadamente 100 milhes de palavras de IB escrito e falado, que foi disponibilizado em 1995. O BROWN consiste em um milho de palavras de IA compilado no incio dos anos 60. O OSC um corpus de ingls escrito composto dos manuais dos sistemas operacionais para computadores pessoais: Windows e Linux. O primeiro consiste em 93.277 tokens e o segundo em 81.305, totalizando 174.582 tokens. O OSC (Operational System Corpus) foi compilado por Dernardin (2008) e estudado pelo mesmo autor juntamente com o BROWN.
10

Linguagens Especializadas em Corpora

209

corpora de ingls geral, sendo mais frequente na terceira posio. O could o quarto modal mais frequente em todos os seis corpora. A quinta posio ocupada por may em cinco e must em um dos corpora. Similarmente, a sexta posio ocupada por should em seis corpora e must em um, enquanto must possui a stima posio em quatro dos corpora investigados. Os modais might e shall ocupam respectivamente a oitava e a nona posies em todos os seis corpora de ingls geral. Cotejando os dados dos corpora de ingls geral com o OSC, possvel observar algumas diferenas marcantes. O can o VM mais frequente, diferentemente dos outros seis corpora. Em contrapartida, would, que nos outros corpora ocupa a primeira ou a segunda posio em ordem de frequncia, apenas o sexto no OSC. O mesmo pode ser dito sobre could, que o quarto em todos os corpora de ingls geral sendo apenas o oitavo no OSC. Should, must e shall no apresentam maiores variaes. Alm do fator frequncia, a LC tambm responsvel pela investigao de aspectos que costumavam ser desconsiderados ou receber pouca ateno, como por exemplo, o estudo das colocaes, neste trabalho entendidas como a tendncia com que certas palavras co-ocorrem com outras. As listas de colocaes podem ressaltar os diferentes significados de uma palavra, ou seja, os diferentes significados de uma palavra tendero a ter diferentes colocados. Para que sejam definidos os padres de uma palavra, faz-se necessrio averiguar as palavras e as estruturas regularmente associadas a ela que de alguma forma refletem no seu significado.

2. O Modal Can
Apresento a seguir algumas breves caractersticas sobre os diferentes sentidos e usos do VM can. H uma extensa variedade de perspectivas com relao ao tratamento terico dos VMs. Entretanto, como o foco prioritrio deste estudo colher subsdios para a elaborao de material de ingls com propsitos especficos, importante revisar o que a literatura voltada a professores de ingls (que no so necessariamente linguistas) oferece sobre o tema.

210

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Can pode expressar possibilidade [Even expert drivers can make mistakes. (Its possible for even)] (LEECH, 1989, p. 85). Leech afirma que esse sentido muitas vezes encontrado na forma negativa com cannot ou cant: [He cant be working at this hour! (Its not possible)]. s vezes, can expressa um significado relacionado a hbitos, que pode ser parafraseado pelo advrbio sometimes [Lightning can be very dangerous. (Lightning is sometimes very dangerous.)] (LEECH, 1989, p. 86). Can pode tambm expressar habilidade, com um sentido semelhante a be capable of, ou, quando for uma habilidade adquirida, com um sentido equivalente a know how to [Paula cant sing, but she can play the guitar. (She knows how to) / You can work harder than this. (are capable of)] (LEECH, 1989, p. 86). Segundo Leech (1989, p.86), com os verbos de cognio 11 inerte e de percepo inerte 12 h pouca diferena entre being able to do something e actually doing something. Em outras palavras, I can remember pouco difere de I remember como modo de se referir ao estado de lembrar. Com os verbos de percepo inerte, a principal funo expressar um estado (I can hear.) em contraste a uma percepo momentnea (I hear.). No h uma clara distino entre os significados de possibilidade e de habilidade, uma vez que o ltimo implica o primeiro. Uma possvel marca distintiva para o significado de possibilidade sua ocorrncia em oraes passivas [This game can be played by young children. (It is possible for this game)]. Entretanto, a sentena na voz ativa [(Even) young children can play this game], pode tambm ser interpretada como habilidade. Shawcross (1992), em seu livro que trata sobre a lingua tcnica dos manuais de aviao, confirma a semelhana entre esses dois significados, apresentando os usos de can sob o ttulo de possibilidade (SHAWCROSS, 1992, p. 93): Use Can + Infinitive to express possibility. (Its usually better than its possible to/that.). Aps essa breve explicao, Shawcross (1992, p. 94) oferece os seguintes exemplos:
11

Essa categoria engloba verbos como believe, forget, hope, imagine, know, suppose, understand etc. 12 Alguns exemplos de verbos assim classificados so feel, hear, see, smell e taste.

Linguagens Especializadas em Corpora

211

The A320 can carry 172 passengers. Coaxial cables can transmit numerous messages. In the event of an engine failure, the remaining engine can power all the hydraulic systems through the PTU. The APU can be started up to 25,000 feet. O autor denomina o seguinte uso de can de capacity: The outer tank can hold 3,500kg (SHAWCROSS, 1992, p. 95) Em lngua geral, o can tambm utilizado para pedir ou conceder permisso. [You can stay here as long as you like. / Can I borrow your pen?] Conforme Leech (1989), linguistas mais tradicionais 13 consideram esse uso de can como incorreto. Entretanto, Coates (1983) e Leech (1989) sugerem que can muito mais frequentemente utilizado como auxiliar de permisso do que may, forma tradicionalmente considerada correta. Coates (1983), Leech (1989) e Palmer (1990) sugerem que, nesses casos, can e may so praticamente intercambiveis, sendo que a principal diferena o fato de may ser considerado mais formal e, assim, mais corts.

3. O Corpus de Estudo: CORPUS DA AVIAO


O Corpus da Aviao (doravante CA) compreende dois manuais da aeronave Boeing 737: (i) o manual de manuteno (MM) destinado a mecnicos e tcnicos de aeronaves com um total de 249.691 palavras; e (ii) o manual de operaes (MO) para pilotos, com 183.959 palavras. O MM 14 contm as informaes necessrias para revises, resolues de problemas, verificaes, reparos e substituies de todos os sistemas e equipamentos instalados nas aeronaves 737300/400/500. Alm disso, o MM contm informaes relacionadas
13

Assim como pais e professores, que regularmente corrigem seus filhos e alunos. 14 O MM no foi utilizado na ntegra, pois obtive acesso somente a algumas partes dele. Alm disso, o manual como um todo muito maior do que o manual para pilotos, somando 98 captulos. Os captulos utilizados foram 0 (introduction), 5 (time limits/maintenance checks), 12 (servicing) e 20 (standard practices).

212

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

inspeo e manuteno das estruturas das aeronaves. Seguem alguns exemplos de concordncias do MM com o modal can.
N Concordance 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 THE OIL STAY ON YOUR SKIN. YOU CAN ABSORB POISONOUS YOUR SKIN FOR A LONG TIME. YOU CAN ABSORB POISONOUS OIL TOUCH YOUR SKIN. YOU CAN ABSORB TOXIC MATERIALS OIL TOUCH YOUR SKIN. YOU CAN ABSORB TOXIC MATERIALS SEALER FOR THE DECAL. YOU CAN BREAK THE EDGE SEAL WITH USE AN EXTENSION HANDLE. YOU CAN CAUSE DAMAGE TO SEALED THAN 55 PSI FUEL PRESSURE, YOU CAN . CAUSE DAMAGE TO THE IF YOU ARE NOT CAREFUL YOU CAN CAUSE DAMAGE TO THE IF YOU ARE NOT CAREFUL, YOU CAN CAUSE DAMAGE TO THE FROM SURFACES THAT MOVE. YOU CAN CAUSE FAILURE OF MOVING THE OTHER ENGINE PARTS. YOU CAN CAUSE INJURY TO YOURSELF IF S 683-060 C_A_U_T_I_O_N_: IF YOU CAN DRAIN THE FUEL FROM THE ONE THREAD . ENGAGED. YOU CAN COMPRESS THE UNION AND THE VACUUM BREAK VALVE, YOU CAN DAMAGE THE VSCF. (4) ON THE VACUUM BREAK VALVE, YOU CAN DAMAGE THE VSCF. (3) Remove THE VACUUM BREAK VALVE, YOU CAN DAMAGE THE VSCF. (a) ON

O MO fornece as informaes relativas aos sistemas da aeronave, desempenho, procedimento e limitaes nas operaes, isto , o que a tripulao de vo necessita saber para operar a aeronave 737 de forma eficiente e segura durante as operaes previstas. Seguem alguns exemplos de concordncias do MO com o modal can:
N Concordance 1 2 4 6 7 8 9 10 extends outboard of measuring stick 4 can be used as an indication of the Increased thrust lever activity can be expected when encountering enabled. 8 Speed Brake Lever Actuator Can be armed to raise ground spoilers realignment cycle before the airplane can be moved. April 28, 2000 737 for the origin and destination airport can be selected for entry into the flight 1000 feet. Airspeed Entry Airspeeds can be entered into the FMC as windshear. Predictive windshear alerts can be enabled prior to takeoff by windshear. Predictive windshear alerts can be enabled prior to takeoff by

3 disabled. 8 Speed Brake Lever Actuator Can be armed to raise ground spoilers 5 total hydraulic power failure the ailerons can be mechanically positioned by

Na tabela 1, resumo as principais informaes de cada manual, incluindo a sua dimenso.

Linguagens Especializadas em Corpora

213

Tabela 1: Sntese do CA
Dados 737-300/400/500 Manual de Manuteno (MM) 737-7l9 Manual de Operaes (MO) Data Novembro / 1998 Destinatrio Mecnicos de aeronaves Objetivo Informaes necessrias para a manuteno das aeronaves nos hangares Informaes relativas aos sistemas da aeronave; para ser utilizado em treinamento ou em vo Tokens 249.691

Julho / 2000

Pilotos

183.959

Corpus da Aviao (CA)

433.650

4. Metodologia
A observao contribui mais para a teoria do que a teoria contribui para a observao (LEECH, 1992, p. 111). Seguindo nessa linha e diante da inexistncia de um modelo especfico para a anlise de VMs em textos tcnicos, procurei estabelecer os princpios que nortearam a escolha e a delimitao das unidades de anlise, bem como a estruturao das fases da pesquisa. A metodologia tem o reflexo de estudos prvios, que contriburam para a compreenso do emprego dos VMs nos manuais de aviao e para o amadurecimento do presente trabalho (SARMENTO, 2005a; SARMENTO, 2005b; SARMENTO 2007; GABRIELATOS e SARMENTO 2006). Os manuais utilizados j estavam em formato digital, em pdf no protegido. Isso exigiu que os textos fossem transformados para arquivo.txt para que pudessem ser estudados atravs da ferramenta WordSmith Tools, pois a ferramenta somente aceita textos no formato .txt. Aps a converso, foi feita uma limpeza manual dos textos. O WordSmith Tools um conjunto de programas integrados destinados anlise lingustica. O programa foi desenvolvido em 1996 por Mike Scott e publicado pela Oxford University Press e est atualmente em sua quinta verso. Neste trabalho fao uso da verso 5 15. O WordSmith
15

A licena para utilizar tal ferramenta pode ser obtida atravs do site: http://www.lexically.net/wordsmith/.

214

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

possui as ferramentas- WordList, Keywords, Concord. Neste trabalho utilizei principalmente algumas funes do WordList e do Concord. Num primeiro momento utilizei o WordList para verificar o nmero exato de tokens em cada um dos subcorpora que compe o CA. Aps esse primeiro levantamento, foi utilizado o seguinte roteiro metodolgico: i) Verificao das diferenas quanto frequncia do VM can e de cada estrutura em cada um dos dois subcorpora que compem o corpus de estudo. Foi utilizada a ferramenta Concord para obter as concordncias atravs de uma lista contendo todas as ocorrncias de can e seu cotexto. Cada palavra investigada destacada no centro de um fragmento do texto. Logo aps, para levantamento das estruturas sintticas, utilizei como ponto de partida as nove estruturas gramaticais sugeridas por Kennedy (2002), conforme o quadro abaixo:
1 2 3 Estrutura Modal sozinho Modal + infinitivo (modal + voz ativa) Exemplo (Who will go?) I will. Sam can swim./ She must be hungry./ You should have a rest. It should be replaced. They will be arriving soon. He might have done it. He must have been hungry. It might be being done tomorrow. He could be being awkward. It should have been fixed. He must have been lying. He might have been being blackmailed. They must have been being careless.

Modal + be + passado particpio (modal+ voz passiva) 4 Modal+be+presente particpio (modal+progressivo) 5 Modal+have+passado particpio (ou adjetivo) (modal+perfeito) 6 Modal+be+being+passado particpio (ou adjetivo) (modal+be+progressivo+passado particpio/adjetivo) 7 Modal+have+been+passado particpio (Modal+voz passiva+perfeito) 8 Modal+have+been+presente particpio (modal+voz passiva+progressivo) 9 Modal+have+been+being+passado particpio (ou adjetivo) (modal+voz passiva+perfeito+progressivo) Quadro2: Estruturas sintticas dos modais (KENNEDY, 2002, p. 82)

Linguagens Especializadas em Corpora

215

Foi utilizado o Concord, do WordSmith e feita uma anlise manual de todas as linhas de concordncia. Primeiramente, as linhas de concordncia foram analisadas com vistas a classific-las conforme as nove estruturas presentes na tabela proposta por Kennedy (2002). As linhas foram salvas em arquivos separados j classificadas nessas estruturas, pois, a partir deste ponto, as outras anlises sero sempre feitas conforme as estruturas em que can se encontra. ii) Identifico as colocaes de can em cada um dos subcorpora. Os resultados mostram que no Corpus de Aviao (CA), h duas estruturas sintticas predominantes, conforme a tabela proposta por Kennedy (2002): a) Estrutura 2- modal +infinitivo (modal + voz ativa) Exemplo: Airplanes may operate with uncured fay sealant or aerodynamic sealant on wing external surface. b) Estrutura 3- modal + be+ passado particpio (modal+ voz passiva) Exemplo: The following is a list of cleaners and polishes that could be required . during regular maintenance of the airplane. A lista de colocados s pode ser obtida se alguns critrios forem cumpridos. Um desses critrios que, pelo menos um dos colocados do ndulo apresente uma frequncia mnima de quatro unidades em um horizonte de seis palavras, trs esquerda (L1, L2 e L3) e trs direita (R1, R2 e R3). Os resultados sero apresentados da seguinte forma: As duas sub-etapas so: A: Colocados esquerda B: Colocados direita Descrevo e explico agora essas duas sub-etapas e mostro as categorias que foram usadas para classificar as ocorrncias. A: Colocados esquerda (L1, L2, L3) Relao dos 10 colocados esquerda com maior grau de atrao. Uma lista de colocados fornece uma espcie de perfil semntico das palavras envolvidas. Essas listas de colocados foram feitas para

216

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

cada modal em cada uma das estruturas encontradas . Para medir a fora ou o grau de cada colocao, foi utilizado o teste estatstico Log Likelihood. Se o resultado obtido aps a aplicao do LL foi de 6,63 ou mais, a probabilidade de a atrao entre os dois itens lexicais ter acontecido aleatoriamente de menos de 1%. Dessa forma, o pesquisador pode estar 99% certo de que o resultado significativo. A funo da estatstica apontar se os itens realmente formam colocaes ou se so co-ocorrncias esprias. Os clculos no foram realizados por mim, mas pelo prprio WordSmith, que apresenta tambm outras opes de testes estatsticos para medir a fora de uma colocao (HUNSTON, 2002). Mede-se o grau de associao entre duas palavras tendo em vista o nmero de vezes que essas duas palavras ocorrem juntas. Ou seja, quanto mais vezes dois elementos ocorrem simultaneamente e menos vezes ocorrem separadamente, mais forte ser sua associao. Um elevado valor da medida de associao indica que as variveis em causa esto associadas, isto , a ocorrncia de uma delas est associada ocorrncia da outra. Cada estatstica tende a trazer resultados diferentes. De modo sucinto, a diferena entre as estatsticas que, alguns testes (por exemplo, o Mutual Information, MI) capturam associaes em que os itens aparecem juntos frequentemente em termos relativos, enquanto outros apontam associaes em que os itens co-ocorrem frequentemente em termos absolutos. Isso significa dizer que o MI localiza pares de palavras que aparecem juntos muitas vezes em relao frequncia de um e de outro, mesmo que cada um ocorra poucas vezes. J o LL d preferncia aos colocados que so, por si s, muito frequentes. Como o objetivo deste trabalho descrever o que mais frequente no CA para auxiliar na elaborao de material didtico, entendo o LL mais apropriado para esse fim. Dessa forma, so considerados colocados, os itens lexicais que se coloquem dentro de um horizonte de trs palavras esquerda (posies L1, L2 e L3) a trs palavras direita (posies R1, R2 e R3) do ndulo, com uma frequncia mnima de quatro ocorrncias, e uma relao LL de pelo menos 6,6. Atravs da lista de colocados possvel verificar se algum item lexical se destaca em termos de frequncia ou

Linguagens Especializadas em Corpora

217

fora de associao. Assim, nessa fase, j possvel verificar algumas caractersticas relativas ao comportamento do ndulo no corpus. A partir da verificao das listas de colocados esquerda do ndulo, foi possvel observar uma variao na classe de palavras que ocupam a posio L1, isto , uma posio esquerda do ndulo, que corresponderia teoricamente ao sujeito do VM. Foi necessrio analisar todas as linhas de concordncia do ndulo can de forma a verificar que tipo de estrutura compunha essas posies esquerda (L1, L2, L3). A partir dessa verificao, foi possvel classificar os colocados esquerda em cinco grupos: (1) You; (2) anforas; (3) unidades simples; (4) sintagmas nominais; (5) sintagmas verbais e preposicionais. Essas categorias surgiram dos dados e no foram baseadas em uma taxonomia pr-existente. Como este trabalho visa fornecer subsdios para a elaborao de material didtico, considerei importante classificar os tipos de elementos lexicais que antecedem o VM can por acreditar que alguns deles impem mais dificuldade na compreenso da funo do modal, uma vez que apresentam o sujeito separado do VM por outros elementos lexicais intermedirios. Esse tipo de construo deve merecer mais destaque nos materiais didticos. O nico dos grupos (nas posies L1, L2, L3) constitudo de um nico item lexical o grupo you. Esses grupos so descritos a seguir: (1) You - You no foi classificado em um grupo juntamente com outros pronomes pessoais retos por apresentar uma funo diferente nesses textos. Por tratar-se de um tipo de texto com caractersticas denticas que estabelece o que pode ou no ser feito, e o que ou no possvel, you difere dos usos dos outros pronomes pessoais que nesses textos, ocupam a funo de um elemento anafrico. Segue alguns exemplos ilustrativos do you + can:

218

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

N Concordance 1 3 4 5 6 7 will dry on the surface before you can flush it with water. EFFECTIVITY. . it has these properties: (1) You can fill the tanks with fuel more quickly IF THE OIL TANK IS COOL, YOU CAN FILL IT TOO MUCH AND CAUSE of the tanks at the same time. (3) You can fill only one tank if it is necessary. as far as the attached hardware. You can fully seal the attached hardware. If of the fuselage, section 48 that you can get access to. Look at the structure 2 surface can dry the cleaners before you can flush them with water. The dried

(2) Anforas - Neste grupo h sempre um elemento anafrico na posio L1, como por exemplo, this, which, it, that, they, these e who. Lembrando que elementos anafricos so aqueles que retomam um elemento referencial. Vide os exemplos abaixo:
N Concordance 25 26 27 28 29 beam. N_O_T_E_: A device which can find mercury (mercury sniffer) is movement of items or equipment which can hit the airplane or injure persons. bearings, screens, screws, etc. This can also include capping of lines, in order to perform the task. This can also include uncapping of lines, TEMPERATURES CAN OCCUR. THIS CAN CAUSE A FIRE OR EXPLOSION

(3) Unidades simples - Foram consideradas unidades simples os casos em que h apenas um substantivo, precedido por um determinante ou no. Seguem alguns exemplos ilustrativos deste grupo:
N Concordance 2 3 4 6 with hot or cold water immediately. Alcohol can also be used. S 162-036 (5) Dry the BEFORE YOU START THE APU. THE APU CAN BE DAMAGED BY THE ICE OR SNOW Strike Zone (Zone 1, Fig. 201). Damage can also be found on the skin trailing edge TIRE OR WHEEL. AN EXPLOSION CAN BE CAUSED AND INJURY TO

5 the damaged area you can see. Delamination can be found by instrumental NDI procedures

(4) Sintagmas nominais - Foram includos nesse grupo os colocados esquerda representados por sintagmas nominais com pelo menos dois elementos, como mostra os exemplos abaixo:

Linguagens Especializadas em Corpora

219

N Concordance 1 2 3 4 5 6 show more oil than there is. Expanded air can push the oil from the oil cooler into the (450F). Heat guns and soldering guns also can contain electrical switches which can HIGH HAZARDOUS GAS CONTENT AREA CAN CAUSE AN EXPLOSION. THE the airplane. C. Many small leakage areas can add to create an excessive fuselage W_A_R_N_I_N_G_: VOLCANIC ASH CAN IRRITATE YOU EYES AND BE A power in the battery. A fully charged battery can operate the refuel system for 15 to 20

(5) Sintagmas verbais e preposicionais - Este grupo constitudo de dois tipos de colocados esquerda: os sintagmas verbais, por exemplo: oil system parts that are hot can; e sintagmas preposicionais, por exemplo, damage to the valve can occur. A caracterstica em comum neste grupo o fato de o sujeito, ou referencial, do VM no estar diretamente (imediatamente) ligado a ele, conforme os exemplos abaixo:
N Concordance 1 2 3 5 6 impedance changes from 10mp to 100mp can possibly be a cable connector and are TO THE UNIT YOU ARE NOT SURE ABOUT CAN MELT AND LET SOME WATER AND of the external surfaces of the airplane can be below freezing, ice can occur and AND SLATS ARE FAST ACTING AND CAN CAUSE SERIOUS INJURY TO OIL WILL PUT STAINS ON CLOTHES AND CAN MAKE PAINT SOFT. (3) Remove the filler

4 LOAD LIMITS. DAMAGE TO THE AIRPLANE CAN OCCUR. (a) Calculate the value that each

importante ressaltar que, para a classificao dos grupos You, anforas e unidades simples foram considerados somente os colocados na posio L1. Para os sintagmas nominais e sintagmas verbais e preposicionais, no foi estabelecido uma posio limite, uma vez que o sujeito pode ser um composto nominal de at quatro elementos, ou uma orao completa. Outro fato a ser comentado que com exceo do grupo you, os outros grupos so compostos por elementos inanimados na posio de sujeito. B: Colocados direita (R1, R2, R3) Analiso os colocados direita de can em cada uma das estruturas a partir da lista de colocados. Mostro os 10 colocados com maior grau de atrao ao ndulo (quando houver 10). Diferentemente dos colocados nas posies esquerda, que podem pertencer a diferentes classes gramaticais, a posio R1 apresenta uma restrio

220

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

gramatical quanto ao tipo de elemento lexical que pode seguir o VM. Dessa forma, o VM pode ser imediatamente seguido apenas por verbo ou advrbio. Nos casos de VM + voz passiva, o be no considerado um colocado do VM por ser considerado elemento obrigatrio para estabelecer a estrutura. Assim, nos casos de voz passiva, a posio R1 a primeira posio aps o be. Finalmente, com o objetivo verificar o sentido de cada ocorrncia, so usados os resultados das etapas anteriores. Parto das categorias e exemplos apresentados no referencial terico para analisar os sentidos, usos e peculiaridades de can no CA. Entretanto, tambm verifico a possibilidade de o VM estar expressando uma funo no antes descrita. Apresento exemplos retirados do corpus que expressam os usos mais salientes em cada um dos subcorpora. Foi observado um contexto estendido, alm de somente a linha de concordncia, sempre que necessrio para classificar o uso expresso pelo VM. 5. Can e suas companhias Nesta seo, os resultados sero apresentados separadamente por manual, uma vez que so escritos para pblicos alvo diferentes. Apresentarei os usos e funes do VM can nos manuais e mostrarei as ocorrncias mais significativos desse VM para fins didticos, ou seja, os exemplos que poderiam constar em materiais elaborados para mecnicos e pilotos. Can no Manual de Manuteno (MM) No MM, o modal can, apresenta um total de 809 ocorrncias, sendo 723 ocorrncias na voz ativa e 86 ocorrncias na voz passiva. Colocados esquerda A Tabela 2 mostra os dez principais colocados esquerda de can juntamente com a quantidade bruta de ocorrncias.

Linguagens Especializadas em Corpora

221

Tabela 2: Colocados esquerda de can no MM


Posio 1 2 3 4 5 6 7 8 9 10 Colocado you (L1) which (L1) this (L1) that (L1) oil (L1) it (L1) agents (L2) hot (L1) explosion (L1) flammable (L3) Voz ativa Quantidade 190 27 34 37 33 26 12 16 9 12 Relao LL 1.292,39 190,39 190,31 179,18 168,68 152,53 109,64 109,62 106,88 103,76 Colocado sealed (L2) force (L3) they (L1) bearings (L1) grease (L3, L2) which (L1) --------------------Voz passiva Quantidade Relao LL 4 4 4 4 4 4 --------------------25,70 23,86 16,75 11,00 8,60 7,65 ---------------------

Destaca-se sobremaneira a frequncia e a fora de atrao de you can na voz ativa. tambm surpreendente, a variedade de diferentes classes de palavras que ocupam a primeira posio esquerda de can, com vrios determinantes (which, this, e that), e um adjetivo (hot). Por tratar-se de um verbo, a expectativa era de haver substantivos, como no caso de oil e explosion ou pronomes pessoais retos, como you. A lista de colocados fornece pistas a respeito do ndulo. Entretanto, faz-se necessrio conhecer e classificar todos os colocados esquerda de can. Aps a anlise de todas as linhas de concordncia de can, os resultados foram agrupados em cinco categorias, como mostra a Tabela 3. Tabela 3: Classificao das unidades lexicais esquerda de can no MM
Voz ativa Colocados Quantidade You (L1) 190 / 26,3% Anforas (L1) 97 / 13,4% Unidades simples 88 / 12,2% (L1) Sintagmas 149 / 20,6 % nominais Sintag. verbais e 199 / 27,5% prepos. Total 723 / 100% Voz passiva Colocados Quantidade You (L1) ----Anforas (L1) 13 / 15,1% Unidades simples (L1) 15 / 17,4% Sintagmas nominais Sintag. prepos. Total verbais e 28 / 32,6% 30 / 34,9% 86 / 100%

222

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Como pode ser visto, o you sozinho responde por 26,3% das ocorrncias de can na voz ativa no MM. Os outros grupos so formados por variados itens lexicais. Como era de se esperar, o you no est presente nos casos de can +voz passiva, pois os colocados esquerda em uma orao passiva no so geralmente pronomes pessoais retos. Colocados direita Mostro agora os colocados direita de can. Tabela 4: Colocados direita de can no MM
Posio Colocado cause (R1) occur (R1) damage (R2) injury (R2) use (R1) be (R1) injuries (R2) come (R1) get (R1) burn (R1) Voz ativa Quantidade 218 84 72 43 52 46 15 12 26 13 Relao LL 2.197,82 844,07 702,85 535,31 239,65 225,43 150,42 139,47 135,12 134,38 Colocado Voz passiva Quantidade Relao LL 11 12 13 6 4 7 --------------------56,66 53,63 45,65 30,21 7,60 6,79 ---------------------

1 2 3 4 5 6 7 8 9 10

damaged (R1) used (R1) by (R2) found (R1) that (R2) with (R2) ---------------------

Nesta lista dos principais colocados direita de can no MM, nota-se que aparecem apenas verbos na posio R1, como esperado. bastante saliente, entretanto, a frequncia e atrao do verbo lexical cause na voz ativa. As 218 ocorrncias de can cause correspondem a mais de 30% do total de ocorrncias de can (voz ativa) no MM. Os verbos occur e use tambm apresentam uma forte atrao com o modal can. Destaco que o cpula be, entre os colocados de can na voz ativa, no um verbo auxiliar como no caso das construes passivas, mas o verbo principal. Ele o quarto verbo com maior atrao a can. Nas ocorrncias de can na voz passiva, os verbos com maior grau de atrao so damaged e used, que apresentam um grau de atrao bem inferior a cause na voz ativa. A ser destacado, mas que na verdade no apresenta qualquer surpresa, a presena da preposio by, que geralmente usada em construes passivas para apontar a

Linguagens Especializadas em Corpora

223

entidade que realizou a ao. Alm disso, destaca-se tambm a presena do verbo found. Usos e funes Aps a anlise detalhada de todas as ocorrncias, foi constatado que no MM: Can usado com maior frequncia na voz ativa, na proporo de nove ocorrncias na voz ativa para apenas uma na voz passiva. usado principalmente na forma afirmativa, na proporo de uma ocorrncia negativa (seguida pelo advrbio not) a cada dez afirmativas. Todas as ocorrncias afirmativas de can expressam a idia de possibilidade, podendo essa possibilidade ser relacionada a uma prosdia semntica 16 neutra ou negativa Quando can acompanhado por um verbo causativo 17 (cause, por exemplo) ou de ocorrncia (occur, por exemplo), ele utilizado para expressar uma consequncia negativa que pode acontecer devido a uma ao mal realizada pelo mecnico. Em outras palavras, nesses casos, can possui uma prosdia semntica negativa. Can aparece frequentemente nas sees de warning (aviso) ou caution (cuidado), com um total de 358 ocorrncias. O uso de can nessas sees sempre vinculado a uma prosdia semntica negativa. Can acompanhado de outros tipos de verbos no apresenta a caracterstica de expressar uma consequncia negativa de forma to marcante. Sua funo geralmente expressa apenas uma possibilidade mais neutra, mostrando possveis aes a serem realizadas.
Prosdia semntica o termo usado para referir a palavra ou expresso usada em um contexto especfico de tal forma que a palavra/expresso adquira certa conotao naquele contexto. Um exemplo seria a expresso sit through (HUNSTON, 2002, p. 141), que geralmente usada com itens que indicam algo longo e cansativo, ou seja, assume uma conotao de algo tedioso, portanto uma conotao negativa. 17 Taxonomia utilizada por Biber et al (1999).
16

224

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Can ocorre com certa frequncia em oraes condicionais com a presena da conjuno if (74 ocorrncias), principalmente na orao principal de uma condicional (60 ocorrncias). Entretanto, can tambm aparece na orao subordinada (14 ocorrncias). Nos contextos negativos tambm predomina a funo de possibilidade, ou melhor, de ausncia de possibilidade devido a uma causa externa. Apenas trs ocorrncias de cannot expressam a idia de forte recomendao negativa; isto , recomendando ao mecnico no usar certos dispositivos, por exemplo: C_A_U_T_I_O_N_: SOME OIL TYPES CANNOT BE MIXED WITH OTHER TYPES OF OIL. DO NOT MIX OIL TYPES, UNLESS YOU ARE SURE THAT THEY CAN BE MIXED OR ENGINE DAMAGE CAN OCCUR. Com base nos resultados apresentados, ilustro as caractersticas e usos mais salientes de can no manual de manuteno. 1-C_A_U_T_I_O_N_: CAREFULLY MOVE ROPES OR FABRIC HOSES ON THE WING OR FUSELAGE. EQUIPMENT THAT IS INSTALLED ON THE SURFACE OF THE WING OR FUSELAGE CAN BE DAMAGED BY THE MOVEMENT OF THE ROPES OR FABRIC. 2- N_O_T_E_: If the fan (N1) cannot turn during an engine start because of ice, this can cause heavy damage. 3- If you can see the lining after bolt removal, refer to the bench check instructions and examine the lining material. 4- W_A_R_N_I_N_G_: INSTALL LEADING EDGE FLAP AND SLAT LOCKS TO PREVENT INADVERTENT OPERATION OF LEADING EDGE FLAPS AND SLATS. FLAPS AND SLATS ARE FAST ACTING AND CAN CAUSE SERIOUS INJURY TO PERSONNEL. 5- Immediately after refueling, the fuel quantity shown on the FMC can be less than the actual fuel quantity in the tank. Can no Manual de Operaes (MO) No MO, can o modal mais frequente apresentando um total de 327 ocorrncias, sendo 85 ocorrncias na voz ativa e 242 ocorrncias na voz passiva.

Linguagens Especializadas em Corpora

225

Colocados esquerda A Tabela 5 mostra os dez principais colocados esquerda juntamente com a quantidade bruta de ocorrncias. Tabela 5: Colocados esquerda de can no MO
Posio 1 2 3 4 5 6 7 8 9 10 Voz ativa Colocado Quantidade it (L1) 4 FMC (L3) 5 APU (L1) 4 ------------------------------------------------------------------------------------Voz passiva Relao LL Colocado Quantidade 19,42 but (L2) 4 8,33 mode (L1) 12 7,50 thrust (L2) 10 ------modes (L1) 7 ------it (L1) 6 ------waypoints (L1) 6 ------entry (L1) 8 ------this (L2) 7 ------information (L1) 7 ------executed (L2) 4 Relao LL 41,34 36,83 36,46 36,41 34,04 31,78 31,39 30,75 30,35 28,59

No h um item lexical que apresente uma preferncia que se destaque. Nota-se, por outro lado, a ausncia do pronome you e a baixa ocorrncia de elementos anafricos. Tabela 6: Classificao das unidades lexicais esquerda de can no MO
Voz ativa Colocados You (L1) Anforas (L1) Simples (L1) Sintagmas nominais Sintag. verbais e prepos. Total Quantidade ------4 / 4,7% 21 / 24,7% 30 / 35,3% 30 / 35,3% 85 / 100% Voz passiva Colocados Quantidade You (L1) ------Anforas (L1) 13 / 5,4% Simples (L1) 54 / 22,3% Sintagmas nominais 126 / 52,1% Sintag. verbais e 49 / 20,2% prepos. Total 242 / 100%

Como pode ser visto, o grupo dos sintagmas nominais preferido por can na voz ativa e empata com o grupo de sintagmas verbais e preposicionais na voz passiva. Os elementos anafricos apresentam poucas ocorrncias nas duas estruturas. Colocados direita Mostro agora os colocados direita de can.

226

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Tabela 7: Colocados direita de can no MO


Posio Colocado 1 2 3 4 5 6 7 8 9 10 cause (R1) include (R1) supply (R1) also (R1) power (R2) operate (R1) occur (R1) provide (R1) either (R2) be (R1) Voz ativa Quantidade 8 7 7 7 7 5 5 5 4 7 Relao LL 61,130 58,679 49,692 39,925 32,594 32,329 28,880 28,313 20,890 17,651 Colocado selected (R1) by (R2) used (R1) reengaged (R1) also (R1) from (R2) opened (R1) on (R2) made (R1) engaged (R1) Voz passiva Quantidade 20 34 17 5 9 12 5 19 7 6 Relao LL 128,946 125,537 108,128 59,708 56,011 55,289 54,536 51,752 49,970 47,499

Nesta lista dos principais colocados direita de can no MO, nota-se que os verbos que ocorrem na voz ativa no se repetem na voz passiva, sendo cause o mais frequente na voz ativa e selected na passiva. A preposio by um colocado forte de can (voz passiva), ocorrendo em aproximadamente 11% dos casos. O advrbio also o nico item lexical que aparece nas duas estruturas. Usos e funes Foi constatado que: Can usado com maior frequncia na voz passiva, na proporo de trs ocorrncias na voz passiva para uma ocorrncia na voz ativa. usado principalmente na forma afirmativa, na proporo de uma ocorrncia negativa a cada cinco afirmativas. Todas as ocorrncias de can em frases afirmativas expressam possibilidade. Can, quando acompanhado por um verbo causativo ou de ocorrncia expressa uma consequncia negativa que pode acontecer devido a uma ao mal realizada pelo piloto ou pelo mau funcionamento da aeronave. A funo de by nas ocorrncias de can na voz passiva indica um agente animado, neste caso, pilotos (flight crew) em apenas quatro casos, ou 12%. Nos outros casos, by

Linguagens Especializadas em Corpora

227

indica o procedimento que pode gerar a ao j descrita esquerda de can. Com base nos resultados apresentados acima, ilustro as caractersticas e usos mais salientes de can no MO. 1-The engine indications can also be manually selected to either the Captains or First Officers inboard DU, or the lower DU, using the respective display select panel. 2- Air for the bleed air system can be supplied by the engines, APU, or an external air cart/source.. 3- After localizer and glideslope capture during a dual autopilot approach, CWS cannot be engaged by manually overriding pitch and roll.. 4- A spinning tire with a loose tread must be stopped prior to entering the wheel well or it can cause damage to wheel well components.

6. Consideraes Finais
Foi observada uma grande diferena na quantidade de colocados em cada um dos subcorpora na voz ativa. Os colocados 18 no MM apresentam uma frequncia, ou fora de colocao bem superior ao MO: por exemplo, o pronome you apresenta 191 ocorrncias como colocado de can, ao passo que o colocado mais forte de can no MO apresenta somente 12 ocorrncias (mode). De forma geral, conclui-se que can encontra-se frequentemente em estruturas sintticas bastante complexas. Essa constatao relevante tendo em vista o objetivo final desta pesquisa que o de obter subsdios para a elaborao de materiais didticos para fins especficos. No suficiente apenas apresentar o VM e apontar o seu valor semntico, isto , se o modal expressa uma possibilidade, uma proibio ou uma obrigao. Um material didtico adequado deve apresentar o modal dentro do seu contexto real de uso para que os alunos possam compreend-lo quando lerem os manuais. Assim, a apresentao de exemplos somente com unidades simples ou you como sujeitos,
18

So considerados colocados os itens lexicais localizados em um horizonte de trs casas direita e trs esquerda, com frequncia mnima de quatro e valor LL de 6,63 ou maior.

228

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

provavelmente no capacitar os alunos a entender as oraes com modais nos manuais, j que no representam a maioria dos casos. Quanto aos colocados direita foi possvel notar que alguns verbos se repetem nos dois manuais, como be, cause e result. 19 Como j visto, as situaes que apresentam os verbos cause e occur como colocados, no expressam mera possibilidade, mas anunciam uma consequncia negativa, fruto de uma ao mal realizada ou de um problema no funcionamento da aeronave. Ressalto que essa caracterstica deveria ser explicitada em livros de ingls para aviao. Apesar de by aparecer como colocado de can na voz passiva em ambos os subcorpora, nota-se que a grande maioria das ocorrncias de can na voz passiva acontece sem a presena do agente que executa ou deve executar a ao expressa pelo verbo principal. Essa informao importante porque muitos livros-texto e gramticas da lngua inglesa apresentam a voz passiva geralmente acompanhada pela preposio by. Entretanto, esse no o caso no CA e tais resultados devem ser considerados nos exemplos e exerccios nesta rea. A presena de can + be deve ser destacada. Essa a associao mais frequente entre todas as associaes no CA (considerando todos os casos, voz ativa e voz passiva juntas). Apesar de be no ter sido considerado colocado na voz passiva, por fazer parte da estrutura, ele encontra-se tambm presente nesses casos. de extrema importncia que essa caracterstica seja explicitamente apresentada nos materiais didticos, pois a estrutura modal na voz passiva rene os dois maiores causadores de dificuldades de compreenso de textos tcnicos entre falantes no-nativos (TRIMBLE, 1985). Nesse sentido, pilotos e mecnicos devem ser ensinados a distinguir entre a estrutura modal + be nas vozes ativa e voz passiva para, ao lerem os manuais (de manuteno ou operao), saibam exatamente o que est sendo instrudo ou indicado atravs do modal. As sees warning e caution recebem um tratamento diferenciado nos dois manuais. Reproduzo um exemplo no MO para pilotos:

19

Apesar de haver uma incidncia muito mais alta desses verbos no MO.

Linguagens Especializadas em Corpora

229

CAUTION: An operating procedure, technique, etc., that can result in damage to equipment if not carefully followed. possvel observar que a seo no devidamente destacada, somente CAUTION est em caixa alta. Blake e Bly (1993) sugerem que destaque grfico para as sees cruciais em um manual fundamental para salientar a importncia da seo de forma. Por outro lado, no MM, a seo de warning aparece da seguinte forma: W_A_R_N_I_N_G_: MAKE SURE EACH TUBE AND THE PORT FITTINGS HAVE TAGS TO IDENTIFY THE CORRECT INSTALLATION LOCATION. IF YOU DO NOT PUT TAGS ON THE TUBES AND PORT FITTINGS, CROSS-CONNECTION OF THE TUBES CAN OCCUR DURING INSTALLATION. IF THE TUBES ARE CROSS-CONNECTED, UNINTENDED OPERATION OR MALFUCTION OF AIRPLANE SYSTEMS CAN RESULT AND CAUSE INJURY TO PERSONS AND DAMAGE TO EQUIPMENT. Pode-se notar que essa seo destacada pelo uso da caixa alta e tende a ser longa, explicando os procedimentos e as consequncias mais detalhadamente. Uma possvel explicao para esse diferente tratamento pode ser atribuda s condies de trabalho e ao local de consulta dos manuais. Sem ter o propsito de avaliar o grau de profissionalizao de qualquer um dos destinatrios dos manuais, sejam eles mecnicos ou pilotos, fundamental lembrar que uma ao mal realizada pelo mecnico pode colocar muitas vidas em risco, mas no necessariamente a dele, ao contrrio dos pilotos, cujas aes tm reflexo na sua prpria vida. Assim, as possveis trgicas consequncias de uma execuo ineficaz, devem ser explicitadas de forma mais marcante no MM. Outra explicao para a diferena entre o MO e o MM, que no necessariamente anula a anterior, a de que so necessrios muitos anos de treinamento terico e prtico para que um piloto possa voar um Boeing. Dessa forma, esse profissional conhece melhor as causas e as consequncias de aes e problemas com a aeronave. Por outro lado, os mecnicos fazem um curso tcnico bem direcionado e mais sucinto, mas em menos de um ano j esto capacitados a trabalhar na manuteno das aeronaves. Os resultados obtidos nesta pesquisa mostram que somente uma abordagem descritiva baseada em corpus pode desvendar a riqueza de

230

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

detalhes necessria para melhor compreenso de um item lexical. De acordo com Hoffmann (1998[2007]), importante escolher e delimitar o material de ensino de forma que o aluno possa aprender, em menor tempo, a quantidade mxima possvel de conhecimentos. O autor considera que esse mnimo de contedo necessita conter as ocorrncias lexicais e gramaticais mais teis, e que o desvendar desse mnimo constitui o cerne das pesquisas voltadas ao ensino de lnguas estrangeiras com propsitos especficos.

Referncias Bibliogrficas
BIBER, D.; JOHANSSON, S.; LEECH, G.; CONRAD, S.; FINEGAN, E. Longman Grammar of Spoken and Written English. London: Longman, 1999. BYBEE, J. The Semantic Development of Past Tense Modals in English. In: Bybee, Joan; Fleischman, Suzanne. Modality in Grammar and Discourse. Philadelphia: John Benjamins, 503-517, 1995. BLAKE, G. E BLY, R. W. The Elements of Technical Writing. The essential guide to writing clear, concise proposals, reports, manuals, letters, memos, and other documents in every technical field. New York, Macmillan General Reference, 1993. COATES, J. The Semantics of the Modal Auxiliaries. London & Canberra: Croom Helm, 1983. COATES, J. The Expression of Root and Epistemic Possibility in English. In: Bybee, Joan; Fleischman, Suzanne. Modality in Grammar and Discourse. Philadelphia: John Benjamins, 55-66, 1995. DENARDIN, F. W. Central Modals in an Operating System Corpus: Frequency, Distribution and Teaching Suggestions. Monografia de Especializao. Porto Alegre, PUC-RS, 2008. DENISON , D. English Historical Syntax. London: Longman, 1993. FIRTH, J. R. Papers in linguistics 1934-51. London: Oxford University Press, 1957. GABRIELATOS, C, SARMENTO, S. Central Modals in an Corpus da Aviao: Frequency and distribution.. Letras de Hoje, Vol 41, N.2. Porto Alegre: EDIPUCRS, 2006.

Linguagens Especializadas em Corpora

231

HOFFMANN, L. Possibilidades de aplicao e a aplicao atual de mtodos estatsticos na pesquisa de linguagens especializadas (Ttulo Original: anwendungsmglichkeiten und bisherige Anwengung von Statistischen Methoden in der Fachsprachenforschung, 1998). Disponvel em: Cadernos de Traduo, Porto Alegre, n 20, janeirojunho, p. 61-76, 2007 HOFFMANN, L. Conceitos Bsicos da Lingustica das Linguagens Especializadas (Ttulo Original: Grundbegriffe der Frachsprachenlinguistik, 1988). Disponvel em: Cadernos de Traduo, Porto Alegre, n 17, outubro-dezembro, p. 79-90, 2004. HOYE, L. Adverbs and Modality in English. Essex: Longman,1997. HUNSTON, S. Corpora in Applied Linguistics. London: Cambridge University Press, 2002. KENNEDY, G. D. Variation in the distribution of modal verbs in the British National Corpus. In: Reppen, R.; Fitzmaurice, S.M., Biber, D. Using Corpora to Explore Linguistic Variation. Amsterdan: John Benjamins: 73-91, 2002. LEECH, G. N. O significado do verbo em ingls. So Paulo: tica.1989 McENERY, T; XIAO, R. e TONO, Y. Corpus-based Language Studies: an advanced resource book, Oxon: Routledge, 2006 NEVES, Maria Helena de Moura. A gramtica funcional. So Paulo: Martins Fontes, 2004. PALMER, F.R. Mood and Modality. Cambridge: Cambridge University Press, 1986. PALMER, F.R. Modality and the English Modals. 2nd Edition, London: Longman, 1990. PALMER F.R. Modality in English: Theoretical, descriptive and typological issues. In; Facchinetti, Roberta; Krug, Manfred; Palmer, Frank: A corpus based study of grammaticalization: Modality in Contemporary English. Cambridge: Cambridge University Press 2003. QUIRK, R.; GREENBAUM, S.; LEECH, G.; SVARTIK, J. A Comprehensive Grammar of the English Language. London: Longman, 1985. SARMENTO, S. Distribution of Modal Verbs in an Corpus da Aviao. Proceedings of the Corpus Linguistics Conference, 2005a. Disponvel em <http://www.corpus.bham.ac.uk/pclc> Acessado em 10 de abril de 2007.

232

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

SARMENTO, S. A Pragmatic Account of Aviation Modals. In: ESPWORLD. Issue 3(11), Volume 4, 2005b. Disponvel em <http://www.espworld.info/contents.htm> Acessado em 15 de abril de 2007. SARMENTO, S. O uso dos verbos modais em manuais de aviao em ingls: Um estudo baseado em corpus. Tese de doutorado. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2008. SHAWCROSS, P. English for Aircraft Maintenance. Paris: Belin, 1992. SINCLAIR, J. Corpus, Concordance, Collocation. Oxford: OUP, 1991. SWALES , J.M. Genre Analysis. Cambridge: Cambridge University Press, 1990. TRIMBLE, L. English for Science and Technology. A discourse approach. Cambridge: C.U.P., 1985.

MACROESTRUTURA E MICROESTRUTURA DO DI CI ONR I O DE LI NGU STI CA DA ENUNCI AO E AS BALIZAGENS EPISTEMOLGICAS DE UM CAMPO: A TEORIA DE MILE BENVENISTE EM EXAME Valdir do Nascimento Flores *
Resumo: O objetivo deste captulo esclarecer em que medida a apresentao das teorias feita no Dicionrio de Lingustica da Enunciao responsvel pela indicao de um caminho epistemolgico de leitura tanto do campo enunciativo, em seu conjunto, quanto das teorias, em sua especificidade. So analisados aspectos tcnicos da produo da obra, tais como o desenho da macroestrutura principalmente, a apresentao (Palavras ao leitor) e os Dados biogrficos e bibliogrficos dos tericos em foco e a configurao de sua microestrutura , em especial, a lista de termos e as relaes entre os termos sugeridas pelo campo Termos relacionados, presente na estrutura do verbete. O carter enciclopdico da obra apreciado tendo em vista a sua natureza didtica e a necessidade de uma adequada representao do campo de conhecimento em foco.

Introduo
O objetivo inicial que temos com este trabalho implcito na primeira parte do ttulo acima esclarecer ao leitor do Dicionrio de lingustica da enunciao (DLE) 1 em que medida a apresentao das
Doutor em Lingustica, professor do PPG-Letras do Instituto de Letras da UFRGS, pesquisador PQ-CNPQ. Coordenador do projeto de elaborao do Dicionrio de lingustica da enunciao. 1 O Dicionrio de lingustica da enunciao, organizado por Leci Borges Barbisan, Maria Jos Bocorny Finatto, Marlene Teixeira e Valdir do Nascimento Flores e publicado pela Editora Contexto em 2009, o resultado do trabalho de uma equipe de 40 profissionais durante mais de cinco anos. Ele rene termos e definies de 14 teorias do campo da enunciao em mais de 400 verbetes. Usamos a sigla DLE para referir, no corpo deste texto, o Dicionrio de lingustica da enunciao. As passagens referidas so notadas com a sigla seguida da pgina citada.
*

234

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

teorias feita no dicionrio responsvel pela indicao de um caminho epistemolgico de leitura tanto do campo enunciativo, em seu conjunto, quanto das teorias, em sua especificidade. Para tanto, analisamos aspectos da macroestrutura principalmente, a apresentao (Palavras ao leitor) e os Dados biogrficos e bibliogrficos dos tericos em foco e da microestrutura do DLE , em especial, a lista de termos e as relaes entre os termos sugeridas pelo campo Termos relacionados, presente na estrutura do verbete. Esperamos, com isso, poder avaliar, em linhas gerais, a necessidade e a relevncia da produo de materiais de tipo enciclopdico, tal como o DLE. Outro objetivo que temos explcito na segunda parte do ttulo analisar como os aspectos da macro e da microestrutura se refletem na apresentao de uma teoria em particular, no caso, a teoria enunciativa de mile Benveniste. Para realizar os objetivos, seguimos o seguinte percurso: a) inicialmente (cf. item 1), avaliamos, ao menos em parte, a relevncia do DLE no contexto da lingustica brasileira. Fazemos isso a partir da anlise de aspectos da macroestrutura do dicionrio; b) em seguida (cf. item 2), valendo-nos da experincia de coordenao do projeto do DLE, expomos algumas das dificuldades de natureza terica enfrentadas durante a elaborao do DLE com nfase no tratamento da teoria de Benveniste; c) tambm tecemos consideraes a respeito da lista de termos presente no DLE e da estrutura do verbete com destaque para o campo Termos relacionados (cf. item 3); d) a seguir, com nossa ateno voltada teoria benvenistiana, fazemos pequena nota sobre a terminologia 2 do autor como forma de dar a conhecer ao leitor brasileiro o estado da arte sobre o tema (cf. item 4) e como o DLE se inclui nesse cenrio; d) adiante, mostramos algumas das relaes conceituais sugeridas pelo DLE, indicando como elas podem ancorar a hiptese especfica de que a teoria de Benveniste sustenta-se sobre um princpio geral (cf. item 5); e) finalmente, elaboramos as concluses gerais.
Utilizamos duas grafias para terminologia: com t maisculo indicando tratarse de uma rea de estudos; com t minsculo indicando o conjunto de termos ou termo de uma dada especialidade.
2

Linguagens Especializadas em Corpora

235

1. O DLE no contexto da lingustica brasileira


A recente publicao do Dicionrio de lingustica da enunciao apresenta uma nova realidade, e mesmo uma nova perspectiva, lingustica brasileira: a produo de discursos de natureza enciclopdica em torno de um determinado campo epistemolgico (rea, disciplina, teoria etc.). No praxe na lingustica do Brasil a elaborao de dicionrios especializados. Nos ltimos anos, geralmente, temos nos limitado traduo dos dicionrios de lingustica, o que no deixa de ser uma opo legtima, que no implica perda de qualidade do conhecimento da rea. No entanto, a elaborao de um dicionrio especializado de um determinado campo do saber impe a quem o faz problemas diferentes, se compararmos com os problemas pertinentes ao campo da traduo e mesmo da adaptao lngua de chegada. Produzir um dicionrio exige a tomada de decises que refletem a configurao epistemolgica do campo na comunidade cientfica em questo. Ou seja, exige que os especialistas confirmem, ou no, que aquilo que vlido em outras comunidades tambm vlido, ou no, na comunidade cientfica na qual o dicionrio est sendo produzido. No caso do DLE, isso perceptvel tanto na macroestrutura quanto na microestrutura. Por ora, pensemos na macroestrutura. Encontramos na macroestrutura do DLE feito sobre um corpus constitudo de 14 Teorias da enunciao , dentre outras indicaes, uma apresentao terica bastante detalhada, denominada Palavras ao leitor , com cerca de 15 pginas e incluindo uma rvore de domnio , uma Lista alfabtica de termos em que indicado a qual autor pertence cada termo, alm de Dados biogrficos e bibliogrficos dos tericos em foco em apresentado cada um dos tericos cuja terminologia contemplada no DLE. Essas informaes tm um sentido especfico, considerado o contexto da lingustica brasileira, e isso, ao menos, por um motivo: o campo da lingustica enunciativa no tem tradio consolidada no cenrio cientfico brasileiro ao contrrio do que vemos em pases como a Frana, por exemplo. No Brasil, as chamadas Teorias da enunciao, entre os anos 1970 e 1990, ou foram associadas s teorias

236

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

discursivistas, em especial a Anlise de Discurso de linha francesa, ou s teorias da lingustica textual, ou ainda s da pragmtica. Em outras palavras: no se operou, nessa poca, com uma distino explcita entre o campo enunciativo e os outros campos de estudos do uso da linguagem. Nesse caso, um dicionrio da natureza do DLE cumpre o papel de colaborar com a sistematizao do conhecimento bsico da rea, alm de compartilh-lo de maneira didtica. Com o DLE, o estudante brasileiro de lingustica usurio pretendido do DLE passa a ter a seu alcance um conjunto de estudos especificamente voltados ao campo enunciativo. Assim, o grande nmero de informaes constantes na macroestrutura do DLE cumpre a funo de contextualizar o contedo apresentado na microestrutura. Com isso, queremos dizer que, caso o DLE fosse feito em outro pas a Frana, por exemplo alguns dos itens da macroestrutura talvez fossem dispensveis, uma vez que tal contextualizao seria suprflua nesse outro cenrio. Tomemos como exemplo do que estamos dizendo o Lexique de linguistique nonciative produzido por M.L. Groussier e C. Rivire e publicado na Frana em 1996, portanto mais de uma dcada antes da publicao do DLE no Brasil. Aps uma breve introduo de no mais que duas pginas, Quelques mots de prsentation, onde os autores contextualizam genericamente o surgimento das Teorias da enunciao, dizem os autores do Lexique:
Le lexique qui est prsent ici se place donc dans la mouvance dAntoine Culioli. (...) Le but est de donner un moyen dacss facile la Thorie des Oprations nonciatives de Culioli grce au classement alphabtique des termes, alli de nombreux renvois (M.L. Groussier e C. Rivire, 1996, p. 6).

Ora, no deixa de causar espcie aos olhos do linguista brasileiro que, na Frana, se apresente, em no mais de duas pginas, um dicionrio sobre a Teoria das operaes enunciativas (TOE), sem que, em funo disso, se tenha de apresentar a dita teoria e mesmo

Linguagens Especializadas em Corpora

237

justificar a existncia do campo 3. Isso demonstra o quo distinta a configurao epistemolgica de um campo em um dado contexto. No Brasil, por exemplo, isso seria absolutamente invivel, uma vez que so raros os trabalhos feitos com base na TOE. Apenas a ttulo de informao suplementar: o Lexique de linguistique nonciative traz em sua macroestrutura, alm da j lembrada apresentao, apenas um Index anglais e um Index franais, o que muito pertinente j que, como sabido, a teoria de Antoine Culioli o autor da Teoria das operaes enunciativas tem larga circulao no mundo anglfono. Isso corrobora nosso vis de leitura segundo o qual a produo de um dicionrio especializado exige que se atente para o contexto no qual ele estar inserido. Seguindo essa linha de raciocnio, no seria pertinente que constasse do DLE um ndice em ingls, uma vez que tal procedimento no encontraria justificativa entre ns brasileiros. Como se pode prever, ento, a tarefa de fazer um dicionrio especializado no simples e, para ser efetivada, exige articulao entre diferentes profissionais (especialistas na rea a ser dicionarizada, terminlogos, tradutores, entre outros). Muitos so os entraves para levar a cabo um empreendimento desse tipo. Falemos um pouco neles.

2. Das dificuldades para elaborao de um Dicionrio de Lingustica da Enunciao no Brasil


As principais dificuldades enfrentadas na elaborao do DLE foram a heterogeneidade terica do campo em exame e a forma pouco regular de organizao da terminologia de alguns dos autores integrantes do Dicionrio. De um lado, h no DLE autores que tm explcita preocupao de estabelecimento de uma terminologia coerente. o caso de Oswald Ducrot, por exemplo, autor que, de maneira recorrente em seus artigos e livros, lista os termos utilizados em sua teoria, esforando-se para defini-los de forma clara. H autores, como A. J. Greimas, que,
3

A Teoria das operaes enunciativas uma das 14 teorias contempladas no DLE.

238

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

inclusive, tm seu prprio dicionrio 4, o que facilita sobremaneira o mapeamento de termos e definies. De outro lado, h autores como mile Benveniste e Mikhail Bakhtin nos quais vemos grande flutuao terminolgica e de definibilidade. Alm dessas dificuldades, outras se apresentaram de maneira imperativa. H no campo enunciativo grande nmero de autores que no formularam um modelo acabado de anlise da enunciao. So autores que refletiram sobre a enunciao, mas que no finalizaram uma metodologia de anlise da linguagem. A teoria desses autores , em grande medida, produto da leitura do conjunto de seus escritos. So os casos de: Michel Bral, Charles Bally, mile Benveniste e Mikhail Bakhtin. H tambm autores que produziram um pensamento que ultrapassa o campo da enunciao e que no podem ser integralmente reduzidos s temticas circunscritas ao campo da enunciao. Isso exigiu dos elaboradores dos verbetes que fosse estabelecido um recorte no interior do conjunto dos trabalhos desses autores de forma a destacar do conjunto apenas o concernente ao campo enunciativo. Esse recorte se faz notar na lista de termos de cada autor. Ela reflete o entendimento dos especialistas a respeito de quais noes de cada autor so fundamentais para a reflexo sobre enunciao feita por esse autor. Exemplos disso no faltam no DLE: o conjunto da obra de Roman Jakobson versa sobre poesia, pintura, mtrica, teoria lingustica, folclore, fonologia, patologia da linguagem, aquisio da linguagem, lnguas no mundo, semitica e shifters. A teoria enunciativa de Jakobson, no entanto, consubstancial noo de shifter 5. Logo, os elaboradores precisaram recortar a reflexo sobre o shifter do conjunto dos trabalhos de Jakobson. Ou ainda: em Charles Bally, encontramos uma reflexo extensa sobre o francs falado, a didtica da lngua, a literatura e a estilstica que propriamente a sua teoria da enunciao, portanto, de onde emanam os termos que integram o DLE.
4

Cf. GREIMAS, Algirdas Julien e COURTES, Joseph. Dicionrio de semitica. So Paulo: Contexto, 2008. 5 Termo que Jakobson utiliza no texto Shifters, verbal categories, the russian verb (1957) e que importado da obra de O. Jespersen.

Linguagens Especializadas em Corpora

239

Enfim, o DLE tambm um espelho do entendimento que temos a respeito da episteme do campo cuja configurao, embora parcial, encontra-se representada na rvore de domnio constante em Palavras ao leitor.

2.1. Um exemplo de dificuldade: a flutuao terminolgica em Benveniste


Em funo dos objetivos que temos, neste item, avaliamos mais detidamente a flutuao terminolgica e, como veremos, tambm conceitual e as dificuldades implicadas na elaborao dos verbetes referentes teoria benvenistiana. Em Benveniste, a flutuao se justifica, uma vez que no encontramos em seus textos um modelo acabado para a anlise da linguagem. A dita Teoria da Enunciao de Benveniste vale a pena observar, aqui, que tal expresso no fora efetivamente usada por Benveniste , na verdade, uma deduo feita pelos leitores dos artigos que esto reunidos em PLG I e PLG II 6. Logo, podemos ver, ento, que essa teoria enunciativa mais uma construo de leitura do que propriamente uma proposio de seu autor. Quando lemos os PLG, sem pr-conceitos sedimentados, vemos que cada texto de Benveniste contm, em si, alm de teorizao especfica, anlises que atendem a tal especificidade. claro que percebemos um eixo comum 7 a todas as reflexes benvenistiana, que explicitada por ele mesmo ao nomear a quinta parte dos PLG de O homem na lngua.
Trata-se de Problemas de lingustica geral I, originalmente, publicado em 1966, e Problemas de lingustica geral II, originalmente, publicado em 1974. As referncias a tais livros sero feitas, aqui, conforme a edio brasileira e de acordo com o seguinte sistema: sigla, indicao do volume, seguida de indicao da pgina. 7 Isso no nos impede de ver um princpio geral que norteia toda a reflexo benvenistiana no campo da enunciao. Trata-se, sempre, de estudar a presena do homem na lngua (ele tambm usa linguagem). Sobre isso ver: FLORES, Valdir. Por que gosto de Benveniste? Um ensaio sobre a singularidade do homem na lngua. In: Letras de hoje. Porto Alegre, v.39, n.4, dez. 2004, p. 217-30.
6

240

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Isso nos permite afirmar que a teoria de Benveniste antes de tudo uma teoria das marcas do homem na lngua, mas tambm na linguagem, uma vez que ele se vale da reflexo sobre as lnguas para generalizar seu raciocnio. No entanto, esse eixo comum est longe de configurar um mtodo pronto. Eis, portanto, uma das causas de tantas diferenas conceituais entre os textos de Benveniste. Tomemos apenas um exemplo dessa flutuao conceitual: a palavra enunciao. Ela aparece em diferentes textos dos Problemas I e II e muitas vezes em cada um desses textos e, tanto num caso quanto em outro, nem sempre com o mesmo sentido. Concluso: h muitas definies de enunciao em Benveniste, embora, especialmente no Brasil, se privilegie aquela dada pelo autor em 1970 este colocar a lngua em funcionamento por um ato individual de utilizao (PLG II, p. 82). Alis, a flutuao conceitual 8 visvel at mesmo dentro do mesmo texto. Somente no famoso texto de 1970 O aparelho formal da enunciao h 69 ocorrncias da palavra enunciao, nem sempre sinnimas entre si. Observemos algumas passagens do texto: aps a definio acima lembrada, encontramos: Este grande processo pode ser estudado sob diversos aspectos. Veremos principalmente trs. (PLG II, p. 82) A enunciao, nesse caso, entendido como um grande processo (em outro momento, Benveniste dir que a enunciao um ato) e pode ser visto sob diversos aspectos: a) O aspecto vocal: O mais imediatamente perceptvel e o mais direto embora de um modo geral no seja visto em relao ao fenmeno geral da

Alm da flutuao conceitual, h tambm uma flutuao terminolgica. Por exemplo, Benveniste parece, em alguns textos, dar nomes diferentes para o mesmo conceito. Observemos as passagens seguintes dentro do mesmo texto de 1956, A natureza dos pronomes: o emprego tem como condio a situao de discurso e nenhuma outra (PLG I, p. 280) e eu s pode ser identificado pela instncia de discurso que o contm e somente por a. (PLG I, p. 278). No seria absurdo pensar que aqui instncia de discurso e situao de discurso so designaes diferentes para um mesmo conceito.

Linguagens Especializadas em Corpora

241

enunciao a realizao vocal da lngua. (PLG II, p. 82) [grifos nossos]; Na prtica cientfica procura-se eliminar ou atenuar os traos individuais da enunciao fnica recorrendo a sujeitos diferentes e multiplicando os registros, de modo a obter uma imagem mdia de sons, distintos ou ligados. Mas cada um sabe que, para o mesmo sujeito, os mesmos sons no so jamais reproduzidos exatamente, e que a noo de identidade no seno aproximativa mesmo quando a experincia repetida em detalhe. Estas diferenas dizem respeito diversidade das situaes nas quais a enunciao produzida. (PLG II, p. 8283) [grifos nossos]; b) O aspecto da semantizao: O mecanismo desta produo um outro aspecto maior do mesmo problema. A enunciao supe a converso individual da lngua em discurso. (PLG II, p. 83) [grifos nossos]; a semantizao da lngua que est no centro deste aspecto da enunciao, e ela conduz teoria do signo e anlise da significncia. (PLG II, p. 83) [grifos nossos]; c) O quadro formal de realizao: Pode-se, enfim, considerar uma outra abordagem, que consistiria em definir a enunciao no quadro formal de sua realizao. o objeto prprio destas pginas. (PLG II, p. 83) [grifos nossos]. Considerando-se o que foi dito at aqui, podemos ver que, do ponto de vista da elaborao do DLE, algumas questes se impem: 1) Como operacionalizar em um verbete casos em que se tem a mesma designao enunciao e nota 8 (supra), por exemplo e definies nem sempre coincidentes no conjunto da obra que serve como corpus de referncia? 2) Tambm: como no dar a falsa impresso de que a teoria uma mera justaposio de termos? Ou seja: como deixar claro ao leitor que se trata de um sistema conceitual? Para responder a tais questes vale deter-se um pouco mais sobre a microestrutura do DLE.

242

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

3. A microestrutura do DLE: um princpio epistemolgico de leitura


O DLE parte de um princpio epistemolgico geral de leitura da Lingustica da Enunciao: as teorias podem ser apresentadas como um conjunto de conceitos sistematicamente relacionados entre si. Tais conceitos so identificados pelos termos que os nomeiam, o que permite responder a segunda questo posta no item anterior. No se trata, ento, de mera justaposio de termos mas da explicitao de um sistema de conceitos. Assim, podemos dizer que a teoria de Benveniste aceita ser lida como uma complexa rede conceitual cujos termos e noes esto interligados a partir de diferentes relaes. No DLE, essas relaes so contempladas no verbete no campo Termos relacionados, que , por sua vez, limitado a um grupo de no mximo trs termos, em funo dos fins didticos do DLE. Observemos a estrutura do verbete do DLE, aqui sintetizada a partir do que apresentado no Guia do Usurio (cf. DLE: p. 31-32):
1- Termo: expresso relevante coletada na(s) obra(s) do autor. O nmero ao lado do termo indica que a mesma forma, com sentido diferente, ocorre em outros autores. Classificao gramatical do termo ou expresso (s.f. = substantivo feminino). 2- Classificao gramatical do termo 3- Nome: autor/terico em foco. 4- Outras denominaes: variante do termo verificada na obra do mesmo autor. 5- Definio: coletada na(s) obra(s) do autor e/ou elaborada pela equipe responsvel. 6- Fonte da definio: indica a fonte consultada conforme codificao 7- Nota explicativa: informaes que complementam a definio. 8- Fonte da nota: indica a fonte consultada conforme codificao. 9- Leitura recomendada: fontes que podem complementar as informaes oferecidas sobre o termo. 10-Termos relacionados: outros termos presentes no dicionrio (no mximo trs) que, em conjunto com o termo em foco, integram uma rede de noes afins de um mesmo autor. Sua consulta amplia a compreenso da noo em foco no verbete. Todos os itens indicados como termos relacionados correspondem a verbetes com informaes completas.
Quadro 1 sntese da estrutura do verbete do DLE

Linguagens Especializadas em Corpora

243

A estrutura do verbete do DLE, acima sintetizada, permite ver que h uma espcie de roteiro de leitura da teoria em foco. Isso pode ser visualizado no DLE na medida em que percebemos que os termos e as noes integrantes de um dado conceito contm outros termos e noes e estes, por sua vez, esto contidos em muitos outros. Vejamos, no quadro abaixo, a ttulo de exemplo, como o que dissemos se aplica a um verbete da teoria de Benveniste no DLE:
Correferncia s. f. Benveniste. Outras denominaes: co-referir. Definio: possibilidade lingustica prpria do co-locutor de partilhar da referncia do discurso do locutor. Fonte da definio: BEN89: 84. Nota explicativa: A co-referncia fundante do dilogo e est estreitamente ligada ideia da intersubjetividade. Por exemplo, o locutor, ao enunciar ontem..., instaura a possibilidade do co-locutor de atribuir a ontem... o mesmo sentido dado pelo locutor. Fonte da nota: EBE06. Leitura recomendada: BEN89C. Termos relacionados: intersubjetividade, pessoa, referncia. (DLE: p. 70)
Quadro 2 exemplo de um verbete da teoria de Benveniste no DLE

Como possvel notar, o campo Termos relacionados indica ao leitor que a definio do termo Correferncia pode ser expandida se forem consultados os termos intersubjetividade, pessoa e referncia. Evidentemente, essa indicao no explicita a natureza das relaes (hierrquicas, paralelas, transversais etc.) que so supostas entre os termos, informao esta desnecessria para um dicionrio do padro do DLE. No entanto, afirmado: h relaes. Admitido este raciocnio, pode-se ver que h em Benveniste conceitos, termos e noes cuja compreenso decorre das relaes que estes mantm com outros conceitos, termos e noes. Isso significa dizer que difcil, nessa teoria, estudar-se um elemento isoladamente. Certamente, as relaes variam na medida em que variam os termos que servem como ponto de partida. Poderamos inclusive questionar a pertinncia do que apresentado como termo relacionado. Isso de menor importncia para o que estamos

244

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

explicando. Na verdade, defendemos a existncia das relaes sem, no entanto, defendermos que elas se configurem dessa ou daquela forma. secundrio, ao menos neste momento, o fato de se aceitar, ou no, qual termo integra cada conjunto de relaes. O essencial perceber que a reflexo benvenistiana no pode ser lida de maneira linear. Ainda na mesma direo, cabe prestar ateno nos campo Definio e Nota explicativa. a partir deles que vislumbramos respostas primeira questo antes apresentada (cf. supra). O campo Definio contm a acepo do termo devido indicao de suas caractersticas genricas e especficas. Prioriza-se a acepo mais representativa do termo. Em Nota explicativa, complementa-se a definio dada atravs de explicaes, exemplos, explicitao de nuances conceituais, finalidade e forma de incluso do termo na teoria em foco. A partir disso, a seguir fazemos ainda algum comentrio sobre a escolha dos termos. Para tanto, como forma de exemplificao, estaremos circunscrito, no item seguinte, terminologia da teoria enunciativa de mile Benveniste.

4. Nota sobre a terminologia de Benveniste


No Brasil, no temos tradio de estudos terminolgicos de autores do campo da lingustica. No entanto, no cenrio da lingustica geral, isso mais comum. O estudo da terminologia de Benveniste, por exemplo, no recente. Muito j se produziu sobre isso. Em primeiro lugar, h uma espcie de lxico tcnico presente em forma de ndice remissivo em apndice aos PLG I e II. Como se sabe, a publicao do primeiro volume datada de 1966 e a do segundo volume de 1974. A organizao do PLG I assinada por Benveniste; a do PLG II por M. Dj. Moinfar 9. Como bem explicado no Prefcio dos livros, tanto em um caso quanto em outro, tem-se a superviso direta de Benveniste.

Benveniste morreu em 1976.

Linguagens Especializadas em Corpora

245

A partir disso, pode-se concluir que muitas das palavras que esto nos ndices remissivos dos dois volumes se no tm estatuto de termo da teoria benvenistiana tm, ao menos, lugar de destaque na reflexo do autor. De qualquer maneira, h nos ndices alguma indicao de um caminho a seguir quando o que est em questo a terminologia do autor. Mas o primeiro grande trabalho que realmente aborda a questo terminolgica em Benveniste um Lexique escrito por Jean Claude Coquet e Marc Derycke intitulado Le lexique dE. Benveniste. Escrito em dois volumes e publicado em 1971 e 1972 10, respectivamente, formado por mais de 180 termos que dizem respeito a toda a reflexo de Benveniste, no apenas a circunscrita ao campo da enunciao. O trabalho de J-C Coquet e M. Dericke consulta obrigatria a todos os que, de um modo geral, se interessam pelo pensamento de Benveniste. Em 1975 vem a pblico um exaustivo trabalho de levantamento bibliogrfico escrito por Mohammad Djafar Monfar 11. Trata-se de uma bibliografia que tem por objetivo estabelecer uma lista to completa quanto possvel (Monfar, 1975, p. IX) segundo o plano seguinte 12: obras (classificadas em ordem cronolgica), artigos (classificados cronologicamente e subclassificados segundo o assunto), ndice de assuntos, resenhas e comunicaes feitas na Socit de Linguistique. De certa forma, nesse trabalho, temos uma indicao terminolgica, em especial, no ndice de assuntos. Alm desses trabalhos, a partir dos anos oitenta, Claudine Normand tambm publica textos voltados questo terminolgica de
Cf. COQUET, J-C; DERYCKE, M. Le lexique dE. Benveniste (vol. I). Documents de travail et pr-publications, n 8, serie A, Centro Internazionale di Semitica e di Linguistica, Universit di Urbino, 1971, p.1-40. COQUET, J-C; DERYCKE, M. Le lexique dE. Benveniste (vol. II). Documents de travail et pr-publications, n 8, serie A, Centro Internazionale di Semitica e di Linguistica, Universit di Urbino, 1972, p.41-78. 11 DJAFAR, Monfar Mohammad. Bibliographie des travaux d'Emile Benveniste. In : Mlanges linguistiques offerts mile Benveniste, Louvain, Peeters. (Collection Linguistique publie par la Socit de Linguistique de Paris LXX). 12 Ver tambm: DJAFAR, Monfar Mohammad. Sur la terminologie de Benveniste . In : LINX, numero special, 1997, p. 365-373.
10

246

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Benveniste. Tais textos so condizentes com uma abordagem investigativa que busca vislumbrar oscilaes de sentido no tratamento conceitual e terminolgico dado por Benveniste. Os artigos Les termes de lnonciation de Benveniste (1986), Constitution de la smiologie chez Benveniste (1989), mile Benveniste: quelle smantique? (1996) e Smiologie, smiotique, smantique: remarques sur lemploi de ces termes par mile Benveniste, entre outros, fazem explicitamente referncia ao tratamento terminolgico da obra benvenistiana. Recentemente, encontramos um livro de Aya Ono cujo ttulo inspirador, La notion dnonciation chez mile Benveniste, j indica a problemtica terminolgica, la notion, que expe com rigor e complexidade uma infinidade de relaes conceituais e noes associadas noo de enunciao na obra de Benveniste. Desse mesmo tipo o trabalho de Grard Dessons, mile Benveniste, linvention du discours, onde encontramos um detalhado mapeamento de noes como comunicao, discurso, lngua, linguagem, significao, subjetividade, tempo e sujeito. Tambm em Sujet de lnonciation et bauche dune rflexion sur la singularit enonciative (cf. Flores, no prelo) fazemos uma investigao terminolgica na obra destacando, principalmente, as relaes conceituais entre lngua, linguagem, lnguas, homem, locutor, sujeito, intersubjetividade, subjetividade e pessoa. Finalmente, h a terminologia presente no DLE. Sobre ela, iremos nos deter no item seguinte.

5. As relaes conceituais: o exemplo da teoria benvenistiana


O DLE prope uma lista de termos e uma organizao conceitual para a teoria enunciativa de mile Benveniste. A seguir, apresentamos a lista de termos, na primeira coluna, acompanhada dos termos relacionados, na segunda coluna.

Linguagens Especializadas em Corpora

247

COLUNA A 1. Agenciamento 2. Aparelho formal da enunciao3. Apropriao 4. Atualizao 5. Compreenso 6. co-referncia7. Correlao de pessoalidade-

8. Correlao de personalidade

9. Correlao de subjetividade -

10. Dixis 11. Dilogo -

12. Discurso 13. Domnio do semitico 14. Ele -

15. Enunciao -

16. Enunciado -

COLUNA B apropriao, referncia, sintagmatizao enunciao, lngua, discurso. atualizao, lngua, subjetividade. apropriao, enunciao, lngua-discurso frase, palavra, reconhecimento. intersubjetividade, pessoa, referncia. correlao de subjetividade, no-pessoa, pessoa correlao de subjetividade, no-pessoa, pessoa correlao de pessoalidade, no-pessoa, pessoa indicadores de subjetividade, referncia aparelho formal da enunciao, intersubjetividade, pessoa. enunciao, lnguadiscurso, semntica forma, lngua, semntico correlao de pessoalidade, correlao de subjetividade, pessoa aparelho formal da enunciao, lngua-discurso, semntico. atualizao, enunciao, palavra.

248

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

17. Eu 18. Forma 19. Forma vazia 20. 21. 22. 23. Frase Ideia Indicadores auto-referenciais Indicadores de dixis -

24. Indicadores de subjetividade25. Instncia de discurso26. Intersubjetividade 27. Lngua 28. Lngua-discurso 29. Linguagem 30. Locutor 31. Metassemntica32. Modo semntico 33. Modo semitico 34. Monlogo -

35. No-pessoa -

36. 37. 38. 39.

Ordem semitica PalavraPessoa Presente-

intersubjetividade, locutor, semntico semntico, semitico discurso, signo, subjetividade enunciado, ideia, semntico frase, referncia, sentido indicadores de dixis indicadores autoreferenciais Instncia do discurso enunciao, indicadores de subjetividade, semntico enunciao, pessoa, subjetividade Intersubjetividade, lngua discurso semntico, semitico, sentido lngua, lngua-discurso subjetividade, sujeito enunciao, semntico, semitico. lngua-discurso, semitico, sentido forma, lngua, semntico aparelho formal da enunciao, dilogo,pessoa correlao de pessoalidade, correlao de subjetividade, pessoa forma, lngua, semntico atualizao, sentido eu, sujeito, tu intersubjetividade, tempo lingustico.

Linguagens Especializadas em Corpora

249

40. Reconhecimento 41. Referncia 42. Semntico 43. Semantizao 44. Semitico 45. Sentido 46. Signo 47. Signo vazio 48. Sintagmatizao 49. Situao de discurso 50. Subjetividade51. Sui-referencial -

52. Sujeito 53. Tempo crnico 54. Tempo da lngua 55. Tempo lingustico 56. Terceira pessoa -

57. Unicidade 58. Verbos delocutivos -

atualizao, compreenso, palavra. lngua, pessoa, situao de discurso. lngua-discurso, semitico, sentido ideia, lngua-discurso, ] semntico forma, lngua, semntico discurso, forma, lnguadiscurso dixis, lngua, signo vazio discurso, signo, subjetividade discurso, frase, palavra discurso, sujeito intersubjetividade, sujeito, pessoa indicadores de subjetividade, signo vazio, situao de discurso intersubjetividade, locutor, semntico. tempo lingustico enunciao, presente, tempo crnico enunciao, presente, tempo crnico. correlao de pessoalidade, correlao de subjetividade, pessoa enunciao, pessoa aparelho formal de enunciao, enunciao, subjetividade

Quadro 3 lista de termos acompanhada dos termos relacionados da teoria de Benveniste no DLE

250

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Essa lista de termos tem peculiaridades que so de extremo interesse a todos os que se interessam pela teoria enunciativa de Benveniste e pela elaborao de dicionrios. Vejamos algumas. O primeiro ponto que chama a ateno que no fornecida a natureza das relaes postas em Termos relacionados. Por exemplo: embora o DLE nos diga que No-pessoa relaciona-se com correlao de pessoalidade, correlao de subjetividade e pessoa, ele no informa se tais termos tm alguma relao de hierarquia, de paralelismo, de transversalidade entre si, se so hipernimos ou se so antnimos. O campo Termos relacionados apenas indica que o consulente complementar sua consulta se tambm contatar com os outros verbetes. Evidentemente, essa constatao no encerra uma crtica ao DLE. A explicitao dessas informaes transcende os objetivos a partir dos quais o DLE fora formulado e est mais prxima de um trabalho que visasse apresentao de um mapa conceitual da teoria. Assim, o campo Termos relacionados cumpre um papel no DLE: o de alertar para o fato de as teorias da enunciao, em geral, e a teoria de Benveniste, no caso aqui destacado, aceitar serem lidas como uma complexa rede cujos termos e noes esto interligados a partir de diferentes relaes hierrquicas, paralelas, transversais etc. entre si. A consequncia disso que muitos dos conceitos propostos por Benveniste, por exemplo, tm valor primitivo, na medida em que integram outros conceitos. Ou seja, os termos e as noes que fazem parte de um dado conceito contm outros termos e noes e estes, por sua vez, esto contidos em muitos outros. Em suma: o DLE imprime um vis de leitura da teoria enunciativa de Benveniste (e das outras tambm): consider-la como uma rede de primitivos tericos. Certamente, as relaes variam na medida em que variam os termos que servem como ponto de partida. Podemos, sem dvida, questionar a pertinncia do que apresentado como Termos relacionados. No disso que estamos tratando. O DLE apenas explicita a existncia das relaes sem, no entanto, defender que elas se esgotem na maneira como esto colocadas em cada verbete. Com certeza, o mapeamento conceitual de cada termo bem como a posio que ocupa em relao aos demais termos limitado uma vez

Linguagens Especializadas em Corpora

251

que, como dissemos, o DLE apenas admite trs Termos relacionados para cada termo. Disso decorre um segundo ponto de fundamental importncia: o DLE, ao contrrio do que poderia se esperar de um dicionrio especializado, no fecha as relaes de sentido numa imanncia que ignoraria a epistemologia do campo. Vejamos como isso operador da leitura que podemos fazer da teoria de Benveniste. O termo enunciao Termo relacionado de 11 outros termos. Considerando-se um universo de 58 termos, conclui-se que, segundo o DLE, a compreenso de cerca de 20% dos termos da teoria enunciativa de mile Benveniste est na dependncia direta do termo enunciao. Disso, conclui-se tambm que esse termo ocupa lugar de destaque na teoria. Observemos mais de perto as implicaes que uma informao dessa natureza tem relativamente leitura de uma teoria como a de Benveniste. Considere-se apenas uma ocorrncia de enunciao como Termo relacionado: no verbete Intersubjetividade. Em intersubjetividade, encontramos remisso, alm de a enunciao, tambm a pessoa e a subjetividade. Como o DLE no explicita a natureza das relaes entre os termos, aos campos Definio e Nota explicativa que devemos recorrer para melhor entendimento das relaes. Na Definio, encontramos sobre intersubjetividade: interrelao constitutiva da enunciao que pressupe o eu e o outro mutuamente implicados (DLE, p. 146) [grifo nosso]. Logo a seguir, em Nota explicativa, h: O tema da intersubjetividade recorrente em Benveniste, porm, o uso da palavra intersubjetividade menos comum se comparado subjetividade e pessoa. (Idem) [grifo nosso]. De imediato encontramos distribudos entre a Definio e a Nota explicativa os trs termos que constam de Termos relacionados e a natureza das relaes entre eles comea a se explicitar.

252

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

Diz, ainda, o DLE: intersubjetividade apresentada por Benveniste como uma condio da experincia humana inerente linguagem. Essa experincia se reflete na lngua (Idem). E conclui:
Em suma, a Teoria da Enunciao de Benveniste tem como fundamento a noo de intersubjetividade, j que na e pela linguagem que o homem se constitui como sujeito, e essa condio est na dependncia da existncia do outro. Como exemplo, pode-se considerar que a intersubjetividade se marca na lngua pela relao de oposio pessoa eu/ pessoa no-eu, distino necessria noo de unicidade de cada uma das pessoas. Essa unicidade se apresenta em uma relao complementar, que intrnseca relao de subjetividade - h pessoa subjetiva porque h pessoa no subjetiva, relao que pode inverter-se. Intersubjetividade , ento, noo primeira, pressuposta, epistemologicamente, pela noo de subjetividade. (Idem) [grifos nossos].

Ora, a partir disso podemos compreender que intersubjetividade termo de maior importncia uma vez que noo primeira, pressuposta epistemologicamente. Numa tentativa de explicitar os tipos de relaes possveis entre os termos e as noes que eles designam, teramos que reservar lugar de maior destaque a intersubjetividade j que tudo indica que dele decorrem muitas outras noes devido o carter fundante que tem. Assim uma continuidade possvel para o DLE seria a de ver, para cada uma das teorias ali contempladas, como se organizam os termos e as definies entre si. Que relaes elas estabelecem umas em relao s outras? Que primitivos tericos cada autor elege para o seu modo de pensar? Enfim, que conhecimento sobre a linguagem cada uma supe (ou no)? Isso ainda est por ser feito e, conforme pensamos, pode dar origem a um tipo de dicionrio que objetive explicitar o sistema conceitual de um pensamento.

Linguagens Especializadas em Corpora

253

Concluso
Em termos de concluso, cabe finalizar indicando as perspectivas que o DLE traz para a consolidao de um discurso epistemolgico para a lingustica brasileira. Um dos principais indicadores que o DLE produz, na atualidade, no contexto da lingustica brasileira, o da possibilidade de construir um saber que, alm de determinar criticamente os princpios, as hipteses e os objetos construdos, tambm ajuda a compreender como esse campo se configurou dentro de uma organizao sciopoltica. Muito h ainda para ser feito em outras tantas reas.

Referncias bilbiogrficas
BENVENISTE, E. Problmes de linguistique gnrale, 1. Paris: Gallimard, 1966. BENVENISTE, E. Problmes de linguistique gnrale, 2. Paris: Gallimard, 1974. BENVENISTE, E. Problemas de lingustica geral, 1. So Paulo: Campinas, 1988. BENVENISTE, E. Problemas de lingustica geral, 2. So Paulo: Campinas, 1989. COQUET, J-C; DERYCKE, M. Le lexique dE. Benveniste (vol. I). Documents de travail et pr-publications, n 8, serie A, Centro Internazionale di Semitica e di Linguistica, Universit di Urbino, 1971, p.1-40. COQUET, J-C; DERYCKE, M. Le lexique dE. Benveniste (vol. II). Documents de travail et pr-publications, n 8, serie A, Centro Internazionale di Semitica e di Linguistica, Universit di Urbino, 1972, p.41-78. DESSON, Grard. mile Benveniste, linvention du discours. Paris : ditions IN PRESS, 2006. DJAFAR, Monfar Mohammad. Bibliographie des travaux d'Emile Benveniste. In : Mlanges linguistiques offerts mile Benveniste, Louvain, Peeters. (Collection Linguistique publie par la Socit de Linguistique de Paris LXX).

254

PERNA, C. L.; DELGADO, H. K.; FINATTO, M. J. (Orgs.)

DJAFAR, Monfar Mohammad. Sur la terminologie de Benveniste . In: LINX, numero special, 1997, p. 365-373. FLORES Valdir do Nascimento; BARBISAN Leci Borges; FINATTO Maria Jos Bocorny; TEIXEIRA, Marlene. Dicionrio de lingustica da enunciao. So Paulo: Contexto, 2009. FLORES, Valdir do Nascimento. Por que gosto de Benveniste? Um ensaio sobre a singularidade do homem na lngua. In: Letras de hoje. Porto Alegre, v.39, n.4, dez. 2004, p. 217-30. ______. Sujet de lnonciation et bauche dune rflexion sur la singularit enonciative. In : NORMAND, Claudine (org.) .Paralleles floues: vers une thorie du langage. (no prelo). GREIMAS, Algirdas Julien e COURTES, Joseph. Dicionrio de semitica. So Paulo: Contexto, 2008. GROUSSIER, M.L. e RIVIRE, C. Les mots de la linguistique : lexique de linguistique nonciative. Paris: OPHRYS, 1996. NORMAND, Claudine. Les termes de lnonciation de Benveniste. In: Histoire pistmologie Langage, VIII-2, 1986. ______. Constitution de la smiologie chez Benveniste. In: Histoire pistmologie Langage, XI-2, 1989. ______. mile Benveniste : quelle smantique?. In: LINX, nmero especial, 1996. ______. Smiologie, smiotique, smantique : remarques sur lemploi de ces termes par mile Benveniste. In: LINX, n44, 2001. ONO, Aya. La notion dnonciation chez mile Benveniste. Limoges : Lambert-Lucas, 2007.