Beruflich Dokumente
Kultur Dokumente
Tommaso Raso
I.
INTRODUO
27
METODOLOGIA
A. O corpus C-ORAL-BRASIL
O C-ORAL-BRASIL [1] um corpus de fala
espontnea [7] do portugus brasileiro que tem como objetivo
principal representar a variao diafsica dos falares de Belo
Horizonte e regio. A arquitetura do C-ORAL-BRASIL
espelha aquela do C-ORAL-ROM [8], corpora multilnge de
quatro das principais lnguas neo-romnicas (italiano, francs,
portugus europeu e espanhol europeu), coordenado pelo
LABLITA (Laboratorio di Linguistica da Universidade de
Florena). Cada um dos corpora que compem o projeto e,
conseqntemente, o C-ORAL-BRASIL dividem-se em uma
parte informal e uma parte formal. A parte informal
constituda de textos de domnio privado (correspondentes a
75% do total de gravaes) e de domnio pblico (25% das
gravaes). Alm disso, os domnios pblico e privado so
igualmente tripartidos em um tero de gravaes de carter
monolgico, um tero dialgico e um tero conversacional.
Para que fosse alcanada a maior variao diafsica possvel,
as gravaes do C-ORAL-BRASIL foram feitas em situaes
comunicativas das mais diversas, tais como pessoas jogando
futebol, drag queens se maquiando, uma aula de direo,
contao de casos, instrues para lidar com equipamentos
eletrnicos e reunio de partido poltico.
Cada gravao do corpus acompanhada de sua
transcrio, segmentao em enunciados e unidades tonais. A
parte informal do C-ORAL-BRASIL encontra-se atualmente
em fase de concluso e conta com aproximadamente 100
textos, no total de cerca de 150.000 palavras.
O subcorpus utilizado foi previamente etiquetado
segundo os preceitos da Teoria da Lngua em Ato.
28
29
TABLE I.
QUE
ID
Ncleo do SN
A1
Nominal
PP
16
A2
Nominal
Pronome pessoal
PP
TABLE II.
TIPO
ID
Retomada Ocorrncias
Exemplo
*CES: aqui o' /=CNT= aquela ali /=TOP= aquea ali que
a Joaquim Nabuco //=COM=
*BAL: < porque /=PHA= isso aqui > /=TOP= < isso
aqui > foi feito pra ser pregado aqui //=COM=
30
V.
CONCLUSES
31