Sie sind auf Seite 1von 7

CORPUS?

Rastier, Franois. La mesure et le grain. Smantique


du corpus. Paris: Champion, 2011.

En un inters contrastivo y diferencial de las cosas que son sometidas


a estudio, Rastier distingue corpus de archivo, documento, obra, web y
texto.
El texto es, para el autor, un verdadero objeto emprico porque es el
lugar de anlisis del analista maduro. Un texto puede preservarse como
un archivo, ser un documento, una obra o una pgina web.

El texto hace parte de un corpus, desde el cual se lee o es posible leer


el texto. Este corpus puede ser implcito o general (como los estudios
literarios) o explcitos, como los corpus de un campo especfico de anlisis (lingstica del corpus, por ejemplo).
De esto se colige que el objeto de anlisis no es en s mismo un corpus
y que este es un universo que incluye o en la que est la cosa que se
estudia. El corpus responde a una definicin cientfica abstracta y se
refiere a cosas que lo integran.

As,
a. El corpus es englobante, mientras que el texto es local y de este se
obtienen muestras ejemplos y ejemplares.

b. El corpus tiene una exigencia de homogenidad genrica.


El corpus puede ser:
a. Corpus de referencia: es el todo eso que queda incluido genricamente, como toda la literatura colombiana, por ejemplo.
b. Corpus de estudio: Constituyente del corpus de referencia (subcategora, zona, rea, parte, etc.) como autor, gnero, poca de la
literatura colombiana.

Las muestras (fragmentos y extractos) seran el objeto concreto de estudio (constituyentes del texto o partes del texto) que, desde la perspectiva del anlisis, seran precisados con ms minucia metodolgica
que el ejemplo y el ejemplar.
El estudio del sentido se basa en el establecimiento de diferencias en
la cosa concreta que se estudia y no en las referencias al corpus de
referencia.
Ambos tipos de corpus estn constituidos siempre por unidades textuales que deben ser tratadas. Ellas se caracterizan siempre no por ser
datos naturales, pues son por ser datos que despiertan una cierta sensibilidad hacia la complejidad de cada unidad textual.
Los textos son objetos compuestos, multivariados, con mltiples niveles
de organizacin interna (jerrquicos), heterrquicos, no necesariamente
discretos, pero s discontinuos y con frecuencia inestables.

Cuando el analista tiene claro cul es el corpus de donde toma los datos
que analiza (textos), debe tener claro si lo que tiene en manos es analizado desde el punto de vista de la expresin (extracto) o desde el
punto de vista del contenido (fragmento). En ambos casos, se trata algo
local, de un lugar privilegiado de la semiosis textual.

Fragmento Contenido
Extracto Expresin

La ambicin suprema del tratamiento de constituyentes del corpus o de


los corpora es que, ms all de los significados de las entidades mnimas
o de la etiqueta morfosintctica, el anlisis de los datos o componentes
(constituidos) textuales haga emerger nuevos observables semiticos
inaccesibles de otro modo (la excesiva fragmentacin de las unidades
que, por separado, pierden su capacidad de significar en el seno de la
totalidad).
Para Rastier s es posible hacer investigaciones sin corpus, pero seran
las exclusivamente tericas.

Das könnte Ihnen auch gefallen