Sie sind auf Seite 1von 6

Lingstica computacional

La lingstica computacional es un campo interdiciplinario entre el modelado


basado en reglas y modelado estadstico del lenguaje natural desde una
perspectiva computacional. Dicho modelado no se centra en ninguna de las
reas de la lingstica en particular, sino que es un campo interdisciplinar,
en el que participan lingistas e informticos especializados en inteligencia
artificial, psiclogos cognoscitivos y expertos en lgica, entre otros.

Algunas de las reas de estudio de la lingstica computacional son:

Corpus lingstico asistido por ordenador.


Diseo de analizadores sintcticos (en ingls: parser), para lenguajes
naturales.
Diseo de etiquetadores o lematizadores, tales como el POS-tagger.
Definicin de lgicas especializadas que sirvan como fuente para el
Procesamiento de Lenguajes Naturales.
Estudio de la posible relacin entre lenguajes formales y naturales.
Traduccin automtica.

ndice

1 Orgenes
2 Ramas de estudio
2.1 Lingstica computacional terica
2.2 Lingstica computacional aplicada
3 Problemas de la lingstica computacional
4 Aplicaciones de la lingstica computacional
5 Vase tambin
6 Ms informacin
7 Enlaces externos

Orgenes

La lingstica computacional surgi en los EE. UU. en los aos 1950 como un
esfuerzo para obtener computadoras capaces de traducir textos
automticamente de lenguas extranjeras al ingls, particularmente de
revistas cientficas rusas. Surgi como resultado de las aseveraciones de
Warren Weaver, quien vea en la traduccin una forma de descifrado.
Cuando la inteligencia artificial apareci en la dcada de los sesenta, la
lingstica computacional se convirti en una rama de la IA, tratando con el
nivel de comprensin humano y la produccin de los lenguajes naturales.

Para traducir un lenguaje en otro, se observ que uno tena que entender la
sintaxis de ambos lenguajes, al menos en el nivel de morfologa (la sintaxis
de las palabras) y las frases enteras. Para entender la sintaxis, uno debe
entender la semntica del vocabulario y la pragmtica del lenguaje. Lo que
empez como un esfuerzo para traducir textos se convirti en una disciplina
encargada de entender cmo representar y procesar el lenguaje natural
individual usando ordenadores.

Este tipo de estudios se conocen tambin como lingstica de corpus, ya


que la denominacin "computacional" puede prestarse a confusin.
Ramas de estudio

La lingstica computacional se ha dividido en dos ramas:


Lingstica computacional terica

Basa sus temas de trabajo en la lingstica terica y en la ciencia cognitiva.


Los aportes de la psicologa cognitiva, en especial de la psicolingstica,
tambin son de especial relevancia, y han dado como resultado la aparicin
de una nueva ciencia, la psicolingstica computacional.

Su objetivo es desarrollar teoras lingsticas computables, es decir, que


puedan ser aplicadas sutilmente a los ordenadores. Dado que las teoras
formales existentes no dan cuenta de todos los fenmenos lingsticos
posibles, la lingstica computacional terica se perfila como un incentivo
para la comprensin formal de los procesos lingsticos, as como un medio

para su demostracin prctica. Esto ocurre, por ejemplo, mediante el


anlisis automtico de grandes corpus lingsticos, para investigar un
fenmeno lingstico o probar la validez de una teora.

Sin embargo, no todas las teoras lingsticas tienen la pretensin de ser


aplicadas al dominio informtico. En efecto, la lingstica cognitiva estudia
las motivaciones de un hablante determinado para expresarse, lo que
naturalmente est lejos de poder ser modelado con un ordenador.
Lingstica computacional aplicada

Es una vertiente de la lingstica computacional con una evidente


orientacin tecnolgica, lo que ha provocado que con frecuencia sea
referida con nombres como ingeniera lingstica o tecnologa del lenguaje
humano. Se centra en los aspectos prcticos que se puedan derivar de la
simulacin de la conducta lingstica con medios informticos.

Su objetivo es crear productos informticos que incorporen algn


componente en el que intervenga el lenguaje, oral o escrito. Entre ellos
figuran:

El apoyo a los usuarios de computadores con el procesamiento de texto,


por ejemplo, correccin de errores de digitacin y ortogrficos, prueba de la
correccin gramatical, cambio en ideogramas en japons o chino.
La bsqueda automtica en pasajes de texto (bsqueda inteligente de
informacin) y, por cierto, no solo su forma, sino su significado
(recuperacin de informacin y motores de bsqueda).
El apoyo al traducir textos en otra lengua (traduccin asistida por
ordenador) o tambin la traduccin automtica.
El procesamiento del lenguaje hablado (reconocimiento del habla y
sntesis de habla), por ejemplo, en el servicio de informacin telefnico o en
aparatos de lectura para ciegos.
De la bsqueda de informacin en grande de bibliografas a la
contestacin directa de preguntas sobre la base de grandes bancos de datos
(recuperacin de informacin, minera de datos, extraccin de la
informacin).
El tratamiento de datos presentes lingsticamente, por ejemplo, la
indexacin de literatura, la creacin de ndices y listas de materias, la
produccin de resmenes y abstracts.

El apoyo a los autores en la redaccin de textos, por ejemplo, en la


bsqueda de la palabra precisa o la terminologa correcta.
La interaccin de los usuarios con el computador en lenguaje natural, tal
que los computadores sean accesibles tambin a las personas que no tienen
suficiente conocimiento de las rdenes especficas (interfaces hombremquina).

Problemas de la lingstica computacional

Algunos de los problemas que se deben resolver son:

Determinar la semntica. La misma forma de palabra puede presentar en


funcin del contexto un significado diferente (comparar homnimo). Se debe
elegir el significado pertinente al contexto. Por otro lado, se necesitan
formalismos para la representacin de los significados de las palabras.
Resolucin de la ambigedad sintctica. En algunos casos, una frase se
deja analizar e interpretar de varias formas. Elegir la correcta exige algunas
veces informacin semntica sobre el acto de habla y la intencin del
hablante, pero, al menos, conocimientos estadsticos previos sobre la coocurrencia (aparicin conjunta) de las palabras.

Por ejemplo: Pedro vio a Mara con los binoculares aqu no est claro si
Pedro ha visto a Mara, la que sostiene unos binoculares en la mano, o si
Pedro con la ayuda de unos binoculares pudo ver a Mara.

Reconocer el propsito de una expresin lingstica (ver Pragmtica).


Algunas frases no deben entenderse textualmente. Por ejemplo, se espera
de la pregunta Puede darme la sal por favor? no la respuesta S o
No sino en lugar de ello que se entregue la sal.

Si y cmo estos pueden resolverse automticamente no est definido solo


por el estado de la tecnologa computacional sino que depende
naturalmente mucho de las caractersticas de la lengua. Ms an: se
aspirar, por cierto, a procedimientos que sean aplicables a todas las
lenguas; sin embargo, los detalles sern elaborados separadamente para
cada una. Un programa para la separacin automtica de palabras que
fuera diseado para el ingls, no ser utilizable sin adaptacin para el
alemn, porque aqu los principios de separacin de palabras son otros. A

diferencia de la informtica, la cual trata generalmente de la programacin


de computadores, el campo de aplicacin de la lingstica computacional
yace, por tanto, en la parte especfica del lenguaje de los programas
computacionales.

Una ciencia no se define solo mediante un campo de aplicacin, sino


tambin mediante un inters terico. Los computadores son autmatas, los
que manipulan smbolos segn reglas definidas. Igual como los nmeros,
tambin los lenguajes son ciertamente, muy complejos sistemas de
smbolos. Resulta evidente, por consiguiente, disear programas
computacionales que simulen las operaciones que el hombre realiza con las
palabras de una lengua, al menos en parte. Se pueden probar as las
hiptesis lingsticas con el computador. La lingstica computacional es, en
este sentido, una lingstica en la cual la simulacin computacional se utiliza
como medio metdico para profundizar nuestros conocimientos sobre la
lengua humana.

Al fin y al cabo, plantea este enfoque, sin duda, diversas preguntas


psicolgicas y filosficas. El computador es una mquina, la lengua es algo
intelectual. Cun lejos se pueden realizar clculos con el lenguaje?
Pensarn los computadores un da o funcionar el intelecto humano como
una mquina simblica? La fascinacin de la simulacin computacional del
comportamiento de la lengua es precisamente sondear sus lmites. Un
inters de conocimiento por el cual uno se puede dedicar a la lingstica
computacional es descubrir si y como la comunicacin humana es
procesable por los ordenadores y en caso de que se encuentren lmites,
cmo son stos. Son estos lmites solo prcticos o tericos primordiales?
Este conocimiento es muy importante para el lugar que nosotros queremos
ceder a los computadores en la sociedad.
Aplicaciones de la lingstica computacional

Analizador sintctico
Analizador morfolgico
Analizador semntico
Alineador
Conjugador
Conversor de lenguajes
Corpus lingstico

Corrector ortogrfico
Desambiguador funcional
Flexionador
Lematizador
Motor de indexacin = Motor de indizacin

Vase tambin

Gestor lexicogrfico
Gestor terminolgico
Gestor de tesauros
Procesamiento de lenguaje natural
Sistemas de traduccin asistida por ordenador
memorias de traduccin.
Traduccin automtica
Ordenador pizarra
Lingstica cuantitativa

Das könnte Ihnen auch gefallen