Sie sind auf Seite 1von 17

Lingstica Computacional I. Tema 1. Introduccin a la LC.

1.3. Principales lneas de investigacin.


En este apartado trataremos de:

Delimitar el campo de la LC. Precisar cada una de las lneas de investigacin que lo conforman. Concretar en cada caso el alcance del tratamiento del lenguaje con medios informticos.

Como ya se ha sealado en los apartados 1.1. y 1.2., la de lingstica computacional no es la nica denominacin que se utiliza para aludir al campo que nos ocupa, sino que es habitual referirse a l tambin como procesamiento del lenguaje natural, lingstica informtica, ingeniera lingstica, tecnologa del lenguaje humano, etc. Esta oscilacin terminolgica se debe, por una parte, a que la tarea de simular la conducta lingstica con medios informticos ha sido abordada por diferentes ciencias y desde distintas perspectivas y, por otra parte, a la propia evolucin de la LC. El resultado es una serie de lneas de investigacin que comparten el inters por el lenguaje y por su tratamiento computacional, pero que difieren en la forma de llevarlo a cabo. Las principales lneas de investigacin que se sealan en la bibliografa al respecto son:

Procesamiento del Lenguaje Natural (PLN). Inteligencia Artificial (IA). Lingstica Informtica (LI). Industrias de la lengua, ingeniera lingstica y tecnologas del lenguaje (humano) o de la lengua.

Otras lneas de investigacin que han sido sealadas por algunos autores son:

Tecnologas del habla Lingstica de corpus

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

1.3.1. Procesamiento del Lenguaje Natural (PLN) Este trmino, traduccin del ingls Natural Language Processing (NLP), alterna con el de LC para referirse a la lnea de investigacin bsica dentro del campo de interseccin entre el lenguaje y los ordenadores. Es ms, en la actualidad LC y PLN se tienden a identificar, por lo que ambos trminos se pueden considerar sinnimos.
(1) Computational linguistics: [...] 2. (more usually today) A synonym for naturallanguage processing (Trask 1993:53).

Igual que la LC, el PLN considera los ordenadores como un instrumento adecuado para la descripcin y explicacin de las diferentes facetas o niveles del lenguaje: fontica y fonologa, morfologa, sintaxis, semntica, pragmtica, anlisis del discurso, etc. El objetivo general, tambin comn con la LC, es disear programas o sistemas informticos que simulen la conducta lingstica humana en todas o en alguna de sus facetas, programas que sean capaces de utilizar lenguajes naturales.
(2) [...] Lingstica Computacional y Procesamiento del Lenguaje Natural tratan de lo mismo: del desarrollo de programas de ordenador que simulan la capacidad lingstica humana (Moreno Sandoval 1998:14). (3) The goal of this research is to create computational models of language in enough detail that you could write computer programs to perform various tasks involving natural language. The ultimate goal is to be able to specify models that approach human performance in the linguistic tasks of reading, writing, hearing, and speaking (Allen 1995:1).

Para llevar a cabo este objetivo el PLN disea tcnicas para representar mediante un metalenguaje los datos lingsticos referidos a un determinado nivel del lenguaje, ya sea para el anlisis o para la generacin.
(4) Entendemos por procesamiento del lenguaje natural (PLN) el estudio del mismo con el fin de crear modelos computacionales capaces de utilizarlo. Esta definicin abarca una problemtica muy amplia: desde la construccin de simples editores de texto en los que el lenguaje se considera como una cadena de caracteres, hasta interfaces para sistemas informticos complejos capaces de ayudar a un usuario a plantear un problema dialogando en lenguaje natural (Verdejo 1995:39-40).

En esta lnea, uno de sus mbitos principales es el desarrollo de gramticas, analizadores sintcticos o parsers y lxicos computacionales. Existe, por lo tanto, un verdadero tratamiento del lenguaje o anlisis lingstico.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

Como en el caso de la LC, el PLN comprende aspectos tericos y aplicados que, siguiendo a H. Tennant (1981:2) y J. Allen (1995:1-3), se pueden resumir as:
PLN TERICO Motivacin cientfica Se ocupa de explorar la naturaleza de la comunicacin lingstica Pretende mejorar el conocimiento que tenemos sobre el funcionamiento del lenguaje y de la mente humana Se encarga de desarrollar modelos computacionales que simulan la conducta lingstica PLN APLICADO Motivacin prctica o tecnolgica Persigue posibilitar una comunicacin hombre-mquina efectiva Busca la utilidad de no tener que necesitar un lenguaje artificial para comunicarse con el ordenador Consiste en aplicaciones concretas y en tcnicas para representar la informacin lingstica mediante un metalenguaje Trata de que los modelos computacionales funcionen, aunque no reflejen la forma en que las personas procesamos el lenguaje

Estos modelos deben cumplir dos requisitos: i) ser adecuados para su tratamiento informtico y ii) ser eficientes computacionalmente

No obstante, para algunos autores el PLN se centra especficamente en los objetivos aplicados, en los que confluye con la vertiente aplicada de la LC o LC Aplicada (vid. Gmez Guinovart 1998, 1999 y 2000a).
(5) Sentn per processament del llenguatge natural (des dara PLN) el desenvolupament de formalismes de representaci de les dades lingstiques i de llenguatges de programaci eficients per tractar-les. Es considera que el PLN socupa dels aspectes tcnics de la LC, ja que tracta de trobar soluci als problemes que planteja la comprensi del llenguatge natural en el marc daplicacions concretes, com la traducci automtica, la indexaci automtica de textos, la interacci home-mquina en llenguatge natural, la confecci de resums, lextracci i la recuperaci dinformaci, etc. (Mart y Castelln 2000:4). (6) Otra lnea de investigacin la tenemos en el Procesamiento del Lenguaje Natural, que se centra en los aspectos ms aplicados de la LC, ya que trata de buscar soluciones a los problemas que plantea la comprensin del lenguaje natural en el marco de sistemas concretos (Mart 2003:10).

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

Las aplicaciones del PLN se suelen clasificar en dos grandes grupos (Allen 1995:4-5; Moreno et al. 1999:17-19; Moreno y Molina 1999:67-69):
1) Aplicaciones basadas en dilogos: comunicacin hombre-mquina escrita u oral Sistemas de acceso a bases de datos Sistemas de acceso a otros dominios Sistemas de dilogo inteligente 2) Aplicaciones basadas en el tratamiento masivo de informacin textual: procesamiento de texto escrito Para la creacin de textos Correctores ortogrficos, sintcticos y de estilo Diccionarios de sinnimos y tesauros Para el procesamiento de textos Filtrado de documentos Clasificacin de documentos Indexacin de documentos Generacin automtica de resmenes Traduccin automtica

Las diferencias entre LC y PLN se establecen considerando argumentos como los siguientes (vid. Gmez Guinovart 1998, 1999, 2000a; Cunningham 1999):
mbito de procedencia

La LC se sita en la esfera de la Lingstica y de la Ciencia Cognitiva. El PLN est ms vinculado a la Informtica y a la Inteligencia Artificial.

Motivacin

En la LC predominan los aspectos tericos o cientficos. En el PLN, los aplicados o tecnolgicos.

(7) To summarise: CL is a part of the science of language that uses computers as investigative tools; NLP is part of the science of computation whose subject matter is computer systems that process human language (Cunningham 1999:4). (8) "El Procesamiento del Lenguaje Natural (PLN) es una parte esencial de la Inteligencia Artificial que investiga y formula mecanismos computacionalmente efectivos que faciliten la interrelacin hombre/mquina y permitan una comunicacin mucho ms fluida y menos rgida que los lenguajes formales" (Moreno Boronat et al. 1999:13; Moreno Boronat y Molina 1999:65).

El siguiente cuadro sintetiza la relacin entre LC y PLN:


LC Trmino ms usual desde la perspectiva de la Lingstica LC Terica LC Aplicada Predominio de aspectos tericos PLN Trmino ms comn desde la perspectiva de la Informtica PLN Terico PLN Aplicado Predominio de aspectos aplicados

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

1.3.2. Inteligencia Artificial (IA) Tanto la LC y como el PLN se conciben como una rama de la IA. La Inteligencia Artificial (en ingls Artificial Intelligence, AI) es una de las subdisciplinas de la Informtica. Su objetivo es disear ingenios artificiales que simulen el comportamiento inteligente humano. En consecuencia, el lenguaje ser objeto de estudio de la IA en tanto que facultad cognitiva bsica. De hecho, constituye uno de los bloques centrales en que la IA suele estructurar el comportamiento inteligente humano, de ah el empeo en su dominio desde los inicios de la disciplina, con vistas a obtener la comunicacin hombre-mquina en lenguaje natural y no en un lenguaje formal y artificial, ya que las lenguas son la forma ms natural y eficiente de que disponemos para comunicarnos, sea entre nosotros mismos o con los ordenadores. Para llevar a cabo este objetivo, la IA debe ocuparse de la descripcin rigurosa de las estructuras del lenguaje as como de los conocimientos generales que poseemos las personas. Esto es as porque codificar en un programa informtico la capacidad cognitiva del lenguaje implica que previamente se posee un conocimiento de cmo funciona este, conocimiento que es posible representar, hacer explcito de manera formal, despojado de toda posible ambigedad. Desde la perspectiva de la IA, el lenguaje se concibe como una parte de un todo, el sistema cognitivo humano. Este tratamiento del lenguaje es caracterstico de la IA, pues la LC se ocupa del lenguaje en s mismo, sin necesidad de integrarlo en un sistema ms general. Algunas definiciones de IA:
(1) Subdisciplina de la informtica, encargada de codificar en un programa informtico facultades cognitivas (Moreno Sandoval 1998:14). (2) Es la ciencia que trata de que las mquinas hagan la clase de cosas que hace la mente humana (Gregory 1995 [1987]:609). (3) La Inteligencia Artificial es una ciencia interdisciplinaria que tiene por objeto investigar el funcionamiento de la inteligencia humana, para aplicar luego estos modelos tericos a una mquina que deber ser capaz de reflejarlos (Meya 1980:135). (4) AI deals with some of the phenomena surrounding computers, hence it is a part of computer science. It is also a part of psychology and cognitive science. It deals, in particular, with the phenomena that appear when computers perform tasks that, if performed by people, would be regarded as requiring intelligence thinking (Simon 1995:95).
Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

(5) AI is the science of making machines do tasks that humans can do or try to do (Allen 1998:17). (6) Q. What is artificial intelligence? A. It is the science and engineering of making intelligent machines, especially intelligent computer programs. It is related to the similar task of using computers to understand human intelligence, but AI does not have to confine itself to methods that are biologically observable (McCarthy 2002).

Ahora bien, qu es la inteligencia? Qu tiene que hacer una mquina para que se considere inteligente? El intento ms serio de definir lo que se entiende por inteligencia es el conocido como test de Turing, ideado por el matemtico ingls del mismo nombre, A. Turing, en 1950. La prueba propuesta consiste en que una persona, situada en una habitacin separada, formula preguntas a travs de un terminal de ordenador a otra persona y a un ordenador. A partir de las repuestas proporcionadas por estos, debe determinar quin es quin. Si es incapaz de decidirlo, se considera que esa mquina ha pasado el test de Turing y que, por tanto, es inteligente, definida la inteligencia de esta forma. Para H. A. Simon (1995:96), las razones por las que se intentan simular en un ordenador los comportamientos inteligentes humanos, son tres: 1) Comprender la inteligencia en general a travs del diseo e implementacin de programas informticos que la muestren y, a partir de ah, construir una teora sobre los sistemas inteligentes. 2) Comprender la mente humana a travs del diseo de programas que muestren inteligencia utilizando los mismos procesos que emplean las personas para llevar a cabo esas mismas tareas. 3) Construir sistemas expertos, programas informticos capaces de suplir o complementar la inteligencia humana en determinadas reas o tareas. M. Ramsay (1991:28-29) resume estos puntos en dos, que para l son las motivaciones bsicas de la IA y que conducen a la concepcin de la IA bien como una ingeniera bien como una ciencia: a) IA como ingeniera: acercamiento de la ingeniera o ingeniera del conocimiento. Se basa en la utilidad que supone disponer de ordenadores inteligentes. El objetivo de este acercamiento, eminentemente prctico y comercial, se concreta en resolver problemas reales usando la inteligencia artificial, entendida como un conjunto de ideas sobre la representacin del conocimiento y la forma de emplearlo en la construccin de sistemas.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

b)

IA como ciencia: acercamiento de la ciencia cognitiva. Se basa en la posibilidad que brindan los ordenadores de investigar cmo la mente humana realiza esas tareas que requieren inteligencia. Desde esta perspectiva, de carcter terico o de investigacin bsica, la IA se ocupa de discernir cules de esas ideas sobre la forma de representar el conocimiento, etc. aportan alguna explicacin de la inteligencia o de alguna de las conductas inteligentes del hombre. En definitiva, trata de comprender la inteligencia en general y la humana en particular. Para ello, se construyen sistemas que imitan la estructura y/o el funcionamiento del cerebro humano.

As pues, igual que suceda con la LC y el PLN, en la IA se diferencian dos tipos de objetivos: tericos y aplicados que, en lo que al lenguaje se refiere, se identifican respectivamente con la LC y el PLN (vanse p.e. Tennant 1981:2; Ramsay 1991:28-29; Fernndez y Sez Vacas 1995:220): a) Objetivos tericos: punto de vista de la ciencia cognitiva. Simular la capacidad cognitiva del lenguaje en un sistema informtico puede contribuir a aumentar nuestro conocimiento sobre el funcionamiento del cerebro humano y del lenguaje, lo que se corresponde con los objetivos tericos o cientficos de la LC-PLN. Utiliza los ordenadores y los programas informticos como un banco de pruebas, como una herramienta para indagar sobre la naturaleza de la inteligencia, con independencia de la utilidad que pueda redundar de ello. Aborda los mismos temas de los que se ocupa la Lingstica Terica, aunque atendiendo prioritariamente a la precisin y formalidad de las teoras. A veces se utiliza el trmino Lingstica computacional para referirse a esta orientacin ms terica.

b)

Objetivos aplicados: acercamiento de la ingeniera. Simular la capacidad cognitiva del lenguaje en un sistema informtico es ventajoso por la utilidad que supone disponer de ordenadores con esta habilidad, lo que entronca con los objetivos aplicados de la LCPLN. Ante todo busca la utilidad. A este acercamiento corresponden los primeros trabajos relacionados con la LC-PLN, centrados en la traduccin automtica y, luego, en las interfaces. A veces el trmino Procesamiento del Lenguaje Natural se utiliza para referirse nicamente a esta orientacin ms aplicada.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

Por supuesto, el lenguaje no es la nica capacidad cognitiva de la que se ocupa la IA. Algunas reas destacadas de la IA son: Comprensin y generacin del lenguaje natural tanto en su vertiente hablada como escrita. Esta rea tiene su origen en las aportaciones de N. Chomsky, de la psicolingstica y de la psicologa cognitiva. Visin artificial o reconocimiento de patrones o formas, es decir, el desarrollo de estrategias que permiten a un ente interpretar las imgenes que capta del medio. Robtica: se ocupa de los mecanismos de control que permiten a un ente mecnico moverse en un medio fsico y manipular elementos tambin fsicos con cierto grado de autonoma. Emulacin del razonamiento simblico o simulacin de la inteligencia a nivel funcional. Se trata del ncleo bsico de la disciplina, ya que fue el que le dio origen (trabajos de Turing, Newell y Simon). Se ocupa del pensamiento lgico-matemtico, de la capacidad de inferencia y de razonamiento, as como de la solucin de problemas, juegos (damas, ajedrez, tres en lnea) y la demostracin automtica de teoremas. Simulacin del funcionamiento neuronal o simulacin de la inteligencia a nivel fsico. Esta corriente remonta a 1943, cuando McCulloch y Pitts idearon una neurona electrnica. El supuesto bsico es que quiz la forma de emular la conducta inteligente humana pase por mimetizar la propia estructura fsica del cerebro humano. Sistemas expertos. Surgen en los aos 70 como consecuencia de la evolucin de la IA desde la bsqueda de soluciones a problemas generales, independientemente del campo considerado, hacia el estudio de los mecanismos empleados por un experto humano para resolver un problema en tiempo real en un campo muy concreto. P.e. existen sistemas expertos en el diagnstico mdico, en gentica molecular, en geologa, etc.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

1.3.3. Lingstica Informtica (LI) Este trmino, del ingls linguistic computing, constituye una lnea de investigacin muy amplia, ya que abarca cualquier uso de los ordenadores en relacin con el lenguaje. Tambin se denomina informtica aplicada a la lingstica (vid. Gmez Guinovart 1998, 1999, 2000a). Se trata de una de las lneas de investigacin pioneras del campo. Utiliza los ordenadores como un instrumento ms de trabajo en Lingstica. En los primeros tiempos de la LC y todava a veces en la actualidad se identifica con la LC.
(1) Computational linguistics: 1. (formerly, and still occasionally) A very broad label covering virtually any activity involving computers and natural language, such as machine translation of natural-language texts, computer searching of texts or the preparation of concordances for literary works by computer. Now usually called literary and linguistic computing [] (Trask 1993:53).

Concibe los ordenadores y los programas informticos como herramientas eficaces para abordar tareas mecnicas y tediosas (contar, clasificar, buscar y ordenar la informacin, etc.) por la rapidez, exactitud y economa que introducen. Se concreta en todo tipo de programas y herramientas informticas que puedan servir de ayuda en los estudios relacionados con la lengua y la literatura.
(2) El terme Lingstica Informtica fa refrencia als programes orientats a donar suport als estudis filolgics, lexicogrfics, lingstics, humanstics, etc. Aquests programes no cal que continguin coneixement lingstic i consideren els textos com a seqncies de carcters, siguin aquests lingstics, numrics o de qualsevol altre tipus, independentment de la llengua que es tracta. El seu objectiu s lextracci dinformaci superficial dels textos en termes dun determinat criteri, normalment de tipus quantitatiu o b basat en el reconeixement de determinades seqncies en el text (Mart y Castelln 2000:6). (3) Finalmente, tenemos en la Lingstica Informtica, orientada al desarrollo de programas de apoyo a los estudios filolgicos, lexicogrficos, lingsticos, humansticos, etc., otra disciplina que ha contribuido al desarrollo de las tecnologas de la lengua. Estos programas tratan los textos como secuencias de caracteres, independientemente de la lengua en la que estn escritos, y extraen de los mismos datos de tipo estadstico, concordancias, colocaciones, etc. (Mart 2003:11).

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

10

A diferencia de la LC y del PLN, por lo general realiza un tratamiento superficial de la informacin lingstica (cmputos, clculos), sin que exista un verdadero anlisis. Las reas en las que mayor repercusin tiene son: lexicografa, sociolingstica, lingstica histrica, estilometra, lingstica estadstica, lingstica de corpus, edicin de textos, enseanza y aprendizaje de lenguas, etc. Los programas ms representativos son los que sirven para extraer listas de frecuencias y los programas de concordancias (palabras en contexto), a los que hay que aadir los programas para la enseanza de cualquiera de las reas de la lingstica (vid. Lawler y Dry 1998).

Ejemplo de concordancias para la palabra bala extradas del CREA, Corpus de Referencia del Espaol Actual, Real Academia Espaola.

En la actualidad destaca especialmente la incidencia de lo que se ha dado en llamar tecnologas de la informacin y de la comunicacin (TIC) (Internet, correo electrnico, etc.). En el sitio web Lab.Lingua, Laboratorio de Lingstica Informtica de la Universidad de Alicante, puedes leer una "Introduccin a la Lingstica Informtica": http://www.ua.es/dfelg/lablingua/

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

11

1.3.4. Industrias de la lengua, ingeniera lingstica y tecnologas del lenguaje (humano) o de la lengua Industrias de la lengua, ingeniera lingstica y tecnologas del lenguaje (humano) o de la lengua son trminos que se han ido poniendo de moda sucesivamente desde los aos 80 y principios de los 90. Por lo tanto, representan las lneas de investigacin ms recientes en LC. Industrias de la lengua El trmino industrias de la lengua parece que se utiliz por primera vez en francs ("les industries de la langue") a principios de los 80 y, desde entonces, su uso se ha extendido rpidamente para referirse a todo tipo de actividades comerciales, profesionales y organizaciones relacionadas con la lengua (Edwards y Kingscott 1997:262). En esta extensin ha tenido mucho que ver el uso del trmino en mbitos polticos y planes de investigacin europeos, tal y como sealan J. Vidal Villalba y J. Busquets Rigat (1996:434). Se trata de una lnea de investigacin muy amplia, aunque el aspecto ms destacado es que persigue la obtencin de productos comerciales relacionados con la lengua. Edwards y Kingscott (1997:13 y ss.) clasifican estas actividades industriales en torno a la lengua en: a) b) c) d) Monolinges: todas aquellas que giran en torno a una nica lengua. Bilinges: todas aquellas que trabajan con dos lenguas. Translinges: todas aquellas relacionadas con la traduccin. Multilinges: todas aquellas que trabajan con ms de dos lenguas.

Algunas definiciones de industrias de la lengua:


(1) Finalmente, cabe considerar las llamadas industrias de la lengua, denominacin usada a menudo junto con la de ingeniera lingstica para referirse a las aplicaciones del procesamiento del lenguaje natural y del habla en el desarrollo de productos comerciales, destinados a usuarios finales, que incluyen una parte importante de conocimientos sobre la lengua (Moure y Llisterri 1996:149-150). (2) Una serie de actividades comerciales en las que el tratamiento del lenguaje, por personas, por mquinas o por una combinacin de unas y otras, forma una parte fundamental del producto o servicio (Lenguaje y tecnologa. De la torre de Babel a la aldea global 1997:12).

Ingeniera lingstica El trmino ingeniera lingstica apareci por primera vez en un panel de COLING (International Conference on Computational Linguistics), en el congreso celebrado en 1988 (Cunningham 1999:6), y de ah se extendi por Europa, fundamentalmente por su utilizacin en una seccin del Programa Telemtico de la Comisin Europea que lleva el mismo nombre: Language Engineering. Para su surgimiento y desarrollo en Espaa, vase Llisterri y Almiana (1998).
Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

12

El objetivo de la ingeniera lingstica es proporcionar medios de ampliar y mejorar la utilizacin de la lengua para hacer de ella una herramienta ms eficaz (Ingeniera lingstica. Cmo aprovechar la fuerza del lenguaje, pg. 1). Para ello: a) Parte de un cuerpo de conocimientos tericos que le proporcionan las ciencias del lenguaje y otras en las que el lenguaje es parte de su objeto. b) Con ellos elabora recursos lingsticos que posteriormente explotar con la aplicacin de tcnicas informticas. Se suele englobar dentro del marco general de las industrias de la lengua (Llisterri y Almiana 1998:299), al ser un requisito previo para que existan estas. En sentido estricto es una lnea de investigacin ms especfica que las industrias de la lengua, aunque en realidad se solapa con dicho trmino. Segn M. A. Mart e I. Castelln (2000:7), viene a marcar un punto de inflexin en el desarrollo de la LC, al representar la interaccin de esta ciencia con la sociedad, a la que brinda productos aplicados: sistemas funcionales que la LC de corte terico no proporciona y que la sociedad demanda (Boguraev, Garigliano y Tait 1995:1). En esta orientacin aplicada y comercial, coincide plenamente con las industrias de la lengua y se opone a la LC Terica: Language engineers make things work without knowing why, whereas computational linguists know why their systems don't work (Cunningham 1999:5). Algunas definiciones de ingeniera lingstica:
(1) Linguistic Engineering (LE) is an engineering endeavour, which is to combine scientific and technological knowledge in a number of relevant domains []. LE can be seen as a rather pragmatic approach to computerised language processing, given the current inadequacies of theoretical CL [Computational Linguistics] (European Commission, Linguistic Research and Engineering in the Framework Programme 1991 apud Boguraev, Garigliano y Tait 1995:1). (2) Language Engineering is the discipline or act of engineering software systems that perform tasks involving processing human language. Both the construction process and its outputs are measurable and predictable. The literature of the field relates to both application of relevant scientific results and a body of practice (Cunningham 1999:5). (3) La ingeniera lingstica es la aplicacin de los conocimientos sobre la lengua al desarrollo de sistemas informticos para que puedan reconocer, comprender, interpretar y generar el lenguaje humano en todas sus formas. En la prctica, la ingeniera lingstica consiste en una serie de tcnicas y recursos que se aplican, en el primer caso, por medio de programas informticos y que, en el segundo, constituyen una fuente de conocimientos a los que se puede acceder por medio de estos mismos programas (Ingeniera lingstica. Cmo aprovechar la fuerza del lenguaje, pg. 5).

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

13

(4) Ms recentment ha aparegut el terme Enginyeria Lingstica per designar tota mena de recursos informtics i lingstics de qu es disposa sobre una llengua determinada i que constitueixent productes susceptibles de ser comercialitzats (Mart y Castelln 2000:7).

Tecnologas del lenguaje Este es el trmino ms habitual hoy en da, utilizado como sinnimo de ingeniera lingstica. El objetivo ltimo de las tecnologas lingsticas es lograr la comunicacin con los ordenadores mediante un lenguaje natural y el acceso a la informacin. Lo distintivo de esta lnea de investigacin, igual que las anteriores, es su clara orientacin aplicada (aunque no carece de base terica) y, sobre todo, comercial: se busca que las aplicaciones se concreten en productos de mercado (Moure y Llisterri 1996, Vidal y Busquets 1996, Gmez Guinovart 1998 y 2000a). Los conceptos clave, segn M. A. Mart (2003:1) son: potencial econmico e impacto social. En el origen de todas estas lneas de investigacin estn, segn J. Vidal y J. Busquets (1996:441) y Mart (2003:9-10), factores como los siguientes: El crecimiento de las actividades que tienen como base la transferencia de informacin. Toda una serie de programas gubernamentales e institucionales, sobre todo en Japn y en la Unin Europea, que las han fomentado. Las nuevas posibilidades industriales y tecnolgicas. La mejora de la capacidad de los ordenadores. Lenguajes de programacin ms adecuados. La propia evolucin de la disciplina. La investigacin bsica realizada en LC y PLN que ha propiciado el desarrollo de aplicaciones reales y no de laboratorio.

El resultado de la suma de todos estos factores es una nueva realidad que se ha venido a denominar sociedad de la informacin, marcada por la globalizacin, el multilingismo y las posibilidades que ofrecen las nuevas tecnologas para la informacin y la comunicacin. El lenguaje tiene un papel central en esta sociedad, de ah que se haya convertido en objeto de explotacin comercial. Las tecnologas lingsticas no seran posibles sin el desarrollo previo de recursos lingsticos y tcnicas de anlisis, necesarios para la obtencin del producto comercial final.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

14

Los productos pueden estar relacionados con la lengua escrita o con la lengua hablada. a) Lengua escrita: se trata de productos que cumplen funciones que tienen que ver con la redaccin, correccin, gestin y traduccin de documentos. Correctores de diverso tipo Diccionarios en soporte electrnico Programas de traduccin automtica o asistida Sistemas de consulta a bases de datos Sistemas de recuperacin de informacin Sistemas de resumen automtico Programas de enseanza de lenguas

b) Lengua hablada: se trata de programas que se utilizan para el reconocimiento y sntesis del habla, la identificacin de locutores o de lenguas, sistemas de dilogo, traduccin del habla, sistemas de dictado, etc. Recursos lingsticos: gramticas computacionales, corpus, bancos de datos terminolgicos. Tcnicas de anlisis: programas informticos para procesamiento y generacin de texto escrito y lengua oral. la introduccin,

Para ms informacin sobre las tecnologas lingsticas, visita el sitio web de la Oficina del Espaol en la Sociedad de la Informacin (OESI) sobre tecnologas lingsticas: http://oesi.cervantes.es/oesi/tls.jsp Algunas definiciones de tecnologas del lenguaje:
(1) The field of human language technology covers a broad range of activities with the eventual goal of enabling people to communicate with machines using natural communication skills. Research and development activities include the coding, recognition, interpretation, translation, and generation of language (Cole et al. 1996). (2) Las tecnologas de la lengua, por su parte, se centran en la aplicacin de los ordenadores al estudio cientfico del lenguaje, en los modelos lingsticos formales, y en los sistemas informticos de comprensin y generacin de textos y habla (Gmez Guinovart y Palomar 1998:3). (3) Las tecnologas lingsticas comprenden () una serie de tcnicas relacionadas con el tratamiento informtico del lenguaje (Llisterri y Mart 2002:15).

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

15

(4) Por tecnologas de la lengua o ingeniera lingstica se entiende los programas que procesan el lenguaje humano con los siguientes objetivos: mejorar la comunicacin en todas sus modalidades y facilitar el acceso a la informacin por encima de las barreras que impone la distancia, el uso de lenguas distintas o el modo en que tiene lugar la comunicacin, ya sea hablado o escrito. [] Se trata, en ltimo trmino, de aplicar los conocimientos sobre la lengua al desarrollo de sistemas informticos, con el fin de que puedan reconocer, comprender, interpretar y generar lenguaje humano en todas sus formas (Mart 2003:9). (5) En el contexto de la Sociedad de la Informacin, las denominadas tecnologas lingsticas permiten aplicar los conocimientos sobre la lengua al desarrollo de sistemas informticos (OESI). (6) Language technologies are information technologies that are specialized for dealing with the most complex information medium in our world: human language. Therefore these technologies are also often subsumed under the term Human Language Technology (Uszkoreit).

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

16

Referencias bibliogrficas ALLEN, J. (1995): Natural Language Understanding, Redwood City, Ca.: Benjamin/Cummings, 2 ed. ALLEN, J. (1998): AI Growing Up. The Changes and Opportunities, AI Magazine, 19 (4), 13-23. BOGURAEV, B.; GARIGLIANO, R. y TAIT, J. (1995): "Editorial", Natural Language Engineering, 1 (1), 1-7. COLE, R. A. et al. (eds.) (1996): Survey of the State of the Art in Human Language Technology, Cambridge: Cambridge University Press. Publicacin electrnica en: http://cslu.cse.ogi.edu/HLTsurvey/HLTsurvey.html CUNNINGHAM, H. (1999): "A definition and short history of Language Engineering", Journal of Natural Language Engineering, vol 5, 1-16. EDWARDS, J. A. y KINGSCOTT, A. G. (eds.) (1997): Language Industries Atlas, Amsterdam: IOS Press, 2 ed. FERNNDEZ, G. y SEZ VACAS, F. (1995): Fundamentos de Informtica. Lgica, Autmatas, Algoritmos y Lenguajes, Madrid: Anaya Multimedia. GMEZ GUINOVART, J. (1998): Fundamentos de Lingstica Computacional: bases tericas, lneas de investigacin y aplicaciones, en J. Bar i Queralt y P. Cid Leal (eds.), Anuari SOCADI de Documentaci i Informaci, Barcelona: Societat Catalana de Documentaci i Informaci, 135-146. Disponible electrnicamente en:
http://www.raco.cat/index.php/Bibliodoc/article/viewFile/56629/66051

GMEZ GUINOVART, J.(1999): Introduccin, en J. Gmez Guinovart et al. (eds.), Panorama de la investigacin en lingstica informtica, Monografa de Revista Espaola de Lingstica Aplicada, Logroo, 7-9. GMEZ GUINOVART, X. (2000a): "Lingstica computacional", en F. RAMALLO, G. REI DOVAL e X. P. RODRGUEZ YEZ (coords.), Manual de Ciencias da Linguaxe, Vigo: Edicins Xerais de Galicia, 221-268. Publicacin electrnica en: http://webs.uvigo.es/sli/arquivos/xerais.pdf GMEZ GUINOVART, J. y PALOMAR, M. (coords.) (1998): Lengua y Tecnologas de la Informacin, nmero monogrfico de Novtica, 133. GREGORY, R. L. (ed.) (1995 [1987]): Diccionario Oxford de la mente, Madrid: Alianza Diccionarios. Ingeniera lingstica. Cmo aprovechar la fuerza del lenguaje. Luxemburgo: Anite Systems. Versin espaola a cargo del Observatorio Espaol de Industrias de la Lengua, Instituto Cervantes. LAWLER, J. y ARISTAR DRY, H. (eds.) (1998): Using Computers in Linguistics. A Practical Guide, London and New York: Routledge. Lenguaje y tecnologa. De la torre de Babel a la aldea global, Luxemburgo: Oficina de Publicaciones Oficiales de las Comunidades Europeas, 1997. LLISTERRI, J. y GARRIDO ALMIANA, J. M. (1998): La ingeniera lingstica en Espaa, El espaol en el mundo, Madrid: Arco/Libros y Alcal de Henares: Centro Virtual Cervantes, Instituto Cervantes. Publicacin electrnica en: http://cvc.cervantes.es/lengua/anuario/anuario_98/llisterri/
Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Lingstica Computacional I. Tema 1. Introduccin a la LC.

17

LLISTERRI, J. y MART, M. A. (2002): Las tecnologas lingsticas en la Sociedad de la Informacin, en M. A. Mart y J. Llisterri (eds.), Tratamiento del lenguaje natural. Tecnologa de la lengua oral y escrita, Soria: Fundacin Duques de Soria-Barcelona: Edicions de la Universitat de Barcelona, 13-28. MART ANTONN, M. A. (coord.) (2003): Tecnologas del lenguaje, Barcelona: Editorial UOC. MART ANTONN, M. A. y CASTELLN MASALLES, I. (2000): Lingstica computacional, Barcelona: Universitat de Barcelona. MCCARTHY, J. (2002): What is Artificial Intelligence?. Notas introductorias al campo de la IA. Publicacin electrnica en: http://wwwformal.stanford.edu/jmc/whatisai/whatisai.html MEYA, M. (1980): La inteligencia artificial, Revista Espaola de Lingstica, 10/1, 135-159. MORENO BORONAT, L. Y MOLINA MARCO, A. (1999): "Preliminares y tendencias en el Procesamiento del Lenguaje Natural", Inteligencia Artificial, 7, Primavera, 65-76. MORENO BORONAT, L.; PALOMAR SANZ, M.; MOLINA MARCO, A. y FERNNDEZ RODRGUEZ, A. (1999): Introduccin al procesamiento del Lenguaje Natural, Alicante: Universidad de Alicante. MORENO SANDOVAL, A. (1998): Lingstica computacional. Introduccin a los modelos simblicos, estadsticos y biolgicos, Madrid: Sntesis. MOURE, T. y LLISTERRI, J. (1996): Lenguaje y nuevas tecnologas: el campo de la lingstica computacional, en M. FERNNDEZ PREZ (coord.), Avances en Lingstica aplicada, Universidade de Santiago de Compostela: Servicio de Publicacins e Intercambio Cientfico, 147-227. Publicacin electrnica: http://liceu.uab.es/~joaquim/publicacions/llisterri_moure_96.html Oficina de Espaol en la Sociedad de la Informacin (OESI): http://oesi.cervantes.es// RAMSAY, A. M. (1991): Artificial Intelligence, en K. Malmkjaer (ed.), The Linguistics Encyclopedia, London and New York: Routledge, 28-38. SIMON, H. A. (1995): Artificial intelligence: an empirical science, Artificial Intelligence, 77, 95-127. TENNANT, H. (1981): Natural Language Processing. An introduction to an Emerging Technology, New York: Petrocelli Books. TRASK, R. L. (1993): A Dictionary of Grammatical Terms in Linguistics, LondonNew York: Routledge. USZKOREIT, H.: Language Technology. A First Overview. Publicacin electrnica en: http://www.dfki.de/~hansu/LT.pdf VERDEJO, M. F. (1995): "Comprensin del lenguaje natural: avances, aplicaciones y tendencias", Arbor, CLI, 595 (Julio), 39-83. VIDAL VILLALBA, J. y BUSQUETS RIGAT, J. (1996): "Lingstica computacional", en C. MARTN VIDE (ed.), Elementos de lingstica, Barcelona: Octaedro Universidad, 393-446.

Milka Villayandre Llamazares, Universidad de Len milka.villayandre@unileon.es

Das könnte Ihnen auch gefallen