Sie sind auf Seite 1von 37

MSTER ESPAOL/INGLS PARA FINES ESPECFICOS

Espaol de la ciencia y la tecnologa

Tema 5
Recursos lingsticos y
terminolgicos en Internet

Grupo EPA
MSTER ESPAOL/INGLS PARA FINES ESPECFICOS
Espaol de la ciencia y la tecnologa

Tema 5:
Recursos lingsticos y terminolgicos en
Internet

Dra. Isabel Santamara Prez


mi.santamaria@ua.es
Dr. Jos Joaqun Martnez Egido
jj.martinez@ua.es
La web es un mundo de aplicaciones
textuales hay un gran conjunto de
imgenes e incontables archivos de audio,
pero el texto predomina no slo en
cantidad, sino en utilizacin (Milln,
2001: pg. 35-36)
OBJETIVOS
Consultar y localizar informacin de
inters lingstico y terminolgico.
Localizar, gestionar y evaluar textos
especializados de una materia.
Constituir un corpus textual especializado,
til para la investigacin lingstica y
terminolgica.
Presentar distintos recursos de consulta
lingstica y terminolgica en Internet.
CONTENIDOS

Internet como fuente de informacin


especializada: obtencin de corpus

Herramientas lingsticas para el tratamiento de


textos: Antconc

Internet como almacn de recursos lingsticos y


terminolgicos
Qu es Internet?
Internet es la red de redes que
permite la interconexin de redes y
ordenadores de todo tipo mediante
ruteadores (dispositivos de conexin
y distribucin de datos en una red).
Qu se puede hacer en
Internet?
Enviar mensajes
Opinar sobre temas
Chatear
Consultar catlogos de bibliotecas
Visitar museos
Conseguir informacin
Ofrecer informacin
Conseguir programas informticos
Comprar/vender, etc.
Internet para el lingista
Fuente de comunicacin (listas de
discusin, correo electrnico, foros)
Intercambio de datos (bases de datos,
publicaciones, documentacin, corpus, etc.)
Fuente de informacin terminolgica y
documental (catlogos, contextos,
definiciones, trminos, glosarios, bases de
datos).
Captura de informacin para realizar un
trabajo terminolgico (trmino, contextos,
textos, publicaciones, herramientas, etc.)
Internet como fuente de
informacin especializada: el
corpus
Internet

fuente de informacin lingstica

Corpus

informacin textual y discursiva


informacin sobre unidades concretas
(variantes, definiciones, categora gramatical)
ejemplos de coocurrencias, etc.
Internet como fuente de
informacin especializada: el
corpus
Necesidad de informacin

Criterios o estrategias
INFORMACIN de bsqueda para la
recuperacin de
EN LA WEB informacin

Herramientas de bsqueda
en Internet
Internet como fuente de
informacin especializada: el
corpus
Qu tipo de informacin recuperamos?

Material textual disponible en Internet que


contiene informacin lingstica.

Productos finales que contienen


informacin lingstica (bases de datos,
glosarios, diccionarios en lnea, corpus,
etc.).
Directorios vs. motores de
bsqueda

BUSCADORES

ndices o directorios

Motores de bsqueda

Metabuscadores
Directorios vs. motores de bsqueda

Tendencia actual

convertir a los buscadores en portales que


ofrecen servicios, ventas y productos

Imposibilidad de ubicar a los actuales


buscadores en una sola descripcin
(directorios, motores de bsquedad, etc.)
Directorios vs. motores de bsqueda

Directorios Motores de bsqueda


Bsqueda dirigida Consulta libre

Funcionan por navegacin Funcionan por recuperacin de


informacin
Lista de recursos clasificados
por temas Programas automticos que
constituyen una BD con todas
las pginas web exploradas
Recogen una pequea parte de
los recursos digitales de la
WWW Recogen la totalidad de recursos

Organizan la informacin Organizan la informacin por


manualmente asignando los comparacin automtica y
recursos a una o ms clases creacin de ndices

Actualizacin de la informacin Actualizacin automtica y


lenta rpida
Indices-directorios

Ventajas Desventajas

-Informacin clasificada, precisa y de -Resultados menores que con los


calidad motores de bsqueda
-Suelen presentar sus enlaces -Enlaces no siempre actualizados
comentados
-Cada directorio tiene su propia
-Realizada por expertos calidad
clasificacin
-Permiten buscar por una catalogacin
temtica preexistente -Sistema menos intuitivo que en
los motores
-Es posible navegar por una temtica
determinada sin concretar la palabra -En las clasificaciones priman los
clave
criterios comerciales
Motores de bsqueda

Ventajas Desventajas

-Abundante informacin -Exceso de informacin

-Est todo -Los primeros resultados suelen


ser pginas que enlazan con
-Buscan en toda la red otras
-Fciles de usar e intuitivos -Presencia de resultados que no
interesan
-Actualizacin de los enlaces
Motores de bsqueda

Recursos ms utilizados para buscar en Internet

Se basan en programas automticos que saltan


de una pgina a otra de la web, siguiendo los
enlaces que encuentran en cada pgina para
construir una gigantesca base de datos.

La bsqueda es por palabras clave.


Ejemplos
Directorios:
Yahoo http://es.yahoo.com/
Excite http://www.excite.es/directory
Lycos http://www.tripod.lycos.es

Buscadores:
Google http://www.google.com
AltaVista http://www.altavista.com
Oz http://www.ozu.es
Terra http://www.terra.es
Metabuscadores
Buscador de buscadores
Redirigen las consultas simultneamente a
bases de datos de varios motores y directorios

tiles para consultar datos muy concretos.

Algunos permiten realizar una consulta


simultnea a todos los buscadores indexados o
bien determinar el buscador en concreto al que
se desea enviar la interrogacin.
Ejemplos de metabuscadores
http://metacrawler.com
http://www.i-une.com
http://www.kartoo.com

Otros metabuscadores en:


http://www.cuervoblanco.com/metabuscador
es.html
http://www.buscopio.net
http://www.internetinvisible.com
Buscadores especializados
Se estructuran sobre la base de un
directorio temtico, aunque pueden ofrecer
un motor de bsqueda.
Su atractivo reside en la especializacin
temtica y en la calidad de los vnculos.
Los recursos que proporcionan son muy
variados: portales temticos, sitios web de
asociaciones, pginas personales, etc.
http://www.scirus.com
Recuperacin de informacin:
operadores booleanos
Permiten expresar nuestras
necesidades de informacin con la
mxima precisin.

Sirven para exigir o excluir conceptos


en la bsqueda avanzada y en
determinados motores de bsqueda.
Tipos de operadores
booleanos
AND (&): localiza documentos que contengan
uno y otro trminos expresados en la consulta.

OR (I): localiza documentos que contengan


uno u otro de los trminos especificados en la
consulta.

NOT (!): recupera documentos que no


contengan un trmino expresado en la
consulta.
Tipos de operadores
booleanos
Frase exacta: Permite buscar
ocurrencias de fragmentos textuales
que coincidan exactamente con el
contenido de un documento.
Se representan:
transcripcin gentica
Tipos de operadores
booleanos
Limitar idioma: Permite limitar los
resultados de la bsqueda a los que se
encuentren en una determinada lengua
especificada previamente.
Limitar a un servidor (domain: host):
Encuentra las pginas con la palabra o frase
especificada en el dominio del servidor Web
donde se encuentre estas pginas.
Domain: .mx (limitamos la bsqueda a ese
dominio: Mxico)
Tipos de operadores
booleanos
Limitar a ttulo: El motor de bsqueda
encuentra las pginas que contienen
la palabra o frase en el ttulo.

Limitar a texto: el contenido de la


pgina.

Limitar a perodo temporal.


Tipos de operadores
booleanos
Formatos de documentos en Internet
Pginas .html
Documentos de word .doc
Archivos .pdf
Imgenes .jpg, .gif
Comprensin y descomprensin de
ficheros .zip
Internet como almacn de
recursos lingsticos y
terminolgicos
a. Recursos lexicogrficos
b. Recursos terminolgicos:
catlogos de diccionarios
especializados
c. Recursos textuales
d. Bases de datos terminolgicos y
neolgicos
e. Consulta con otros especialistas:
listas de discusin y foros
a) Recursos lexicogrficos
Recursos lingsticos generales: Diccionarios y enciclopedias
Espaol
http://www.rae.es
http://clavecorp.grupo-sm.com
Cataln
http://pdl.iecat.net
Ingls
http://www.m-w.com (Merriam Webster)
http://www.ldoceonline.com (Longman)
http://dictionary.cambridge.org
http://www.hyperdictionary.com
http://www.oed.com/ (Oxford English Dictionary)

Francs
http://atilf.atilf.fr/tlfv3.htm

Alemn
http://www.dwds.de/
AllWords.com: Diccionario ingls con
traduccin a seis idiomas
http://www.allwords.com
Diccionario de sinnimos
http://tradu.scig.uniovi.es/sinon.html
ElMundo.es
http://www.elmundo.es/diccionarios
a) Recursos lexicogrficos
Portales
http://www.yourdictionary.com. Portal con
2.500 diccionarios y gramticas en 300
lenguas
http://www.onelook.com/browse.shtml.
Portal con cerca de 900 diccionarios
http://www.diccionarios.com. Portal de
Larousse.
http://www.lexicool.com. Portal con ms de
4.000 enlaces de diccionarios y glosarios
bilinges y multilinges
b) Recursos terminolgicos
Portales
Portalingua http://www.portalingua.info. Portal dedicado
a las lenguas neolatina. Consulta de recursos en lnea.
TermSciences http://www.termsciences.fr/. Portal
terminolgico multidisciplinario. Permite la consulta de
trminos en francs, ingls, espaol y alemn
Eureka http://www.foreignword.com/eureka/default.asp.
Portal que recoge informacin sobre bancos de datos
terminolgicos, glosarios, diccionarios, traduccin, etc.
Latinosapiens http://www.latinosapiens.info. Portal de
informacin cientfica en lenguas neolatina. Contiene
artculos, foros, revistas.
b) Recursos terminolgicos
Catlogo de glosarios y diccionarios especializados

Hiperenciclopdia http://www.grec.net/home/cel/mainc.htm

Visual dictionary http://www.infovisual.info/

Glossarist http://www.glossarist.com/

Terminology Collection
http://lipas.uwasa.fi/comm/termino/collect/

Vademcum del traductor externo


http://www.europarl.europa.eu/transl_es/plataforma/pagina/
celter/celula.htm

Inventerm http://www.inventerm.com/
c) Recursos textuales
Corpus
BwanaNet
BNC (British National Corpus)
CREA (Corpus de Referencia del espaol
actual)
Internet (Scirus [cientfico], Google)
d) Bancos de datos
terminolgicos y neolgicos
TERMITE (Banco creado por la International
Telecommunications Union)
http://www.itu.int/terminology/index.html
Terminologa de la FAO
http://www.fao.org/faoterm/index.asp?lang=ES
IATE http://iate.europa.eu/
UPF_Term http://upfterm.upf.edu:8080/cat/index.htm
TIS (Terminological Information System)
http://tis.consilium.eu.int/utfwebtis/frames/introfsEN.htm
Termium http://www.termium.gc.ca/site/accueil_home_f.html
Cercaterm http://www.termcat.es
Neoloteca http://www.termcat.es
Bobneo http://obneo.iula.upf.edu/bobneo/
f) Listas de discusin, foros
y blogs
The Linguist List. Conjunto de listas
(corpora, ELEX, lexicography)
http://www.linguistlist.org/

Relacin temtica de listas de distribucin


de RedIris (tecnotrad, traduccin,
tradumtica)
http://www.rediris.es/list/
Evaluacin de resultados
Autora
Actualidad
Precisin y correccin
Tratamiento del contenido
Originalidad
Enlaces a otros recursos
Ergonoma
Citacin en otros sitios

Das könnte Ihnen auch gefallen