Beruflich Dokumente
Kultur Dokumente
@chelovargas
UPC
Universidad Peruana de Ciencias Aplicadas Lima, 13 de septiembre de 2013
NDICE: ROLES
PRIMER ROL
TRADUCTOR
ndice
3. Sistemas de MT
2. Conceptos clave
Componentes Funciones
5. Intercambio de datos
Tendencias
1966
ALPAC
El informe critic la TA
1980, M. Kay
Traduccin automtica
Procesador de textos
Cambio de
Picture by Isaal Leedom: http://www.flickr.com/photos/risus_in_silva/
paradigma
Evolucin/innovaciones Globalizacin de software y hardware Ms textos para traducir Presin para traducir rpido y Desarrollo mejor espectacular de Traduccin = las TIC: RAZONES entorno computerizado
GLOBALIZACIN
SIMSHIP
CONCEPTOS CLAVE
CONCEPTOS CLAVE
. Estacin de trabajo
Conjunto integral compuesto por una serie de aplicaciones y recursos para la traduccin
Programas de concordancias
Estacin de Trabajo
Corpus electrnicos Internet BDT Programas de interaccin (chat, correo-e, listas, foros, etc.)
Recurso Recurso documental documental Recurso Recurso lexicogrfico lexicogrfico Recurso Recurso enciclopdico enciclopdico Repositorio Repositorio de de bases/bancos bases/bancos de de datos datos Megacorpus Megacorpus
CONCEPTOS CLAVE
Traduccin automtica,TA Traduccin automtica asistida por humanos, TAAH
CONCEPTOS CLAVE
Sistemas TA
traducen trminos o textos como conjuntos absolutos, de manera automtica y sin que el usuario intervenga en el proceso propiamente dicho, aunque s puede hacerlo en alguna fase anterior o posterior.
CONCEPTOS CLAVE
TO
TM
Intervencin humana
CONCEPTOS CLAVE
Sistemas TAAH
traducen trminos o textos como conjuntos absolutos, de manera automtica, pero el usuario interviene antes, durante y/o despus del proceso.
CONCEPTOS CLAVE
TO sin editar
MODELO DE TAAH
TO pre-editado
TM
post-edicin
CONCEPTOS CLAVE
Herramientas TAO
conjunto de programas informticos que ayudan a realizar la traduccin: Memorias de traduccin (SDL Trados, Transit, Dj Vu, MemoQ) Sistemas gestores de BDT (Multiterm, TermStar, TermBase, ) Sistemas de localizacin (SDL Passolo, Alchemy Catalyst, )
CONCEPTOS CLAVE
Herramientas TAO
conjunto de programas informticos que ayudan a realizar la traduccin: Sistemas de Memorias de Traduccin (SDL Trados, Transit, Dj Vu, MemoQ) Sistemas Gestores de BDT (Multiterm, TermStar, TermBase, ) Sistemas de Localizacin (SDL Passolo, Alchemy Catalyst, )
Conceptos clave
SISTEMA DE TRADUCCIN MODELO DE TAO HERRAMIENTA 3 Internet, corpus electrnicos HERRAMIENTA 1 BD Memoria TO HERRAMIENTA 5 Correctores ortogrficos
TM
TRADUCTOR HUMANO
post-edicin
HERRAMIENTA 4 BD terminolgicas
CONCEPTOS CLAVE
Segmentacin
Segmento
Unidad mnima de traduccin
Alineacin Formatos
codificacin del archivo (doc, .html, .pdf, .xml, etc.)
proceso de reestructuracin de dos textos dados de forma que se establezca una correspondencia entre prrafos, frases y/o palabras de ambos
Filtros
aplicaciones que convierten el formato original del texto en uno intermedio
Flujo de trabajo
Aspectos operacionales de la actividad de traduccin.
Sistema de MT
Herramienta avanzada de TAO que permite al usuario: (1) almacenar frases o segmentos originales junto con sus respectivas traducciones en BD especial (la memoria); (2) recuperar segmentos de texto en funcin de ciertas condiciones de bsqueda. Traduccin humana: el traductor decide la idoneidad de un segmento o trmino recuperado por el sistema.
Sistema de MT
AVANZADA?
Se trata de un nico programa, que contiene un conjunto de aplicaciones que se combinan en un nico entorno. Trabajan al mismo tiempo con:
El documento BILINGE (el archivo importado, filtrado y la traduccin) Los RECURSOS del sistema: La MT La BDT (Diccionario Autosuggest, LiveDocs, .)
Sistema de MT
Qu es lo que NO hacen los SMT?
No traducen. Son diferentes de los traductores automticos
Sistema de MT
Qu es lo que SI hacen los SMT?
Recuperan material previamente traducido:
Correspondencia exacta (exact matching) Correspondencia aproximada (fuzzy matching)
Sistema de MT
Qu distingue a los SMT de otras herramientas TAO?
No necesita volver a traducir segmentos que haya traducido en ocasiones anteriores
Sistema de MT
Cmo funcionan?
Texto original
MT
Texto meta
IMPORTACIN FILTROS
IMPORTACIN
ALINEACIN
IMPORTACIN
Otras BDM
Trad. previas
Otras BDT
Glos. previos
BDM
PRETRADUCCIN
BDT
TEXTO DE TRABAJO
EXPORT. FILTROS
PREPRODUCCIN
SISTEMA MT+ TA
Texto original se encuentra en la MT
Texto meta
Texto original
MT
Texto original NO est en la MT
TA
Texto meta
Sistema de MT
Qu textos son adecuados?
Sistema de MT
Qu textos son adecuados? Actualizaciones Revisiones
Sistema de MT
Qu textos son adecuados?
C a t e g o r i a s
econmico
Correspondencia
Prensa/ comunicacin
comercial
marketing
publicidad
administrativo
jurdicos
cientfico
tcnico
cultural
literario
C a t e g o r i a s
econmico
Correspondencia
Prensa/ comunicacin
comercial
marketing
publicidad
administrativo
jurdico
cientfico
tcnico
cultural
literario
Sistema de MT
Qu textos son adecuados? Patentes (Jurdicos, cientfico-tcnicos) T Contratos (jurdico, econmico, i comercial) P Manuales de usuario (tcnico) Informes anuales (negocios, comercio) o Artculos de investigacin s Certificados
COMPONENTES
EDITOR
MEMORIA DE TRADUCCIN
1
BASE DE DATOS TERMINOLGICA
2
4
ALINEADOR
EDITOR
EDITOR
EDITOR
EDITOR
EDITOR
EDITOR
MEMORIA
MEMORIA
MEMORIA
Campos personalizados
Campos en Dj Vu
SGBD terminolgicas
SGBD terminolgicas
FUNCIONES
Almacenamiento de datos terminolgicos (antes, durante o despus de la traduccin) Reconocimiento de trminos en el segmento activo Verificacin de la terminologa empleada
Almacenamiento
e n t r a d a
2
REGISTRO
CAMPOS
se trabaja
O Elegir el mtodo ms sencillo segn el flujo
truncamiento
O Portabilidad
O Dominio
O Fuente O Notas
SGBD terminolgicas
FUNCIONES
Almacenamiento de datos terminolgicos (antes, durante o despus de la traduccin) Reconocimiento de trminos en el segmento activo Verificacin de la terminologa empleada
SGBD terminolgicas
FUNCIONES
Almacenamiento de datos terminolgicos (antes, durante o despus de la traduccin) Reconocimiento de trminos en el segmento activo Verificacin de la terminologa empleada
SGBD terminolgicas
(IN)FLEXIBILIDAD DE LOS SISTEMAS
Bsicos: 2 columnas Poco flexibles Flexibles: Multiterm y TermStar
A L I N E A D O R
ALINEADOR
ALINEADOR
Recapitulando
EDITOR
MEMORIA DE TRADUCCIN
1
BASE DE DATOS TERMINOLGICA
2
4
ALINEADOR
Formatos de archivos
De texto PDF
1
Complementos (plug-in)
2
ARCHIVOS (TMX o paralelos para alinear)
3
Plataformas
1
MyMemory
3
Linguee (http://www.linguee.es/), Glosbe (http://es.glosbe.com/), MyMemory (http://mymemory.translated.net/) Taus Data (http://www.tausdata.org/) Termacor. Terminology and Corpus (http://goo.gl/a4mVNw)
WebiText (http://webitext.com/bin/webitext.cgi)
1.
TA en SMT Aumento de la calidad en TA (lejos de la perfeccin) Cambio de foco en su aplicacin; los usuarios saben qu esperar
Traduccin automtica
Una amenaza?
TA ha conquistado furtivamente algunas reas:
Acceso rpido a la informacin en lenguas desconocidas por el usuario; Traduccin de chat y mensajes instantneos; y Traduccin rpida de documentos pequeos y pginas web para uso particular o interno
El ser humano puede soportar una semana de sed, dos semanas de hambre, muchos aos sin techo, pero no puede soportar la soledad. Es la peor de las torturas, de todos los sufrimientos. Paulo Coelho.
over the Internet and the hardware and systems software the data centres that que provide those Permite ain usuarios concurrentes pueden estar en services (Armbrust et al. 2010). trabajar en un proyecto situaciones geogrficas distintas comn: -Cualquier tarea se realiza con la computadora y va web -Se ha adaptado tambin a los procesos de traduccin
entornos de traduccin y estaciones de trabajo colaborativo (software como servicio basado en la nube , Cloudbased SaaS )
MemoQ
SEGUNDO ROL
GESTOR DE PROYECTOS
Gestin de proyectos
Preproduccin
Traduccin
Revisin
Cierre
ENTREGA
101
Gestin de proyectos
Concepto de proyecto:
Sentido amplio: p. de ingeniera civil p. de documentacin DRAE:
4. m. Conjunto de escritos, clculos y dibujos que se hacen para dar idea de cmo ha de ser y lo que ha de costar una obra de arquitectura o de ingeniera. 5. m. Primer esquema o plan de cualquier trabajo que se hace a veces como prueba antes de darle la forma definitiva. (+ Gral.)
Gestin de proyectos
Concepto de proyecto:
Sentido amplio: p. de ingeniera civil p. de documentacin WEBSTER:
A proposal of something to be done; plan; scheme An organized undertaking Idea de proyecto aplicada a cualquier actividad
103
Gestin de proyectos
Concepto de proyecto:
Un proyecto es un esfuerzo temporal, nico y progresivo emprendido para crear un producto o un servicio tambin nico
104
Gestin de proyectos
Naturaleza de los proyectos:
Para qu?:
Para cubrir la distancia potencial entre lo que el cliente quiere y lo que el proveedor le entrega, sin que se d la improvisacin: calidad Para racionalizar el tiempo, los recursos y los costes Porque garantiza la coherencia dentro del ciclo de desarrollo de un producto o servicio Porque mejora la planificacin, la comunicacin, la coordinacin y el trabajo en equipo
Por qu?
105
Gestin de proyectos
Si se anan esos esfuerzos evitamos:
106
Gestin de proyectos
108
Varios profesionales
F A S E S
112
CONCEPTO
ANLISIS
Traduccin
DESARROLLO
113
REVISIN/ INSTALACIN
OPERACIN
TAREAS
Recepcin material Recuento Elaboracin del presupuesto Fijacin de los plazos
Traduccin
Revisin y correccin
Entrega
Mantenimiento de la MT
114
Facturacin
Gestin de proyectos
Herramientas:
Usada para la gestin de proyectos en general Diseada especficamente para la gestin de proyectos de traduccin No creadas especficamente para las tareas de gestin de proyectos, pero que, sin embargo, se usan muy a menudo con este fin: Microsoft Office Excel y Microsoft Office Access
115
Gestin de proyectos
Figuras profesionales
117
Gestin de proyectos
Gestin de proyectos
Figuras profesionales en empresas de traduccin:
119 Jefe de proyecto Terminlogo Traductor principal Traductor(es) Revisor(es) Corrector(es) Maquetador(es) Responsable del control de calidad Tcnicos informticos Especialistas en programas especficos
Gestin de proyectos
Ejemplos :
Traduccin de 2 textos jurdicos (3.000 pal. c.u)
Traduccin de pg. web
120
121
Para aprovechar
una MT en formato propietario el traductor ha de: comprar la herramienta comprar una herramienta compatible con otras
ESTNDARES
ABIERTOS
ESPECIFICACIN DISPONIBLE
TAREA ESPECFICA
desarrollada en proceso abierto a toda la industria garantizar que cualquiera la puede usar sin pago de regalas o con condiciones
Definicin: formato universal recomendado y aprobado por una organizacin internacional de normalizacin (ISO) o por una determinada industria. Objetivo: facilitar el intercambio de textos empleando un lenguaje de marcas comn que define la estructura de cada documento (por ejemplo, HTML)
Formatos estndar para Intercambio de memorias de traduccin (TMX Translation Memory Exchange format) Intercambio de bases de datos terminolgicas (TBX Termbase Exchange format) Formato de archivo de intercambio de localizacin XML (XLIFF XML Localization Interchange File Format) No resuelven todos los problemas, pero s los ms urgentes
Extensible Markup Language Permite definir la gramtica de lenguajes especficos Estndar para el intercambio de informacin estructura entre distintas plataformas Se puede usar en casi todo (BD, editores, hojas de clculo, etc.)
TMX
(Translation Memory eXchange) LISA, 1998
de MT entre herramientas y agencias de traduccin sin que exista prdida [] de datos cruciales durante el proceso Resultado: Sistemas MT adaptados para poder I/E al formato TMX
TMX
TBX
(Termbase eXchange) LISA
TBX
XLIFF
(XML Localisation Interchange File Format)
OASIS, 2002-2008
localizables e informacin relacionada No es especfica de una herramienta concreta Formalizada en un vocabulario de XML Caracterizada por un mecanismo de extensibilidad
XLIFF
140
TERCER ROL
USUARIO DE INFORMTICA
Windows 7
Uso del teclado (Microsoft)
http://goo.gl/BSjjhF
Internet: aplicaciones
144
Aplicaciones
Teamviewer: acceso remoto al computador (gratuito) Dropbox, Box, Google Drive: almacenar y compartir en la nube Evernote: organizacin de info. mediante notas Scoop it Search Everything Mailinator: cuenta de correo temporal: cvs@mailinator.com TeraCopy Recuva Funduc Search & Replace SpyBot S&D (antivirus)
Aplicaciones
Babylon GT4T: Google Translate for Translators (60 $ al ao) Xbench: ApSIC Xbench 2.9 gratuito Traductor de Google
Aplicaciones: buscadores
2lingual Best Grammar & Plagiarism Checker DocJax (busca documentos) Wolfram Alpha (buscador matemtico) Archive.org Wayback Machine
CUARTO ROL
PROFESIONAL (AUTNOMO)
CON LO BIEN QUE TRABAJO SLO PARA QU QUIERO UTILIZAR LAS REDES SOCIALES?
VENTAJAS Y REQUISITOS
http://goo.gl/Gb5oS
TIPOS DE REDES
Horizontales:
Sin temtica definida y abierta a cualquier usuario
Verticales:
Centradas en una determinada temtica, esencialmente ocio o profesionales
Y HAZTE VISIBLE
SUGERENCIAS DE REDES
https://previous.delicious.com/chelovargas https://previous.delicious.com/manuelsaavedra
Twitlistmanager
QUINTO ROL
GESTOR DE LA INFORMACIN
BUSCA
RECUPERA
MANIPULA
ALMACENA
Competencia documental
Habilidades y destrezas especficas del traductor para saber manejar con precisin y rapidez las fuentes de informacin de cualquier tipo y en cualquier formato necesarias para su quehacer traductor (Palomares y Pinto, 2000: 100)
Conocimiento relacionado con el uso de fuentes de documentacin e informacin aplicadas a la traduccin (PACTE, 2005: 610)
Uso de fuentes documentales de todo tipo, la bsqueda de terminologa y la gestin de glosarios, bases de datos, etc., el manejo de las aplicaciones informticas ms tiles para el ejercicio de la profesin (tratamiento de textos, autoedicin, Internet, correo electrnico), adems de otras herramientas (Kelly, 2002: 1415)
Qu busca?
Las _____________ y __________ que afectan a la potente _________ del ___________ estn atravesadas por ___________ ________ posteriores a la primera fase del _______
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomtica del Cretcico Superior estn atravesadas por alineaciones diapricas transversales (NO-SE) posteriores a la primera fase del plegamiento
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomtica del Cretcico Superior estn atravesadas por alineaciones diapricas transversales (NO-SE) posteriores a la primera fase del plegamiento
Las estructuras anticlinales y sinclinales que afectan a la potente serie calco-dolomtica del Cretcico Superior estn atravesadas por alineaciones diapricas transversales (NO-SE) posteriores a la primera fase del plegamiento
si existe en la LM un trmino lexicalizado que exprese la idea del TermO: no se encuentra el equivalente
el
palabras contexto,
que significan.
WEB concretos
site:es, inurl:
pginas
expresin en Google de site: ms la especializadas, construir pgina web concreta (por ejemplo, un corpus ad hoc sobre http://www.cancer.gov/espanol) haramos las bsquedas un tema especfico.
obtendramos
toda
la
Concurrencia sinnimia
Participaciones preferentes:
preference shares, preferred shares, preferential shares, priority shares and privileged shares
Resultados de frecuencia
Resultados de equivalentes en Google Preference shares GB EE.UU.
61.000 740
126 16
514.000 2.430.000
11.200 15.000 497
Preferred shares
Priority shares Privileged share
DE ARCHIVOS
filetype: o ext:
multilinge,
podramos construir
una memoria de
textos paralelos.
Rigor, mtodo
Si NO existe el equivalente
Si NO existe el equivalente
Si NO existe el equivalente
Si NO existe el equivalente
ACEPTACIN SOCIAL
Dnde busca?
Su accesibilidad y aplicabilidad
Minera terminolgica
Sus mtodos se basan en el uso de los motores de bsqueda Las herramientas basadas en web reflejan distintas tecnologas,
POR ELLO
DIFERENTES RESULTADOS
definiciones equivalentes
proporcionan
ndices
Portales
Usenlos de manera crtica Manipulen la informacin para que se adecue a su entorno concreto de trabajo No corten y peguen la informacin de la web sin comprobar su calidad Siga directrices y listas que les aseguren dicha calidad
PERO
Muchas veces se trabaja en materias sobre las que nadie antes ha llevado a cabo una investigacin terminolgica
Confirmen la informacin visualizando los trminos en contexto en lugar de confiar exclusivamente en diccionarios y glosarios existentes.
Intente validar trminos que parecen ser buenos candidatos para ser cognados o prstamos en la LM: E.j. diaphragm spring diafragma de
Busque conceptos que estn relacionados Colabore con expertos del tema que le proporcionen el mecanismo de validacin a travs de listas de discusin
http://www.ilae.org/Visitors/Centre/ctf/documents/Spani shTranslationILAEHandout.pdf
http://www.ilae.org/Visitors/Centre/ctf/documents/NewConcep ts-Classification_2011_000.pdf
2. Recursos terminolgicos
Portales Catlogos con glosarios y diccionarios especializados Diccionarios y glosarios temticos Bancos terminolgicos Bancos con neologismos Bases de datos de conocimiento
Hyperdictionary
TermScience
EUTERM.ORG
Ms recursos
http://www.iula.upf.edu/recurs02es.htm Vocabularios Realiter: http://unilat.org/DTIL/Terminologie/Reseaux/ Realiter/es
Nombre largo 1. Hacer una bsqueda 2. Copiar URL de la bsqueda 3. Quitar la palabra de bsqueda 4. Aadir %s: Ejemplo con linguee.es: http://www.linguee.es/espanol-ingles/search?source=auto&query=%s
4. Configurar las bsquedas en Chrome Ctrl + T (abre una nueva pestaa en Chrome) Escribo linguee.es (o el nombre corto que haya elegido) Espacio o tabulador Escribo la palabra o expresin de bsqueda
4. Configurar las bsquedas en Chrome Ctrl + T (abre una nueva pestaa en Chrome) Escribo linguee.es Espacio o tabulador Escribo la palabra o expresin de bsqueda
BSQUEDA DE
INFORMACIN
Objetivos
Aprender a realizar bsquedas ms efectivas. Conocer los tipos de recursos que podemos obtener y cmo localizarlos. Practicar el proceso de bsqueda, refinado y captura de informacin relevante.
Recuperacin de informacin
Encontrar informacin en Internet NO es difcil pero Encontrar el equivalente, la informacin, el texto concreto que andamos buscando es como Advantages and disadvantages of the Internet Para extraer la aguja del pajar, el traductor debe emplear el motor de bsqueda a modo de
Recuperacin de informacin
Recuperacin de informacin
Implicaciones: (1) Conocer las funcionalidades del motor de bsqueda que vamos a emplear. (2) Aplicar el lenguaje de interrogacin que entiende el motor. (3) Planificar varias estrategias de bsqueda. Ms posibilidades de obtener respuesta fructfera
Recuperacin de informacin
Internet ofrece informacin y datos de alcance mundial PERO Hay mucha informacin. Anonimato de la fuente. POR LO TANTO Desarrollar estrategias de evaluacin de la informacin.
Recuperacin de informacin
El objetivo del proceso de localizacin y recuperacin de informacin es: Obtener los documentos que cumplen mejor con la necesidad de informacin
Documentos RECUPERADOS por SRI pero NO RELEVANTES para necesidad de info.
RUIDO
SILENCIO
Inconvenientes de Internet
Cantidad masiva de datos Dificultad de evaluar la informacin que recuperamos El carcter efmero de las pginas
Wayback Machine: http://www.archive.org/web/web.php
Tipos de buscadores
Directorios: http://goo.gl/Un8FTr Motores de bsqueda: http://goo.gl/t88A2 Metabuscadores: http://goo.gl/4H8hsI Buscadores especializados La web invisible: http://goo.gl/LlMxM
Los directorios
http://www.googledirectorio.com/
Los directorios
Definicin: guas o listas agrupadas y ordenadas sistemticamente por categoras y subcategoras. El acceso a la informacin es por NAVEGACIN Sitios definidos manualmente; la actualizacin no es automtica Apropiados para:
Temas amplios y generales Sitios web conocidos
Los directoriosVentajas:
Fciles de usar. Vnculos a pginas de calidad. Agrupan pginas similares.
Los directoriosDesventajas:
Bases de datos pequeas. No se actualizan rpidamente. Contienen descripciones generales sobre los sitios.
Los metabuscadores
Los metabuscadores
SRI que buscan simultneamente las bd de directorios y motores de bsquedas Ventaja: ahorro de tiempo Desventaja:
Recuperacin no exhaustiva de datos. No existe una estrategia de bsqueda comn.
SurfWax
http://www.surfwax.com
Ventajas:
Ahorro de tiempo Mayor calidad y especificidad de los resultados
U H
Economa http://ese.rfe.org/
Conclusiones
Muchas gracias