Informática Aplicada a la Traducción e Interpretación

Memorias de Traducción

Departamento Informática y Sistemas

Memorias de traducción

Una MT es un tipo de base de datos lingüística


1970: surge la idea

1980: primeros desarrollos

1990: a finales de la década se comercializan

Actualmente redes neuronales

Inicialmente herramientas internas de las empresas

Lista de segmentos de texto origen explícitamente alineados con sus homólogos de texto destino

Memorias de traducción


Unidad de traducción 1 IN: The following document name has invalid characteres or is too long.

FR: Le nom du document ci-dessous est trop long ou contient des caractères non valides.
Unidad de traducción 2 IN: Please rename the document.

FR: Veuilez renommer le document.

¿Cómo funciona una MT?

Comparación automática de un texto fuente con una base de datos de textos que ya han sido traducidos

Por ejemplo:

Nuevo segmento fuente El nombre de fichero no es válido
.
Unidad MT almacenada Español: El nombre de fichero no es válido
Francés: Le nom de fichier n'est pas valide

¿Cómo funciona una MT?

Equipos de traducción


Los equipos de traducción suelen estar formados por:

¿Cómo funciona una MT?

Importancia de la comunicación del equipo

¿Cómo funciona una MT?

Segmentación


La unidad básica de segmentación en un sistema de MT es la frase

El usuario puede definir otras Problemas con cabeceras, signos de puntuación, abreviaturas, ...

Posible solución mediante "listas de parada"

Las unidades de segmentación utilizadas en el texto origen pueden no corresponder exactamente a las utilizadas en la traducción

¿Cómo funciona una MT?

Cabecera ES: Peligro:

FR: Avertissement:
Una frase traducida en otra frase ES: Este programa de ordenador está protegido por la ley de Copyright y tratados internacionales.

FR: Ce logiciel est protégé par les lois et les traités internationaux sur le droit d'auteur.
Una frase traducida en dos frases ES: La reproducción o distribución no autorizada de este programa, o cualquier parte de el, puede resultar en severas penas civiles y criminales, y podría ser perseguido con la máxima extensión posible de la ley.

FR: Toute reproduction ou distribution partielle ou totale, par quelque moyen que ce soit, est strictemet interdite. Toute personne ne respectant pas ces dispositions se rendra coupable du délit de contrefaçon et sera passible des sanctions pênales prévues para la loi.
Dos frases traducidas en una frase ES: Las opciones del botón "0" y el "1" afectan la aplicación actual. Las otras opciones afectan todas las aplicaciones.

Les modificationes apportées par le bouton "0" et l'option "1" n'affecteront que l'application en cours alors que les autres options seront répercutées dans toutes les applications.

¿Cómo funciona una MT?

Coincidencias


Las más comunes son las exactas, las fuzzy y las de términos


Nuevos tipos de coincidencias, como la completa y la de subsegmentos


Las técnicas de coincidencia existentes que usan la mayoría de sistemas de MT tienen limitaciones

¿Cómo funciona una MT?

Coincidencias exactas


Es 100% idéntica al segmento que el traductor está traduciendo, tanto lingüísticamente como en términos de formato

Hay situaciones en que la traducción propuesta no es apropiada

Casos de homonimia, un segmento puede ser en realidad una traducción exacta cuando se considera aisladamente, pero no si se coloca en el contexto equivocado

¿Cómo funciona una MT?

Coincidencias completas


Segmento origen difiere de una unidad almacenada en la MT en términos de los llamados elementos variables

Los elementos variables incluyen números, fechas, horas, monedas, medidas y hasta nombres propios

Estos elementos suelen requerir algún tipo de tratamiento especial en el texto

¿Cómo funciona una MT?

Coincidencias fuzzy


Sistemas de MT que son capaces de localizar equivalencias aproximadas

Denominadas coincidencias “difusas” o “fuzzy”

Recupera un segmento que es similar, pero no idéntico, al segmento fuente

Se ha de fijar el umbral de sensibilidad

Problemas de "silencio" y "ruido"

¿Cómo funciona una MT?

Correspondencia de términos


La mayoría de los sistemas de MT operan junto con una base de términos asociada


El sistema comparará los términos individuales que figuran en cada segmento del texto origen con los términos de la base terminológica


Se conoce como reconocimiento activo de terminología y constituye esencialmente una búsqueda en un diccionario automático

¿Cómo funciona una MT?

Correspondencia de subsegmentos


Se sitúa entre la coincidencia fuzzy y la de términos

Puede parecer que la correspondencia de subsegmentos es una coincidencia fuzzy con un umbral de sensibilidad muy bajo, sin embargo, en el caso de la fuzzy, la similitud se determina basándose en la semejanza global de los dos segmentos

En el caso de la correspondencia de subsegmentos, los elementos que se comparan son pequeños fragmentos de los segmentos

Una coincidencia de subsegmentos también se diferencia de una coincidencia de términos

¿Cómo funciona una MT?

No coincidencias


Es posible que haya segmentos para los cuales no se recupere ninguna coincidencia útil

El nuevo segmento fuente debe ser traducido por el traductor desde cero

O utilizar un sistema de traducción automática

Una vez que un segmento fuente se ha traducido, se puede añadir a la MT

¿Cómo funciona una MT?

Limitaciones de los algoritmos de correspondencia actuales


Incapacidad para hacer frente a la inflexión y la derivación


Ejemplos:


Sustantivo plural, "niño" + "s" = "niños"

Conjugar un verbo,"hablar" + "ado" = "hablado"

Creación de una MT

Un sistema MT es esencialmente una base de datos

La información debe proporcionarla el usuario

Cuanto mayor sea el número de textos almacenados, mayor será la probabilidad de encontrar algún tipo de coincidencia

Es útil crear memorias de traducción separadas para distintos campos

Formas principales de introducir traducciones en la base de datos MT: traducción interactiva o alineación post-traducción

Creación de una MT

Traducción interactiva


La más sencilla

Se añaden unidades de traducción a medida que avanzan

Una vez que un segmento se ha traducido y almacenado, se convierte en parte de la MT

Generalmente da como resultado una base de datos de mayor calidad

Este método puede conllevar una cantidad considerable de tiempo

Se puede gestionar por varios traductores conectados en red

Creación de una MT

Alineación post-traducción


Función para alinear traducciones ya existentes

Algunos sistemas tratan de hacer la alineación cuando una búsqueda está en curso

La mayoría de los sistemas requieren que la alineación se lleve a cabo antes de la búsqueda

Existen limitaciones y los resultados dependen de la idoneidad de los textos para la alineación

Consideran la correlación natural entre las longitudes de los segmentos traducidos

Uso de pares de palabras análogas conocido como cognados o dobletes

Trabajo con una MT existente

Modo interactivo


Modo no interactivo (por lotes)

Textos adecuados para MT

Textos que contienen repeticiones internas

Revisiones

Textos reciclados

Actualizaciones

Ventajas y desventajas de MT

Tiempo

Calidad

Formato electrónico

Formatos de archivo, filtros y normas

Conjuntos de caracteres y dificultades relacionadas con el idioma

Actitudes

Tasas de remuneración

Propiedad

Integración con otras herramientas

Sistemas gestores de terminología

Concordancias bilingües

Sistemas de traducción automática

Aspectos económicos

Memorias de traducción comerciales

OmegaT

Trados translator’s Workbench

IBM TranslationManager

Start transit

Atril Déjà-Vu

Euramis (memoria de traducción en la Comisión Europea)

Estándares en memorias de traducción

Open Document: formato para los documentos creados con las aplicaciones ofimáticas

TBX: basado en el lenguaje XML, utilizado para la creación, gestión e intercambio de glosarios terminológicos

TMX: basado en el lenguaje XML, utilizado para la creación, gestión e intercambio de memorias de traducción

TRANSLATION WEB SERVICES: basado en el lenguaje XML, empleado para facilitar el intercambio de información entre los diversos protagonistas en los procesos de traducción

XLIFF (XML Localisation Interchange File Format): basado en el lenguaje XML, empleado para la extracción y la elaboración del texto para traducir en el interior de los documento

XML (eXtensible Markup Language): tecnología textual relativa a la descripción y estructura de los datos

Estándares en memorias de traducción

XML no es más que una simplificación de SGML


Ventajas del empleo de XML:

/