IATEI II. Localización

Prácticas 2016/17

Prácticas 2015/16

Introducción

Cada día es más habitual que los traductores tengan que participar en proyectos de localización de software de todo tipo. En este capítulo se presentan los aspectos más importantes a considerar cuando se trabaja en este tipo de proyectos.

La localización de software es una actividad con una componente técnica que habitualmente da lugar a numerosas dificultades, imposibles de exponer aquí por razones de espacio. La vertiente lingüística de los proyectos de localización presenta una serie de particularidades muy marcadas que diferencian claramente este tipo de proyectos de los habituales de traducción de textos.

Este tema se centra principalmente la vertiente lingüística, y se mostrará de una manera clara los principales aspectos a tener en cuenta cuando se trabaja en proyectos de localización.

Introducción a la localización de programas informáticos

1. Conceptos destacados: localización e internacionalización

Localización

Localización según LISA, es el proceso de adaptación de un producto –habitualmente, aunque no siempre, una aplicación o programa informático– para satisfacer los requisitos lingüísticos, idiomáticos, culturales y de otro tipo aplicables a un entorno, país, zona geográfica o mercado específico.

El término localización a menudo se abrevia como L10n. Que viene de la denominación en inglés (localization). La L es la primera letra, la n la última y 10 simboliza el número de letras entre la primera letra y la última.

Los conceptos de traducción y localización frecuentemente se confunden, porque muchos aspectos de ambos son comunes. De hecho, la localización implica una serie de procesos, entre los cuales se incluye la traducción.

Internacionalización

La internacionalización es el proceso de diseñar e implantar un producto que se muestre tan neutro como sea posible desde el punto de vista cultural y técnico y que, por lo tanto, sea fácilmente trasladable a una o diversas culturas específicas; es decir, que sea fácilmente localizable.

El término internacionalización a menudo se abrevia como i18n. Esta abreviatura viene de la denominación en inglés (internationalization). La i es la primera letra, la n la última y 18 simboliza el número de letras entre la primera letra y la última.

2. Aspectos importantes de la aplicación original

Los programas informáticos pueden tener distintos niveles de internacionalización. Se pueden concretar en cuatro:

• Sin internacionalización. La aplicación sólo funciona en una lengua y no está preparada para facilitar la localización.

• Código de programación dependiente de la localización. Se ha de escribir un código diferente para cada lengua o grupo de lenguas. Es posible que para lenguas “occidentales” (caracteres de un byte y escritura de izquierda a derecha) se pueda compartir el mismo código, pero se necesita un nuevo código de programación para lenguas que se escriben de derecha a izquierda (como el hebreo y el árabe) y para lenguas que necesitan más de un byte (como el chino, el japonés y el coreano).

• Un único código fuente, pero diversos binarios. Es posible que haya un único código fuente, pero que sea necesario compilar diversas versiones del ejecutable para diferentes lenguas o grupos de lenguas.

• Un único código fuente, y un único binario. Tanto el código fuente como el binario satisfacen las exigencias de todas las lenguas.

Los aspectos a considerar para asegurar que un código de programación sea fácil de localizar son:

• Separar el código fuente de los mensajes de texto. Esto evitará la necesidad de manipular los archivos de código y la posibilidad de encontrar errores de compilación posteriormente.

• Eliminar las restricciones de longitud de los elementos de las interfaces de usuario.

• Comprobar que se visualicen correctamente los caracteres acentuados y los diferentes alfabetos, incluso aquéllos que utilizan caracteres de más de un byte.

• Permitir la utilización de diferentes configuraciones de teclado.

• Evitar la utilización de formatos fijos de fechas, horas y divisas.

• Evitar utilizar textos en imágenes, pues son difíciles de editar.

Hay otros aspectos importantes de carácter cultural, no tan técnicos, que se han de considerar:

• Evitar dentro de lo posible la utilización de iconos (como banderas u otros símbolos) para representar lenguas o países.

• Conocer las combinaciones de colores que puedan tener algún significado en alguna cultura donde se pretenda comercializar el producto.

Finalmente, hay requisitos legales (cómo garantías en bienes de consumo) que hay que adecuar a las legislaciones vigentes de los países destino.

Tipos de archivos en proyectos de localización

En un proyecto de localización son frecuentes distintos tipos de archivos. Es preciso conocer sus características principales y las herramientas necesarias para su gestión.

Código de programación

Es poco frecuente en proyectos de localización, pero es posible que se presente la situación de tener que traducir directamente un fichero de código de programación. Esto significa que el software bajo traducción no tiene tratamiento de internacionalización. Acostumbra a suceder con aplicaciones pequeñas para localizar a un pequeño número de lenguas.

Para traducir el código se necesitarán conocimientos mínimos del lenguaje de programación concreto y puede resultar una tarea peligrosa, para quienes no tengan conocimientos de informáticas, si se pretende realizar directamente sobre el archivo de código. Si se cambia de manera accidental algún fragmento del código, es posible que el programa deje de funcionar.

Algunas herramientas TAO pueden tratar directamente ficheros de código escrito en determinados lenguajes de programación. En caso de trabajar para traducir con este tipo de ficheros, se recomienda utilizar alguna herramienta de traducción asistida que disponga del filtro adecuado.

Ejecutables

Algunas herramientas de traducción asistida permiten extraer el texto de un fichero ejecutable (exe, com o DLL) y obtener posteriormente la versión traducida. Esta posibilidad se utiliza exclusivamente para traducir pequeños programas a un número limitado de lenguas.

Ficheros de recursos

Si una aplicación informática está correctamente diseñada, los textos que visualiza el usuario están almacenados en ficheros separados, conocidos como “ficheros de recursos”. Seguidamente se muestra el “fichero de recursos” de un cuadro de diálogo habitual en el sistema operativo Windows.
IDD_SELECT DIALOG DISCARDABLE 0, 0, 167, 106
STYLE DS_MODALFRAME|WS_POPUPWS_SYSMENU
CAPTION "Select an object"
FONT 8, "MS Sans Serif"
BEGIN
DEFPUSHBUTTON "OK",IDOK,108,8,50,14
PUSHBUTTON "Cancel",IDCANCEL,108,24,50,14
LISTBOX IDC_TOOLBAR_NAMES,8,8,92,88,LBS_SORT |
LBS_NOINTEGRALHEIGHT | WS_VSCROLL | WS_TABSTOP
PUSHBUTTON "&Help...",IDHELP,108,40,50,14
PUSHBUTTON "&Rename...",IDD_RENAME,108,64,50,14
PUSHBUTTON "&Delete",IDD_DELETE,108,80,50,14
END


El texto entre comillas es que hay que traducir. Se puede traducir directamente un fichero de recursos con un editor de textos, pero muchas,herramientas de traducción asistida ofrecen filtros para este tipo de archivos. Los mensajes de error también se almacenan en ficheros de recursos, como se indica en el siguiente ejemplo:

STRINGTABLE DISCARDABLE
BEGIN
IDS_WINEXEC_ERROR0 "The following error occurred:\n\nSystem was out of memory, executable file was corrupt, or relocations were invalid."
IDS_WINEXEC_ERROR2 "The following error occurred:\n\nFile was not found."
IDS_WINEXEC_ERROR3 "The following error occurred:\n\nPath was not found."
IDS_WINEXEC_ERROR5 "The following error occurred:\n\nAttempt was made to dynamically link to a task, or there was a sharing or network-protection error."
IDS_WINEXEC_ERROR6 "The following error occurred:\n\nLibrary required separate data segments for each task."
IDS_WINEXEC_ERROR8 "The following error occurred:\n\nThere was insufficient memory to start the application."
IDS_WINEXEC_ERROR10 "The following error occurred:\n\nWindows version was incorrect."
END


Ficheros de ayuda (help)

Los ficheros fuente de los textos de ayuda de Windows acostumbran a ser ficheros del tipo no estándar RTF. Los compiladores de los ficheros de ayuda de Windows los toman y los convierten en ficheros de ayuda.

Ficheros léeme (readme)

Estos archivos habitualmente dan información adicional de última hora no incluida en la documentación del programa, procedimiento de instalación o correcciones del manual. Son ficheros de texto y, en consecuencia no presentan problemas para traducirlos.

Capturas de pantalla e imágenes

Algunos elementos de los programas o de su documentación son imágenes. El proceso suele ser complicado y se requieren conocimientos sobre tratamiento de imágenes.

Si se trata de capturas de pantalla del programa que se está localizando, algo que se hace para evitar tener que procesar las imágenes, son nuevas capturas de pantalla una vez localizada la aplicación.

Ficheros de procesadores de texto o de sistemas de publicación electrónica (DTP)

La documentación se puede encontrar bajo diferentes formatos, ya sea correspondiente a de un procesador de textos o a sistemas DTP. Se ha de disponer de la misma aplicación con la que se ha creado la documentación, o bien de una herramienta TAO que posea el filtro adecuado para tratar los ficheros.

Ficheros especiales

Algunas empresas de este sector crean ficheros de texto con un formato especial y propio para facilitar el trabajo al traductor.

Aspectos importantes a considerar en un proyecto de localización

Expansión del texto

Se ha de considerar que las diversas lenguas presentan la característica de ocupar más o menos espacio (o caracteres) para un texto análogo. Por ejemplo, el texto en inglés y chino es, generalmente, muy compacto; y el texto producto de la traducción de estos idiomas será, por lo general, más extenso que el original, a veces, en una proporción alarmante.

Un caso real, la interfaz de usuario del servicio en la nube de almacenamiento de fotografías Flickr se tradujo a varios idiomas. Uno de los mensajes más comunes que aparecen cuando mira sus propias fotos indica cuántas veces se visitó esa página, por ejemplo, "137 visitas". La tabla que aparece a continuación muestra las longitudes comparativas de la palabra que Flickr utilizó para "visitas" en proporción* al original en inglés (views).

Idioma Traducción Proporción
Coreano 조회 0,8
Inglés views 1
Chino 次檢視 1,2
Portugués visualizações 2,6
Francés consultations 2,6
Alemán -mal angesehen 2,8
Italiano visualizzazioni 3


La expansión del 300% del inglés al italiano no es para nada sorprendente en el caso de una pequeña secuencia. Los siguientes datos corresponden a proporciones promedio de expansión esperada en el caso de textos traducidos del inglés a lenguas europeas, según lo publicado por IBM en Guidelines to design global solutions.

Caracteres
en el original en inglés
Expansión promedio
Hasta 10 200 - 300%
11 - 20 180 - 200%
21 - 30 160 - 180%
31 - 50 140 - 160%
51 - 70 130 - 140%
Más de 70 150%


Suele suceder que cuanto más corto es el texto en inglés, es más probable que se tenga que ajustar en un espacio pequeño. Además la expansión textual no es exclusivamente un problema de las interfaces de usuario con el texto original en inglés y chino. Si el texto original está en español, la frase "Idioma de la interfaz" será más corta en inglés (Interface language), pero mucho más larga en malayo (Bahasar pegantar untuk penelusuran). Asimismo, las traducciones más pequeñas pueden ser tan problemáticas como las más grandes si dejan mucho espacio en blanco en la página.

Los programas con un buen diseño de internacionalización ya prevén esta posibilidad y no presentan restricciones destacadas al traducir elementos gráficos (como por ejemplo: botones, elementos del menú, etc.) Algunos programas de traducción asistida o de localización permiten visualizar el elemento gráfico (pantalla, cuadro de diálogo, etc.) de forma que se puede verificar si la traducción propuesta encaja en el elemento.

Factores que pueden complicar el proceso

Sustantivos compuestos:

Varias lenguas, como el alemán, el finlandés y el holandés, crean una sola "palabra" larga para reemplazar una secuencia de palabras más pequeñas en otros idiomas. Por ejemplo, la frase en inglés Input processing features puede convertirse en Eingabeverarbeitungsfunktionen en alemán. El texto en inglés se puede ajustar en dos líneas cuando el ancho disponible es restringido, en una serie de pestañas o botones, o bien, en columnas angostas, el alemán no se puede ajustar automáticamente, lo cual es un problema para su diagramación.

Ancho de caracteres:

El chino, el japonés y el coreano, entre otros, son sistemas de escritura que, por lo general, tienen caracteres más complicados que los latinos. Esto puede implicar que aunque la cantidad de caracteres de la traducción queda igual o, si es menor, el espacio horizontal necesario podría ser mucho mayor. Por ejemplo, desktop en inglés se convierte en デスクトップ en japonés. El japonés tiene un carácter menos, pero generalmente ocupa mucho más espacio horizontal.

Altura de caracteres y líneas:

Es habitual que un texto escrito en una lengua que no sea latina tenga caracteres más altos. No sólo eso, estos sistemas de escritura a menudo requieren más espacio vertical entre líneas. Por ejemplo, el siguiente gráfico muestra el mismo texto en inglés y tailandés. El espacio vertical ocupado por el tailandés es mucho mayor. En parte, esto se debe a la complejidad de los caracteres (lo que conduce a glifos más altos y, por lo tanto, a líneas de mayor altura), pero también es habitual tener un espacio mayor de interlineado en tailandés. Existe una gran cantidad de sistemas de escritura que requieren una altura mucho mayor que el texto en latín, incluidos el árabe (especialmente en fuentes Nastaliq), chino, hindi, japonés, coreano, tibetano, etc.

tailandés

Accesos directos

Cuando se localiza un programa algunos segmentos incluyen el carácter &. Por ejemplo: Fi&nd what. Esto indica que la n de Find se visualizará subrayada y que se podrá acceder directamente a aquella función pulsando la combinación de teclas Alt+n. Por lo que es imprescindible seleccionar adecuadamente el lugar a situar el carácter & en la traducción, ya que no puede haber un mismo carácter marcado de esta manera dentro de una misma pantalla, menú o cuadro de diálogo. Éste es otro motivo de la importancia de poder visualizar el contexto, es decir, el elemento gráfico del programa bajo traducción. Esta selección no es posible si no se puede ver el contexto, ya que no hay manera de saber dónde empieza un elemento gráfico y dónde termina.

Coherencia en la denominación de los elementos

En un proyecto de traducción hay que tener mucho cuidado en denominar siempre los mismos conceptos con la misma terminología (coherencia terminológica). En un proyecto de localización esto es de gran importancia. Los elementos de los menús, las opciones, las funciones, etc. han de presentar siempre el mismo nombre, tanto en los elementos gráficos de la aplicación como en la ayuda, los manuales, etc.

¿Por dónde empezar a traducir?

En los proyectos de localización siempre se plantea esta interrogante. ¿Por qué parte es mejor empezar a traducir? ¿Por la aplicación informática? ¿Por los manuales? ¿Por la ayuda? No hay una respuesta única, cada proyecto presentará sus particularidades que harán que sea más conveniente empezar por una parte o por otra.

La idea básica para tomar una decisión es que hay que comenzar por lo que permita fijar más fácilmente los nombres de los menús, las opciones, etc. Si se traduce una aplicación que utiliza nombres de menús muy habituales, sin funciones muy específicas o bien se dispone de un buen glosario que recoja los nombres de los elementos, se podrá empezar por cualquier parte, habitualmente por la aplicación, para después traducir la ayuda y la documentación.

En cambio, si se trata de una aplicación con funciones demasiado específicas y desconocidas y que no dispone de un buen glosario, será preferible empezar por algún apartado de la documentación o de la ayuda que describa qué hace cada función, ya que de esta manera será más fácil poder dar el equivalente de traducción adecuado.

Algunos recursos interesantes

Se describen algunos recursos interesantes para poder afrontar un proyecto de localización.

Glosarios y diccionarios de terminología informática

Los diccionarios en papel tienen un gran inconveniente, pues a causa de los rápidos avances tecnológicos, se quedan obsoletos en poco tiempo. Por este motivo, es muy interesante utilizar glosarios terminológicos disponibles en internet.

Los propios glosarios, recopilados y organizados en bases de datos terminológicas, serán uno de los recursos más valiosos para los proyectos de localización. También es adecuado que el cliente disponga de glosarios propios.

Glosarios “estándar"

Algunos fabricantes ofrecen públicamente sus glosarios, entre ellos Microsoft y Apple

El objetivo de los fabricantes es unificar al máximo la terminología y las denominaciones de elementos como menús, opciones, etc.

El ordenador del traductor

Si el programa a localizar funciona sobre el mismo sistema operativo con el que trabaja el traductor, siempre es posible utilizar su equipo informático para saber cómo se denominan ciertos elementos.

Revistas y sitios en internet, de informática

La informática cambia con mucha frecuencia. A menudo aparecen funciones nuevas desconocidas para el traductor y difíciles de encontrar en glosarios y diccionarios. Un buen lugar de consulta pueden ser los sitios web especializados en informática o bien los sitios web de revistas de informática, disponibles en la lengua del proyecto de localización bajo consideración. Haciendo búsquedas en estos sitios es posible ver si la denominación que se piensa emplear se utiliza realmente o no.

Herramientas específicas para la localización de software

Aparte de las herramientas TAO que permiten trabajar con algunos formatos propios de los proyectos de localización, existen herramientas específicas para la localización de software.

Entre los programas específicos de localización destacan Alchemy Catalyst y Passolo.




Top