Clicky

El traductor de Google inventa su propio lenguaje artificial para traducir mejor

Categoría: Noticias de Internet
Visitas: 3174
Traductor

Google Translate es compatible actualmente con 103 idiomas

El traductor Google es cada vez más inteligente. La herramienta de traducción en línea comenzó recientemente a utilizar una red neuronal para traducir entre algunos de sus idiomas más populares - y el sistema es ahora tan inteligente que puede hacer esto para los pares de idiomas en los que no se ha entrenado de forma explícita. Para ello, parece haber creado su propio lenguaje artificial.

Los sistemas tradicionales de traducción automática rompen las oraciones en palabras y frases, y traducen cada una individualmente. En septiembre Google Translate dio a conocer un nuevo sistema que utiliza una red neuronal para trabajar en frases enteras a la vez, lo que le da más contexto para averiguar la mejor traducción. Este sistema está ahora funcionando en ocho de los pares de idiomas más comunes en los que trabaja Google Translate.

Aunque los sistemas neuronales de traducción automática se están haciendo rápidamente populares, pero la mayoría sólo funciona en un solo par de idiomas, por lo que se necesitan diferentes sistemas para traducir entre otros. Con un poco de bricolaje, sin embargo, Google ha ampliado su sistema de modo que pueda manejar múltiples pares de idiomas - y puede traducir entre dos lenguas cuando no ha sido directamente entrenado para hacerlo.

Por ejemplo, si a la red neuronal se le ha enseñado a traducir entre inglés y japonés, y entre inglés y coreano, también puede traducir entre japonés y coreano sin pasar primero a través del inglés. Esta capacidad puede permitir a Google escalar rápidamente el sistema para traducir entre un gran número de idiomas.

"Este es un gran avance", dice Kyunghyun Cho en la Universidad de Nueva York. Su equipo y otro grupo en el Instituto de Tecnología de Karlsruhe en Alemania han publicado de forma independiente estudios similares que trabajan con sistemas de traducción neuronales que pueden manejar múltiples combinaciones de idiomas.

Nuevo lenguaje común

Los investigadores de Google creen que su sistema consigue este avance mediante la búsqueda de un terreno común por el que frases con el mismo significado se representan de manera similar sin importar el idioma - y dicen que es un ejemplo de una "interlingua". En cierto sentido, eso significa que se ha creado un nuevo lenguaje común, aunque sea uno que es específico para la tarea de traducción y no es legible o utilizable para los seres humanos.

Cho dice que este enfoque, llamado traducción zero-shot, todavía no funciona tan bien como el método más sencillo de traducir a través de un lenguaje intermediario. Pero el campo está progresando rápidamente y los resultados de Google atraerán la atención de la comunidad científica y la industria.

"No tengo ninguna duda de que vamos a ser capaces de formar un único sistema de traducción automática neuronal que en el futuro cercano funcione en 100 idiomas más", dice Cho.

El traductor Google es compatible actualmente con 103 idiomas y traduce más de 140 mil millones de palabras cada día.

¿Se encontrarán los traductores humanos pronto sin trabajo? La tecnología de traducción neuronal puede hacer un buen trabajo para textos sencillos, dice Andrejs Vasiljevs, co-fundador de la firma de tecnología Tilde, que está desarrollando servicios de traducción neuronales entre el letón o estonio y en inglés. Sin embargo, un buen traductor humano entiende el significado del texto original, así como sus características estilísticas y léxicas, y puede utilizar ese conocimiento para dar una traducción más exacta.

"Para que coincida con esta capacidad humana, tenemos que encontrar una manera de enseñar a los ordenadores cierto conocimiento del mundo de base, así como el conocimiento sobre la zona específica de la traducción y cómo utilizar este conocimiento para interpretar el texto a traducir", dice Vasiljevs.