La Evolución de la Traducción Automática

En este artículo exploraremos la evolución de la traducción automática desde su origen, pasando por el presente, hasta el futuro.

El término «traducción automática» significa un proceso de traducción generado principalmente por un ordenador. Aunque hace que la comunicación sea más rápida y, en el caso de las lenguas más exóticas, incluso posible, la traducción automática sigue siendo muy criticada por hacer que el texto carezca de sentido cuando se prescinde de la intervención de un traductor humano. Por otro lado, existen varios tipos de traducción automática: algunos son más avanzados que otros. 

¿Los más avanzados ya prescinden de la intervención humana? ¿Y los menos avanzados todavía tienen sentido? ¿Es Google Translate uno de los más o menos avanzados? ¿Cómo ocurrió esta evolución? ¿Y cómo será el futuro?

El origen de la Traducción Automática

Warren Weaver, que trabajó como matemático durante la Segunda Guerra Mundial y más tarde fue pionero de la traducción automática, postuló por primera vez, en 1947, la posibilidad de utilizar ordenadores digitales para traducir documentos entre lenguas humanas naturales. Dos años más tarde, los colegas de la Fundación Rockefeller le animaron a desarrollar sus ideas. El resultado fue un memorándum escrito en julio de 1949 – Traducción. En esta influyente publicación, formuló objetivos y métodos pioneros que impulsaron la investigación de la traducción automática en los Estados Unidos e, indirectamente, en todo el mundo.

Esencialmente, hizo cuatro propuestas.

 

1 – Resolver la polisemia(1) de palabras al examinar el contexto inmediato

If one examines the words in a book, one at a time as through an opaque mask with a hole in it one word wide, then it is obviously impossible to determine, one at a time, the meaning of the words. (…) But, if one lengthens the slit in the opaque mask, until one can see not only the central word in question but also say N words on either side, then, if N is large enough one can unambiguously decide the meaning of the central word.

 

2 – Partiendo del supuesto de que el lenguaje es lógico 

A robot (or computer) constructed with regenerative loops of a certain formal character is capable of deducing any legitimate conclusion from a finite set of premises.

 

3 – Aplicar métodos criptográficos

Weaver ejemplificó el significado de esta propuesta con una experiencia de guerra: el desciframiento de un texto turco. Esto fue dado a un matemático que, sin saber cuál era el idioma original, logró «recrear» el texto de partida turco.

Sin embargo, el punto débil de la propuesta de Weaver se reveló rápidamente: la confusión entre las actividades de descifrado y de traducción, que ocurre precisamente cuando la misma persona hace ambas cosas, como suele ocurrir en el criptoanálisis(2).

 

4 – Aplicar universales lingüísticos(3)

De manera utópica, Weaver creía que existían características lógicas comunes a todos los idiomas y universales lingüísticos que podían aplicarse rápidamente a la traducción automática.

Pronto se dio cuenta de que la aplicación de este supuesto a la traducción automática implicaba «antes de cualquier mecanización, una enorme cantidad de trabajo con las estructuras lógicas de los idiomas».

Sin embargo, el memorándum impulsó la traducción automática y las primeras teorías sobre la pre y postedición de textos involucrados en la traducción automática.

El presente de la Traducción Automática

En el ensayo titulado A Statistical Approach to Machine Translation (Un enfoque estadístico de la traducción automática) (1990), Brown et al. presentan un enfoque estadístico de la traducción automática: cinco modelos estadísticos y algoritmos para estimar las formas de traducción de los modelos, teniendo en cuenta varios pares de oraciones bilingües. Los algoritmos asignarían entonces un factor de probabilidad a cada una de las alineaciones, palabra por palabra, para cualquier par de oraciones. 

Actualmente, son estos algoritmos predictivos los que Google Translate, por ejemplo, utiliza en la traducción estadística automática. Como se puede entender, se trata de un proceso en el que es necesario mejorar continuamente o, dicho de otro modo, en el que es necesario enseñar continuamente al ordenador a traducir mejor, proporcionándole textos traducidos. 

La traducción automática basada en estadísticas tiene la ventaja de ser rápida, pero tiene la desventaja de ser el resultado del análisis automático de muchas traducciones realizadas anteriormente, y no siempre es posible garantizar que sean fiables o suficientes.

El futuro de la Traducción Automática

Recientemente propuesto por varios investigadores, tales como Kalchbrenner y Blunsom(2013), la traducción automática neuronal, a diferencia de la traducción automática estadística convencional, tiene como objetivo construir una red neuronal única que pueda sincronizarse, maximizando el rendimiento de la traducción. 

Mucho más precisa que la traducción estadística, busca imitar el cerebro humano, en el que la información se envía a varias «capas» antes de ser procesada. 

La traducción neuronal es más rápida y cercana a la traducción humana, porque no es solo el resultado de operaciones estadísticas, sino también de la aplicación de reglas lingüísticas, que el sistema de traducción automática neuronal puede aprender.

Sin embargo, hay quienes se están alejando de esta coalición neuroestadística y van más allá. En Neural Machine Translation by Jointly Learning to Align and Translate (Traducción Neural Automática por medio del Aprendizaje Conjunto para Alinear y Traducir) (2014), Bahdanau et al. muestran que la propuesta de aprendizaje por ordenador, que combina alineación y traducción, puede mejorar significativamente el rendimiento de la traducción en comparación con el enfoque básico del modelo codificador-decodificador. También se muestra que la mejora es más evidente en las oraciones más largas, pero se puede observar en oraciones de cualquier longitud.

Esto se debe a que, en lugar de integrar una red neuronal en el sistema, el modelo de Bahdanau funciona por sí solo, generando una traducción directamente a partir de una oración original.

En Letrário, nuestros clientes ya se benefician de una traducción automática de última generación, ya sea simple, cuando quieren encargarse ellos mismos de la revisión y obtener una traducción mucho más barata, o combinada con un traductor humano, cuando el objetivo es obtener una traducción lista para usar. 

¿Busca una solución económica de la más alta calidad? No dude en ponerse en contacto con Letrário: descubra las ventajas de nuestros servicios de traducción automática.

(1) Multiplicidad de significados de una palabra o locución.

(2) Conjunto de técnicas y métodos para descifrar los caracteres de un sistema de escritura desconocido.

(3) Término utilizado en lingüística y especialmente en el campo de la gramática generativa para referirse a las propiedades comunes de las lenguas humanas.

Bibliografía
Bahdanau, D., Cho, K., Bengio, Y. (2014): «Neural machine translation by jointly learning to align and translate», en: Proceedings of ACL – IJCNLP 2015, vol. 1 (2015).
Brown, Peter F. et al. (1989) «A statistical approach to machine translation», en: Computational Linguistics archive, Volume 16, Issue 2, June 1990, pp. 79-85. MIT Press Cambridge, MA, USA.
Kalchbrenner N. y Blunsom P. (2013) «Recurrent continuous translation models», en: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, Seattle, October, Association for Computational Linguistics.
Weaver, W. (1949) «Translation» Locke, W.N. and Booth, A.D. (eds.) Machine translation of languages: fourteen essays (Cambridge, Massachusetts: Technology Press of the Massachusetts Institute of Technology, 1955), pp. 15-23.