A Evolução da Tradução Automática

Neste artigo iremos explorar a evolução da tradução automática partindo da sua origem, passando pelo presente e terminando no futuro.

O termo «tradução automática» designa um processo de tradução gerado principalmente por um computador. Apesar de tornar a comunicação mais rápida e, no caso de línguas mais exóticas, até possível, a tradução automática é ainda fortemente criticada por retirar sentido ao texto, quando é dispensada a intervenção de um tradutor humano. Por outro lado, ouve-se falar de vários tipos de tradução automática: umas mais avançadas do que outras. 

As mais avançadas já dispensam a intervenção humana? E as menos avançadas ainda fazem sentido? O Google Translator é das mais ou menos avançadas? Como aconteceu esta evolução? E como será o futuro?

A origem da tradução automática

Warren Weaver que trabalhou como matemático durante a Segunda Guerra Mundial e foi, posteriormente, pioneiro da tradução automática, postulou pela primeira vez, em 1947, a possibilidade de usar computadores digitais para traduzir documentos entre línguas humanas naturais. Dois anos depois, os colegas da Fundação Rockefeller incentivaram-no a desenvolver as suas ideias. O resultado foi um memorando escrito em julho de 1949 – Translation. Nesta influente publicação, formulou objetivos e métodos pioneiros que impulsionaram a investigação da tradução automática nos Estados Unidos e, indiretamente, no mundo inteiro.

Essencialmente, apresentou quatro propostas.


  1. Resolver a polissemia(1) das palavras examinando o contexto imediato

If one examines the words in a book, one at a time as through an opaque mask with a hole in it one word wide, then it is obviously impossible to determine, one at a time, the meaning of the words. (…) But, if one lengthens the slit in the opaque mask, until one can see not only the central word in question but also say N words on either side, then, if N is large enough one can unambiguously decide the meaning of the central word.


  1. Partir do pressuposto de que a linguagem é lógica 

A robot (or computer) constructed with regenerative loops of a certain formal character is capable of deducing any legitimate conclusion from a finite set of premises.


  1. Aplicar métodos criptográficos

Weaver exemplificou o sentido desta proposta com uma experiência de guerra – a decifração de um texto turco. Este foi dado a um matemático que, sem saber qual era a língua original, conseguiu «recriar» o texto de partida turco.

No entanto, o ponto fraco da proposta de Weaver revelou-se rapidamente – a confusão entre as atividades de decifração e tradução, que ocorre precisamente quando a mesma pessoa faz as duas coisas, como acontece muitas vezes na criptoanálise(2).


  1. Aplicar universais linguísticos(3)

Utopicamente, Weaver acreditou haver características lógicas comuns a todas as línguas e universais linguísticos que poderiam ser rapidamente aplicados na tradução automática.

Depressa percebeu que aplicar este pressuposto à tradução automática envolvia «antes de qualquer mecanização, uma tremenda quantidade de trabalho com as estruturas lógicas das línguas».

Ainda assim, o memorando impulsionou a tradução automática e as primeiras teorias sobre pré e pós-edição dos textos envolvidos em tradução automática.

O presente da tradução automática

No ensaio intitulado A Statistical Approach to Machine Translation (1990), Brown et al. apresentam uma abordagem estatística à tradução automática – cinco modelos estatísticos, e algoritmos para estimar as formas de traduzir dos modelos, tendo em conta vários pares de frases bilingues. Os algoritmos atribuiriam então um fator de probabilidade a cada um dos alinhamentos, palavra a palavra, para qualquer par de frases. 

Atualmente, são estes algoritmos preditivos que o Google Tradutor, por exemplo, utiliza na tradução automática estatística. Como se compreende, este é um processo em que o contínuo aperfeiçoamento é necessário ou, dito de outro modo, em que é necessário ensinar continuamente o computador a traduzir melhor, fornecendo-lhe textos traduzidos. 

A tradução automática de base estatística tem a vantagem da rapidez, mas tem a desvantagem de resultar da análise automática de muitas traduções previamente feitas, não sendo sempre possível assegurar que estas são fidedignas ou suficientes.

O futuro da tradição automática

Recentemente proposta por vários investigadores, como Kalchbrenner e Blunsom (2013), a tradução automática neural, ao contrário da tradução automática estatística convencional, visa construir uma rede neural única que possa ser sincronizada, maximizando o desempenho da tradução. 

Muito mais precisa do que a tradução estatística, procura imitar o cérebro humano, no qual a informação é enviada para várias «camadas», antes de ser processada. 

 

A tradução neural é mais rápida e aproxima-se mais da tradução humana, pois não resulta só de operações estatísticas, mas também da aplicação de regras linguísticas, que o sistema de tradução automática neural consegue aprender.

Contudo, há quem se esteja a afastar desta coligação neuro-estatística e a ir mais longe. Em Neural Machine Translation by Jointly Learning to Align and Translate (2014), Bahdanau et al. mostra-se que a proposta de aprendizagem pelo computador, que combina o alinhamento e a tradução, consegue melhorar significativamente o desempenho da tradução, em comparação com a abordagem básica do modelo codificador-descodificador. Demonstra-se igualmente que a melhoria é mais evidente em frases mais longas, podendo, no entanto, ser observada em frases de qualquer comprimento.

Isto deve-se ao facto de que, em vez de integrar uma rede neural no sistema, o modelo de Bahdanau funciona por conta própria, gerando uma tradução diretamente a partir de uma frase original.

Na Letrário, os nossos clientes já beneficiam da tradução automática de ponta – quer simples, quando eles próprios pretendem encarregar-se da revisão e conseguir uma tradução muito mais barata –  quer aliada a um tradutor humano, quando o objetivo é obter uma tradução pronta a usar. 

Procura uma solução em conta e da mais alta qualidade? Não hesite em contactar a Letrário – descubra as vantagens dos nossos serviços de tradução automática.

 

(1)– Multiplicidade de sentidos de uma palavra ou locução.
(2)– Conjunto de técnicas e métodos para a decifração de caracteres de uma escrita de sistema desconhecido.
(3)-Termo usado em linguística e especialmente no âmbito da gramática generativa para referir as propriedades comuns das línguas humanas.
Bibliografia

Bahdanau, D., Cho, K., Bengio, Y. (2014). “Neural machine translation by jointly learning to align and translate. In: Proceedings of ACL – IJCNLP 2015, vol. 1 (2015).

Brown, Peter F. et al. (1989). “A statistical approach to machine translation. In: Computational Linguistics archive, Volume 16, Issue 2, June 1990, pp. 79-85. MIT Press Cambridge, MA, USA.

Kalchbrenner N. e Blunsom P. (2013). “Recurrent continuous translation models. In: Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, Seattle, October. Association for Computational Linguistics.

Weaver, W. (1949). “Translation”. Locke, W.N. e Booth, A.D. (eds.) Machine translation of languages: fourteen essays (Cambridge, Mass.: Technology Press of the Massachusetts Institute of Technology, 1955), pp. 15-23.