Portugueses criam sistema que traduz fala para fala - Observatório da Língua Portuguesa

O projecto chama-se ‘PT STAR’ e integra um reconhecedor de fala, um motor de tradução e um sintetizador.
“Na base da tradução de fala para fala estão módulos muito complexos de conversão da fala para texto (reconhecedores), de texto numa língua para texto noutra língua (tradutores) e de texto para fala (sintetizadores), pelo que a nível científico temos abordado problemas fascinantes”, afirma Luísa Coheur ao Ciência Hoje.

De acordo com a investigadora do INESC-ID, uma das principais neste projecto que iniciou em Maio de 2009, os desafios, no entanto, não se restringem a estas áreas: “Temos doutoramentos a decorrer que focam a transformação da entoação de uma língua para outra, a extracção de pares de frases a partir de textos paralelos, o processamento de disfluências em fala espontânea, a combinação de sistemas de tradução simultânea para várias línguas, etc.”, exemplifica.

Em termos sociais, continua, o projecto é “igualmente relevante” pois “faz-nos caminhar em direcção à eliminação das barreiras da língua”.

O funcionamento do protótipo está patente na página do grupo L2F do INESC-ID. O trabalho dos investigadores portugueses no âmbito deste projecto permitiu-lhes integrar o consórcio ‘U-STAR’ (Universal Speech Translation Advanced Research Consortium), no qual são o parceiro que lida com o Português.

Apesar do ‘PT-STAR’ estar agora a terminar, “muito há ainda a fazer” em qualquer das principais áreas de investigação e o trabalho desta equipa que combina investigadores do INESC-ID e do LTI (Carnegie Mellon University), da Universidade da Beira Interior e da Fundação da Universidade de Lisboanão vai parar por aqui.

“Pessoalmente, vou continuar a trabalhar com uma das minhas alunas de doutoramento na tradução de colocações e na proposta de uma taxonomia que captura os diferentes tipos de erros de tradução cometidos quer por máquinas quer por humanos. Adicionalmente gostaria de continuar a explorar tarefas de extracção de informação com vista ao enriquecimento de léxicos bilingues. Esta área, de facto, não se esgota com o final do ‘PT-STAR’. Teremos que apostar num ‘PT-STAR 2’”, adianta Luísa Coheur.

FONTE: Ciência Hoje

TAGS: