2 March 2021
Investigadores portugueses e da universidade norte americana de Carnegie Mellon terminam amanhã um sistema que traduz automaticamente fala para fala, tentando manter as características da voz da original.

Portugueses criam sistema que traduz fala para fala

O projecto chama-se ‘PT STAR’ e integra um reconhecedor de fala, um motor de tradução e um sintetizador.
“Na base da tradução de fala para fala estão módulos muito complexos de conversão da fala para texto (reconhecedores), de texto numa língua para texto noutra língua (tradutores) e de texto para fala (sintetizadores), pelo que a nível científico temos abordado problemas fascinantes”, afirma Luísa Coheur ao Ciência Hoje.

De acordo com a investigadora do INESC-ID, uma das principais neste projecto que iniciou em Maio de 2009, os desafios, no entanto, não se restringem a estas áreas: “Temos doutoramentos a decorrer que focam a transformação da entoação de uma língua para outra, a extracção de pares de frases a partir de textos paralelos, o processamento de disfluências em fala espontânea, a combinação de sistemas de tradução simultânea para várias línguas, etc.”, exemplifica.

Em termos sociais, continua, o projecto é “igualmente relevante” pois “faz-nos caminhar em direcção à eliminação das barreiras da língua”.

O funcionamento do protótipo está patente na página do grupo L2F do INESC-ID. O trabalho dos investigadores portugueses no âmbito deste projecto permitiu-lhes integrar o consórcio ‘U-STAR’ (Universal Speech Translation Advanced Research Consortium), no qual são o parceiro que lida com o Português.

Apesar do ‘PT-STAR’ estar agora a terminar,  “muito há ainda a fazer” em qualquer das principais áreas de investigação e o trabalho desta equipa que combina investigadores do INESC-ID e do LTI (Carnegie Mellon University), da Universidade da Beira Interior e da Fundação da Universidade de Lisboanão vai parar por aqui.

“Pessoalmente, vou continuar a trabalhar com uma das minhas alunas de doutoramento na tradução de colocações e na proposta de uma taxonomia que captura os diferentes tipos de erros de tradução cometidos quer por máquinas quer por humanos. Adicionalmente gostaria de continuar a explorar tarefas de extracção de informação com vista ao enriquecimento de léxicos bilingues. Esta área, de facto, não se esgota com o final do ‘PT-STAR’. Teremos que apostar num ‘PT-STAR 2’”, adianta Luísa Coheur.

 

FONTE: Ciência Hoje

Também poderá gostar

Sem comentários