Meta apresenta o SeamlessM4T, inovador modelo de tradução de fala para texto que busca abranger quase 100 idiomas

A nova plataforma da Meta é parte dos esforços da empresa para criar um tradutor universal. O SeamlessM4T, que significa “Tradução de Máquina Massivamente Multilíngue e Multimodal”, oferece a capacidade de traduzir fala para texto e texto para texto em diversos idiomas, além de reconhecer 100 idiomas de entrada para ações de fala para fala e texto para fala, convertendo-os em 35 idiomas de saída.

A Meta lança essa iniciativa sob uma licença Creative Commons, permitindo iterações por parte dos pesquisadores. Além disso, a Meta também disponibilizou os metadados para o conjunto de dados SeamlessAlign, complementando o lançamento do SeamlessM4T.

A empresa visa construir um tradutor de linguagem universal e busca superar os desafios que os sistemas atuais enfrentam ao cobrir apenas uma fração dos idiomas do mundo. A plataforma também apresenta a promessa de reconhecer trocas de código e movimentos entre idiomas em uma frase, algo que muitos softwares de reconhecimento de voz têm dificuldade de detectar.

Para criar o SeamlessM4T, a Meta redesenhou seu kit de ferramentas Fairseq para lidar com informações mais abrangentes e construir modelos mais leves. A plataforma também inclui medidas para filtrar palavras tóxicas, detectar viés de gênero nas traduções e melhorar a qualidade das traduções.

A Meta continua a disponibilizar seus modelos de IA de forma aberta para pesquisadores e desenvolvedores, como parte de seus esforços para impulsionar a inovação na área.

Leia mais:

Laura Bonci

Deixe seu Comentário