A startup de San Francisco, ElevenLabs, anunciou uma atualização significativa em sua tecnologia de clonagem de voz baseada em IA. O novo modelo Multilingual v2 da empresa agora pode imitar vozes falando fluentemente em 30 idiomas diferentes, um salto considerável dos oito idiomas originalmente suportados.
A ElevenLabs usou a Lukeman Literary, uma agência literária e editora independente, como exemplo para demonstrar a eficácia de sua tecnologia. “Antes, a equipe da Lukeman levava semanas para produzir um único audiolivro. Agora, o processo inteiro leva apenas algumas horas”, disse a ElevenLabs em um post oficial do blog.
A empresa oferece duas opções principais de clonagem de voz: uma ferramenta de texto para fala e um “VoiceLab” para clonar vozes específicas. Os usuários podem fazer upload de amostras de fala para criar um clone de voz personalizado, que a IA analisa para construir uma versão sintética. Essa voz clonada pode então ser manipulada para dizer qualquer coisa imaginável.
No entanto, a expansão das capacidades linguísticas da ElevenLabs vem com preocupações éticas. A tecnologia tem o potencial de ser mal utilizada para fraudes e campanhas de desinformação. A empresa enfrentou reações negativas no ano passado quando sua plataforma foi explorada para personificar e assediar figuras públicas.
Apesar dessas preocupações, a ElevenLabs afirma que implementou salvaguardas mais rigorosas e continua a avançar na clonagem de voz com IA. “Esperamos eventualmente cobrir ainda mais idiomas e vozes com a ajuda da IA e eliminar as barreiras linguísticas ao conteúdo”, disse o linguista Mati Staniszewski da ElevenLabs. A implementação ética continua sendo um desafio, mas o progresso na clonagem de voz com IA parece imparável.