A Nvidia, liderada por Jensen Huang, revelou um modelo de IA projetado para alterar vozes e criar novos sons, voltado para produtores de música, cinema e videogames.
Chamado de Fugatto, a tecnologia pode compor uma nova peça musical com base em um comando de texto, ou os usuários podem enviar seu próprio áudio e pedir ajustes, por exemplo:
- Agências de publicidade poderiam alterar os sotaques em uma campanha publicitária para diferentes lugares do mundo;
- Desenvolvedores de games poderiam ajustar os efeitos sonoros conforme os usuários jogam.
Para desenvolver o Fugatto, os pesquisadores da empresa reuniram um conjunto de dados com milhões de amostras de áudio. Contudo, a empresa está debatendo se deve ou não liberá-lo publicamente.
Segundo ela, “qualquer tecnologia generativa sempre carrega alguns riscos, porque as pessoas podem usá-la para gerar coisas que preferiríamos que não fizessem”.