Investigación y Desarrollo

VALL-E es la nueva IA de Microsoft que puede imitar cualquier voz

La inteligencia artificial está avanzando a pasos agigantados. Ya vimos el desarrollo avanzado de empresas como OpenAI con ChatGPT, y en el cual Microsoft está inmerso, ya que la empresa de Redmond a hado a conocer que está desarrollando el software VALL-E, que es capaz de imitar cualquier voz con un grado de precisión abismal.

La idea de Microsoft es que este desarrollo se pueda utilizar en la creación de aplicaciones de texto a voz personalizadas o de alta calidad, aunque aquí entra el riesgo de los deepfake. Sin embargo, para evitar la información falsa en video y audio la compañía ha decidido no hacer abierto el código de su nuevo software para que no caiga en las manos equivocadas.

VALL-E es capaz de sintetizar el habla de cualquier persona, por lo que esto podría acarrear riesgos potenciales de mal uso del software, como la creación de identificadores de voz o grabaciones falsas. Este programa se ha definido como un códec neuronal para reproducir un modelo de lenguaje, se basa en la inteligencia artificial Encodec de Meta, que es capaz de generar voz humana a partir de texto.

Para desarrollar VALL-E se utilizaron grabaciones sonoras en inglés realizadas por más de 7000 personas con una duración total de 60 000 horas. Como en todo desarrollo prematuro, algunas de las voces imitadas por el software suenan como si hubieran sido dichas por una máquina, pero otras son sorprendentemente realistas.

Microsoft mejorará sus servicios con ayuda de la inteligencia artificial, pero echará mano de los modelos GPT desarrollados por OpenAI, donde ya invirtió algunos millones de dólares hace unos años.

Artículos relacionados

Back to top button