Investigadores del MIT, la Universidad de Tsinghua y la empresa canadiense de inteligencia artificial MyShell han desarrollado una solución de clonación de voz de código abierto llamada OpenVoice. A diferencia de otras plataformas, OpenVoice ofrece controles granulares y clonación de voz casi instantánea. Los usuarios pueden clonar voces con precisión, controlando el tono, la emoción, el acento, el ritmo, las pausas y la entonación mediante un pequeño clip de audio. Los desarrolladores han facilitado un documento de investigación previamente revisado y enlaces para acceder a OpenVoice y probarlo. El objetivo de MyShell es apoyar a la comunidad investigadora de código abierto proporcionándole subvenciones, conjuntos de datos y potencia de cálculo. La empresa cree que la voz es una modalidad crucial para la Inteligencia Artificial General (AGI) y decidió centrarse en la clonación de voz de código abierto. OpenVoice comprende un modelo de conversión de texto en voz y un convertidor de tonos, entrenados con muestras de audio de varios hablantes. MyShell, una plataforma descentralizada, ofrece OpenVoice junto con otros personajes, bots y funciones de IA, cobrando una suscripción mensual y por datos de entrenamiento de IA.
