Forscher des MIT, der Tsinghua-Universität und des kanadischen KI-Start-ups MyShell haben eine Open-Source-Lösung zum Klonen von Stimmen namens OpenVoice entwickelt. Im Gegensatz zu anderen Plattformen bietet OpenVoice granulare Kontrollen und nahezu sofortiges Klonen von Stimmen. Benutzer können Stimmen mit Präzision klonen, indem sie Ton, Emotion, Akzent, Rhythmus, Pausen und Intonation mit einem kleinen Audioclip kontrollieren. Die Entwickler haben ein vorab geprüftes Forschungspapier und Links zur Verfügung gestellt, um auf OpenVoice zuzugreifen und es auszuprobieren. MyShell zielt darauf ab, die Open-Source-Forschungsgemeinschaft durch die Bereitstellung von Zuschüssen, Datensätzen und Rechenleistung zu unterstützen. Das Unternehmen ist davon überzeugt, dass die Stimme eine entscheidende Modalität für die künstliche allgemeine Intelligenz (AGI) ist, und beschloss, sich auf das Open-Source-Stimmenklonen zu konzentrieren. OpenVoice besteht aus einem Text-zu-Sprache-Modell und einem Tonkonverter, die anhand von Hörproben verschiedener Sprecher trainiert wurden. MyShell, eine dezentralisierte Plattform, bietet OpenVoice zusammen mit anderen KI-Charakteren, Bots und Funktionen an und erhebt eine monatliche Gebühr für die KI-Trainingsdaten.
