Meta Platforms, die Muttergesellschaft von Facebook, Instagram, WhatsApp und Oculus VR, hat ein Programm zum Klonen von Stimmen namens Audiobox veröffentlicht. Audiobox ist ein kostenloses Programm, das die Stimme einer Person nachbilden und mithilfe von Spracheingaben und Textaufforderungen benutzerdefinierte Audios erzeugen kann. Es basiert auf dem selbstüberwachten Modell Audiobox SSL, das selbstüberwachtes Lernen verwendet, um seine eigenen Beschriftungen für nicht beschriftete Daten zu erzeugen. Die Forscher stützten sich beim Training von Audiobox auf 160.000 Stunden Sprache, 20.000 Stunden Musik und 6.000 Stunden Tonbeispiele. Meta hat auch interaktive Demos veröffentlicht, um die Fähigkeiten von Audiobox zu demonstrieren, die es den Benutzern ermöglichen, ihre eigene Stimme zu klonen oder neue Stimmen aus Textbeschreibungen zu erzeugen. Die Demos sind jedoch auf die kommerzielle Nutzung beschränkt und stehen den Einwohnern von Illinois und Texas aufgrund der staatlichen Gesetze nicht zur Verfügung. Meta plant, Forscher und akademische Einrichtungen einzuladen, in Zukunft Sicherheits- und Verantwortungsforschung mit Audiobox zu betreiben. Es wird erwartet, dass bald kommerzielle Versionen der Technologie zum Klonen von Stimmen auf den Markt kommen werden.
