Alibaba hat mit Wan2.1-VACE ein Open-Source-KI-Modell vorgestellt, das die Erstellung und Bearbeitung von Videos revolutionieren soll. Es ist die erste Open-Source-Lösung in der Branche für verschiedene Videoaufgaben und verspricht, den Prozess durch die Integration mehrerer Tools in einer Plattform zu rationalisieren. VACE kann Videos aus Text, Bildern oder anderen Videoschnipseln generieren und verfügt über fortschrittliche Bearbeitungsfunktionen, wie z. B. die selektive Änderung von Videobereichen ohne Beeinträchtigung des Hintergrunds. Das Modell ermöglicht es den Nutzern, Standbilder zu animieren, die Posen der Figuren zu steuern und die Videodimensionen zu erweitern, während sie gleichzeitig relevante Inhalte hinzufügen.
Zu den wichtigsten technologischen Komponenten gehören die Video Condition Unit (VCU) zur Verarbeitung multimodaler Eingaben und eine Context Adapter-Struktur zum besseren Verständnis von Zeit und Raum in Videos. Alibaba stellt sich vor, dass VACE für Social-Media-Clips, Marketing-Inhalte und Lehrvideos nützlich sein wird. Indem Alibaba dieses leistungsstarke KI-Tool als Open Source zur Verfügung stellt, soll der Zugang demokratisiert werden, damit auch kleinere Unternehmen und Einzelpersonen zu erschwinglichen Preisen hochwertige visuelle Inhalte produzieren können. Sowohl ein Modell mit 14 Milliarden Parametern als auch eine Version mit 1,3 Milliarden Parametern sind auf Plattformen wie Hugging Face und GitHub kostenlos verfügbar.
