Alibaba uviedla na trh model Wan2.1-VACE s otvoreným zdrojovým kódom, ktorého cieľom je transformovať tvorbu a úpravu videa. Je umiestnený ako prvé open-source riešenie v odvetví pre rôzne úlohy videa a sľubuje zefektívnenie procesu integráciou viacerých nástrojov do jednej platformy. VACE dokáže vytvárať videá z textu, obrázkov alebo iných úryvkov videa a ponúka pokročilé možnosti úprav, napríklad selektívnu úpravu oblastí videa bez ovplyvnenia pozadia. Model umožňuje používateľom animovať statické obrázky, ovládať pózy postáv a rozširovať rozmery videa a zároveň pridávať príslušný obsah.
Kľúčové technologické komponenty zahŕňajú jednotku VCU (Video Condition Unit) na spracovanie multimodálnych vstupov a štruktúru Context Adapter na lepšie pochopenie času a priestoru vo videách. Alibaba predpokladá, že VACE bude užitočný pre klipy sociálnych médií, marketingový obsah a vzdelávacie videá. Sprístupnením tohto výkonného nástroja AI s otvoreným zdrojovým kódom chce spoločnosť Alibaba demokratizovať prístup a umožniť menším podnikom a individuálnym tvorcom cenovo dostupnú produkciu vysokokvalitného vizuálneho obsahu. Model so 14 miliardami parametrov aj verzia s 1,3 miliardami parametrov sú k dispozícii zadarmo na platformách ako Hugging Face a GitHub.
