Alibaba telah meluncurkan Wan2.1-VACE, sebuah model AI sumber terbuka yang bertujuan untuk mengubah pembuatan dan pengeditan video. Diposisikan sebagai solusi open-source pertama di industri untuk berbagai tugas video, solusi ini menjanjikan untuk menyederhanakan proses dengan mengintegrasikan beberapa alat ke dalam satu platform. VACE dapat menghasilkan video dari teks, gambar, atau potongan video lainnya dan memiliki kemampuan pengeditan yang canggih, seperti modifikasi area video secara selektif tanpa mempengaruhi latar belakang. Model ini memungkinkan pengguna untuk menganimasikan gambar diam, mengontrol pose karakter, dan memperluas dimensi video sambil menambahkan konten yang relevan.
Komponen teknologi utama termasuk Video Condition Unit (VCU) untuk memproses input multimodal dan struktur Context Adapter untuk pemahaman yang lebih baik tentang waktu dan ruang dalam video. Alibaba membayangkan VACE berguna untuk klip media sosial, konten pemasaran, dan video pendidikan. Dengan membuat alat AI yang kuat ini menjadi sumber terbuka, Alibaba bertujuan untuk mendemokratisasi akses, memungkinkan bisnis yang lebih kecil dan kreator individu untuk menghasilkan konten visual berkualitas tinggi dengan harga terjangkau. Baik model dengan 14 miliar parameter maupun versi 1,3 miliar parameter tersedia secara gratis di platform seperti Hugging Face dan GitHub.
