Alibaba ha lanzado Wan2.1-VACE, un modelo de IA de código abierto destinado a transformar la creación y edición de vídeo. Posicionada como la primera solución de código abierto del sector para diversas tareas de vídeo, promete agilizar el proceso integrando múltiples herramientas en una sola plataforma. VACE puede generar vídeos a partir de texto, imágenes u otros fragmentos de vídeo y cuenta con funciones avanzadas de edición, como la modificación selectiva de áreas de vídeo sin afectar al fondo. El modelo permite a los usuarios animar imágenes fijas, controlar las poses de los personajes y ampliar las dimensiones del vídeo al tiempo que se añaden contenidos relevantes.
Los componentes tecnológicos clave incluyen la Video Condition Unit (VCU) para procesar entradas multimodales y una estructura Context Adapter para comprender mejor el tiempo y el espacio en los vídeos. Alibaba prevé que VACE sea útil para clips de redes sociales, contenidos de marketing y vídeos educativos. Al hacer que esta potente herramienta de IA sea de código abierto, Alibaba pretende democratizar el acceso, permitiendo a las pequeñas empresas y a los creadores individuales producir contenidos visuales de alta calidad de forma asequible. Tanto un modelo de 14 mil millones de parámetros como una versión de 1,3 mil millones de parámetros están disponibles de forma gratuita en plataformas como Hugging Face y GitHub.
