Alibaba Wan2.1-VACE: Herramienta de vídeo de IA de código abierto para todos

Create an illustration in a positive and light style, in 3:2 aspect ratio, that can be representative of the following situation. A groundbreaking open-source AI model has been developed by a tech giant for transforming video creation and editing. The AI model, known as VACE, is capable of generating videos from texts, images, or other video snippets. It boasts advanced editing capabilities and can animate still images, control character poses, and expand video dimensions while adding relevant content. Key technological components like the Video Condition Unit and a Context Adapter structure stand out in its design. This AI tool is envisioned to be useful for social media clips, marketing content, and educational videos, catering to both small businesses and individual creators.

Alibaba ha lanzado Wan2.1-VACE, un modelo de IA de código abierto destinado a transformar la creación y edición de vídeo. Posicionada como la primera solución de código abierto del sector para diversas tareas de vídeo, promete agilizar el proceso integrando múltiples herramientas en una sola plataforma. VACE puede generar vídeos a partir de texto, imágenes u otros fragmentos de vídeo y cuenta con funciones avanzadas de edición, como la modificación selectiva de áreas de vídeo sin afectar al fondo. El modelo permite a los usuarios animar imágenes fijas, controlar las poses de los personajes y ampliar las dimensiones del vídeo al tiempo que se añaden contenidos relevantes.

Los componentes tecnológicos clave incluyen la Video Condition Unit (VCU) para procesar entradas multimodales y una estructura Context Adapter para comprender mejor el tiempo y el espacio en los vídeos. Alibaba prevé que VACE sea útil para clips de redes sociales, contenidos de marketing y vídeos educativos. Al hacer que esta potente herramienta de IA sea de código abierto, Alibaba pretende democratizar el acceso, permitiendo a las pequeñas empresas y a los creadores individuales producir contenidos visuales de alta calidad de forma asequible. Tanto un modelo de 14 mil millones de parámetros como una versión de 1,3 mil millones de parámetros están disponibles de forma gratuita en plataformas como Hugging Face y GitHub.

Artículo completo

Deja una respuesta