Stability AI ha publicado un primer avance de su Stable Diffusion 3.0, un modelo generativo de IA de texto a imagen de nueva generación. La empresa ha estado mejorando constantemente sus modelos de imagen durante el último año, y el nuevo modelo tiene como objetivo proporcionar una mejor calidad de imagen y rendimiento. También se centra en mejorar la tipografía, un área en la que los modelos anteriores han tenido problemas. Stable Diffusion 3.0 se basa en una nueva arquitectura denominada transformadores de difusión, que permiten una nueva era de generación de imágenes. El modelo se está desarrollando en múltiples tamaños, que van de 800M a 8B parámetros. Stability AI también ha estado experimentando con otros enfoques, como la arquitectura Würstchen en Stable Cascade. La tipografía mejorada en Stable Diffusion 3.0 se consigue mediante el uso de una arquitectura de transformadores y codificadores de texto adicionales. El modelo se demuestra inicialmente como una tecnología de texto a imagen, pero servirá de base para futuros modelos visuales, incluida la generación de vídeo e imágenes 3D.
