Stability AI telah merilis pratinjau awal Stable Diffusion 3.0, model AI generatif teks-ke-gambar generasi berikutnya. Perusahaan ini telah secara konsisten meningkatkan model gambarnya selama setahun terakhir, dan model baru ini bertujuan untuk memberikan kualitas dan performa gambar yang lebih baik. Model ini juga berfokus pada peningkatan tipografi, area di mana model sebelumnya mengalami kesulitan. Stable Diffusion 3.0 didasarkan pada arsitektur baru yang disebut diffusion transformer, yang memungkinkan era baru pembuatan gambar. Model ini sedang dikembangkan dalam berbagai ukuran, mulai dari parameter 800M hingga 8B. Stability AI juga telah bereksperimen dengan pendekatan lain, seperti arsitektur Würstchen di Stable Cascade. Tipografi yang lebih baik di Stable Diffusion 3.0 dicapai melalui penggunaan arsitektur transformator dan penyandi teks tambahan. Model ini pada awalnya didemonstrasikan sebagai teknologi teks-ke-gambar, tetapi akan berfungsi sebagai fondasi untuk model visual di masa depan, termasuk pembuatan video dan gambar 3D.
