Stability AI tarafından desteklenen bir araştırma grubu olan DeepFloyd, metni görüntülere entegre edebilen bir metinden görüntüye modeli olan DeepFloyd IF’yi tanıttı. Bir milyardan fazla görüntü ve metinden oluşan bir veri kümesi üzerinde eğitilen DeepFloyd IF, Deep Floyd’ yazan bir tişört giyen bir oyuncak ayı gibi bir istemden bir görüntü oluşturabilir; isteğe bağlı olarak bir dizi stilde. DeepFloyd IF, görüntüleri oluşturmak için modüler bir mimaride bir araya getirilmiş çok sayıda farklı işlem kullanır. Model özellikle karmaşık istemleri ve hatta istemlerde açıklanan uzamsal ilişkileri anlamada başarılıdır. Görüntülerde okunaklı ve doğru yazılmış metinler oluşturabilir ve hatta birden fazla dildeki istemleri anlayabilir. DeepFloyd IF’in logo tasarımı, web tasarımı, posterler, reklam panoları ve hatta memler de dahil olmak üzere yeni üretken sanat olanakları dalgasının kilidini açması bekleniyor. Bununla birlikte, model bazı difüzyon modelleri kadar estetik açıdan hoş görüntüler üretmiyor. Ayrıca, diğer dilleri kullanan topluluklardan ve kültürlerden gelen metinlerin ve görüntülerin yeterince hesaba katılmaması muhtemel olduğundan, modelde önyargı potansiyeli de vardır. DeepFloyd IF, diğer açık kaynaklı üretken modeller gibi, pornografik ünlü deepfakeleri ve grafik şiddet tasvirleri üretmek gibi zarar vermek için kullanılabilir.
