MobileDiffusion, mobil cihazlarda hızlı metin-resim üretimi için yeni bir yaklaşımdır. Mobil cihazlar için özel olarak tasarlanmış, 520 milyon parametreden oluşan küçük bir model boyutuna sahip verimli bir gizli difüzyon modelidir. Mobil cihazlarda metinden görüntüye difüzyon modellerinin göreceli verimsizliği, yinelemeli denoising sürecinden ve ağ mimarisinin karmaşıklığından kaynaklanmaktadır. Önceki çalışmalar fonksiyon değerlendirme sayısını azaltmaya odaklanmıştır, ancak mimari verimlilik daha az dikkat çekmiştir. MobileDiffusion, model mimarisindeki her bir bileşeni inceleyerek ve UNet ile görüntü kod çözücüyü optimize ederek bu sorunu ele almaktadır. Ortaya daha fazla dönüştürücü dahil eder ve normal konvolüsyon katmanlarını hafif ayrılabilir konvolüsyon katmanları ile değiştirir. Görüntü kod çözücü de varyasyonel bir oto kodlayıcı kullanılarak optimize edilmiştir. MobileDiffusion, iOS ve Android premium cihazlarda saniyenin altında metinden görüntüye üretim gerçekleştirir. Tek adımlı örnekleme için eğitim sürecini önemli ölçüde kolaylaştıran bir DiffusionGAN hibriti kullanır. MobileDiffusion’ın performansı hem iOS hem de Android cihazlarda ölçülmüş ve verimli olduğu ve hızlı bir şekilde yüksek kaliteli görüntüler üretebildiği kanıtlanmıştır.
