Wissenschaftler des MIT haben eine Technik namens “Distribution Matching Distillation” (DMD) entwickelt, die gängige KI-Bildgeneratoren beschleunigt, indem sie einen 100-stufigen Prozess auf einen Schritt zusammenfasst. Diese Methode führt zu kleineren und schnelleren KI-Modellen bei gleichbleibender Bildqualität. Der neue Ansatz reduziert die Berechnungszeit um das 30-fache und erhält oder übertrifft die Qualität der generierten visuellen Inhalte. Diffusionsmodelle wie DALL-E 3 und Stable Diffusion werden neuen KI-Modellen mit DMD beigebracht. Diese Modelle erzeugen Bilder, indem sie Zufallsbilder mit Rauschen kodieren und das Rauschen dann in einem mehrstufigen Prozess beseitigen. Durch die Anwendung von DMD auf ein neues Modell konnten die Wissenschaftler die Bilderzeugungszeit von 2,59 Sekunden auf 90 Millisekunden reduzieren, was einer 28,8-fachen Beschleunigung entspricht. DMD besteht aus zwei Komponenten: “Regressionsverlust,” der die Bilder auf der Grundlage der Ähnlichkeit ordnet, und “Verteilungsabgleichsverlust,” der die Fremdartigkeit der erzeugten Bilder minimiert. Dieser Durchbruch reduziert die Rechenleistung drastisch und beschleunigt den Bilderzeugungsprozess, was für Branchen, die eine schnelle und effiziente Inhaltserstellung benötigen, von Vorteil ist.
