Výskumníci spoločnosti Google vyvinuli systém umelej inteligencie s názvom VLOGGER, ktorý dokáže z jednej fotografie vytvoriť realistické videá hovoriacich, gestikulujúcich a pohybujúcich sa ľudí. Táto technológia využíva pokročilé modely strojového učenia na syntézu realistických záberov, čo vyvoláva obavy z deepfakes a dezinformácií. VLOGGER využíva na dosiahnutie tohto výsledku difúzne modely a bol vycvičený na veľkom súbore údajov s názvom MENTOR, ktorý obsahuje rôzne identity a videozáznamy. Umelá inteligencia má potenciálne využitie, napríklad pri dabovaní videí do iných jazykov, vytváraní fotorealistických avatarov pre virtuálnu realitu a vylepšovaní virtuálnych asistentov poháňaných umelou inteligenciou. Existujú však obavy z možného zneužitia, najmä pri vytváraní deepfakes. Hoci má VLOGGER obmedzenia, predstavuje významný krok vpred v oblasti médií generovaných umelou inteligenciou, pričom prekonáva iné najmodernejšie metódy v kvalite obrazu, zachovaní identity a časovej konzistencii. Tento pokrok v oblasti umelej inteligencie predstavuje výzvu pri rozlišovaní medzi skutočným a falošným obsahom, čo naznačuje budúcnosť, v ktorej môže byť ťažké rozoznať videá generované umelou inteligenciou od skutočných.
