MobileDiffusion是什么?
MobileDiffusion是谷歌推出的專為移動(dòng)設(shè)備設(shè)計(jì)的輕量級潛在擴(kuò)散模型,可以在0.5秒內(nèi)根據(jù)文本提示生成512x512高質(zhì)量圖像。相較于其他文本到圖像模型,它更小巧(僅520M參數(shù)),非常適合在手機(jī)上部署使用。
MobileDiffusion采用 DiffusionGAN 在推理過程中實(shí)現(xiàn)一步采樣,它微調(diào)了預(yù)訓(xùn)練的擴(kuò)散模型,同時(shí)利用 GAN 對去噪步驟進(jìn)行建模,可以為各種領(lǐng)域生成高質(zhì)量的多樣化圖像。
論文地址:https://arxiv.org/abs/2311.16567
官方博客:https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
MobileDiffusion的演示demo:


下面是使用MobileDiffusion生成的效果:

