MobileDiffusion是什么?
MobileDiffusion是谷歌推出的專為移動設備設計的輕量級潛在擴散模型,可以在0.5秒內根據文本提示生成512x512高質量圖像。相較于其他文本到圖像模型,它更小巧(僅520M參數),非常適合在手機上部署使用。
MobileDiffusion采用 DiffusionGAN 在推理過程中實現一步采樣,它微調了預訓練的擴散模型,同時利用 GAN 對去噪步驟進行建模,可以為各種領域生成高質量的多樣化圖像。
論文地址:https://arxiv.org/abs/2311.16567
官方博客:https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
MobileDiffusion的演示demo:


下面是使用MobileDiffusion生成的效果:

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。



