MobileDiffusion是什么?
MobileDiffusion是谷歌推出的專為移動設(shè)備設(shè)計的輕量級潛在擴散模型,可以在0.5秒內(nèi)根據(jù)文本提示生成512x512高質(zhì)量圖像。相較于其他文本到圖像模型,它更小巧(僅520M參數(shù)),非常適合在手機上部署使用。
MobileDiffusion采用 DiffusionGAN 在推理過程中實現(xiàn)一步采樣,它微調(diào)了預(yù)訓(xùn)練的擴散模型,同時利用 GAN 對去噪步驟進行建模,可以為各種領(lǐng)域生成高質(zhì)量的多樣化圖像。
論文地址:https://arxiv.org/abs/2311.16567
官方博客:https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
MobileDiffusion的演示demo:


下面是使用MobileDiffusion生成的效果:

?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

