Hyper-SD是什么?
Hyper-SD 是一個(gè)由字節(jié)跳動(dòng)推出的新穎的擴(kuò)散模型蒸餾框架,它通過軌跡分段一致性蒸餾和人類反饋學(xué)習(xí),顯著提升了低步數(shù)下的圖像生成性能。該模型結(jié)合了軌跡保持和重構(gòu)策略,實(shí)現(xiàn)了快速且高質(zhì)量的圖像生成,同時(shí)支持多種風(fēng)格和可控生成,為生成式AI領(lǐng)域帶來新SOTA性能。
與現(xiàn)有的擴(kuò)散模型加速算法相比,該方法取得了卓越的加速效果。經(jīng)過大量實(shí)驗(yàn)和用戶評(píng)測的驗(yàn)證,Hyper-SD 在 SDXL 和 SD1.5 兩種架構(gòu)上都能在 1 到 8 步生成中實(shí)現(xiàn) SOTA 級(jí)別的圖像生成性能。

Hyper-SD的功能特性
- 軌跡分段一致性蒸餾:通過將擴(kuò)散模型的時(shí)間步長劃分為多個(gè)段落,并在每個(gè)段落內(nèi)保持一致性,Hyper-SD 能夠在減少去噪步數(shù)的同時(shí),保持圖像生成的高質(zhì)量。
- 人類反饋學(xué)習(xí)(RLHF):結(jié)合人類審美偏好和現(xiàn)有視覺感知模型的反饋,Hyper-SD 能夠生成更符合人類審美的圖像,提升生成效果。
- 一步生成強(qiáng)化:使用分?jǐn)?shù)蒸餾技術(shù),Hyper-SD 增強(qiáng)了模型在單步生成中的性能,這對(duì)于需要快速生成圖像的場景非常有用。
- 低步數(shù)推理:Hyper-SD 實(shí)現(xiàn)了在極少的步數(shù)內(nèi)進(jìn)行高效圖像生成,顯著減少了計(jì)算資源的消耗,同時(shí)保持了圖像質(zhì)量。
- 風(fēng)格兼容性:訓(xùn)練得到的加速模型能夠適應(yīng)不同風(fēng)格的圖像生成,增加了模型的通用性和適用性。
- 可控圖像生成:Hyper-SD 能夠與現(xiàn)有的 ControlNet 等控制網(wǎng)絡(luò)兼容,實(shí)現(xiàn)低步數(shù)下的高質(zhì)量可控圖像生成。
- SOTA性能:在 SDXL 和 SD1.5 兩種架構(gòu)上,Hyper-SD 都能實(shí)現(xiàn) SOTA 級(jí)別的圖像生成性能。
- 開源:Hyper-SD 的開源性質(zhì)促進(jìn)了生成式 AI 社區(qū)的發(fā)展,允許研究人員和開發(fā)者進(jìn)一步探索和改進(jìn)模型。
- 統(tǒng)一的低步數(shù)推理模型:Hyper-SD 實(shí)現(xiàn)了理想的全局一致性模型,無需針對(duì)每個(gè)特定的步數(shù)訓(xùn)練 UNet 或 LoRA,簡化了模型訓(xùn)練和應(yīng)用的復(fù)雜性。
這些功能特色使得 Hyper-SD 成為一個(gè)強(qiáng)大的工具,適用于需要快速、高質(zhì)量圖像生成的各種應(yīng)用,如內(nèi)容創(chuàng)作、虛擬試衣、游戲開發(fā)、圖像編輯等。
如何使用Hyper-SD?
- 項(xiàng)目主頁:https://hyper-sd.github.io/
- 論文鏈接:https://arxiv.org/abs/2404.13686
- Huggingface 鏈接:https://huggingface.co/ByteDance/Hyper-SD
- 單步生成 Demo 鏈接:https://huggingface.co/spaces/ByteDance/Hyper-SDXL-1Step-T2I
- 實(shí)時(shí)畫板 Demo 鏈接:https://huggingface.co/spaces/ByteDance/Hyper-SD15-Scribble
?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。



