
6月22日,Stability AI宣布推出SDXL 0.9,這是Stable Diffusion文本生成圖像模型中最先進的版本。
繼4月發(fā)布Stable Diffusion XL 測試版后,SDXL 0.9 的圖像和構(gòu)圖細節(jié)比之前版本有了顯著改進。
尤其是在參數(shù)上,這次的SDXL 0.9具有35億參數(shù)基礎(chǔ)模型和66億參數(shù)模型的集成管線。相比之下,Beta測試版僅用了單個31億參數(shù)的模型。
為了生成更逼真的圖像,以及更大的深度和更高的分辨率(1024x1024),SDXL 0.9使用了兩個CLIP模型,包括迄今為止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。
不僅如此,SDXL 0.9在消費級顯卡上就能運行。只需要Win10/11或Linux操作系統(tǒng)、16GB內(nèi)存,以及具有8GB以上顯存的英偉達RTX 20系顯卡即可。
官方表示,SDXL系列還會提供一系列超越基本文本prompt的功能,包括:
- 圖像對圖像的prompt:輸入一個圖像以獲得該圖像的變化;
- 內(nèi)畫:重建圖像的缺失部分;
- 外畫:構(gòu)建一個現(xiàn)有圖像的無縫擴展。
SDXL團隊不久將發(fā)布一個研究博客,更詳細地介紹這個模型的規(guī)格和測試。
該模型今天可以通過ClipDrop訪問,API即將推出。據(jù)Stability AI公布,將于 7 月中旬公開發(fā)布v1.0版本。
以下是官方示例:



?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

