Stable Diffusion 3是什么?
Stable Diffusion 3 是由Stability AI推出的最新文本到圖像模型,模型參數(shù)范圍從 800M 到 8B,可適配不同類型設(shè)備,并稱是迄今為止“最強(qiáng)大的文本到圖像模型”。
Stable Diffusion 3 采用了類似Sora的新架構(gòu)Diffusion Transformer ,結(jié)合了新技術(shù) Flow Matching ,大大提高了多主題提示、圖像質(zhì)量、拼寫能力的性能。
這個(gè)模型在多主題提示、圖像質(zhì)量和拼寫能力方面有了顯著的性能提升,特別擅長(zhǎng)處理包含多個(gè)主題的復(fù)雜提示,能夠生成更加精細(xì)和逼真的圖像。
非常大的變化是,提示詞支持使用自然語(yǔ)言了。例如下面的示例:
Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy.
提示詞:史詩(shī)般的動(dòng)漫藝術(shù)作品,一個(gè)巫師在夜晚的山頂上向黑暗的天空施放了一個(gè)宇宙咒語(yǔ),上面寫著“Stable Diffusion 3”,由五顏六色的能量組成。

Stable Diffusion 3生成圖片示例
以下是官方發(fā)布的生成示例,確實(shí)在多主題提示、圖像質(zhì)量上有很大的提升。



Stable Diffusion 3適用人群
Stable Diffusion 3適用于需要快速、高效地從文本生成高質(zhì)量圖像的個(gè)人、開發(fā)者和企業(yè)。無(wú)論是藝術(shù)家尋求靈感、開發(fā)者構(gòu)建應(yīng)用程序,還是企業(yè)需要生成獨(dú)特的視覺(jué)內(nèi)容,Stable Diffusion 3都提供了一個(gè)強(qiáng)大的工具。
如何使用Stable Diffusion 3?
AIHub 2024 年 04 月 18 日最新消息,Stable Diffusion 3 API 正式開放,開發(fā)者們可以接入使用了。
Stable Diffusion 3 API 通過(guò) Stability AI 開發(fā)者平臺(tái)提供服務(wù)。
AIHub 2024 年 6 月 12 日最新消息,Stable Diffusion 3 Medium模型正式開源,下載地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium
了解更多信息,請(qǐng)前往官方博客:https://stability.ai/news/stable-diffusion-3
