欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當前位置:首頁>AI資訊>Stable Diffusion 3 研究論文發布(附論文地址)

Stable Diffusion 3 研究論文發布(附論文地址)

Stable Diffusion 3 研究論文發布(附論文地址)

AIHub 3月5日最新消息,Stability AI 發布了關于其最新研究成果 Stable Diffusion 3 的研究論文。這篇論文深入探討了 Stable Diffusion 3 的底層技術,這是一種文本到圖像生成系統,據稱在字體排版和提示遵循方面超越了現有的最先進系統,如 DALL·E 3、Midjourney v6 和 Ideogram v1。Stable Diffusion 3 采用了新的多模態擴散變換器(MMDiT)架構,該架構為圖像和語言表示使用不同的權重集,從而提高了文本理解和拼寫能力。

研究論文的主要要點包括:

  1. 性能提升:Stable Diffusion 3 在視覺美學、提示遵循和字體排版方面,基于人類偏好評估,與競爭模型相比表現優異。
  2. MMDiT架構:新架構允許圖像和文本標記之間的信息流動,以改善輸出的整體理解和排版。
  3. 改進的Rectified Flows:通過重新加權,Stable Diffusion 3 在訓練過程中采用了一種新的軌跡采樣計劃,提高了性能。
  4. 可擴展性:MMDiT架構易于擴展到多種模態,如視頻。
  5. 靈活的文本編碼器:在推理過程中移除內存密集型的 T5 文本編碼器,可以顯著降低 SD3 的內存需求,同時只有微小的性能損失。
  6. 硬件兼容性:在消費級硬件上,最大的 SD3 模型(8B 參數)可以在 RTX 4090 的 24GB VRAM 中運行,并在 50 次采樣步驟下,34 秒內生成 1024x1024 分辨率的圖像。
  7. 模型變體:初始發布將包括從 800M 到 8B 參數的多種 Stable Diffusion 3 模型變體,以進一步消除硬件障礙。

這篇研究論文將在 arXiv 上提供,并且 Stability AI 邀請感興趣的人注冊等待列表,以參與 Stable Diffusion 3 的早期預覽。

Stable Diffusion 3 詳細介紹,點此了解

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。 Trae
0 條回復 A文章作者 M管理員
    暫無評論內容
error:
主站蜘蛛池模板: 宁陕县| 盐边县| 建水县| 托里县| 上饶县| 历史| 凌源市| 于都县| 绥芬河市| 定远县| 双鸭山市| 明星| 紫阳县| 吴忠市| 金阳县| 汉川市| 开远市| 汝州市| 滕州市| 土默特左旗| 武川县| 冷水江市| 平度市| 沅陵县| 涞水县| 资溪县| 遂平县| 桐梓县| 兴和县| 北海市| 鄯善县| 阿巴嘎旗| 鄂托克前旗| 重庆市| 府谷县| 西吉县| 徐闻县| 青冈县| 宣武区| 宣汉县| 周宁县|