欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

即夢AI
當前位置:首頁>AI模型>混元DiT-騰訊最新開源的文生圖AI模型

混元DiT-騰訊最新開源的文生圖AI模型

混元DiT是什么?

混元DiT是騰訊最新開源的文生圖AI模型,采用了與Sora、Stable Diffusion 3相同的DiT(Diffusion With Transformer)架構,支持中英文雙語輸入及理解,參數量達到15億。它是業界首個中文原生的DiT架構文生圖開源模型,可以作為視頻等多模態視覺生成的基礎。

混元DiT-騰訊最新開源的文生圖AI模型

混元DiT的主要特點

  1. 中英雙語DiT架構:混元DiT采用了與Sora和Stable Diffusion 3相同的DiT架構,這是一種結合了擴散模型和Transformer架構的技術。擴散模型是一種生成模型,能夠生成高保真度的圖像,而Transformer架構則是一種在自然語言處理(NLP)領域非常成功的模型結構。
  2. 中文元素理解:混元DiT支持中文和英文的輸入及理解,尤其對中文語言和文化元素有更好的理解和生成能力。
  3. 長文本理解:混元DiT能分析和理解長篇文本中的信息并生成相應藝術作品。
  4. 細粒度語義理解:混元DiT能捕捉文本中的細微之處,從而生成完美符合用戶需要的圖片。
  5. 多輪對話文生圖:混元DiT可以在多輪對話中通過與用戶持續協作,精煉并完善的創意構想。
  6. 開源和免費商用:模型已在Hugging Face平臺及Github上發布,包含模型權重、推理代碼、模型算法等,可供免費商用。
混元DiT-騰訊最新開源的文生圖AI模型
混元DiT中文元素理解
混元DiT-騰訊最新開源的文生圖AI模型
混元DiT長文本理解

混元DiT的性能表現

為了全面比較HunyuanDiT與其他模型的生成能力,研究團隊構建了4個維度的測試集,包括文本圖像一致性、排除AI偽影、主題清晰度、審美。超過50名專業評估人員進行評估。

評測數據顯示,其效果超過現有的開源Stable Diffusion模型,屬于國際領先水平。

混元DiT-騰訊最新開源的文生圖AI模型

混元DiT的技術架構

混元DiT使用預訓練的變分自編碼器(VAE)將圖像壓縮到低維潛在空間中,并訓練擴散模型以學習擴散模型的數據分布。混元DiT的擴散模型是用Transformer參數化的。為了對文本提示進行編碼,混元DiT利用了預先訓練的雙語(英文和中文)CLIP和多語言T5編碼器的組合。

混元DiT-騰訊最新開源的文生圖AI模型
混元DiT-騰訊最新開源的文生圖AI模型

如何使用混元DiT

目前,混元DiT已在 Hugging Face 平臺及 Github 上發布,包含模型權重、推理代碼、模型算法等完整模型,可供企業與個人開發者免費商用。

另外,騰訊也基于混元DiT開發了一個AI生圖產品:騰訊混元生圖,感興趣的話,可以去體驗下。

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。 Trae
主站蜘蛛池模板: 陵川县| 大姚县| 普安县| 常宁市| 新疆| 依兰县| 望江县| 桦南县| 万荣县| 丹凤县| 邓州市| 定边县| 绍兴县| 册亨县| 通许县| 陆丰市| 西青区| 沛县| 文昌市| 广元市| 常熟市| 万载县| 商丘市| 吉首市| 贞丰县| 恩平市| 民权县| 屏南县| 望奎县| 五台县| 岳普湖县| 阿瓦提县| 浪卡子县| 望谟县| 淳安县| 叶城县| 宜都市| 敦化市| 陵水| 富锦市| 垦利县|