Step1X-Edit是什么?
Step1X-Edit是階躍星辰推出的開源圖像編輯大模型,性能達到開源 SOTA。該模型總參數(shù)量為 19B(7B MLLM + 12B DiT),具備語義精準解析、身份一致性保持、高精度區(qū)域級控制三項關(guān)鍵能力;支持 11 類高頻圖像編輯任務類型,如文字替換、風格遷移、材質(zhì)變換、人物修圖等。

Step1X-Edit的主要能力
- 語義精準解析:支持自然語言描述的復雜組合指令,無需模板,能夠靈活應對多輪、多任務編輯需求。同時,支持對圖像中文字進行識別、替換與重構(gòu)。
- 身份一致性保持:編輯后能穩(wěn)定保留人臉、姿態(tài)與身份特征,適用于虛擬人、電商模特、社交圖像等高一致性場景。
- 高精度區(qū)域級控制:支持對指定區(qū)域進行文字、材質(zhì)、色彩等定向編輯,保持圖像風格統(tǒng)一,控制能力更精細。
Step1X-Edit的應用場景
1. 電商領域
- 虛擬模特生成:通過自然語言指令,將商品圖像中的模特替換為虛擬模特,或者為商品添加背景和場景。
- 商品圖像優(yōu)化:快速調(diào)整商品圖像的風格、色彩或背景,提升視覺效果,節(jié)省拍攝成本。
2. 創(chuàng)意設計
- 背景替換與風格遷移:用戶可以通過簡單指令將照片背景替換為海灘、山脈等場景,或者將圖像風格轉(zhuǎn)換為動漫、油畫等。
- 主體添加與移除:在圖像中添加或移除物體,例如在風景圖中添加一只貓,或移除廣告牌。
3. 社交媒體
- 照片美化與個性化編輯:用戶可以輕松美化照片,調(diào)整膚色、添加濾鏡或改變文字內(nèi)容,提升內(nèi)容吸引力。
- 創(chuàng)意內(nèi)容生成:生成具有創(chuàng)意的圖像,如將照片中的寵物替換為其他動物,或改變場景風格。
4. 影視后期
- 特效制作:在影視后期中添加或移除物體,調(diào)整場景色調(diào),節(jié)省后期制作成本。
5. 虛擬人與社交圖像
- 身份一致性保持:在編輯虛擬人或社交圖像時,保持人臉、姿態(tài)和身份特征,適用于虛擬人、電商模特等高一致性場景。
7. 游戲開發(fā)
- 角色與場景生成:快速生成游戲角色、場景和道具,調(diào)整裝備或風格,減少美術(shù)資源開發(fā)時間。
Step1X-Edit的開源信息
- Github倉庫:https://github.com/stepfun-ai/Step1X-Edit
- 模型地址:
- 技術(shù)報告:https://arxiv.org/pdf/2504.17761
?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關(guān)法律責任的權(quán)利。

