通義萬(wàn)相 Wan2.1-VACE 是什么?
通義萬(wàn)相 Wan2.1-VACE是阿里巴巴開源的AI視頻生成與編輯模型,單一模型可同時(shí)支持文生視頻、圖像參考視頻生成、視頻重繪、視頻局部編輯、視頻背景延展以及視頻時(shí)長(zhǎng)延展等全系列基礎(chǔ)生成和編輯能力。本次共開源1.3B和14B兩個(gè)版本,其中1.3B版本可在消費(fèi)級(jí)顯卡運(yùn)行,開發(fā)者可在GitHub、HuggingFace及魔搭社區(qū)下載體驗(yàn)。該模型還將逐步在通義萬(wàn)相官網(wǎng)和阿里云百煉上線。
通義萬(wàn)相 Wan2.1-VACE的主要功能
- 多模態(tài)視頻生成:
- 支持文本生成視頻、圖像參考生成視頻、視頻參考生成視頻等多種輸入方式。
- 通過(guò)局部區(qū)域生成或修改視頻,可以實(shí)現(xiàn)視頻的局部編輯、內(nèi)容重塑。
- 視頻編輯與重繪:
- 支持視頻的背景擴(kuò)展、局部編輯、視頻重繪等功能。
- 用戶可以通過(guò)深度圖、光流、布局等控制信號(hào)對(duì)視頻進(jìn)行精確的編輯。
- 功能自由組合:
- 用戶可以通過(guò)輸入條件的組合,實(shí)現(xiàn)更復(fù)雜的任務(wù),如將圖片參考與主體重塑結(jié)合,進(jìn)行物體替換;將首幀參考與背景擴(kuò)展結(jié)合,生成不同類型的長(zhǎng)視頻。
- 支持廣泛輸入格式:
- 支持文本、圖像、視頻、Mask和控制信號(hào)等多種輸入方式,能夠保持視頻生成的一致性和靈活控制視頻的布局、運(yùn)動(dòng)姿態(tài)等。
通義萬(wàn)相 Wan2.1-VACE的應(yīng)用場(chǎng)景
- 創(chuàng)意視頻制作:為影視制作、廣告創(chuàng)意、動(dòng)畫制作等領(lǐng)域提供支持,幫助創(chuàng)作者快速生成符合需求的視頻素材。
- 視頻內(nèi)容編輯:在視頻編輯領(lǐng)域,Wan2.1-VACE能夠高效地修改現(xiàn)有視頻內(nèi)容,進(jìn)行局部調(diào)整或添加新元素。
- 虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí):在VR/AR等沉浸式技術(shù)領(lǐng)域,利用該模型生成和編輯虛擬環(huán)境中的視頻內(nèi)容,提升用戶體驗(yàn)。
- AI驅(qū)動(dòng)的自動(dòng)化內(nèi)容創(chuàng)作:對(duì)于需要大量生成視頻內(nèi)容的行業(yè),如社交媒體平臺(tái)或在線教育,Wan2.1-VACE能高效生成內(nèi)容,降低人工成本。
- 個(gè)性化視頻定制:在電子商務(wù)、營(yíng)銷和客戶服務(wù)等領(lǐng)域,Wan2.1-VACE可以根據(jù)用戶的需求生成定制化的視頻內(nèi)容。
?通義萬(wàn)相 Wan2.1-VACE的開源地址
開發(fā)者可在GitHub、HuggingFace及魔搭社區(qū)下載體驗(yàn)。該模型還將逐步在通義萬(wàn)相官網(wǎng)和阿里云百煉上線。
- GitHub:https://github.com/Wan-Video/Wan2.1
- HuggingFace:https://huggingface.co/Wan-AI
- 魔搭社區(qū):https://www.modelscope.cn/organization/Wan-AI?tab=model
?版權(quán)聲明:如無(wú)特殊說(shuō)明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

