Tora是什么?
Tora是阿里巴巴推出的以軌跡為導向的基于擴散變換器(DiT)的視頻生成框架,它能夠整合文本、視覺和軌跡數據,精確控制視頻內容的動態變化,在不同的時間長度、縱橫比和分辨率條件下生成高質量的視頻。Tora包括軌跡提取器和運動引導融合器,確保生成的視頻能夠精確地遵循預定義的軌跡,支持不同分辨率和時長的視頻制作。
Tora演示demo:
Tora的主要特點
- 軌跡控制:Tora能夠確保視頻中的動作精確地遵循預定義的軌跡,提供精確的運動控制。
- 高保真度:Tora生成的視頻在視覺上具有高保真度,能夠細致地模擬現實世界中的運動和動態。
- 多模態輸入:Tora能夠處理和整合文本、視覺和軌跡條件,使得視頻生成過程更加豐富和靈活。
- 創新架構:Tora采用了Diffusion Transformer(DiT)架構,這是生成高質量視頻內容的先進技術。
- 動態內容生成:它能夠根據軌跡提取器(TE)和運動引導融合器(MGF)的協同工作,生成具有動態一致性的視頻內容。
- 高分辨率和長時序視頻:Tora支持生成高分辨率和長時序的視頻,適用于需要長時間連續鏡頭的應用場景。
如何使用Tora?
Tora目前提供了論文和演示視頻demo,暫未對外開放使用。感興趣的話,可以訪問下方地址了解。
- Tora項目官網:https://ali-videoai.github.io/tora_video
- 論文地址:https://arxiv.org/abs/2407.21705
- GitHub地址:https://github.com/ali-videoai/Tora
?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
