Matrix-Zero是什么?
Matrix-Zero 是昆侖萬維發布的世界模型,包含兩款子模型:3D 場景生成大模型和可交互視頻生成大模型。3D 場景生成大模型能將圖片轉化為可自由探索的 3D 場景,具備全局一致性、支持不同風格輸入、動態場景生成等亮點。可交互視頻生成大模型則提供以用戶輸入為核心的視頻生成方案,支持實時互動,具備精準控制的 action model。該模型將推動影視制作、游戲開發等領域的創新,提升內容生產效率。

Matrix-Zero的主要特性
Matrix-Zero包含兩款子模型:3D 場景生成大模型和可交互視頻生成大模型。
1、3D 場景生成大模型
昆侖萬維自研的 3D 場景生成大模型能夠將用戶輸入的圖片轉化為可自由探索的真實 3D 場景。其亮點包括:
- 全局一致性:生成的 3D 場景在各個角度和位置保持一致,不會出現前后不一致的現象。
- 自由探索:支持在場景中進行任意方向的長距離、大范圍探索,為電影、短劇等場景鏡頭生成提供更多可能性。
- 風格遷移:能夠根據輸入圖片的風格(如卡通或寫實)生成相應風格的 3D 場景,并支持風格遷移。
- 動態場景生成:可生成光照、水花、云霧等動態效果,符合物理規律,后續可用于構建更真實的 3D 場景和視頻。
該模型包含兩個核心模塊:場景布局生成模塊和紋理生成模塊。幾何生成模塊借助可微渲染和擴散模型技術,創造出與輸入圖片一致的 3D 場景布局;紋理生成模塊則在用戶運動時不斷補全場景缺失區域,確保用戶在任何位置、任何角度都能看到合理、一致的場景。
2、可交互視頻生成大模型
昆侖萬維的可交互視頻生成大模型建立在先進的生成式視頻模型之上,結合自主研發的用戶交互模塊,實現以用戶輸入為核心驅動的空間智能視頻生成方案。其特點包括:
- 精準控制:能夠根據用戶實時輸入(如鍵盤、鼠標操作)生成互動視頻效果,增強對視頻內容中視角移動的精確控制。
- 多模塊支持:
- 離散運動控制模塊:解析用戶輸入的離散控制信號(如前進、跳躍、后退等),轉化為運動軌跡,影響視頻中的對象行為。
- 連續視角控制模塊:解析鼠標或其他輸入設備的連續控制信號,響應實時輸入,確保視角變換的平滑性和一致性。
- 3D 場景位置追蹤模塊:基于三維空間定位技術,提升視角移動時的位置穩定性,減少畫面跳轉問題。
- 滑動窗口機制:引入時間序列中的歷史輸入信息,優化控制響應的平滑度,減少輸入延遲,提高交互流暢性。
該模型能夠高效生成高質量的視頻內容,確保視頻的流暢性、一致性和合理性,為虛擬環境、交互式應用以及沉浸式體驗提供強大支持。
Matrix-Zero 的應用場景
- 影視制作:Matrix-Zero可用于快速生成電影、短劇等影視作品的場景,提升創作效率,減少傳統 3D 建模的高成本和耗時問題。
- 游戲開發:Matrix-Zero為 3D 游戲場景的快速建模提供高效解決方案,支持不同風格的場景生成,提升游戲開發的效率和質量。
- 具身智能:Matrix-Zero可用于模擬場景的快速搭建,為具身智能的訓練和測試提供虛擬環境。
- 交互式應用:Matrix-Zero通過可交互視頻生成大模型,支持用戶實時輸入生成互動視頻效果,可用于虛擬環境、沉浸式體驗等場景,提升用戶交互的多樣性。
- 教育與培訓:Matrix-Zero可以創建沉浸式的教學場景,支持不同風格的場景生成和動態效果,提升學習體驗。
- 虛擬旅游:Matrix-Zero為用戶提供可自由探索的虛擬旅游場景,支持不同風格的圖片輸入和風格遷移,增強旅游體驗。
如何體驗Matrix-Zero?
據昆侖萬維官方消息,Matrix-Zero世界模型預計4月份上線。
