-
混元圖生視頻模型 - 騰訊開源的AI視頻生成模型
混元圖生視頻模型是騰訊開源的一個圖像轉視頻生成框架,能夠將靜態圖像轉換為生動的視頻內容。用戶只需上傳一張圖片并簡單描述動態效果,即可生成五秒的短視頻。它結合了先進的視頻生成技術和多模態大語言模型,支持多種角色和場景的生成,包括寫實視頻、動漫角色和 CGI 角色等。- 2.6k
- 0
-
SkyReels-V1:昆侖萬維開源的AI短劇創作視頻生成模型
SkyReels-V1 是昆侖萬維開源的中國首個面向AI短劇創作的視頻生成模型,專注于影視級人物表演、表情生成和動作模擬。它能夠精細控制人物的口型、表情和肢體動作,提供33種人物微表情和400多種自然動作組合,模擬真實的情感表達。- 6.6k
- 0
-
Step-Video-T2V:階躍星辰推出的開源視頻生成大模型
Step-Video-T2V是階躍星辰與吉利聯合開源的一款高性能視頻生成大模型,具備300億參數量,能夠生成540P分辨率的高質量視頻。它支持復雜運動場景、精準鏡頭控制和生動人物生成,能夠根據文本輸入生成符合物理規律的視頻。- 7k
- 0
-
Video-XL:智源等推出的小時級超長視頻理解大模型
Video-XL是一款創新性的長視頻理解大模型,與現有的短視頻模型相比,Video-XL在處理長視頻時表現出卓越的效率和準確性,適用于電影摘要、廣告檢測、異常事件識別等多種應用場景。通過深度優化的視覺壓縮和上下文建模技術,Video-XL能在單塊80G顯卡上支持2048幀的視頻分析任務,并在主流視頻理解基準上取得領先成績。- 6.2k
- 0