全部標簽

視頻模型

混元圖生視頻模型 - 騰訊開源的AI視頻生成模型

混元圖生視頻模型是騰訊開源的一個圖像轉視頻生成框架，能夠將靜態圖像轉換為生動的視頻內容。用戶只需上傳一張圖片并簡單描述動態效果，即可生成五秒的短視頻。它結合了先進的視頻生成技術和多模態大語言模型，支持多種角色和場景的生成，包括寫實視頻、動漫角色和 CGI 角色等。
AI模型
- 2.6k
- 0
AIHub3月6日
SkyReels-V1：昆侖萬維開源的AI短劇創作視頻生成模型

SkyReels-V1 是昆侖萬維開源的中國首個面向AI短劇創作的視頻生成模型，專注于影視級人物表演、表情生成和動作模擬。它能夠精細控制人物的口型、表情和肢體動作，提供33種人物微表情和400多種自然動作組合，模擬真實的情感表達。
AI模型
- 6.6k
- 0
AIHub2月18日
Step-Video-T2V：階躍星辰推出的開源視頻生成大模型

Step-Video-T2V是階躍星辰與吉利聯合開源的一款高性能視頻生成大模型，具備300億參數量，能夠生成540P分辨率的高質量視頻。它支持復雜運動場景、精準鏡頭控制和生動人物生成，能夠根據文本輸入生成符合物理規律的視頻。
AI模型
- 7k
- 0
AIHub2月18日
Video-XL：智源等推出的小時級超長視頻理解大模型

Video-XL是一款創新性的長視頻理解大模型，與現有的短視頻模型相比，Video-XL在處理長視頻時表現出卓越的效率和準確性，適用于電影摘要、廣告檢測、異常事件識別等多種應用場景。通過深度優化的視覺壓縮和上下文建模技術，Video-XL能在單塊80G顯卡上支持2048幀的視頻分析任務，并在主流視頻理解基準上取得領先成績。
AI模型
- 6.2k
- 0
AIHub24年10月29日