Vimi是什么?
Vimi是商湯科技推出的全球首個可控人物視頻生成大模型,可以通過動作視頻、動畫、聲音、文字等多種元素來驅動人物類圖片生成和目標動作一致的人物類視頻,可以穩定地生成分鐘級的單鏡頭人物視,并且生成合理的頭發、服飾、背景,并支持光影變化。
該模型主要面向C端用戶,支持聊天、唱歌、舞動等多種娛樂互動場景。商湯方面稱,Vimi可生成長達1分鐘的單鏡頭人物類視頻,畫面效果不會隨著時間的變化而劣化或失真,Vimi基于商湯日日新大模型,通過一張任意風格的照片就能生成和目標動作一致的人物類視頻。

Vimi的功能特性
- 可控人物:Vimi能夠生成高一致性的人物表情和肢體動作視頻,這意味著用戶可以精確控制視頻中人物的表情和動作,以匹配特定的需求或場景。
- 多種控制方式:Vimi支持多種輸入驅動方式,包括人物視頻、動畫參數、語音和文字等,這為用戶提供了靈活的創作手段,可以根據不同的輸入生成相應的視頻內容。
- 分鐘級單鏡頭生成:Vimi可以穩定地生成長達分鐘級別的單鏡頭人物視頻,這在視頻生成技術上是一個顯著的突破,允許用戶制作更長時間和更連貫的視頻內容。
- 生成合理的視頻場景:Vimi不僅能夠生成人物,還能夠補全人物的合理頭發、服飾和背景,并支持光影變化,使得生成的視頻場景更加真實和完整。
這些功能特性使得Vimi成為一個強大的工具,適用于需要高質量視頻內容的各種應用場景,包括但不限于廣告制作、社交媒體內容創作、個性化視頻生成等。
Vimi的適合場景
- 快速生成唯美寫真視頻:適用于需要快速制作高質量人物視頻的場景,如廣告、社交媒體內容等。

- 個性動態表情包:適合創造個性化的動態表情,用于社交媒體交流或個性化內容制作。

如何使用Vimi?
目前Vimi已在商湯科技官網開放預約,預約申請地址:https://vme-int.softsugar.com/questionnaire/
