VideoPoet是什么?
VideoPoet是Google發布的基于大語言模型(LLM)來實現視頻生成的模型,之前主流視頻生成模型如Stable Video Diffusion和Video Diffusion都是采用擴散架構,但VideoPoet是基于大語言模型(LLM)來實現視頻生成的,即采用LLM的自回歸架構。VideoPoet的一個特色是它將許多視頻生成能力無縫集成到一個LLM中。
下圖展示了VideoPoet的能力,它可以實現文本生成視頻,圖像生成視頻,視頻風格化,視頻的inpainting和outpainting以及視頻轉語音。

下圖是VideoPoet生成的一些視頻示例:

了解更多詳情,請前往谷歌官方介紹
?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
