Pyramid-Flow是什么?
Pyramid-Flow是由快手、北京大學(xué)和北京郵電大學(xué)聯(lián)合組建的研究團(tuán)隊(duì)推出的開(kāi)源超高清視頻生成模型,該模型能根據(jù)文本描述生成最長(zhǎng) 10 秒、分辨率高達(dá) 1280x768、幀率 24fps 的高質(zhì)量視頻。
Pyramid Flow 文生視頻模型主要面向開(kāi)發(fā)者、藝術(shù)家和創(chuàng)作者等,提供更高效、更靈活的視頻生成解決方案,目前已經(jīng)在 Hugging Face 平臺(tái)上線(xiàn),并完全開(kāi)源。
Pyramid Flow 的視頻示例
Pyramid Flow 的核心特點(diǎn)
- 高效生成:Pyramid Flow 采用新技術(shù),通過(guò)統(tǒng)一 AI 模型分階段生成視頻,大多數(shù)階段為低分辨率,只有最后階段為全分辨率。這種“金字塔流匹配”方法保持了視頻的高視覺(jué)質(zhì)量前提下,大幅降低了計(jì)算成本,tokens 數(shù)量是傳統(tǒng) diffusion 模型的四分之一。
- 快速推理:在推理過(guò)程中,該模型可以在 56 秒內(nèi)生成一個(gè) 5 秒、384p 的視頻,速度媲美許多全序列 diffusion 模型,甚至更快。
- 開(kāi)源和商業(yè)使用:Pyramid-Flow 在 MIT 許可證下發(fā)布,允許廣泛的使用,包括商業(yè)應(yīng)用、修改和再分發(fā),吸引了希望將模型集成到專(zhuān)有系統(tǒng)中的開(kāi)發(fā)者和公司。
如何使用Pyramid Flow?
Pyramid Flow發(fā)布了論文,開(kāi)源了代碼、模型,提供了在線(xiàn)體驗(yàn)demo:
- Pyramid Flow項(xiàng)目官網(wǎng):https://pyramid-flow.github.io/
- Pyramid Flow在線(xiàn)體驗(yàn)demo:https://huggingface.co/spaces/Pyramid-Flow/pyramid-flow
- Pyramid Flow論文地址:https://arxiv.org/pdf/2410.05954
- GitHub代碼:https://github.com/jy0205/Pyramid-Flow;
- Hugging Face模型下載:https://huggingface.co/rain1011/pyramid-flow-sd3
?版權(quán)聲明:如無(wú)特殊說(shuō)明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書(shū)籍等各類(lèi)媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

