AIHub最新消息,螞蟻集團(tuán)近日開源了一個(gè)名為EchoMimic的新項(xiàng)目,其能夠通過人像面部特征和音頻來幫人物“對(duì)口型”,結(jié)合面部標(biāo)志點(diǎn)和音頻內(nèi)容生成較為穩(wěn)定、自然,符合真實(shí)面部運(yùn)動(dòng)和表情變化的視頻。
同時(shí),EchoMimic也支持單獨(dú)使用音頻或面部標(biāo)志點(diǎn)生成肖像視頻。據(jù)悉,其支持包含中文普通話、英語在內(nèi)的多語言及多種風(fēng)格,也可應(yīng)對(duì)唱歌等場(chǎng)景。
- 項(xiàng)目地址:https://badtobest.github.io/echomimic.html
- Github:https://github.com/BadToBest/EchoMimic
- 模型地址:https://huggingface.co/BadToBest/EchoMimic
?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

