阿里巴巴的图片转视频说话模型:EMO,这两个演示视频近乎完美

EMO ( Emote Portrait Alive)是一种富有表现力的音频驱动肖像视频生成框架,通过输入单个参考图像和语音,例如说话和唱歌,可以生成具有表情丰富的面部表情和各种头部姿势的声音头像视频。

支持多语言、谈话、唱歌以及快语速的适配,这东西出来之后估计又有很多不明真相的小朋友上当了。。。可以根据输入视频的长度生成任意持续时间的视频。

项目链接:https://humanaigc.github.io/emote-portrait-alive/

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索