阿里团队马不停蹄，与清华大学，华中科技大学共同发布了肖像生成口型同步AI模型DreamTalk，迄今为止没对手

+AI动态 AI+视频生成 AIGC 网站公告
23年12月18日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

超级口型同步AI模型DreamTalk发布，迄今为止没对手
随着技术的不断进步，人工智能在各个领域都取得了令人瞩目的成果。而在富有表现力的口语生成中，这个重要而具有挑战性的任务中，扩散模型的应用却尚未被充分探索。为了填补这一空白，清华大学、阿里集团和华中科技大学共同开发了名为DreamTalk的口型同步AI模型。

DreamTalk 框架包含三个关键组件：降噪网络、风格感知唇部专家和风格预测器。首先，通过基于扩散的降噪网络，可以稳定地合成高质量的音频驱动面部运动，实现音频和面部表情的同步。其次，为了增强唇部动作的表现力和准确性，引入了风格感知唇部专家，它可以指导唇部同步，同时注意到说话的风格差异。最后，为了避免需要参考视频或文本的表情信息，还使用了基于扩散的风格预测器，可以直接从音频中预测目标表情。通过这些组件的协作，DreamTalk 能够有效地生成富有表现力的面部，同时减少对昂贵的风格参考的依赖。

实验结果表明，DreamTalk 能够生成逼真的说话图像，具有多样的说话风格，并且能够准确地同步唇部动作，超过了现有的最先进的方法。DreamTalk 还展示了良好的泛化能力，可以处理不同语言的演讲、嘈杂的音频以及域外肖像等情况。通过调整无分类器指导的尺度和样式代码的插值，还可以灵活地操纵说话风格。

DreamTalk项目展示地址：
https://dreamtalk-project.github.io/

DreamTalk项目论文链接：
https://arxiv.org/abs/2312.09767

DreamTalk项目代码下载地址：
https://github.com/ali-vilab/dreamtalk

AI模型 dreamtalk 华中科技大学口型同步唇部同步图像说话清华大学阿里集团

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

Samsung三星AI机器人Ballie，重返全球科技盛会CES2024，引人关注
1月10日
TOP2

（上）2024年midjourney/MJ目前在设计中真实应用到底如何？一年亲身使用大揭秘！【香克斯卡密】
3月1日
TOP3

【图文教程#20】Stable Diffusion关键词咒语分享：爱丽丝梦游仙境风格AI造字七夕情人节海报
7月19日
【AI作品】用Midjourney和Runwayml制作高级宣传片动画
23年11月19日
阿里下大棋，TF-T2V高质量AI文生视频将一步到位
23年12月28日
新鲜出炉用Suno加微软Copilot制作的音乐
23年12月20日
AIGCRank：2024年6月全球AI网站流量排行榜
7月11日
AI提示词（第47辑）midjourney生成MG动画扁平风格Q版AI插图
1月24日
【亚日东升】别让老板知道我全程用AI打造了AI广告大片
2月25日
2023-RunwayML-Gen-2 AI视频生成功能发展历程
1月4日
【Runway学院】如何使用多运动笔刷制作AI视频动画教学
1月23日
ChatGPTAI聊天机器人新功能推出后，更加智能和便捷的同时又曝出安全问题变得犯二？
1月31日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部