微软VASA-1：实时生成逼真的音频驱动人物说话视频的项目，拥有表情细微差以及自然的头部动作

HeeHel喜好儿官方小编

微软VASA-1：实时生成逼真的音频驱动人物说话视频的项目，拥有表情细微差以及自然的头部动作

他们介绍了 VASA，这是一个框架，可以在给定单个静态图像和语音音频剪辑的情况下生成具有吸引人的视觉情感技能 (VAS) 的逼真说话面孔。他们的首屈一指的模型 VASA-1 不仅能够产生与音频完美同步的嘴唇运动，还能捕捉大量面部细微差别和自然头部运动，有助于感知真实性和活力。

VASA-1核心创新包括在面部潜在空间中工作的整体面部动态和头部运动生成模型，以及使用视频开发这种富有表现力和解开的面部潜在空间。通过广泛的实验，包括对一组新指标的评估，他们表明他们的方法在各个维度上都显着优于以前的方法。他们的方法VASA-1不仅提供具有逼真的面部和头部动态的高视频质量，而且还支持高达 40 FPS 的在线生成 512x512 视频，并且启动延迟可以忽略不计。它为与模仿人类对话行为的逼真化身进行实时互动铺平了道路。

从显示成效来看，当前视频生成技术已近乎完美，VASA-1又成功攻克了一个技术难关：

VASA-1项目能精准捕捉情感、表情细微差别及自然头部动作，增强视频真实感和生动感。
VASA-1支持根据主眼注视方向、头部距离和情绪偏移等可选信号进行调整。
VASA-1可处理超出训练范畴的照片和音频输入，包括艺术照片、歌唱音频和非英语语音。
VASA-1支持表情和姿势的编辑功能，提供创作空间。
VASA-1在离线批处理模式和在线流模式下，能以高速率生成高清视频帧，减少延迟，提升用户体验。

微软VASA-1：实时生成逼真的音频驱动人物说话视频的项目，拥有表情细微差以及自然的头部动作

Microsoft VASA-1 人物说话实时生成微软自然头部动作表情细微差视频逼真音频驱动

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

Midjourney Prompt Generator——midjourney提示词生成器在线工具
9月18日
TOP2

通义千问——一个不断进化的AI大模型
23年11月11日
TOP3

Weights 新手指南：如何免费在线使用 AI 语音模型模仿名人声音（附官网链接）
9月9日
【图文教程#41】Midjourney（MJ）教程：sref指令精准复制日本昭和动漫风格
8月12日
埃隆·马斯克 (Elon Musk) xAI 的 Grok 聊天机器人现已开源
3月18日
ComfyUI必修基础课第三章基础插件＆基础节点【灵仙儿和二狗子】
6月6日
【AIGC流云】Krita+Comfyui新版本升级详解，超强大免费一键选取工具推荐
2月25日
天下武功，唯快不破！最快的AI生图工具StreamDiffusion开源啦，每秒生成过百张AI图
23年12月23日
【图文教程#40】Midjourney超详细教程：AIGC技巧生成创意奇幻风格商业海报的思路
8月9日
2024年国内可用最强AI工具软件应用排行榜TOP8——优点和缺点
4月17日
《大唐紫禁城的春天》：用Haiper AI将唐朝的画”演活“了
5月20日
【进击的AI学长】AI绘画如何给电商行业降本增效？使用Stable Diffusion一键换装换脸生成产品模特
3月15日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部