Meta AI又来搞事啦!只需语音就能生成逼真会动的3D人物的开源模型Audio2Photoreal

Meta AI又来搞事啦!他们刚刚发布了一个新项目,听着就有点科幻感。你只需提供语音,它就能给你生成逼真的3D人物,而且还能根据语术作出表情动作,6到不行呀!

这个神奇的玩意儿叫Audio2Photoreal,是一个开源项目。原理是利用向量量化的多样样本和高频细节扩散的技巧。该AI模型分为三大部分,分别是脸部动作、引导姿态和身体运动。

而在炫酷的训练演示中,Meta AI还特地用对话形式的音频来测试。结果不得了,生成的3D人物不但外貌逼真,居然还能根据语音内容作出非常自然的动作表现。比如语音说“为什么?”,它就耸肩,简直是科技版的奇迹!

Meta AI又来搞事啦!只需语音就能生成逼真会动的3D人物的开源模型Audio2Photoreal

audio2photoreal对比之前的同类技术在随机生成上更合理。未来的AI技术简直是无限大啊!回头看看2023年,AI在绘画、音乐、视频领域都疯狂飙升,瞅瞅今年,AI对3D的玩法,估计得有点刷新认知了吧!

2024,我们就等着看这场AI在3D领域的大表演吧,保证会是一出精彩的戏码!

audio2photoreal项目开源代码链接:
https://github.com/facebookresearch/audio2photoreal/

audio2photoreal项目论文链接:
https://t.co/mABg4w0DSH

audio2photoreal项目展示地址:
https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/

AI工具专区:
https://heehel.com/category/ai-soft

https://heehel.com/ai-news/meta-announces-fairy.html

https://heehel.com/aigc/audiobox.html

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索