好好看好好听～这项技术能通过识别图像信息生成环境声音

+AI动态 +AI教程
2月28日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

好好看好好听～

这个项目研究了利用扩散潜在对齐器进行开放域的视听生成。通过利用现有的强大模型并构建共享潜在空间，实现了跨视觉和音频的联合生成。该方法在多个生成任务上表现出色，为从学术界到工业界的技术转移提供了解决方案。

传送门：https://huggingface.co/papers/2402.17723

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

用梵高的画风打开一个人平凡无奇的一天：AnimateDiff动画
5月7日
TOP2

AI文生图工具PlaygroundV2.5新功能Creative Upscale到底有多强大？
3月8日
TOP3

扣子Coze官方使用教程：技能-工作流（下）｜第四节【扣子Coze】
8月14日
AI模拟视频中的五官表情（LivePortrait）工具V1.3版：加入webui界面、新增图片表情编辑、视频表情编辑，绿色免安装（网盘下载地址）
8月16日
【中英机翻】教你怎么本地部署阿里巴巴开源图转视频模型AnimateAnyone，下载安装模型全流程演示攻略教程
1月30日
神秘老哥曝出绘画工具Leonardo AI即将推出的名为“Motion”的功能
23年12月24日
MotionLLM：从人类动作和视频中识别、分析和了解人类行为
6月1日
网友发现Suno v3.5的说唱效果极佳，不仅人声更加清晰，节奏也令人难以置信
5月29日
肝肝肝！三套方案任你选~电商图工作流V2版本发布-电商系列-第八集【阿米粒包子】
7月25日
【聚梦小课堂】标签编辑器SD Trainer使用教程-模型训练炼丹新手入门喂饭级教程：标签批量操作技巧！
2月23日
【闲人一坤1982】AI玄幻短片凤鸣山海楚庄王涅槃自省凤出荆楚争霸春秋
4月13日
【建筑学长】完全免费！建筑学长AI渲染SU插件发布了！还不快来用一下？
2月29日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部