Sound Of Pixels，AI视听界的黑马，轻松把视频声音分离音轨

+AI动态 +AI工具 +AI插件 AI+文本/音频生成 AIGC 文本/音频网站公告
2月21日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

Sound of Pixels这个开源模型可以说是视听界的黑马，它通过看视频，就能让图像区域产生声音，并且能够分离音轨。
相关论文和开源地址在文章下方发布，感兴趣的朋友可以去看看喔
该模型通过观看大量未标记的视频，自动学习如何定位图像区域产生声音。
例如，你在看一个乐器演奏的视频，这个系统就能把声音信号分成多个声道，每个声道对应不同的乐器类别。同时，Sound of Pixels还能为每个像素分配不同的音频波，让你听到视频中的每一个细节！
简而言之，就是让视频中的每个像素都“开口说话”！就是不知道是否演奏的是同一首歌。这个模型的创新和实用性为我们带来了全新的体验和可能性。

Sound of Pixels项目展示地址：
http://sound-of-pixels.csail.mit.edu/

Sound of Pixels开源代码下载：
https://github.com/hangzhaomit/Sound-of-Pixels

ai音乐分析 SoundofPixels 分离音轨配音秀工具音频分离麻省理工

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

Stable Diffusion研发公司Stability AI的最新工具可以使用AI生成3D 模型了
23年11月3日
TOP2

【AfterShip】史上最强 AI 数字人工具！免费白嫖的 HeyGen 保姆级教程！
3月8日
TOP3

【平面设计案例#41：Midjourney】咒语提示词分享：立秋节气银杏叶抽象扁平插画风格设计二十四节气海报
7月18日
HAAR 可以根据文本提示生成基于 3D 线的人类发型。该模型能够在不同的发型之间进行插值、编辑甚至动画化
23年12月22日
【即梦Dreamina】字节跳动即梦Dreamina图片、视频生成工具优质创作合集第三弹
6月2日
【中文字幕】AI教程，ComfyUI制作集换式卡牌保姆级教学
2月11日
人工智能视频Runway Gen48参赛作品，戴上Vision Pro穿越AI吉卜力宫崎骏世界
2月7日
用AI工具KREA实时绘制生成完整好玩的LEGO乐高图片
23年11月28日
Sora现在可以支持对视频中的对象、背景以及其他元素进行精准的定向修改
5月6日
ElevenLabs 为其 Reader 应用程序带来了标志性的声音——现在 AI Judy Garland 可以为您朗读绿野仙踪
7月4日
《Wisp World》：一款 Apple Vision Pro 桌面养成游戏
2月6日
【-Zho-】单独输出指定蒙版！轻松实现视频重绘！YoloWorld-EfficientSAM in ComfyUI已更新为 V2.0
2月24日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部