//再不认真就输了!
//致力于发现AIGC动态与教程。

Sound Of Pixels,AI视听界的黑马,轻松把视频声音分离音轨

Sound of Pixels这个开源模型可以说是视听界的黑马,它通过看视频,就能让图像区域产生声音,并且能够分离音轨
相关论文和开源地址在文章下方发布,感兴趣的朋友可以去看看喔
该模型通过观看大量未标记的视频,自动学习如何定位图像区域产生声音。
例如,你在看一个乐器演奏的视频,这个系统就能把声音信号分成多个声道,每个声道对应不同的乐器类别。同时,Sound of Pixels还能为每个像素分配不同的音频波,让你听到视频中的每一个细节!
简而言之,就是让视频中的每个像素都“开口说话”!就是不知道是否演奏的是同一首歌。这个模型的创新和实用性为我们带来了全新的体验和可能性。

Sound of Pixels项目展示地址:
http://sound-of-pixels.csail.mit.edu/

Sound of Pixels开源代码下载:
https://github.com/hangzhaomit/Sound-of-Pixels

版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《Sound Of Pixels,AI视听界的黑马,轻松把视频声音分离音轨》
文章链接:https://heehel.com/aigc/sound-of-pixels.html
本站资源仅供个人学习交流,未经许可不得用于商业用途,自行承担法律责任。
如有疑问,请联系微信:heehelcom

喜好儿——再不认真就输了!

致力于发现ai人工智能应用的新世界, 长期更新目前热门AI教程与动态!期待在这个工业变革时代中,希望你我都能发出一点光。

登录

找回密码

注册