Music ControlNet：时变控制的创新音乐生成模型

+AI动态 +AI工具 +AI插件 AI+文本/音频生成 AIGC AI音频文本/音频
23年11月15日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

随着文本到音乐生成模型的发展，如今我们能够欣赏到各种风格的高质量AI人工智能生成的音乐音频。然而，目前的文本控制主要局限于处理全局音乐属性，如流派、情绪和速度，对于时变属性的精确控制，例如节拍在时间中的位置或音乐的动态变化，存在一定的不足。为了弥补这一缺陷，Music ControlNet的团队提出了一种创新的音乐生成模型，称之为Music ControlNet，它基于扩散技术，可以对生成的音频进行多种精确、时变的控制。

在给文本到AI音乐模型注入时变控制的过程中，他们引入了一种类似于图像域ControlNet方法的像素控制策略。具体而言，他们从训练音频中提取控制数据，并在给定旋律、力度和节奏控制的情况下，在音频频谱图上微调基于扩散的条件生成模型。与传统的图像域Uni-ControlNet方法不同，他们设计了一种新的策略，允许创作者仅在时间上部分指定控制，从而更灵活地定制音乐的时变属性。

通过评估从音频中提取的控制和创作者提供的控制，他们证明了他们的模型能够生成与这两种设置中的控制输入相对应的逼真音乐。与最新的模型 MusicGen 相比，该模型接受文本和旋律输入，他们的Music ControlNet在提高音乐对输入旋律的忠实度方面取得了显著的进步，增加了49%。更令人印象深刻的是，尽管参数减少了35倍，训练数据减少了11倍，他们的模型还启用了两种额外的时变控制形式，展现了其高效和灵活的性能。这一创新AI模型为音乐生成领域注入了新的活力，为创作者提供了更多个性化和精确控制的可能性。

Github 开源文件：https://musiccontrolnet.github.io/web/

论文地址：https://arxiv.org/abs/2311.07069

aigc ai技术 AI音频 ControlNet Music ControlNet 扩散技术文生音频生成模型音乐

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

RunwayML创新推出24/7 AI 视频频道：runway tv，全天候播放 Gen AI打造的震撼大片！
23年11月24日
TOP2

Google力作——ZipLoRA发布！Google创新技术让你创造艺术风格图像
23年11月27日
TOP3

【图文教程#47】ComfyUI换脸从零开始工作流搭建教程
8月19日
【Dreamina】字节跳动Dreamina图片、视频生成工具优质创作合集第一弹
4月25日
Spline AI在线 3D 编辑工具发布了自己的免费3D生成工具：快速生成3D物体、动画和材质
4月20日
【玩科技的舒】怎么用ComfyUI+IPAdapter FaceID画出了大量完美的迪丽冷巴 | IPAdapter FaceID安装和使用教程
1月17日
【Rick不想上班】SD webui保姆级人像摄影教程，从0到1教会你使用Instantid实现超还原人像艺术写真和影楼级高清换脸
4月9日
使用DomoAI将真人视频转化成动漫风格
1月5日
患先天性心脏缺陷的男子手术后在康复期间使用Runway制作充满亲情的AI短片《房间》
23年12月11日
【火星时代官方】第一集AI+UE5轻松实现科幻电影！文案→2D美术→3D动画的全流程分享
1月4日
【看完包会】 ComfyUI 详细图文教程：新手级入门学习安装使用必备教程（基础知识篇II）
6月6日
7 个让你惊掉下巴的 ChatGPT-4o 提示词使用小技巧，快速提高使用效率！
5月30日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部