全部标签

零样本

【AI论文与新生技术】Zero-shot：精细增益零样本视频采样

将时间维度纳入用于视频生成的预训练图像扩散模型中是一种流行的方法。然而，这种方法计算量要求较高，并且需要大规模视频数据集。更重要的是，图像和视频数据集之间的异构性通常会导致图像专业知识的灾难性遗忘。最近从图像扩散模型中直接提取视频片段的尝试在一定程度上缓解了这些问题。然而，这些方法只能生成具有简单运动的简短视频片段，无法捕获细粒度运动或非网格变形。在本文中，我们提出了一种新颖的零样本视频采样算法…
AI+视频生成
- 926
- 0
HeeHel8月5日
【AI论文与新生技术】CosyVoice：基于监督语义标记的可扩展多语言零样本文本转语音合成器

近年来，基于大语言模型（LLM）的文本转语音（TTS）因其高自然度和零样本能力而成为主流。在此范例中，语音信号被离散化为令牌序列，这些序列由 LLM 以文本作为提示进行建模，并由基于令牌的声码器重构为波形。显然，语音标记在基于 LLM 的 TTS 模型中发挥着至关重要的作用。当前的语音标记是以无监督的方式学习的，缺乏明确的语义信息和与文本的对齐。在本文中，我们建议用有监督的语义标记来表示语音，这…
AI+文本/音频生成
- 1.1k
- 0
HeeHel7月9日
AI工具MimicBrush“模仿笔刷”：通过参考模仿进行零样本图像编辑

考虑到用户的多样化需求，图像编辑是一项实用但具有挑战性的任务，其中最难的部分之一是精确描述编辑后的图像应该是什么样子。在这项工作中，我们提出了一种新的编辑形式，称为模仿编辑，以帮助用户更方便地发挥创造力。具体来说，为了编辑感兴趣的图像区域，用户可以自由地直接从一些野外参考（例如，网上遇到的一些相关图片）中汲取灵感，而不必处理参考和源之间的配合。这种设计要求系统自动找出参考文献的预期内容来执行编辑。…
+AI动态
- 1.6k
- 1
HeeHel6月19日
FlashSpeech：高效的大规模零样本语音合成系统

语言模型和扩散模型极大地推进了大规模零样本语音合成的最新进展。然而，这两种方法的生成过程都很慢并且计算量大。使用较低的计算预算实现高效的语音合成以达到与以前的工作相当的质量仍然是一个重大挑战。音频样本：https://flashspeech.github.io/ AI工具专区： https://heehel.com/category/ai-soft AIGC专区： https://heehel.…
+AI动态
- 297
- 0
HeeHel5月5日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

Weights 新手指南：如何免费在线使用 AI 语音模型模仿名人声音（附官网链接）

【下集】掌握UDIO：AI生成音乐创作终极指南，基本操作和进阶高级功能使用技巧演示

AI翻唱教程：新手克隆自己声音ai唱歌软件教学，教你使用SoVITS 4.1怎么弄RVC模型做翻唱【大头旅行家】

用一句话让AI生成任何网页、游戏、和你想要的工具｜WebSim教程【树懒TV】

Midjourney局部重绘使用教程：局部重绘功能终于来了，区域重绘新功能更新【CG迷李辰】

【图文教程#73】midjourney新手必看！MJ基本命令，快速打开操作大门

【图文教程#72】stable diffusion手绘变3D，SD精准控图思路分享

【图文教程#71】如何用Midjourney秒出各种风格图标

出色的视频风格转换添加特效：RunwayML Gen3视频生成视频功能

蒂姆大叔AIGC讲堂：海螺AI Minimax 视频生成模型提示词填写技巧！

用Runway Gen-3创建电影级 Ai VFX（视觉效果）ai视频生成特效完整教程

AI商业广告片制作解析：ai视频生成人人都能做导演【地质大学博士说AI】

hyperhuman Rodin姐妹工具chatavatar：使用 AI 将肖像照片变成 3D 模型

Meshy AI是最好的 AI 3D 工具吗？ AI3D动画制作教程

Blender + SDXL/FLUX comfyui工作流使用教程：快速渲染3D场景

全新AI工具Meshy AI轻松制作四足角色动物行走3D动画

《心途 Journey of the Heart》一不小心又写了首淡淡的歌做了个淡淡的MV【F君的小小世界】

用SUNO AI做的AI纯音乐—《Nebula's》【AI_Fox】

用AI续写新闻联播片头曲，没想到燃成这样【逆转逆转再逆转】

使用Udio和Luma Dream Machine制作的摇滚重金属AIMV音乐视频《PLASMA》

100个Midjourney风格参考（SREF）代码800-899分享，mj风格一致性

用 AI 重新生成星鸣特工（Concord）里面的角色

AI提示词（第106辑）极具张力的线条动感表现主义风格提示词

100个Midjourney风格参考（SREF）代码700-799分享，mj风格一致性

ai视频生成《任天堂明星大乱斗》——但是1950年代画风

用 Runway gen3 的视频生成视频功能制作特效视频

Dogstudio团队用ComfyUI为可口可乐制作的AI广告视频短片

ai视频生成：中秋至味是团圆【温维斯Wenvis】

MoveAI人工智能驱动的动作捕捉，无需穿着特殊服装。

这你可受得了～有手就行～多种AI工具组合应用可以做游戏了

MeshyAI 官方视频，AI生成3d模型材质，并展示多种形态的狮子步行动作

无需任何大型设备和定位点，使用Move AI 动作捕捉一场22人足球比赛

零样本

【AI论文与新生技术】Zero-shot：精细增益零样本视频采样

【AI论文与新生技术】CosyVoice：基于监督语义标记的可扩展多语言零样本文本转语音合成器

AI工具MimicBrush“模仿笔刷”：通过参考模仿进行零样本图像编辑

FlashSpeech：高效的大规模零样本语音合成系统