【snapAI实验室】ComfyUI instance diffusion 视频运动控制工作流搭载过程演示教学
InstanceDiffusion是一种在文本到图像的扩散模型中加入了精确的实例级控制的技术。它支持每个实例自由形式的语言条件,并允许以灵活的方式指定实例位置,例如简单的单点、涂鸦、边界框或复杂的实例分割掩码,以及它们的组合。这表明Inst...
InstanceDiffusion是一种在文本到图像的扩散模型中加入了精确的实例级控制的技术。它支持每个实例自由形式的语言条件,并允许以灵活的方式指定实例位置,例如简单的单点、涂鸦、边界框或复杂的实例分割掩码,以及它们的组合。这表明Inst...
Haiper 是一个强大的感知基础模型驱动的人工智能,专为通向 AGI 的新道路而设计。他们不仅构建了一个该领域很少有人能够实现的专有模型,而且还在其中心的创作者社区中成长、发展和协调。 Haiper AI官网:https://haiper...
FunClip是一款功能强大的音频处理工具,它不仅能提供文件转录服务,还能实现实时转录,让音频内容轻松转化为文字。FunClip的独特之处在于其高效、准确且易于使用的特点,使得无论是专业人士还是普通用户都能轻松上手。 它能够自动识别视频中的...
图片生成:stablediffusion 动画生成:AnimateDiff AnimateDiff插件在将真人转换为动画并制作成特效视频方面的影响深远且多方面。以下是关于其影响的一些讨论: 艺术创作的革新: AnimateDiff插件的出现...
抖音一位叫Jacob的老哥和他的朋友去了一趟印尼。借助AI技术和美图的视频美化工具wink,他成功地将自己拍的视频赋予了黏土风格的灵魂,并尝试以“韦斯安德森”式的独特视角,将这一创意推向了全新的高度。 美图官网:https://www.me...
大家五一快乐~ 送给大家一个小礼品视频~ 提到的插件: https://github.com/rgthree/rgthree-comfy 插件仓库链接: https://github.com/rgthree/rgthree-comfy.gi...
人体抠图是图像和视频处理中的一项基础任务,其中从输入中提取人体前景像素。先前的工作要么通过额外的指导来提高准确性,要么提高跨帧的单个实例的时间一致性。 我们提出了一个新的框架 MaGGIe,Masked Guided Gradual Hum...
Dreamina是字节跳动旗下剪映推出的一款AI图片创作和绘画工具,旨在帮助抖音的图文和短视频创作者进行内容创作。用户可以通过输入提示性描述,利用AI技术快速将创意和想法转化为视觉作品。Dreamina支持的功能包括「文生图」、「智能画布」...
视频主要介绍了一个AI全自动工作流Midjourney创作大师工具网站,可以通过10分钟内完成所有内容的图片创作,包括内容创作、角色设定、图片绘制等,大大提高工作效率。 工具箱: https://heehel.com/ai-tools#ai...
EndlessDreams语音指导的实时视频,分辨率为 1280x1024。 由博主的声音在 2 分钟内制作的 2 分钟以上的视频。很简单粗暴的首次使用。 不需要渲染几个小时才能完成的 60 秒流畅视频, 这是RT对隐藏在潜空间中一次珍贵的...
Reka Core、Flash 和 Edge,这是 Reka 从头开始训练的一系列强大的多模态语言模型。 Reka 模型能够对文本、图像、视频和音频输入进行处理和推理。该技术报告讨论了其中一些模型的训练细节,并提供了综合评估结果。 Re...
他们介绍了 VASA,这是一个框架,可以在给定单个静态图像和语音音频剪辑的情况下生成具有吸引人的视觉情感技能 (VAS) 的逼真说话面孔。他们的首屈一指的模型 VASA-1 不仅能够产生与音频完美同步的嘴唇运动,还能捕捉大量面部细微差别和自...
专门为视频自动生成音效的AI工具,现在升级到了1.0版本,效果比之前有了大幅提升,可以为AI视频自动配音。 AIGC专区: https://heehel.com/category/aigc 工具箱: https://heehel.com/a...
Dreamina是一个由字节跳动旗下的剪映平台推出的AI创作工具,旨在帮助用户通过简单的文案创作出精彩的图片和视频内容。Dreamina的主要功能包括文字绘图、扩图、局部重绘和图片灵感生成等。它支持用户根据一段文字生成创意图,并允许对生成的...
教程专区: https://heehel.com/category/ai-tutorial AIGC专区: https://heehel.com/category/aigc 这段视频主要向观众介绍了LTX Studio这款软件,它能够将用户...
项目及演示:https://pku-yuangroup.github.io/MagicTime/ 论文:https://arxiv.org/abs/2404.05014 GitHub:https://github.com/PKU-YuanG...
教程专区: https://heehel.com/category/ai-tutorial 符文页: https://heehel.com/category/more/rune-page AIGC专区: https://heehel.com...
AI进化贼快,哪怕1个月前的工作流放到今天大概率就是跑不通的了,模型和插件、节点都在升级优化。今天给大家带来的是animatediff和ipadapter升级后的视频转绘工作流,animatediff在目前阶段做视频转绘是毋庸置疑的王者,稳...
ComfyUI-MuseTalk: https://github.com/ainewsto/ComfyUI-MuseTalk 模型地址: https://pan.baidu.com/s/1ov3DIOqxNiupv6q_06fzKg?pwd...
非常好的一个演示视频,通过可视化清晰的介绍了 LLM 的核心 Transformer 架构的原理。 包括词嵌入、自注意力机制等关键技术。对了解GPT-3等大型语言模型的内部结构很有帮助。