全部标签

AIGC

最新随机最多浏览最多喜欢最多评论

分类：
AI+3D AI+图片生成 AI+文本/音频生成 AI+视频生成

【Nenly同学】ComfyUI“不好用”？这期视频，帮你找到最正确的入门姿势！全面掌握高清修复+重绘+LoRA+ControlNet，无缝丝滑上手SD

如果你之前用过ComfyUI，却因为它那复杂的节点操作方式和工作流逻辑被“劝退”过，那这期视频或许正是你所需要的；而如果你之前从来没有使用过ComfyUI，这就是你“入坑”的最佳机会。 🚩本期教程配套资料： gf66fxi6ji.feishu.cn/wiki/HJojwCK8aiEQw4kwnWEcEwxmnBd?from=from_copylink （请完整复制链接在电脑浏览器打开，含Mana…...
- 5月6日
- 0
- 0
首届中国AI电影节成功举办，多部优秀AI作品获奖

文章来源：AI电影共创社推荐去”AI电影共创社“视频号观看视频原文链接：https://mp.weixin.qq.com/s/_2I9hHKETEX4iQYXQQzWdQ 更多作品： https://heehel.com/category/ai-works AIGC专区： https://heehel.com/category/aigc 5月4日，一个特别的日子，不仅是青年的节日，更是中国AI…...
- 5月6日
- 0
- 0
3D从业网友用 Blander 制作很简陋的动画，再用 Animatediff 转绘直接省去了渲染的步骤？

作者：shanef3d用 Blander 制作很简陋的动画，再用 Animatediff 转绘，原文章在ins。 Blender 3D工具与Animatediff AI动画生成工具：共创未来工作与生活的新篇章随着科技的飞速发展，数字化工具在我们的工作和生活中扮演着越来越重要的角色。Blender 3D工具和Animatediff AI动画生成工具的结合，无疑将为我们带来前所未有的创新体验，深刻影…...
- 5月6日
- 0
- 0
【老陈打码】解压即用，2024最简单好用AI开源换脸应用Start Rope，整合包已备好，快试试吧！

AI换脸技术对人们工作生活的积极影响和潜在好处：夸克网盘「Start Rope换脸整合包」备用链接： https://pan.quark.cn/s/91b7f4043f21 工具箱： https://heehel.com/ai-tools#ai-3d AI工具专区： https://heehel.com/category/ai-soft 一、娱乐产业的革新 AI换脸技术在娱乐产业中的应用已经屡见…...
- 5月6日
- 0
- 0
Adobe最新研究成果：单一视频多视角观看的奇妙之旅

Adobe的最新研究成果，如同一扇神奇的窗户，开启了从单一普通视频中捕捉并展现不同视角观看画面的新纪元。想象一下，你手中的视频不再局限于一个固定的角度，而是可以像在现场一样，自由切换视角，全方位地观察运动中的人或飞驰的车辆。这项技术的魅力不仅在于其带来的视觉新奇，更在于其高效和实用性。与传统的NeRF技术相比，这项新研究在保持高质量视觉效果的同时，大大提升了处理和渲染速度。这种速度的提升，使得从…...
- 5月6日
- 0
- 0
StoryDiffusion Windows系统一键本地安装使用教程：提高生成图像之间的一致性文生图模型

本文来源：AI产品汇原文来链接：https://mp.weixin.qq.com/s/U7ni9AdcuSPzD_SOWCCpdQ StoryDiffusion是由字节跳动和南开大学合作推出的AI工具，专注于长范围图像和视频生成。该工具利用一致性自注意力机制来实现图像和视频内容的连续性和一致性。此外，StoryDiffusion还被应用于漫画生成和图像转视频等多种场景，通过Consistent…...
- 5月6日
- 0
- 0
【中文翻译】Agent AI (幻境侦探) | Agent AI官方预告片|全球“首部”AI动画电影|第一篇人工智能长篇动漫

这段视频是关于《Agent AI (幻境侦探)》的官方预告片，它是世界上“第一部”由人工智能完成的长篇动画电影。视频介绍了这部电影将会有一个很棒的故事情节和动作场面，并且整部电影由作者——UX Bootcamp独自完成。男演员/女演员：UX Bootcamp AI动画：DomoAI 故事：UX Bootcamp/ChatGPT 音乐：Suno 音效：剪映这部电影的出现，代表着人工智能在动画制作…...
- 5月6日
- 0
- 0
【万能君的软件库】AI数字人音频驱动对口型MuseTalk离线版V1.0，效果更好的数字人制作工具，不用搭建环境，解压即用！

这个视频主要介绍了一个AI数字人音频驱动对口型工具MuseTalk离线版V1.0，可以通过给定的音频和参考视频，将音频的口型与参考视频的口型进行匹配，实现不同语言的口型同步。目前项目的效果还不错，已经做成软件，用户可以直接下载使用。项目功能：项目可以接受输入的音频文件和参考视频，然后将音频的口型和参考视频的口型进行匹配，实现音频和视频的同步播放。支持的语言包括汉语、英语、日语等。使用方法：用户…...
- 5月6日
- 0
- 0
AI小镇Thistle Gulch，无尽叙事，用AI-NPC模拟现实世界，现在即可安装试玩

今天，作者将一同踏入两个令人惊叹的免费AI世界模拟器，它们不仅可供安装，更可让我们深入探索。首先，让我们聚焦于《Fable Studios》的杰作——《The Simulation》，这款游戏早已在作者的期待列表中占据一席之地。你或许对这家工作室有所耳闻，他们曾以人工智能之力创作出备受赞誉的南方公园剧集。然而，今天，我们将目睹他们真正的杰作——蓟谷，一个被某些人亲切地称为“AI西部世界”的神奇之…...
- 5月6日
- 0
- 0
保姆级教程：ComfyUI中常见的十几种多图处理节点，包括图像填充、图像拼接、图像混合等等【月下Hugo】

这段视频主要介绍了ComfyUI中的图像处理方法，包括图像填充、图像组合、图像增强差异、图像混合处理、图像覆盖处理、图像之间的调色处理、图像的拼接处理以及图像的切换处理等。图像填充：可以将一张图片覆盖在另一张图片上，可以通过设置坐标来设置覆盖的具体位置，也可以进行缩放和平移操作。图像组合：可以将多张图片放到一起，组成一个批次，这对于需要处理多张图片的情况非常有用。图像增强差异：可以通过设置指…...
- 5月6日
- 0
- 0
Chrome插件新宠：一键虚拟试穿换衣AI魔法工具

只需在电商网站上右键单击任何图像即可实现虚拟换装，虚拟试衣的应用，作者说现在还在整理，还没有上传到扩展商店给大家用，但是给出了自己搭建的在线使用平台。使用的API：https://replicate.com/cuuupid/idm-vton Chrome插件原型作者：@aaronbesson 在线使用：https://www.myoutfitai.com/dressingroom 工具箱： ht…...
- 5月6日
- 0
- 0
Sora现在可以支持对视频中的对象、背景以及其他元素进行精准的定向修改

Sora的功能并不仅局限于视频的渲染生成，它更具备了一项令人瞩目的能力——对视频中的对象、背景以及其他元素进行精准的定向修改。这种强大的处理能力使得Sora在视频编辑和后期制作领域脱颖而出，为用户提供了前所未有的便利和创造力。无论是调整视频的色调、亮度，还是改变某个对象的形状、位置，甚至是对背景进行替换，Sora都能轻松应对，让用户的创意得以完美实现。这一技术革新不仅为影视制作、广告设计等行业带…...
- 5月6日
- 0
- 0
ChatGPT即将迎来全新用户界面（UI）

在即将到来的更新中，ChatGPT的全新用户界面（UI）设计旨在增强对话的沉浸感，为用户带来更为自然和流畅的交流体验。然而，对于习惯频繁查找历史记录或切换不同GPTs（生成式预训练模型）的用户而言，这次更新可能会带来一些不便。 AIGC专区： https://heehel.com/category/aigc 更多消息： https://heehel.com/category/ai-news 工具箱…...
- 5月6日
- 0
- 0
HeyGen AI音频工具与Instant Highlights自动剪辑视频工具

HeyGen AI音频工具及其新增的Instant Highlights 1.0自动剪辑视频工具，预示着人工智能技术在视频制作领域的一次重大飞跃。这两款工具的出现，不仅将极大地简化视频制作流程，还将对人们的生活和工作方式产生深远的影响。 HeyGen官方网址：https://www.heygen.com/ Instant Highlights体验链接：https://app.heygen.com/…...
- 5月6日
- 0
- 0
特斯拉公开自主研发擎天柱（Optimus）机器人的最新训练成果

特斯拉近期公开了擎天柱（Optimus）机器人的最新训练成果，其展现出了令人瞩目的灵活性和步行稳定性，甚至能够精确地进行4680电池的分拣工作。更为引人关注的是，特斯拉此次还罕见地披露了机器人的训练过程，揭示其完全是依赖视觉辅助和人类示范进行训练的，这一逻辑与特斯拉汽车的自动驾驶技术不谋而合。在技术层面，Optimus机器人所依赖的神经网络已实现了端到端的运行模式。它仅凭机器人的2D摄像头视频和…...
- 5月6日
- 0
- 2
Adobe 3D & Immersive Labs推出全新工具：Project Neo

Project Neo 是由 Adobe 3D & Immersive Labs 推出的一个用于加速矢量和立体插图设计的工具（Beta 版本）。该工具可以帮助设计师更快速地创建出令人印象深刻的图标、有活力的插图和独特的维度形状。与 Adobe Photoshop 和 Illustrator 等软件共享相同的操作控制和命令，Project Neo 使用户只需几分钟，而不是几小时，就可以轻松地…...
- 5月5日
- 0
- 0
【PUAI_001】AI电视台｜纪录片《如果充电宝会说话》

视频主要介绍了一种古老的便携式供电装置——充电宝，它出土于沙县小吃旧文明遗址，距今约3500年。考古人员在充电宝内部发现了八块电路板，上面记录了古老文明的信息，成为了人类开启文明复兴的钥匙。此外，视频还提到，在21世纪中叶，一股被称为“爱”的力量发起了人类文明清除计划，为了避免被清除，一些有识之士选择了在充电宝内部的电路板上留言，留下了关于人类文明的信息。更多作品： https://heehel…...
- 5月5日
- 0
- 0
FlashSpeech：高效的大规模零样本语音合成系统

语言模型和扩散模型极大地推进了大规模零样本语音合成的最新进展。然而，这两种方法的生成过程都很慢并且计算量大。使用较低的计算预算实现高效的语音合成以达到与以前的工作相当的质量仍然是一个重大挑战。音频样本：https://flashspeech.github.io/ AI工具专区： https://heehel.com/category/ai-soft AIGC专区： https://heehel.…...
- 5月5日
- 0
- 0
SEED-Bench-2-Plus：通过富含文本的视觉理解对多模态大型语言模型进行基准测试

理解富含文本的视觉内容对于多模态大语言模型（MLLM）的实际应用至关重要，因为丰富文本的场景在现实世界中无处不在，其特点是图像中嵌入了大量文本。最近，具有令人印象深刻的多功能性的 MLLM 的出现提高了我们对 MLLM 的期望标准。然而，他们在文本丰富的场景中的熟练程度尚未得到全面、客观的评估，因为当前的 MLLM 基准主要侧重于评估一般视觉理解能力。在这项工作中，我们引入了 SEED-Benc…...
- 5月5日
- 0
- 0
【AI-KSK】Llama3携手ComfyUI进行提示词驱动,灵感爆发！

这段视频主要介绍了Meta AI发布的Llama3模型在ComfyUI中的应用，以及如何使用该模型进行提示词生成和图片生成。提示词生成：通过使用Llama3模型的微调模型，用户可以输入提示词，模型会进行扩句或美化，每次点击队列都会生成新的正常提示词。这种生成方式可以提供更多的灵感。图片生成：用户可以使用一些模糊的描述，如“超现实主义艺术”，模型同样会生成相应的提示词并进行生成。此外，模型还支持…...
- 5月5日
- 0
- 0