全部标签

+AI插件

最新随机最多浏览最多喜欢最多评论

清华大学交作业:Triplane Meets Gaussian Splatting，图像秒转3D

使用 Transformers 可以把图像快速转换成3D模型 Triplane Meets Gaussian Splatting彻底改变 3D 视觉，三平面高斯泼溅的强大功能，实现下一代单视图重建让我们能够从单张图像中重建出精确的 3D 模型。它采用了基于变压器的网络来实现高效的单视图重建。这种新方法，通过使用变压网络，能够快速高效地生成 3D 模型。无论是AI图像还是现实照片，只需十分之一秒…...
- 1月20日
- 0
- 0
Meta 刚刚发布了MAGNeT模型，可以生成更为自然的音乐与音效。

MAGNeT是文本转音乐和音频的模型，使用单个非自回归变压器生成屏蔽音频，这次迭代可以生成更为自然的音乐与音效。随着音乐模型的更新迭代，效果与功能上越来越接近sunoAI了。 veed官方网站： https://www.veed.io/ MAGNeT演示说明： https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/ MAGNeT API模型： https:…...
- 1月16日
- 0
- 0
免费AI工具DDColor，给照片恢复色彩

各位观众朋友们，今天给大家分享一款AI修复工具DDColor，它可以把黑白照片或图像转换成彩色，这不是普通的上色工具哦，它能同时考虑色彩分布和像素级的细节，让你看到高度真实的彩色图像效果！ DD Color运用了双解码器技术，能够理解图片的复杂结构和决定内容部分的颜色。它会提取重要的视觉特征。这些特征包括了图像的不同层次的信息，从轮廓到细节的纹理都有。最酷的是，这项技术不需要依赖过多复杂的设置规…...
- 1月15日
- 0
- 0
10款顶级开源TTS模型传送门，语音合成炼丹师必备

TTS是Text To Speech的缩写，即“从文本到语音”，是人机对话的一部分，让机器能够说话。TTS技术是语音合成应用的一种，它将储存于电脑中的文件，如帮助文件或者网页，转换成自然语音输出。TTS利用自然语言处理和语音合成技术，将文本转化为语音，并可以通过音频播放设备输出语音。TTS技术的应用非常广泛，包括教育、娱乐、语音导航和广播、电话自动应答系统等领域。 1、XTTS XTTS 是一种语…...
- 1月15日
- 0
- 0
微软对标腾讯，AI视频生成模型DragNUWA1.5更新

微软对标腾讯，更新了他们的全新AI视频生成模型，DragNUWA 1.5！让用户可以通过特定路径对图像进行动画处理。这个模型以Stable Video Diffusion作为基础，让用户可以通过特定路径对图像进行动画处理。 DragNUWA 1.5以Stable Video Diffusion作为基础，可以利用文本、图像和轨迹这三个基本控制因素，以语义、空间和时间的方式来生成高度可控的视频。在生成…...
- 1月9日
- 0
- 0
阿里又发布超酷AI技术啦，一句话生成3D角色模型的Make-A-Character

阿里又发布超酷AI技术啦，一句话生成3D角色你知道吗？以前创建逼真的3D角色可是相当费时的，现在有了人工智能技术，这一切变得轻松又快捷！阿里最近推出了一项超酷的AI技术，叫做Make-A-Character框架，简称Mach！ Mach框架利用了大型语言（LLM）和视觉模型，基于真实人类扫描数据集，能在几分钟内，根据用户的文字描述创建一个逼真、可控的3D角色，包括面部特征、发型、眼睛、嘴巴等等…...
- 1月8日
- 0
- 0
乐理100级的AI音乐大师工具M2UGen，文生音乐、图生音乐、视频生音乐全都懂！

AI能够理解图片和视频内容生成相应音乐啦腾讯与新加坡国立大学发布能理解音乐的AI模型M2UGen，它是一个强大的框架，同时包含音乐理解和多模态音乐生成能力。包括文本生成音乐，图像生成音乐，视频生成音乐等在文本生成音乐功能上，只需要输入自然语言，它就能生成一段AI音乐，并且能要求AI作出其创作思路，如空灵而空旷的音乐、充满活力的民歌以及缓慢而忧伤的音乐等等。不仅如此，M2UGen还能根据用户…...
- 1月3日
- 0
- 0
GPT Pilot开源AI编程工具出现，程序猿的头发终于保住啦！

GPT Pilot 是一个AI开发工具，它可以在开发者监督下从零开始编写可扩展的应用程序。它是真正的AI程序员，可以编写代码、调试代码，并在需要帮助时与您进行交互。使用 GPT Pilot可以指定要构建的应用程序类型，它会询问澄清问题，创建产品和技术需求，设置环境，并逐步编写应用程序的代码，就像在现实生活中一样。您可以在开发过程中监督开发进程，并在每个任务完成时进行审核或提供帮助。 GPT Pi…...
- 23年12月27日
- 0
- 0
国产区再发力，把图片修复技术提升到新档次！阿里巴巴与中国香港理工大学联手开发PASD开源AI模型

大家身边可能都保存着一些老照片，但由于年代久远或保管不善，很多照片变得模糊、破旧。随着AI技术的不断发展，现在可以利用这项技术来弥补这些遗憾。阿里巴巴与中国香港理工大学联手开发了一款名为Pixel-Aware Stable Diffusion（PASD）开源的AI模型。这一基于扩散模型的AI技术拥有老照片修复与个性化风格还原功能，并且支持风格化转换，让逝去的记忆焕发新机。目前，PASD模型可以…...
- 23年12月26日
- 0
- 0
ComfyUI 新插件拯救用户最大难题：一键全自动处理工作流中的文件和插件丢失节点问题

AIGC专区：https://heehel.com/category/aigc ComfyUI专区：https://heehel.com/topic/comfy-ui 项目地址：https://github.com/thecooltechguy/ComfyUI-ComfyRun 该插件的一大亮点是一键处理工作流中的节点问题。用户不再需要担心复杂的连线和逻辑，因为所有文件和插件都会在一键安装和下载中…...
- 23年12月26日
- 0
- 0
天下武功，唯快不破！最快的AI生图工具StreamDiffusion开源啦，每秒生成过百张AI图

最快的AI生图工具开源啦！ StreamDiffusion是一个开源项目，它基于LCM和SDXL Turbo扩散模型而优化的增强功能，并在生成性能方面有显著的提升。 StreamDiffusion 支持多种模型和输出帧率。其中，SD-turbo 模型在 1 步的情况下，文生图每秒帧率达到 106，图生图每秒帧率达到 93。而在LCM-Lora+Kohaku V2 模型在 4 步的情况下，文生图每秒…...
- 23年12月23日
- 0
- 0
百度AI工具文心一言的插件商城上线啦，只需一键安装

百度 AI 官方公众号宣布，他们的文心一言插件商城已经上线了。这个商城提供了各种插件，包括办公提效、多模态内容理解生成、专业信息查询等功能。用户只需点击 “一键安装”，就可以使用插件来完成 PPT 生成、音视频提取、思维导图制作等多种需求。目前上线的插件包括思维导图工具、PPT 生成器、能提取视频关键信息的 “视频助理” 等。用户还可以加入文心一言开发者社区。插件商城可以通过文心一…...
- 23年12月14日
- 0
- 0
【AI教程】实现安装krita实时LCM绘画AI插件教学，适用于ComfyUI

Krita 是一款专业的免费开源绘画程序，主要用于数字绘画和创作。它提供了一系列功能和工具，旨在满足概念艺术、纹理和背景绘画、插图和漫画等不同类型的艺术创作需求。Krita 的功能丰富，包括各种绘画和绘图工具、图层管理、颜色管理、动画制作、滤镜效果等。它支持多种文件格式，包括常见的图片格式和专业的绘画文件格式。本教程介绍了用于在 krita 中实时稳定扩散的插件。该插件基于 LCM绘画，允许用户…...
- 23年11月30日
- 0
- 0
Stability AI发布SDXL Turbo，实现每秒14帧图像生成，并开启会员计划

Stability AI再次引起行业关注，发布了经过SDXL蒸馏的全新模型——SDXL Turbo。该模型在图像生成领域取得了巨大突破，将类似LCM生成图片所需步数从原本的50步缩减至仅需1步。据该公司CEO透露，SDXL Turbo在4090显卡上可实现每秒14帧的惊人图像生成速度，为用户提供了更加高效的图像处理体验。然而，Stability AI为了技术创新和更好地实现商业化推出会员计划，这…...
- 23年11月30日
- 0
- 0
AI实时绘画插件LCM-i2i-PoC，实现捕捉活动屏幕画面高速图转图功能，可兼容windows系统画画工具，photoshop，sai等绘画设计软件

LCM-i2i-PoC，它是一个实时获取屏幕画面图像到图像插件，将其发送到AI图像生成并在单独的窗口中重新显示的脚本，该插件提供了修复、生成全新图像、优化草稿线稿，可以利用人工智能生成图像。 LCM 是一种能够实现实时连续生图的生成式模型，由清华大学的研究者们开发。传统的基于扩散模型的生成模型由于多步采样过程缓慢，生成速度慢，而 LCM 通过创新性的方法只用几步推理就能生成高分辨率图像，将主流文生…...
- 23年11月29日
- 0
- 0
Ai人工智能实时绘画LCM涂鸦绘图 comfyui 工作流整合包+fal.AI/Krita/IlumineAI三大平替工具

LCM的全称是Latent Consistency Models (潜在一致性模型)，由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,Stable Difusion等潜在扩散模型(LDM)由于迭代采样过程计算量大，生成速度非常缓慢。通过一些创新性的方法，LCM只用少数的几步推理就能生成高分辨率图像。据统计，LCM能将主流文生图模型的效率提高5-10倍，所以能呈现出实时的Q效果。以下使…...
- 23年11月25日
- 0
- 0
Stability AI公司发布首个基于图像模型的AI视频基础模型Stable Video Diffusion

Stability.AI 是一家开源生成AI公司，其使命是通过利用现代人工智能技术激发全球创造力和创新。Stability.AI 公司开发了多个产品，其中最知名的是他们的 AI 绘画程序 Stable Diffusion。Stable Diffusion 是一种创新的文本到图像模型，具有卓越的生成能力。它可以根据给定的文本描述生成与之相关的图像，为用户提供了一种新颖而有趣的创作工具。在最新的突破…...
- 23年11月22日
- 0
- 0
Stable Difusion WebUI Latent Consistency Models（LCM）：开启艺术创新之窗

LCM的全称是Latent Consistency Models （潜在一致性模型），由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,Stable Difusion等潜在扩散模型(LDM)由于迭代采样过程计算量大，生成速度非常缓慢。通过一些创新z性的方法，LCM-Painter只用少数的几步推理就能生成高分辨率图像。据统计，LCM能将主流文生图模型的效率提高5-10倍，所以能呈现出实时…...
- 23年11月21日
- 0
- 0
Stable-Diffusion AI虚拟人说话插件：SadTalker，详细使用流程及如何从官方网站下载安装教程

SadTalker是一种能够从音频中生成逼真的3D动画人脸的AI人工智能技术。通过StableDiffusion插件功能搭配使用，可以将静态的人像图像和音频合成为会说话的头像视频。除此之外，市面上还有其他一些AI工具，例如D-ID，也可以实现类似的功能，但需要付费使用。SadTalker既可以单独本地安装运行，也可以在Stable-Diffusion-WebUI中运行。本次我们主要介绍在Stab…...
- 23年11月20日
- 0
- 0
StableDiffusion AI虚拟人说话插件：SadTalker v0.0.2 rc如何更新及常见问题解决

这个视频主要讲解SadTalker v0.0.2版本更新流程，以及cuda cpu error、format error常见的问题解决方法 SadTalker是一个照片/音频生成3D动画人脸的软件应用程序，它可以根据音频和单张图片生成逼真的3D动画人脸。该应用程序采用了一种新颖的AI人工智能技术，利用3D运动系数来控制人脸的表情和姿态，从而实现更加真实的人脸动画效果。此外，SadTalker还支持…...
- 23年11月20日
- 0
- 0
【NIN学废了吗】SadTalker:用音频让你的图像栩栩如生——SadTalker使用教程

SadTalker是一个AI人工智能开源项目，其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之，它能够将一张静态的肖像图片和一段音频融合，通过AI生成一个逼真的说话头部视频，仿佛让一张照片变得“会说话”，有一种很不明觉厉的视觉效果。而今天这个视频演示了如何通过名为SadTalker的开源项目创建会说话的主播头像。该项目提供了多种选择，包括Google Co…...
- 23年11月20日
- 0
- 0
谁还本地玩SDXL？Photoshop插件 Image Creator，把stable diffusion跟PS完美融合在了一起

PS免费stable diffusion ai插件：ImageCreator ，它可以将文本转化为图像，并提供了稳定扩散、LoRA、ControlNet 和生成填充等功能，而无需使用 GPU。它还支持 SDXL 1.0，并具有用户友好的安装过程。通过PHOTOSHOP SD插件 ImageCreator，用户可以快速创建精美的艺术作品，并探索不同的生成方法和模型。这个插件还支持自定义模型，并提供…...
- 23年11月17日
- 0
- 0
【AI教程】如何使用SadTalker用音频让你的AI图像栩栩如生详细教学

SadTalker是一个由西安交通大学、腾讯AI实验室、蚂蚁集团联合开发的AI人工智能开源项目，其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之，它能够将一张静态的肖像图片和一段音频融合，通过AI生成一个逼真的说话头像视频，仿佛让一张照片变得“会说话”，有一种很不明觉厉的视觉效果。这个教学视频演示了如何通过使用SadTalker的开源项目创建会说话的主播头…...
- 23年11月16日
- 0
- 0
四种适合stable diffusion XL且不需要图像精炼的AI模型，Civitai免费下载网址

Stable Diffusion XL 简称SDXL，是最新的文本生成图像AI工具版本，它几乎可以生成任何艺术风格的高质量图像，是图像生成的最佳开源模型。但在生成过程中往往需要精炼器的二次加工，但这并不妨碍SD爱好者的脚步，一些不需要精炼的AI模型油然而生，这些模型以创造各种艺术风格而闻名，包括照片级写真肖像、超现实建筑、3D艺术、数字绘画等等。 C站（Civitai ）官方下载网址 DynaVi…...
- 23年11月16日
- 0
- 0