-
清华大学交作业:Triplane Meets Gaussian Splatting,图像秒转3D
使用 Transformers 可以把图像快速转换成3D模型 Triplane Meets Gaussian Splatting彻底改变 3D 视觉,三平面高斯泼溅的强大功能,实现下一代单视图重建 让我们能够从单张图像中重建出精确的 3D 模型。它采用了基于变压器的网络来实现高效的单视图重建。 这种新方法,通过使用变压网络,能够快速高效地生成 3D 模型。无论是AI图像还是现实照片,只需十分之一秒…...- 0
- 0
-
Meta 刚刚发布了MAGNeT模型,可以生成更为自然的音乐与音效。
MAGNeT是文本转音乐和音频的模型,使用单个非自回归变压器生成屏蔽音频,这次迭代可以生成更为自然的音乐与音效。 随着音乐模型的更新迭代,效果与功能上越来越接近sunoAI了。 veed官方网站: https://www.veed.io/ MAGNeT演示说明: https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/ MAGNeT API模型: https:…...- 0
- 0
-
免费AI工具DDColor,给照片恢复色彩
各位观众朋友们,今天给大家分享一款AI修复工具DDColor,它可以把黑白照片或图像转换成彩色,这不是普通的上色工具哦,它能同时考虑色彩分布和像素级的细节,让你看到高度真实的彩色图像效果! DD Color运用了双解码器技术,能够理解图片的复杂结构和决定内容部分的颜色。它会提取重要的视觉特征。这些特征包括了图像的不同层次的信息,从轮廓到细节的纹理都有。 最酷的是,这项技术不需要依赖过多复杂的设置规…...- 0
- 0
-
10款顶级开源TTS模型传送门,语音合成炼丹师必备
TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。TTS技术是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。TTS利用自然语言处理和语音合成技术,将文本转化为语音,并可以通过音频播放设备输出语音。TTS技术的应用非常广泛,包括教育、娱乐、语音导航和广播、电话自动应答系统等领域。 1、XTTS XTTS 是一种语…...- 0
- 0
-
微软对标腾讯,AI视频生成模型DragNUWA1.5更新
微软对标腾讯,更新了他们的全新AI视频生成模型,DragNUWA 1.5!让用户可以通过特定路径对图像进行动画处理。这个模型以Stable Video Diffusion作为基础,让用户可以通过特定路径对图像进行动画处理。 DragNUWA 1.5以Stable Video Diffusion作为基础,可以利用文本、图像和轨迹这三个基本控制因素,以语义、空间和时间的方式来生成高度可控的视频。在生成…...- 0
- 0
-
阿里又发布超酷AI技术啦,一句话生成3D角色模型的Make-A-Character
阿里又发布超酷AI技术啦,一句话生成3D角色 你知道吗?以前创建逼真的3D角色可是相当费时的,现在有了人工智能技术,这一切变得轻松又快捷! 阿里最近推出了一项超酷的AI技术,叫做Make-A-Character框架,简称Mach! Mach框架利用了大型语言(LLM)和视觉模型,基于真实人类扫描数据集,能在几分钟内,根据用户的文字描述创建一个逼真、可控的3D角色,包括面部特征、发型、眼睛、嘴巴等等…...- 0
- 0
-
乐理100级的AI音乐大师工具M2UGen,文生音乐、图生音乐、视频生音乐全都懂!
AI能够理解图片和视频内容生成相应音乐啦 腾讯与新加坡国立大学发布能理解音乐的AI模型M2UGen,它是一个强大的框架,同时包含音乐理解和多模态音乐生成能力。 包括文本生成音乐,图像生成音乐,视频生成音乐等 在文本生成音乐功能上,只需要输入自然语言,它就能生成一段AI音乐,并且能要求AI作出其创作思路,如空灵而空旷的音乐、充满活力的民歌以及缓慢而忧伤的音乐等等。 不仅如此,M2UGen还能根据用户…...- 0
- 0
-
GPT Pilot开源AI编程工具出现,程序猿的头发终于保住啦!
GPT Pilot 是一个AI开发工具,它可以在开发者监督下从零开始编写可扩展的应用程序。它是真正的AI程序员,可以编写代码、调试代码,并在需要帮助时与您进行交互。 使用 GPT Pilot可以指定要构建的应用程序类型,它会询问澄清问题,创建产品和技术需求,设置环境,并逐步编写应用程序的代码,就像在现实生活中一样。您可以在开发过程中监督开发进程,并在每个任务完成时进行审核或提供帮助。 GPT Pi…...- 0
- 0
-
国产区再发力,把图片修复技术提升到新档次!阿里巴巴与中国香港理工大学联手开发PASD开源AI模型
大家身边可能都保存着一些老照片,但由于年代久远或保管不善,很多照片变得模糊、破旧。随着AI技术的不断发展,现在可以利用这项技术来弥补这些遗憾。 阿里巴巴与中国香港理工大学联手开发了一款名为Pixel-Aware Stable Diffusion(PASD)开源的AI模型。这一基于扩散模型的AI技术拥有老照片修复与个性化风格还原功能,并且支持风格化转换,让逝去的记忆焕发新机。 目前,PASD模型可以…...- 0
- 0
-
ComfyUI 新插件拯救用户最大难题:一键全自动处理工作流中的文件和插件丢失节点问题
AIGC专区:https://heehel.com/category/aigc ComfyUI专区:https://heehel.com/topic/comfy-ui 项目地址:https://github.com/thecooltechguy/ComfyUI-ComfyRun 该插件的一大亮点是一键处理工作流中的节点问题。用户不再需要担心复杂的连线和逻辑,因为所有文件和插件都会在一键安装和下载中…...- 0
- 0
-
天下武功,唯快不破!最快的AI生图工具StreamDiffusion开源啦,每秒生成过百张AI图
最快的AI生图工具开源啦! StreamDiffusion是一个开源项目,它基于LCM和SDXL Turbo扩散模型而优化的增强功能,并在生成性能方面有显著的提升。 StreamDiffusion 支持多种模型和输出帧率。其中,SD-turbo 模型在 1 步的情况下,文生图每秒帧率达到 106,图生图每秒帧率达到 93。而在LCM-Lora+Kohaku V2 模型在 4 步的情况下,文生图每秒…...- 0
- 0
-
百度AI工具文心一言的插件商城上线啦,只需一键安装
百度 AI 官方公众号宣布,他们的文心一言插件商城已经上线了。这个商城提供了各种插件,包括办公提效、多模态内容理解生成、专业信息查询等功能。用户只需点击 “一键安装”,就可以使用插件来完成 PPT 生成、音视频提取、思维导图制作等多种需求。目前上线的插件包括思维导图工具、PPT 生成器、能提取视频关键信息的 “视频助理” 等。 用户还可以加入文心一言开发者社区。插件商城可以通过文心一…...- 0
- 0
-
【AI教程】实现安装krita实时LCM绘画AI插件教学,适用于ComfyUI
Krita 是一款专业的免费开源绘画程序,主要用于数字绘画和创作。它提供了一系列功能和工具,旨在满足概念艺术、纹理和背景绘画、插图和漫画等不同类型的艺术创作需求。Krita 的功能丰富,包括各种绘画和绘图工具、图层管理、颜色管理、动画制作、滤镜效果等。它支持多种文件格式,包括常见的图片格式和专业的绘画文件格式。 本教程介绍了用于在 krita 中实时稳定扩散的插件。该插件基于 LCM绘画,允许用户…...- 0
- 0
-
Stability AI发布SDXL Turbo,实现每秒14帧图像生成,并开启会员计划
Stability AI再次引起行业关注,发布了经过SDXL蒸馏的全新模型——SDXL Turbo。该模型在图像生成领域取得了巨大突破,将类似LCM生成图片所需步数从原本的50步缩减至仅需1步。据该公司CEO透露,SDXL Turbo在4090显卡上可实现每秒14帧的惊人图像生成速度,为用户提供了更加高效的图像处理体验。 然而,Stability AI为了技术创新和更好地实现商业化推出会员计划,这…...- 0
- 0
-
AI实时绘画插件LCM-i2i-PoC,实现捕捉活动屏幕画面高速图转图功能,可兼容windows系统画画工具,photoshop,sai等绘画设计软件
LCM-i2i-PoC,它是一个实时获取屏幕画面图像到图像插件,将其发送到AI图像生成并在单独的窗口中重新显示的脚本,该插件提供了修复、生成全新图像、优化草稿线稿,可以利用人工智能生成图像。 LCM 是一种能够实现实时连续生图的生成式模型,由清华大学的研究者们开发。传统的基于扩散模型的生成模型由于多步采样过程缓慢,生成速度慢,而 LCM 通过创新性的方法只用几步推理就能生成高分辨率图像,将主流文生…...- 0
- 0
-
Ai人工智能实时绘画LCM涂鸦绘图 comfyui 工作流整合包+fal.AI/Krita/IlumineAI三大平替工具
LCM的全称是Latent Consistency Models (潜在一致性模型),由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,Stable Difusion等潜在扩散模型(LDM)由于迭代采样过程计算量大,生成速度非常缓慢。通过一些创新性的方法,LCM只用少数的几步推理就能生成高分辨率图像。据统计,LCM能将主流文生图模型的效率提高5-10倍,所以能呈现出实时的Q效果。 以下使…...- 0
- 0
-
Stability AI公司发布首个基于图像模型的AI视频基础模型Stable Video Diffusion
Stability.AI 是一家开源生成AI公司,其使命是通过利用现代人工智能技术激发全球创造力和创新。Stability.AI 公司开发了多个产品,其中最知名的是他们的 AI 绘画程序 Stable Diffusion。Stable Diffusion 是一种创新的文本到图像模型,具有卓越的生成能力。它可以根据给定的文本描述生成与之相关的图像,为用户提供了一种新颖而有趣的创作工具。 在最新的突破…...- 0
- 0
-
Stable Difusion WebUI Latent Consistency Models(LCM):开启艺术创新之窗
LCM的全称是Latent Consistency Models (潜在一致性模型),由清华大学交叉信息研究院的研究者们构建。在这个模型发布之前,Stable Difusion等潜在扩散模型(LDM)由于迭代采样过程计算量大,生成速度非常缓慢。通过一些创新z性的方法,LCM-Painter只用少数的几步推理就能生成高分辨率图像。据统计,LCM能将主流文生图模型的效率提高5-10倍,所以能呈现出实时…...- 0
- 0
-
Stable-Diffusion AI虚拟人说话插件:SadTalker,详细使用流程及如何从官方网站下载安装教程
SadTalker是一种能够从音频中生成逼真的3D动画人脸的AI人工智能技术。通过StableDiffusion插件功能搭配使用,可以将静态的人像图像和音频合成为会说话的头像视频。除此之外,市面上还有其他一些AI工具,例如D-ID,也可以实现类似的功能,但需要付费使用。SadTalker既可以单独本地安装运行,也可以在Stable-Diffusion-WebUI中运行。 本次我们主要介绍在Stab…...- 0
- 0
-
StableDiffusion AI虚拟人说话插件:SadTalker v0.0.2 rc如何更新及常见问题解决
这个视频主要讲解SadTalker v0.0.2版本更新流程,以及cuda cpu error、format error常见的问题解决方法 SadTalker是一个照片/音频生成3D动画人脸的软件应用程序,它可以根据音频和单张图片生成逼真的3D动画人脸。该应用程序采用了一种新颖的AI人工智能技术,利用3D运动系数来控制人脸的表情和姿态,从而实现更加真实的人脸动画效果。此外,SadTalker还支持…...- 0
- 0
-
【NIN学废了吗】SadTalker:用音频让你的图像栩栩如生——SadTalker使用教程
SadTalker是一个AI人工智能开源项目,其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之,它能够将一张静态的肖像图片和一段音频融合,通过AI生成一个逼真的说话头部视频,仿佛让一张照片变得“会说话”,有一种很不明觉厉的视觉效果。 而今天这个视频演示了如何通过名为SadTalker的开源项目创建会说话的主播头像。该项目提供了多种选择,包括Google Co…...- 0
- 0
-
谁还本地玩SDXL?Photoshop插件 Image Creator,把stable diffusion跟PS完美融合在了一起
PS免费stable diffusion ai插件:ImageCreator ,它可以将文本转化为图像,并提供了稳定扩散、LoRA、ControlNet 和生成填充等功能,而无需使用 GPU。它还支持 SDXL 1.0,并具有用户友好的安装过程。 通过PHOTOSHOP SD插件 ImageCreator,用户可以快速创建精美的艺术作品,并探索不同的生成方法和模型。这个插件还支持自定义模型,并提供…...- 0
- 0
-
【AI教程】如何使用SadTalker用音频让你的AI图像栩栩如生详细教学
SadTalker是一个由西安交通大学、腾讯AI实验室、蚂蚁集团联合开发的AI人工智能开源项目,其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之,它能够将一张静态的肖像图片和一段音频融合,通过AI生成一个逼真的说话头像视频,仿佛让一张照片变得“会说话”,有一种很不明觉厉的视觉效果。 这个教学视频演示了如何通过使用SadTalker的开源项目创建会说话的主播头…...- 0
- 0
-
四种适合stable diffusion XL且不需要图像精炼的AI模型,Civitai免费下载网址
Stable Diffusion XL 简称SDXL,是最新的文本生成图像AI工具版本,它几乎可以生成任何艺术风格的高质量图像,是图像生成的最佳开源模型。但在生成过程中往往需要精炼器的二次加工,但这并不妨碍SD爱好者的脚步,一些不需要精炼的AI模型油然而生,这些模型以创造各种艺术风格而闻名,包括照片级写真肖像、超现实建筑、3D艺术、数字绘画等等。 C站(Civitai )官方下载网址 DynaVi…...- 0
- 0
❯
今日签到
有新私信
私信列表
搜索
客服
扫码打开当前页
联系客服
公众号
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!