全部标签

AIGC

最新随机最多浏览最多喜欢最多评论

分类：
AI+3D AI+图片生成 AI+文本/音频生成 AI+视频生成

把换脸工具 InstantID 集成到 ComfyUI 工作流上！仅需一张图就可实现高质量的角色保持一致！支持与PhotoMaker Styler通用

InstantID是一款新的AI技术，能够通过上传一张人脸照片，在几秒钟内生成不同风格的人物照片。与传统方法相比，InstantID具有许多优势。首先，它只需一张图像，无需多张参考图像和复杂的微调过程。其次，它能够生成高质量的个性化图像，并保持个人特征的真实性。此外，InstantID还具有适应不同视觉需求的能力。 InstantID基于强大的扩散模型解决方案，专门用于进行图像个性化处理，同时确保…...
- 1月25日
- 0
- 0
谷歌推出 AutoRT 机器人代理大规模编排的具体基础模型，远程操作和收集 77,000 个机器人事件

演示 AutoRT 向多个建筑物中的20多个机器人提出指令，并通过远程操作和自主机器人策略收集77,000个真实的机器人事件。实验表明，AutoRT 收集的此类“野外”数据明显更加多样化，并且 AutoRT 使用 LLMs 允许遵循能够符合人类偏好的数据收集机器人的指令。论文网址： https://huggingface.co/papers/2401.12963 AIGC专区：https://h…...
- 1月25日
- 0
- 0
MedSAM：深度学习通用医学影像分割模型，更快、更准确地自动识别诊断疾病

MedSAM是一款基于深度学习的医学影像分割工具，它能够自动识别和描绘医学影像中的重要区域，如肿瘤或其他组织的病变。该工具通过学习大量医学影像和对应的掩模（即正确的分割结果），能够处理各种不同的医学影像和复杂情况，从而帮助医生更快、更准确地诊断疾病。与传统的医学影像分析方法相比，MedSAM具有更高的准确性和可靠性。它使用大规模数据集进行训练，该数据集包含了超过100万张医学影像-掩模对，覆盖了…...
- 1月25日
- 0
- 0
【玩科技的舒】kohya-hiresfix安装使用教学：一个插件让SD1.5/SDXL直出高清大图/2K大图，Stable diffusionAI绘画教程

插件安装地址：https://github.com/wcde/sd-webui-kohya-hiresfix.git Stablediffusion专区：https://heehel.com/topic/stablediffusion-toppic ComfyUI专区：https://heehel.com/topic/comfy-ui 这个视频是关于kohya-hiresfix插件让 SD1.5/…...
- 1月25日
- 0
- 0
Adobe放出AI黑科技ActAnywhere，可随意更换视频背景

Adobe放出AI黑科技，可随意更换视频背景。 Adobe发布的ActAnywhere，这简直是个黑科技啊！它是一个人工智能模型，只需输入原视频就能把主体分割，然后配上一张图片后即可融合起来，生成新的视频。不过这个技术刚刚发布，还没有体验渠道，喜好儿网会持续关注后续更新。 Adobe这个黑科技，借助了大规模视频扩散模型的强大技术，还专门为这个任务进行了定制。涵盖丰富的人类与场景互动视频的大数据集…...
- 1月24日
- 0
- 0
王老吉 x 网易云课堂 x HCI讲堂联合举办——AI视觉大赛落下帷幕，得奖者已诞生，奖品居然有这些？！

王老吉联合网易云课堂、HCI讲堂携手共创AIGC视觉大赛！丰厚奖金奖品等你来拿！快来发挥你天马行空的想象力，展现你驾驭AI的水平，打造专属于你的吉祥仪式感吧！优胜作品，将有机会将作品印到王老吉罐子上，把专属于你的“吉”带回家！奖项设置：一等奖3名，奖金2899元；二等奖6名，奖金1500元；三等奖10名，奖金900元；（以上小可爱还能获得大赛证书、获奖作品王老吉凉茶个性定制罐1箱、王老吉产品1箱…...
- 1月24日
- 0
- 0
AI提示词（第47辑）midjourney生成MG动画扁平风格Q版AI插图

MG动画，英文全称为Motion Graphics，直接翻译为动态图形或者图形动画。通常指的是视频设计、多媒体CG设计、电视包装等等。动态图形融合了平面设计、动画设计和电影语言，它的表现形式丰富多样，具有极强的包容性，总能和各种表现形式以及艺术风格混搭。扁平风格是一种设计风格，其特点是追求简洁、清爽和现代感。这种风格在设计元素上强调抽象、极简和符号化，去除多余的装饰和细节，以简单的形状、线条和色…...
- 1月24日
- 0
- 0
【Stable diffusion技巧教程】深入分析，通过AI认识绘画风格

大家经常面对一大堆不同风格的作品时，在自己专业储备还不够时，很难自己描述清晰，也导致出图时不知道给什么咒语。这次，作者用AI角度给大家剖析了关于风格分类的技巧，把SD当中的画面风格效果和属性做一个详细的分析讲解。 Stable Diffusion是一种文本到图像的潜在扩散模型，由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据…...
- 1月24日
- 0
- 0
【设计师学Ai】在Comfyui上搭建图片转视频SVD工作流教程，Stable Video Diffusion的动画参数调节和报错问题全攻略教学

ComfyUI专区：https://heehel.com/topic/comfy-ui 教程专区：https://heehel.com/category/ai-tutorial 这个视频B站UP主——设计师学Ai，详细介绍了在 Comfyui 上搭建图片转视频 SVD 工作流的方法和参数调节技巧，以及可能遇到的报错问题和解决方法。SVD 是 Stable Video Diffusion 的简称，它…...
- 1月24日
- 0
- 0
【大头旅行家】ai声音克隆如何制作，GPT-Sovits新手克隆声音训练教程，教你如何克隆别人声音（2024年新手入门声音克隆进化版教学）

这个视频是B站UP主——大头旅行家一个关于如何使用 GPT-Sovits 进行声音克隆训练的教程。视频中详细介绍了整个训练的过程，并提供了相关软件的下载链接。 GitHub资源网址：https://github.com/RVC-Boss/GPT-SoVITS 开发者视频教程：https://bilibili.com/video/BV12g4y1m7Uw/ Eleven labs教学内容专区：htt…...
- 1月24日
- 0
- 0
PixVerse AI免费的文本生成视频人工智能AI工具——PixVerse（像素宇宙）

PixVerse AI是一个强大的生成式AI模型，可以将多模态输入（包括图像、文本和音频）轻松转化为令人惊叹的视频。它支持广泛的输入类型，并提供了自定义选项，允许用户为生成的视频添加自己的艺术风格，确保独特和个性化的结果。 PixVerse AI官网链接：https://pixverse.ai/ PixVerse专区：https://heehel.com/topic/pixverse AI工具专区…...
- 1月24日
- 0
- 0
网友使用结合多种AI工具创作的作品——《君士坦丁堡之战》

作者的话：这是我第二次使用AI工具创作《君士坦丁堡之战》，在过去六个月左右的时间里，我学到的关于人工智能的最重要的事情是：“真正的成本降低和效率，每个人的视频” 图片：Midjourney、PIX VERSE 视频：Pikalabs、 RunwayML 音频：Eleven Labs Midjourney是一个利用深度学习技术为数字艺术服务的平台，可以根据用户提供的简略描述快速生成不同主题的作品。V…...
- 1月24日
- 0
- 0
动画师用AnimateDiff生成AI广告片《货币的演变》

thefutureofmoney是一个关于货币和金融技术的会议和研讨会的网站。它的目的是探讨和讨论未来的货币形式、金融技术创新以及对金融行业和其他相关行业的影响。对金融、银行业、支付行业、科技行业、投资行业、加密货币行业、商业和经济学领域的专业人士和学者有帮助和影响。多伦多“货币未来”活动的创始人找到作者，为他们的网站主页横幅制作了一个定制的AI视频，展示了货币的动态演变。该作品使用Anima…...
- 1月24日
- 0
- 0
谷歌Google 推出 LUMIERE 多风格滤镜视频生成的时空扩散AI模型

Lumiere——文本到视频的扩散模型，旨在合成描绘真实、多样化和连贯运动的视频——这是视频合成中的关键挑战。为此，研究人员引入了时空 U-Net 架构，该架构通过模型中的单次传递一次性生成视频的整个时间持续时间。 LUMIERE官方介绍网址：https://lumiere-video.github.io/ LUMIERE论文链接：https://arxiv.org/abs/2401…...
- 1月24日
- 0
- 0
小兔Rabbit R1买家秀翻车，回复又慢，差评如潮

哎呀，你们听说了么？那个号称要干翻所有App的Rabbit R1，短短5天就卖了5千台，火爆得一塌糊涂。除了那复古的设计和简洁的操作，它还能通过语音指令播放音乐，甚至能总结屏幕上的内容。可是啊，有些网友拿到真机后，却发现它跟宣传视频里的效果大相径庭。有位网友让它看了一眼菜单，然后问了一个问题：“食用它们最好的方式是什么？”结果呢，Rabbit R1愣是磨蹭了将近20秒才给出回应，网友都无奈了。在…...
- 1月24日
- 0
- 0
"Pika、北京大学和斯坦福大学推出RPG-DiffusionMaster模型：增强文本到图像生成/编辑的组合性”

pika与北京大学和斯坦福大学合作推出 RPG-DiffusionMaster。 RPG 利用多模态 LLMs 来掌握复杂且组合的文本到图像生成/编辑中的扩散模型，从而实现最先进的性能。扩散模型在文本到图像的生成和编辑方面表现出了卓越的性能。然而，现有的方法在处理涉及具有多个属性和关系的多个对象的复杂文本提示时经常面临挑战。研究人员提出了一种全新的免训练文本到图像生成/编辑框架，即Recapti…...
- 1月24日
- 0
- 0
Dusty 推出了新版本的施工布局机器人——更智能、更快、更加强大

Dusty 是一家位于湾区的初创公司，于2019年推出了 FieldPrinter，这是建筑自动化领域中的一个创新产品。这款自主移动机器人通过在建筑工地的地板上绘制粉笔轮廓，将蓝图带入现实世界，从而减少了建筑工作中的猜测和误差。据该公司表示，第一代 FieldPrinter 已经打印了超过9100万平方英尺的面积。 Dusty公司官网链接：https://www.dustyrobotics.com…...
- 1月24日
- 0
- 0
RunwayML多运动笔刷正式上线，生成更精确、更具表现力的视频。

画它。设置它。移动它。用多运动笔刷Multi-Motion Brush 通过独立运动控制最多五个区域，以生成更精确、更具表现力的视频。已正式上线。 Runwayml的Multi-Motion Brush是视频生成平台Runway推出的新功能，它允许用户独立控制视频中多个区域的运动，让不同的物体、内容分别运动。相较于之前只能让几个物体同向运动的“运动笔刷”功能，Multi-Motion Brush…...
- 1月24日
- 0
- 0
【粉丝作品】《山海奇镜》4K预告片重制版

《山海经》是中国志怪古籍，内容主要是民间传说中的地理知识，包括山川、道里、民族、物产、药物、祭祀、巫医等。保存了包括夸父逐日、女娲补天、精卫填海、大禹治水等不少脍炙人口的远古神话传说和寓言故事。《山海经》具有非凡的文献价值，对中国古代历史、地理、文化、中外交通、民俗、神话等的研究，均有参考，其中的矿物记录，更是世界上最早的有关文献。众多文化创作者对《山海经》的关注和创作一直都很活跃。由于《山海经…...
- 1月24日
- 0
- 0
财务危机的Stable Diffusion创造者Stability AI转向语言模型，王炸开局一手好牌打得稀烂？

Stability AI 近期陷入财务困境，而该公司正在加大对语言模型的开发力度，希望通过这一举措扭转局面。稳定性人工智能公司推出了其 “StableLM 2 1.6B” 系列模型的首款模型。这款名为 “ StableLM 2 1.6B” 的模型仅有 16 亿个参数，但却是一个功能强大的语言模型。该模型经过两个周期的训练，使用了两万亿个代币的数据，并涵盖了七种语言，包括英语、西班牙语和法语等。 …...
- 1月24日
- 0
- 0