全部标签

AIGC

最新随机最多浏览最多喜欢最多评论

分类：
AI+3D AI+图片生成 AI+文本/音频生成 AI+视频生成

【极点AI】ComfyUI电商实战系列教程：服装生成模特照从0到1安装节点安装模型运行工作流

这段视频主要介绍了电商实战系列中如何使用ComfyUI服装照生成模特照。包括了从0~1进行节点安装、模型安装到工作流运行，以及根据实际场景不同，核心ComfyUI工作流共分为三个部分：原素材是假人模特照生成真人模特照，原素材是服装的平面图生成真人模特照，以及原素材已经是模特照，在生成基础模特照后进行服装细节的修复提高服装的细节和还原度。工作流拆解：首先，根据不同的原素材，可以生成三种类型的模特照…...
- 4月23日
- 0
- 0
【坏心眼猫特效】IPAdapter + ControlNet 前景背景替换 comfyUI工作流

这段视频主要介绍了IPAdapter工作流，这是一种可以改变图像风格的工作流，可以让用户将图像的主体（如老虎）改变为不同的风格，同时也可以改变背景的风格，或者只改变背景而不改变主体。工作流中使用了IPAdapter的节点和ControlNet模型，并通过遮罩功能来控制主体和背景的处理。工作流的功能：用户可以使用这个工作流将图像的主体改变为不同的风格，同时也可以改变背景的风格，或者只改变背景而不改…...
- 4月23日
- 0
- 0
【PUAI_001】AI电视台｜风筝版《还珠格格》

《还珠格格》是一部改编自琼瑶同名小说的古装清宫喜剧，以其引人入胜的剧情和鲜明的人物形象赢得了广大观众的喜爱。该剧讲述了乾隆之女夏紫薇到北京城与失散多年的父亲相认，在走投无路之际遇上女飞贼小燕子，并结为姐妹的故事。小燕子为夏紫薇想办法混入宫，但在阴差阳错中与夏紫薇互换了身份，成为清宫中的“还珠格格”并深受乾隆宠爱的经历。 AIGC专区： https://heehel.com/category/aig…...
- 4月23日
- 0
- 0
ORPO微调助力，Llama3-8B-Chinese-Chat模型中文处理再升级

Llama3-8B-Chinese-Chat模型是基于Meta-Llama-3-8B-Instruct模型，通过ORPO（Odds Ratio Preference Optimization）方法进行微调的中文聊天模型。相较于原始的模型，它在处理中文问题时表现出色，显著减少了“中文问题英文回答”和混合中英文回答的情况。此外，该模型在回答时也大量减少了表情符号的使用，使回应更加正式和专业。模型下载…...
- 4月23日
- 0
- 0
硅谷女孩采访挑战Google谷歌的 Perplexity 搜索引擎创始人 Aravind

看了一下，这个搜索引擎和秘塔AI搜索引擎很像，方向都是一样的，页面布局也差不多。 Aravind，这位印度创新者，在IIT和加州大学伯克利分校毕业后，曾在Google DeepMind实习并加入OpenAI。他看到GitHub Copilot的潜力，并成功吸引投资，从OpenAI离职创业。 Perplexity 搜索引擎：https://www.perplexity.ai/ 秘塔AI搜索：http…...
- 4月22日
- 0
- 0
【AI-GitHub】VSR自动去除字幕水印：利用AI算法精确识别一键去除视频中的字幕

Video-sSubtitle-Remover (VSR)一个基于Al技术的工具,专门用于从视频和图片中去除硬编码的字幕和文本水印。这个工具能在不损失图像分辨率的情况下,清除视频领或图片中的不需要的文字信息。 GitHub: https://github.com/YaoFANGUK/video-subtitle-rernover 整合包下载：Windows GPU版本v1.1.0（GPU）：百度…...
- 4月22日
- 0
- 0
【下集】Stylar AI图像生成工具：完整的AI艺术和图像编辑器（完整教程）

上期回顾： https://heehel.com/aigc/stylar-aitool-1.html Stylar AI是一款基于人工智能的图像生成工具，它通过理解图层概念来提供精确和直观的图像布局调整功能。用户可以通过拖拽的方式排版不同的AI生成元素，实现像传统设计工具一样的精确控制。Stylar AI支持超过40种风格的图像生成，并具备类似Photoshop的功能，如图层管理、去背、选取、文字…...
- 4月22日
- 0
- 0
【赛博画手威少】Midjourney10分钟10次点击即可完成AI网文推文绘本漫画故事视频内容创作

视频主要介绍了一个AI全自动工作流Midjourney创作大师工具网站，可以通过10分钟内完成所有内容的图片创作，包括内容创作、角色设定、图片绘制等，大大提高工作效率。工具箱： https://heehel.com/ai-tools#ai-3d Midjourney专区： https://heehel.com/topic/midjourney-topic AI全自动工作流：通过AI技术，可以自动…...
- 4月22日
- 0
- 0
【秋芝2046】我花2万块测试100多个AI工具，真正好用的只有这些！

这段视频主要介绍了各种AI工具的使用体验，包括文本生成、图片生成、视频生成、音乐生成等方面，同时也分享了免费和付费的工具推荐。 AIGC专区： https://heehel.com/category/aigc 工具箱： https://heehel.com/ai-tools#ai-3d 文本生成视频中提到了几个好用的文本生成工具，如charGPT、Claude等，这些工具都能生成高质量的文本内容…...
- 4月22日
- 0
- 0
Groma格罗马：用于奠定多模态大型语言模型的本地化视觉标记化

Groma，一种多模态大语言模型（MLLM），具有扎实的细粒度视觉感知能力。除了整体图像理解之外，Groma 还擅长区域级任务，例如区域字幕和视觉基础。项目页面：https://groma-mllm.github.io/ AIGC专区： https://heehel.com/category/aigc 更多消息： https://heehel.com/category/ai-news 此类功能建…...
- 4月22日
- 0
- 0
阿里云百炼平台推出Llama 3系列大模型限时免费服务，加速大模型生态发展

近日，阿里云百炼大模型服务平台宣布了一项重要举措：全面支持Meta最新开源的Llama 3系列大语言模型，并推出限时免费训练、部署、推理服务。这一举措旨在让企业和开发者能够轻松利用Llama 3系列模型，打造专属的大模型应用。阿里云官网：https://www.aliyun.com/benefit/waitou/V2?utm_content=se_1016877700 阿里云百炼平台：https…...
- 4月22日
- 0
- 0
谷歌刚刚推出了 ScreenAI，一种专门用于理解 UI 和信息图表的视觉语言模型

应用布局注释器、图标分类器、图像字幕模型和 OCR 引擎为每个 UI 元素提供详细注释。这对人机交互影响巨大。可能将永远改变用户体验的未来。官方介绍：https://heehel.com/google-screenai AIGC专区： https://heehel.com/category/aigc 更多消息： https://heehel.com/category/ai-news Screen…...
- 4月22日
- 0
- 0
用ViggleAI+Adobe firefly+ Suno AI一键选择角色人物舞蹈风格

想象一下，有按钮可以让每个插图都按你喜欢的方式跳舞！即将实现人工智能舞蹈使用工具：ViggleAI+Adobe firefly+ Suno AI AIGC专区： https://heehel.com/category/aigc 工具箱： https://heehel.com/ai-tools#ai-3d ViggleAI是一款令人振奋的AI视频生成工具，它革新了传统的视觉特效制作流程。用户可以通…...
- 4月22日
- 0
- 0
【自带马赛克属性的阿尼】DynamiCrafter图生成视频动画工作流使用演示教程

DynamiCrafter是一个由腾讯、香港中文大学和北京大学联合研发的视频生成工具，它能够将静态图像转换为动画视频。这个工具利用了预训练的视频扩散先验，基于文本提示对开放域静止图像进行动画处理4。DynamiCrafter的关键思想是通过将图像合并到生成过程中作为指导，利用文本到视频扩散模型的运动先验。此外，DynamiCrafter支持高分辨率模型，提供更好的动态效果、更高的分辨率和更强的一致…...
- 4月22日
- 0
- 0
博主用EndlessDreams语音指导极速实时生成视频

EndlessDreams语音指导的实时视频，分辨率为 1280x1024。由博主的声音在 2 分钟内制作的 2 分钟以上的视频。很简单粗暴的首次使用。不需要渲染几个小时才能完成的 60 秒流畅视频，这是RT对隐藏在潜空间中一次珍贵的探索。 AIGC专区：https://heehel.com/category/aigc 更多作品：https://heehel.com/category/ai-…...
- 4月22日
- 0
- 2
Nothing Ear真无线降噪耳机：独特设计与ChatGPT智能融合，打造卓越听音与智能交互新体验

Nothing Ear是一款真无线降噪耳机，拥有独特的透明设计，展现了个性化的特点。它提供了出色的音质体验，无论是低音还是高音都表现得相当出色。同时，环境音增强的透明模式和降噪功能也让用户在不同场景下都能获得舒适的听音体验。Nothing公司将其新款无线耳机与ChatGPT技术相融合，使得用户能够通过简单的召唤，让ChatGPT即时回答各类问题或执行所需任务。 Nothing官网链接：https:…...
- 4月22日
- 0
- 0
Apple Vision Pro 在巴西医院的骨科手术中的辅助应用

Apple Vision Pro已应用于各个行业和娱乐领域。在医疗保健领域，Maçã 的混合现实（虚拟/增强）耳机也是医生在手术和其他程序中的绝佳盟友，该手术由南雅拉瓜 (SC) 雅拉瓜医院的骨科医生布鲁诺·戈巴托 (Bruno Gobbato) 和他的团队为一名肩袖撕裂（其中一侧肩肌腱受伤）的患者进行肩关节镜手术。在 Apple Vision Pro 中，使用了 3D 参考模型、用于访问检查（例…...
- 4月22日
- 0
- 0
Llama 3 8B 在 Raspberry Pi 5 上运行速度可以达到 1.89 个字符秒

树莓派（Raspberry Pi）是一种小型、低成本的单板计算机，由树莓派基金会开发。近年来，树莓派系列经历了多次更新和升级，以满足不同用户的需求。到了2023年9月底，树莓派5正式发布，带来了更多令人兴奋的功能和性能提升。例如，新增了PCI Express 2.0接口和支持高带宽外设的能力，MIPI接口带宽提升至1.5Gbps，以及新增的开关机按钮等。这些升级使得树莓派5成为一个功能更加强大和…...
- 4月22日
- 0
- 0
苹果取消电能新能源汽车工作，将团队转向生成人工智能部门

苹果公司的汽车制造项目，一项原被视为其历史上最雄心勃勃的计划之一，最近被宣布终止，这一决定在内部引起了不小的震动。周二，公司向参与该项目的近2000名员工透露了这一消息，使他们倍感惊讶。该消息并未公开，因此涉及此事的人士均要求保持匿名。更多消息： https://heehel.com/category/ai-news 据悉，这一决策是由首席运营官杰夫·威廉姆斯和负责汽车项目的副总裁凯文·林奇共同…...
- 4月21日
- 0
- 0
Meta Llama3 正式发布打脸李彦宏，成为迄今为止功能最强大的公开可用的 LLM 模型

彦宏桑刚说开源模型会越来越落后，就被Meta脸都打肿来。现在Meta Llama3最大的模型参数超过 400B，还在训练中，完成将会发布，还有多模态模型。他们的测试结果看，70B全面超越Gemini Pro 1.5以及Claude3 Sonnet。下面是博主op7418梳理的详细介绍：性能测试：在当前8B和70B参数规模中，预训练和指导微调模型表现出色，堪称业界最佳。经过对后期训练程序的优…...
- 4月21日
- 0
- 0