-
Google DeepMind对标Open AI的Sora推出:Veo视频模型
本次谷歌年度I/O开发者大会的重头戏——Veo视频模型,冲着Sora来的,商战真不容易,同类型新品发布晚了效果真的差很远。 Google DeepMind Veo视频模型是一个由Google DeepMind开发的先进视频生成模型,能够生成1080p高分辨率、长时长的高质量视频。Veo模型可以通过文本、图像或视频提示来指导其生成所需的视频内容,能够生成时长超过一分钟1080P分辨率的视频。此外,V…...- 0
- 0
-
外国VR大神使用 Quest 3 的Figmin XR 应用程序制作了能抓取页面物体的工具!
你认为这是一个正常的视频吗?他表示:“你以为这是哥的极限了吗?错!这才是个开始!5秒钟,让电子商务将永远改变混合现实!”简直就是网购界的大地震。 想象一下,一个工具它能够: 搜索任何网页。 物理抓取你想要的物品。 看看它“IRL(在现实世界里 IRL是in real life的首字母缩写,区别于通讯,网络互动或虚拟情景)”,看看它到底是什么。 2023年,Meta推出了Quest 3,这一新一代的…...- 0
- 0
-
上色AI工具DDColor:通过图生图的方法生成摄影级写实图片帮你上色
DDColor利用双解码器技术,能够精确地为黑白照片或动漫游戏场景上色,实现高度真实的图像效果。该技术突破了传统方法的局限,通过自主学习图片内容来决定颜色,减少了颜色错误的问题,使最终的图像色彩更丰富、更自然。这不仅为历史黑白照片赋予了新的生命,还为动漫和游戏爱好者带来了全新的视觉体验。上色能力弱的画手可以通过这个工具帮助自己上色,或者可以给黑白漫画上色变成彩漫。 项目及演示:https://mo…...- 0
- 0
-
【中文字幕】AI教程,学ComfyUI,你需要了解InstantID的一切
InstantID 是一款针对肖像的风格转换工具,让用户能够轻松地以特定风格创建合成作品。视频展示了如何改善肖像的相似度,如何制作包含多人的场景等内容。详细演示了在ComfyUI中使用 InstantID 进行肖像风格转换,以及如何应用于多人场景等技巧。 作者:matteo 编译:喜好儿网 InstantID 扩展 https://github.com/cubiq/ComfyUI_InstantI…...- 0
- 0
-
Ctrl-Adapter:融合ControlNet与扩散模型,实现视频生成的完美控制
项目地址:https://ctrl-adapter.github.io AIGC专区: https://heehel.com/category/aigc 工具箱: https://heehel.com/ai-tools#ai-3d Ctrl-Adapter,作为一个专为视频生成设计的Controlnet,赋予各种图像和视频扩散模型丰富的控制功能,并优化了视频的时间对齐。它具备多项强大能力,包括图像…...- 0
- 0
-
福布斯杂志作法现场 2024 年 AI 十大终极预测,来年人工智能领域的发展会怎么样?
《福布斯》(Forbes)是美国福布斯公司的一本商业杂志。该杂志每两周发行一次,以金融、工业、投资和营销等主题的原创文章著称。福布斯还报道技术、通信、科学和法律等领域的内容。 2024年的AI前景预测显示福布斯杂志认为Stability AI可能会倒闭,微软和OpenAI可能会有分歧。新的职位Chief AI Officer可能会兴起,而是否会出现足以取代Transformer的新架构仍是未知。 …...- 0
- 0
-
CameraAI——实时生成图像AI工具,世界上的另一个我
在线使用网址:https://www.fal.ai/camera AIGC专区:https://heehel.com/category/aigc 一个很好玩的实时图像生成工具,用摄像头进行输入,以30+fps AI实时生图,就能把你变成另一个人,可以使用提示词控制你想要生成什么图像或者模仿谁谁谁。 有个老哥把自己变成艾隆·马克斯。 https://heehel.com/aigc/yiyan-bai…...- 0
- 0
-
【坏心眼猫特效】fooocus inpaint comfyUI工作流 遮罩重绘优化
「ComfyUI遮罩重绘优化工作流」夸克网盘备用链接: https://pan.quark.cn/s/b9dc5cf0d406 fooocus_inpaint模型地址:https://huggingface.co/lllyasviel/fooocus_inpaint/tree/main Inpaint-Anything是一个功能强大且易于操作的图像修复工具,在实际应用中,Inpaint-Anyth…...- 0
- 0
-
【AI论文与新生技术】Shape of Motion:从单个视频进行 4D 重建通用动态场景的方法
由于任务的高度不适定性质,单眼动态重建是一个具有挑战性且长期存在的视觉问题。现有方法的局限性在于它们要么依赖于模板,要么仅在准静态场景中有效,要么无法显式地对 3D 运动进行建模。 在这项工作中,我们介绍了一种能够从随意捕捉的单眼视频中重建通用动态场景的方法——Shape of Motion,该场景具有明确的、全序列长的 3D 运动。我们通过两个关键见解来解决该问题的约束不足性质:首先,我们通过使…...- 0
- 0
-
Solos公司推出集成ChatGPT-4o的智能眼镜Solos AirGo Vision
香港智能眼镜峰会上,Solos公司发布了其革命性产品——Solos AirGo Vision智能眼镜。这款眼镜是全球首款集成了先进的ChatGPT-4o人工智能技术的可穿戴设备,能够根据用户的视觉输入和环境识别提供实时语音回答。 AirGo Vision智能眼镜采用创新的模块化设计,用户可以根据个人喜好更换不同风格的镜框。它不仅具备LED通知灯,还整合了Google Gemini和Anthropi…...- 0
- 0
-
从自制AI有声绘本到OpenAI的API革命:未来儿童文学的变革
博主Gorden Sun今年3月份的时候,用各种AI工具组合,做了一个AI有声绘本,现在 OpenAI 开放了一系列 API,只使用 OpenAI 的API 就能实现有声绘本了。他表示,如果结合 Assistants API 和 vision API,可以实现的更多。 博主分享的绘本生成大致流程为: 1.先人工讲一个故事,输入到智能音箱/APP程序中。 2.智能音箱/APP程序将音频文件通过Whi…...- 0
- 0
-
【AI论文与新生技术】CosyVoice:基于监督语义标记的可扩展多语言零样本文本转语音合成器
近年来,基于大语言模型(LLM)的文本转语音(TTS)因其高自然度和零样本能力而成为主流。在此范例中,语音信号被离散化为令牌序列,这些序列由 LLM 以文本作为提示进行建模,并由基于令牌的声码器重构为波形。显然,语音标记在基于 LLM 的 TTS 模型中发挥着至关重要的作用。 当前的语音标记是以无监督的方式学习的,缺乏明确的语义信息和与文本的对齐。在本文中,我们建议用有监督的语义标记来表示语音,这…...- 0
- 0
-
程序员福利——Stability AI发布 Stable Code 3B编程辅助工具AI模型,支持18种编程语言
Stable Code 3B是一款卓越的编程辅助工具,它能够在普通的笔记本电脑上流畅运行,甚至包括那些没有专用GPU的设备,如MacBook Air。这一突破性的技术让编程不再局限于高性能的计算机设备,为广大的程序员带来了极大的便利。 详细介绍:https://stability.ai/news/stable-code-2024-llm-code-completion-release 模型下载:h…...- 0
- 0
-
大型科技竞争迫在眉睫,Pika、Runway等人工智能视频初创公司竞相领先
Pika 是一家视频生成初创公司,在最新一轮融资中筹集了 8000 万美元,该公司已经拥有一款公开可用的产品,但 OpenAI 和 Google 一直对其保密。 旧金山——随着风险资本投资者继续向试图与行业重量级 OpenAI 和谷歌竞争的人工智能初创公司投入数十亿美元,人工智能视频生成初创公司 Pika 筹集了 8000 万美元。 AIGC专区: https://heehel.com/categ…...- 0
- 0
-
【Ai绘画小猪】手把手教你AI动画,Stable Diffusion零基础到进阶全流程系列教学:打造无闪烁丝滑AI动画!
这篇文章是关于 AI动画的教学视频,介绍了如何利用 AI 技术制作流畅的动画作品。视频中展示了使用 Stable Diffusion 技术进行 AI 绘画的全流程教学,从零基础到进阶的教学内容,包括安装包的下载和安装、AI 绘画工具的使用等。通过学习这些内容,可以打造无闪烁丝滑的 AI 动画作品。 教程专区: https://heehel.com/category/ai-tutorial Stab…...- 0
- 0
-
【央视频】首部AI全流程微短剧《中国神话》第一集《补天》
神话故事里,女娲创造了人类。当灾难来临,女娲又化身彩石,修补天空裂缝。现在,我们面临着臭氧层空洞等环境危机,全球人类共同“补天”!随着臭氧层空洞被逐渐修补,人类再次看到了希望的曙光......中国首部AI全流程微短剧《中国神话》第一集上线,来央视频一起换个角度看神话! 更多作品: https://heehel.com/category/ai-works AIGC专区: https://heehel…...- 0
- 0
-
【AI0x0】AI 0x0 通用型AI生成工具:输入模式演示与教程
AI 0x0 是一个桌面端的多模态多模型通用型AI生成助手应用,支持在 mac 端和 win 端安装使用。它可以让您在任意桌面软件上使用 AI 能力来查询生成文本、图片、音频和视频等多种模态数据,帮助您更高效地完成工作。 夸克网盘安装包下载链接:https://pan.quark.cn/s/8544fbfaf96a 工具箱: https://heehel.com/ai-tools#ai-3d AI…...- 0
- 0
-
阿里新的AI生成视频技术被字节跳动给秒了!
https://heehel.com/ai-news/reference-net.html 前几天,阿里推出一张照片就能生成动画视频的AI框架,然而就在大家都期待何时公布代码时,字节跳动直接放出了名为MagicAnimate的动画框架,并提供代码,热度一下子盖过阿里的Reference Net。 MagicAnimate,是基于扩散模型的人体图像动画框架。与其他基线方法进行了比较,这种AI模型能够…...- 0
- 0
-
【图文教程#9】midjourney表情包快速制作教程
作者:添澎AI绘画设计 原文链接:https://www.xiaohongshu.com/explore/664c536e0000000005005c13 使用AI绘画工具如Midjourney来制作可爱猫猫狗狗的表情包,无疑是一种创新且富有潜力的艺术和技术融合。这种趋势不仅展示了人工智能在艺术领域的巨大潜力,同时也为表情包文化注入了新的活力和创意。 Midjourney专区: https://h…...- 0
- 0
-
用WonderJourney将一张爱丽丝梦游仙境图片转成3D场景
WonderJourney,一个用于永久 3D 场景生成的模块化框架。与之前专注于单一类型场景的视图生成工作不同,从用户提供的任何位置(通过文本描述或图像)开始,并通过一系列不同但连贯的 3D 场景生成一个旅程。利用 LLM 生成此旅程中场景的文本描述,利用文本驱动的点云生成管道来制作引人注目且连贯的 3D 场景序列,并利用大型 VLM 来验证生成的场景。在不同的场景类型和风格中展示…...- 0
- 0