全部标签

AIGC

最新随机最多浏览最多喜欢最多评论

分类：
AI+3D AI+图片生成 AI+文本/音频生成 AI+视频生成

空间计算与增强现实的结合：创新练习工具震撼登场

空间计算技术与增强现实的结合正为音乐领域带来惊人的变革。外国创造者、工程师、投资者Bilawal Sidhu和AR，3D艺术家，联合创始人Sergei Galkin携手合作，共同打造了一款超级强大的设备，为用户提供了独特而高效的练习体验。而增强现实（Augmented Reality，简称AR）技术是一种基于计算机实时计算和多传感器融合，将现实世界与虚拟信息结合起来的技术。该技术通过对人的视觉、听…...
- 23年11月15日
- 0
- 0
Music ControlNet：时变控制的创新音乐生成模型

随着文本到音乐生成模型的发展，如今我们能够欣赏到各种风格的高质量AI人工智能生成的音乐音频。然而，目前的文本控制主要局限于处理全局音乐属性，如流派、情绪和速度，对于时变属性的精确控制，例如节拍在时间中的位置或音乐的动态变化，存在一定的不足。为了弥补这一缺陷，Music ControlNet的团队提出了一种创新的音乐生成模型，称之为Music ControlNet，它基于扩散技术，可以对生成的音频进…...
- 23年11月15日
- 0
- 0
Endless Zoom：潜在一致性模型(LCMs)图像无限扩充技术

Endless Zoom凭借其潜在一致性模型（LCMs）正拓宽AI图像生成领域的范围，这一创新AI人工智能技术让图像的无限扩充成为可能，通过LCMs的快速图像生成能力，用户可以体验到连续的、无缝连接的图像内容，实现了“无限扩充”的引人注目的效果。 LCMs作为基于AI绘画工具Stable Diffusion的图像生成人工智能绘画模型的进化版本，突破了传统生成模型的限制，以惊人的速度在4到8步之间生…...
- 23年11月15日
- 0
- 0
Move Ai：引领数字创作新潮流的人工智能动作捕捉软件

在当今数字化风潮中，人工智能技术正迅速渗透到各行各业，为创作者们带来了前所未有的创作力和表达方式。其中，一款名为Move Ai的人工智能驱动的动作捕捉软件正崭露头角，以其卓越的技术和无限的创作潜力成为创作者们的新宠。 Move Ai的独特之处在于其专利的人工智能技术，该技术能够从任何视频中提取高保真度的动作。这项创新使创作者们能够轻松捕捉各种动作，并在数字世界中重新构思和表达这些动作…...
- 23年11月15日
- 0
- 0
谷歌携手 UC 伯克利抛出王炸 IGN：要取代扩散模型，可单步生成逼真图像

谷歌近日携手加州大学伯克利分校（UC Berkeley），研发出了可取代AI人工智能扩散模型（Diffusion Models）的全新生成式 AI 方法--幂等生成网络（IGN）。包括生成对抗网络（GAN）、扩散模型（Diffusion Models）和今年3月 OpenAI 发布的一致性模型（Consistency Models）在内，当前主流生成式 AI 模型都是随机噪点、草图或者低分辨率或其…...
- 23年11月14日
- 0
- 0
香水爱好者用Midjourney+PikaLabs生成AI香水产品宣传广告视频短片《海市蜃楼系列香水》

该作者非常喜欢香水广告，于是。。。自己用AI工具随手做了一款。。。 Pika Labs和RunwayML是两个用于机器学习和人工智能的工具，同时也是目前在AI视频生成领域中“抗衡着”的对手。 Pika Labs是一个基于云的机器学习平台，它提供了一个简单易用的界面，使用户能够进行数据预处理、模型训练和部署。Pika Labs适用于初学者和非技术人员，他们可以使用它来构建和部署自己的机器学习模型，而…...
- 23年11月14日
- 0
- 0
国外小伙用RunwayGen2耗时38小时生成AI高清情感MV

Runway Gen-2与Stable Diffusion类似，属于一种扩散模型，它通过学习如何逐步减少起始图像中的噪声，使图像逐步接近给定的提示。扩散模型通过对数百万到数十亿的示例进行训练来获取这种能力。据Runway介绍，在一篇详细描述Gen-2架构的学术论文中，该模型是在一个包含2.4亿张图片和640万个视频片段的内部数据集上进行训练的。这一模型的核心思想是借助大规模的数据集，通过逐步学习…...
- 23年11月14日
- 0
- 0
AI提示词（第17辑）有用上帝视角见过你城市风雨中的模样吗，快来试试这组提示词！

风暴来临！为你的城市添加闪电风暴，一起用鸟瞰视角来看看它们在风雨中伫立的英姿吧~ Midjourney是一款AI人工智能制图工具，只要关键字，就能透过AI算法生成相对应的图片，只需要不到一分钟。可以选择不同画家的艺术风格，例如安迪华荷、达芬奇、达利和毕加索等，还能识别特定镜头或摄影术语。有别于谷歌的 Imagen和OpenAI的DALL·E，Midjourney是第一个快速生成AI制图并开放予大众…...
- 23年11月14日
- 0
- 0
AI VoiceOver：OpenAI的GPT-4V API和TTS为视频提供智能语音解说

近期，借助OpenAI的GPT-4V API和TTS技术，一种新的AI VoiceOver服务正逐渐崭露头角，为视频内容提供自动生成的语音解说。这项服务的操作简便，用户只需上传不超过100MB的视频文件，系统将自动进行内容分析和识别。接着，AI人工智能系统自动生成相应的解说词，并将其转化为语音，为视频自动添加生动的语音解说。这一技术的背后倚靠OpenAI的强大GPT-4V API，该API在理解…...
- 23年11月14日
- 0
- 0
【AI硬件】D-POINT：创新数字手写笔，实现六自由度输入

D-POINT是一款人工智能领域创新的数字硬件手写笔，采用开源设计，利用摄像头跟踪和惯性测量技术实现了6DoF（六自由度）输入。这使得它能够在空间中准确跟踪笔的位置和方向，并在数字设备上生成相应的输入。以下是该手写笔的关键特点和设计方案：特点和优势：六自由度输入： D-POINT实现了高度精确的6DoF输入，使用户能够在数字界面上进行更自然和精准的手写和绘图操作。平面通用性：该手写笔可以在任…...
- 23年11月14日
- 0
- 0
外国独立电影制片人使用pika_labs制作了一部科幻大片！

Daniił Vołkaū是一位国外的独立电影制片人，正在探索如何将人工智能方法带入电影行业标准 Pika Labs是一款新的AI人工智能文本转视频工具，它可以根据简单的文本提示创建视频和动画。这个工具被网友评价为“目前全球最好用的文本生成视频AI"，引起了广泛的关注。使用Pika Labs，用户只需提供一些简单的文本提示，就可以生成精美的视频和动画内容。这种功能对于那些没有专业视频制作…...
- 23年11月13日
- 0
- 0
Motif模型：利用LLM反馈的强化学习，助力AI代理迅速适应新环境

Meta AI和加拿大麦吉尔大学共同开发了一种新型AI人工智能模型——Motif，Motif模型的核心原理在于利用大型语言模型（LLM）的反馈来训练AI代理，以帮助其更快地学习和适应新环境。在新环境中，由于AI代理缺乏必要的知识来做出正确的决策，Motif通过充分利用LLM的知识储备，使AI代理能够更迅速地学习和适应新环境，并做出明智的决策。 Meta AI是一个学术研究实验室，致力于为AI社区提…...
- 23年11月13日
- 0
- 0
【AI教程】Midjourney v5.2风格调谐器指南（为电影超逼真创建自己的一致风格）

Midjourney是一款AI制图工具，只要关键字，就能透过AI人工智能算法生成相对应的图片，只需要不到一分钟。可以选择不同画家的艺术风格，例如安迪华荷、达芬奇、达利和毕加索等，还能识别特定镜头或摄影术语。有别于谷歌的 Imagen和OpenAI的DALL．E，Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台。Midjourney的主要原理是通过收集大量已有的作品数据，对这些…...
- 23年11月13日
- 0
- 0
AI提示词（第16辑）包豪斯bauhaus风格纹样大家觉得怎么样？

Midjourney是一款AI制图工具，只要关键字，就能透过AI算法生成相对应的图片，只需要不到一分钟。可以选择不同画家的艺术风格，例如安迪华荷、达芬奇、达利和毕加索等，还能识别特定镜头或摄影术语。有别于谷歌的 Imagen和OpenAI的DALL．E，Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台。Midjourney的主要原理是通过收集大量已有的作品数据，对这些数据进行…...
- 23年11月13日
- 0
- 0
AI提示词（第15辑）Remix+MixerAN模型生成彩漫风AI插图

所属工具：Remix Remix是一款AI绘画应用，可以通过智能算法来辅助用户创作绘画，利用AI技术改善用户的绘画质量。它的主要功能是可以给出画布上的纹理和样式的改善，为你的画作制作出更加精美的表现效果。提示词公式： comic portrait drawing of a [主题] | stoic, [发型] haircut | front view, monochromatic [颜色] an…...
- 23年11月13日
- 0
- 0
前苹果公司工程总监和设计师推出AI pin，全球首个可穿戴AI智能硬件产品

Humane AI Pin是一款由苹果公司前软件工程总监Bethany Bongiorno和设计师Imran Chaudhri组成的团队开发的创新产品，被誉为全球首个可穿戴人工智能硬件。与其他智能设备不同，AI Pin无需任何唤醒词即可始终保持在线状态。它采用了无屏幕设计，完全依靠语音控制，内置了一枚1300万像素的超广角相机和多种传感器，并且整个系统由AI驱动。采用安全的激光墨投影专利显示技术…...
- 23年11月13日
- 0
- 0
海外小哥用AnimateDiff制作的AI动图艺术，两分钟的视觉盛宴！

AnimateDiff 是一款强大的工具，它允许您轻松地将文本转化为动画图像，而无需特定的调整。它为用户提供了无限的创意和探索空间，让您可以将文本描述转化为令人惊叹的动画场景。它的优势在于将真人电影视频转换成的动画，在激烈的动作下，视频依然可以异常的稳定。我动画行业的朋友告诉我，制作这种特效转场动画，往往需要一个团队好几天的工作量。...
- 23年11月13日
- 0
- 0
实时人体姿态评估AI模型YOLO-NAS Pose能够快速识别动作姿势生成骨架图

实时人体姿态评估AI模型YOLO-NAS Pose，它主要功能是能快速识别图片和视频中人类的动作姿势，能够快速找到网络结构，提高肢体的准确性，用于训练基于 PyTorch 的计算机视觉模型。允许你仅使用一个训练库，就所有最常用的计算机视觉任务训练或微调 SOTA 预训练模型。在自上而下的方法中，对象检测模型用于识别感兴趣的对象，例如人或汽车，并且使用单独的姿态估计模型来估计对象的关键点。相比之下…...
- 23年11月13日
- 0
- 0
网友分享一个使用AnimateDiff制作的可爱鼠妹跳舞

网友使用AnimateDiff制作可爱鼠妹跳舞的视频，里面有用了多个控制网络（lineart_anime、IP2P、Openpose、ref）的 animatediff-cli-travel-prompt，然后有一个upscale选项。 AnimateDiff是一个Text-to-Image Diffusion框架，通过将文本转化为个性化的动画图像，实现了二次元ai动漫风格视频效果。它的主要特点是…...
- 23年11月13日
- 0
- 0
复刻"钢铁侠"里的贾维斯？外网开发者成功打造名为Jarvis的图像处理系统

外网网友成功搭建了一款名为Jarvis的图像处理系统。这一系统采用完全开源的模型，并在他的本地机器上运行，不依赖于外部API，也没有使用OpenAI的服务。通过引入一系列优化，他成功使系统更加实时。现在，用户可以通过语音命令进行实时图像搜索、图像选择、图像隔离，甚至进行图像修复。此外，用户还可以与图像进行交互，并将它们自动分享到社交媒体平台。在演示视频中，展示的所有内容都是一次性拍摄的。为了减少视…...
- 23年11月13日
- 0
- 0