全部标签

AIGC

最新随机最多浏览最多喜欢最多评论

分类：
AI+3D AI+图片生成 AI+文本/音频生成 AI+视频生成

微软推出创新语音技术：Personal Voice AI语音即将上线

微软最新推出的Personal Voice AI人工智能语音技术引起了广泛关注。通过提供仅需1分钟语音样本，该技术能在几秒钟内克隆并复制出一模一样的AI语音。更令人惊叹的是，生成的AI语音支持包括中文、西班牙语、德语等在内的多达100种不同语言。为保障用户信息的私密安全，Personal Voice采用了设备端机器学习技术。与此同时，该技术与LiveSpeech实现了无缝集成，用户可以在与他人交…...
- 23年11月17日
- 0
- 0
Deemos Tech的Audio2Face：文字生成超真实的3D头像模型

基于扩散的 Audio2Face 即将登陆 ChatAvatar（ChatAvatar是一个基于DreamFace开发的平台，它可以通过文本提示生成可动画的高分辨率3D头像。使用了生成式AI的技术，结合了深度学习的语言模型，让用户可以用自然语言描述想要的3D头像的外貌、特征、表情和风格。）可以从文字、照片或艺术到超逼真的 3D 头像，具有定义明确的 UV、绑定和 PBR 纹理。正在准备好通过音乐同…...
- 23年11月17日
- 0
- 0
创意软件A股上市公司万兴科技近日发布了AI工具万兴播爆Wondershare Virbo数字人短视频出海营销神器

创意软件A股上市公司万兴科技近日发布了名为"万兴播爆"（Wondershare Virbo）的AIGC（Artificial Intelligence Generated Content）"真人"短视频出海营销AI神器，并宣布正式开启移动端公测。据介绍，这一创新工具无需外籍演员出镜，用户只需调用万兴播爆中的场景化模板和多国籍AI数字人功能，几分钟内便可一键生…...
- 23年11月17日
- 0
- 0
Google Deepmind 和 YouTube 推出音乐生成模型：Lyria

最新音乐生成AI模型Lyria展现了其多才多艺的创作能力。Lyria不仅能够生成高质量音乐，涵盖乐器和人声，同时还能保持音乐的连续性，特别擅长处理短语、诗句或扩展段落中的音乐结构。该AI工具支持多种音乐类型，包括重金属、Bbox和歌剧等，同时维持着对节奏、旋律和人声的复杂性。用户还可以精细控制输出音乐的风格和表现形式，使创作过程更富有个性化和灵活性。 AI人工智能驱动的音乐生成界面提升了音乐创作…...
- 23年11月17日
- 0
- 0
Omnivore：Readwise替代品，沉浸式翻译与超真实语音朗读，为用户带来新颖阅读体验

"近日，一款号称是Readwise的免费替代软件——Omnivore，在用户安装了插件后，提供了一种新颖的阅读体验。首先，用户可利用AI人工智能技术的沉浸式翻译功能将英文文章翻译成中文，然后通过Omnivore进行收藏。令人惊喜的是，在手机端的Omnivore阅读应用中，该软件正在进行超真实语音朗读的测试。用户可以根据个人偏好设置，享受中英文双语的朗读体验。这一功能让用户不仅能够在沉浸…...
- 23年11月17日
- 0
- 0
【AI教程】如何使用SadTalker用音频让你的AI图像栩栩如生详细教学

SadTalker是一个由西安交通大学、腾讯AI实验室、蚂蚁集团联合开发的AI人工智能开源项目，其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之，它能够将一张静态的肖像图片和一段音频融合，通过AI生成一个逼真的说话头像视频，仿佛让一张照片变得“会说话”，有一种很不明觉厉的视觉效果。这个教学视频演示了如何通过使用SadTalker的开源项目创建会说话的主播头…...
- 23年11月16日
- 0
- 0
媲美photoshop beta AI功能，Stability AI Clipdrop 新增图像扩展功能：Uncrop

clipdrop.co是一个AI设计编辑工具平台，同时有苹果版，安卓版手机APP，提供了多种基于AI的图片编辑工具，如AI抠图去除背景，图像无损放大，AI绘画文本到图像，替换背景，文本去除，重新打光（重铸灯光）等。能够帮助用户在几秒钟内创建令人惊叹的视觉图片效果。 Stability AI旗下Clipdrop推出Uncrop（支持中文版），这是一款终极AI人工智能纵横比编辑器，它可以实现和新版PS…...
- 23年11月16日
- 0
- 0
建模师狂喜！MeshNCA AI可以在3D网格上合成动态纹理，无需UV贴图！

一个名为 Mesh Neural Cellular Automata（MeshNCA）的方法，用于在 3D 网格上直接合成纹理。它的作用是增强虚拟环境的真实感，并可以用于实时和交互式AI应用。具体来说，MeshNCA 可以通过示例纹理图像或文本提示来合成纹理，并且可以根据目标矢量场合成跟随目标运动的AI动态纹理。令人惊讶的是，在训练一个 Icosphere 网格后，MeshNCA 可以泛化到几乎…...
- 23年11月16日
- 0
- 0
AI代理模型JARVIS-1在Minecraft（我的世界）游戏中测试表现出色

ARVIS-1 是一个开放式多任务代理，可以在 Minecraft 中感知多模态输入，包括视觉观察和人类指令，生成复杂的计划并执行具体控制。它是基于预训练的多模态语言模型开发的，该模型可以将视觉观察和文本指令映射到计划，并将计划发送给控制器来执行。JARVIS-1 还配备了一个多模态内存，可以利用预先训练的知识和实际游戏经验进行规划。例如：能够根据玩家的指令去挖掘特定的资源或建造结构。 JARV…...
- 23年11月16日
- 0
- 0
网友开始卷RunwayML，高质量AI视频动画作品集欣赏

RunwayML的Gen-2代表了人工智能辅助视频生成的重大飞跃，为用户提供了无需参考图像或源视频从零开始创建视频的能力。这种生成式AI人工智能解决方案扩展了Gen-1的功能，使用户能够制作具有更高真实性的视频，并且提高了创作的自由度，被网友一度称为文字生成视频动画最强AI工具。自从runwayML上周更新gen2新功能后，网友纷纷开始使用AI工具创作自己喜欢的AI视频作品，从科幻到魔幻题材，…...
- 23年11月16日
- 0
- 0
AI绘画工具KREA新特性，随意涂鸦实时生成作品

KREA是一款AI绘画图片prompt提示关键词搜索共享平台，它能够帮助创作者利用AI生成的图像来激发灵感，提高效率，拓展想象力。通过机器学习算法从大量数据中学习，并提供准确的预测和决策支持。用户只需要在画布上随意的起草稿，它便能实时地根据草稿造型进行联想，同时生成与提示词相应的图像，它的强大之处是可以实时根据用户在修改过程中进行逐张生成，不管是改变颜色，改变造型或改变主体，它都能按照原提示词的…...
- 23年11月16日
- 0
- 0
RunwayML生成大自然逼真AI动态纪录片用素材

RunwayML的Gen-2代表了人工智能辅助视频生成的重大飞跃，为用户提供了无需参考图像或源视频从零开始创建视频的能力。这种生成式AI人工智能解决方案扩展了Gen-1的功能，使用户能够制作具有更高真实性的视频，并且提高了创作的自由度，被网友一度称为文字生成视频动画最强AI工具。虽说还没能完全代替真实生物，但能生成很多过场素材，比较抽象的转场素材，就已经给纪录片制作者省下非常多的时间。...
- 23年11月16日
- 0
- 0
新兴3D创作软件Spline加入了AI驱动实时3D渲染

新兴3D创作软件Spline加入了AI驱动的3D高斯溅射方法，这是一种新的体积渲染方式，可以将现实生活中的数据捕获到 3D 空间中，并实时渲染。它类似于 Radiance Field 方法，但设置速度更快，渲染速度更快，同时提供相同或更好的质量。这个方法的结果被称为Splats，它们可以通过拖放文件或使用移动应用程序来创建和导入。您可以使用 Polycam 或 Luma 等应用程序创建Splat…...
- 23年11月16日
- 0
- 0
南开大学与字节跳动共同开发在线生成LLM（语言模型）增强人物开源AI工具ChatAnything

ChatAnything 是一个由南开大学与字节跳动共同开发的在线生成 LLM（语言模型）增强人物角色的开源AI工具。它可以根据文本描述生成包括外观、个性和语调在内的拟人化AI角色。ChatAnything 利用 LLM 的上下文学习能力，通过设计一组系统提示来生成角色的个性。同时，它引入了两个创新概念：声音混合（MoV）和外观混合（MoD）来实现多样化的声音和外观生成。MoV 利用文本转语音（…...
- 23年11月16日
- 0
- 0
四种适合stable diffusion XL且不需要图像精炼的AI模型，Civitai免费下载网址

Stable Diffusion XL 简称SDXL，是最新的文本生成图像AI工具版本，它几乎可以生成任何艺术风格的高质量图像，是图像生成的最佳开源模型。但在生成过程中往往需要精炼器的二次加工，但这并不妨碍SD爱好者的脚步，一些不需要精炼的AI模型油然而生，这些模型以创造各种艺术风格而闻名，包括照片级写真肖像、超现实建筑、3D艺术、数字绘画等等。 C站（Civitai ）官方下载网址 DynaVi…...
- 23年11月16日
- 0
- 0
科学家成功提出首个实时渲染的可驱动人体3D模型 D3GA

在一项最新的研究中，科学家们成功提出了可驱动的3DGaussian Avatars（D3GA），这是首个采用高斯飞溅渲染技术的人体3D可控模型。与当前的可驱动化身模型需要在人工智能训练期间进行准确的3D配准或测试期间需要密集输入图像的方法不同，该研究采用了最新的3D高斯展开（3DGS）技术，能够通过使用密集校准的多视图视频作为输入，在实时帧速率下渲染逼真的人体。为了实现模型的变形，研究团队摒弃了…...
- 23年11月16日
- 0
- 0
Stable Diffusion Deforum AI插件3D动画制作完全新手系列教程，从零开始学会使用Deforum

Deforum 是一种使用 Stable Diffusion 创建动画视频的工具。您只需要提供有关相机移动方式的提示和设置。 Deforum是用于制作动画的开源和免费软件。它使用 Stable Diffusion 的图像到图像功能生成一系列图像并将它们拼接在一起以创建视频。它对图像帧应用小的变换，并使用图像到图像功能创建下一帧。由于帧之间的变化很小，因此会产生连续视频的感觉。抖音（tiktok…...
- 23年11月16日
- 0
- 0
Stable Diffusion Deforum ai插件3D动画（动漫效果）视频制作，常见问题汇总解答及两个设定档分享

Deforum 是一种使用 Stable Diffusion 创建动画视频的工具。您只需要提供有关相机移动方式的提示和设置。 Deforum是用于制作动画的开源和免费软件。它使用 Stable Diffusion 的图像到图像功能生成一系列图像并将它们拼接在一起以创建视频。它对图像帧应用小的变换，并使用图像到图像功能创建下一帧。由于帧之间的变化很小，因此会产生连续视频的感觉。抖音（tiktok…...
- 23年11月16日
- 0
- 0
Polycam发布免费3D建模工具，支持多设备快速生成高质量三维模型

Polycam（Polycam是一款使用LiDAR人工智能技术的3D扫描和摄影测量应用程序，可用于iPhone、iPad、Android和Web，Polycam也拥有自己的网站）最近发布了一款免费的3D建模工具，该工具支持手机、平板电脑、摄像机以及无人机进行物体、地形或结构的3D捕捉。用户可以使用任何设备，通过上传至少20张照片或至少20秒的视频，使用摄影测量技术迅速生成高质量的三维模型。这一工具…...
- 23年11月16日
- 0
- 0
Story-to-Motion项目——无限延长角色动画的文本驱动生成工具

商汤科技研究院最新发布的AI人工智能项目Story-to-Motion在文本驱动AI动画生成领域取得了重大突破。该系统能够处理复杂的文本描述，并将其转换为具体的动作和位置信息，不仅能生成单一动作，还能连续地生成一系列动作，创造出连贯的动画效果。最引人注目的特点之一是，Story-to-Motion可以生成无限长的角色动画。这意味着，只要提供的文本故事足够长且内容连续，系统就能持续根据文本内容生成相…...
- 23年11月16日
- 0
- 0