-
微软推出创新语音技术:Personal Voice AI语音即将上线
微软最新推出的Personal Voice AI人工智能语音技术引起了广泛关注。通过提供仅需1分钟语音样本,该技术能在几秒钟内克隆并复制出一模一样的AI语音。更令人惊叹的是,生成的AI语音支持包括中文、西班牙语、德语等在内的多达100种不同语言。 为保障用户信息的私密安全,Personal Voice采用了设备端机器学习技术。与此同时,该技术与LiveSpeech实现了无缝集成,用户可以在与他人交…...- 0
- 0
-
Deemos Tech的Audio2Face:文字生成超真实的3D头像模型
基于扩散的 Audio2Face 即将登陆 ChatAvatar(ChatAvatar是一个基于DreamFace开发的平台,它可以通过文本提示生成可动画的高分辨率3D头像。使用了生成式AI的技术,结合了深度学习的语言模型,让用户可以用自然语言描述想要的3D头像的外貌、特征、表情和风格。)可以从文字、照片或艺术到超逼真的 3D 头像,具有定义明确的 UV、绑定和 PBR 纹理。正在准备好通过音乐同…...- 0
- 0
-
创意软件A股上市公司万兴科技近日发布了AI工具万兴播爆Wondershare Virbo数字人短视频出海营销神器
创意软件A股上市公司万兴科技近日发布了名为"万兴播爆"(Wondershare Virbo)的AIGC(Artificial Intelligence Generated Content)"真人"短视频出海营销AI神器,并宣布正式开启移动端公测。据介绍,这一创新工具无需外籍演员出镜,用户只需调用万兴播爆中的场景化模板和多国籍AI数字人功能,几分钟内便可一键生…...- 0
- 0
-
Google Deepmind 和 YouTube 推出音乐生成模型:Lyria
最新音乐生成AI模型Lyria展现了其多才多艺的创作能力。Lyria不仅能够生成高质量音乐,涵盖乐器和人声,同时还能保持音乐的连续性,特别擅长处理短语、诗句或扩展段落中的音乐结构。 该AI工具支持多种音乐类型,包括重金属、Bbox和歌剧等,同时维持着对节奏、旋律和人声的复杂性。用户还可以精细控制输出音乐的风格和表现形式,使创作过程更富有个性化和灵活性。 AI人工智能驱动的音乐生成界面提升了音乐创作…...- 0
- 0
-
Omnivore:Readwise替代品,沉浸式翻译与超真实语音朗读,为用户带来新颖阅读体验
"近日,一款号称是Readwise的免费替代软件——Omnivore,在用户安装了插件后,提供了一种新颖的阅读体验。首先,用户可利用AI人工智能技术的沉浸式翻译功能将英文文章翻译成中文,然后通过Omnivore进行收藏。令人惊喜的是,在手机端的Omnivore阅读应用中,该软件正在进行超真实语音朗读的测试。用户可以根据个人偏好设置,享受中英文双语的朗读体验。 这一功能让用户不仅能够在沉浸…...- 0
- 0
-
【AI教程】如何使用SadTalker用音频让你的AI图像栩栩如生详细教学
SadTalker是一个由西安交通大学、腾讯AI实验室、蚂蚁集团联合开发的AI人工智能开源项目,其旨在通过AI学习真实的3D运动系数来支持风格化的音频驱动的单图像说话面部动画。简而言之,它能够将一张静态的肖像图片和一段音频融合,通过AI生成一个逼真的说话头像视频,仿佛让一张照片变得“会说话”,有一种很不明觉厉的视觉效果。 这个教学视频演示了如何通过使用SadTalker的开源项目创建会说话的主播头…...- 0
- 0
-
媲美photoshop beta AI功能,Stability AI Clipdrop 新增图像扩展功能:Uncrop
clipdrop.co是一个AI设计编辑工具平台,同时有苹果版,安卓版手机APP,提供了多种基于AI的图片编辑工具,如AI抠图去除背景,图像无损放大,AI绘画文本到图像,替换背景,文本去除,重新打光(重铸灯光)等。能够帮助用户在几秒钟内创建令人惊叹的视觉图片效果。 Stability AI旗下Clipdrop推出Uncrop(支持中文版),这是一款终极AI人工智能纵横比编辑器,它可以实现和新版PS…...- 0
- 0
-
建模师狂喜!MeshNCA AI可以在3D网格上合成动态纹理,无需UV贴图!
一个名为 Mesh Neural Cellular Automata(MeshNCA)的方法,用于在 3D 网格上直接合成纹理。它的作用是增强虚拟环境的真实感,并可以用于实时和交互式AI应用。 具体来说,MeshNCA 可以通过示例纹理图像或文本提示来合成纹理,并且可以根据目标矢量场合成跟随目标运动的AI动态纹理。令人惊讶的是,在训练一个 Icosphere 网格后,MeshNCA 可以泛化到几乎…...- 0
- 0
-
AI代理模型JARVIS-1在Minecraft(我的世界)游戏中测试表现出色
ARVIS-1 是一个开放式多任务代理,可以在 Minecraft 中感知多模态输入,包括视觉观察和人类指令,生成复杂的计划并执行具体控制。它是基于预训练的多模态语言模型开发的,该模型可以将视觉观察和文本指令映射到计划,并将计划发送给控制器来执行。JARVIS-1 还配备了一个多模态内存,可以利用预先训练的知识和实际游戏经验进行规划。 例如:能够根据玩家的指令去挖掘特定的资源或建造结构。 JARV…...- 0
- 0
-
网友开始卷RunwayML,高质量AI视频动画作品集欣赏
RunwayML的Gen-2代表了人工智能辅助视频生成的重大飞跃,为用户提供了无需参考图像或源视频从零开始创建视频的能力。 这种生成式AI人工智能解决方案扩展了Gen-1的功能,使用户能够制作具有更高真实性的视频,并且提高了创作的自由度,被网友一度称为文字生成视频动画最强AI工具。 自从runwayML上周更新gen2新功能后,网友纷纷开始使用AI工具创作自己喜欢的AI视频作品,从科幻到魔幻题材,…...- 0
- 0
-
AI绘画工具KREA新特性,随意涂鸦实时生成作品
KREA是一款AI绘画图片prompt提示关键词搜索共享平台,它能够帮助创作者利用AI生成的图像来激发灵感,提高效率,拓展想象力。 通过机器学习算法从大量数据中学习,并提供准确的预测和决策支持。用户只需要在画布上随意的起草稿,它便能实时地根据草稿造型进行联想,同时生成与提示词相应的图像,它的强大之处是可以实时根据用户在修改过程中进行逐张生成,不管是改变颜色,改变造型或改变主体,它都能按照原提示词的…...- 0
- 0
-
RunwayML生成大自然逼真AI动态纪录片用素材
RunwayML的Gen-2代表了人工智能辅助视频生成的重大飞跃,为用户提供了无需参考图像或源视频从零开始创建视频的能力。 这种生成式AI人工智能解决方案扩展了Gen-1的功能,使用户能够制作具有更高真实性的视频,并且提高了创作的自由度,被网友一度称为文字生成视频动画最强AI工具。 虽说还没能完全代替真实生物,但能生成很多过场素材,比较抽象的转场素材,就已经给纪录片制作者省下非常多的时间。...- 0
- 0
-
新兴3D创作软件Spline加入了AI驱动实时3D渲染
新兴3D创作软件Spline加入了AI驱动的3D高斯溅射方法,这是一种新的体积渲染方式,可以将现实生活中的数据捕获到 3D 空间中,并实时渲染。它类似于 Radiance Field 方法,但设置速度更快,渲染速度更快,同时提供相同或更好的质量。 这个方法的结果被称为Splats,它们可以通过拖放文件或使用移动应用程序来创建和导入。您可以使用 Polycam 或 Luma 等应用程序创建Splat…...- 0
- 0
-
南开大学与字节跳动共同开发在线生成LLM(语言模型)增强人物开源AI工具ChatAnything
ChatAnything 是一个由南开大学与字节跳动共同开发的在线生成 LLM(语言模型)增强人物角色的开源AI工具。 它可以根据文本描述生成包括外观、个性和语调在内的拟人化AI角色。ChatAnything 利用 LLM 的上下文学习能力,通过设计一组系统提示来生成角色的个性。同时,它引入了两个创新概念:声音混合(MoV)和外观混合(MoD)来实现多样化的声音和外观生成。MoV 利用文本转语音(…...- 0
- 0
-
四种适合stable diffusion XL且不需要图像精炼的AI模型,Civitai免费下载网址
Stable Diffusion XL 简称SDXL,是最新的文本生成图像AI工具版本,它几乎可以生成任何艺术风格的高质量图像,是图像生成的最佳开源模型。但在生成过程中往往需要精炼器的二次加工,但这并不妨碍SD爱好者的脚步,一些不需要精炼的AI模型油然而生,这些模型以创造各种艺术风格而闻名,包括照片级写真肖像、超现实建筑、3D艺术、数字绘画等等。 C站(Civitai )官方下载网址 DynaVi…...- 0
- 0
-
科学家成功提出首个实时渲染的可驱动人体3D模型 D3GA
在一项最新的研究中,科学家们成功提出了可驱动的3DGaussian Avatars(D3GA),这是首个采用高斯飞溅渲染技术的人体3D可控模型。与当前的可驱动化身模型需要在人工智能训练期间进行准确的3D配准或测试期间需要密集输入图像的方法不同,该研究采用了最新的3D高斯展开(3DGS)技术,能够通过使用密集校准的多视图视频作为输入,在实时帧速率下渲染逼真的人体。 为了实现模型的变形,研究团队摒弃了…...- 0
- 0
-
Stable Diffusion Deforum AI插件3D动画制作完全新手系列教程,从零开始学会使用Deforum
Deforum 是一种使用 Stable Diffusion 创建动画视频的工具。您只需要提供有关相机移动方式的提示和设置。 Deforum是用于制作动画的开源和免费软件。它使用 Stable Diffusion 的图像到图像功能生成一系列图像并将它们拼接在一起以创建视频。 它对图像帧应用小的变换,并使用图像到图像功能创建下一帧。由于帧之间的变化很小,因此会产生连续视频的感觉。 抖音(tiktok…...- 0
- 0
-
Stable Diffusion Deforum ai插件3D动画(动漫效果)视频制作,常见问题汇总解答及两个设定档分享
Deforum 是一种使用 Stable Diffusion 创建动画视频的工具。您只需要提供有关相机移动方式的提示和设置。 Deforum是用于制作动画的开源和免费软件。它使用 Stable Diffusion 的图像到图像功能生成一系列图像并将它们拼接在一起以创建视频。 它对图像帧应用小的变换,并使用图像到图像功能创建下一帧。由于帧之间的变化很小,因此会产生连续视频的感觉。 抖音(tiktok…...- 0
- 0
-
Polycam发布免费3D建模工具,支持多设备快速生成高质量三维模型
Polycam(Polycam是一款使用LiDAR人工智能技术的3D扫描和摄影测量应用程序,可用于iPhone、iPad、Android和Web,Polycam也拥有自己的网站)最近发布了一款免费的3D建模工具,该工具支持手机、平板电脑、摄像机以及无人机进行物体、地形或结构的3D捕捉。用户可以使用任何设备,通过上传至少20张照片或至少20秒的视频,使用摄影测量技术迅速生成高质量的三维模型。这一工具…...- 0
- 0
-
Story-to-Motion项目——无限延长角色动画的文本驱动生成工具
商汤科技研究院最新发布的AI人工智能项目Story-to-Motion在文本驱动AI动画生成领域取得了重大突破。该系统能够处理复杂的文本描述,并将其转换为具体的动作和位置信息,不仅能生成单一动作,还能连续地生成一系列动作,创造出连贯的动画效果。最引人注目的特点之一是,Story-to-Motion可以生成无限长的角色动画。这意味着,只要提供的文本故事足够长且内容连续,系统就能持续根据文本内容生成相…...- 0
- 0