全部标签

+AI工具

最新随机最多浏览最多喜欢最多评论

分类：
+AI插件 +AI软件在线版

阿里下大棋，TF-T2V高质量AI文生视频将一步到位

阿里下大棋，高质量AI文生视频将一步到位，具有多种能力，例如风格化生成，高分辨率输出等等等等尽管runway与pika在AI视频生成上有着出色的表现，但依然离不开midjourney的辅助，相对图生图，AI文生视频的技术相对落后。阿里团队开发了一种名叫TF-T2V的扩散模型，能够灵活生成各种风格的视频，并且支持高分辨率的视频生成。简单来说，只要输入自然语言提示便可生成出高质量的AI视频，并且在…...
- 23年12月28日
- 0
- 0
【虚空光影】8个剪映Ai功能，提升你的剪辑效率～润物细无声的智能化剪辑，让以前得做半天的效果，一键就搞定啦！

这段视频主要介绍了剪映的一些AI功能，包括智能字幕、智能搜索、人声美化、智能打光等，这些功能可以大大提高剪辑效率。智能字幕：剪映的智能字幕功能可以一键识别字幕，准确度高，大大减少了人工成本。智能搜索：剪映的智能搜索功能可以根据人脸、画面元素、文案台词等快速定位素材位置，非常实用。人声美化：剪映的人声美化功能可以一键开启降噪，去除混响和口水音，使声音更加细腻。智能打光：剪映的智能打光功能可以…...
- 4月10日
- 0
- 0
OpenAI的开源Whisper语音识别模型反向工程WhisperSpeech文本到语音系统

该项目通过对OpenAI的Whisper语音识别模型进行反向工程，成功实现了从文本到语音的自然转换。这一技术的突破，有望引领语音技术的新篇章。 WhisperSpeech的核心在于其对Whisper模型的深度理解和创新应用。通过独特的反转过程，该项目能够接收文本输入，并利用经过修改的Whisper模型生成听起来自然的语音输出。在发音准确性和自然度方面，输出的语音表现得极为出色，为用户带来了前所未有…...
- 1月22日
- 0
- 0
正式开源，免费商用 | “书生·浦语灵笔”图文混合创作大模型

上海人工智能实验室推出首个图文混合创作大模型书生·浦语灵笔（InternLM-XComposer），基于书生·浦语大语言模型（InternLM）研发，浦语灵笔接受视觉和语言模态输入，不仅在图文对话方面表现优秀，更具备图文并茂文章的“一键生成”能力。今年7月以来，实验室陆续开源了书生·浦语大语言模型的7B（InterLM-7B）及20B（InternLM-20B）版本为业界提供了完整的大模型研发…...
- 2月3日
- 0
- 0
【CG小苏】虚幻引擎 5 ！使用 Cascadeur Auto 物理和 uDraper 布料模拟进行 MetaHuman 动画！

MetaHuman指的是元宇宙虚拟数字人，这个概念来自于虚幻引擎（UE）公布的新创作工具：MetaHuman Creator。该工具能使所有人在几分钟时间内创建出照片级的数字人类形象。在现代科技和医学的发展下，MetaHuman也指通过动作捕捉、三维建模、语音合成等技术高度还原真实人类，再借助AR/MR/VR等终端呈现出来的立体“人”。这种虚拟数字人具有高度的智能和自主意识，可以在虚拟环境中与人…...
- 4月24日
- 0
- 0
百川智能发布 Baichuan 4模型及首款AI智能助手“百小应”：你的24小时私人秘书，还是超级大脑？

百川智能推出的新一代AI智能助手“百小应”便是这一领域的又一力作，它不仅集成了先进的搜索技术和大模型能力，还具备了一系列令人惊艳的功能，预示着智能助手将步入全新的发展阶段。它具备多轮搜索、定向搜索等功能，能更精准地满足用户需求。百小应已在Web端和移动端应用商店上线。 Web端体验链接：https://ying.baichuan-ai.com/chat Web端左下角扫码可以下载移动端百川智能官…...
- 5月22日
- 0
- 0
新兴3D创作软件Spline加入了AI驱动实时3D渲染

新兴3D创作软件Spline加入了AI驱动的3D高斯溅射方法，这是一种新的体积渲染方式，可以将现实生活中的数据捕获到 3D 空间中，并实时渲染。它类似于 Radiance Field 方法，但设置速度更快，渲染速度更快，同时提供相同或更好的质量。这个方法的结果被称为Splats，它们可以通过拖放文件或使用移动应用程序来创建和导入。您可以使用 Polycam 或 Luma 等应用程序创建Splat…...
- 23年11月16日
- 0
- 0
AI插图在线生成器：Ilus AI在几分钟内即可获得精美、风格一致的插图

Ilus AI 是一款 AI 插图生成器，使用户能够快速高效地创建美观、风格一致的插图。用户可以从预制模型中进行选择，立即生成艺术品，也可以通过上传自己的插图来训练自定义模型，以微调独特的风格。该工具对于需要按需制作高质量视觉资产的设计师、营销人员和内容创建者特别有用。 Ilus AI 能够以 .png 和 .svg 格式导出，为创建插图、图标和其他图形元素提供了多功能解决方案，可增…...
- 5月8日
- 0
- 0
南洋理工大学研发动画自动填色技术，极大地简化了动画上色制作过程

项目及演示：https://ykdai.github.io/projects/InclusionMatching 论文：https://arxiv.org/abs/2403.18342 GitHub：https://github.com/ykdai/BasicPBC 南洋理工大学的S-lab团队成功研发出了一种前沿的动画自动填色技术，该技术极大地简化了动画制作中复杂且耗时的手动上色环节。这项技术…...
- 4月2日
- 0
- 0
【赛文乔伊】这个AI工具帮你一秒看完你正在看的视频并给出文字总结还能提问并获得AI的见解

瞬间读懂任何流媒体视频内容，并给出文字总结，还能根据视频内容进行任何提问并获得AI的见解的Chrome良心插件推荐。 Elmo是一款良心插件，无需注册即可使用。它可以帮助用户高效获取信息，提供文字总结并允许用户根据视频内容提问并获得 AI 的见解。下载链接：https://www.elmo.chat/ AIGC专区： https://heehel.com/category/aigc 工具箱： h…...
- 4月17日
- 0
- 0
游戏行业掀起新革命：Convai推出全新NPC技术，为游戏体验带来翻天覆地的变化

近日，Convai在游戏技术领域取得了重大突破，Convai在 CES2024 国际消费电子展的NVIDIA特别直播中宣布了其最新游戏AI功能：场景感知和NPC行动生成功能，推出了一项全新的NPC（非玩家角色）技术。该技术运用生成式AI和高性能计算，为游戏体验带来了前所未有的提升。 Convai官网链接：https://convai.com/ 教程专区：https://heehel.com/cat…...
- 1月10日
- 0
- 0
【蓝色多脑盒】Stable Diffusion地表最奇葩的高清换脸插件photomaker简单易学用法详解

photomaker插件触发词：（空格）photomaker（空格）（逗号）之后再加其他的提示词，或者photomaker这个提示词在整组提示词最后一个的时候就不用加空格。 photomaker模型链接：https://pan.baidu.com/s/1kejGylgVONZbHDm9I5KkJA?pwd=gmlb 提取码：gmlb 放在models/ControlNet/ 预处理器之前有给过全套…...
- 3月20日
- 0
- 0
ADOBE 推出杀手功能：Adobe Substance Viewer (alpha) 2D图像秒变3D

ADOBE隆重推出Adobe Substance Viewer (alpha) ，这是一款桌面应用程序，可让您打开、查看和设计 3D 对象。它与 Photoshop（测试版）应用程序配合使用，使您能够将 3D 模型作为可编辑智能对象无缝添加到 2D Photoshop 设计中，从而为数字艺术家释放新的创作可能性。 ADOBE 推出杀手功能：Adobe Substance Viewer (alpha…...
- 10月21日
- 0
- 0
Morph Studio与StabilityAI突破性合作，人工智能视频生成领域新概念

Morph Studio与StabilityAI突破性的合作，将推出一站式视频生成平台。AI视频生成领域不断涌入新生代，从文本、图像或现有视频中获得的灵感，并且能可以转化为引人入胜的故事。通过多并行连接体验无缝创作，激发每一个创造力的火花。 Morph Studio候补名单申请： https://app.morphstudio.com/waitlist 更多AI工具 https://…...
- 2月29日
- 0
- 0
Ctrl-Adapter：融合ControlNet与扩散模型，实现视频生成的完美控制

项目地址：https://ctrl-adapter.github.io AIGC专区： https://heehel.com/category/aigc 工具箱： https://heehel.com/ai-tools#ai-3d Ctrl-Adapter，作为一个专为视频生成设计的Controlnet，赋予各种图像和视频扩散模型丰富的控制功能，并优化了视频的时间对齐。它具备多项强大能力，包括图像…...
- 4月16日
- 0
- 0
快收藏，一键抠像，视频背景移除小工具～

在复杂场景中似乎有点困难，但在普通模式下表现良好。这是现在东京著名的 Sora 视频。右边出现的那个标志没有抠掉，但问题不大，很容易处理传送门：https://huggingface.co/spaces/amirgame197/Remove-Video-Background AIGC工具专区：https://heehel.com/category/ai-soft...
- 2月27日
- 0
- 0
Google即将推出AI办公视频工具Google Vids，一键生成专业宣讲视频

Google即将为用户带来一款全新的AI视频工具——Google Vids，它将集成多种功能，为用户提供一键式、高效的视频创作体验。 Google Vids凭借其强大的AI技术，能够一键生成故事板，并智能协助用户编辑内容。它将自动选择适合的场景、图片和音乐，帮助用户快速生成一个完整的宣讲视频，形式类似于PPT的展示。除了内容编辑，Google Vids还允许用户根据自己的需求添加配音。用户可以选…...
- 4月10日
- 0
- 0
ElevenLabs 推出 Audio Native：创新工具将网页内容自动转化为播客体验

ElevenLabs 近日发布了 Audio Native，这是一款革命性的工具，能够将博客文章、新闻内容以及其他网页文本自动转化为高质量的语音旁白，为用户带来全新的播客式阅读体验。Audio Native 不仅仅是一个音频播放器，它更是一个集文本转语音、内容嵌入、数据分析于一体的综合性解决方案。 ElevenLabs官网：https://elevenlabs.io/ 官方介绍：https://e…...
- 5月18日
- 0
- 0
【王大文-音乐制作人】积分制音乐生成工具Suno AI：当音乐制作人听到Suno AI作曲后的崩溃现场。。。

这个视频展示了音乐制作人听到 AI 生成的音乐后的反应。AI 通过生成音乐来模仿人类的创作，这种技术可能会对音乐产业和人类工作产生影响。观众们在评论中提到，AI 能够提供灵感、辅助创作，并且在音乐的制作过程中起到一定的作用。推荐观看：【图文教程】Suno Ai音乐生成工具如何制作长度超过1分20秒的歌曲？新手小白教学指南-喜好儿网 (heehel.com) 推荐文章：【邵旭斌的景观自习室】目前最…...
- 3月16日
- 0
- 0
先进的图像恢复技术 Personalized Restoration：让老照片焕发新生

如果你有一张模糊的老照片，是爷爷奶奶年轻时的样子，因为年代久远，照片变得模糊不清，颜色褪色，面部细节几乎无法辨认。而传统的图像恢复技术可能会使照片变得更清晰，但可能会丢失外祖父独特的面部特征。项目及演示：https://personalized-restoration.github.io 论文：https://arxiv.org/abs/2312.17234 GitHub：https://git…...
- 1月11日
- 0
- 0
【灵羽助手AI-Anywhere】还用什么ChatGPT，来自清华的AI助手：灵羽助手AI，支持所有应用的Copilot！

灵羽助手（AI Anywhere）是一款桌面端智能助手，可以帮您一键翻译、润色和解释选中的文本，随时随地聊天，并使用内置或自定义的prompts生成高质量内容，协助您创作文案、阅读、编程、沟通等。夸克网盘安装包下载链接：https://pan.quark.cn/s/db69af39d36a 官网链接：https://www.ai-anywhere.com/ AIGC专区： https://hee…...
- 4月5日
- 0
- 0
Mustango：可以通过文本提示生成完整的音乐

Mustango是一款音乐生成系统，类似于Midjourney，但它在文本到音乐的转换以及用户可控性方面有其独特之处。以下是对关键点的详细说明： 1.文本到音乐的转换：用户可以通过输入文本描述来引导音乐的生成。这段文本可能包含有关音乐的多种描述，例如：音乐风格：用户可以指定音乐的风格，如古典、爵士等。节奏：用户可以描述音乐的节奏，包括快节奏或慢节奏。和弦类型：用户可以指定和弦的类型，如大调…...
- 23年11月20日
- 0
- 0
【AI兔扒哥】Stable Diffusion生成质量和效率超过LCM和SDXL Turbo新模型 UniFL，以及新采样器Euler Smea Dyn

UniFL对于SD模型具有巨大的潜力。它更快，更好地理解图像内容，最重要的是:它看起来更好。最后，我们在SD中越来越接近看起来像Midjourney的图像。另外，让我们看看A1111的新欧拉Smea Dyn github：https://github.com/licyk/advanced_euler_sampler_extension Stable Diffusion专区： https://…...
- 4月15日
- 0
- 0
外国小哥体验Pika Labs AI文本生成音效功能：现在免费公开所有人使用

人工智能视频平台Pika Labs现面向所有用户开放音效功能，使创作者能够便捷地为视频添加声音。音效功能首先面向Pro计划订阅者推出，利用Pika Labs内部的文本到音频模型，该模型能匹配视频提示文本以生成相应的声音效果。这一新功能将AI视频的应用提升到了新的高度，并增强了Pika Labs平台已有的角色声音和口型同步工具。与此同时，其他公司如ElevenLabs和Runway也在AI视频音效…...
- 3月21日
- 0
- 0