-
阿里下大棋,TF-T2V高质量AI文生视频将一步到位
阿里下大棋,高质量AI文生视频将一步到位,具有多种能力,例如风格化生成,高分辨率输出等等等等 尽管runway与pika在AI视频生成上有着出色的表现,但依然离不开midjourney的辅助,相对图生图,AI文生视频的技术相对落后。阿里团队开发了一种名叫TF-T2V的扩散模型,能够灵活生成各种风格的视频,并且支持高分辨率的视频生成。 简单来说,只要输入自然语言提示便可生成出高质量的AI视频,并且在…...- 0
- 0
-
【虚空光影】8个剪映Ai功能,提升你的剪辑效率~润物细无声的智能化剪辑,让以前得做半天的效果,一键就搞定啦!
这段视频主要介绍了剪映的一些AI功能,包括智能字幕、智能搜索、人声美化、智能打光等,这些功能可以大大提高剪辑效率。 智能字幕:剪映的智能字幕功能可以一键识别字幕,准确度高,大大减少了人工成本。 智能搜索:剪映的智能搜索功能可以根据人脸、画面元素、文案台词等快速定位素材位置,非常实用。 人声美化:剪映的人声美化功能可以一键开启降噪,去除混响和口水音,使声音更加细腻。 智能打光:剪映的智能打光功能可以…...- 0
- 0
-
OpenAI的开源Whisper语音识别模型反向工程WhisperSpeech文本到语音系统
该项目通过对OpenAI的Whisper语音识别模型进行反向工程,成功实现了从文本到语音的自然转换。这一技术的突破,有望引领语音技术的新篇章。 WhisperSpeech的核心在于其对Whisper模型的深度理解和创新应用。通过独特的反转过程,该项目能够接收文本输入,并利用经过修改的Whisper模型生成听起来自然的语音输出。在发音准确性和自然度方面,输出的语音表现得极为出色,为用户带来了前所未有…...- 0
- 0
-
正式开源,免费商用 | “书生·浦语灵笔”图文混合创作大模型
上海人工智能实验室推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer),基于书生·浦语大语言模型(InternLM)研发,浦语灵笔接受视觉和语言模态输入,不仅在图文对话方面表现优秀,更具备图文并茂文章的“一键生成”能力。 今年7月以来,实验室陆续开源了书生·浦语大语言模型的7B(InterLM-7B)及20B(InternLM-20B)版本 为业界提供了完整的大模型研发…...- 0
- 0
-
【CG小苏】虚幻引擎 5 !使用 Cascadeur Auto 物理和 uDraper 布料模拟进行 MetaHuman 动画!
MetaHuman指的是元宇宙虚拟数字人,这个概念来自于虚幻引擎(UE)公布的新创作工具:MetaHuman Creator。该工具能使所有人在几分钟时间内创建出照片级的数字人类形象。 在现代科技和医学的发展下,MetaHuman也指通过动作捕捉、三维建模、语音合成等技术高度还原真实人类,再借助AR/MR/VR等终端呈现出来的立体“人”。这种虚拟数字人具有高度的智能和自主意识,可以在虚拟环境中与人…...- 0
- 0
-
百川智能发布 Baichuan 4模型及首款AI智能助手“百小应”:你的24小时私人秘书,还是超级大脑?
百川智能推出的新一代AI智能助手“百小应”便是这一领域的又一力作,它不仅集成了先进的搜索技术和大模型能力,还具备了一系列令人惊艳的功能,预示着智能助手将步入全新的发展阶段。它具备多轮搜索、定向搜索等功能,能更精准地满足用户需求。百小应已在Web端和移动端应用商店上线。 Web端体验链接:https://ying.baichuan-ai.com/chat Web端左下角扫码可以下载移动端 百川智能官…...- 0
- 0
-
新兴3D创作软件Spline加入了AI驱动实时3D渲染
新兴3D创作软件Spline加入了AI驱动的3D高斯溅射方法,这是一种新的体积渲染方式,可以将现实生活中的数据捕获到 3D 空间中,并实时渲染。它类似于 Radiance Field 方法,但设置速度更快,渲染速度更快,同时提供相同或更好的质量。 这个方法的结果被称为Splats,它们可以通过拖放文件或使用移动应用程序来创建和导入。您可以使用 Polycam 或 Luma 等应用程序创建Splat…...- 0
- 0
-
AI插图在线生成器:Ilus AI在几分钟内即可获得精美、风格一致的插图
Ilus AI 是一款 AI 插图生成器,使用户能够快速高效地创建美观、风格一致的插图。用户可以从预制模型中进行选择,立即生成艺术品,也可以通过上传自己的插图来训练自定义模型,以微调独特的风格。该工具对于需要按需制作高质量视觉资产的设计师、营销人员和内容创建者特别有用。 Ilus AI 能够以 .png 和 .svg 格式导出,为创建插图、图标和其他图形元素提供了多功能解决方案,可增…...- 0
- 0
-
南洋理工大学研发动画自动填色技术,极大地简化了动画上色制作过程
项目及演示:https://ykdai.github.io/projects/InclusionMatching 论文:https://arxiv.org/abs/2403.18342 GitHub:https://github.com/ykdai/BasicPBC 南洋理工大学的S-lab团队成功研发出了一种前沿的动画自动填色技术,该技术极大地简化了动画制作中复杂且耗时的手动上色环节。 这项技术…...- 0
- 0
-
【赛文乔伊】这个AI工具帮你一秒看完你正在看的视频并给出文字总结还能提问并获得AI的见解
瞬间读懂任何流媒体视频内容,并给出文字总结,还能根据视频内容进行任何提问并获得AI的见解的Chrome良心插件推荐。 Elmo是一款良心插件,无需注册即可使用。它可以帮助用户高效获取信息,提供文字总结并允许用户根据视频内容提问并获得 AI 的见解。 下载链接:https://www.elmo.chat/ AIGC专区: https://heehel.com/category/aigc 工具箱: h…...- 0
- 0
-
游戏行业掀起新革命:Convai推出全新NPC技术,为游戏体验带来翻天覆地的变化
近日,Convai在游戏技术领域取得了重大突破,Convai在 CES2024 国际消费电子展的NVIDIA特别直播中宣布了其最新游戏AI功能:场景感知和NPC行动生成功能,推出了一项全新的NPC(非玩家角色)技术。该技术运用生成式AI和高性能计算,为游戏体验带来了前所未有的提升。 Convai官网链接:https://convai.com/ 教程专区:https://heehel.com/cat…...- 0
- 0
-
【蓝色多脑盒】Stable Diffusion地表最奇葩的高清换脸插件photomaker简单易学用法详解
photomaker插件触发词:(空格)photomaker(空格)(逗号)之后再加其他的提示词,或者photomaker这个提示词在整组提示词最后一个的时候就不用加空格。 photomaker模型链接:https://pan.baidu.com/s/1kejGylgVONZbHDm9I5KkJA?pwd=gmlb 提取码:gmlb 放在models/ControlNet/ 预处理器之前有给过全套…...- 0
- 0
-
ADOBE 推出杀手功能:Adobe Substance Viewer (alpha) 2D图像秒变3D
ADOBE隆重推出Adobe Substance Viewer (alpha) ,这是一款桌面应用程序,可让您打开、查看和设计 3D 对象。它与 Photoshop(测试版)应用程序配合使用,使您能够将 3D 模型作为可编辑智能对象无缝添加到 2D Photoshop 设计中,从而为数字艺术家释放新的创作可能性。 ADOBE 推出杀手功能:Adobe Substance Viewer (alpha…...- 0
- 0
-
Morph Studio与StabilityAI突破性合作,人工智能视频生成领域新概念
Morph Studio与StabilityAI突破性的合作,将推出一站式视频生成平台。AI视频生成领域不断涌入新生代,从文本、图像或现有视频中获得的灵感,并且能可以转化为引人入胜的故事。通过多并行连接体验无缝创作,激发每一个创造力的火花。 Morph Studio候补名单申请: https://app.morphstudio.com/waitlist 更多AI工具 https://…...- 0
- 0
-
Ctrl-Adapter:融合ControlNet与扩散模型,实现视频生成的完美控制
项目地址:https://ctrl-adapter.github.io AIGC专区: https://heehel.com/category/aigc 工具箱: https://heehel.com/ai-tools#ai-3d Ctrl-Adapter,作为一个专为视频生成设计的Controlnet,赋予各种图像和视频扩散模型丰富的控制功能,并优化了视频的时间对齐。它具备多项强大能力,包括图像…...- 0
- 0
-
快收藏,一键抠像,视频背景移除小工具~
在复杂场景中似乎有点困难,但在普通模式下表现良好。 这是现在东京著名的 Sora 视频。右边出现的那个标志没有抠掉,但问题不大,很容易处理 传送门:https://huggingface.co/spaces/amirgame197/Remove-Video-Background AIGC工具专区:https://heehel.com/category/ai-soft...- 0
- 0
-
Google即将推出AI办公视频工具Google Vids,一键生成专业宣讲视频
Google即将为用户带来一款全新的AI视频工具——Google Vids,它将集成多种功能,为用户提供一键式、高效的视频创作体验。 Google Vids凭借其强大的AI技术,能够一键生成故事板,并智能协助用户编辑内容。它将自动选择适合的场景、图片和音乐,帮助用户快速生成一个完整的宣讲视频,形式类似于PPT的展示。 除了内容编辑,Google Vids还允许用户根据自己的需求添加配音。用户可以选…...- 0
- 0
-
ElevenLabs 推出 Audio Native:创新工具将网页内容自动转化为播客体验
ElevenLabs 近日发布了 Audio Native,这是一款革命性的工具,能够将博客文章、新闻内容以及其他网页文本自动转化为高质量的语音旁白,为用户带来全新的播客式阅读体验。Audio Native 不仅仅是一个音频播放器,它更是一个集文本转语音、内容嵌入、数据分析于一体的综合性解决方案。 ElevenLabs官网:https://elevenlabs.io/ 官方介绍:https://e…...- 0
- 0
-
【王大文-音乐制作人】积分制音乐生成工具Suno AI:当音乐制作人听到Suno AI作曲后的崩溃现场。。。
这个视频展示了音乐制作人听到 AI 生成的音乐后的反应。AI 通过生成音乐来模仿人类的创作,这种技术可能会对音乐产业和人类工作产生影响。观众们在评论中提到,AI 能够提供灵感、辅助创作,并且在音乐的制作过程中起到一定的作用。 推荐观看:【图文教程】Suno Ai音乐生成工具如何制作长度超过1分20秒的歌曲?新手小白教学指南-喜好儿网 (heehel.com) 推荐文章:【邵旭斌的景观自习室】目前最…...- 0
- 0
-
先进的图像恢复技术 Personalized Restoration:让老照片焕发新生
如果你有一张模糊的老照片,是爷爷奶奶年轻时的样子,因为年代久远,照片变得模糊不清,颜色褪色,面部细节几乎无法辨认。而传统的图像恢复技术可能会使照片变得更清晰,但可能会丢失外祖父独特的面部特征。 项目及演示:https://personalized-restoration.github.io 论文:https://arxiv.org/abs/2312.17234 GitHub:https://git…...- 0
- 0
-
【灵羽助手AI-Anywhere】还用什么ChatGPT,来自清华的AI助手:灵羽助手AI,支持所有应用的Copilot!
灵羽助手(AI Anywhere)是一款桌面端智能助手,可以帮您一键翻译、润色和解释选中的文本,随时随地聊天,并使用内置或自定义的prompts生成高质量内容,协助您创作文案、阅读、编程、沟通等。 夸克网盘安装包下载链接:https://pan.quark.cn/s/db69af39d36a 官网链接:https://www.ai-anywhere.com/ AIGC专区: https://hee…...- 0
- 0
-
Mustango:可以通过文本提示生成完整的音乐
Mustango是一款音乐生成系统,类似于Midjourney,但它在文本到音乐的转换以及用户可控性方面有其独特之处。以下是对关键点的详细说明: 1.文本到音乐的转换: 用户可以通过输入文本描述来引导音乐的生成。这段文本可能包含有关音乐的多种描述,例如: 音乐风格:用户可以指定音乐的风格,如古典、爵士等。 节奏:用户可以描述音乐的节奏,包括快节奏或慢节奏。 和弦类型:用户可以指定和弦的类型,如大调…...- 0
- 0
-
【AI兔扒哥】Stable Diffusion生成质量和效率超过LCM和SDXL Turbo新模型 UniFL,以及新采样器Euler Smea Dyn
UniFL对于SD模型具有巨大的潜力。 它更快,更好地理解图像内容,最重要的是:它看起来更好。 最后,我们在SD中越来越接近看起来像Midjourney的图像。 另外,让我们看看A1111的新欧拉Smea Dyn github:https://github.com/licyk/advanced_euler_sampler_extension Stable Diffusion专区: https://…...- 0
- 0
-
外国小哥体验Pika Labs AI文本生成音效功能:现在免费公开所有人使用
人工智能视频平台Pika Labs现面向所有用户开放音效功能,使创作者能够便捷地为视频添加声音。音效功能首先面向Pro计划订阅者推出,利用Pika Labs内部的文本到音频模型,该模型能匹配视频提示文本以生成相应的声音效果。 这一新功能将AI视频的应用提升到了新的高度,并增强了Pika Labs平台已有的角色声音和口型同步工具。与此同时,其他公司如ElevenLabs和Runway也在AI视频音效…...- 0
- 0