-
【AI论文与新生技术】SEED-Story:使用大型语言模型生成多模式长故事
随着图像生成和开放格式文本生成的显着进步,交错图像文本内容的创建已成为一个越来越有趣的领域。多模式故事生成的特点是以交错的方式生成叙事文本和生动的图像,已成为一项具有广泛应用的有价值且实用的任务。 然而,这项任务提出了重大挑战,因为它需要理解文本和图像之间复杂的相互作用,以及生成连贯的、上下文相关的文本和视觉效果的长序列的能力。在这项工作中,我们提出了 SEED-Story,这是一种利用多模态大语…...- 0
- 0
-
【平面设计案例#46:Midjourney】咒语提示词分享:牛郎织女云中拱桥相遇中国七夕情人节海报
🤔️AI可能觉得七夕不应该只是异性成双成对 niji・journey Bot机器人 — 完整魔法口令/咒语/提示词/关键词思路(👇登录后可见) 部分参数 1 中国情人节海报设计图案,浅色调,蓝色和紫色,梦幻场景,温暖色彩,云中的拱桥,织女与牛郎在桥上相遇,巨大的月亮,烟火,繁星点点的天空,喜鹊,三角形构图,丰富的细节,顶视图,长镜头,中国传统绘画,玉,风景,吉祥,浅背景,最佳品质,粉彩,柔和光线,…...- 0
- 0
-
【AI论文与新生技术】MiraData:腾讯PCG ARC实验室高质量视频数据集开源项目
Mira是腾讯的Mini Sora项目,MiraData是为了达成目标而开源的高质量视频数据集,在视频时长、视频描述细节、运动强度和视觉质量方面都超越了以前的数据集。 视频来源由人工挑选,由GPT-4V生成结构化视频描述,从四个不同的角度(主体、背景、运镜、风格)详细描述视频。 视频数据集在 Sora 等视频生成中发挥着至关重要的作用。然而,现有的文本视频数据集在处理长视频序列和捕获镜头过渡方面往…...- 0
- 0
-
【AI动画】AI动画工具MoonValley—快速生成专属动画!
MoonValley是一款革命性的AI动画工具,旨在彻底改变动画制作的方式。它利用深度学习和机器学习技术,使动画制作者能够轻松将静态图像和图形转化为生动逼真的动画。这个工具的应用范围非常广泛,包括电影制作、游戏开发、广告和虚拟现实。 可以看到视频中的万圣节主题动画,正是由“UDIO TRACKS AI”使用MoonValley工具来制作的。使用方法也非常简单,基本AI绘画的流程差不多,只需要在网站…...- 0
- 0
-
Stability AI推出Stable Video 4D:动态多角度视频生成AI模型
Stability AI 最近推出了一项革命性的技术——Stable Video 4D,这是一种先进的动态多角度视频生成人工智能模型。这项技术的核心在于将单个对象的视频转换为八个不同角度或视图的新颖视频,极大地扩展了视频内容的多样性和创意空间。 Stable Video 4D 的工作原理是,用户首先上传一个视频,并指定他们希望的 3D 相机姿势。模型通过一次推理,能够在大约 40 秒内生成跨八个视…...- 0
- 0
-
AI智能文本转语音平台ElevenLabs——推出进阶Eleven Turbo v2版本
Elevenlabs 是国外一个火爆的AI人工智能文本转语音平台,目前已完成测试价段并推出了正式版。借助先进的多语言人工智技术,Elevenlabs 可以自动识包括中文在内的28种语言,并将其转换为逼真的语音。免费版提供每月10000个字符的转换和创建3个自定义声音。 Eleven Turbo v2是结合了先进的文本到语音技术和最新的低延迟模型架构的版本,这一版本的关键特点是能够以几乎无需等待的速…...- 0
- 0
-
Vidu视频生成工具全球上线 | 注册即刻体验【Vidu-AI】
生数科技,这家成立于2023年3月的年轻企业,其核心团队成员来自清华大学人工智能研究院。首席科学家朱军教授,曾在贝叶斯机器学习和多模态大模型领域取得多项原创性成果。Vidu的核心技术U-ViT架构,是全球首个将Diffusion与Transformer融合的架构,完全由团队自主研发,标志着中国在全球AI视频技术领域的领先地位。 Vidu现已在全球正式上线。该平台以其创新的文生视频和图生视频功能,为…...- 0
- 0
-
Open AI——Vision API和TTS解说技术为游戏带来“船新”体验?
一位外国小哥兴奋地分享了自己使用AI人工智能工具Vision API和TTS技术解说英雄联盟游戏比赛。 Google Vision API是一个应用程序编程接口。该软件是一个创建具有图像识别和分类功能的应用程序的人工智能工具。Cloud Vision AP 使用人工智能向图像添加标签,以便在图像上传到图像目录后立即创建元数据。它使用机器学习和图像识别,可以快速对图像进行…...- 0
- 0
-
奥运转播首次应用,商汤与 SMT 联合打造 2024 巴黎奥运射箭比赛“AI 解说员”
据商汤科技 8 月 5 日晚消息,商汤科技与上海东方传媒技术有限公司(SMT)达成合作,在 2024 巴黎奥运会射箭比赛项目全程赛事转播中,联合打造“智慧体育-InnoMotion AI 赛事转播升级解决方案”,通过三维运动捕捉技术与 AR 特效渲染引擎,实现射箭赛事数据采集与可视化转播,并提供 AI 解说。 上海广播电视台(SMG)旗下上海东方传媒技术有限公司(SMT),前身为上海广播电视局技术…...- 0
- 0
-
draw-a-ui——利用数字画板和GPT-4-Vision API绘制UI设计
近期涌现了一个引人注目的开源AI项目,也是最近几天github trending排第一的项目——“draw-a-ui”,这个项目的强大之处在于,它巧妙地结合了开源数字画板tldraw和GPT-4-Vision API,能够根据用户绘制的线框和标注生成令人惊艳的UI设计。这一创新背后的技术思路是将当前画布的SVG图形转换为PNG格式,并将其发送到GPT-4-Vision API,附带相应指令以获取生…...- 0
- 0
-
AIGCRank:2024年7月国内AI产品流量排行榜
榜单数据来自公开平台,AIGCRank 没有对数据做任何修改,排名公平公正,极具行业参考价值。你可放心转载、分享榜单,或直接引用榜单数据。如需获取榜单原始数据请在公众号后台回复「AI」。 AIGCRank排行榜合集: https://heehel.com/collection/topic-aigcrank-top · 前 5 位次发生变化,秘塔 AI 搜索下跌 2 名,头部 AIBot 产品持续推…...- 0
- 0
-
Midjourney+Elevenlabs+HeyGen 10分钟的时间内创建一个独一无二,能说会动的ai动画头像
一成不变的静态图片头像即将成为过去,即是GIF图片也不够个性。现在开始给自己制作一个独一无二的个性化AI动态头像吧! 这个教学将手把手地教你如何用一张自拍相片交给midjourney AI绘画工具生成卡通图片,然后再运用Elevenlabs 声音生成式ai 克隆自己的声音录音,最后用HeyGen AI虚拟数字人口播工具生成动态动画,变成一个属于自己的动态视频卡通头像。 以下是具体操作步骤: 1/ …...- 0
- 0
-
如何使用 Midjourney 的全新 AI 图像编辑器
Midjourney AI图像编辑器全新上线,带你领略数字创意的新境界。这款人工智能界的翘楚,最近又添新翼,在其强大的工具箱中加入了一项革命性的功能——图像编辑器。 这项新功能,不仅拓宽了Midjourney原有的功能边界,更让使用者能够对AI生成的图像和现实世界的照片进行更精细的把控。无论是打造逼真的视觉效果,还是添加趣味贴纸,或是设计家居装饰,Midjourney都能助你一臂之力。AI图像编辑…...- 0
- 0
-
【AI教程】KreaAI是一款实时绘画AI创意工具,使用KreaAI+网络摄像头LCM实时绘画教学
使用全新的AI绘画工具KreaAI,可以实时与AI绘画,甚至可以使用摄像头输入并将人脸实时绘制成AI图像 视频是关于使用 KreaAI 和网络摄像头 LCM 实时绘画的教学。作者介绍了 KreaAI 的功能,使用 KreaAI,你可以实时与 AI 进行绘画,无论是在纸上还是在电脑屏幕上。更棒的是,你还可以通过网络摄像头将人脸实时绘制成 AI 图像。作者详细介绍了 KreaAI 的安装和操作步骤,并…...- 0
- 0
-
【AI论文与新生技术】Audio Match Cutting:在电影和视频中查找和创建匹配的音频过渡
“相似转场”是一种常见的视频编辑技术,其中具有相似构图的一对镜头从一个镜头流畅地过渡到另一个镜头。尽管比赛剪辑通常是视觉化的,但某些比赛剪辑涉及音频的流畅过渡,其中来自不同来源的声音合并成两个镜头之间无法区分的过渡。在本文中,研究者们探讨了在视频和电影中自动查找和创建“音频匹配剪辑”的能力。简而言之,新的技术Audio Match Cutting,Audio Match Cutting可以帮助视频…...- 0
- 0
-
横向对比现阶段三款主流ai视频动画生成技术和软件的动态影片效果
当前主流软件工具:Stable Video Diffusion (SVD)-Runway-Pika Labs Image to Video(图片到视频) : - Stable Video Diffusion (SVD) - Runway - Pika Labs 图片:Midjourney 使用心得: 1) 在 Replicate 上使用了稳定视频扩散 Stable Video Diffusion …...- 0
- 0
-
【图文教程#59】stable diffusion(sd)320个人物动作关键词!
AI绘画魔法无穷,同样的角色可以赋予他不同的动作姿势,可妖娆、可妩媚、也可拘泥!只要你想什么动作姿势都可以!只有你想不到的!这就是关键词的神奇之处! 今天晚晚再接再励给大家带来一套320+Stablediffusion动作、姿势关键词(只能展示这么多,当然不止)! 话不多说!直接上干货!👇👇👇看图! AIGC图文教程合集专题: https://heehel.com/collection/topic…...- 0
- 0
-
AI工具微软设计师Microsoft Designer,谁都能成为视觉设计师
Microsoft Designer更新了在线图形设计AI工具,可以帮助用户创建专业质量的社交媒体帖子、邀请函、数字明信片、图形等等。它使用了生成式人工智能技术,使用户能够通过文字描述来创建独特的设计。该应用提供了一系列功能,包括图像创建者、设计创造者、生成擦除、背景删除、背景模糊、品牌套件创建者等。用户可以根据自己的创意和想法,快速生成令人惊叹的设计作品。 它通过自动生成文字提示和视觉图像,降低…...- 0
- 0
-
【AI论文与新生技术】Guide-and-Rescale:有效免调整真实图像编辑的自引导机制
尽管大规模文本到图像生成模型最近取得了进展,但用这些模型操纵真实图像仍然是一个具有挑战性的问题。现有编辑方法的主要局限性在于,它们要么无法在大范围的图像编辑上以一致的质量执行,要么需要耗时的超参数调整或扩散模型的微调以保留输入图像的图像特定外观。 我们提出了一种新颖的方法Guide-and-Rescale,该方法通过引导机制基于改进的扩散采样过程。在这项工作中,我们探索自我引导技术来保留输入图像…...- 0
- 0
-
GAIA:微软开创性的语音与图像合成AI人工智能技术,创造自然表情的会话头像视频
微软的GAIA项目能够从语音和单张肖像图片合成自然的会说话的头像视频,它甚至支持诸如“悲伤”、“张开嘴”或“惊讶”等文本提示,来指导视频生成。还允许你精确控制虚拟人物的每个面部动作,比如微笑或惊讶的表情。可以接受语音、视频或文字指令创建会说话的人物头像视频。 项目及演示:https://microsoft.github.io/GAIA/ 论文:https://arxiv.org/abs/2311.…...- 0
- 0