商汤科技“Vimi”:全球首个可控人物视频生成AIGC产品,支持多种驱动方式

商汤科技推出的Vimi是全球首个可控人物视频生成AIGC产品,基于商汤日日新大模型的能力。商汤科技Vimi能够通过一张任意风格的照片生成与目标动作一致的人物类视频,并支持多种驱动方式,如动作视频、动画、声音和文字等。该模型可以生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真。

(商汤科技Vimi官网链接👇)

 

Vimi不仅能够实现精准的人物表情控制,还可以在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。此外,Vimi还支持多样化的娱乐互动场景,如聊天、唱歌、舞动等。

Vimi已经在商汤科技官网开放预约,更多细节将在相关论坛上揭晓。在2024年世界人工智能大会(WAIC 2024)上,Vimi荣获“镇馆之宝”荣誉,成为本届大会最具创新展品。

商汤科技“Vimi”:全球首个可控人物视频生成AIGC产品,支持多种驱动方式

Vimi的功能特色

  1. 多元素驱动:Vimi的多元素驱动能力,使其能够接受并响应各种类型的输入信号,无论是动作视频、动画序列,还是音频指令和文本描述,Vimi都能理解和生成与输入相匹配的人物动态视频。
  2. 高度可控性:用户可以对视频中的人物表情和肢体动作进行细致的调整和控制,确保视频内容与预期高度一致。Vimi的这一特性,不仅局限于面部表情,更扩展到了全身动作,让生成的视频更加自然流畅。
  3. 稳定长视频生成:Vimi技术的一个显著优势是其稳定生成长视频的能力,打破了传统AI视频生成技术在视频长度上的限制。这使得Vimi能够应用于电影制作、广告拍摄、虚拟主播等更广泛的领域。
  4. 合理场景生成:Vimi不仅能够生成人物动作,还能够智能生成与人物动作相匹配的背景、服饰和发型,构建出一个完整的视频场景,让视频更加丰富立体,提高了观赏性和实用性。
  5. 光影效果支持:Vimi支持对视频中的光影效果进行调整,包括光线的方向、强度和色彩,以及阴影的生成和变化。这些光影效果的加入,让Vimi生成的视频更加逼真,增强了动态感和视觉冲击力。
  6. 个性化应用:Vimi的个性化应用功能,允许用户根据自己的需求快速生成个性化的动态表情包、虚拟角色等,满足社交媒体、个人娱乐、内容创作等多样化场景下的需求。

商汤科技“Vimi”:全球首个可控人物视频生成AIGC产品,支持多种驱动方式

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索