KLING可灵:快手AI视频生成型新模型,与OpenAI的Sora相媲美

据说是快手推出的新视频生成模型可灵。根据演示,它可以与 OpenAI 的 Sora 相媲美。

快手表示,灵可以制作长达两分钟、分辨率为 1080p、每秒 30 帧的视频。它还可以对物理上准确的复杂运动序列进行建模。

开发人员表示,可灵 使用 3D 时空注意力系统来更好地建模运动和物理交互,并且由于可扩展的框架和优化的推理,该模型能够生成长的高分辨率视频。

快手声称该模型正确模拟了现实世界的物理特性。使用扩散变压器,它还可以结合概念并创建虚构的场景,例如一只猫驾驶汽车穿过繁忙的城市。

KLING 可灵AI官网:https://kling.kuaishou.com/

AIGC专区:
https://heehel.com/category/aigc

工具箱:
https://heehel.com/ai-tools#ai-3d

以下是10个可灵生成的视频演示:

1. 宇航员在月球表面奔跑

 

2. 快餐店里,戴眼镜的中国男孩闭着眼睛享用美味的芝士汉堡

 

3. 一个中国男人坐在桌边用筷子吃面条

 

4. 一只白猫开着车穿过繁忙的市中心街道,背景是高楼和行人

 

5.一只手将牛奶从钢制打奶壶倒入桌上一杯咖啡中,背景为模糊的厨房

 

6. 一辆拉力赛车在赛道上快速转弯

 

7. 星空下,一男一女手牵手行走,背景是一片星空

 

8. 戴着墨镜的柯基犬在热带岛屿的海滩上行走

 

9.夕阳下的烟囱

 

10.咖啡杯中火山喷发的微距镜头

 

可灵是由快手大模型团队自研打造的视频生成大模型,具备强大的AI视频生成能力。该模型采用了与Sora相似的技术路线,并结合了多项自研技术创新,能够生成具有合理运动和模拟物理世界特性的视频。

可灵大模型的核心技术包括3D时空联合注意力机制,这使得它能够更好地建模复杂的时空运动,生成较大幅度运动的视频内容,同时符合运动规律。此外,可灵AI还采用了原生的文生视频技术路线,替代了图像生成+时序模块的组合,这也是其生成时间长、帧率高,能准确处理复杂运动的核心奥义。

可灵大模型的应用非常广泛,不仅适用于专业视频制作,也适合普通用户进行日常的创意视频制作。目前,可灵已在快影App中开启邀测,并且快手还推出了基于可灵的大模型的其他应用,如"ai舞王"和"ai唱跳"。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索