中国自研视频大模型Vidu突破技术瓶颈，实现音视频合成与4D内容生成，视频时长延至32秒

+AI动态 AI+视频生成 AIGC 网站公告
6月7日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

近日，生数科技与清华大学联合研发的中国首个自研视频大模型Vidu，在时隔40天后低调宣布了重大技术进展。据悉，Vidu在视频生成领域实现了三大突破：首先，它能一键生成长达32秒的视频，打破了国内视频生成模型的时长限制；其次，Vidu支持音视频合成，即生成的视频不仅具备图像，还配备了声音；最后，Vidu支持4D内容生成，可从单一视频精确重构出时空一致的4D内容，极大提升了视频生成模型的效果和真实感。

论文地址：https://arxiv.org/abs/2405.16822

AIGC专区：
https://heehel.com/category/aigc

更多作品：
https://heehel.com/category/ai-works

这项技术的突破，标志着中国在视频生成领域取得了重要进展，Vidu作为国内首个长时长、高一致性、高动态性的视频大模型，其技术实力与效果已得到业界的广泛认可。生数科技首席科学家朱军表示，Vidu不仅具备模拟真实物理世界的能力，还能理解并生成中国特有的元素，如熊猫、龙等。

值得一提的是，Vidu的技术迭代速度令人瞩目。自今年2月Sora视频大模型发布后，Vidu团队便基于深厚的技术积累，迅速推出了这一国内领先的视频生成模型，并在短短一个多月后再次实现重大技术迭代。此外，生数科技还宣布完成了数亿元的Pre-A轮融资，为Vidu的后续研发和应用提供了强有力的支持。

展望未来，生数科技将继续深化Vidu的研发和应用，推动视频生成技术的进一步发展。同时，该公司还公布了“Vidu大模型合作伙伴计划”，旨在与各方共同构建合作生态，推动视频生成技术的商业化应用。

4D内容生成 Vidu 中国实现技术瓶颈突破自研视频大模型音视频合成

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

【审美提升】瑞典概念设计艺术家 Simon Fetscher 西蒙·费切尔，看看你认得几个游戏
4月3日
TOP2

美图发布公告称将用约 3964 万美元的价格宣布收购综合性设计师社区——站酷网
2月3日
TOP3

【snapAI实验室】ComfyUI instance diffusion 视频运动控制工作流搭载过程演示教学
5月18日
【月下Hugo】干货分享：腾讯开源的混元-DiT模型来了，我愿称它为史上最强开源中文生图模型，在ComfyUI中也可以使用了
5月23日
ElevenLabs 推出 Audio Native：创新工具将网页内容自动转化为播客体验
5月18日
南开大学与字节跳动共同开发在线生成LLM（语言模型）增强人物开源AI工具ChatAnything
23年11月16日
AI作品“失落的王子 - 亚瑟的最后一战”预告片的第一部分，使用Runwayml、Magnific AI和Midjourney
1月22日
北京大学、腾讯PCG联手推出ReVideo：通过动作和内容控制重新制作视频
5月25日
近日全网出圈的AI转绘视频，用 AnimateDiff 将自己的手加上超级酷的特效【工作流下载+幕后花絮】
5月23日
【AI电影实验室】个人原创AI电影：《三体3 - 魔法师之死》人类历史上最后一个真正的魔法师
5月27日
【AI教程】简单几步，有手就行！我奶奶都能学懂使用Midjourney+Topaz Video AI无损放大图片方法!
23年10月30日
谷歌CAT3D革新3D内容创建：多视图扩散模型引领快速高效新纪元
5月18日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
扫码加入交流群
公众号客服

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部