Stability AI发布Stable Video Diffusion不久,网友们纷纷开始测试使用它创作AI作品,效果不错

不久前,Stability AI发布Stable Video Diffusion的论文研究了高质量视频生成的潜在扩散模型,通过阐述文本到图像预训练、视频预训练和高质量视频微调的关键步骤,以及预训练数据集的重要性。他们成功训练出一个强大的文本到视频模型,并探索了其在运动表征和多视图3D先验方面的应用。这项研究为进一步推动视频生成领域的发展提供了有价值的贡献。

Stability AI还在论文中探讨了在高质量数据上微调基础模型的影响,并成功训练出一个与闭源视频生成相媲美的文本到视频模型。该模型为下游任务提供了强大的运动表征,例如图像到视频的生成,以及对摄像机运动特定的适应性(使用LoRA模块)。此外,该模型还能够提供强大的多视图3D先验,这可以作为多视图扩散模型的基础。该模型以前馈方式生成对象的多个视图,只需要较小的计算资源,性能也优于基于图像的方法。

StabilityAI官方网址链接:https://stability.ai/
官方网址注册候补链接: https://stability.ai/contact
官方论文网址链接:https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
如何开始使用模型教程及下载网址链接:https://github.com/Stability-AI/generative-models

https://heehel.com/aigc/stable-video-diffusion-svd.html

https://heehel.com/aigc/stable-video-diffusion.html

 

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索