该项目由腾讯开发,该框架结合了现成的多视图扩散模型和基于LRM(大规模重建模型)的稀疏视图重建模型的优势,能够在10秒内创建多样化的3D模型,且精度相当高。
论文链接:https://arxiv.org/abs/2404.07191
GitHub:https://github.com/TencentARC/InstantMesh
在线体验:https://huggingface.co/spaces/TencentARC/InstantMesh
InstantMesh,这是一种用于从单个图像即时生成 3D 网格的前馈框架,具有最先进的生成质量和显着的训练可扩展性。通过协同现成的多视图扩散模型和基于 LRM 架构的稀疏视图重建模型的优势,InstantMesh 能够在 10 秒内创建多样化的 3D 资产。
为了提高训练效率并利用更多的几何监督,例如深度和法线,将可微等值面提取模块集成到我们的框架中,并直接优化网格表示。公共数据集上的实验结果表明,InstantMesh 在定性和定量上都显着优于其他最新的图像到 3D 基线。腾讯发布InstantMesh的所有代码、权重和演示,旨在为3D生成AI社区做出实质性贡献,为研究人员和内容创作者赋能。