WonderJourney，一张图创建3D场景动画的人工智能研究项目

+AI动态网站公告
23年12月11日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

WonderJourney这个项目确实非常恐怖如斯，一个由斯坦福大学和谷歌合作开发的项目，它能够仅凭一张图片就连续创建出引人入胜的3D场景动画，而且用户可以通过提供的文本描述或图像，从任何所需的起点开始，然后系统会自动生成一系列独特但又连贯的3D场景，形成一个令人惊奇的旅程。这种技术的背后无疑融合了先进的图像处理和计算机生成的技术，为用户提供了一种沉浸式而个性化的体验。

从演示效果来看非常流畅，3D游戏或者影视的场景创建要变简单了。而且这还是最近罕见的谷歌会开源的研究。
论文网页链接：https://arxiv.org/pdf/2312.03884.pdf

WonderJourney，一张图创建3D场景动画的人工智能研究项目

主要能力：

从同一个起点开始，WonderJourney 能够创造出多组不同的“奇妙旅程”，每一组都以不同的目的地作为终点。这种灵活性使用户能够探索不同的虚拟世界，感受到多样性和无限可能性。每个旅程都会通过相机姿势的轨迹进行渲染，为用户提供身临其境的感觉。
此外，WonderJourney 还具备根据一系列文本描述（例如诗歌、俳句和故事摘要）生成受控的奇妙旅程的能力。用户可以通过输入各种文学作品，引导程序创造出符合文本情感和主题的虚拟旅程。这为艺术家、创作者和文学爱好者提供了一个独特的工具，用以将文字转化为引人入胜的三维体验。

WonderJourney的方法论：

场景描述生成：这一过程首先涉及文本描述的创建，其中系统考虑先前场景的元素、可能的发展趋势以及用户输入。系统通过深入分析语境，使用语言模型来生成详尽的场景描述，以确保文本与前文一致且具有逻辑连贯性。
视觉场景生成：系统采用当前场景的3D表示和先前生成的文本描述作为基础。基于这些信息，系统运用视觉生成技术，将文本描述映射到3D场景中，以形成下一个视觉场景。这一过程涉及复杂的图像生成算法，以确保生成的场景既符合文本描述的要求，又具有视觉上的真实感和合理性。
视觉验证：系统通过一系列视觉验证算法检查生成的场景是否存在不良视觉效果，如不自然的透视、光照不一致等问题。如果检测到问题，系统将根据先前的训练数据和用户反馈进行调整，以优化场景的外观和可视效果。这一反馈机制确保了生成的场景在视觉上达到了用户期望，并提高了系统的生成准确性。