【AI论文与新生技术】Lotus：预测图像中每个像素的深度和法线信息扩散模型

+AI动态 AI+3D AI+图片生成 AIGC
来源：喜好儿网
10月2日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

想象一下，你给一个AI看一张图片，然后它能够神奇地预测出图片中每个点距离你有多远。这就像是给AI装上了一双能够感知深度的眼睛。而且，Lotus这个AI非常特别，它不需要看很多图片就能学会这个技能，甚至在看一张图片的时候，它也能注意到图片中的很多小细节。这就像是你在街上看到一辆车快速开过来，你能很快地判断它的距离一样。Lotus能够迅速地给出准确的预测，而且它处理信息的速度非常快，这对于很多需要快速反应的应用来说非常有用，比如自动驾驶的汽车或者制作3D电影。

利用预先训练的文本到图像扩散模型的视觉先验提供了一种有前途的解决方案，可以增强密集预测任务中的零样本泛化。然而，现有的方法通常不加批判地使用原始的扩散公式，由于密集预测和图像生成之间的根本差异，这可能不是最佳的。

【AI论文与新生技术】Lotus：预测图像中每个像素的深度和法线信息扩散模型

在本文中，我们对密集预测的扩散公式进行了系统分析，重点关注质量和效率。我们发现用于图像生成的原始参数化类型学习预测噪声，这对于密集预测是有害的；多步噪声/去噪扩散过程也是不必要的并且优化起来具有挑战性。基于这些见解，我们引入了 Lotus，这是一种基于扩散的视觉基础模型，具有简单而有效的密集预测适应协议。具体来说，Lotus 经过训练可以直接预测注释而不是噪声，从而避免有害的方差。

我们还将扩散过程重新表述为单步过程，简化了优化并显着提高了推理速度。此外，我们引入了一种称为细节保留器的新颖调整策略，它可以实现更准确和更细粒度的预测。在不扩展训练数据或模型容量的情况下，Lotus 在零样本深度和跨各种数据集的正常估计方面实现了 SoTA 性能。它还显着提高了效率，比大多数现有的基于扩散的方法快数百倍。

文章目录

(预测图像中每个像素的深度和法线信息扩散模型Lotus详情👇)

【AI论文与新生技术】Lotus：预测图像中每个像素的深度和法线信息扩散模型

Lotus技术原理

扩散模型：Lotus基于一种叫做扩散模型的技术，这种技术最初是用来生成图像的，但Lotus的创造者们发现它可以重新调整来预测图像的几何特性。
直接预测：不同于其他模型，Lotus直接预测注释（比如深度信息），而不是像其他模型那样预测噪声。
单步扩散：Lotus将复杂的多步骤扩散过程简化为单步过程，这样不仅提高了预测的速度，还提升了效率。
细节保护：Lotus有一个特殊的机制来保护图像中的细节，这样在预测的时候能够保留更多精细的信息。

Lotus的功能

高质量的密集预测：Lotus能够预测图像中每个像素的深度和法线信息。
零样本学习：即使没有大量的训练样本，Lotus也能很好地工作。
高效快速：Lotus的预测速度非常快，比现有的大多数基于扩散的方法要快几百倍。

Lotus的应用场景

3D/4D重建：在只有一张图片的情况下，Lotus可以帮助重建出3D模型或者4D动画。
跟踪：在视频中，Lotus可以用来跟踪物体的移动。
自动驾驶：在自动驾驶汽车中，Lotus可以帮助车辆更好地理解周围的环境。

AI论文 Lotus 像素图像扩散模型新生技术法线信息深度预测

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

TOP1

【设计师老克】ComfyUI字体设计应用
2月24日
TOP2

【AI教程】（指鹿AI）ComfyUI整合包中文下载安装教程
23年11月20日
TOP3

Polycam发布免费3D建模工具，支持多设备快速生成高质量三维模型
23年11月16日
喜好儿AI周报Weekly（第5期）字节跳动GPT账号惨遭冻结 | 文心一言插件商城 | 阿里AI电商要来啦 | 特斯拉二代机器人 | RunwayML连放大招 | Krea AI正式上线 | Meta法宝Audiobox |
23年12月18日
MeshyAI 官方视频，AI生成3d模型材质，并展示多种形态的狮子步行动作
4月2日
【天地会珠海分舵】DomoAI：怎么将周星驰电影《唐伯虎点秋香》视频转换成动漫风格
3月8日
【PAPAYA电脑教室】新的 AI 绘图工具抵达战场！！Leonardo.ai 五个超酷功能让 Midjourney 也感到害怕
23年12月6日
Dreamina即梦：“故事创作-风格控制功能”使用教程，成为古希腊掌握风格变换的神
9月1日
AI提示词（第109辑）科幻梦想核心象征意义梦核风格提示词
10月1日
【无孤冰淇凌】央视《Ai我中华》SD Defoum穿越镜头教程|Ai绘画保姆级教程
5月7日
Runway Gen-3 Alpha 文生视频提示词编写官方指南
7月6日
【原型机SPFX】导演速成法：电影之外最常见的六种运镜镜头艺术
3月25日

❯

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
联系客服
公众号

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部