【AI论文与新生技术】BiRefNet抠图：高分辨率二分图像分割双边参考

我们引入了一种用于高分辨率二分图像分割（DIS）的新颖双边参考框架（BiRefNet）。它包括两个基本组件：定位模块（LM）和带有我们提出的双边参考（BiRef）的重建模块（RM）。所谓二元图像分割，就是将图像中的每个像素划分为前景或背景，这在许多实际应用中非常重要，比如在一张照片中分离出人物或其他重要物体。

LM 使用全局语义信息帮助对象定位。在 RM 中，我们利用 BiRef 进行重建过程，其中分层图像块提供源参考，梯度图作为目标参考。这些组件协作生成最终的预测图。我们还引入了辅助梯度监督来增强对细节更精细的区域的关注。此外，我们概述了为 DIS 量身定制的实用培训策略，以提高地图质量和培训过程。

为了验证我们方法的普遍适用性，我们对四项任务进行了广泛的实验，以证明 BiRefNet 表现出卓越的性能，在所有基准测试中都优于特定于任务的前沿方法。

(BiRefNet抠图技术详细信息👇)

简单来说，如果你有一张高分辨率的照片，想要把里面的某个对象（比如一个人或者一辆车）从背景中分离出来，BiRefNet可以帮助你做到这一点，而且做得非常精确。这就像是有一个非常聪明的剪刀，能够沿着物体的边缘非常精确地剪切，而不会损害到物体本身或者背景的任何部分。这对于制作特效、编辑照片或者进行科学研究等需要精确图像处理的场景非常有用。

BiRefNet的技术原理、功能、特点和应用场景如下：

文章目录

BiRefNet抠图技术原理

双边参考框架（Bilateral Reference）：BiRefNet利用双边参考机制，包括内向参考（Inward Reference）和外向参考（Outward Reference）。
局部化模块（Localization Module, LM）：通过全局语义信息辅助目标定位。
重建模块（Reconstruction Module, RM）：使用双边参考进行图像重建，其中原始图像的不同分辨率层次作为源参考，梯度图作为目标参考。
辅助梯度监督：增强对细节区域的关注。
多尺度监督：通过在不同分辨率层次上生成中间预测来加速学习过程。