【AI论文与新生技术】Meta Reality Labs推出视频人物人体表面法线预测、动作识别模型“Sapiens”

AIGC AI+3D
来源：喜好儿网
9月2日
🍔喜好值+
编辑

HeeHel喜好儿官方小编

Meta Reality Labs 推出了Meta Sapiens，这是一个用于四种基本的以人为中心的视觉任务的模型系列：2D 姿势估计、身体部位分割、深度估计和表面法线预测。我们的模型本身支持 1K 高分辨率推理，并且只需对在超过 3 亿张野外人类图像上预训练的模型进行微调，就可以非常轻松地适应各个任务。即使标记数据稀缺或完全合成，所得模型也对野外数据表现出显着的泛化能力。我们简单的模型设计还带来了可扩展性——随着我们将参数从 0.3 亿扩展到 20 亿，跨任务的模型性能得到提高。 Sapiens 在各种以人类为中心的基准测试中始终超越现有基准。

文章目录

（Meta Sapiens视频人物人体表面法线预测、动作识别模型详情介绍👇)

AI论文与新生技术专题：
https://heehel.com/collection/topic-aipapers-jiaocheng

简单来说，这些模型可以识别照片中人的各个部位的位置，判断人与人之间的距离，以及理解人体表面的弯曲和方向。

Sapiens 模型的特点是它们可以在高分辨率（1K分辨率）下工作，并且很容易根据不同的任务进行调整。研究者们使用超过3亿张真实世界中的人体图像来预训练这些模型，使得它们在处理各种不同的人体图像时表现出色，即使这些图像没有标签或者完全是合成的。这些模型的设计简单，但性能强大，能够随着参数数量的增加而提升性能。

【AI论文与新生技术】Meta Reality Labs推出视频人物人体表面法线预测、动作识别模型“Sapiens”