移花接木工具AnyDoor :可以将图片对象毫无违和感地放入到新的图像、视频场景中

项目网址链接:http://damo-vilab.github.io/AnyDoor-Page/
论文网址链接:https://arxiv.org/abs/2307.09481
AIGC专区:https://heehel.com/category/aigc
更多作品:https://heehel.com/category/ai-works

香港大学、阿里巴巴集团和蚂蚁集团联合开发的项目“AnyDoor”推出了一种基于扩散的图像生成器。其主要功能是在用户指定的位置将目标对象(人或物品)无缝插入新场景,实现和谐的场景传送。

移花接木工具AnyDoor :可以将图片对象毫无违和感地放入到新的图像、视频场景中

这一模型的独特之处在于仅需一次训练,即可适用于各种不同的对象和场景组合。通过“零射击”泛化能力,模型在训练中学到了描述对象一般特性而非特定对象特性的技能。

AnyDoor采用了“细节特征”技术,保留对象纹理细节的同时允许局部变化,如照明、方向和姿势等,使对象与新场景自然融合。借鉴视频数据集的知识,有助于提高模型的泛化和鲁棒性。

实验结果表明,AnyDoor在性能上超过了现有方法,潜在应用广泛,如虚拟试穿和对象移动。例如,服装设计师无需真实模特或摄影棚,即可通过AnyDoor将设计“传送”到模特照片上,得到效果图。

https://heehel.com/aigc/midjourney-v6-video-animation.html

https://heehel.com/aigc/xiangzhi-translation-tool.html

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
今日签到
有新私信 私信列表
搜索