扩散模型新突破!无需微调,就能高效稳定移除目标物体

花韻仙語
发布: 2025-02-24 20:30:24
原创
894人浏览过

aixiv 专栏重磅发布:无需微调,高效目标移除的扩散模型新方法——attentive eraser

AIxiv 专栏持续关注并报道全球顶尖AI研究成果。过去数年,我们已发布超过2000篇学术技术文章,涵盖各大高校和企业实验室的最新研究。欢迎投稿或联系我们报道您的优秀工作!投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

研究团队: 浙江工商大学统计与数学学院硕士生孙文灏、阿里巴巴算法工程师崔奔雷(共同第一作者),浙江工商大学统计与数学学院董雪梅教授(通讯作者)。

扩散模型在图像生成领域取得了显著进展,尤其在处理高维复杂数据方面优势明显。然而,将其应用于图像目标移除任务时,仍面临诸多挑战,例如移除目标后残留伪影等问题。为解决这些问题,本文提出了一种无需微调的基于扩散模型的目标移除方法——Attentive Eraser,显著提升了预训练扩散模型的目标移除能力。AAAI 2025 录用并选为 Oral Presentation。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

核心创新:

Attentive Eraser 的核心在于其双重创新:

  1. 注意力激活和抑制 (AAS): 通过巧妙地修改预训练扩散模型的自注意力机制,增强模型对背景的关注,同时抑制对前景目标的关注。 此外,引入相似性抑制 (SS) 机制,有效避免因自注意力机制导致的对背景中相似目标的误判。

  2. 自注意力重定向引导 (SARG): 利用 AAS 修改后的自注意力机制,引导逆向扩散采样过程,从而更精准地移除目标并生成与背景自然融合的内容。

图片

研究背景与方法:

当前,扩散模型如 Stable Diffusion (SD) 在图像生成方面表现出色。然而,直接应用于目标移除任务时,常出现伪影。虽然已有基于微调或提示工程的方法,但这些方法成本高且效果不稳定。Attentive Eraser 则提供了一种无需微调的解决方案,有效解决了这些问题。

图片

实验结果:

SEEK.ai
SEEK.ai

AI驱动的智能数据解决方案,询问您的任何数据并立即获得答案

SEEK.ai 128
查看详情 SEEK.ai

实验结果表明,Attentive Eraser 在多种预训练扩散模型上均表现出色,甚至优于一些基于微调的方法。其在目标移除的质量和稳定性方面均取得了显著提升。用户偏好研究和 GPT-4o 评估进一步验证了其优越性。

图片

图片

图片

鲁棒性和可扩展性:

Attentive Eraser 对不同精细度的掩码具有鲁棒性,并可扩展到其他预训练扩散模型(例如,生成动漫图像的模型)。

图片

图片

论文及代码:

图片

图片

欢迎访问论文链接了解更多细节。

以上就是扩散模型新突破!无需微调,就能高效稳定移除目标物体的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号