南开大学李重仪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南开大学申请的专利基于扩散模型的遮挡物体移动和编辑方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119810263B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411993796.5,技术领域涉及:G06T11/60;该发明授权基于扩散模型的遮挡物体移动和编辑方法及系统是由李重仪;段正鹏;郭春乐;张佳维;邹冬青;任思捷设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本基于扩散模型的遮挡物体移动和编辑方法及系统在说明书摘要公布了:本发明公开了一种基于扩散模型的遮挡物体移动和编辑方法及系统,属于计算机视觉与图像处理技术领域。包括:获取原始图像和可视区域掩膜并进行预处理,生成标准输入图像和标准掩码;通过去遮挡分支对标准输入图像和标准掩码进行处理,利用交叉注意力机制和自注意力机制引导扩散过程,生成去遮挡物体图像;获取目标位置,将原始图像、可视区域掩码和目标位置输入移动分支进行处理,引入潜在空间调整操作,以局部文本条件引导,生成遮挡物体移动图像。能够使被遮挡的物体在编辑后保持完整性和真实性,实现目标位置的自然融合和原始位置的无痕重建,解决了现有内容补全不足、目标位置融合不自然以及原始位置残留伪影的问题。
本发明授权基于扩散模型的遮挡物体移动和编辑方法及系统在权利要求书中公布了:1.基于扩散模型的遮挡物体移动和编辑方法,其特征在于,包括: 获取包含被遮挡物体的原始图像和对应的可视区域掩膜并进行预处理,生成标准输入图像和标准掩码; 通过训练好的去遮挡分支对所述标准输入图像和所述标准掩码进行处理,通过背景颜色填充策略初始化可视区域,并利用交叉注意力机制和自注意力机制引导扩散过程,生成去遮挡物体图像; 所述去遮挡分支包括依次连接的变分自编码器、DDIM反演模型、去噪扩散模型U-net、潜变量保持层和变分自解码器,去噪扩散模型U-net中包括交叉注意力机制和自注意力机制; 通过训练好的去遮挡分支对所述标准输入图像和所述标准掩码进行处理包括: 利用预训练的变分自编码器对所述标准输入图像进行编码,生成潜变量;通过去噪扩散隐式模型对所述潜变量进行反演,获取反演生成的中间噪声潜变量; 利用所述标准掩码对所述潜变量进行初始化和填充,通过去噪扩散模型U-net对填充结果进行处理,经交叉注意力机制和自注意力机制引导,获取生成潜变量; 引入潜变量保持策略,利用反演生成的中间噪声潜变量和标准掩码,将生成潜变量中的可见区域,替换为反演结果; 通过变分自解码器将替换后的生成潜变量解码为去遮挡物体图像; 获取目标位置,将所述原始图像、所述可视区域掩码和所述目标位置输入训练好的移动分支进行处理,引入潜在空间调整操作,以局部文本条件引导,生成遮挡物体移动图像; 所述移动分支包括依次连接的变分自编码器、DDIM反演模型、去噪扩散模型U-net、潜变量保持层、局部文本引导层、潜变量优化层和变分自解码器,其中,去噪扩散模型U-net中包括交叉注意力机制和自注意力机制; 将所述原始图像、所述可视区域掩码和所述目标位置输入训练好的移动分支进行处理包括: 通过预训练的变分自编码器对所述原始图像进行编码,生成初始潜变量;通过去噪扩散隐式模型对所述初始潜变量进行反演并存储中间键值对; 将反演后的所述初始潜变量输入去噪扩散模型U-net,通过交叉注意力机制对所述初始潜变量进行处理,引入局部文本引导策略,调整目标位置的潜变量生成内容;通过自注意力机制将调整后初始潜变量的查询向量与中间键值对替换,更新背景信息;引入潜变量,通过潜变量优化策略,最小化目标对象与目标区域的潜变量差距; 通过噪声填充策略引导背景信息在目标对象的原位置进行区域修复,通过变分自解码器对修复后的图像进行解码,获取遮挡物体移动图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南开大学,其通讯地址为:300350 天津市津南区海河教育园区同砚路38号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励