浙江大学耿卫东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于条件扩散模型的草图引导图像编辑方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116503513B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310269415.8,技术领域涉及:G06T11/60;该发明授权一种基于条件扩散模型的草图引导图像编辑方法是由耿卫东;蒋寅峰;毛卫航;厉向东;梁秀波设计研发完成,并于2023-03-20向国家知识产权局提交的专利申请。
本一种基于条件扩散模型的草图引导图像编辑方法在说明书摘要公布了:本发明公开了一种基于条件扩散模型的草图引导图像编辑方法,包括:获取待修复图像和草图,并随机生成掩码图;利用两个编码器分别对待修复图像和草图进行降维编码得到两个低维向量,同时对掩码图采样得到掩码向量;将两个低维向量和掩码向量作为引导条件,利用条件扩散模型基于引导条件的逆扩散生成修复向量;利用解码器对修复向量进行解码重构回图像像素空间得到图像编辑结果。该方法由于整体过程引入草图作为引导,实现对图像中目标区域的有效编辑并且保证图像的全局一致性。
本发明授权一种基于条件扩散模型的草图引导图像编辑方法在权利要求书中公布了:1.一种基于条件扩散模型的草图引导图像编辑方法,其特征在于,包括以下步骤: 获取待修复图像和草图,并随机生成掩码图; 利用两个编码器分别对待修复图像和草图进行降维编码得到两个低维向量,同时对掩码图采样得到掩码向量; 将两个低维向量和掩码向量作为引导条件,利用条件扩散模型基于引导条件的逆扩散生成修复向量; 利用解码器对修复向量进行解码重构回图像像素空间得到图像编辑结果; 所述两个编码器和解码器被应用之前,通过构建包括编码器、解码器和判别器的VQGAN框架,采用对抗学习来优化编码器和解码器参数; 所述条件扩散模型在被应用之前需要经过训练,训练过程包括: 构建训练样本:生成彩色图像对应的初始草图,随机生成掩码图,依据掩码图和彩色图像生成待修复图像,依据掩码图和初始草图生成草图; 构建引导条件:利用两个编码器分别对待修复图像和草图进行降维编码得到两个低维向量,同时对掩码图采样得到掩码向量,两个低维向量和掩码向量拼接作为引导条件; 构建条件扩散模型:条件扩散模型包括正向扩散过程和基于引导条件的逆扩散过程,其中,正向扩散过程中,以基于彩色图像的低维向量作为初始正扩散向量,通过在每个扩散步增加实际噪声实现正向扩散并获得每个扩散步的正扩散向量;逆扩散过程中,以从高斯分布随机采样的向量作为初始逆扩散向量,针对每个扩散步,基于引导条件和前一扩散步的逆扩散向量计算累积噪声,并根据累积噪声计算每个扩散步的逆扩散向量; 构建损失函数:以同一扩散步的正向扩散过程增加的实际噪声与逆向扩散过程计算的累积噪声之间的均方误差作为损失函数; 模型训练:采用损失函数对条件扩散模型进行训练,以优化模型参数; 所述利用条件扩散模型基于引导条件的逆扩散生成修复向量,包括: 以从高斯分布随机采样的向量作为初始逆扩散向量,针对每个逆扩散步,基于引导条件和前一逆扩散步的逆扩散向量计算累积噪声,并根据累积噪声计算每个扩散步的逆扩散向量,最后逆扩散步获得的逆扩散向量作为修复向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。