北京理工大学庄胤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种掩码图像建模引导域适应的跨域遥感场景分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116580243B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310594974.6,技术领域涉及:G06V10/764;该发明授权一种掩码图像建模引导域适应的跨域遥感场景分类方法是由庄胤;张心怡;陈禾;陈亮设计研发完成,并于2023-05-24向国家知识产权局提交的专利申请。
本一种掩码图像建模引导域适应的跨域遥感场景分类方法在说明书摘要公布了:本发明公开了一种掩码图像建模引导域适应的跨域遥感场景分类方法,包括:构建域适应网络,对自编码器进行无标注的自监督预训练,得到预训练后的自编码器模型参数;将自编码器模型参数加载到自编码器中,将数据输入到域适应网络中,利用自编码器对源域图像和目标域图像进行掩码图像建模;利用特征适应模块对齐源域和目标域的高级语义特征分布;以及基于数据构建总体目标损失函数,并优化总体目标损失函数来迭代训练域适应网络,移除自编码器的解码器部分,利用自编码器的编码器和特征适应模块测试目标域图像,获得良好的场景分类结果。本发明在进行域不变特征提取的过程中保留域特定特征,进一步提升对于无标注数据目标域的分类泛化能力。
本发明授权一种掩码图像建模引导域适应的跨域遥感场景分类方法在权利要求书中公布了:1.一种掩码图像建模引导域适应的跨域遥感场景分类方法,其特征在于,包括以下步骤: 构建域适应网络,所述域适应网络包括一个自编码器和一个特征适应模块;其中,所述自编码器包括解码器和编码器; 对所述自编码器进行无标注的自监督预训练,得到预训练后的自编码器模型参数;其中,所述自监督预训练是利用掩码图像建模的方式在源域图像和目标域图像上进行的;所述自编码器模型参数至少包括权重参数;所述源域图像是无标注的源域图像,所述目标域图像是无标注的目标域图像; 将所述自编码器模型参数加载到所述自编码器中,将数据输入到所述域适应网络中,利用所述自编码器对源域图像和目标域图像进行掩码图像建模,利用所述特征适应模块对齐源域和目标域的高级语义特征分布;其中所述数据包括所述源域图像及其标注和所述目标域图像; 以及 基于所述数据构建总体目标损失函数,并优化所述总体目标损失函数来迭代训练所述域适应网络; 其中所述利用所述自编码器对源域图像和目标域图像进行掩码图像建模包括: 将所述源域图像和所述目标域图像处理为第四数目个16×16分辨率的补丁块; 随机选择其中第二比例的所述补丁块进行遮罩,所述第二比例不大于20%; 移除被遮罩的补丁块,将剩余可见的补丁块输入所述自编码器中,得到编码特征; 将所述编码特征还原到所述剩余可见的补丁块的顺序位置; 在缺失的位置补充可学习的随机初始化向量,得到补全的编码特征;以及 将所述补全的编码特征输入所述解码器中重建输入图像的归一化像素值; 其中所述重建输入图像的归一化像素值包括: 计算归一化像素空间中重建图像和原始图像被遮罩的补丁像素之间的均方误差, 图像重建损失表达式如下: 其中,表示源域和目标域中每个归一化像素重建损失的平均值,ns和nt分别为源域和目标域样本总数,和分别为第i个源域图像和第j个目标域图像的归一化像素值,ps和pt分别为所述自编码器对源域图像和目标域图像预测的像素值,M为遮罩补丁块像素的集合,|·|表示集合中元素的数量,s代表源域,t代表目标域,i为正整数,j为正整数; 其中所述利用所述特征适应模块对齐源域和目标域的高级语义特征分布包括: 取源域数据和目标域数据通过所述编码器得到编码特征中的分类令牌; 将所述分类令牌作为高级语义特征输入到所述特征适应模块;其中,所述特征适应模块包括第一特征对齐块和第二特征对齐块,所述第一特征对齐块在分类层之前,所述第二特征对齐块在所述分类层之后; 所述第一特征对齐块依次由全连接层、ReLU激活函数和全连接层组成,两个全连接层之间有残差连接,并且这些附加层只有目标域数据通过,源域数据则直接流入分类层;第二特征对齐块依次由全连接层、ReLU激活函数和全连接层组成,两个全连接层之间有残差连接,并且这些附加层只有目标域数据通过,所述附加层之后还有一个softmax层; 以及 基于所述源域数据和所述目标域数据计算特征对齐损失和正则化损失 其中所述基于所述源域数据和所述目标域数据计算特征对齐损失包括: 所述特征对齐损失为所述第一特征对齐块和所述第二特征对齐块上所述源域和所述目标域特征的最大均值差异之和,表达式如下: 其中,ns和nt分别为源域和目标域样本总数,l=1,2,为第i个源域样本通过第l个特征对齐块的源域高级语义特征,是第j个目标域样本通过第l个特征对齐块之后的目标域高级语义特征,是具有特征核的再生核希尔伯特空间,φ·是相应的特征映射,MMD为最大均值差异,为目标域样本通过第l个特征对齐块的源域高级语义特征,为通过第l个特征对齐块之后的目标域高级语义特征,s代表源域,t代表目标域,i为正整数,j为正整数; 其中基于所述源域数据和所述目标域数据计算计算正则化损失的包括: 选择所述源域数据的随机子集,强制所述随机子集通过所述特征适应模块的目标域路径; 计算所述第一特征对齐块和所述第二特征对齐块上源域中每个类与这个随机子集的最大均值差异之和,表达式如下: 其中,l=1,2,是源域样本随机子集的高级语义特征集合,Cn表示总类别数,Sk表示源域样本第k类的高级语义特征集合,是第i个源域样本通过第l个特征对齐块的源域高级语义特征,是源域随机子集第j个样本通过第l个特征对齐块目标域路径的源域高级语义特征,是具有特征核的再生核希尔伯特空间,φ·是相应的特征映射,|·|表示集合中元素的数量,MMD为最大均值差异,为目标域样本通过第l个特征对齐块的源域高级语义特征,为通过第l个所述特征对齐模块目标域路径的所述源域样本随机子集的高级语义特征,s代表源域,t代表目标域,i为正整数,j为正整数,k为正整数; 其中所述基于所述数据构建总体目标损失函数包括: 构建源域分类损失表达式如下: 其中,ns为源域样本总数,H·,·是交叉熵损失函数,是所述特征适应模块对第i个源域样本的高级语义特征预测的概率,为第i个源域样本的真实标签,s代表源域,i为正整数; 构建目标域条件熵损失表达式如下: 其中,nt为源域样本总数,表示所述特征适应模块对输入的第j个目标域样本的高级语义特征所预测的第k类的概率,t代表目标域,j为正整数,k为正整数; 利用所述源域分类损失所述目标域条件熵损失所述图像重建损失所述特征对齐损失和所述正则化损失建立所述总体目标损失函数表达式如下: 其中,α,β,γ是超参数,表示所述特征对齐损失所述正则化损失所述目标域条件熵损失和所述图像重建损失的权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:102488 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励