重庆大学冯永获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利基于多尺度细粒度哈希网络的跨模态遥感检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116049475B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310048099.1,技术领域涉及:G06F16/583;该发明授权基于多尺度细粒度哈希网络的跨模态遥感检索方法及系统是由冯永;黄嘉翔设计研发完成,并于2023-01-31向国家知识产权局提交的专利申请。
本基于多尺度细粒度哈希网络的跨模态遥感检索方法及系统在说明书摘要公布了:本发明具体涉及基于多尺度细粒度哈希网络的跨模态遥感检索方法及系统。所述方法包括:将待检索数据输入经过训练的跨模态检索模型中,输出语义相关的文本或图像结果;训练时,首先将遥感图像及对应的描述文本作为模型输入;然后提取遥感图像的多尺度融合特征,并引入冗余过滤器去除重复特征生成图像特征;其次提取描述文本的细粒度语义特征并结合图像特征进行视觉引导生成文本特征;再通过哈希检索网络将图像特征和文本特征转换为二进制哈希码,进而计算汉明距离并排序;最后通过损失函数优化哈希检索网络的网络参数直至收敛。本发明的跨模态遥感检索方法能够提高跨模态遥感图文检索的准确性、全面性和效率。
本发明授权基于多尺度细粒度哈希网络的跨模态遥感检索方法及系统在权利要求书中公布了:1.基于多尺度细粒度哈希网络的跨模态遥感检索方法,其特征在于,包括: S1:获取用户输入的遥感图像或描述文本作为待检索数据; S2:将待检索数据输入经过训练的跨模态检索模型中,输出与其语义相关的文本或图像结果; 训练时,跨模态检索模型首先将用作训练样本的遥感图像及对应的描述文本作为模型输入;然后通过CNN网络和多尺度特征融合模块提取遥感图像的多尺度融合特征,并引入冗余过滤器去除重复特征,生成对应的图像特征;其次利用Bi-GRU网络和视觉引导注意力模块提取描述文本的细粒度语义特征,并结合图像特征进行视觉引导,生成对应的文本特征;再通过哈希网络将图像特征和文本特征转换为对应的二进制哈希码,进而计算对应哈希码的汉明距离并排序;最后通过损失函数优化哈希网络的网络参数直至收敛; 步骤S2中,通过如下步骤提取多尺度融合特征: S201:通过预先训练的ResNet模型提取遥感图像的图像全局特征vg; 公式描述为: vg=fCNNI; 式中:vg表示图像全局特征;I表示输入的遥感图像;fCNN表示ResNet模型; S202:基于图像全局特征vg,通过组合不同上采层的上采样特征生成对应的图像低级特征vl和图像高级特征vh; 公式描述为: vl=Cat{Lk}k=1.2.3; vh=Cat{Lk}k=4,5; 式中:vl表示图像低级特征;vh表示图像高级特征;Cat表示特征连接;Upsample表示上采样;Lk表示第k层上采样层; S203:通过3×3和1×1的卷积核分别对图像低级特征vl和图像高级特征vh进行下采样,并连接下采样后的图像低级特征和图像高级特征生成对应的多尺度特征 公式描述为: 式中:表示下采样后的图像低级特征;表示下采样后的图像高级特征;表示3×3的卷积核;表示1×1的卷积核;PReLU表示激活函数; S204:将多尺度特征和平均化后的图像高级特征vh进行残差连接,生成对应的多尺度融合特征vlh; 公式描述为: 式中:vlh表示多尺度融合特征;Average表示平均化操作;+表示特征相加; 冗余过滤器通过如下步骤生成图像特征: S211:对多尺度融合特征vlh进行L2正则化,并通过1×1的卷积核进行下采样,得到第一滤波表示v1; 公式描述为: 式中:v1表示第一滤波表示;表示1×1的卷积核;L2·表示L2正则化; S212:对多尺度融合特征vlh进行L2正则化,并通过1×1的卷积核进行下采样和激活函数,得到第二滤波表示v2; 公式描述为: 式中:v2表示第二滤波表示;σ表示激活函数; S213:将第一滤波表示v1和第二滤波表示v2相乘,得到对应的多尺度滤波表示公式描述为: 式中:表示多尺度滤波表示;元素相乘; S214:将全局图像特征vg和多尺度滤波表示相乘得到最终的图像特征 公式描述为: 式中:表示图像特征;vg表示全局图像特征;表示多尺度滤波表示; 通过WordPiece模型对描述文本进行分词,再通过预训练Bi-GRU网络提取描述文本的细粒度语义特征sg; 公式描述为: 式中:表示正向GRU网络;表示反向GRU网络;表示正向GRU网络的隐藏状态;表示反向GRU网络的隐藏状态;ek表示描述文本的第k个单词;sg表示细粒度语义特征,即文本全局特征; 视觉引导注意力模块首先将图像特征和细粒度语义特征sg进行连接,得到对应的细粒度语义特征向量;然后将细粒度语义特征向量输入全连接层并结合激活函数进行相乘以实现视觉引导,进而生成对应的文本特征 公式描述为: 式中:表示文本特征;sg表示细粒度语义特征;表示图像特征;vIs表示细粒度语义特征向量;σ表示激活函数; S3:将跨模态检索模型输出的与对应待检索数据语义相关的文本或图像结果作为对应的检索结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励