山东大学宋雪萌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利一种目标引导的多模态组合式图像检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117009571B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310980937.9,技术领域涉及:G06F16/583;该发明授权一种目标引导的多模态组合式图像检索方法及系统是由宋雪萌;聂礼强;温皓琨;尉寅玮;胡宇鹏;赵中州设计研发完成,并于2023-08-04向国家知识产权局提交的专利申请。
本一种目标引导的多模态组合式图像检索方法及系统在说明书摘要公布了:本发明属于图像信息检索技术领域,提供了一种目标引导的多模态组合式图像检索方法级系统,其方案为:包括属性特征提取模块,目标‑查询关系引导的多模态融合模块,以及目标相似度分布引导的度量学习模块。其中,属性特征提取模块可对参考图像、修改文本、以及目标图像提取统一的属性特征。而后两个模块则利用目标图像信息作为引导,分别进行多模态融合和度量学习,取得了出色的多模态组合式图像检索性能。
本发明授权一种目标引导的多模态组合式图像检索方法及系统在权利要求书中公布了:1.一种目标引导的多模态组合式图像检索方法,其特征在于,包括如下步骤: 从局部和全局的角度提取参考图像、修改文本以及目标图像的属性特征; 基于参考图像、修改文本及目标图像的属性特征和目标-查询关系引导的多模态融合模块,进行多模态特征融合得到融合后的多模态特征; 其中,在目标-查询关系引导的多模态融合模块中,设计了两个分支,在基于目标的教师分支中,通过引入目标图像与多模态查询之间的一致性关系作为引导,指导对多模态查询中参考图像和修改文本之间冲突性关系建模;在无目标的学生分支中,通过向教师分支进行学习,来间接获取指导信息; 将融合后的多模态特征和目标图像属性特征进行度量学习优化后得到用于检测的依据对目标图像进行检索; 其中,所述基于参考图像、修改文本及目标图像的属性特征和目标-查询关系引导的多模态融合模块,进行多模态特征融合得到融合后的多模态特征,具体包括: 设计了基于目标的教师分支和无目标的学生分支; 在无目标学生分支中,仅利用参考图像和修改文本进行多模态融合,根据参考图像和修改文本的属性特征得到第一保留掩码和第一替换掩码;基于第一保留掩码和第一替换掩码得到第一多模态融合特征; 在基于目标的教师分支中,引入目标图像信息得到第二保留掩码和第二替换掩码,并通过第二保留掩码和第二替换掩码得到第二多模态融合特征; 其中,所述第一保留掩码表示参考图像的一致性属性特征中需要被保留的部分,第一替换掩码表示参考图像的一致性属性特征中需要被修改文本的一致性属性特征替换的部分; 在基于目标的教师分支中,具体的计算公式为: 在无目标学生分支中,具体的计算公式为: , 在两个分支的保留掩码和替换掩码添加如下约束: , 其中,和分别为教师分支中的保留掩码和替换掩码,是教师分支中提取保留掩码的多层感知机网络是提取替换掩码的多层感知机网络,和为修改文本和目标图像的属性特征,是参考图像的属性特征,为Sigmoid激活函数,为无目标学生分支中提取掩码的多层感知机网络,和为学生分支的保留掩码和替换掩码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250014 山东省济南市历城区山大南路27号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。