山东财经大学刘峥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东财经大学申请的专利一种基于多尺度语义扫描的图文互检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521924B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310241222.1,技术领域涉及:G06F16/583;该发明授权一种基于多尺度语义扫描的图文互检索方法及系统是由刘峥;徐君豪;高珊珊;苏宜俊设计研发完成,并于2023-03-09向国家知识产权局提交的专利申请。
本一种基于多尺度语义扫描的图文互检索方法及系统在说明书摘要公布了:本发明公开了一种基于多尺度语义扫描的图文互检索方法及系统,涉及跨模态检索技术领域。首先,为了从图像和文本中生成多粒度语义单元,通过多级重叠滑动窗口对前景和背景区域进行多尺度语义扫描。其次,为了对齐图像和文本之间的语义单元,使用堆叠交叉注意力机制来计算初始图像‑文本相似度。再次,为了进一步自适应地优化图像文本相似度,设计了动态自适应加权损失。最后,为了执行图像文本检索,将多粒度前景和背景语义单元之间的相似度进行融合,以获得最终的图像文本相似度。本发明真正实现了多粒度前景语义单元与多粒度背景语义单元的互补,有效挖掘完整的语义信息进行图文检索,提高检索的精度。
本发明授权一种基于多尺度语义扫描的图文互检索方法及系统在权利要求书中公布了:1.一种基于多尺度语义扫描的图文互检索方法,其特征在于,包括以下步骤: 通过双分支前景背景融合网络利用多级滑动窗口策略对待检索的图像和文本数据进行多尺度语义扫描,分别得到多粒度前景与背景的图像语义单元和文本语义单元;双分支前景背景融合网络包括F-Net结构与B-Net结构,其中通过F-Net结构提取前景区域,通过B-Net结构提取背景区域; 多级滑动窗口策略包括图像多级重叠滑动窗口策略和文本多级重叠滑动窗口策略;图像多级重叠滑动窗口策略中,图像的滑动窗口使用二维数据扫描模式,图像中的相邻滑动窗口彼此重叠;文本多级重叠滑动窗口策略中,文本的滑动窗口使用一维数据扫描模式; 利用堆叠交叉注意机制对图像语义单元和文本语义单元计算图像-文本相似度; 利用动态自适应加权损失函数对图像-文本相似度进行优化过程中,优化每批数据中最困难的负样本和最困难的正样本之间的样本,而不是优化所有样本,得到图像-文本相似度矩阵; 动态自适应加权损失函数: 其中B是批数据的大小,是超参数,γ是超参数,是负样本对的损失函数,是正样本对的损失函数; 将前景与背景的多个图像-文本相似度矩阵进行线性融合,得到最终的图像-文本相似度矩阵,并利用最终的图像-文本相似度矩阵执行检索。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东财经大学,其通讯地址为:250014 山东省济南市历下区二环东路7366号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励