北方工业大学刘杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北方工业大学申请的专利一种面向多图像场景的多模态命名实体识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120930645B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511059945.5,技术领域涉及:G06F40/295;该发明授权一种面向多图像场景的多模态命名实体识别方法及系统是由刘杰;许明英;宋立志;吴保文;宋林琦;李垠桥设计研发完成,并于2025-07-30向国家知识产权局提交的专利申请。
本一种面向多图像场景的多模态命名实体识别方法及系统在说明书摘要公布了:本发明公开了一种面向多图像场景的多模态命名实体识别方法及系统,其中方法包括:S1.对输入的文本序列及关联的若干图像进行对象检测,获得每张图像中的候选对象集合;S2.提取文本序列的文本特征,并提取各候选对象的对象特征;S3.基于对象特征的相似度进行相关性聚类,从聚类结果中筛选与命名实体相关的跨图像一致性对象;S4.将文本特征与一致性对象特征输入动态融合网络,通过跨模态注意力机制动态调整模态权重,生成多模态融合表示;S5.对多模态融合表示解码获得命名实体识别结果。本发明解决了传统方法在多图像场景中存在的噪声干扰和模态权重静态分配问题。
本发明授权一种面向多图像场景的多模态命名实体识别方法及系统在权利要求书中公布了:1.一种面向多图像场景的多模态命名实体识别方法,其特征在于,步骤包括: S1.对输入的文本序列及关联的若干图像进行对象检测,获得每张图像中的候选对象集合; S2.提取所述文本序列的文本特征,并提取各候选对象的对象特征; S3.基于所述对象特征的相似度进行相关性聚类,从聚类结果中筛选与命名实体相关的跨图像一致性对象;所述S3包括:计算所有候选对象的特征向量间余弦相似度,按预设聚类数K进行相关性聚类;计算每个聚类的中心特征向量,选择与聚类中心相似度最高的候选对象作为该聚类的跨图像一致性对象,包括: 其中k∈[1,K],ck表示聚类Ck的中心,∣Ck∣表示聚类Ck中对象的数量,oi表示聚类Ck中每个对象的特征;通过计算每个对象与聚类中心之间的余弦相似度,选择与聚类中心最相似的对象作为该聚类的一致性对象;如果聚类数K小于预定值,则使用零向量填充一致性对象的数量至K; 其中是与聚类中心最相似的对象的索引;最终,所有聚类的一致性对象表示组成集合; S4.将所述文本特征与一致性对象特征输入动态融合网络,通过跨模态注意力机制动态调整模态权重,生成多模态融合表示;所述动态融合网络包括堆叠的动态融合网络;每一层动态融合块执行以下操作:基于跨模态注意力机制计算文本特征与图像特征的相似度;根据相似度动态更新各模态权重;通过加权融合生成当前层的多模态表示并输入下一层;具体步骤包括: 首先对文本模态表示Ht′和图像模态表示Hv′进行加法操作;该加法结果作为第一个动态融合模块的输入; 多个动态融合块堆叠在一起,形成一个管道;上一层的输出、单模态表示,其中u∈{t,v}和平衡权重α被用作下一层模块的输入;计算后,得到输出: 其中,DFB为动态融合块;在该模块中,引入跨模态注意力机制,将多模态特征视为Q,单模态特征视为K和V,并应用层归一化进行处理: ; 之后平衡权重α乘以中间表示;并将得到的表示和输入的多模态表示相加,以微调每个模态的贡献: ; S5.对所述多模态融合表示解码获得命名实体识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北方工业大学,其通讯地址为:100144 北京市石景山区晋元庄路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励