湖南师范大学王润民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南师范大学申请的专利一种视觉-语言信息交互增益的行人重识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120873695B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511367668.4,技术领域涉及:G06F18/24;该发明授权一种视觉-语言信息交互增益的行人重识别方法是由王润民;朱姿諭;崔灵馨设计研发完成,并于2025-09-24向国家知识产权局提交的专利申请。
本一种视觉-语言信息交互增益的行人重识别方法在说明书摘要公布了:本发明公开了一种视觉‑语言信息交互增益的行人重识别方法,涉及跨模态行人识别技术领域。本发明提出了数据处理优化与深度交互融合方案,主要包含了四个处理阶段:数据处理阶段通过显著性网络生成热力图,结合网格模块实现非均匀采样以放大关键区域特征;属性提取阶段采用GroundedSAM模型生成视觉属性掩码,同时利用GPT2模型解析文本属性;特征融合阶段将视觉属性掩码与原始图像特征加权融合,并通过CLIP模型实现跨模态编码;损失优化阶段设计层次化对齐损失函数,依据相似度细分样本对,优化难样本对齐。本发明通过显著性采样增强关键特征表达、双模态属性深度交互及层次化损失优化,显著提升复杂场景下的行人重识别准确率。
本发明授权一种视觉-语言信息交互增益的行人重识别方法在权利要求书中公布了:1.一种视觉-语言信息交互增益的行人重识别方法,其特征在于,包括以下步骤: 首先,在数据处理步骤中通过显著性网络生成行人显著性图像,基于所述显著性图像对图像进行非均匀采样,得到关键区域放大的采样后图像; 然后,在属性提取步骤中利用图像属性提取器和文本属性提取器分别提取采样后图像的视觉属性掩码和对应文本描述的添加了属性字段的文本,其中,所述图像属性提取器采用GroundedSAM模型,通过外部文本属性提示词生成高置信度语义分割结果;所述文本属性提取器采用GPT2模型,按照属性分词指令对文本描述进行短语级属性提取;图像属性、文本属性、采样后图像、文本描述输入跨模态特征编码步骤进行特征提取; 接着,在跨模态特征编码步骤中采用对比语言-图像预训练模型对采样后图像和文本描述进行特征编码,得到图像全局特征和文本全局特征,其中,所述图像全局特征提取使用对比语言-图像预训练模型的视觉转化器,输入为采样后图像;所述文本全局特征提取使用对比语言-图像预训练模型的文本转化器,输入为文本描述;图像全局特征与文本全局特征通过特征融合与对应属性特征融合,所述特征融合公式为Matt为视觉属性掩码,Fv为图像全局特征,为视觉属性特征,然后,通过添加了属性字段的文本得到文本属性特征 最后,在特征融合处理步骤中基于视觉属性特征和文本属性特征的相似度分类结果,通过层次化对齐损失函数优化模型参数,其中,所述损失函数包括属性级的模态内对比损失、模态间对比损失、三元组损失以及全局级的实例损失、行人身份损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南师范大学,其通讯地址为:410081 湖南省长沙市岳麓区麓山路36号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励