大连理工大学孙传昱获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种基于状态空间模型的多模态目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120070504B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510220834.1,技术领域涉及:G06T7/246;该发明授权一种基于状态空间模型的多模态目标跟踪方法是由孙传昱;杨鑫;尹宝才设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。
本一种基于状态空间模型的多模态目标跟踪方法在说明书摘要公布了:本发明属于计算机视觉技术领域,涉及一种基于状态空间模型的多模态目标跟踪方法。本发明针对快速运动和光照恶劣条件下的运动目标视觉跟踪任务,提出了一种基于状态空间模型的多模态视觉跟踪方法,以实现对视觉目标的精准跟踪。该方法充分结合了RGB图像和事件数据的优势:RGB图像提供丰富的纹理信息,而事件相机在复杂场景中依然能捕捉物体的边缘和运动信息,从而提高跟踪性能。
本发明授权一种基于状态空间模型的多模态目标跟踪方法在权利要求书中公布了:1.一种基于状态空间模型的多模态目标跟踪方法,其特征在于,步骤如下: 步骤1、RGB-事件图像数据处理 首先,通过标定好的事件相机与RGB相机采集多种挑战场景下的图像数据,根据一定时间步长将事件相机产生的事件流叠加为事件图像帧并根据RGB相机频率进行图像对齐与筛选,得到事件图像,然后,将RGB图像与事件图像经过预处理后送入模型; 步骤2、构建多模态编码器 多模态编码器用于提取RGB图像和事件图像的信息,采用垂直架构的注意力网络HiViT作为多模态编码器,通过token编码、token合并以及自注意力机制逐层提取特征;在中间的注意力层之间,插入基于状态空间模型的模态融合模块FM,进行跨模态融合;最后,将提取的最终层特征送入历史信息解码器和预测头,进行下一步预测; 步骤2.1、基于状态空间模型的模态融合模块的构建 构建基于状态空间模型的模态融合模块FM用于融合多模态的语义信息,FM模块中分别引入目标感知扫描模块和跨模态扫描模块; 1目标感知扫描模块 目标感知扫描模块利用状态空间模型的全局建模能力,增强模态内模板区域和搜索区域之间的交互,目标感知扫描模块采用双向状态空间模型扫描机制,用于计算模板特征与搜索特征之间的相关性; 2跨模态扫描模块 基于状态空间模型的门控机制建立跨模态扫描模块,来对两种模态进行交叉融合; 通过目标感知扫描模块和跨模态扫描模块,多模态编码器能够促进模态内以及跨模态的交互;最后一层编码器的RGB和事件特征相加,得到最终融合特征最终融合特征将用于通过历史信息解码器后预测目标位置; 步骤3、历史信息解码器构建 历史信息解码器通过对历史信息的解码来感知目标的运动趋势与外观变化,从而辅助模型进行精准预测;历史信息解码器的每一层包括历史状态感知模块和特征序列注意模块;历史状态感知模块用于对视频序列中历史信息进行建模,采用基于状态空间模型的序列建模模块;历史状态感知模块输出随后将作为特征序列注意模块输入与步骤2中的多模态特征进行融合,从而对当前搜索区域内的目标进行精准定位; 步骤4、将多模态特征历史信息解码器的输出Fout输入到跟踪头中,以用于目标边界框的预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励