浙江师范大学张大伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江师范大学申请的专利一种基于状态空间模型的单流RGB-D目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120599236B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511093081.9,技术领域涉及:G06V10/25;该发明授权一种基于状态空间模型的单流RGB-D目标跟踪方法是由张大伟;应舸;郑忠龙;蒋云良;杨易设计研发完成,并于2025-08-06向国家知识产权局提交的专利申请。
本一种基于状态空间模型的单流RGB-D目标跟踪方法在说明书摘要公布了:本发明公开了一种基于状态空间模型的单流RGB‑D目标跟踪方法,属于计算机视觉技术领域,将RGB模态图像和深度Depth模态图像数据以Token形式进行整合,通过Mamba单流主干网络进行特征提取与第一阶段融合,之后通过多模态MixMamba深层融合模块3M模块进行第二阶段融合,提升跨模态特征的表达能力和跟踪效率,再利用跟踪头输出预测结果。通过上述方式,本发明通过Token级融合、Mamba单流主干网络与创新的3M模块,成功解决了传统RGB‑D目标跟踪方法中存在的参数量大、融合低效及噪声放大等问题,显著提升了跟踪器的效率与鲁棒性。
本发明授权一种基于状态空间模型的单流RGB-D目标跟踪方法在权利要求书中公布了:1.一种基于状态空间模型的单流RGB-D目标跟踪方法,其特征在于,包括以下步骤: 步骤一:针对每一帧视频序列,同时获取RGB模态图像和深度模态图像,并分别将图像分为搜索区域图像和初始模板图像;分别对各图像进行Token编码,之后拼接为多模态输入Token序列,并将多模态输入Token序列送入线性层进行特征嵌入; 步骤二:多模态输入Token序列输入至Mamba单流主干网络中,首先经过归一化处理,随后进入由多层堆叠的MambaBlock组成的主干网络,在每个MambaBlock内,多模态输入Token序列以单流式同步输入,通过主干网络完成特征提取与第一阶段模态融合; 步骤三:经过主干网络输出的特征输入至3M模块,首先进行归一化,然后通过线性层分解为RGB分支特征和Depth分支特征;RGB分支特征经过卷积及激活函数后作为主输入送入MSSM模块;Depth分支特征直接保留,并经过卷积及激活函数后作为辅输入送入MSSM模块; 步骤四:将3M模块融合输出的特征输入至跟踪头,进行目标预测; MSSM模块进行如下计算: ; =; 其中,为第一次经过预处理的RGB分支特征,为第一次经过预处理的Depth分支特征,SiLU为激活函数,Conv为卷积层,Linear为线性层,Norm为标准化操作; ; ; 其中,为第二次经过预处理的RGB分支特征;为第二次经过预处理的Depth分支特征; ; ; 其中,为RGB分支的最终混合输出,为Depth分支的最终混合输出,为多模态状态空间模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江师范大学,其通讯地址为:321000 浙江省金华市婺城区迎宾大道688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励