北京工业大学张敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利一种基于运动矢量引导局部注意力的视频目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120071217B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510143847.3,技术领域涉及:G06V20/40;该发明授权一种基于运动矢量引导局部注意力的视频目标检测方法是由张敏;段娟;禹晶;肖创柏设计研发完成,并于2025-02-10向国家知识产权局提交的专利申请。
本一种基于运动矢量引导局部注意力的视频目标检测方法在说明书摘要公布了:本发明公开了一种基于运动矢量引导局部注意力的视频目标检测方法,在单帧检测模型基础上,利用视频帧间的时间相关性,通过相邻帧传播特征以增强当前帧特征。上述方法包括:使用递归融合的视频目标检测框架;通过运动矢量引导局部注意力对齐的方式进行特征对齐;采用FasterR‑CNN作为单帧检测模型。将FasterR‑CNN分为特征提取网络和目标检测任务网络,每个视频帧都需送入特征提取网络以提取视频帧特征,在时间维度上利用运动矢量引导局部注意力方式传播一个含有历史帧中语义信息的记忆特征,通过特征融合增强当前帧特征,每个视频帧的增强特征图既用于当前帧的检测,也为下一帧检测提供足够的语义信息和时间信息,实现了精度与速度的良好平衡。
本发明授权一种基于运动矢量引导局部注意力的视频目标检测方法在权利要求书中公布了:1.一种基于运动矢量引导局部注意力的视频目标检测方法,其特征在于,包含以下6个步骤: 步骤1.特征提取; 特征提取网络是ResNet101网络,根据特征提取网络提取的特征图尺寸大小,将特征提取网络分为5层,其中layer1输出的特征图高宽为原图的12且通道数为64、layer2的特征图高宽为原图的14且通道为128、layer3的特征图高宽为原图的18且通道数为256,layer4的特征图高宽为原图的116且通道数为512,layer5的特征图高宽为原图的132且通道数为1024; 步骤2.预测运动矢量; 对当前帧图像与前一帧图像在通道维度上堆叠输入到运动矢量预测网络以预测运动矢量;该网络由四组卷积组成,其中第一组和第二组卷积分别由通道数为32和64的卷积层构成,第三组卷积是一个多尺度特征融合层,由四个膨胀率分别为1、2、4和8的卷积层组成第4组卷积通过一个卷积核尺寸为的卷积层预测运动矢量,最终获取与特征图相同分辨率运动矢量图;所述视频目标检测方法采用运动矢量引导局部注意力的方式进行特征对齐;FasterR-CNN模型利用一个运动矢量预测网络预测的运动矢量用于引导注意力计算的位置,将相邻帧的特征对齐至当前帧; 步骤3.特征传播; 对当前帧进行检测时,若当前帧为视频帧的初始帧,则对该帧使用图像目标检测;同时将记忆特征初始化为该帧特征图用于后续的特征传播;若当前帧不是视频帧的初始帧,则利用特征提取网络提取特征、运动矢量预测网络预测运动矢量,利用运动矢量引导局部注意力的方式将记忆特征从上一帧传播至当前帧; 步骤4.特征融合; 记忆特征传播到当前帧后,需要与当前帧进行特征融合;记忆特征能够增强当前特征,缓解当前帧中可能出现的模糊和遮挡问题;同时,当前帧特征的引入使得传播来的特征能够更好地适应当前场景的变化; 步骤5.获取检测结果; 将增强特征图输入到目标检测任务网络获取检测结果,通过RPN网络提取候选区域和利用ROIpooling提取候选区域特征之后,利用两个通道数为1024的全连接层对候选区域特征进一步提取特征,再分别利用通道数为C+1和4的全连接层预测感兴趣区域属于某一具体类别的置信度以及更精确的目标位置; 步骤6.判断是否检测完成; 判断图像序列是否检测完成,如果检测完成,则输出图像序列的检测结果,如果未完成,则返回步骤1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100024 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励