南京邮电大学朱虎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于深度学习分层视频注意力的单目标跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919457B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510412123.4,技术领域涉及:G06T7/246;该发明授权基于深度学习分层视频注意力的单目标跟踪方法是由朱虎;黄一帆;徐国夏;邓丽珍设计研发完成,并于2025-04-02向国家知识产权局提交的专利申请。
本基于深度学习分层视频注意力的单目标跟踪方法在说明书摘要公布了:本发明涉及一种基于深度学习分层视频注意力的单目标跟踪方法,包括:读取数据集得到原始视频数据和每帧中目标坐标、目标遮挡比例;利用目标遮挡比例筛选出基准帧,构建以基准帧为第一帧的初始视频序列和初始坐标真值序列;对初始坐标真值序列进行坐标扰动,利用扰动后的坐标对初始视频序列进行裁剪得到裁剪视频序列;对裁剪视频序列和裁剪坐标真值序列进行数据增强得到增强视频序列和增强坐标真值序列;利用增强视频序列和增强坐标真值序列对分层帧间滑动窗口因果注意力网络模型进行训练;利用训练完成分层帧间滑动窗口因果注意力网络模型进行自回归目标跟踪。本发明能够在视频遮挡、模糊、抖动的条件下对目标进行高效、准确的跟踪。
本发明授权基于深度学习分层视频注意力的单目标跟踪方法在权利要求书中公布了:1.基于深度学习分层视频注意力的单目标跟踪方法,其特征在于,所述方法包括以下步骤: 步骤1、读取数据集得到原始视频数据和每帧中目标坐标、目标遮挡比例, 步骤2、利用目标遮挡比例筛选出基准帧,构建以基准帧为第一帧的初始视频序列和初始坐标真值序列, 步骤3、对初始坐标真值序列进行坐标扰动,利用扰动后的坐标对初始视频序列进行裁剪得到裁剪视频序列,利用扰动后的坐标对初始坐标真值序列进行变换得到裁剪坐标真值序列, 步骤4、对裁剪视频序列和裁剪坐标真值序列进行数据增强得到增强视频序列和增强坐标真值序列, 步骤5、利用增强视频序列和增强坐标真值序列对分层帧间滑动窗口因果注意力网络模型进行训练, 步骤6、利用训练完成分层帧间滑动窗口因果注意力网络模型进行自回归目标跟踪; 其中,步骤3中, 坐标扰动采用动态噪声注入技术,初始坐标真值序列T中第i帧的初始坐标真值Bi表示为: Bi=[xi,yi,wi,hi], 其中,xi为第i帧框左上角顶点横坐标,yi为第i帧框左上角顶点纵坐标,wi为第i帧框宽度,hi为第i帧高度,扰动后的第i帧的初始坐标真值计算为: 其中,为第i帧框左上角顶点扰动横坐标,为第i帧框左上角顶点扰动纵坐标,为第i帧框扰动宽度,为第i帧扰动高度,e表示自然常数,σ1表示方差为1的高斯噪声采样值,U0,1表示取值范围在0~1之间的均匀噪声采样值; 搜索区域裁剪采用自适应放大策略,以扰动后坐标为中心,第i帧的裁剪边长szi计算为: 其中,f为控制裁剪尺度的裁剪因子; 基于裁剪边长和扰动坐标,生成裁剪视频序列Vc,其表达式为: 其中,每个元素i∈[1,N]通过以下生成, 表示对图像Z执行以的中心点为中心坐标、边长为sz的正方形裁剪操作; 裁剪坐标真值序列Tc通过以下处理得到,生成裁剪视频序列Vc时, 对初始坐标真值序列T进行等价映射处理,最终形成裁剪坐标真值序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。