广东警官学院(广东省公安司法管理干部学院)王宇飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东警官学院(广东省公安司法管理干部学院)申请的专利一种视频运动物体精确追踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115294500B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210963640.7,技术领域涉及:G06T7/246;该发明授权一种视频运动物体精确追踪方法是由王宇飞;廖广军设计研发完成,并于2022-08-11向国家知识产权局提交的专利申请。
本一种视频运动物体精确追踪方法在说明书摘要公布了:本发明公开了一种视频运动物体精确追踪方法,主要步骤如下:对待检测视频进行分帧;获取各帧物体分割掩膜;获得各帧的光流图;利用SLIC超像素分割算法,将各帧分割为2000个超像素;利用DBSCAN聚类方法以平均光流特征对2000个超像素进行自动聚类,确定属于背景的超像素,并去除属于背景的物体掩膜;在视频首帧标定需要精确追踪的物体内部一个像素点的坐标;利用光流信息将包含指定像素的物体掩膜进行双向传播并加以优化;将各帧RGB、HSV和CIELAB颜色空间图像,光流图以及优化后的物体掩膜送入浅层全卷积网络,获得最终像素级分割结果;本方面通过综合利用复合颜色空间特征及光流信息,提升了视频中特定运动物体的精确追踪准确率。
本发明授权一种视频运动物体精确追踪方法在权利要求书中公布了:1.一种视频运动物体精确追踪方法,其特征在于,包括以下步骤: S1、对待检测视频进行分帧处理,得到各帧的帧图像,分别记为I0、I1、I2、…、IN-1,其中N为视频总帧数; S2、利用像素级物体分割方法,对每一幅帧图像进行检测,获得各帧的物体掩膜,分别记为M0、M1、M2、…、MN-1; S3、对于第i幅帧图像Ii,选择其前后相邻的Ii-3、Ii-2、Ii-1、Ii+1、Ii+2及Ii+3帧图像中的存在者,分别与Ii组合计算获得对应的稠密光流图,并进一步计算每一个像素点的平均光流,得到于第i幅帧图像对应的平均光流图,记为水平分量光流图Xi以及垂直分量光流图Yi,i∈{0,1,2,…,N-1}; S4、利用SLIC超像素分割算法将各幅帧图像分割为2000个超像素,将第i幅帧图像的第j个超像素记为Sij,其中j∈{0,1,2,…,1999}; S5、计算每一个超像素中所有像素的平均光流,记为Vij; S6、对于第i幅帧图像,以其中各超像素的平均光流Vij为特征,利用DBSCAN聚类方法对2000个超像素进行自动聚类,按类内超像素从多到少的顺序对类进行排列,将第i帧第k个类别中包含超像素的数量记为Hik; S7、计算各类中所包含超像素的平均光流,将第i帧第k个类别的平均光流记为HVik; S8、将k=0的类别作为背景,随后对k=1的类别进行检验,若其满足下式: 则将k=1的类别也作为背景,并继续检验k=2的类别,式中||||表示光流向量的长度,·表示两个向量的内积,重复上述过程,直至第k类和第k+1类之间不满足上式,则停止检验,将此时作为背景类别中的所有超像素在对应帧的物体掩膜中置为背景,获得新的物体掩膜M’0、M’1、M’2、…、M’N-1; S9、在第0帧的帧图像I0中标记出需要精确追踪的运动物体,以该物体在M’0中的掩膜作为初步物体掩膜,计算掩膜内所有像素的平均光流OV00; S10、检验所有与初步物体掩膜邻接或重叠的其他物体掩膜,计算其平均光流,将第l个相邻或重叠物体的平均光流记为OV0l,若满足: 则认为第l个物体与选择物体可进行合并,最终得到第0帧中所有可以作为选择物体的掩膜,记为Mb 0,其中b∈O,O表示所有被选择的物体的集合; S11、计算第0帧中处理后的需追踪物体掩膜,记为P0,其中P0x,y表示坐标x,y位置像素属于需追踪物体的概率,且有: S12、在获得第i-1帧的需追踪物体掩膜后,计算从第i-1帧到第i帧的光流,并将第i-1帧的需追踪物体掩膜映射到第i帧,得到映射追踪掩膜PPi,且有: 其中dxx,y表示在坐标x,y位置光流的水平分量,dyx,y表示在坐标x,y位置光流的垂直分量,表示向下取整; S13、将M’i中与PPi具有最大重合面积的物体作为第i帧的需追踪物体,其后按照S9至S11的步骤计算得到第i帧处理后的需追踪物体掩膜Pi,其中在检验与初步物体掩膜邻接或重叠的其他物体掩膜时,需要进一步检验在PPi中大于0.5,但在M’i中为背景的区域,最终得到各帧的处理后需追踪物体掩膜P0、P1、P2、…、PN-1; S14、将第N-1帧的处理后需追踪物体掩膜PN-1作为待输入需追踪物体掩膜P* N-1; S15、在获得第i帧的待输入需追踪物体掩膜后,计算从第i帧到第i-1帧的光流,按S12步骤将第i帧的待输入需追踪物体掩膜映射到第i-1帧,并按照S9至S11的步骤计算得到第i-1帧的待输入需追踪物体掩膜P* i-1,最后得到各帧的待输入需追踪物体掩膜P* 0、P* 1、P* 2、…、P* N-1; S16、对帧图像I0、I1、I2、…、IN-1进行颜色空间变换,得到对应的HSV和CIELAB颜色空间,与原有的RGB颜色空间拼接得到9通道特征图,其中各通道的数值通过除以所在通道取值的最大值归一化至[0,1]的区间; S17、对于第i帧图像,将9通道颜色空间特征图,水平分量光流图Xi,垂直分量光流图Yi,以及待输入需追踪物体掩膜P* i,组成12通道输入特征图,输入浅层全卷积网络,最终输出精确追踪结果Ri,其中Ri的尺寸与Ii相同,通道数为2,分别表示各像素属于需追踪物体及背景的概率,从而实现对视频中特定运动物体的像素级精确追踪。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东警官学院(广东省公安司法管理干部学院),其通讯地址为:510230 广东省广州市海珠区滨江东路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。