Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学王利民获国家专利权

南京大学王利民获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学申请的专利一种在线端到端的时空动作检测方法及检测器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115439923B

龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110622809.8,技术领域涉及:G06V40/20;该发明授权一种在线端到端的时空动作检测方法及检测器是由王利民;王子旭;武港山设计研发完成,并于2021-06-04向国家知识产权局提交的专利申请。

一种在线端到端的时空动作检测方法及检测器在说明书摘要公布了:一种在线端到端的时空动作检测方法及检测器,对输入视频序列直接获得相应的时空动作检测结果,而不需要额外的后处理过程。本发明构建检测网络,网络配置包括特征提取网络、特征缓存区、中心点预测分支、包围框回归分支和序列匹配分支,通过特征提取网络抽取视频帧的高维度抽象特征,使用特征缓存模块缓存视频帧特征,采样后将特征序列分别传入动作中心点预测分支、人体包围框回归分支及序列匹配分支,得到动作实例中心点及人体动作检测框,结合序列匹配形成时空动作检测结果。本发明有效利用视频中蕴含的时序信息进行动作识别,避免重复计算,提升检测效率,在视频时空检测任务上体现了鲁棒性和高效性,并具有很强的移植性和扩展性。

本发明授权一种在线端到端的时空动作检测方法及检测器在权利要求书中公布了:1.一种在线端到端的时空动作检测方法,其特征是构建检测网络对输入视频序列直接检测输出时空动作检测结果,检测网络包括特征提取网络、特征缓存区、中心点预测分支、包围框回归分支和序列匹配分支,特征提取网络抽取视频帧的高维度抽象特征,特征缓存模块缓存提取的视频帧特征,得到特征序列,将特征序列分别传入动作中心点预测分支、目标包围框回归分支和序列匹配分支,由动作中心点预测分支、目标包围框回归分支得到动作实例中心点及目标动作检测框,由动作实例中心点和目标动作检测框得到动作检测框,将动作检测框输入序列匹配分支,当前帧动作检测结果在时序上与上一帧检测结果进行匹配,并拼接生成连续的时空检测结果; 检测网络具体配置如下: 1特征提取网络:采用2D特征提取网络,对输入的图像序列进行特征提取,视频帧经过特征提取网络得到高维度特征图,即视频帧特征,特征提取网络包含下采样层和上采样层,视频帧特征包括两种类型,将经过上采样层的特征作为高分辨率特征,只经过下采样层,而未经上采样层的特征为低分辨率特征; 2特征缓存区:特征缓存区缓存至多64帧的视频帧特征,并随输入视频帧的顺序将新生成的特征放入缓冲区替换掉最早缓存的特征; 3中心点预测分支:包括一个2D分支和一个3D分支,2D分支由当前帧的高分辨率特征卷积处理得到运动实例中心点的位置,3D分支从特征缓存区内的低分辨率特征序列均匀采样8帧作为输入特征序列,经过堆叠的R2+1D模块,即3D子网络,进行时空特征融合,通过一个全连接层得到动作类别偏好预测结果,将2D分支和3D分支的结果结合起来,得到动作中心点预测结果,包括定位和分类;中心点预测分支同时利用高分辨率特征的精细空间细节信息和低分辨率特征的连续时序特征信息来完成动作中心点的定位和动作类别的估计,3D分支完成动作类别识别的子任务,动作定位的子任务由2D分支完成,2D分支中,融合上一帧和当前帧的高分辨率特征作为输入,输入特征依次经过3*3卷积层、ReLU激活层、1*1卷积层和Sigmoid层得到通道数为C的中心点预测热图,C代表动作类别;3D从特征缓冲区中的64帧低分辨率特征序列中均匀采样8帧并沿通道拼接形成特征图,输入3D子网络进行动作识别,3D子网络包含4个堆叠的R2+1D时空卷积块和一个全局平均池化层,最后通过一个全连接层输出一维的动作类别预测向量V,预测向量V维度为C; 将2D分支和3D分支的结果结合:首先沿着W‑H轴扩展3D分支生成的一维的动作类别预测向量V,生成一个二维的预测矩阵M,然后把预测矩阵M和热图相加,使长序动作分类信息被纳入到具有位置细节特征的中心点定位估计热图中,有助于抑制中不准确的分类结果; 4包围框回归分支:由当前帧的高分辨率特征通过包围框回归分支得到当前帧运动实例中心点的包围框,结合中心点预测分支得到的定位和分类,形成当前帧的动作实例检测结果,包括动作类别和动作包围框; 5序列匹配分支:将当前帧动作检测结果在时序上与上一帧检测结果进行匹配,经过自适应匹配拼接生成连续的时空检测结果,当整个视频序列处理完成之后,相应地生成整个视频序列的时空动作检测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。