南京大学;南京英麒智能科技有限公司王利民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学;南京英麒智能科技有限公司申请的专利一种端到端时序动作检测方法、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117079188B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311067826.5,技术领域涉及:G06V20/40;该发明授权一种端到端时序动作检测方法、电子设备及存储介质是由王利民;杨珉;高桓;王楠;武港山设计研发完成,并于2023-08-22向国家知识产权局提交的专利申请。
本一种端到端时序动作检测方法、电子设备及存储介质在说明书摘要公布了:一种端到端时序动作检测方法、电子设备及存储介质,基于ViT模型构建一个时序动作检测模型ViT‑TAD用于完成依赖长时建模的时序动作检测任务,首先将长时视频片段划分为多个短时片段,送入ViT‑TAD进行时序动作检测,通过插入ViT骨干网络中的两个信息传播模块用于引导检测模型学习全局时序语义信息,之后由一个长时时序动作检测器进行动作检测,通过端到端的训练方式,在训练中更新信息传播模块的内部参数。本发明在时序动作检测任务上具有自适应性强、检测流程直接、检测结果准确等特点,和现有的方法相比,本发明在主流数据集和实际应用中都具有更好的表现。
本发明授权一种端到端时序动作检测方法、电子设备及存储介质在权利要求书中公布了:1.一种端到端时序动作检测方法,其特征是基于ViT模型构建一个时序动作检测模型ViT-TAD用于完成依赖长时建模的时序动作检测任务,首先将长时视频片段划分为多个短时片段,每个短时片段对应一个ViT骨干网络,每个ViT骨干网络中包含n个层级模块,在ViT骨干网络中插入inner-backbone信息传播模块,inner-backbone信息传播模块的插入位置和数量根据消融实验的结果确定,在ViT骨干网络之后插入一个post-backbone信息传播模块,之后再经由一个长时时序动作检测器进行时序动作检测,插入的信息传播模块用于引导检测模型学习全局时序语义信息,并通过端到端的训练方式,在训练中更新信息传播模块的内部参数;其中,两种信息传播模块具体为: inner-backbone信息传播模块:对于来自各骨干网络中短时模块建模的短时特征序列,将这些短时特征序列沿时序维度拼接成为长时特征X∈RW×H×T×C,X=concatx1,x2,...xW×H,其中特征维度为C,特征宽为W高为H,时序长度为T,xt代表每个空间位置处的长时时序特征,t=1,2,…,W×H,inner-backbone信息传播模块内部使用自注意力机制,公式为Y=X+attentionX,对于attention的计算,首先构造每个时序特征xt的查询q,键k和值v,之后再进行自注意力计算,具体公式如下: q=xt·wq,k=xt·wk,v=xt·wv 分别为自注意力机制q、k、v的权重参数,Cq=Ck=Cm,m是注意力头的个数,经过inner-backbone信息传播模块内部的计算,得到Y=concaty1,y2,...yW×H∈RW×H×T×C,特征Y即为经过全局时序交互的特征; post-backbone信息传播模块:对于经过ViT骨干网络建模的多个短时片段特征,将它们沿时序维度拼接为长时特征X′∈RT×C,对其进行Transformer中的运算,由一个自注意力层和一个前馈网络组成,Y′=transformerX′,具体公式如下: X″=X′+attentionX′ Y′=X″+FFNX″ 其中attention的计算与inner-backbone信息传播模块一致,FFN由两个全连接层组成,用于对每个时序位置进行非线性变换以进行特征交互,得到的Y′输入长时时序动作检测器进行动作检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学;南京英麒智能科技有限公司,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励