杭州电子科技大学信息工程学院;杭州电子科技大学张海平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学信息工程学院;杭州电子科技大学申请的专利基于多头自注意力的多时间跨度上下文建模动作识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524402B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310471296.4,技术领域涉及:G06V20/40;该发明授权基于多头自注意力的多时间跨度上下文建模动作识别方法是由张海平;徐东阳;马琮皓;林海翔;管力明;朱崇磊设计研发完成,并于2023-04-27向国家知识产权局提交的专利申请。
本基于多头自注意力的多时间跨度上下文建模动作识别方法在说明书摘要公布了:本发明公开了基于多头自注意力的多时间跨度上下文建模动作识别方法,包括:获取待识别视频并提取视频帧形成第一特征序列;对第一特征序列进行采样获得高频时间轴采样流和低频时间轴采样流;分别通过第一多时间跨度上下文聚合模块和数据增强模块对高频时间轴采样流进行特征提取,对应形成第一上下文提取特征和第一增强特征,并通过第二多时间跨度上下文聚合模块对低频时间轴采样流进行特征提取,形成第二上下文提取特征;将两个上下文提取特征进行相加平均后再与第一增强特征进行相加聚合,形成第一聚合特征;将第一聚合特征输入后处理模块获取动作识别结果。该方法能具有优秀的时序动作定位性能,动作识别准确率高。
本发明授权基于多头自注意力的多时间跨度上下文建模动作识别方法在权利要求书中公布了:1.一种基于多头自注意力的多时间跨度上下文建模动作识别方法,其特征在于:所述基于多头自注意力的多时间跨度上下文建模动作识别方法包括如下步骤:S1、获取待识别视频并对待识别视频进行视频帧提取形成第一特征序列;S2、分别采用第一时间轴采样率和第二时间轴采样率对第一特征序列进行采样,对应获得高频时间轴采样流和低频时间轴采样流;S3、分别通过第一多时间跨度上下文聚合模块和数据增强模块对高频时间轴采样流进行特征提取,对应形成第一上下文提取特征和第一增强特征,并通过第二多时间跨度上下文聚合模块对低频时间轴采样流进行特征提取,形成第二上下文提取特征,各所述多时间跨度上下文聚合模块包括四个衰减模块、四个聚合模块和第一Concat函数,各所述衰减模块依次串接且每个衰减模块的输出端一一对应与所述聚合模块的输入端连接,所述第一Concat函数用于将各聚合模块的输出特征进行聚合形成对应的上下文提取特征,所述第一多时间跨度上下文聚合模块和第二多时间跨度上下文聚合模块的衰减模块采用不同倍数的时间轴采样率进行衰减;所述衰减模块包括融合模块、全局模块和本地模块,其中:所述融合模块用于将对应的输入数据的时间轴采样率以第一预设倍率进行衰减,再将衰减后的输入数据的特征维度以第二预设倍率进行增加,并使用第一时域卷积层对特征维度增加后的输入数据进行衰减操作,获得第一融合特征;所述全局模块用于通过多头自注意力层提取第一融合特征的全局时间上下文信息,获得第一提取特征;所述本地模块用于将第一提取特征依次经过第二时域卷积层、第三时域卷积层和第四时域卷积层进行特征提取形成第二提取特征,并将第一提取特征和第二提取特征进行相加平均,获得第一局部时间上下文信息;S4、将第一上下文提取特征和第二上下文提取特征进行相加平均后,再与第一增强特征进行相加聚合,形成第一聚合特征;S5、将第一聚合特征输入后处理模块获取动作识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学信息工程学院;杭州电子科技大学,其通讯地址为:311305 浙江省杭州市临安区青山湖街道杭电路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励