桂林电子科技大学赵彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林电子科技大学申请的专利基于局部和全局注意力机制的视频动作识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116129326B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310160041.6,技术领域涉及:G06V20/40;该发明授权基于局部和全局注意力机制的视频动作识别方法是由赵彬;丁数学;杨婷设计研发完成,并于2023-02-23向国家知识产权局提交的专利申请。
本基于局部和全局注意力机制的视频动作识别方法在说明书摘要公布了:本发明公开了一种基于局部和全局注意力机制的视频动作识别方法。包括步骤:设计一个局部建模模块,在非重叠窗口内局部计算自注意,该窗口划分了一个标记映射,它从小的三维领域的局部时空上下文中提取特征;在局部建模模块中嵌入卷积前馈神经网络,用于捕获局部连续性和位置信息;设计一个全局建模模块,在像素级标记上应用注意力机制,每个转置的标记都抽象全局信息;在全局建模模块中嵌入跳跃连接的卷积层,组成基于卷积神经网络和Transformer的网络LGATNet;不使用预训练,LGATNet在动作识别的公开数据集上进行模型参数学习,并在测试集输出对应的测试结果。本发明有效利用了多尺度特征信息,大大提高了动作识别的准确性和实时性。
本发明授权基于局部和全局注意力机制的视频动作识别方法在权利要求书中公布了:1.一种基于局部和全局注意力机制的视频动作识别方法,其特征在于,在浅层中利用三维深度卷积来减少计算负担,并利用卷积提供局部连接和平移方差,在每个像素周围的小空间窗口内应用自注意机制,在深层中使用全局自注意力来构建,使用空间和通道的注意力来捕获全局交互作用,通过以分层的方式逐步集成块,建立视频动作识别骨干网络,具体包括以下步骤: 1设计一个局部建模模块,在非重叠窗口内局部计算自注意,该窗口划分了一个标记映射,它从小的三维领域的局部时空上下文中提取特征,所述局部建模模块包括第一深度三维卷积层、第一维度重置层、第一线性块、多个第一线性层、第二线性层、第二维度重置层、第一批归一化层、第二深度三维卷积层、第三深度三维卷积层、第一激活函数以及第四深度三维卷积层; 2在局部建模模块中嵌入卷积前馈神经网络,用于捕获局部连续性和位置信息; 3设计一个全局建模模块,在像素级标记上应用注意力机制,每个转置的标记都抽象全局信息,所述全局建模模块包括第五深度三维卷积层、第三维度重置层、第二线性块、多个第三线性层、第四线性层、第四维度重置层、第五线性层、第二批归一化层、第五维度重置层、第六深度三维卷积层、第六维度重置层、第六线性层、第二激活函数以及第七线性层; 4在全局建模模块中嵌入跳跃连接的卷积层,组成基于卷积神经网络和Transformer的网络LGATNet,所述LGATNet包括第一块嵌入层、所述局部建模模块、第二块嵌入层、所述局部建模模块、第三块嵌入层、所述全局建模模块、第四块嵌入层、所述全局建模模块以及分类层; 5不使用预训练,LGATNet在动作识别的公开数据集上进行模型参数学习,并在测试集输出对应的测试结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林电子科技大学,其通讯地址为:541004 广西壮族自治区桂林市金鸡路一号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励