中科(黑龙江)数字经济研究院有限公司;北京邮电大学周琬婷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科(黑龙江)数字经济研究院有限公司;北京邮电大学申请的专利基于上下文感知关系预测编码的自监督群体行为识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116704433B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310598477.3,技术领域涉及:G06V20/52;该发明授权基于上下文感知关系预测编码的自监督群体行为识别方法是由周琬婷;韩雨杉;孔龙腾;吴钺;孙哲南设计研发完成,并于2023-05-25向国家知识产权局提交的专利申请。
本基于上下文感知关系预测编码的自监督群体行为识别方法在说明书摘要公布了:本申请公开了一种基于上下文感知关系预测编码的自监督群体行为识别方法,属于视频分析技术领域,包括获取群体行为视频数据;基于上下文感知关系预测编码,构建群体行为特征自学习模型的网络结构,网络结构包括群体标记生成器、注意力机制编码器和混合上下文Transformer解码器;对网络结构进行自监督训练,得到群体行为特征自学习目标网络;基于少量样本对特征自学习目标网络进行微调,得到用于实现群体行为识别的目标网络。本申请通过上下文感知关系预测编码捕捉上下文关系,从而得到更全面准确的群体行为自学习表征。适用于缺乏标注的高效精确群体行为识别。
本发明授权基于上下文感知关系预测编码的自监督群体行为识别方法在权利要求书中公布了:1.一种基于上下文感知关系预测编码的自监督群体行为识别方法,其特征在于,包括: 获取群体行为视频数据; 基于上下文感知关系预测编码,构建群体特征自监督模型的网络结构,所述网络结构包括群体标记生成器、注意力机制编码器和混合上下文Transformer解码器,其中,所述群体标记生成器根据所述群体行为视频数据生成用于初始化个体表示的群体标记;所述注意力机制编码器根据所述群体标记生成用于构建群体关系的高级语义;所述混合上下文Transformer解码器根据所述高级语义和全局场景上下文信息预测未来帧的空间和时间的群体行为特征; 对所述网络结构进行自监督训练,得到特征自学习目标网络; 基于少量样本对特征自学习目标网络进行微调,得到目标网络,通过所述目标网络进行自监督群体行为识别; 所述群体标记生成器具体用于: 将预训练的I3D网络作为骨干提取特征图对输入的视频片段进行特征提取; 根据特征提取的结果分别建立外观特征分支和姿态线索分支; 通过全连接层连接所述外观特征分支和所述姿态线索分支,得到视频片段中每个个体的D维特征向量; 将各D维特征向量进行组合得到所述群体标记; 所述混合上下文Transformer解码器具体用于: 根据所述I3D网络的最后一个卷积层获取未来视频帧的场景上下文信息; 通过Transformer自注意力机制将所述群体行为高级语义编码信息和所述场景上下文信息进行结合,通过卷积、归一化及池化操作,在所述未来视频帧的场景上下文信息的指导下逐步预测未来每一帧的空间和时间的群体行为特征; 所述对所述网络结构进行自监督训练包括: 在所述混合上下文Transformer解码器进行预测的过程中,基于所述群体行为高级语义编码信息、所述场景上下文信息以及所述群体行为特征计算联合损失; 基于所述联合损失,通过损失梯度反向传播算法迭代调整所述网络结构的各项参数,直至训练收敛,并得到所述特征自学习目标网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科(黑龙江)数字经济研究院有限公司;北京邮电大学,其通讯地址为:150020 黑龙江省哈尔滨市道外区大新街116号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励