贵州电网有限责任公司孟令雯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州电网有限责任公司申请的专利一种基于自训练的视频动作检测伪标签去噪方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120356138B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510847370.7,技术领域涉及:G06V20/40;该发明授权一种基于自训练的视频动作检测伪标签去噪方法及系统是由孟令雯;钟晶亮;班国邦;朱新山;蒋理;黄源军;穆帅;马定利;余思伍;郭思琪;马金通;罗莎莎;刘建刚设计研发完成,并于2025-06-24向国家知识产权局提交的专利申请。
本一种基于自训练的视频动作检测伪标签去噪方法及系统在说明书摘要公布了:本发明公开了一种基于自训练的视频动作检测伪标签去噪方法及系统,涉及电力系统视频智能安监领域,用于提升视频动作检测模型利用未标注视频数据的能力,包括:使用基于师生模型的半监督框架在不加入额外参数限制下降低低质量伪标签的噪声,提升对无标签视频数据的利用效率。将伪标签根据评估质量由高至低排序,保证模型对不同质量伪标签的差异化学习;通过自精调模块提升低质量伪标签的精度;基于改进的伪标签,进一步提出了一种基于时序预测不变性的训练方法来帮助模型学习到更鲁棒的时空特征。相比于一般的半监督方法,本发明首次在半监督视频动作检测领域引入了主动学习和伪标签自精调技术,可以生成比默认自训练设置下精度更高的伪标签。
本发明授权一种基于自训练的视频动作检测伪标签去噪方法及系统在权利要求书中公布了:1.一种基于自训练的视频动作检测伪标签去噪方法,其特征在于,包括: 提取视频的时空语义特征,通过预训练的视觉编码器,提取包含时序信息和空间信息的视觉特征,然后将两类视觉特征拼接得到视频特征向量; 将视频特征向量映射到适用于时序动作检测任务的子空间,引入包含明确语义信息的时序特征向量和空间特征向量,设计特征融合和映射模块,得到与视频长度对应的时空特征向量; 根据与视频长度对应的时空特征向量,初始化两个相同的检测模型,一个作为监督模型用于生成伪标签,另一个作为训练模型用于更新权重; 所述检测模型包含一个多层的特征编码转换器、一个多层的组标准化层、一个动作类别预测分支和一个时序预测分支,通过监督模型的推理得到初步动作预测; 初步动作预测按照伪标签评估排序方法从质量高到低进行排序; 对质量排序后50%的伪标签使用自精调模块进行去噪,自精调模块复用监督模型的推理模块,进行若干次推理和聚合推理结果得到去噪的伪标签; 所述根据与视频长度对应的时空特征向量,初始化两个相同的检测模型,一个作为监督模型用于生成伪标签,另一个作为训练模型用于更新权重包括,检测模型包含一个多层的特征编码转换器,每一层均增加了不同尺寸一维卷积模块的转换器模块,第一层的输入为时空特征向量第一层的输出为进一步处理的时序二倍下采样的时空特征向量当前时空特征向量作为第二层的输入,并逐层前向传播,合并各层的输出为{F1,F2,…Fl,...,FL},其中L为多层特征编码转换器的层数,Fl为第l层输出FL为第L层输出,若T不可被2l整除,将的时间维度通过填充0的方法扩展到T',T'是大于等于T且能被2L整除的最小的整数; 检测模型包含一个多层的组标准化层,其中包含L层组标准化层,将各层输出分别通过组标准化层得到时空特征向量视频特征的深层表示{F'1,F'2,…,F'l,...,F'L},其中,F'l为第l层组标准化层的输出,F'L为第L层组标准化层的输出; 检测模型包含一个动作类别预测分支,包含两层一维卷积神经网络和一层全连接网络,每层之间通过标准化层和ReLU激活层,对于每一层组标准化层的输出F'l,通过动作类别预测分支的输出结果为其中,C为需要预测的动作类别数量; 检测模型包含一个时序预测分支,包含两层一维卷积神经网络和一层全连接网络,每层之间通过标准化层和ReLU激活层,对于每一层组标准化层的输出F'l,通过时序边界预测分支的输出结果为两个维度中,第一个维度代表当前片段预测的动作开始时间点,第二个维度代表当前片段预测的动作结束时间点; 单个视频得到若干个预测结果,其中第j个动作预测的表示为其中,是动作类别,为动作在视频中的开始时间,为动作在视频中的结束时间;将各层的动作类别预测分支的输出结果A1,A2,...,AL拼接得到其中为第1层输出的动作类别,为第2层输出的动作类别,为第L层输出的动作类别,明确动作类别为得到和将各层的时序预测分支的输出结果B1,B2,...,BL拼接得到其中为第1层输出的时序边界,为第2层输出的时序边界,为第L层输出的时序边界,在时序维度上根据A选择置信度最大的N个动作预测,并选出N个对应的时序区间,使用置信度阈值过滤得到初步的动作预测,明确动作在视频中的开始时间以及动作在视频中的结束时间一个视频包含的所有动作预测视为一个伪标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州电网有限责任公司,其通讯地址为:550002 贵州省贵阳市南明区滨河路17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励