北京工业大学袁彤彤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利主体与行为偏离可控的监控视频语言数据集自动生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120670746B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510662239.3,技术领域涉及:G06T7/00;该发明授权主体与行为偏离可控的监控视频语言数据集自动生成方法是由袁彤彤;刘波设计研发完成,并于2025-05-22向国家知识产权局提交的专利申请。
本主体与行为偏离可控的监控视频语言数据集自动生成方法在说明书摘要公布了:主体与行为偏离可控的监控视频语言数据集自动生成方法属于计算机视觉领域。本发明基于深度学习技术与数学中的交叉验证方法,研究了一种主体与行为偏离可控的监控视频语言数据集自动生成方法。首先使用目标追踪模块来构建增强的监控视频字幕模型,用于标注生成监控视频的描述文本,控制描述文本中的主体偏离程度。随后使用基于迭代偏离交叉验证的数据过滤模型对描述文本进行过滤,控制文本描述中的行为偏离程度,最终可获取主体与偏离可控的视频语言数据集。本发明所生产数据集具有已知的主体与行为偏离程度,因此可以为多模态监控视频语言理解模型等任务的训练提供有效帮助。
本发明授权主体与行为偏离可控的监控视频语言数据集自动生成方法在权利要求书中公布了:1.主体与行为偏离可控的监控视频语言数据集自动生成方法,其特征在于: 对于任意监控视频集,首先使用目标追踪模块来构建增强的监控视频字幕模型,用于自动标注生成监控视频的描述文本,控制描述文本中的主体偏离程度;随后使用基于迭代偏离交叉验证的数据过滤模型对描述文本进行过滤,控制文本描述中的行为偏离程度,最终可以获取主体与偏离可控的视频语言数据集; 使用目标追踪模块来构建增强的监控视频字幕模型,模型采用一种融合全局与局部特征的视频编码策略,首先对输入的原始视频进行固定采样,提取出若干视频帧片段,并通过视觉编码器提取全局视频特征;同时,采用预训练好的目标检测器对每个视频帧中的对象进行识别和定位,再通过目标筛选器追踪并分析检测对象在视频帧中的运动轨迹,从而进一步筛选出在连续帧中发生变化的对象,并将该对象检测框外其他部分遮盖掉,来得到只含有追踪目标的图像,再输入到视觉编码器获得局部的视频特征;最后,将视觉编码器输出的全局视频特征和局部视频特征相融合,和文本特征一起输入到多模态解码器中,进行文本输出的预测,生成主体描述偏离度低的文本标注; 用基于迭代偏离交叉验证的数据过滤模型对描述文本进行过滤,具体如下: 训练一个双路模型,用于估计出输入的机器标注文本数据中的行为描述是否准确;该模型包含一个基于C3D特征视频分支的异常检测模型和一个基于GPT3大语言模型和提示词的异常检测模型,其中提示词用于告知大语言模型去分析所输入的文本句子是否包含异常行为;训练的数据使用已有的监控领域视频语言数据集,其中C3D特征视频分支的异常检测模型输入为数据集中的视频,基于GPT3大语言模型的输入为数据集中的描述文本和提示词,两边输出的结果都为判断是否存在异常,并使用交叉熵损失对可训练神经网络模块进行训练; 随后,在训练后的模型上输入一对视频和机器标注下的文本描述,可通过判断两个分支在异常检测的输出是否一致,从而判断自动标注的行为描述是否准确; 采取迭代-验证循环的方式,在多次迭代中反复从机器标注好的数据中过滤掉高行为偏离的数据样本,保留低行为偏离的样本,使用样本来训练中初始化的双路检测模型并进行对数据样本的置信度进行测试;具体地,在每一次迭代中,将尚未过滤的候选机器标注集合C划分为互不相交的两部分,一部分用作训练集来训练双路检测模型,训练到模型收敛为止,另一部分用做测试集进行样本过滤;在双路模型的训练过程中,视频分支的异常检测和时序网络部分会进行参数更新,其他部分的参数无需更新;在测试的过程中,算法将测试集中被双路模型判断准确的样本存放到可控行为偏离数据的样本集合S1,并按照预先设定的移除比例γ移除掉其中置信度低的样本,从而进一步提高S1的干净程度;随后,交换上述测试集和训练集,使用重新初始化的双路模型进行训练与测试,并重复以上流程,可以得到另一个可控行为偏离数据的样本集合S2;在这之后,从候选机器标注集合C中去掉S1、S2和双路模型判断不准确的数据,并将S1和S2加入到样本集合S中,随后使用在人工标注数据集上预训练好的双路检测模型来测试集合S的准确率ρ;随后,根据公式ρ=1-ε22+ε22 由准确率ρ计算出S中数据样本的行为偏离度ε2;如果偏离度过高即大于50%,通过调整移除比例γ的值来更积极地过滤数据集的低质量数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励