阿里巴巴达摩院(杭州)科技有限公司卿志武获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利模型训练方法、视频处理方法、计算机设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114677623B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210249167.6,技术领域涉及:G06V20/40;该发明授权模型训练方法、视频处理方法、计算机设备及介质是由卿志武;张士伟;唐铭谦设计研发完成,并于2022-03-14向国家知识产权局提交的专利申请。
本模型训练方法、视频处理方法、计算机设备及介质在说明书摘要公布了:本申请实施例提供一种模型训练方法、视频处理方法、计算机设备及介质。在本申请实施例,既准备视觉一致性的多个视频片段,又准备主题一致性的多个视频片段,这样,在特征提取模型的模型训练过程中,采用自监督对比学习方式,既关注不同视频片段是否具有相同的视觉特征的视觉一致性维度,又关注不同视频片段是否具有相同的主题的主题一致性维度,实现了从多个层级基于自监督对比学习方式学习视频表征,这样训练出来的特征提取模型的模型性能较好,能够准确提取视频的特征向量,具有较好的泛化性能,能够应用于短视频和长视频的特征提取。另外,模型训练过程不需要引入大量的人工标注成本,耗时较少,模型训练效率较高。
本发明授权模型训练方法、视频处理方法、计算机设备及介质在权利要求书中公布了:1.一种模型训练方法,其特征在于,包括: 获取多个样本视频各自对应一组视频片段,每组视频片段包括具有视觉一致性的两个视频片段,以及不限定视觉一致性的其它视频片段,同组视频片段中的各个视频片段之间具有主题一致性; 利用多组视频片段对特征提取模型进行本轮模型训练,以得到所述特征提取模型在本轮模型训练产生的多组特征向量; 根据所述多组特征向量,生成本轮模型训练在视觉一致性维度上对应的第一损失值,并根据主题一致性预测模型和所述多组特征向量,生成本轮模型训练在主题一致性维度上对应的第二损失值; 在根据所述第一损失值和所述第二损失值判断出不满足模型训练结束条件时,继续对所述特征提取模型进行下一轮模型训练; 其中,根据所述多组特征向量,生成本轮模型训练在视觉一致性维度上对应的第一损失值,包括:针对每组特征向量,根据该组特征向量中与视觉一致性的两个视频片段对应的第一特征向量和第二特征向量之间的相似度,以及所述第一特征向量和所述第二特征向量分别与各组特征向量中不同于自身的其它特征向量之间的相似度,得到该组特征向量对应的第三损失值;根据多组特征向量对应的多个第三损失值,得到本轮模型训练在视觉一致性维度上对应的第一损失值; 其中,根据主题一致性预测模型和所述多组特征向量,生成本轮模型训练在主题一致性维度上对应的第二损失值,包括:将所述多组特征向量中任意两个特征向量进行向量拼接,得到多个拼接向量;将每个拼接向量输入至主题一致性预测模型中,以对每个拼接向量对应的两个视频片段进行主题一致性预测;根据多个拼接向量各自对应的主题一致性预测结果和分类标签,确定本轮模型训练在主题一致性维度上对应的第二损失值; 其中,根据多个拼接向量各自对应的主题一致性预测结果和分类标签,确定本轮模型训练在主题一致性维度上对应的第二损失值,包括:根据每个拼接向量对应的主题一致性预测结果和分类标签,确定每个拼接向量对应的第六损失值;根据多个拼接向量对应的多个第六损失值,确定本轮模型训练在主题一致性维度上对应的第二损失值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励