阿里巴巴达摩院(杭州)科技有限公司黄思腾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利模型训练方法以及图文比对方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116361647B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310242112.7,技术领域涉及:G06F40/30;该发明授权模型训练方法以及图文比对方法是由黄思腾;龚镖;潘玉霖;蒋建文;吕逸良;赵德丽设计研发完成,并于2023-03-08向国家知识产权局提交的专利申请。
本模型训练方法以及图文比对方法在说明书摘要公布了:本说明书实施例提供模型训练方法以及图文比对方法,其中模型训练方法包括:获取样本文本和样本视频,并输入至图文比对模型;通过图文比对模型中的文本编码器提取样本文本的词单元特征和长句特征,以及通过图文比对模型中的视频编码器提取所述样本视频的图块特征和视频帧特征;根据词单元特征构建短句特征,根据图块特征构建轨迹特征,以及根据视频帧特征构建视频特征;对齐词单元特征和图块特征获得第一对齐分值,对齐短句特征和轨迹特征获得第二对齐分值,以及对齐长句特征和视频特征获得第三对齐分值;基于第一对齐分值、第二对齐分值和第三对齐分值,对图文比对模型进行调参,直至获得满足训练停止条件的目标图文比对模型。
本发明授权模型训练方法以及图文比对方法在权利要求书中公布了:1.一种模型训练方法,包括: 获取样本文本和样本视频,并输入至图文比对模型,其中,所述图文比对模型用于对文本和视频之间的匹配分值进行预测; 通过所述图文比对模型中的文本编码器提取所述样本文本的词单元特征和长句特征,以及通过所述图文比对模型中的视频编码器提取所述样本视频的图块特征和视频帧特征; 根据所述词单元特征构建短句特征,根据所述图块特征构建轨迹特征,以及根据所述视频帧特征构建视频特征,其中,所述轨迹特征用以体现所述样本视频中同一物体对应的轨迹的向量表达,所述轨迹在所述样本视频中表达物体的位置变化; 对齐所述词单元特征和所述图块特征获得第一对齐分值,对齐所述短句特征和所述轨迹特征获得第二对齐分值,以及对齐所述长句特征和所述视频特征获得第三对齐分值,其中,所述第一对齐分值为所述词单元特征和所述图块特征进行多对多对齐后得到的总匹配分值,所述第二对齐分值为所述短句特征和所述轨迹特征进行多对多对齐后得到的总匹配分值,所述第三对齐分值为所述长句特征和所述视频特征进行一对一对齐后得到的总匹配分值; 基于所述第一对齐分值、所述第二对齐分值和所述第三对齐分值,对所述图文比对模型进行调参,直至获得满足训练停止条件的目标图文比对模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。