北京爱奇艺科技有限公司潘迪生获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京爱奇艺科技有限公司申请的专利一种搜索词排序模型训练、搜索词排序方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116450927B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310174596.6,技术领域涉及:G06F16/9535;该发明授权一种搜索词排序模型训练、搜索词排序方法及装置是由潘迪生设计研发完成,并于2023-02-28向国家知识产权局提交的专利申请。
本一种搜索词排序模型训练、搜索词排序方法及装置在说明书摘要公布了:本发明实施例提供了一种搜索词排序模型训练、搜索词排序方法及装置,应用于智能分析技术领域。该方法包括:获取第一样本集中N个样本的样本特征;基于所获取的样本特征,构建M个样本特征组,并确定每一样本特征组的第一标注信息;利用各样本特征组以及每一样本特征组的第一标注信息,对预训练模型进行训练,并返回执行获取第一样本集中N个样本的样本特征的步骤,直至预训练模型的损失函数值收敛;利用第二样本集中的样本特征对待训练的搜索词排序模型进行训练,直至待训练的搜索词排序模型的损失函数值收敛,得到训练完成的搜索词排序模型。通过本方案,可以使搜索词排序模型更准确的进行搜索词排序。
本发明授权一种搜索词排序模型训练、搜索词排序方法及装置在权利要求书中公布了:1.一种搜索词排序模型训练方法,其特征在于,所述方法包括: 获取第一样本集中N个样本的样本特征;其中,N为正整数,每一样本包含令牌词和搜索词,每一搜索词包含其所在样本中的令牌词,所述第一样本集中包含第一类样本和第二类样本,所述第一类样本所包含的令牌词和或搜索词,在指定时间段内的检索数量小于第一数量阈值,所述第二类样本所包含的令牌词和或搜索词,在所述指定时间段内的检索数量大于第二数量阈值,每一样本的样本特征包括基于该样本中的令牌词所确定的令牌特征,和基于该样本中的搜索词所确定的搜索特征; 基于所获取的样本特征,构建M个样本特征组,并确定每一样本特征组的第一标注信息;其中,M为大于N的正整数;若该样本特征组内各样本特征中的令牌特征和搜索特征均相同,则第一标注信息为正样本,反之为负样本; 利用各样本特征组以及每一样本特征组的第一标注信息,对预训练模型进行训练,并返回执行所述获取第一样本集中N个样本的样本特征的步骤,直至所述预训练模型的损失函数值收敛,其中,所述预训练模型的损失函数值为:基于所述预训练模型针对样本特征组所输出的正负样本预测结果与第一标注信息所确定的,所述预训练模型包括针对令牌特征和搜索特征进行特征提取的特征提取层; 利用第二样本集中的样本特征对待训练的搜索词排序模型进行训练,直至所述待训练的搜索词排序模型的损失函数值收敛,得到训练完成的搜索词排序模型;其中,所述待训练的搜索词排序模型的损失函数值为:基于所述待训练的搜索词排序模型针对样本特征所输出的点击率预测结果与所标注的点击率所确定,所述待训练的搜索词排序模型为基于训练完成的所述预训练模型中的特征提取层所构建的。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京爱奇艺科技有限公司,其通讯地址为:100080 北京市海淀区海淀北一街2号鸿城拓展大厦11层1101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。