北京百度网讯科技有限公司刘昊骋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利一种特征编码方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114881163B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210564917.9,技术领域涉及:G06F18/2431;该发明授权一种特征编码方法、装置、设备和介质是由刘昊骋;陈才;徐世界设计研发完成,并于2022-05-23向国家知识产权局提交的专利申请。
本一种特征编码方法、装置、设备和介质在说明书摘要公布了:本公开提供了一种特征编码方法、装置、设备、介质和程序产品,涉及机器学习技术领域,尤其涉及智慧金融、人工智能和深度学习技术。具体实现方案为:根据多个对象的样本数,和至少两种类别下多个对象的样本数,计算多个对象在至少两种类别中的第一权重,其中,所述模型训练的目标是使模型在至少两种类别中对输入的对象进行分类;根据第一权重对多个对象进行分箱,得到多个对象分箱;根据多个对象分箱的样本数,和至少两种类别下多个对象分箱的样本数,计算多个对象分箱在至少两种类别中的第二权重,并将多个对象分箱的第二权重作为多个对象分箱的特征取值。本公开可以提升稀疏特征的覆盖度、单调性和区分度,从而增强模型训练效果。
本发明授权一种特征编码方法、装置、设备和介质在权利要求书中公布了:1.一种特征编码方法,包括:根据多个对象的样本数,和至少两种类别下所述多个对象的样本数,计算所述多个对象在所述至少两种类别中的第一权重,其中,模型训练的目标是使所述模型在所述至少两种类别中对输入的对象进行分类;所述模型为二分类模型,所述类别包括正样本所属类别和负样本所属类别,且所述正样本为稀疏样本;所述稀疏样本表示样本数在总样本中占比低;所述对象是指应用程序;根据所述第一权重对所述多个对象进行分箱,得到多个对象分箱;根据所述多个对象分箱的样本数,和所述至少两种类别下所述多个对象分箱的样本数,计算所述多个对象分箱在所述至少两种类别中的第二权重,并将所述多个对象分箱的第二权重作为所述多个对象分箱的特征取值;其中,所述计算所述多个对象在所述至少两种类别中的第一权重,包括:根据所述多个对象的样本数,以及所述多个对象的样本数之和,计算所述多个对象的逆向文件频率;根据所述多个对象的样本中的正样本总数,以及所述多个对象的样本数之和,计算所述多个对象的正样本占比;将所述多个对象的逆向文件频率与所述正样本占比相乘的结果,作为所述多个对象在所述正样本所属类别中的第一权重;所述第一权重用于表示多个对象中各对象在每种类别中的重要程度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励