微软技术许可有限责任公司Y·马获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉微软技术许可有限责任公司申请的专利用于模型探索的数据采样获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113939829B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202080043172.0,技术领域涉及:G06F18/214;该发明授权用于模型探索的数据采样是由Y·马;M·L·布朗;B-C·陈;吴晟;贾骏;龙波设计研发完成,并于2020-05-11向国家知识产权局提交的专利申请。
本用于模型探索的数据采样在说明书摘要公布了:所公开的实施例提供了用于处理数据的系统。在操作期间,所述系统获得包含与第一标识符ID值集合相关联的第一记录集合的训练数据集和包含与第二ID值集合相关联的第二记录集合的评估数据集。接下来,所述系统从所述第二ID值集合中选择随机ID值子集。所述系统然后生成经采样的评估数据集,所述经采样的评估数据集包括所述第二记录集合中的与所述随机ID值子集相关联的第一记录子集。所述系统还生成经采样的训练数据集,所述经采样的训练数据集包括所述第一记录集合中的与所述随机ID值子集相关联的第二记录子集。最后,所述系统输出所述经采样的训练数据集和所述经采样的评估数据集,以用于训练和评估机器学习模型。
本发明授权用于模型探索的数据采样在权利要求书中公布了:1.一种方法,包括: 获得包括与第一实体标识符ID的第一ID值集合相关联的第一记录集合的训练数据集和包括与所述第一实体ID的第二ID值集合相关联的第二记录集合的评估数据集,其中,所述第一实体ID表示通过在线网络搜索或申请职位的成员,并且所述训练数据集和所述评估数据集包括与成员和职位之间的交互和或兼容性相关的信息; 从所述第二ID值集合中选择所述第一实体ID的随机ID值子集; 从所述第二记录集合生成经采样的评估数据集,所述经采样的评估数据集包括与从所述第二记录集合中随机选择的所述ID值子集相关联的第一记录子集; 从所述第一记录集合生成经采样的训练数据集,所述经采样的训练数据集包括与从所述第二记录集合中随机选择的所述ID值子集相关联的第二记录子集; 使用所述经采样的训练数据集和第一训练配置来训练第一机器学习模型的全局版本和第一个性化版本集合; 使用所述经采样的评估数据集来评估所述第一机器学习模型的第一性能; 将所述第一机器学习模型的所述第一性能与使用第二训练配置训练的第二机器学习模型的第二性能进行比较,以识别所述第一机器学习模型和所述第二机器学习模型内性能最高的机器学习模型;以及 使用用于所述性能最高的机器学习模型的训练配置和所述训练数据集来训练第三机器学习模型,其中,训练所述第三机器学习模型包括:i从所述全局版本的所述训练配置中获得正则化超参数;以及ii通过由所述经采样的训练数据集代表的所述训练数据集的比例的倒数来对所述正则化超参数进行缩放, 其中,所述第一机器学习模型、所述第二机器学习模型和所述第三机器学习模型用于生成成员对所推荐的职位进行积极响应的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人微软技术许可有限责任公司,其通讯地址为:美国华盛顿州;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。