上海库帕思科技有限公司山栋明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海库帕思科技有限公司申请的专利一种指令数据的筛选方法、设备、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120653995B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511156725.4,技术领域涉及:G06F18/214;该发明授权一种指令数据的筛选方法、设备、介质及产品是由山栋明;黄海清;王长冕;刘俊毅设计研发完成,并于2025-08-19向国家知识产权局提交的专利申请。
本一种指令数据的筛选方法、设备、介质及产品在说明书摘要公布了:本申请涉及信息技术领域,公开了一种指令数据的筛选方法、设备、介质及产品。方法包括:根据预训练的轻量级通用语言模型和目标样本集,确定第一困惑度和第二困惑度;第一困惑度,用于表征在有指令条件下的预测困惑度;第二困惑度,用于表征在无指令条件下的预测困惑度;根据第一困惑度和第二困惑度,确定信息增益评分;信息增益评分,用于量化指令内容对降低响应内容生成难度的贡献度;根据信息增益评分和所述目标样本集,确定训练数据集;所述训练数据集,用于提升大型语言模型在指令微调阶段的泛化能力和指令遵循精度。可以至少用以解决部署门槛高、成本高昂、存在监督依赖、训练效率低下及模型泛化能力差的技术问题。
本发明授权一种指令数据的筛选方法、设备、介质及产品在权利要求书中公布了:1.一种指令数据的筛选方法,其特征在于,所述方法包括: 根据预训练的轻量级通用语言模型和目标样本集,确定第一困惑度和第二困惑度;所述第一困惑度,用于表征在有指令条件下的预测困惑度,在有指令的条件下,输入格式包括指令和输入文本;所述第二困惑度,用于表征在无指令条件下的预测困惑度,在无指令的条件下,输入格式仅包含输入文本; 根据所述第一困惑度和所述第二困惑度,确定信息增益评分;所述信息增益评分,用于量化指令内容对降低响应内容生成难度的贡献度; 根据所述信息增益评分和所述目标样本集,确定训练数据集;所述训练数据集,用于提升大型语言模型在指令微调阶段的泛化能力和指令遵循精度; 所述根据所述信息增益评分和所述目标样本集,确定训练数据集包括: 根据所述目标样本集和所述信息增益评分,得到每条样本的优度评分;根据每条样本的优度评分,确定训练数据集; 所述根据所述目标样本集和所述信息增益评分,得到每条样本的优度评分包括: 计算目标样本集中每条样本的响应熵、词长因子、内容覆盖度;其中,响应熵用以衡量在有指令的条件下生成响应序列的不确定性或多样性,词长因子用于对偏离预设的理想响应长度均值的生成结果进行惩罚;内容覆盖度为响应序列中唯一出现的关键词数量占全部关键词的比例大小; 计算词长因子的方法为: ; 其中,表示数据中的第个样本;表示响应序列的长度,即Token数量;表示预设的理想响应长度均值;表示长度容忍度,用于控制模型输出响应序列的长度与预设的理想响应长度之间的允许偏差范围;表示第个样本的词长因子; 获取信息增益评分,结合所述响应熵、词长因子、内容覆盖度形成因子集合;所述因子集合,用于表征评价样本质量的指标合集; 根据所述因子集合执行样本评分,得到每条样本的优度评分; 所述优度评分,用于反映样本质量高低,样本质量越高,优度评分越高。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海库帕思科技有限公司,其通讯地址为:200030 上海市徐汇区丰谷路315弄24号1-3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励