Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中电信人工智能科技(北京)有限公司黄钰瑶获国家专利权

中电信人工智能科技(北京)有限公司黄钰瑶获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中电信人工智能科技(北京)有限公司申请的专利基于数据排序的大模型微调训练方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118965048B

龙图腾网通过国家知识产权局官网在2026-05-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411155152.9,技术领域涉及:G06F18/23213;该发明授权基于数据排序的大模型微调训练方法、系统、设备及介质是由黄钰瑶;李学龙;赵宇;宋双永;李永翔设计研发完成,并于2024-08-21向国家知识产权局提交的专利申请。

基于数据排序的大模型微调训练方法、系统、设备及介质在说明书摘要公布了:本发明公开了基于数据排序的大模型微调训练方法、系统、设备及介质,包括:从微调训练数据中选取多个预热训练数据,通过预热训练数据对目标大模型进行预热,得到预热大模型;根据预热大模型确定微调训练数据的输入问题向量和质量得分;根据质量得分对微调训练数据进行划分,得到简单训练数据和复杂训练数据,进而根据输入问题向量对简单训练数据和复杂训练数据分别进行向量聚类和排序,得到简单排序数据和复杂排序数据;依次通过简单排序数据和复杂排序数据对预热大模型进行多阶段微调训练,得到目标微调大模型。本发明提高了大模型微调训练的效率以及模型性能,可应用于人工智能技术领域。

本发明授权基于数据排序的大模型微调训练方法、系统、设备及介质在权利要求书中公布了:1.一种基于数据排序的大模型微调训练方法,其特征在于,包括以下步骤: 从微调训练数据中选取多个预热训练数据,通过所述预热训练数据对目标大模型进行预热,得到预热大模型; 根据所述预热大模型确定所述微调训练数据的输入问题向量和质量得分; 根据所述质量得分对所述微调训练数据进行划分,得到简单训练数据和复杂训练数据,进而根据所述输入问题向量对所述简单训练数据和所述复杂训练数据分别进行向量聚类和排序,得到简单排序数据和复杂排序数据; 依次通过所述简单排序数据和所述复杂排序数据对所述预热大模型进行多阶段微调训练,得到目标微调大模型; 所述根据所述预热大模型确定所述微调训练数据的输入问题向量和质量得分,其具体包括: 通过所述预热大模型对所述微调训练数据进行推理,获取各所述微调训练数据的所述输入问题向量,并确定各所述微调训练数据的模型拟合难度; 确定各所述微调训练数据的答案长度,根据所述模型拟合难度和所述答案长度确定各所述微调训练数据的所述质量得分; 其中,所述质量得分与所述模型拟合难度呈正相关,所述质量得分与所述答案长度呈负相关,所述目标微调大模型用于输入问题文本并输出答案文本,所述输入问题向量为所述微调训练数据的问题文本的embedding向量,所述答案长度为所述微调训练数据的答案文本的长度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信人工智能科技(北京)有限公司,其通讯地址为:100032 北京市西城区西四北大街156、158、160号2幢1至2层2-6、2-9内01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。