Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东财经大学贾海彦获国家专利权

山东财经大学贾海彦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东财经大学申请的专利大模型微调训练系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119443275B

龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411533636.2,技术领域涉及:G06N5/04;该发明授权大模型微调训练系统是由贾海彦;韩琭;段培新;王得成;孙卫华设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。

大模型微调训练系统在说明书摘要公布了:本发明公开了大模型微调训练系统,属于教育教学模型训练技术领域,系统中,数据获取子系统负责搜集包含与人文社科领域有关的训练和验证问题‑答案对的数据集,这些数据来自专业教材、学术论文和实习案例;模型微调子系统采用小样本学习方法对选定的通用大模型进行训练和微调,输出微调后的模型;微调后模型验证子系统评估微调模型的性能,根据评估结果决定是否需要进一步优化模型,以确保模型的准确性和实用性。本发明提高了模型在教育教学领域中的精准度和实用性,且通过对数据进行筛分以及难度分级,确保每一步数据处理都是为了提高最终模型的质量和效率,从而使模型更好地适应具体的教育教学应用场景和需求。

本发明授权大模型微调训练系统在权利要求书中公布了:1.大模型微调训练系统,其特征在于,包括数据获取子系统,模型微调子系统和微调后模型验证子系统,其中: 数据获取子系统用于获取人文社科领域的训练数据和验证数据,训练数据中包括若干个训练问题-训练答案对,验证数据包括若干个验证问题-验证答案对; 模型微调子系统用于确定待微调通用大模型,并基于训练数据和小样本学习对确定的通用大模型进行训练微调,输出用于人文社科领域的微调后大模型; 微调后模型验证子系统用于基于验证数据对微调后大模型的性能进行评估,并基于评估结果确定微调后大模型是否需要优化: 若不需要优化,则输出验证后的微调后大模型; 若需要优化,则重置确定的通用大模型的初始参数并输送给模型微调子系统,由模型微调子系统基于获取的人文社科领域的训练数据重新进行微调; 所述获取训练数据,包括以下步骤: 获取与人文社科领域内容相关的待筛选数据,待筛选数据包括待筛选问题和待筛选问题对应的答案,人文社科领域内容包括与经济学、管理学、文学、法学、理学、工学、教育学、艺术学有关的专业教材、学术论文和实习实训案例; 对待筛选数据进行随机分组,获得若干个待筛选数据组; 对各个待筛选数据组分别进行组内筛选,获得筛选后数据组,包括以下步骤: 随机选择待筛选数据组中的任意一个待筛选问题,获取该待筛选问题的待筛选文本关键词组合并保存到该待筛选数据组对应的文本关键词集合中; 逐个获取该待筛选数据组中的下一个待筛选问题的待筛选文本关键词并记为待比对文本关键词组合; 将待比对文本关键词组合与文本关键词集合中的待筛选文本关键词组合逐一进行相似度比对: 若待比对文本关键词组合与文本关键词集合中的任一个待筛选文本关键词组合相似,则删除该待比对文本关键词组合并删除该待比对文本关键词组合对应的待筛选问题以及该待筛选问题对应的答案; 若待比对文本关键词组合与文本关键词集合中的任一个待筛选文本关键词组合都不相似,则将该待比对文本关键词组合保存到文本关键词集合中,同时保留该待比对文本关键词组合对应的待筛选问题以及该待筛选问题对应的答案; 将进行组内筛选后的待筛选数据记为筛选后数据组,并保存该筛选后数据组对应的文本关键词集合; 确定最相似的筛选后数据组对,对筛选后数据组对进行二次筛选,得到二次筛选后数据组,包括以下步骤: 对任意两个筛选后数据组对应的文本关键词集合进行相似度判断: 若两个文本关键词集合不相似,则对应的两个筛选后数据组不进行二次筛选; 若两个文本关键词集合相似,则对应的两个筛选后数据组为最相似的筛选后数据组对; 确定最相似的筛选后数据组对中的两个筛选后数据组中的待筛选问题的数量; 将数量多的筛选后数据组作为基准,另一个数量少的筛选后数据组中的待筛选问题与数量多的筛选后数据组中的待筛选问题进行相似度比对: 若相似,则删除数量少的筛选后数据组中的待筛选问题; 若不相似,则保留数量少的筛选后数据组中的待筛选问题; 输出两个筛选后数据组得到二次筛选后数据组; 拆分二次筛选后数据组和没有进行二次筛选的筛选后数据组,获得训练数据。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东财经大学,其通讯地址为:250014 山东省济南市历下区二环东路7366号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。