浙江大学吴飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种敦煌垂直领域大模型训练方法、系统、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119322830B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411349613.6,技术领域涉及:G06F16/3329;该发明授权一种敦煌垂直领域大模型训练方法、系统、介质及设备是由吴飞;窦怀永;张圣宇;贺宝仪;张钰清;张涌泉;严骏驰设计研发完成,并于2024-09-26向国家知识产权局提交的专利申请。
本一种敦煌垂直领域大模型训练方法、系统、介质及设备在说明书摘要公布了:本发明公开了一种敦煌垂直领域大模型训练方法、系统、介质及设备,属于人工智能领域和文化领域。本发明通过整理敦煌大辞典、敦煌概论、敦煌18讲等敦煌垂直领域知识,形成了敦煌指令微调数据和“关键词‑解释”的字典类向量知识库,通过继续预训练、有监督微调、外挂向量知识库等步骤,训练出了面向文化旅游和语言专家的敦煌垂直领域大模型。进而提出PhiloCoP框架,以便于敦煌垂直领域大模型的应用。本发明为敦煌爱好者和考古学家提供了更便利的查询知识和辅助研究的工具,有助于在更大范围内更便捷的宣传敦煌文化,能够应用在古代语言学研究领域和旅游场景。
本发明授权一种敦煌垂直领域大模型训练方法、系统、介质及设备在权利要求书中公布了:1.一种敦煌垂直领域大模型的问答系统,其特征在于,包括: 模型获取模块,用于获取按照一种敦煌垂直领域大模型训练方法训练得到的敦煌垂直领域大模型; 第一处理模块,用于将用户问题输入到敦煌垂直领域大模型中,对用户问题进行命名实体识别、提取和分类,得到用户问题中出现的各类命名实体; 第二处理模块,用于将用户问题和用户问题中出现的各类命名实体输入到敦煌垂直领域大模型中,推理命名实体间的隐含关系,得到关系网; 第三处理模块,用于将用户问题和用户问题中出现的各类命名实体以及关系网输入到敦煌垂直领域大模型中,对用户问题中的文言文进行翻译,得到用户问题中文言文的现代汉语翻译; 结果获取模块,用于将用户问题、用户问题中出现的各类命名实体、关系网和用户问题中文言文的现代汉语翻译输入到敦煌垂直领域大模型中,得到用户问题的答案; 一种敦煌垂直领域大模型训练方法包括以下步骤: S1、将基座大语言模型在通用以及敦煌领域的无标签文本上继续预训练,得到继续预训练后的大语言模型; S2、根据预设的下游任务构造对应领域的敦煌指令微调数据,获取通用指令微调数据,对继续预训练后的大语言模型在敦煌指令微调数据以及通用指令微调数据上进行指令微调,得到指令微调后的大语言模型;其中,下游任务共有九个,分别为文字修复、拼接、年代归因、命名实体识别、主题建模、判断、问答、分析、以及推理; S3、将预先构造好的向量知识库外挂到指令微调后的大语言模型上,得到最终训练好的敦煌垂直领域大模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励