北京深势科技有限公司许明军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京深势科技有限公司申请的专利一种自回归大语言模型的知识编辑方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120218023B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510337893.7,技术领域涉及:G06F40/166;该发明授权一种自回归大语言模型的知识编辑方法和装置是由许明军;何雨浓;高志锋;蔡恒兴;张林峰设计研发完成,并于2025-03-21向国家知识产权局提交的专利申请。
本一种自回归大语言模型的知识编辑方法和装置在说明书摘要公布了:本发明实施例涉及一种自回归大语言模型的知识编辑方法和装置,所述方法包括:将自回归大语言模型作为目标模型;并对目标模型的预训练知识库中的各个知识条目进行问题‑答案文本对转换;对各文本对按三类模型推理方式单次正常推理、单次加扰推理、加扰前提下的多次修复推理进行处理得到第一、第二预测文本和第三预测信息集;并基于各文本对的第一、第二预测文本和第三预测信息集进行一次关键层预估;并根据所有预估关键层进行关键层终判,并通过在所有关键层植入低秩矩阵参数的方式对目标模型进行参数重置;并由植入的所有低秩矩阵参数组成植入参数集,并在每次知识编辑过程中只对植入参数集进行更新。本发明可以提高编辑效率、降低编辑成本。
本发明授权一种自回归大语言模型的知识编辑方法和装置在权利要求书中公布了:1.一种自回归大语言模型的知识编辑方法,其特征在于,所述方法包括: 将一款基于Transformer模型结构实现的并已完成预训练和NLP任务微调的自回归大语言模型作为目标模型;并将所述目标模型的推理板块中的各个注意力层或MLP层记为对应的推理层Ai,并对所述推理层Ai的总数进行统计得到总数NA;1≤层索引i≤NA;所述目标模型内部结构分为两大板块:预处理板块和所述推理板块; 为所述目标模型配置问答指令模板;并对所述目标模型的预训练知识库中的各个知识条目进行问题-答案文本对转换得到对应的第一文本对; 将各个所述第一文本对逐个作为对应的当前文本对;并将所述当前文本对的问题文本带入所述问答指令模板生成当前指令文本;并将所述当前指令文本作为模型输入文本输入所述预处理板块进行预处理得到对应的初始向量H0;并将所述初始向量H0输入所述推理板块进行一次正向推理并将当次输出的生成文本作为第一预测文本,并对当次推理过程中所有所述推理层Ai输出的过程向量进行缓存并由所有缓存的过程向量组成向量矩阵M;并对所述初始向量H0进行加扰得到加扰向量;并将所述加扰向量输入所述推理板块进行一次正向推理并将当次输出的生成文本作为第二预测文本;并再将所述加扰向量输入所述推理板块进行一轮NA次正向推理并在本轮的每次推理过程中基于所述向量矩阵M进行一次过程向量修正从而得到一个由NA个第三预测信息组成的第三预测信息集;并基于所述当前文本对对应的所述第一、第二预测文本和所述第三预测信息集进行一次关键层预估得到对应的第一关键层集合; 根据得到的所有所述第一关键层集合进行关键层终判得到第二关键层集合;并通过在所有第二关键层的层权重参数中植入低秩矩阵参数的方式对所述目标模型的模型参数进行重置; 由植入的所有所述低秩矩阵参数组成对应的植入参数集;并在每次知识编辑过程中只对所述植入参数集进行更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京深势科技有限公司,其通讯地址为:100089 北京市海淀区海淀大街3号1幢11层1101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励