浪潮通用软件有限公司宋刚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮通用软件有限公司申请的专利一种大模型多类型工具协同推理方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120745849B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511261103.8,技术领域涉及:G06N5/04;该发明授权一种大模型多类型工具协同推理方法、系统及设备是由宋刚;郑伟波;路宽;丁一凡;韩嘉懿;杜宏伟;路鹏程;张士良;刘继乔;刘金桐设计研发完成,并于2025-09-05向国家知识产权局提交的专利申请。
本一种大模型多类型工具协同推理方法、系统及设备在说明书摘要公布了:本发明公开一种大模型多类型工具协同推理方法、系统及设备,涉及人工智能和自然语言处理技术领域,包括:针对原推理路径,计算每次调用推理工具后当前推理节点的熵值,并以此确定熵变化量,根据熵变化量与阈值的比较,确定高token熵节点;在高token熵节点处进行下一次推理工具调用时,随机调用与原推理路径不同的推理工具并继续执行推理过程,生成新推理路径;将原推理路径和生成的所有新推理路径作为训练集,对大模型基于强化学习算法进行训练。设计基于token熵的自适应探索与强化学习策略,实现了大模型在不确定情况下的推理工具选择策略的智能化提升,提高最终答案的推理准确性。
本发明授权一种大模型多类型工具协同推理方法、系统及设备在权利要求书中公布了:1.一种大模型多类型工具协同推理方法,其特征在于,包括: 针对大模型对自然语言查询的问题生成的原推理路径,计算每次调用推理工具后,大模型生成的推理节点的前个token片段的熵均值,并以此作为当前推理节点的熵值; 根据当前推理节点、上一推理节点和初始推理节点的熵值,确定当前推理节点的熵变化量,根据熵变化量与设定熵变化阈值的比较,确定高token熵节点; 在高token熵节点处进行下一次推理工具调用时,随机调用与原推理路径不同的推理工具并继续执行推理过程,生成新推理路径,对新推理路径继续计算各推理节点的熵值,直至无高token熵节点; 将原推理路径和生成的所有新推理路径作为训练集,对大模型基于强化学习算法进行训练; 对待处理问题采用训练后的大模型生成最终答案; 针对大模型对问题生成的每条推理路径,对于第次推理工具调用阶段,计算大模型生成的推理节点的前个token片段的熵均值,并以此作为当前推理节点的熵值; 同时考虑当前推理节点的熵值,相对于上一推理节点的熵值和初始推理节点的熵值的增益情况,定义当前推理节点的熵变化量为: ; 其中,为当前推理节点的熵值;为上一推理节点的熵值;为初始推理节点的熵值;为词典大小; 熵变化量与设定熵变化阈值的比较的过程包括: 若当前推理节点的熵变化量小于熵变化阈值时,保持原推理路径的多类型工具调用策略; 若当前推理节点的熵变化量大于或等于熵变化阈值时,判定当前推理节点为高token熵节点; 对大模型基于强化学习算法进行训练的过程建模为: ; 其中,为数学期望函数,为分组数量,为查询生成结果,为限制变化范围,为clip范围参数;为组内相对优势;表示KL正则项;为重要性采样比率;为模型可学习参数; 对问题,采用大模型基于多类型工具协同推理的过程建模为: ; 其中,因子表示多类型工具调用的推理过程,表示思维链中的token数量,为位置的token,表示位置之前的所有token;表示引入推理工具集的模型指令;表示位置之前所有历史调用推理工具的反馈;因子表示答案生成过程,表示答案的token数量,为位置的模型生成结果,为位置之前的模型历史生成结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮通用软件有限公司,其通讯地址为:250000 山东省济南市历下区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励