Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华东师范大学吴雯获国家专利权

华东师范大学吴雯获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华东师范大学申请的专利一种基于元认知思想的多智能体推理框架构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119476492B

龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411613108.8,技术领域涉及:G06N5/04;该发明授权一种基于元认知思想的多智能体推理框架构建方法是由吴雯;王国庆;周婧;黄婧淇;王柳丁;贺樑设计研发完成,并于2024-11-13向国家知识产权局提交的专利申请。

一种基于元认知思想的多智能体推理框架构建方法在说明书摘要公布了:本发明公开了一种基于元认知思想的多智能体推理框架构建方法,其特点是采用多智能体推理架构模拟人脑思维模式的方法,该方法首先构建元认知智能体训练数据集,并基于思考注入训练范式训练开源大语言模型,使其成为具备思考能力的元认知智能体,而后构建中枢智能体训练数据集,并基于有监督训练范式训练开源大语言模型,使其能够准确地评估任务的困难程度,最后,将未经额外训练的开源大语言模型作为认知智能体,结合元认知智能体与中枢智能体,构建一个能够有效模拟人类元认知思维模式的多智能体推理框架。本发明与现有技术相比具有提升模型解决复杂问题的能力,有效缓解阻碍大语言模型推理能力缺乏串行计算模式和缺乏“思考”能力的两大局限。

本发明授权一种基于元认知思想的多智能体推理框架构建方法在权利要求书中公布了:1.一种基于元认知思想的多智能体推理框架构建方法,其特征在于,采用多智能体推理架构,增强大语言模型的推理能力来模拟人脑的思维模式,该方法具体包括以下步骤:步骤1:构建元认知智能体训练数据集1-1:将思考注入提示词P与用户指令提示词进行拼接,得到输入提示将其输入大语言模型,得到下述a式所示的输出结果:LLM0xi={zi,yi}a;其中,LLM0为未经额外训练的普通大语言模型;zi和yi分别为思考过程和答案;1-2:使用下述b式所示的法官模型Judge判断输出结果中yi的好坏:Judgeyi=label,label∈{pos,neg}b;其中,Judge为判断y好坏的代表法官模型,并为其生成标签label,label=poseg代表当前yi为正样本负样本;1-3:元认知智能体训练数据集Dmeta由下述c式表示为: 其中,和分别为答案中的正负样本;步骤2:通过思考注入训练范式获取元认知智能体2-1:使用直接偏好优化算法,在元认知智能体训练数据集Dmea上训练由下述d式所示的元认知智能体Agentmeta的损失函数L: 其中,π=LLM0为待训练的大语言模型;2-2:最小化上述损失函数L,得到由下述e式所示的“慢思考”Agentmeta: 其中,表示寻找使得L最小的π;所述“慢思考”Agentmeta在生成答案的同时隐式地生成下述f式表示的思考过程Agentmetax:Agentmetax={zlatent,y}f;其中,x、zlatent和y分别代表输入、隐式的思考过程和答案输出;步骤三、构建中枢智能体训练数据集3-1:从数学、逻辑推理、通用知识、医疗和法律的多个领域中收集数据样本,将其通过下述g式处理为问答对Multi_data:Multi_data={Qi,Ai}g;其中,Qi,和Ai分别为问题和答案;3-2:依据问题的难易程度将数据样本对分为简单和困难两类,并由下述h式为其打上标签Ri:Dhub={Qi,Ai,Ri}h;其中,Dhub为中枢智能体训练数据集;Ri∈{easy,hard}表示问题的难易程度标签;步骤四、通过有监督微调训练范式获取中枢智能体4-1:使用对分类任务的有监督微调训练范式在中枢智能体训练数据集Dhub上训练LLM0,得到中枢智能体Agenthub,所述训练使用下述i式表示的损失函数Lπ: 其中,π=LLM0为待训练的大语言模型;R和分别为真实难度标签与预测难度标签;4-2:通过最小化损失函数Lπ,得到由下述j式表示的中枢智能体Agenthub: 4-3:使用中枢智能体Agenthub判断输入问题的难易程度,且由下述k式表示的AgenthubQ确定是否启用“慢思考”: 步骤五、基于元认知思想构建多智能体推理框架多智能体推理框架MetaInf由下述l式表示的认知智能体Agentcog、元认知智能体Agentmeta和中枢智能体Agenthub构建而成:MetaInf=Agentcog,Agentmeta,Agenthubl;所述多智能体推理框架MetaInf具有处理简单任务和复杂任务的两种工作模式的多智能体推理框架;所述认知智能体Agentcog为未经训练的大语言模型LLM0担任,处理简单任务的认知智能体;所述元认知智能体Agentmeta为处理复杂任务的智能体;所述中枢智能体Agenthub为引入串行计算的工作模式,在接收到简单任务时激活Agentcog,接收到困难任务时激活Agentmeta,其具体处理如下:5-1:Agenthub判断当前任务为简单时,MetaInf激活简单任务处理模式,即仅使用Agentcog解决任务,具体由下述m~n式表示为:AgenthubQ=easym;O=AgentcogQn;其中,Q为当前任务的查询;O为MetaInf的输出结果;5-2:当Agenthub判断当前任务为困难时,MetaInf激活困难任务处理模式,即先使用Agentcog生成中间结果,再使用Agentmeta结合优化指令来优化中间结果得到最终输出,具体由下述o~q式表示为:如下:AgenthubQ=hardo;S=AgentcogQp;Q=AgentmetaPrefine,Sq;其中,S为中间结果;Prefine,S为优化指令。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。