南京信息工程大学陈邦彦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京信息工程大学申请的专利一种基于强化学习的多智能体协同动态目标拦截决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121069790B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511604573.X,技术领域涉及:G05B13/04;该发明授权一种基于强化学习的多智能体协同动态目标拦截决策方法是由陈邦彦;苏洋设计研发完成,并于2025-11-05向国家知识产权局提交的专利申请。
本一种基于强化学习的多智能体协同动态目标拦截决策方法在说明书摘要公布了:本发明公开了一种基于强化学习的多智能体协同动态目标拦截决策方法,包括:初始化环境和智能体;对拦截目标的状态进行预测;基于多智能体的预测性拦截成本对全局最优任务进行分配;为每个智能体构建一个基于近端策略优化算法PPO的自主控制模型,并设计未来碰撞感知的状态表征向量;将状态表征向量输入智能体的神经网络中,输出动作指令;设计多目标的奖励函数,用于在训练过程中引导智能体进行行为上学习;本发明智能体具备更高级的策略。更精细的状态表示和更复杂的奖励函数设计,使得通过PPO训练的智能体不仅能准确执行对目标的追击任务,还能学会自主避障、降低能耗、提高效率等高级策略。
本发明授权一种基于强化学习的多智能体协同动态目标拦截决策方法在权利要求书中公布了:1.一种基于强化学习的多智能体协同动态目标拦截决策方法,其特征在于,包括如下步骤: 步骤1、初始化环境和智能体; 步骤2、对拦截目标的状态进行预测; 步骤3、基于多智能体的预测性拦截成本对全局最优任务进行分配; 步骤3具体为:构建基于预估拦截时间为成本的全局最优任务分配模型,代表智能体i拦截目标j的预估成本,成本是动态计算的预估拦截时间,其计算方式如下: 1其中,,分别为智能体i和目标j的当前位置向量;‖ ‖表示欧几里得范数;为目标j当前的位置速度;为智能体的最大速度;是一个可选的任务切换惩罚项,用于提升分配方案的稳定性;分子项表示智能体i与目标j之间的直线距离;分母项考虑目标速度在两者连线方向上的投影,通过分母项动态评估目标的拦截难度:其值越小,代表此时目标速度与智能体最大速度越接近,智能体追上目标的难度越大; 步骤4、为每个智能体构建一个基于近端策略优化算法PPO的自主控制模型,并设计未来碰撞感知的状态表征向量;将状态表征向量输入智能体的神经网络中,输出动作指令; 步骤5、设计多目标的奖励函数,用于在训练过程中引导智能体进行行为上学习; 步骤6、重复执行步骤2至步骤5,直到所有拦截目标都被拦截或整个回合达到最大仿真步长,完成多智能体的协同动态目标拦截决策。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210032 江苏省南京市江北新区宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励