南京理工大学张洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120871645B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511403591.1,技术领域涉及:G05B13/04;该发明授权基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统是由张洋;马立丰;郜晨;张鑫烨设计研发完成,并于2025-09-29向国家知识产权局提交的专利申请。
本基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统在说明书摘要公布了:本发明公开了一种基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统,该方法包括建立在故障与未知分布干扰下的多智能体系统状态空间模型;构建内层容错控制系统与外层鲁棒控制系统;基于Q学习算法设计内部容错控制增益;基于瓦瑟斯坦距离及零和博弈框架设计外层鲁棒控制增益和偏置项;结合邻域状态信息设计分布式一致性协议。本方法在系统模型未知、执行器存在加性时变故障、外部扰动概率分布不确定且仅凭有限样本的情况下,能够有效降低补偿故障与扰动的影响,并且在满足H无穷性能约束的同时,实现所有智能体的渐近状态同步,确保系统稳定。
本发明授权基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统在权利要求书中公布了:1.一种基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法,其特征在于:包括: 步骤1、建立存在执行器故障与具有未知概率分布的随机扰动的离散时间多智能体系统数学模型; 步骤2、基于离散时间多智能体系统数学模型,构建内层容错控制系统与外层鲁棒控制系统; 步骤3、设计内层容错控制系统控制器和局部价值函数,基于Q学习算法求解内层容错控制系统控制器的最优增益,使局部价值函数最小化; 步骤4、基于瓦瑟斯坦距离及零和博弈框架下设计外层鲁棒控制系统的局部性能指标函数,通过Q学习算法求解最优增益和偏置项,使局部性能指标函数最小化,结合邻域状态信息、增益和偏置项,设计外层鲁棒控制系统控制器; 步骤5、结合内层容错控制系统控制器和外层鲁棒控制系统控制器,设计分布式一致性控制器,进行多智能体系统的控制; 步骤1中所述离散时间多智能体系统数学模型为: ; 其中,、和分别表示第个智能体的状态、执行器故障输入信号和具有未知概率分布的外部随机干扰,A、B和E是未知的时不变系统矩阵,、和分别表示为维、维和维列向量,为当前时刻的离散时间步,为下一时刻的离散时间步,所述执行器故障输入信号为: ; 其中,为未知的时变加性执行器故障,为待设计的分布式一致性控制输入,为能量有限空间,为智能体数量; 步骤2中所述内层容错控制系统为: 其中,变量是外层鲁棒控制系统状态,为待设计的内层容错控制系统控制器; 所述外层鲁棒控制系统为: 其中,为待设计的外层鲁棒控制系统控制器; 基于瓦瑟斯坦距离及零和博弈框架下设计外层鲁棒控制系统的局部性能指标函数为: 其中,,,为惩罚参数,是折现因子,为测试输入信号,为测试随机干扰输入信号,为待求解的外层鲁棒控制系统控制增益,为测试随机干扰输入信号增益矩阵,表示为随机变量的数学期望,表示瓦瑟斯坦距离,,是集中于干扰样本的狄拉克测度,为干扰样本个数,和为偏置项; 步骤4中求解最优增益和偏置项的Q学习算法的Q函数为: ; 其中,矩阵、和常数为: ,,; 其中,,和为常数;和的各子矩阵为:,,,,,,,,,,,,,为线性系数向量,参数、和的计算表达式为: , , ; 通过Q学习在线策略迭代算法求解最优控制增益及偏置项为: ,, ,; 其中,为的最优解,为的最优解。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励