大连理工大学马松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种针对智能体的自适应最优合作博弈控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115993826B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310025787.6,技术领域涉及:G05D1/43;该发明授权一种针对智能体的自适应最优合作博弈控制方法是由马松;王翊民;孙涛;孙希明;于欣萌;张一凡设计研发完成,并于2023-01-09向国家知识产权局提交的专利申请。
本一种针对智能体的自适应最优合作博弈控制方法在说明书摘要公布了:本发明属于多智能体控制领域,涉及一种针对智能体的自适应最优合作博弈控制方法。本发明的方法能够使车辆系统在运动过程中保持稳定的同时使协作的性能指标最优。首先,对合作博弈中的两个控制器施加噪声信号,并收集一定时间段内的车辆状态数据。然后,找到一对可以使系统稳定的控制策略作为初始控制。最后,利用自适应动态规划方法进行策略迭代,以求得能使协作的性能指标达到最优的合作博弈控制策略。本发明可以对合作博弈问题求解,计算时间少,可以保证系统稳定,并且为全局最优。
本发明授权一种针对智能体的自适应最优合作博弈控制方法在权利要求书中公布了:1.一种针对智能体的自适应最优合作博弈控制方法,其特征在于,步骤如下: 步骤1:构建车辆系统合作博弈方程 其中:u为驾驶员施加于方向盘的控制输入,v为车辆横摆控制器的控制输入,fx为已知的系统矩阵,g1x与g2x分别为两个控制器的输入矩阵;对两个控制器分别施加一个探测输入,u0与v0,其中u0为对方向盘控制器施加的探测噪声,v0为对车辆横摆控制器施加的探测噪声; 采集一段时间内系统的状态变量x, 其中:y为车辆质心的横向位置,vy为车辆质心的横向速度,ψ为横摆角,为横摆率;引用Carsim7中的车辆动力学模型,处于控制目的,对该模型进行简化,假定轮胎侧向力是轮胎侧偏角的线性函数,其fx、g1x、g2x分别满足下式: 其中,m为车辆自身质量,vx为车辆的前向速度,CαF和CαR分别为前后轮胎侧偏刚度,转向传动比rst为方向盘转角与前轮转角的比值,lF、lR分别为车辆前后轮距离车辆质心的轴距;Iz为汽车绕z轴的转动惯量; 步骤2:运用自适应动态规划中策略迭代的方法求得博弈控制器最优解; 对于系统方程1,其中的两个控制器u,v双方共同优化一个性能指标J如下: 其中rxt,ut,vt=qx+uTR1xu+uTR2xv+vTR3xv,R1x、R2x、R3x为权重矩阵;根据贝尔曼最优性原理,得到广义的哈密顿方程如下: 其中值函数V为在最优控制律u*与v*控制作用下的最优性能指标; 两个控制器的最优控制律如下: 步骤3:对于施加探测噪声的系统方程定义αi=u0-ui,βi=v0-vi,ui,vi为第i次迭代后得到的控制律;将系统方程重写为: 对于任意的i≥0,值函数的导数满足下式: 以当前时刻t,积分时间段T,对7式在时间段[t,t+T]中进行积分可以得到下式: 分别使用三个基函数近似的替代值函数V以及控制策略u、v; 其中φjx,ψjx为不同基函数,N1,N2分别为基函数的个数,ci,j、ωi,j、σi,j分别代表着3个基函数的权重;将公式12、公式13、公式14代入的公式11中,得到迭代方程如下: 其中tk为以T为时间间隔从0开始严格递增的时间序列,ui与vi为上一次迭代得到的控制律; 步骤4:首先将采集到的状态变量以时间间隔T分为N组,根据公式15的需要处理数据,然后以四阶以内的多项式函数作为基函数的基底,并确定控制策略的初始权重ω0、σ0; 通过公式15进行迭代更新ω、σ、c的值,直至值函数V收敛时停止迭代,迭代后得到的控制策略即为最优控制方法。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励