西安电子科技大学魏大卫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利面向多无人机协同的动作鲁棒安全控制方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119717536B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411914178.7,技术领域涉及:G05B13/04;该发明授权面向多无人机协同的动作鲁棒安全控制方法、系统及介质是由魏大卫;李珂莹;张莫涵;刘文瑾;习宁;马建峰设计研发完成,并于2024-12-24向国家知识产权局提交的专利申请。
本面向多无人机协同的动作鲁棒安全控制方法、系统及介质在说明书摘要公布了:一种面向多无人机协同的动作鲁棒安全控制方法、系统及介质,方法包括在环境不确定性因素的干扰下,基于构造的多无人机协同飞行仿真模型,对无人机集群进行训练来更新多无人机的飞行策略;同时建立经验池,更新多无人机状态;抽取经验池中的样本,计算多无人机协同控制鲁棒性的预期收益,并根据多无人机协同控制鲁棒性的预期收益更新批评家网络;构建基于动作鲁棒的深度强化学习算法模型,执行安全性梯度下降,以更新动作网络;更新目标策略网络;在目标策略网络更新后的状态下增加不同的扰动,观察不同动作扰动情况下的奖励值,若奖励值满足收敛性则保存当前策略,否则返回重新抽取经验池中的样本。本发明提高了多无人机协同控制的安全性。
本发明授权面向多无人机协同的动作鲁棒安全控制方法、系统及介质在权利要求书中公布了:1.一种面向多无人机协同的动作鲁棒安全控制方法,其特征在于,包括: 获取多无人机的目标函数,构造多无人机协同飞行仿真模型; 初始化多无人机的状态,设定一个随机的动作探索过程,选择多无人机的初始动作,初始化策略网络和批评家网络; 在环境不确定性因素的干扰下,基于构造的多无人机协同飞行仿真模型,对无人机集群进行训练来更新多无人机的飞行策略;同时建立经验池,更新多无人机状态; 抽取经验池中的样本,计算多无人机协同控制鲁棒性的预期收益,并根据多无人机协同控制鲁棒性的预期收益更新批评家网络; 构建基于动作鲁棒的深度强化学习算法模型,执行安全性梯度下降,以更新动作网络; 更新目标策略网络; 在目标策略网络更新后的状态下增加不同的扰动,观察不同动作扰动情况下的奖励值,若奖励值满足收敛性则保存当前策略,否则返回重新抽取经验池中的样本; 所述初始化多无人机的状态,设定一个随机的动作探索过程,选择多无人机的初始动作,初始化策略网络和批评家网络的步骤包括:根据表达式选择无人机动作,式中,au为无人机动作,为多智能体深度确定性策略梯度算法MADDPG中的确定性策略,Ou为无人机的观测状态,为时隙时无人机的随机动作探索过程; 所述构建基于动作鲁棒的深度强化学习算法模型,执行安全性梯度下降,以更新动作网络的步骤包括: 按如下方式构建基于动作鲁棒的深度强化学习算法模型: 记无人机初始状态为s,在此状态下选择动作at,则无人机以1-α的概率执行无干扰情况下的理想动作fs;θπ,由无人机的策略参数θπ控制;无人机以α的概率执行在对抗者攻击情况下的动作由对抗者的策略参数横线控制;α为进行对抗性动作的概率,α∈0,1]; 根据策略梯度网络更新无人机u在干扰下的策略参数: θu为无人机u的策略参数,为对手的策略参数,α为进行对抗性动作的概率,S为无人机集群状态,为无人机集中动作函数,x={o1,...,ou}为多无人机观测状态结果,μuau|ou为无人机u的确定性策略,为无人机在干扰下的混合策略; 根据梯度信息更新对手的策略参数,使对手的长期回报最小化: 式中,更新后对手的策略参数为更新前的对手参数为 表示与其相应梯度的点积,该点积用于指导更新的方向和幅度,为当前对手的策略; φ为批评家网络,在动作鲁棒的深度强化学习PR-MDP算法中更新批评家网络表示为: 式中,θ为无人机目标网络,为对手的目标网络,r为无人机的奖励值,γ表示折扣因子,0<γ<1,α∈0,1为进行对抗性动作的概率,Qs';fs';θ表示无人机在状态S'下的期望回报,表示对手在S'状态下的期望回报; 通过动作鲁棒的深度强化学习PR-MDP算法执行安全性梯度下降,以计算安全性梯度下降最小化来更新无人机和对手的动作网络,计算表达式如下:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励