哈尔滨工业大学张立宪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于深度强化学习的多无人机编队控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120491673B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510990909.4,技术领域涉及:G05D1/46;该发明授权一种基于深度强化学习的多无人机编队控制方法及系统是由张立宪;朱益民;张舜智;杜蔚峰;韦章宇;李博;吴桐;杨嘉楠设计研发完成,并于2025-07-18向国家知识产权局提交的专利申请。
本一种基于深度强化学习的多无人机编队控制方法及系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的多无人机编队控制方法及系统,涉及无人机控制领域,为解决现有编队中的无人机应对模型不确定性和多源干扰时,难以确保高的鲁棒性、安全性及可靠性的问题。包括:步骤1:考虑到无人机在穿越狭窄通道飞行时所面临的外部气流干扰,构建外部气流干扰模型;步骤2:构建外部气流干扰影响的无人机飞行动力学模型;步骤3:以PD控制器为基础控制器,并采用基于UDE的控制器针对模型不确定性及多源干扰进行估计与补偿;步骤4:构建基于深度强化学习的无人机鲁棒控制优化的状态空间以及动作空间,并构建侧重位置跟踪、姿态稳定、控制平滑与安全的分段奖励函数,提升无人机在复杂干扰下的自适应能力。
本发明授权一种基于深度强化学习的多无人机编队控制方法及系统在权利要求书中公布了:1.一种基于深度强化学习的多无人机编队控制方法,其特征在于,包括如下步骤: 步骤1:考虑到无人机在穿越狭窄通道飞行时所面临的外部气流干扰,构建外部气流干扰的数学模型; 步骤2:构建外部气流干扰影响的无人机飞行动力学模型; 步骤3:以PD控制器为基础控制器,并采用基于UDE的控制器针对模型不确定性及多源干扰进行估计与补偿; 步骤4:构建基于深度强化学习的无人机鲁棒控制优化的状态空间以及动作空间,并构建侧重位置跟踪、姿态稳定、控制平滑与安全的分段奖励函数; 步骤3包括如下过程: 以PD控制器作为基础控制器,基于UDE的控制器结构为: 其中u是总体控制输入,u0是基础控制器,是UDE提供的干扰补偿量; 定义无人机的姿态角误差eγ为: eγ=Θdes-Θ11 Θdes=[φdes,θdes,ψdes]T=[ux,uy,ψdes]T12 其中ux,uy是无人机的外环控制输入,ψdes是期望偏航角,Θ=[θ,φ,ψ]T为无人机在机体坐标系下姿态角,上角标des代表期望; 通过PD控制,得到无人机的期望角速度: 其中,kp,γ,kd,γ为角度环比例项、微分项反馈增益; 定义无人机的旋转角速度误差eσ为: eσ=ωdes-ω14 其中,ω=[p,q,r]T为无人机在机体坐标系下的旋转角速度; 通过PD控制,得到无人机内环基础控制器的控制输出: 其中,kp,σ,kd,σ为角速度环比例项、微分项反馈增益; 定义无人机的位置误差eα为: eα=pdes-p16 其中,p=[x,y,z]T代表无人机在惯性坐标系下的位置; 定义无人机的速度误差eβ为: eβ=vdes-v17其中,代表无人机在惯性坐标系下的速度; 以vdes为速度控制器的输入,得到外环基础控制器的控制输出为: 其中kp,β,kd,β为外环比例项、微分项反馈增益; 采用UDE对无人机的干扰进行估计与补偿; 假定干扰估计信号与原干扰信号d存在如下关系: 式中Gs是低通滤波器; 将式10带入式9,得到如下恒等变换: 其中,η=[x,y,z,θ,φ,ψ],g=[0,0,g,0,0,0]T; 将19代入20得: 其中是拉普拉斯变换算子,E是单位矩阵,整理式19-21得到: 考虑设计滤波器Gs=[Gxs,Gys,Gzs,Gφs,Gθs,Gψs]为: 其中,Tλ是滤波器一阶时间常数,s是拉普拉斯变换后的复数自变量; 结合方程22~23得到UDE的频域表达形式为: 其中,T为UDE积分环节增益系数; 通过拉氏反变换得到UDE的时域表达形式为: 其中,ηt、η0分别为t时刻、初始时刻的位姿状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。