Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学徐勇获国家专利权

北京理工大学徐勇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种强化学习驱动的空地无人集群系统协同编队控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120044982B

龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510169736.X,技术领域涉及:G05D1/695;该发明授权一种强化学习驱动的空地无人集群系统协同编队控制方法是由徐勇;杨加秀;万梦颖;张文雨;孙健设计研发完成,并于2025-02-17向国家知识产权局提交的专利申请。

一种强化学习驱动的空地无人集群系统协同编队控制方法在说明书摘要公布了:本公开提供了一种强化学习驱动的空地无人集群系统协同编队控制方法。建立针对空地无人集群系统的动态模型;构建分布式预定义时间观测器来估计虚拟领导者状态,为协同编队跟踪控制提供的状态参考;重构增广空地无人集群系统的动力学模型,进而构建控制增益矩阵。将分段恒定初始激励应用于增广系统并收集存储其前期运行的状态数据,然后根据空地无人系统前期的运行数据,利用数据驱动方法获得初始稳定控制策略,最后基于离线策略强化学习算法和基于数据的初始稳定控制策略,学习最优编队跟踪控制器,实现空地无人系统的最优编队跟踪控制。本发明能够在系统模型未知情况下,根据复杂任务需求实现空地无人集群系统的最优时变编队跟踪控制。

本发明授权一种强化学习驱动的空地无人集群系统协同编队控制方法在权利要求书中公布了:1.一种强化学习驱动的空地无人集群系统协同编队控制方法,其特征在于,空地无人集群系统包括1个虚拟领导者和由M个无人机和N-M个无人车组成的跟随者;该方法包括如下步骤: 步骤一:建立所述空地无人集群系统的动力学模型,包含无人机、无人车的动力学模型、虚拟领导者的动力学模型以及期望编队队形,并转换为全局统一描述模型;其中,通过线性反馈化方法将无人机、无人车的动力学模型解耦为包含参数矩阵和系统状态的线性模型;将空地无人集群系统行进过程中易受影响的系统参数设计到所述参数矩阵中; 步骤二:构建分布式预定义时间观测器,利用观测器估计虚拟领导者状态和编队信息,为空地无人集群系统的编队跟踪提供轨迹参考;分布式预定义时间观测器的收敛时间设置为与观测器参数无关的精确预定义时间; 步骤三:利用所述全局统一描述模型和分布式预定义时间观测器,重构空地无人集群系统的增广动力学模型,设计基于增广动力学模型的最优编队控制器并构建控制增益矩阵; 步骤四:将分段恒定初始激励应用于所述增广动力学模型的各增广子系统,并收集前期运行的系统运行数据;根据前期运行的系统运行数据,利用数据驱动的方法获得初始稳定的控制增益矩阵; 步骤五:进行强化学习离线策略迭代:仅利用所述系统运行数据的积分构建数据存储矩阵,并按照数据索引进一步构建非奇异数据矩阵;利用所述非奇异数据矩阵中的系统运行数据求解不包含参数矩阵的广义希尔韦斯特-转置数据方程,通过迭代计算,学习最优控制增益矩阵,进而获得空地无人集群系统的最优编队控制器; 所述最优编队控制器通过求解折扣因子代数黎卡提方程获得;所述最优编队控制器表示为: 其中,;表示最优控制增益矩阵;为空地无人机集群系统各个增广子系统的状态向量;通过求解折扣因子代数黎卡提方程得到,其中为折扣因子,用以确保控制器的收敛性; 其中,,;,,;,;和为所述全局统一描述模型的动力学矩阵; 所述步骤五为: S501.定义数据存储矩阵和,其中,中存储的是增广子系统运行过程中状态向量关联的系统运行数据,中存储的是增广子系统运行过程中与控制输入关联的系统运行数据,中存储的是增广子系统运行过程中与状态向量微分关联的系统运行数据;为空地无人集群系统各个增广子系统的状态向量;为状态向量的导数;为空地无人集群系统各个增广子系统的控制输入;;; 其中,时间区间表示数据收集的采样时间,其中,,表示收集数据的长度,表示采样步长,t0为系统收集数据的初始时刻,t1为系统在初始收集数据时刻t0的通过采样步长后的时刻,依次类推,tl为系统收集数据的终止时刻;r为状态向量的维度,s为增广子系统控制输入的维度; 分别表示在对应空地无人集群系统第i个跟随者的第个增广子系统在子区间内收集的系统状态数据;分别表示在对应空地无人集群系统第i个跟随者的第个增广子系统在子区间内收集的系统输入数据;分别表示在对应空地无人集群系统第i个跟随者的第个增广子系统在子区间内收集的系统状态的积分数据,其中,表示在内的积分; S502.分别从和选择一组索引为的数据构建数据存储矩阵,使得为非奇异矩阵; S503.策略评估:依赖数据存储单元中的系统运行数据,根据以下数据驱动的广义希尔韦斯特转置矩阵方程进行迭代求解: 其中,,上标表示按索引重新构建的数据矩阵;,每次迭代进行更新,上标k和k+1表示第k和第k+1次迭代对应的数据,其中,为矩阵的分块子矩阵且为正定矩阵,为矩阵的分块子矩阵,表示第k次迭代时空地无人集群系统中第i个跟随者的个增广子系统的控制器增益矩阵,; S504.策略迭代:使用更新控制增益矩阵; S505.判断是否成立,为大于零的一个小的常数值; ①如果成立,则停止迭代,此时控制增益矩阵为,编队控制器为;转入步骤S506; ②如果不成立,则令k自加一,而后转至S503和S504继续求解; S506.获得最优的控制增益矩阵,同时获得最优编队控制器。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。