Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京航空航天大学池沛获国家专利权

北京航空航天大学池沛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京航空航天大学申请的专利一种多无人机协同对抗决策方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119598825B

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410276466.8,技术领域涉及:G06F30/27;该发明授权一种多无人机协同对抗决策方法及系统是由池沛;安乐;赵江;王英勋设计研发完成,并于2024-03-11向国家知识产权局提交的专利申请。

一种多无人机协同对抗决策方法及系统在说明书摘要公布了:本发明涉及一种多无人机协同对抗决策方法及系统,方法包括如下步骤:通过建立多无人机空战对抗运动模型和空战态势评估模型来构建多无人机协同空战对抗决策环境;根据每架无人机在对抗决策环境中的动作空间和局部观测及状态建立多无人机协同对抗决策问题的分布式部分可观测马尔可夫决策过程模型;设计多机协同对抗奖励函数和HASAC算法网络空间;基于HASAC算法网络空间与多无人机协同对抗决策环境交互,训练并生成多机协同对抗策略模型。本发明面向多机协同空战对抗问题,为多机协同对抗决策无人机设计特定的全局状态,相较于直接将各个无人机观测向量拼接,降低了全局状态维度,提升训练效率。

本发明授权一种多无人机协同对抗决策方法及系统在权利要求书中公布了:1.一种多无人机协同对抗决策方法,其特征在于,所述多无人机包括我方多架无人机及敌方多架无人机,其中,我方作为红方,敌方作为蓝方,所述方法包括步骤: 步骤1.通过建立多无人机空战对抗运动模型和空战态势评估模型来构建多无人机协同空战对抗决策环境,具体包括: 步骤11.对每一架无人机的受力进行分析,建立质点运动模型; 步骤12.对多无人机之间的相互关系进行分析,建立多无人机的相对运动模型,所述无人机的相对运动模型的建立如下: 式中,为红方无人机的数量,编号集合,为蓝方无人机的数量,编号集合,红方第架无人机速度矢量,、蓝方第架无人机速度矢量,、红方第架无人机的队友无人机的速度矢量,,表示队友编号;为红方第架无人机与蓝方第架无人机在轴的距离;表示红方第架无人机与红方队友无人机在轴的距离;红方第架无人机与蓝方第架无人机相对位置矢量、红方第架无人机和红方队友无人机的相对位置矢量;红方第架无人机与蓝方第架无人机的偏离角为红方第架无人机速度矢量与相对位置矢量的夹角;红方第架无人机与蓝方第架无人机的脱离角为蓝方第架无人机速度矢量与相对位置矢量的夹角;红方第架无人机与其队友无人机的偏离角为红方第架无人机速度矢量与相对位置矢量的夹角;红方第架无人机与其队友无人机的脱离角为队友无人机速度矢量与相对位置矢量的夹角,表示红方第架无人机相对于蓝方第架无人机相对距离的大小,表示红方第架无人机相对于其队友无人机相对距离的大小,分别表示红方第架无人机速度大小、航迹倾角、航迹偏角,分别表示蓝方第架无人机速度大小、航迹倾角、航迹偏角,分别表示红方第架无人机队友无人机的速度大小、航迹倾角、航迹偏角;分别表示红方第架无人机在惯性坐标系下的位置,分别表示蓝方第架无人机在惯性坐标系下的位置,分别表示红方第架无人机队友无人机在惯性坐标系下的位置; 步骤13.根据无人机的角度、速度、高度和距离建立无人机空战态势评估模型; 步骤2.根据每架无人机在对抗决策环境中的动作空间和局部观测及状态建立多无人机协同对抗决策问题的分布式部分可观测马尔可夫决策过程模型; 步骤3.设计多机协同对抗奖励函数和HASAC算法网络空间,所述HASAC算法采用集中式训练分布式执行框架,由n个策略网络、两个价值网络和两个目标价值网络组成,n表示红方无人机的数量,每一个策略网络对应一架红方无人机,每架红方无人机与一个策略网络进行连接,用于近似无人机决策模型,生成红方无人机局部观测下决策的动作,其策略网络结构相同,各策略网络独立学习,网络参数不共享,所述价值网络用于评估策略网络在给定观测下执行动作的好坏;目标价值网络用于稳定训练过程,网络结构与价值网络相同,目标价值网络参数更新基于价值网络参数进行加权平均得到; 步骤4.基于HASAC算法网络空间与多无人机协同对抗决策环境交互,训练并生成多机协同对抗策略模型,具体包括: 1从交互环境中获取时刻观测,分别将策略网络输入红方第架无人机的观测,输出红方第架无人机的动作,所有红方无人机动作组成联合动作; 2将所有的动作输入交互环境中,环境返回下一时刻的观测和全局状态和执行动作的联合奖励,其中,动作分别作用于红方n架无人机模型,进行红方无人机的状态更新;蓝方决策模型基于目标分配将多对抗决策问题转为每架蓝方无人机分配一架红方目标和一对一对抗决策问题,目标分配模型基于态势评估输出蓝方无人机攻击的红方目标,Minimax输出蓝方无人机对抗红方目标的决策动作,进行蓝方无人机状态更新,通过观测与全局状态处理器提取红方无人机的观测值和全局状态值,并基于奖励函数计算联合奖励; 3将当前时刻的每架红方无人机的观测和全局状态、所有红方无人机的联合动作、下一时刻的每架红方无人机的观测和全局状态、联合奖励组成元组存入经验池中; 4然后,从经验池中随机采样数据作为价值网络、策略网络和目标价值网络的训练数据,基于Adam优化器对价值网络、目标价值网络和每架红方无人机的策略网络进行更新; 重复以上步骤至所有网络逐步收敛,即在一段时间内每回合奖励无明显增长且回合对抗时长无明显缩短时,将各策略网络作为红方多无人机协同对抗决策模型,其输入为当前时刻各红方无人机局部观测,输出为各红方无人机在当前观测下执行的决策动作。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100083 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。