中国人民解放军海军航空大学李常久获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军海军航空大学申请的专利一种基于并行强化学习的飞机协同回收动态调度决策方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120725392B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511204856.5,技术领域涉及:G06Q10/0631;该发明授权一种基于并行强化学习的飞机协同回收动态调度决策方法及系统是由李常久;丛婧羽;张勇;万兵;李煊;刘翔宇;程亮亮设计研发完成,并于2025-08-27向国家知识产权局提交的专利申请。
本一种基于并行强化学习的飞机协同回收动态调度决策方法及系统在说明书摘要公布了:本申请公开了一种基于并行强化学习的飞机协同回收动态调度决策方法及系统,涉及航空交通控制与强化学习交叉领域,该方法包括创建多个并行环境实例,在各环境实例中配置各飞机的初始化属性,生成机群状态向量,在各环境实例的决策阶段对智能体选定的飞机执行回收动作,计算多目标奖励,由本次回收时间更新全局时间戳,同步本次机群状态向量,重复上述步骤,直至全部回收;选择最大总累积对应的动作序列作为目标动态调度决策序列,本申请根据燃油奖励、优先级奖励、安全奖励复合的多目标奖励机制,解决了静态调度造成的燃油消耗随机性考虑不周、优先级任务保障不足、安全风险无法有效规避的问题,并解决了单环境强化学习训练效率低的问题。
本发明授权一种基于并行强化学习的飞机协同回收动态调度决策方法及系统在权利要求书中公布了:1.一种基于并行强化学习的飞机协同回收动态调度决策方法,其特征在于,包括: 创建多个并行环境实例,在各环境实例中配置各飞机的初始化属性,并生成由归一化燃油状态向量和飞机回收状态向量构成的机群状态向量,所述属性至少包括燃油量、归一化优先级、燃油消耗率; 在各环境实例的决策阶段执行以下步骤: 对智能体选定的飞机执行回收动作,更新本次飞机回收状态向量;更新本次飞机回收状态向量,具体包括:当本次飞机的回收成功概率大于设定的回收成功率阈值时,将飞机回收状态向量赋值为1,标记为已回收成功;当本次飞机的回收成功概率小于等于设定的回收成功率阈值时,执行复飞策略,将飞机回收状态向量更新为执行复飞策略后的状态值;执行复飞策略,将飞机回收状态向量更新为执行复飞策略后的状态值,具体包括:当飞机处于首圈复飞等待状态时,执行PS策略:飞机经过一圈复飞等待后状态从“首圈复飞等待”变为“单圈复飞等待”,即复飞策略函数;当飞机处于单圈复飞等待状态时,执行SS策略:飞机经过一圈复飞等待后状态从“单圈复飞等待”变为“首圈复飞等待”,即,准备后续再次尝试;当飞机连续复飞次数超过复飞上限时,执行终止策略:飞机从达到复飞次数上限的任意状态变为“复飞终止待分析”,即,其中表示达到复飞次数上限的任意状态输入,此时该飞机在后续决策中将不可被选择,即动作空间将排除该飞机的飞机编号; 根据燃油量计算的燃油奖励、归一化优先级计算的优先级奖励、基于燃油量的安全成本得到的安全奖励及各奖励的权重系数,计算多目标奖励; 更新本次所有飞机的燃油量,并重新计算本次归一化燃油状态向量,具体包括:将本次所有飞机的燃油量更新为前次所有飞机的燃油量减去燃油消耗率与时间间隔的乘积,即,其中为前次决策阶段终止到本次决策阶段为止实际流逝的时间间隔;对本次所有飞机的燃油量进行归一化,计算出本次归一化燃油状态向量,归一化公式为:;其中,为在环境实例e的决策阶段中的飞机编号i的归一化燃油量,为在环境实例e的决策阶段中的飞机编号i的燃油量,为最小燃油量,为最大燃油量; 由本次回收时间更新全局时间戳,同步本次机群状态向量; 智能体选定下一待回收飞机进入下一决策阶段重复上述步骤,直至全部回收; 计算各环境实例决策轨迹多目标奖励的总累积,选择最大总累积对应的动作序列作为目标动态调度决策序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军航空大学,其通讯地址为:264001 山东省烟台市芝罘区二马路188号科研学术处;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励