Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军海军航空大学李常久获国家专利权

中国人民解放军海军航空大学李常久获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军海军航空大学申请的专利一种飞机回收调度方法、装置、设备、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120706847B

龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511204947.9,技术领域涉及:G06Q10/0631;该发明授权一种飞机回收调度方法、装置、设备、介质及产品是由李常久;张勇;李煊;苏析超;王宁;韩啸华;成一阳设计研发完成,并于2025-08-27向国家知识产权局提交的专利申请。

一种飞机回收调度方法、装置、设备、介质及产品在说明书摘要公布了:本申请公开了一种飞机回收调度方法、装置、设备、介质及产品,涉及飞机回收调度领域,该方法包括获取实时环境状态;根据所述实时环境状态利用训练好的策略网络进行飞机回收调度,得到飞机回收的最优动作;所述训练好的策略网络是基于历史策略网络、性能评价家网络以及安全评论家网络,结合广义优势估计函数、剪切机制和拉格朗日安全惩罚项对初始策略网络的网络参数进行优化得到的,本申请能在安全约束下,实现飞机回收的最优调度。

本发明授权一种飞机回收调度方法、装置、设备、介质及产品在权利要求书中公布了:1.一种飞机回收调度方法,其特征在于,所述飞机回收调度方法包括: 获取实时环境状态; 根据所述实时环境状态利用训练好的策略网络进行飞机回收调度,得到飞机回收的最优动作;所述训练好的策略网络是基于历史策略网络、性能评价家网络以及安全评论家网络,结合广义优势估计函数、剪切机制和拉格朗日安全惩罚项对初始策略网络的网络参数进行优化得到的; 所述策略网络的优化过程,具体包括: 根据决策阶段的环境状态利用历史策略网络进行环境交互,得到第一动作并控制环境执行所述第一动作; 获取环境执行所述第一动作的即时奖励和安全成本并根据所述即时奖励和安全成本生成状态-动作轨迹数据集; 基于所述状态-动作轨迹数据集基于初始策略网络和性能评价家网络计算广义优势估计函数; 根据所述广义优势估计函数利用剪切机制基于历史策略网络对所述初始策略网络的网络参数进行更新; 根据所述状态-动作轨迹数据集分别对性能评论家网络和安全评论家网络的网络参数进行优化; 利用优化后的安全评论家网络确定拉格朗日安全惩罚项; 根据优化后的性能评论家网络、优化后的安全评论家网络和拉格朗日安全惩罚项,利用加权多目标函数对更新后的初始策略网络进行优化,得到训练好的策略网络; 所述广义优势估计函数的表达式为: ; 其中,表示决策阶段的动作优势估计,表示当前决策阶段的索引,表示未来决策阶段相对于的偏移索引,为偏差-方差权衡系数,为时序差分残差,为阶段的环境状态,为阶段的环境状态,为未来决策阶段索引,为单次迭代的决策阶段总数,为偏差-方差权衡系数,为奖励折扣因子,为性能评论家网络,为阶段即时奖励信号; 根据所述广义优势估计函数利用剪切机制基于历史策略网络对所述初始策略网络的网络参数进行更新的表达式为: ; 其中,表示策略网络的剪切损失函数,为策略网络的可训练参数,为重要性采样权重,为决策阶段的广义优势估计,表示将裁剪到区间,为剪切阈值,为期望算子,为决策阶段的环境状态,为阶段执行的动作,为历史策略网络,为策略网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军航空大学,其通讯地址为:264001 山东省烟台市芝罘区二马路188号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。