北京理工大学高寒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于隐状态和强化学习的行星际轨道转移方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119861572B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510340687.1,技术领域涉及:G05B13/04;该发明授权一种基于隐状态和强化学习的行星际轨道转移方法是由高寒;林扬辉;李瑞彬;潘英杰;杨宇龙;次昊哲设计研发完成,并于2025-03-21向国家知识产权局提交的专利申请。
本一种基于隐状态和强化学习的行星际轨道转移方法在说明书摘要公布了:本发明公开了一种基于隐状态和强化学习的行星际轨道转移方法,涉及航天器控制技术领域。本发明通过建立序列隐变量模型,可以显式地对不确定环境进行表示学习,提取隐藏在不确定环境观测下的隐藏信息。并通过演员网络和评论家网络组成强化学习控制器。采用序列隐变量模型和强化学习控制器构建强化学习算法框架,从而加快智能体在不确定环境中的训练,提高智能体对不确定性的处理能力。此外,本发明实施例还将基于当前观测和预期操作预测下一状态,并将预测的下一状态的质量纳入奖励结构中,使得即时奖励能够同时捕获当前和后续策略的有效性,进而提高算法的学习效率。
本发明授权一种基于隐状态和强化学习的行星际轨道转移方法在权利要求书中公布了:1.一种基于隐状态和强化学习的行星际轨道转移方法,其特征在于,所述方法包括: 获取航天器的观测数据;其中,所述观测数据基于状态数据和观测不确定性确定;所述状态数据基于以预设轨道转移任务构建的状态转移矩阵计算得到; 将所述观测数据输入预设的序列隐变量模型,得到隐变量; 将所述隐变量和航天器的历史轨迹记录输入强化学习控制器,得到航天器的执行动作; 根据所述观测数据和所述执行动作预测航天器的下一状态数据,根据所述状态数据和所述下一状态数据计算奖励值,使所述强化学习控制器基于所述奖励值更新轨道转移策略; 其中,所述强化学习控制器包括: 评论家网络,用于根据输入的隐变量和自身价值估计函数估计状态价值,根据所述状态价值更新所述轨道转移策略; 演员网络,用于根据所述历史轨迹记录以及所述轨道转移策略,计算航天器的执行动作; 所述状态转移矩阵为: ; 其中,、分别表示航天器第k个时间步和第k+1个时间步的位置;、分别表示航天器第k个时间步和第k+1个时间步的速度;、分别表示航天器第k个时间步和第k+1个时间步的质量;和表示第k个时间步的拉格朗日系数;和表示第k个时间步的拉格朗日系数的导数;向量是强化学习控制器的输出,表示由脉冲推理所获得的速度变化;表示推进器的等效排气速度;表示在第k+1个时间步由状态不确定性导致的位置偏差;表示在第k+1个时间步由状态不确定性导致的速度偏差; 所述观测数据为向量形式,观测向量的计算公式为: ; 其中,表示观测向量;表示时间,,表示总时间步;表示矩阵或向量转置;表示在第k个时间步由观测不确定性导致的位置偏差;表示在第k个时间步由观测不确定性引起的速度偏差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。