中国人民解放军军事科学院国防科技创新研究院郭鹏宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院国防科技创新研究院申请的专利基于进化算法和强化学习的航天器形态控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120440311B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510942197.9,技术领域涉及:B64G1/24;该发明授权基于进化算法和强化学习的航天器形态控制方法及系统是由郭鹏宇设计研发完成,并于2025-07-09向国家知识产权局提交的专利申请。
本基于进化算法和强化学习的航天器形态控制方法及系统在说明书摘要公布了:本发明公开了基于进化算法和强化学习的航天器形态控制方法及系统,具体为:S1.建立初始种群,种群中的个体为不同功能模块和不同模块数量组合的不同形态的航天器;S2.对种群中的所有个体进行内环初始化学习训练,计算每个个体的适应度值;S3.选择适应度值较高的个体组成精英种群;S4.利用遗传算法中的遗传和变异操作,对精英种群进行均匀交叉、单点变异,生成精英子代;S5.内环强化学习:对步骤S4中获得精英子代进行学习训练;S6.形态评估;S7.形成最优个体。本发明充分结合空间环境和任务需求的特点,基于深度进化强化学习的内外环算法架构,通过外环形态进化和内环学习训练不断交替,实现模块化航天器的形态自主生成。
本发明授权基于进化算法和强化学习的航天器形态控制方法及系统在权利要求书中公布了:1.基于进化算法和强化学习的航天器形态控制方法,其特征在于,具体为: S1.建立初始种群,种群中的个体为不同功能模块和不同模块数量组合的不同形态的航天器; S2.对种群中的所有个体进行内环初始化学习训练,计算每个个体的适应度值; S3.根据适应度值选择个体组成精英种群; S4.利用遗传算法中的遗传和变异操作,对精英种群进行均匀交叉、单点变异,生成精英子代; S5.内环强化学习:对步骤S4中获得精英子代进行学习训练; S6.形态评估:分析航天器在当前任务场景的任务完成情况,得到综合形态评估结果,将评估结果作为航天器形态的适应度值,并以此作为外循环进化的评价依据; S7.形成最优个体:将完成内环强化学习训练后的精英子代加入原始种群,按照适应度值大小,对种群内的个体进行排序并淘汰适应度最低的个体,直到种群的个体数量和初始种群数量一致,当外循环达到设定进化代数,输出最优个体; 步骤S2中,内环训练过程中使用多进程方式为每个个体的学习训练分配单独的进程,从而实现并行计算,提升计算效率;个体适应度函数表述为: ; 其中,表示典型任务场景数量,表示航天器在任务场景中通过内环强化学习获得的奖励值,表示任务场景的奖励值上限,表示奖励函数标准权重,用于统一奖励值和适应度值的量级; 内环强化学习阶段采用嵌套的PPO算法对整个初始种群中的个体进行学习训练,PPO算法采用Actor-Critic架构实现航天器构型和姿轨控策略; PPO算法以最大化动态权重优势函数的期望为目标代价函数: ; 其中,,分别表示在任务进程中,当前时间步下的任务场景环境状态和Actor网络所采取的动作;表示在当前参数所遵循的策略下,任务场景由于航天器执行动作由状态转移到下一状态的概率,则表示在参数下的概率;Actor模型用一个神经网络拟合航天器的控制策略函数,其中是待优化的Actor网络参数;Actor网络以任务场景的环境态势信息,输出航天器的变构和机动策略;是采样网络参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院国防科技创新研究院,其通讯地址为:100070 北京市丰台区东大街53号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励