大连理工大学王昕炜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种基于分层强化学习的导弹制导方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120426830B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510914305.1,技术领域涉及:F42B15/01;该发明授权一种基于分层强化学习的导弹制导方法是由王昕炜;王妍;孟艺硕;李昕;王磊;苏析超;吕琛;陶来发;王轶辉设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。
本一种基于分层强化学习的导弹制导方法在说明书摘要公布了:本发明提供一种基于分层强化学习的导弹制导方法,属于控制策略领域。步骤如下:首先,引入导弹‑目标运动学模型与导弹速度衰减模型;其次,在导弹‑目标运动学模型基础上设计过程奖励与结果奖励,得到总的奖励函数,引导导弹朝目标追击;再次,完成奖励函数设计后,在目标采取直线运动情况下使用柔性动作‑评价算法SAC对导弹进行初步训练,得到初始制导策略;最后,在初始制导策略的基础上敌机采取规避策略,使用柔性动作‑评价算法SAC继续对导弹进行训练,最终得到高质量制导策略。本发明能够使导弹在复杂战况中自主调整飞行路径,克服复杂环境中的干扰与挑战,从而大幅提高制导精度和攻击成功率,提升导弹打击效果与生存能力。
本发明授权一种基于分层强化学习的导弹制导方法在权利要求书中公布了:1.一种基于分层强化学习的导弹制导方法,其特征在于,所述导弹制导方法包括以下步骤: 步骤1,引入导弹-目标运动学模型与导弹速度衰减模型,为追逃博弈提供高保真度的仿真环境;具体的: 步骤1.1,构建导弹-目标运动学模型如下: 1; 其中,上标表示变量对应导弹或目标;是导弹或目标的坐标,则是飞行速度在三维惯性坐标系下三个坐标轴上的投影分量;表示速度,其方向由俯仰角和偏航角定义;表示过载,偏航和俯仰方向上的加速指令由控制;g表示万有引力常数;表示偏航角变化量;表示俯仰角变化量; 导弹和目标之间的三维坐标表示如下: 2; 其中,与表示导弹与目标在三维惯性坐标系下三维坐标差值的向量;与表示导弹与目标在三维惯性坐标系下速度差值的向量;表示目标在三维惯性坐标系下的三维坐标;表示导弹在三维惯性坐标系下的三维坐标;表示目标速度在三维惯性坐标系下三个坐标轴上的投影分量;表示导弹速度在三维惯性坐标系下三个坐标轴上的投影分量; 步骤1.2,引入导弹速度衰减模型; 引入如公式3所示的导弹速度衰减模型,用于计算导弹的速度衰减; 3; 其中,是导弹在三维惯性坐标系中的高度;是导弹在三维惯性坐标系下的坐标;是导弹在三维惯性坐标系下的坐标;是导弹在三维惯性坐标系下的坐标;是动压;是导弹速度;是状态更新时间;是导弹偏航角;是有效面积,设置为0.1;、表示系数;为气动系数; 步骤2:在导弹-目标运动学模型基础上设计过程奖励与结果奖励,得到总的奖励函数,引导导弹朝目标追击;具体的: 步骤2.1,在导弹制导的实现过程中,将双方的位置信息转变为态势信息以进行态势评估; 步骤2.2,过程奖励有两个组成部分,包括距离奖励和角度奖励; 步骤2.3,结果奖励的描述如下: 8; 当本回合导弹击中敌方,取得胜利,获得正奖励。若本回合结束时未能击中,则获得负奖励; 步骤2.4,总的奖励函数为: 9; 其中,为距离奖励的权重,为角度奖励的权重,为结果奖励的权重;为本回合所获得总奖励;为距离奖励;为角度奖励; 步骤3:完成奖励函数设计后,在目标采取直线运动情况下使用柔性动作-评价算法SAC对导弹进行初步训练,得到初始制导策略; 步骤4:在初始制导策略的基础上敌机采取规避策略,使用柔性动作-评价算法SAC继续对导弹进行训练,最终得到高质量制导策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励