中国人民解放军军事科学院军事智能研究院武鹏伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院军事智能研究院申请的专利一种基于深度强化学习的认知干扰决策方法及其应用系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121142484B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511686615.9,技术领域涉及:G01S7/38;该发明授权一种基于深度强化学习的认知干扰决策方法及其应用系统是由武鹏伟;张楚笛;王璐璐设计研发完成,并于2025-11-18向国家知识产权局提交的专利申请。
本一种基于深度强化学习的认知干扰决策方法及其应用系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的认知干扰决策方法及其应用系统,适用于我方干扰无人机在对抗复杂多变电磁环境下的组网雷达系统时完成智能干扰决策任务,基于干扰决策算法DAR‑PPO,以提升现有干扰决策系统在样本效率与策略稳定性方面的性能,干扰决策算法DAR‑PPO包括两大创新模块:其一为KTD‑Clip模块,基于经验KL散度构建反馈信号,动态调整策略更新中的剪裁阈值,以控制策略更新步长,使其始终处于稳定有效的信赖域内,显著提高算法对环境变化的适应能力;其二为RA‑IS模块,通过构建轨迹回放池并引入剪裁重要性采样,实现对历史交互样本的有效复用,同时设计权重熵正则化机制,抑制异常权重带来的策略波动,从而显著提升训练样本利用率并增强算法鲁棒性。
本发明授权一种基于深度强化学习的认知干扰决策方法及其应用系统在权利要求书中公布了:1.一种基于深度强化学习的认知干扰决策方法,其特征在于,所述方法用于干扰无人机对多功能组网雷达干扰对抗环境中,包含以下步骤: 步骤S1:构建雷达干扰决策模型,定义多智能体协同干扰决策对抗框架,建模环境状态空间、干扰动作空间及奖励函数; 步骤S2:初始时刻初始化干扰决策算法DAR-PPO的参数,参数包括策略网络参数、价值网络参数、学习率、折扣因子和KL目标,初始化重放缓存区,用于存储轨迹数据; 步骤S3:初始化的最小值和最大值 步骤S4:获取当前状态,根据策略网络做出决策:; 步骤S5:执行动作,观察到该步奖励和下一步的状态; 步骤S6:根据价值网络输出的Q值,计算时序差分目标和时序差分误差; 步骤S7:根据新的调整策略; 步骤S8:从重放池中采样旧的轨迹训练; 步骤S9:进入下一回合,直至训练结束; 其中,策略网络表示在当前状态和当前网络参数下,选择出动作值表示在给定状态下,选择动作后的期望累积回报;表示裁剪阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院军事智能研究院,其通讯地址为:100091 北京市海淀区厢红旗东门外一号院;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励