电子科技大学霍伟博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于DQN的调频率捷变信号抗干扰策略设计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118465705B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410574401.1,技术领域涉及:G01S7/36;该发明授权一种基于DQN的调频率捷变信号抗干扰策略设计方法是由霍伟博;张寅;陈舒波;黄钰林;张翠;裴季方;杨建宇;杨海光设计研发完成,并于2024-05-10向国家知识产权局提交的专利申请。
本一种基于DQN的调频率捷变信号抗干扰策略设计方法在说明书摘要公布了:本发明公开了一种基于DQN的调频率捷变信号抗干扰策略设计方法,首先用将雷达与干扰机的交互过程建模为马尔科夫决策过程,随后将雷达发射波形中的调频斜率作为动作,上一时刻与当前时刻雷达和干扰机发射波形中的调频斜率组成的序列作为状态,再由干扰信号与目标信号的相关峰值设计正奖励函数,由信号能量和信号被截获的概率设计负奖励函数,最后通过深度Q网络,学习出性能最佳的SV‑LFM信号斜率变化策略。本发明的方法允许雷达在没有任何先验信息的情况下学习对抗干扰的最佳策略,实现了雷达系统在自适应抑制干扰的同时,避免因脉冲宽度剧烈变化而导致的低信噪比和高截获概率。
本发明授权一种基于DQN的调频率捷变信号抗干扰策略设计方法在权利要求书中公布了:1.一种基于DQN的调频率捷变信号抗干扰策略设计方法,具体步骤如下: 步骤一、调频率捷变信号模型建立; 采用调频率捷变信号SV-LFM作为雷达信号传输,则调频率捷变信号表达式如下: 1; 其中,表示的调谐斜率,表示载波频率,表示快速时间,表示脉冲重复间隔PRI;表示时间宽度为的矩形脉冲函数,表示基频调谐斜率,表示随机抖动参数,即真实调频斜率与基频调谐频率之间的变化;雷达的每个发射脉冲都有相应的抖动参数,该参数只有雷达方知道,干扰方不知道; 固定信号带宽保证信号的分辨率不变,则信号脉宽与调频斜率的关系表达式如下: 2; 其中,表示调制频率斜率为时的脉冲宽度,表示调制频率斜率为时的脉冲宽度;在相同带宽下,两个不同斜率的SV-LFM信号具有不同的脉宽; 设定干扰信号为与雷达相干的欺骗信号,由干扰机拦截调制并转发;干扰机每次都会转发当前截获的雷达信号;若雷达第个、第个脉冲的抖动参数分别为和;则在处理第脉冲时,干扰信号的匹配滤波结果表达式如下: 3; 步骤二、脉宽约束条件建立; 对脉冲宽度的范围进行约束,由信号表达式1可知,各脉冲的平均功率表达式如下: 4; 其中,表示信号幅度;则信号的能量表达式如下: 5; 设定匹配滤波器的输入为延迟信号加加性白噪声,表达式如下: 6; 其中,表示预先设定的常数,表示目标距离处的时延,表示输入白噪声; 设定总噪声功率为,则功率谱密度为;用表示滤波器的自相关函数,则输出噪声的自相关函数和功率谱密度函数分别表示为: 7; 8; 其中,表示冲激响应,表示滤波器冲激响应的傅里叶变换;总的平均输出噪声功率等于在处的值,更精确表示为: 9; 在时刻的输出信号功率为,并且由信号的滤波器输出可以得到: 10; 则输出在第0时刻的峰值瞬时信噪比表达式如下: 11; 其中,表示雷达接收机输出的能量; 设定信号能量在传播过程中的衰减为,则; 在设计抗干扰策略时,考虑干扰机探测到雷达信号的概率,则干扰机接收机输出信噪比表达式如下: 12; 其中,表示单个雷达脉冲发射的平均功率,表示脉冲功率从雷达到干扰机的衰减,表示干扰机接收机的信号处理增益,表示干扰机接收机噪声的功率;将干扰机的检测概率近似为: 13; 其中,表示干扰机虚警概率,表示互补误差函数; 步骤三、根据建立的调频率捷变信号模型,建立基于MDP的抗干扰场景模型; 将雷达和干扰机之间的对抗过程建模为MDP模型,雷达抗干扰策略问题表述为MDP问题; 在每个时间步长,雷达根据给定策略选择发射的SV-LFM信号的调制斜率的动作;同时,作为环境的一部分,干扰机转发前一脉冲发射周期的信号,其调制斜率为;随后,状态从转移到,智能体将根据状态和行为获得奖励; 步骤四、基于步骤三的MDP模型,设置动作、状态和奖励函数,构建DQN模型进行训练并求解,生成最优抗干扰策略; 基于步骤三的MDP问题,采用DQN来解决; 采用函数来近似动作值,称为值函数近似,然后用神经网络生成函数,称为DQN,表示神经网络训练参数; 雷达和干扰机MDP问题中的动作、状态和奖励函数设置,具体如下: 将斜率选择范围为的SV-LFM信号分成个离散点作为其在每个时间片的动作,而干扰机的信号斜率为,即雷达上一个脉冲的调制斜率; 然后选择作为状态序列,该状态序列包括雷达和干扰机的历史信息; 在奖励设置中,将奖励函数分为通过匹配滤波抑制干扰信号获得的正奖励和脉宽约束获得的负奖励;对回波信号进行匹配滤波后,干扰信号将与当前雷达信号正交,则取相互相关归一化幅度的绝对值作为正奖励,即; 对脉冲宽度进行限制,当脉冲宽度过窄时,选择发射脉冲信号的能量作为负奖励;且脉冲宽度的变化线性地改变信号的能量值,则设置反映这种负奖励是针对窄脉冲而不是宽脉冲的约束;当脉冲宽度过大时,选择干扰机拦截雷达信号的概率作为负奖励,即; 然后定义一个奖励函数,表示为;系数、根据脉宽变化范围的要求进行变化; 通过上述设置的动作、状态和奖励函数,利用DQN的循环迭代来求解步骤三中的MDP问题; 则利用DQN求解MDP问题中每次循环的具体步骤如下: 1以ϵ-greedy策略选择动作,观察干扰者策略; 2用和计算奖励; 3获得下次状态; 4在经验回放数组中存储数组; 5通过梯度更新; 其中,表示对求梯度,,表示目标网络的参数,参数表示折现因子,; 6预先设定更新步数L,每L步更新为; 7循环执行步骤1-6直至总奖励值收敛,通过循环迭代获得最优抗干扰策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励