电子科技大学任婧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于分层强化学习的网络安全防御方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119728237B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411889440.7,技术领域涉及:H04L9/40;该发明授权一种基于分层强化学习的网络安全防御方法是由任婧;朱洪曦;王雄;王晟;徐世中设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。
本一种基于分层强化学习的网络安全防御方法在说明书摘要公布了:本发明公开了一种基于分层强化学习的网络安全防御方法,首先通过构建目标网络训练子智能体,得到子智能体库,在此基础上,再通过构建另一目标网络训练主智能体,用于防御时,根据环境选择子智能体库中的子智能体进行防御。当子智能体和主智能体的训练结束后,便可以开始结合分层强化学习进行防御,防御过程中得到经验条放入经验缓冲区并进行策略优化,更新主智能体的估值网络,进一步优化网络安全防御策略,以更好地应对网络安全领域的各种挑战,提升整体的网络安全防御能力。
本发明授权一种基于分层强化学习的网络安全防御方法在权利要求书中公布了:1.一种基于分层强化学习的网络安全防御方法,其特征在于,包括以下步骤: 1、子智能体训练 对于M种不同的攻击模式,分别训练相应的、用于选取各自攻击模式下当前环境状态最优的防御动作的子智能体,然后存入子智能体库中;所述子智能体为一估值网络Enetchild,其动作价值函数为QchildEvaluations,a;ω,根据当前环境状态s,选择其动作价值函数QchildEvaluations,a;ω最大的防御动作a输出,其中,ω为估值网络Enetchild的网络参数; 2、主智能体训练 对于M种不同的攻击模式,训练一主智能体,以识别当前环境下的攻击模式,所述主智能体为一估值网络Enetmain,其动作价值函数为QmainEvaluations,A;θ,根据当前环境状态s,选择其动作价值函数QmainEvaluations,A;θ最大的子智能体选取动作A输出,其中,θ为估值网络Enetmain的网络参数; 3、分层强化学习进行防御 3.1、识别当前环境中的攻击者模式,并派遣最优的子智能体进行防御 识别方法是将当前环境的状态s输入主智能体,依据动作价值函数QmainEvaluations,A;θ最大值在主智能体的子智能体选取动作空间选择子智能体选取动作A即A=argmaxAQmainEvaluations,A;θ; 选择智能体选取动作后,主智能体执行子智能体选取动作A,选取对应的子智能体; 3.2、防御动作执行 选取的子智能体根据环境状态s,依据动作价值函数QchildEvaluations,a;ω最大值在子智能体的防御动作空间选择防御动作a即a=argmaxaQchildEvaluations,a;ω并执行,环境返回给主智能体奖励r以及环境的下一个环境状态s'; 3.3、策略优化 将经验条dmain=s,A,r,s',t存入经验缓冲区Dmain,更新估值网络Enetmain的网络参数θ,t表示每个时间步骤。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。