中国电子科技集团公司电子科学研究院康乐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司电子科学研究院申请的专利一种强化学习声诱饵奖励值的计算方法、装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115587528B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211071850.1,技术领域涉及:G06F30/27;该发明授权一种强化学习声诱饵奖励值的计算方法、装置是由康乐;孙宝三;宋鹏汉设计研发完成,并于2022-09-02向国家知识产权局提交的专利申请。
本一种强化学习声诱饵奖励值的计算方法、装置在说明书摘要公布了:本申请的实施例揭示了一种强化学习声诱饵奖励值的计算方法、装置,其中方法通过建立基于吊放声纳目标识别处理时间、目标识别能力变量,给出声诱饵诱骗的目标成功率和声诱饵出现后的平均识别处理时间,可快速计算奖励值,避免了蒙特卡洛方法时间周期长,影响强化学习智能体训练速度的问题。在一些示例中,结合航空平台识别目标后开展攻击、识别等后续处理典型战等需要的处理时间,对目标成功率进行加权处理,更加准确的计算出声诱饵奖励值,避免了蒙特卡洛方法时间周期长,影响强化学习智能体训练速度的问题。
本发明授权一种强化学习声诱饵奖励值的计算方法、装置在权利要求书中公布了:1.一种强化学习声诱饵奖励值的计算方法,其特征在于,所述强化学习声诱饵奖励值的计算方法,包括: 初始化吊放声纳的识别处理时间以及目标识别能力变量; 基于所述目标识别能力变量计算潜艇使用预设数量的声诱饵对抗吊放声纳的目标成功率; 基于所述吊放声纳识别处理时间以及所述目标识别能力变量计算所述声诱饵的平均识别处理时间; 基于所述平均识别处理时间和所述目标成功率确定所述声诱饵的奖励值; 所述目标识别能力变量包括:识别真目标成功的识别率、识别真目标失败的识别率、识别假目标失败的识别率以及识别假目标成功的识别率;初始化目标识别能力变量,包括: 将识别真目标成功的识别率设为α,将识别真目标失败的识别率设为1-α; 将识别假目标失败的识别率设为1-β,将识别假目标成功的识别率设为β; 基于所述目标识别能力变量计算潜艇使用预设数量的声诱饵对抗吊放声纳的目标成功率,包括:通过第一预设公式,以及所述目标识别能力变量计算潜艇使用预设数量的声诱饵计算所述目标成功率,所述第一预设公式为: 其中,N为预设个数与真目标个数之和,i为识别真目标成功时所处识别的顺序位置; 基于所述吊放声纳识别处理时间以及所述目标识别能力变量计算所述声诱饵的平均识别处理时间,包括:基于第二预设公式,以及所述吊放声纳识别处理时间以及所述目标识别能力变量计算所述声诱饵的平均识别处理时间,所述第二预设公式为: ; 其中,为单个目标识别时间所占用的检测周期数,为吊放声纳单个检测周期时长; 基于所述平均识别处理时间和所述目标成功率确定所述声诱饵的奖励值为:×; 其中,为处理加权时间。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司电子科学研究院,其通讯地址为:100041 北京市石景山区双园路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励