Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京辰安科技股份有限公司张辉获国家专利权

北京辰安科技股份有限公司张辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京辰安科技股份有限公司申请的专利基于深度强化学习的应急决策生成方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116029389B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211705344.3,技术领域涉及:G06N20/00;该发明授权基于深度强化学习的应急决策生成方法、装置及设备是由张辉;李志鹏设计研发完成,并于2022-12-28向国家知识产权局提交的专利申请。

基于深度强化学习的应急决策生成方法、装置及设备在说明书摘要公布了:本发明提供一种基于深度强化学习的应急决策生成方法、装置及设备,用以解决相关技术中基于深度强化学习的应急决策模型的泛化性较差,且很难复用的技术问题,该方法包括:对需要进行应急决策强化学习的场景进行分析,得到所述场景的场景因素;基于所述场景因素确定在所述场景中进行所述应急决策的多个行为指令;基于所述场景因素确定用于表征所述场景突发事件状态的状态信息;根据所述多个行为指令和所述状态信息生成辅助奖励函数,并通过所述辅助奖励函数训练应急决策生成模型;利用训练好的应急决策生成模型生成应急决策。

本发明授权基于深度强化学习的应急决策生成方法、装置及设备在权利要求书中公布了:1.一种基于深度强化学习的应急决策生成方法,其特征在于,包括: 对需要进行应急决策强化学习的场景进行分析,得到所述场景的场景因素,其中,所述场景因素包括突发事件因素、承灾载体因素和应急管理因素; 基于所述场景因素确定在所述场景中进行所述应急决策的多个行为指令; 基于所述场景因素确定用于表征所述场景突发事件状态的状态信息,其中,所述状态信息包括突发事件状态信息、承灾载体状态信息和应急管理状态信息; 根据所述多个行为指令和所述状态信息生成辅助奖励函数,并通过所述辅助奖励函数训练应急决策生成模型,其中,生成所述辅助奖励函数,包括: 根据所述多个行为指令、所述承灾载体状态信息和所述应急管理状态信息确定所述多个行为指令应对所述突发事件时造成的第一损失值; 根据所述承灾载体状态信息确定不应对所述突发事件时造成的第二损失值; 基于所述第一损失值和所述第二损失值确定所述辅助奖励函数; 利用训练好的应急决策生成模型生成应急决策; 其中,通过如下公式确定所述辅助奖励函数的初始奖励函数: 其中,为承灾载体受损数量,为救援力量受损数量,为救援力量出动数量,为承灾载体受损,为应急力量受损,为所述初始奖励函数; 通过如下公式确定所述第一损失值和所述第二损失值: 则所述辅助奖励函数的最终奖励函数如下: 其中,是经过救援后整个场景中的受损的承灾体数量,是场景中最终可能损坏的承灾载体数量,是指第个受损承灾载体的价格,是指第个受损承灾载体的价格,指第个受损承灾载体的程度,为第一损失值,为第二损失值,为所述最终奖励函数; 通过如下公式确定所述辅助奖励函数: 其中,为承灾载体受损数量,为救援力量受损数量,为救援力量出动数量,为承灾载体受损,为应急力量受损,为第一损失值,为第二损失值,为辅助奖励函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京辰安科技股份有限公司,其通讯地址为:100094 北京市海淀区丰秀中路3号院1号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。