Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学陈爱国获国家专利权

电子科技大学陈爱国获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利一种基于优先级经验重放的强化学习智能决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119129693B

龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411100709.9,技术领域涉及:G06N3/092;该发明授权一种基于优先级经验重放的强化学习智能决策方法是由陈爱国;罗光春;付波;杨鑫涛;张一鸣;龙沛设计研发完成,并于2024-08-12向国家知识产权局提交的专利申请。

一种基于优先级经验重放的强化学习智能决策方法在说明书摘要公布了:本发明涉及机器学习和强化学习技术领域,公开了一种基于优先级经验重放的强化学习智能决策方法,针对现有强化学习中智能体在面对复杂环境时学习困难的问题,提出了一种基于权重打分网络的优先级经验重放方法,指导智能体对重放缓冲区中的数据进行优先级量化,从而更加高效地利用历史经验数据进行学习。在训练过程中,本发明方法根据训练数据计算综合损失函数,并利用梯度下降法对目标策略网络进行更新,以提高其决策性能。通过这种基于优先级经验重放的强化学习智能决策方法,本发明能够有效解决现有强化学习中智能体面对复杂环境学习困难的问题,提高智能体的决策效率和准确性。

本发明授权一种基于优先级经验重放的强化学习智能决策方法在权利要求书中公布了:1.一种基于优先级经验重放的强化学习智能决策方法,其特征在于,所述方法包括训练过程和决策过程,具体包括以下步骤: 训练过程: A1:模型初始化;模型包括目标策略网络和权重打分网络,通过随机设置的网络参数完成网络初始化,两个网络输入均为当前智能体所观测的状态信息,目标策略网络的输出为可执行的所有动作构成的状态-动作价值向量,策略打分网络的输出为当前样本的优先级权重值; A2:环境交互采集数据,智能体的目标策略网络指导智能体与环境进行交互,具体包括以下步骤: A21:获取环境信息;将环境的图像信息编码后获取,并进行预处理; A22:将图像信息输入至目标策略网络,通过神经网络的前向传播,获得每个动作的执行的概率分布,这里所有动作的概率和为1; A23:对获得的概率分布进行采样得到具体的实施动作,该动作即是智能体下一步需要执行的动作; A24:智能体执行完当前动作a后,环境给予该动作的奖励反馈r,并状态s转移至下一个状态s’,转移后的状态即智能体下一次决策所进行输入的环境信息; A3:使用权重打分网络设置交互数据s,a,r,s’的优先级权重并放入到重放缓冲区当中; A4:当重放缓冲区存储一定的样本数据后,根据数据的优先级权重,从重放缓冲区中进行数据采样,以此进行目标策略网络的一轮训练; A5:计算重要性权重;采用重要性权重对优先级权重进行偏差修正,计算方式如下: 其中N表示重放缓冲区样本容量,β是一个超参数,用来控制纠正偏差的程度;其中wj为权重打分网络计算的原始权重,wi为修正后的权重; A6:计算损失函数并更新目标策略网络参数,损失函数计算公式如下所示: 其中D表示重放缓冲区,Q表示目标策略网络,θ表示网络的参数集合,表示目标策略网络的参数,E表示求解在样本数据s,a,s’,r采样服从D的分布下的期望值;γ表示折扣系数;针对计算出来的损失值,利用梯度下降法对目标策略网络的网络参数进行参数更新,使损失函数延梯度下降方向逐步减小直至收敛; A7:当所选择的训练数据被使用完毕后,如果设定的策略目标未完成,则回到步骤A2,继续进行上述步骤;如果策略的表现满足要求,则结束训练; 决策过程: B1:智能体观察当前所处环境,获取图像信息; B2:根据当前观测的图像信息和全局导航视图,对图像数据进行预处理; B3:将状态s输入到训练好的模型中,得到可执行的所有动作对应的概率; B4:对动作进行采样,得到智能体本次所执行的动作,同时智能体接受环境给出的奖励值并观察变化后的环境; B5、重复S1至S4步骤,直至导航任务完成,智能决策结束。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。