Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学史豪斌获国家专利权

西北工业大学史豪斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利多仓储机器人强化学习调度的自适应修正奖励塑形方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119105285B

龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411250097.1,技术领域涉及:G05B13/04;该发明授权多仓储机器人强化学习调度的自适应修正奖励塑形方法是由史豪斌;吴凡;何自明;杨北亚设计研发完成,并于2024-09-06向国家知识产权局提交的专利申请。

多仓储机器人强化学习调度的自适应修正奖励塑形方法在说明书摘要公布了:本发明公开多仓储机器人强化学习调度的自适应修正奖励塑形方法,包括S1:设计任务环境,设定仓储机器人、目标物和障碍物的参数,建立机器人运动学模型,设置超参数;S2:通过仓储机器人与环境交互,收集训练数据,处理后得到奖励函数;S3:将奖励函数的利用定义为双层优化问题,经计算得到自适应修正奖励函数;S4:分别为每个机器人提供独有的自适应修正奖励函数,得到奖励值,该值和训练数据存放于经验回放池;S5:从经验回放池采集数据,使用多智能体强化学习算法训练机器人避开障碍物并到达目标物的最优策略。本发明能够解决多机器人强化学习算法在复杂环境中的信用分配问题,有效提高强化学习算法的学习效率和收敛速度。

本发明授权多仓储机器人强化学习调度的自适应修正奖励塑形方法在权利要求书中公布了:1.一种用于多仓储机器人强化学习调度的自适应修正奖励塑形方法,其特征在于包括以下步骤: S1、设计任务环境,设定仓储机器人、目标物和障碍物的相关参数,建立机器人运动学模型,设置多机器人强化学习算法的各项超参数; S2、通过每个仓储机器人与环境交互,收集训练数据,经过标准化和归一化处理后得到奖励函数; S3、将奖励函数的利用定义为双层优化问题,其中下层为优化策略来最大化整体奖励,上层为优化参数来最大化预期累计外在奖励,经计算得到自适应修正奖励函数; 所述步骤S3包括以下步骤: 步骤S3.1:建立双层优化框架;在时间步的状态环境变量由表示,机器人得到状态值后,会根据自身当前策略函数来选择一个动作,即,其中策略函数用来表示;策略的值由或者表示,其代表着机器人按照策略执行动作时获得的预期累计折扣奖励的总和,即 其中为折扣引子,而的含义是,在某一状态下,机器人通过策略函数采取某一动作后,到达另一个状态的过程;对于值函数的计算,在双层优化框架中,使用的是策略梯度的方法,具体的更新公式如下: 其中是终止前的返回值; 机器人内部有两个模块,一个是由参数化的策略函数,另一个是由参数化的内在奖励函数;机器人从环境中得到某一状态,通过最大化外在奖励来更新内在奖励参数,之后得到内在奖励,再通过最大化内在奖励与外在奖励之和来更新策略参数,从而得到动作; 步骤S3.2:设定自适应奖励函数:将内在奖励设为,辅助奖励参数化为,双层优化目标定义如下所示: 通过最大化外在奖励来更新内在奖励参数,通过最大化整体奖励来更新策略参数;奖励函数表示如下: 其中,为外在奖励,即原本的奖励;为内在奖励;为带参权重函数,能够自适应调整优化奖励函数;是修正函数,是超参数,是带参函数,作为修正函数,用于对稀疏的奖励函数进行惩罚; S4、结合多智能体强化学习算法为每个机器人提供一个独有的自适应修正奖励函数,经计算得到每个机器人的奖励值,将所述奖励值和训练数据一起存放于经验回放池; S5、从经验回放池中采集一个批次的数据,使用基于自适应修正奖励塑形的多智能体强化学习算法训练机器人得到多仓储机器人调度的最优策略网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。