郑州大学辛健斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉郑州大学申请的专利基于深度强化学习的货到人系统多AGV路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120010487B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510139194.1,技术领域涉及:G05D1/43;该发明授权基于深度强化学习的货到人系统多AGV路径规划方法是由辛健斌;郭沛延;李洪波;彭金柱;张方方;刘艳红设计研发完成,并于2025-02-08向国家知识产权局提交的专利申请。
本基于深度强化学习的货到人系统多AGV路径规划方法在说明书摘要公布了:本发明涉及计算机领域的一种基于深度强化学习的货到人系统多AGV路径规划方法,融合改进A*全局引导与局部强化学习的双层规划架构,全局层采用非均匀惩罚启发式策略,通过Dijkstra算法计算的固定惩罚项和基于历史路径的实时动态惩罚项协同优化路径分散性;局部层设计异步近端策略优化APPO算法,结合LSTM网络处理连续5个时间步的多通道观测状态静态障碍物、AGV位置、全局路径编码,输出5自由度动作策略。针对仓储可移动货架Pod区域设置固定惩罚豁免机制,避免无效避让,提高任务成功率和吞吐量,降低计算负载,为解决货到人系统多AGV路径规划问题提供了一种高效且可扩展的解决方案。
本发明授权基于深度强化学习的货到人系统多AGV路径规划方法在权利要求书中公布了:1.基于深度强化学习的货到人系统多AGV路径规划方法,其特征在于,包括以下步骤: 步骤1、根据预先部署的货到人系统静态结构布局,采用基于非均匀惩罚机制的改进A*启发式算法为AGV规划全局引导路径; 所述非均匀惩罚机制包括固定惩罚和实时动态惩罚,表示为: 式中,表示固定惩罚,表示实时惩罚; 固定惩罚是基于Dijkstra算法计算的每个栅格到未占用区域的平均路径长度: 通过计算每个栅格到所有未占用区域的平均路径长度,确定网格的访问难度,从而为每个栅格分配固定惩罚值; 固定惩罚值的计算公式为: 式中,表示栅格到所有未占用区域的平均路径长度,固定惩罚值越大表示对应栅格越难到达,AGV在路径规划中更倾向于避开固定惩罚值大的栅格; 实时惩罚是基于AGV的实时路径更新; 实时惩罚随着AGV经过的次数累积而增大,通过以下公式计算: 式中,为二值函数,用于判断在时间步时AGV是否位于栅格中; 步骤2、根据每个AGV上载有的激光雷达获取的点云数据构建周围的栅格环境,将实时扫描的地图转换为栅格地图信息; 步骤3、根据提取的货到人系统栅格地图信息,构建局部观测状态空间矩阵; 步骤4、采用异步近端策略优化算法训练局部路径规划器,通过长短期记忆LSTM网络融合时序观测数据,输出避碰动作策略以及对全局引导路径的模仿; 所述异步近端策略优化算法是基于近端策略优化PPO算法,为每个AGV构建一个强化学习框架中的局部路径规划器,通过更新策略网络和价值网络,实现AGV路径规划策略的优化; 步骤5、针对货到人系统中仓储区域的可活动货架存储单元,固定惩罚设置为+1,且实时动态惩罚置零。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人郑州大学,其通讯地址为:450001 河南省郑州市高新技术开发区科学大道100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励