东南大学时欣利获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于注意力机制和深度强化学习的多约束车辆路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115759915B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211381477.X,技术领域涉及:G06Q10/0835;该发明授权基于注意力机制和深度强化学习的多约束车辆路径规划方法是由时欣利;王小荷;徐向平;万颖设计研发完成,并于2022-11-07向国家知识产权局提交的专利申请。
本基于注意力机制和深度强化学习的多约束车辆路径规划方法在说明书摘要公布了:本发明公开了一种基于注意力机制和深度强化学习的多约束车辆路径规划方法,首先,建立基于带容量限制和时间窗的车辆路径规划问题的目标函数,以最小成本为每辆车找到一组用户结点不相交的路线,使其能在用户时间窗要求内为用户服务;然后通过建立模型,确定初始参数信息与条件约束;再根据马尔可夫决策过程预测车辆与环境的交互过程;最后通过强化学习方法训练神经网络模型,实现多约束条件下的合理车辆路径规划。本发明考虑到现实问题存在的各种限制,如配送车辆的容量限制、用户对送达时间的要求,合理构建了一种可靠的基于注意力机制的神经网络结构,针对该问题进行训练,合理有效的解决实际问题。
本发明授权基于注意力机制和深度强化学习的多约束车辆路径规划方法在权利要求书中公布了:1.基于注意力机制和深度强化学习的多约束车辆路径规划方法,其特征在于,包括如下步骤: S1,建立目标函数:所述目标函数基于带容量限制和时间窗的车辆路径规划问题,以最小成本为每辆车找到一组用户结点不相交的路线,使其能在用户时间窗要求内为用户服务;影响目标函数的参数至少包括车辆行驶路径长度,用户需求完成时间与时间窗之间的关系; S2,模型建立:根据带容量限制和时间窗的车辆路径规划问题的特点创建数学模型,将用户位置坐标、货物需求、时间窗与车辆的容量信息使用数学参数表示,并确定条件约束信息; S3,马尔可夫决策过程建模:根据马尔可夫决策过程预测车辆与环境的交互过程,确定交互顺序序列; S4,神经网络模型建立:搭建神经网络模型作为车辆路径用户结点选择策略,所述神经网络模型采用编码器-解码器结构,编码器将用户结点信息作为输入,输出个体用户结点编码与全图用户结点编码,该编码将与车辆之前的行驶路径作为解码器的输入,解码器最终会输出各个用户结点的选择概率,选择概率最大的用户结点作为车辆的下一个目的地; S5,车辆路径解生成:根据步骤S4的神经网络模型,每一个时间步骤T输入用户结点信息并最终获得一个用户结点作为车辆的下一个目的地,直到没有等待服务的可服务用户结点,每个时间步生成的用户结点所组成的序列即为该车辆规划的路径解; S6,模型训练:根据步骤S3的马尔可夫决策过程设计奖励函数,计算步骤S5中生成的路径解的奖励,根据奖励使用强化学习方法训练神经网络模型,所述神经网络模型的训练使用REINFORCE梯度下降算法,更新训练参数θ: 其中,θ表示需要训练的参数;bs表示基线;Lπ在pθπ|s情况下π的损失函数,即奖励值的负值; 根据最优策略贪婪生成的路径的价值作为当前bs的值,bs随着模型的更新而更新; S7,路径规划:将用户位置坐标、货物需求、时间窗作为编码器输入训练好的神经网络模型,得到注意力向量,所述注意力向量与车辆信息、历史路径及现有容量一同作为解码器输入,解码器每一个时间步T输出一个用户结点作为车辆的下一个目的地,直到没有等待服务的可服务用户结点,生成的用户结点序列即为该车辆规划的路径解。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。