南京信息工程大学张朔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京信息工程大学申请的专利一种基于深度强化学习的外卖配送路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115841286B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211042369.X,技术领域涉及:G06Q10/0835;该发明授权一种基于深度强化学习的外卖配送路径规划方法是由张朔设计研发完成,并于2022-08-29向国家知识产权局提交的专利申请。
本一种基于深度强化学习的外卖配送路径规划方法在说明书摘要公布了:本发明公开了路径规划技术领域的一种基于深度强化学习的外卖配送路径规划方法,所述规划方法包括以下步骤:步骤一:读取问题输入的信息,定义优化目标,设定约束条件;步骤二:搭建编码器‑解码器架构中的基础神经网络;步骤三:构建演员和评论家网络;步骤四:设定网络训练过程参数;步骤五:构建数据集;步骤六:演员网络和评论家网络的前向传递;步骤七:网络的训练与更新;步骤八:终止判断。本发明具有求解速度快、泛化能力强的优点,有着更好的适应能力和发展前景,能够对更加复杂的问题进行模拟和求解,引入注意力‑指针网络结构加快了算法收敛的速度,已训练好的网络参数可以保存,不需要每次重新进行大量的运算。
本发明授权一种基于深度强化学习的外卖配送路径规划方法在权利要求书中公布了:1.一种基于深度强化学习的外卖配送路径规划方法,其特征在于,所述规划方法包括以下步骤: 步骤一:读取问题输入的信息,定义优化目标,设定约束条件; 步骤二:搭建以注意力-指针网络机制为基础的编码器-解码器架构中的基础神经网络,并初始化它们的权值和偏置参数; 步骤三:在步骤二搭建的基础神经网络基础上,结合演员-评论家算法,构建演员网络和评论家网络; 步骤四:设定网络训练过程参数; 步骤五:收集取送货节点位置信息,并为数据添加先后次序约束,构建数据集,划分为训练样本集、验证样本集以及测试数据集; 步骤六:输入训练样本集中的数据,使用演员网络给出骑手的预测行程序列,即骑手访问各个取送货节点的合法次序,并给出序列对应的行程距离,再利用评论家网络对演员网络的输出结果做出评价,即给出实际行程距离; 步骤七:进行网络的训练与更新,计算演员网络给出结果与评论家网络给出结果的差值,进行平方处理后作为损失值,根据损失值进行反向传播,并使用Adam优化器对神经网络的参数进行更新; 步骤八:终止判断,若已完成设定的训练轮数,或损失值满足终止条件,则终止迭代,保存最优网络参数,并在该参数下使用演员网络给出目标问题的规划结果,否则转至步骤六,重复训练过程,并通过观察损失的变化和当前网络在验证集上的表现评估网络训练情况; 所述步骤一中问题的输入信息包括骑手平均速度、骑手最远行驶距离、骑手最大携带量、订单时间窗、单个节点最大需求量、节点总数目以及各节点位置; 所述优化目标为完成所有订单配送任务时的行程总距离最小; 所述约束条件为每个订单必须在时间窗内被完成且仅被完成一次、骑手的行驶距离不能超过最大行驶距离及骑手必须先取后送; 所述步骤二中搭建的基础神经网络的相关结构如下: 选定了编码器-解码器作为基础架构,并引入了使用注意力机制的指针网络,用于完成传统方法中seq2seq的过程,其中指针网络在数学上的描述如下所示: 式中,是编码器encoder在时间序列次的隐藏层输出,是解码器decoder在时间序列次的隐藏状态输出,、、为固定维度的参数; 所述编码器-解码器结构中,编码器由一维卷积层构成,解码器由注意力-指针网络构成,其中,注意力机制用于计算给定当前状态的输入节点上的注意力。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210044 江苏省南京市浦口区宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。