Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学彭剑坤获国家专利权

东南大学彭剑坤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种基于图强化学习的协同式路线-充电规划方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721415B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411749937.9,技术领域涉及:G06Q10/047;该发明授权一种基于图强化学习的协同式路线-充电规划方法及系统是由彭剑坤;马雨晗;闫方;丁璠;葛雨明;何洪文;范毅设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。

一种基于图强化学习的协同式路线-充电规划方法及系统在说明书摘要公布了:本发明涉及电动汽车充电规划技术领域,公开了一种基于图强化学习的协同式路线‑充电规划方法及系统,该方法包括使用图神经网络和强化学习算法对路线和充电规划进行集成优化;将地图表示为图结构数据,并通过Structure2Vector方法提取道路网络的拓扑信息;将拓扑信息嵌入到深度Q网络DQN算法的状态值函数中,以规划路线和优化充电站的选择;通过自学习适应交通和充电需求的变化形成一种协同式路径‑充电规划方法。本发明的有益效果为:可以提高规划效率,还可以大大减少驾驶和充电等待时间,增强用户体验。

本发明授权一种基于图强化学习的协同式路线-充电规划方法及系统在权利要求书中公布了:1.一种基于图强化学习的协同式路线-充电规划方法,其特征在于,使用图神经网络和强化学习算法对路线和充电规划进行集成优化,包括以下步骤: 引入TSPHS模型作为所述协同式路线-充电规划方法的建模方案,得到改进的TSPHS模型; 将获取的地图表示为图结构数据,并通过图神经网络方法从所述图结构数据中提取道路网络的拓扑信息,得到地图中各节点的特征向量; 将所述特征向量嵌入到强化学习算法的状态动作函数中,得到状态动作函数的动作值,通过特征向量来影响状态动作函数的动作值,进而来影响智能体的动作选择,以规划路线和优化充电点,得到协同式路线-充电规划方法; 引入TSPHS模型作为所述协同式路线-充电规划方法的建模方案的具体方法为:将酒店比作充电站,将客户比作乘客,将电动汽车驾驶员每日最长工作时间与电动汽车的行驶里程对应起来,得到改进的TSPHS模型; 所述改进的TSPHS模型中包括个节点,其中包括个充电站节点和个任务节点,充电站节点,任务节点,所述改进的TSPHS模型的表示式为: ; 其中,表示如果在第次任务中访问了充电站或乘客,之后又访问了充电站或乘客,则,否则;表示从充电站或乘客到充电站或乘客所需要的时间,表示总任务次数,,表示充电站节点的总个数,表示任务节点的总个数; 通过图神经网络方法从所述图结构数据中提取道路网络的拓扑信息,得到地图中各节点的特征向量的具体方法为: 图神经网络方法中使用嵌入的特征向量来表示地图中的每个节点,节点的特征向量的更新公式为: ; 其中,是通用非线性映射,表示地图G中节点的临界点的集合,、表示节点,且表示用来参数化评价函数Q的一个深度学习参数;表示节点与节点之间边的权重,表示节点被迭代次后的特征向量,表示第一迭代次数,表示节点被迭代次后的特征向量,表示节点的属性,表示节点的特征向量; 将所述特征向量嵌入到强化学习算法的状态动作函数中,得到状态动作函数的动作值的方法为: 将拟定为更新维的嵌入特征向量,来参数化,具体为: ; 其中,、和是的参数化模型参数,代表对其输入按元素顺序应用的整流线性单元,表示relu中的变量;表示嵌入节点的特征向量的维度; 所述强化学习算法采用深度Q网络算法,所述深度Q网络算法利用嵌入的节点的特征向量来动态优化电动车辆的路线和充电规划方法,其中Q函数表示为: ; 其中,表示Q函数,、是的参数化模型参数,表示连接算子,表示地图G中的所有节点在迭代T次后的嵌入特征向量;表示节点在迭代T次后的的嵌入特征向量;T为第二迭代次数;,表示地图G上所有节点的集合;表示表示解的组合结构;表示改进的TSPHS模型的解,同时对应在强化学习算法中表示状态;表示地图G上的节点,同时对应在强化学习算法中表示选择的动作; 所述深度Q网络算法中状态、动作以及奖励函数的定义如下: 状态表示在地图上执行的一系列动作;由于我们已经使用嵌入对标记地图中的节点进行了编码,因此,将状态表现为维空间中的向量,允许跨不同地图表示; 动作表示强化学习算法选择的动作,并且选择出的节点不能是当前状态的组成部分,我们将动作表示为维嵌入节点嵌入特征向量,该定义适用于不同尺度的地图; 将状态S的奖励函数定义为执行动作并过渡到新状态所引起的成本函数的变化,具体地说: ; 与最终状态有关的累积奖励函数为: ; 其中,表示成本函数,奖励值是两个状态下成本函数的变化量,表示地图,表示每一个状态动作对; 通过最小化行程距离和充电站选择的惩罚项来优化电动车辆的行驶路线,每一个状态动作对奖励函数表示为: ; 其中,是调节惩罚项在总奖励中权重的参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210018 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。