Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 同济大学饶卫雄获国家专利权

同济大学饶卫雄获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉同济大学申请的专利基于强化学习图神经网络的大型路网多车辆路径负载均衡方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119514979B

龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411603299.X,技术领域涉及:G06Q10/0631;该发明授权基于强化学习图神经网络的大型路网多车辆路径负载均衡方法是由饶卫雄;赵钦佩;张隆源设计研发完成,并于2024-11-11向国家知识产权局提交的专利申请。

基于强化学习图神经网络的大型路网多车辆路径负载均衡方法在说明书摘要公布了:本发明提出了基于强化学习图神经网络的大型路网多车辆路径负载均衡方法,包括步骤:获取真实场景中的路网数据,对路网建模,表示为图结构;将图结构拆分为多个子图结构,每个子图结构对应一个子路网;构建并训练强化学习自适应图神经网络;对路网的每个子路网,调用已训练的强化学习自适应性图神经网络并行生成相应道路选择概率,将生成的子路网道路选择概率按照原路网的拓扑结构进行合并,恢复为完整的原路网中的各道路选择概率;基于完整的原路网中的各道路选择概率,实现道路负载均衡。本发明在大规模路网场景中,实现高效的路径重规划,实时降低路网负载,解决道路拥堵问题,并提高交通效率。

本发明授权基于强化学习图神经网络的大型路网多车辆路径负载均衡方法在权利要求书中公布了:1.基于强化学习图神经网络的大型路网多车辆路径负载均衡方法,其特征在于,包括如下步骤: 步骤1:获取真实场景中的路网数据,对路网建模,表示为图结构; 步骤2:将图结构拆分为多个子图结构,每个子图结构对应一个子路网; 步骤3:构建并训练强化学习自适应图神经网络; 步骤4:对路网的每个子路网,调用已训练的强化学习自适应性图神经网络并行生成相应道路选择概率,将生成的子路网道路选择概率按照原路网的拓扑结构进行合并,恢复为完整的原路网中的各道路选择概率; 步骤5:基于完整的原路网中的各道路选择概率,实现道路负载均衡; 基于仿真器实现对强化学习自适应图神经网络的训练;将子图结构对应的道路路网映射入仿真器,在仿真器中生成车辆,模拟车辆行驶过程;在车辆行驶过程中,仿真器实时读取当前每个车道的拥堵程度,车道拥堵程度随仿真器中车流模拟的变化而实时改变; 训练过程包括: 3.2.1开启仿真器,创建车辆,初始化当前的车道信息和车辆信息,获取对应当前的车道拥堵程度信息,并嵌入为当前时刻向量; 3.2.2每一个时间步t,获取当前图结构及对应的道路拥堵程度,产生对应t时刻的向量,输入强化学习自适应图神经网络,输出当前时刻的,即道路选择概率,该过程包括: 3.2.2.1获取子路网对应的子图以及其对应的道路拥堵程度信息,将其嵌入为向量,将作为所有车道的特征,在强化学习算法中表示为状态State,s代表状态,t代表当前时间步; 3.2.2.2通过强化学习自适应图神经网络产生动作Action,即子图中每一条车道的道路选择概率; 3.2.2.3仿真器中,当车辆获取到当前的道路选择概率,在每个子图中,对于每辆车自身的路径做出更新,获取当前车辆行驶路段对应的道路,根据选择下一个行驶的道路,从而实时修改自身轨迹; 3.2.2.4根据reward进行迭代,更新强化学习自适应图神经网络参数; 3.2.3循环N次步骤3.2.2,完成完整一集的训练; 3.2.4重复M次步骤3.2.2以及步骤3.2.3,保存强化学习自适应图神经网络参数; 所述Reward,其函数设计由三部分组成,即第一部分reward、第二部分reward、第三部分reward: 所述第一部分reward,由车道的拥堵程度确定;车道的拥堵程度,定义为所有车辆总长度与车道总长度的比值,记为;值反应车道i的拥堵程度,i∈E,E为边集合;拥堵值越大,代表拥堵程度越高;记录第一部分reward为 所述第二部分reward,由BPR值确定,BPR值为阻抗函数,由确定;其中,T是当前车道实际通行时间,T0是车道自由流速通行时间,D是当前车道上的车辆数目,C是当前车道的车辆容量,a和b为参数;T的值越大说明道路受到的阻抗越大,从而通行时间更长;通过计算T-T0值,衡量第二个奖励函数值,令为道路i的T-T0值,第二部分reward为 所述第三部分reward,其值与车辆选取的路径是否为最短路径边有关;检测当前情况下车辆选择的下一条道路是否为最短路径上的一条边,如果是,则将其奖励值设置为1,否为0;H为车辆的集合,表示车辆v当前选取的路径是否为最短路径边的奖励值: 结合上述三个奖励部分,得到最终的奖励值函数为:

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区上海市四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。