Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 同济大学饶卫雄获国家专利权

同济大学饶卫雄获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉同济大学申请的专利基于多智能体强化学习的跨域车辆路径优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119250323B

龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411280151.7,技术领域涉及:G06Q10/047;该发明授权基于多智能体强化学习的跨域车辆路径优化方法是由饶卫雄;唐克双;赵钦佩;尹嘉铭设计研发完成,并于2024-09-12向国家知识产权局提交的专利申请。

基于多智能体强化学习的跨域车辆路径优化方法在说明书摘要公布了:本发明基于多智能体强化学习算法,提出基于多智能体强化学习的跨域车辆路径优化方法。本发明通过将交通系统内原始路网划分为多个区域,并将每个区域建模为一个智能体,智能体为区域内的车辆规划跨域的路径,通过强化学习算法能够学习到自适应、合作式的策略,从而避免交通拥堵,实现车辆更低的行驶时间。本发明利用人工智能技术为路网上的多车辆寻径问题给出了新的解决方案,通过强化学习算法训练路径选择策略,能够提供自适应的、合作式的路径优化算法,避免交通拥堵的发生,提高路网的吞吐率,并降低车辆的平均行驶时间。本发明技术应用前景广阔,有望在交通出行、货物运输、自主交通等领域得到应用。

本发明授权基于多智能体强化学习的跨域车辆路径优化方法在权利要求书中公布了:1.基于多智能体强化学习的跨域车辆路径优化方法,其特征在于,将交通系统内原始路网划分为多个区域,并将每个区域建模为一个智能体,智能体为区域内的车辆规划跨域的路径,通过强化学习算法学习到自适应、合作式的策略; 第一划分部分:将路网划分为M个区域,将每个区域建模为一个智能体,智能体为区域内的车辆选择离开该区域的割边,以及区域内部的路径; 第二定义部分: 将多车辆寻径问题定义为可观测的马尔科夫决策过程,以及多智能体强化学习定义如下: 智能体:将每个区域建模为一个单独的智能体,所有的智能体构成集合,;当车辆从一个区域出发或进入到一个新的区域,车辆会将行程信息发送给相关的区域智能体,智能体会为车辆规划路径并将路径计算结果发送给车辆,所述路径包括区域间的路径和区域内部的路径; 动作:当车辆进入路网或到达进入区域的割边时,该区域智能体需要做出动作,对于每个车辆查询请求,区域智能体从该区域的割边集合中选择一条边作为区域间的路径选择,这一选择决定了车辆即将进入的下一个区域和进入下一区域通过的边;假设在第t个时间步,智能体收到的路径查询请求集合为,对于每个查询请求,智能体做出动作; 观测:每个区域智能体的观测信息分为两部分,对于路网环境的观测和对于车辆查询请求的观测;首先,对于路网环境的观测包括区域内部的路段状态信息和对于邻居区域的道路状态信息的估计,所述邻居区域的道路状态信息包括邻居区域的平均行驶速度和总车辆数;所述路网环境,将路网的信息表示为,其中F为输入特征维度,每条割边的特征包含边的起点终点坐标、边的长度、边的平均车速和车辆总数和边连接区域的平均行驶速度和车辆总数;其次,每条车辆路径请求特征表示为,其中F'为车辆路径请求输入特征,包括车辆当前位置和终点的坐标、车辆到达条割边的时间估计和条割边到达车辆终点的距离,这一特征由区域智能体根据车辆发送的起点终点信息计算获得;在每个时间步,收到条路径查询请求,智能体对于t时刻第个查询请求的观测表示为,将作为智能体的策略网络输入; 全局状态:将时刻的全局状态表示为所有割边的特征的连接,这一状态表示包含了M个智能体的观测信息,同时,割边的特征包含这些关键路段的路况信息和各个区域的平均行驶速度信息; 策略:给定智能体的观测,智能体的策略网络输出概率分布,这一概率分布表示选择每个动作的概率,智能体会按照这一概率分布为车辆选择跨域动作,即中的一条割边; 奖励:智能体关于路径请求的局部奖励定义为,其中,为车辆进入动作路段的时间步;奖励设计和最小化车辆的完成行程的总行驶时间是一致的; 第三应用部分: 在每个区域内部署区域服务器,用于为区域内车辆规划路径,并与区域内车辆通信;以及部署中心服务器用于训练算法并与区域服务器通信; 智能体的策略网络,包括路网特征提取、车辆路径请求特征提取和车辆动作输出,其中; 路网特征提取: 路网特征提取过程旨在提取交通路网的特征,根据路网划分的结果,连接区域智能体的割边集合表示为,每条割边的特征为,包含割边对应路段的位置信息、交通拥堵信息和路段连接区域的交通状况信息;通过多层感知机网络对每条割边的输入特征进行编码,获得隐向量表示;通过将条割边的隐向量表示连接,获得区域智能体对于路网的特征提取 车辆路径请求特征提取: 在t时刻,智能体收到的车辆路径请求集合为;对于t时刻智能体收到的第个车辆的路径请求,的特征包含车辆的当前位置和目标位置信息;通过多层感知机网络将其编码为向量;将个车辆路径请求特征输入门控循环单元GRU进行特征提取,即,将GRU单元的最后一个隐向量作为多个车辆查询请求的向量表示,也就是; 车辆动作输出: 通过路网编码过程和车辆路径请求编码过程获得3个向量表示:路网向量表示,当前车辆的路径请求编码和多个车辆的路径请求编码;将这三个向量表示作为输入,智能体生成一个选择割边的概率分布,并根据概率选择割边; 首先使用多层感知机将向量表示映射为条割边的分数,使用动作掩码操作,将不可行的动作的分数调整为,然后通过softmax函数将边得分转换为选择条割边作为跨域动作的概率,即 根据向量表示和,智能体识别出具有位置相近的车辆路径请求。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区上海市四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。