南京信息工程大学王翀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京信息工程大学申请的专利基于多智能体深度强化学习的城市交通信号协同控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114995119B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210151210.5,技术领域涉及:G05B13/04;该发明授权基于多智能体深度强化学习的城市交通信号协同控制方法是由王翀设计研发完成,并于2022-02-16向国家知识产权局提交的专利申请。
本基于多智能体深度强化学习的城市交通信号协同控制方法在说明书摘要公布了:本发明公开了基于多智能体深度强化学习的城市交通信号协同控制方法,包括:采集城市路网的交通状态信息向量;协调各个子区域交叉口的控制策略,并生成子区域交叉口的控制策略。通过深度强化学习算法优化交通信号灯配时,实时动态地调节交叉口车流,减少拥堵延误。以降低总旅行时间为目标优化所有交叉口的信号配时,防止单一交叉口优化对路网造成不利影响,并通过强化学习持续更新优化策略。本发明可以满足城市交通信号控制问题的复杂性、实时性、适应性要求,提升城市路网的整体通行效率,缓解交通拥堵。
本发明授权基于多智能体深度强化学习的城市交通信号协同控制方法在权利要求书中公布了:1.基于多智能体深度强化学习的城市交通信号协同控制方法,其特征在于,包括: 采集城市路网的交通状态信息向量; 协调各个子区域交叉口的控制策略,并生成子区域交叉口的控制策略,包括: 获取交通状态信息向量,动态生成每个子区域交叉口的控制策略,并将每个子区域交叉口的控制策略转换为对应子区域的交通信号灯的相位配时,具体包括: 将子区域i交通状态信息,送入训练获得的执行网络; 执行网络动态生成已知的最优控制策略; 将最优控制策略转换为对应子区域i交通信号灯的相位配时: 获取当前交通信号灯的相位配时和相位配时的已执行时长,相位配时的最新执行时长;若,则交通信号灯跳转执行下一相位配时; 从中提取子区域的拥堵延误状态,计算奖励函数; 获取下一时刻交通信息状态和,将存为经验数据; 基于训练获得的本地评价网络,训练获得执行网络,包括: 训练获得本地评价网络,包括: 采集,获取历史经验数据,为子区域i的历史时刻的交通状态信息,为对应的历史控制策略,为控制策略的奖励值,为时刻+1子区域的交通状态信息,为时刻+1全路网交通状态信息,为历史经验数据的容量; 随机选择条历史经验数据构成训练数据集; 利用训练数据集对本地评价网络进行训练,包括: 从训练数据集中提取奖励向量、交通状态信息向量和; 训练获得的全局执行网络计算获得全局优化策略的控制策略分量; 采用软更新法更新目标评价网络的权重: , 式中,τ是设定的系数,是更新前的权重,是更新后的目标评价网络的权重,为的权重; 根据交通状态信息向量、控制策略分量、奖励向量以及目标评价网络的权重,求解使累积奖励最大的控制目标向量: , 式中,是设定的折扣系数; 计算本地评价网络的值和控制目标向量之间的loss值: , 式中,是和控制目标向量之间的loss值;是本地评价网络的权重向量,采用Adam优化器以loss值最小为目标迭代更新;是由该训练数据集计算得到的loss期望值,,; 判断是否能收敛到,若收敛到则输出获得最终的本地评价网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:224002 江苏省盐城市盐南高新区新河街道文港南路105号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。