重庆邮电大学林峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利基于多智能体深度强化学习的交通信号控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119252054B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411501953.6,技术领域涉及:G08G1/083;该发明授权基于多智能体深度强化学习的交通信号控制方法是由林峰;何帅;邵琅;蒋建春设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。
本基于多智能体深度强化学习的交通信号控制方法在说明书摘要公布了:本发明涉及基于多智能体深度强化学习的交通信号控制方法。该方法包括:为路口设置智能体,在云端或服务器部署拟合网络,根据交通路网结构和历史交通流数据进行预测并得到交通流预测结果Y;利用该交通流预测结果和随机获取的各个路口实时交通信息,对各个智能体和拟合网络进行训练,得到各个优化后的智能体和优化后的拟合网络;各个优化后的智能体根据交通流预测结果Y和各自当前的实时交通信息进行独立观测并将其结果传输给优化后的拟合网络,计算全局奖励并反馈给各个智能体,各个智能体根据当前各自观测结果和奖励,执行下一个动作,形成目标区域当前最优的交通信号控制策略。本发明实现了多路口的交通信号协调控制,明显提升出行效率。
本发明授权基于多智能体深度强化学习的交通信号控制方法在权利要求书中公布了:1.基于多智能体深度强化学习的交通信号控制方法,其特征在于,为目标区域的各路口设置智能体,在云端或服务器部署拟合网络,各个智能体分别与目标区域的交通路网环境、拟合网络进行实时交互,该方法具体包括: 步骤A:获取目标区域的交通路网结构和历史交通流数据,经过预处理后输入预训练的短时交通流预测网络进行预测,得到交通流预测结果Y; 步骤B:利用交通流预测结果Y和随机获取的各个路口实时交通信息,对各个智能体和拟合网络进行训练,得到各个优化后的智能体和优化后的拟合网络,其训练过程包括: 初始化各个智能体的估计网络参数和目标网络参数,初始化拟合网络的估计网络参数和目标网络参数,初始化经验回放池; 各个智能体从交通流预测结果Y中获取当前各自的交通流预测结果Yi,i表示路口或智能体的序号,各个智能体随机获取各自的实时交通信息; 各个智能体根据所述各自的实时交通信息和交通流预测结果Yi进行独立观测,得到各自的状态和动作j表示时间步的序号,i表示智能体或路口的序号,拟合网络根据全部智能体的状态计算全局奖励rj,得到随机经验sj,uj,rj,sj+1并将其存放在经验回放池中,sj表示当前的全局状态,sj是由当前全部智能体观测的状态所组成的,uj表示当前的全局动作,uj由当前全部智能体观测的动作所组成的,rj表示当前的全局奖励,sj+1表示下一个时间步的全局动作; 从经验回放池中随机采样数据st,ut,rt,st+1,其中t表示训练步的序号,各个智能体从该采样数据获取各自的当前状态和下一个状态分别经各自的估计网络和目标网络学习后输出各自的估计Qi值和目标Q'i值; 将从经验池中采样得到的当前全局状态st、各个智能体的估计Qi值和目标Q'i值一并输入拟合网络,经拟合网络的估计网络和目标网络学习后输出全局估计Qtot值和全局目标Q't0t值; 计算全局估计Qtot值与全局目标Q't0t值之间的损失,根据该损失反向传播分别更新各个智能体的估计网络参数θi、目标网络参数θ'i以及拟合网络的估计网络参数目标网络参数 各个智能体根据各自更新后网络参数形成各自的奖励分配权重并从全局奖励中获取各自的奖励各个智能体根据各自当前的状态动作和奖励各自执行下一个动作进而更新经验并将其存入经验池中; 从经验池中采样数据进行迭代训练,直至全局估计Qtot值与全局目标Q't0t值之间的损失函数收敛或达到预设的训练步数时停止迭代; 步骤C:各个优化后的智能体根据交通流预测结果Y和各自当前的实时交通信息进行独立观测,将其独立观测结果全部传输给优化后的拟合网络进行学习并计算全局奖励; 步骤D:各个优化后的智能体根据各自的贡献值从全局奖励中获取各自的奖励,结合各自当前观测结果以及各自的奖励,执行下一个动作,形成目标区域当前最优的交通信号控制策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励