Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学工业互联网研究院聂文迪获国家专利权

重庆邮电大学工业互联网研究院聂文迪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学工业互联网研究院申请的专利基于深度强化学习的无信号灯交叉口控制方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116564078B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310443274.7,技术领域涉及:G08G1/01;该发明授权基于深度强化学习的无信号灯交叉口控制方法及设备是由聂文迪;高德娅;段垚鑫设计研发完成,并于2023-04-21向国家知识产权局提交的专利申请。

基于深度强化学习的无信号灯交叉口控制方法及设备在说明书摘要公布了:本发明公开了基于深度强化学习的无信号灯交叉口控制方法及设备,使用了深度强化学习算法协调控制交叉口无冲突放行,通过冲突点的判断方式避免了冲突放行,通过奖励函数的设计实现了车辆放行的公平性,以及在此基础上的最大限度放行,通过交互更新训练后的DQN网络计算得到当前时刻目标无信号灯交叉口的放行动作,减少了车辆的平均等待时间,增加了通行效率,从而解决了无信号灯交叉口车辆拥堵的问题。本发明相较于现有技术的深度强化学习的无信号灯交叉口放行方法而言,通过使用深度学习框架制定交叉口协调问题,无需记录冲突区域网格的占领情况,降低了计算的复杂度;同时,将无信号灯交叉口整体进行分析也充分发挥了交叉口的协调潜力。

本发明授权基于深度强化学习的无信号灯交叉口控制方法及设备在权利要求书中公布了:1.基于深度强化学习的无信号灯交叉口控制方法,其特征在于,包括: S1、构建代理和环境,其中,所述环境包括冲突区和车道区,所述冲突区中包括冲突点; S2、观测所述环境,并获取t时刻的所述环境整体的状态st,代理通过ε-贪婪策略选取状态st下t时刻的放行动作at; S3、代理执行所述放行动作at,得到t时刻所述冲突点的冲突情况; S4、根据所述冲突情况确定t时刻的奖励rt,并获取所述环境整体在t+1时刻的状态st+1; S5、将状态st、放行动作at、奖励rt、状态st+1整合成经验并存入经验回放池中,使用所述经验回放池中的经验训练代理; S6、通过重复步骤S2至步骤S5的环境与代理交互训练,并将训练结果用于更新DQN网络; S7、使用更新后的DQN网络计算当前时刻无信号灯交叉口的放行动作; 观测所述环境,并获取t时刻的所述环境整体的状态st具体包括: 观测12条道路的道路状况,并采用12元向量N分别表示12条道路的道路状况; 其中,若第i条道路的头车到达所述冲突区,则将第i条道路所对应的向量Ni记为第i条道路的车队长度;否则,将第i条道路所对应的向量Ni记为0;其中,0≤i≤11; 此时,将t时刻的所述环境整体的状态st表示为st={N0t,N1t,…,N10t,N11t}; 其中,头车是指该条道路上向冲突区方向行驶的车辆中排行第一个的车辆; 交叉口放行能力的奖励函数表示如下: rnt=VtVmax 其中,Vt表示t时刻放行的车辆数量,Vmax表示最大能放行的车辆数目; 使用排队长度作为公平性的奖励函数,公平性的奖励函数表示如下: rft=∑NitNmax 其中,Nit表示t时刻被放行车道的车辆数目,Nmax表示单车道的最大容量; 对每次放行的最大车辆数目和使用排队长度作为公平性的奖励函数进行归一化,得到t时刻的奖励函数,t时刻的奖励函数表示如下: 其中,rt为t时刻的奖励函数,rnt为公平性的奖励函数,rft为交叉口放行能力的奖励函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学工业互联网研究院,其通讯地址为:400000 重庆市渝北区数据谷中路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。