东南大学徐铖铖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利面向智能网联专用道场景的速度协调与协同合流组合控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116758739B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310669127.1,技术领域涉及:H04L67/12;该发明授权面向智能网联专用道场景的速度协调与协同合流组合控制方法是由徐铖铖;马晨翔;陈雨菲设计研发完成,并于2023-06-07向国家知识产权局提交的专利申请。
本面向智能网联专用道场景的速度协调与协同合流组合控制方法在说明书摘要公布了:本发明公开了一种面向智能网联专用道场景的速度协调与协同合流组合控制方法,包括:建立组合控制系统,利用交通数据采集设备获取上游路段、匝道路段、瓶颈路段的密度流量等交通流数据,布设交通信号发布设备,针对专用车道和通用车道发布不同限速与换道组合控制指令,基于深度强化学习算法实现决策控制智能体,接收来自数据采集设备的交通状态,在训练模式下不断迭代训练生成最优控制策略,转入执行模式,输出最优控制指令到信号发布设备。本发明适用于设置智能网联专用道的复杂交通流场景,可以最大程度减少专用道场景下混合交通流带来的负面效益,同时保证各项策略实现最佳控制效果。
本发明授权面向智能网联专用道场景的速度协调与协同合流组合控制方法在权利要求书中公布了:1.面向智能网联专用道场景的速度协调与协同合流组合控制方法,其特征在于,该方法包括以下步骤: 步骤1,建立面向智能网联专用道场景的速度协调与协同合流组合控制系统,包括:交通数据采集设备、交通信号发布设备、决策控制智能体和车辆; 步骤2,沿高速公路以预设间隔布设交通数据采集设备,获取特定检测断面的交通流数据,设置更新频率; 步骤3,在瓶颈路段上游设置控制区,布设可变信号标识与路侧信号单元作为交通信号发布设备,其中可变信号标识发布不同限速指令,路侧信号单元发布换道指令,设置控制周期设和控制断面间距; 步骤4,基于深度强化学习网络实现决策控制智能体,决策控制智能体设有训练模式和执行模式,接收来自数据采集设备的交通状态st,若当前处于训练模式,转入步骤5,若当前处于执行模式,转入步骤6; 步骤5,在训练模式下,根据当前训练次数设定概率阈值ε,决策控制智能体有ε的概率采取随机动作at,有1-ε的概率采取未来平均累积奖励,即Q值,最高的最优动作at,发送至交通信号发布设备,转换成相应控制指令,传递给受控车辆,将交互过程中的状态st、动作at以及所获得奖励存入经验库中,迭代训练智能体,直至满足相应阈值条件,进入执行模式; 其中,决策控制智能体的训练过程包括如下步骤: 步骤5.1,初始化经验库,设置样本容量;初始化深度学习神经网络,建立在线网络与目标网络,两个网络结构相同,其中在线网络不断与环境进行交互以更新网络参数,目标网络用于输出获得未来平均累计奖励最高的最优动作; 步骤5.2,决策控制智能体接收交通状态,输入网络得到不同动作的未来平均累积奖励,即Q值,ε概率随机采取动作,1-ε概率采取Q值最大动作; 步骤5.3,将步骤5.2中的动作转换成相应控制指令,通过交通信号设备发布,经过一个控制周期后,计算上一控制周期t的奖励值Rt: , 式中,kb为瓶颈密度,kc为关键密度,kg为拥堵密度; 步骤5.4,控制周期结束,智能体接收下一控制周期t+1的交通状态st+1,将控制周期内的交互信息序列st,at,Rt,st+1储存进入经验库,记为样本samplet; 步骤5.5,从经验库中取出批量为k的经验样本,定义损失函数的公式如下: , 其中表示在线网络参数,表示在控制周期t内,状态为、动作为时,在线网络计算得到的状态Q值,表示目标值,计算公式如下: , 其中表示控制周期获得的奖励值,为折扣因子;表示在控制周期内,状态为、动作为时,在线网络计算得到的Q值;为目标网络参数,表示在状态,在线网络根据参数选择Q值最大的动作a;表示依据上述选择的动作a,在状态下,目标网络计算得到的Q值; 步骤5.6,赋予不同经验样本权重,计算公式如下: , 其中ωt为样本samplet的权重值,N为经验库中样本总量,β和π为常数;表示样本samplet被抽取的概率,表示样本samplet的优先级,α为优先级权重,用于修正;表示经过修正后批量k的所有样本优先级之和; 步骤5.7,根据梯度下降方向更新在线网络参数,公式如下: , 其中表示在线网络参数,表示更新后的在线网络参数,κ为学习率,表示损失函数的梯度值,表示在线网络在处的梯度值; 步骤5.8,到达预设控制周期数时,将在线网络参数复制给目标网络参数; 步骤5.9,重复步骤5.2至5.8,直至达到设定的停止条件; 步骤6,在执行模式下,决策控制智能体直接选取未来平均累积奖励最高的最优动作at,发送至交通信号发布设备,转换成相应控制指令,传递给受控车辆。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励