浙江省交通运输科学研究院金波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江省交通运输科学研究院申请的专利一种可扩展的高速公路交通流管控的多策略协同优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120260267B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510303391.2,技术领域涉及:G08G1/01;该发明授权一种可扩展的高速公路交通流管控的多策略协同优化方法是由金波;阙祖琛;朱铭耀;汪成立;高介敦;娄刃设计研发完成,并于2025-03-14向国家知识产权局提交的专利申请。
本一种可扩展的高速公路交通流管控的多策略协同优化方法在说明书摘要公布了:本发明公开了一种可扩展的高速公路交通流管控的多策略协同优化方法,包括:S1.基于交通流管控策略的不同类型定义相对应的强化学习动作空间;S2.基于交通流观测状态定义相对应的强化学习状态空间;S3.基于不同目标系数定义强化学习的奖励函数;S4.构建仿真训练环境;S5.基于动作空间、状态空间、奖励函数、仿真训练环境构建强化学习智能体策略;S6.在仿真训练环境中对构建的强化学习智能体策略进行优化,得到最优强化学习智能体策略;S7.获取实际环境状态,根据最优强化学习智能体策略计算实际环境状态的最优交通流管控策略。
本发明授权一种可扩展的高速公路交通流管控的多策略协同优化方法在权利要求书中公布了:1.一种可扩展的高速公路交通流管控的多策略协同优化方法,其特征在于,包括: S1.基于交通流管控策略的不同类型定义相对应的强化学习动作空间; S2.基于交通流观测状态定义相对应的强化学习状态空间; S3.基于不同目标系数定义强化学习的奖励函数; S4.构建仿真训练环境; S5.基于动作空间、状态空间、奖励函数、仿真训练环境构建强化学习智能体策略; S6.在仿真训练环境中对构建的强化学习智能体策略进行优化,得到最优强化学习智能体策略; S7.获取实际环境状态,根据最优强化学习智能体策略计算实际环境状态的最优交通流管控策略; 所述步骤S5包括: S51.初始化强化学习算法策略参数,且初始化训练次数; S52.初始化状态空间和奖励函数,且初始化迭代次数; S53.基于交通流管控策略类型的参数获取当前时段的动作空间; S54.根据仿真训练环境计算下一时段的状态空间和当前时段的奖励函数; S55.基于当前时段的动作空间、当前时段的状态空间、下一时段的状态空间、当前时段的奖励函数更新算法策略强化学习算法策略参数; S56.判断迭代次数是否小于总迭代次数,若是,则执行步骤S53;若否,则执行步骤S57; S57.判断训练次数是否小于总训练次数,若是,则执行步骤S52;若是,则执行结束,得到强化学习智能体策略; 所述步骤S53中基于交通流管控策略类型的参数获取当前时段的动作空间,表示为: 其中,表示当前时段k的动作空间;πθ表示强化学习智能体策略;表示当前时段k的状态空间; 所述步骤S55中基于当前时段的动作空间、当前时段的状态空间、下一时段的状态空间、当前时段的奖励函数更新算法策略强化学习算法策略参数,表示为: 其中,θ表示强化学习智能体算法策略参数;表示下一时段k+1的状态空间;表示当前时段k的奖励函数;Q表示强化学习智能体算法策略参数更新函数;表示当前时段k的状态空间;表示当前时段k的动作空间;表示当前时段k的奖励函数;gtra表示奖励函数的计算函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江省交通运输科学研究院,其通讯地址为:310000 浙江省杭州市西湖区大龙驹坞705号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励