Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 吉林大学张智权获国家专利权

吉林大学张智权获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉吉林大学申请的专利一种基于分层强化学习的多线路模块化公交接驳控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412316B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510901155.0,技术领域涉及:G08G1/123;该发明授权一种基于分层强化学习的多线路模块化公交接驳控制方法是由张智权;别一鸣;从远;杨颖;张鹏;刘芷含设计研发完成,并于2025-07-01向国家知识产权局提交的专利申请。

一种基于分层强化学习的多线路模块化公交接驳控制方法在说明书摘要公布了:一种基于分层强化学习的多线路模块化公交接驳控制方法,本发明属于城市公共交通控制领域,具体涉及基于分层强化学习的多线路模块化公交接驳控制方法。本发明的目的是为了解决现有车辆无法应对站点客流的随机波动,并且无法满足接驳过程中模块化公交对速度控制的实时性与精确性的要求的问题。过程为:1.定义模块化公交环境数据;2.初始化网络模型;3.获得训练好的第一值函数、第二值函数、技能、选择器、第一目标值函数和第二目标值函数;4.在完整线路场景下保存训练好的第一下层批评家、第二下层批评家、技能网络模型参数、上层批评家网络和终止函数网络;5.将待测观测信息输入训练好的网络,训练好的网络输出动作。

本发明授权一种基于分层强化学习的多线路模块化公交接驳控制方法在权利要求书中公布了:1.一种基于分层强化学习的多线路模块化公交接驳控制方法,其特征在于:所述方法具体过程为: 步骤1.定义模块化公交环境数据; 步骤2.初始化技能网络、选择器网络、第一值函数网络、第二值函数网络、上层批评家网络、第一下层批评家网络、第二下层批评家网络、终止函数网络、第一目标值函数网络、第二目标值函数网络、上层批评家目标网络、第一下层批评家目标网络、第二下层批评家目标网络; 步骤3.将完整线路场景拆分为跟驰场景、停靠场景、驻站场景和接驳场景; 获得接驳班次的观测信息; 获取安全性奖励函数、舒适性奖励函数、效率性奖励函数,基于安全性奖励函数、舒适性奖励函数、效率性奖励函数获得总奖励值; 将接驳班次的观测信息输入到对应场景的技能网络中,技能网络输出动作值,执行技能网络输出的动作值,获取时刻接驳班次的观测信息; 对应场景为跟驰场景、停靠场景、驻站场景或接驳场景; 将作为一条样本经验存储到经验池中; 基于经验池获得训练好的第一值函数网络、第二值函数网络、技能网络、选择器网络、第一目标值函数网络和第二目标值函数网络; 步骤4.在完整线路场景下训练第一下层批评家网络、第二下层批评家网络、技能网络、上层批评家网络和终止函数网络,保存训练好的第一下层批评家网络、第二下层批评家网络、技能网络模型参数、上层批评家网络和终止函数网络; 步骤5.将待测观测信息输入训练好的网络,训练好的网络输出动作。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130023 吉林省长春市南关区人民大街5988号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。