北京理工大学李佳奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于多智能体强化学习的混合动力汽车生态驾驶策略获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119283834B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411581642.5,技术领域涉及:B60W20/12;该发明授权一种基于多智能体强化学习的混合动力汽车生态驾驶策略是由李佳奇;何洪文;王勇;吴京达;王沛设计研发完成,并于2024-11-07向国家知识产权局提交的专利申请。
本一种基于多智能体强化学习的混合动力汽车生态驾驶策略在说明书摘要公布了:本发明提供了一种基于多智能体强化学习的混合动力汽车生态驾驶策略,其不同于基于传统强化学习的生态驾驶策略,创新性地设计了多智能体协同训练框架,从而能够有效避免上层速度规划和下层能量管理解耦处理,实现了全局协同优化,并可获取更优的节能效果。本发明的策略相比现有技术大幅缩减了计算时间,在控制中提供了较好的实时性。
本发明授权一种基于多智能体强化学习的混合动力汽车生态驾驶策略在权利要求书中公布了:1.一种基于多智能体强化学习的混合动力汽车生态驾驶策略控制方法,其特征在于:具体包括以下步骤: 步骤1、针对混合动力汽车在信号交叉口的通行场景,建立由车辆动力总成模型和具备V2I功能的信号灯交通环境模型构成的信号灯交通环境模型,用于作为策略上层对包含速度v、加速度a和发动机功率的车辆信息,以及包含车辆与前方信号交叉口距离dinter、信号灯的相位lp和剩余时间lr的交通信息进行采集处理,以模拟出车辆在信号灯交叉口的行驶工况并计算相应的能量消耗; 步骤2、通过将问题建模为马尔科夫决策过程来构建多智能体环境交互模型,由上层速度规划策略智能体和下层能量管理策略智能体两部分组成,分别针对上层速度规划策略智能体和下层能量管理策略智能体定义以下状态空间: 式中,s1为上层速度规划策略智能体状态空间,s2为下层能量管理策略智能体状态空间,SoC为动力电池的剩余电量; 定义以下动作空间: a1={a|amin≤a≤amax} a2={Pe|Pe,min≤Pe≤Pe,max} 式中,a1为上层速度规划策略智能体动作空间,a2为下层能量管理策略智能体动作空间,amin和amax分别为加速度最小值和最大值,Pe为混合动力汽车的发动机功率,Pe,min和Pe,max分别为发动机功率最小值和最大值; 以及定义以下奖励函数: 式中,w1和w2为权重系数,r1为上层速度规划策略智能体奖励函数,涉及到达目的地时间、能耗以及交通安全三部分因素,dend为车辆到达目的地距离,vred为发生闯红灯时车辆的速度,用于衡量智能体违反约束程度,r2为下层能量管理策略智能体奖励函数,分别涉及能耗以及SoC稳定情况两部分因素,SoCref为参考SoC,t为当前时刻; 步骤3、对多智能体进行基于强化学习的集中式训练,定义集中式训练的全局价值函数,在训练中使上层速度规划策略智能体和下层能量管理策略智能体能够分别基于自身与全局状态,通过最大化价值函数选择动作并获得奖励,最终实现上下层策略的更新; 步骤4、对训练完成后的多智能体进行仿真和实际应用测试以验证其效果,之后将多智能体应用于真实交通场景的生态驾驶任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励