当前位置 : 首页 > 专利喜报 > 东南大学彭剑坤获国家专利权

东南大学彭剑坤获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉东南大学申请的专利基于多目标深度强化学习的混合动力汽车生态驾驶方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116257937B 。

龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310020281.6，技术领域涉及：G06F30/15；该发明授权基于多目标深度强化学习的混合动力汽车生态驾驶方法是由彭剑坤;范毅;余思辰;何洪文;孙蕊;李志斌;马春野设计研发完成，并于2023-01-05向国家知识产权局提交的专利申请。

本基于多目标深度强化学习的混合动力汽车生态驾驶方法在说明书摘要公布了：本发明公开了一种基于多目标深度强化学习的混合动力汽车生态驾驶方法，属于深度强化学习技术领域。包括如下步骤：构建混合动力汽车自适应巡航系统ACC与动力系统的模型；利用MODRL算法，建立基于MODRL的混合动力汽车跟驰场景下的能耗优化方法；进一步利用条件网络CN，建立每个优化目标对应权重的输入网络，从而将MODRL算法首次应用于混合动力汽车多系统协同优化，结合奖励权重抽样机制，实现多目标权重的自适应选择。本发明所提出的方法能够解决混合动力汽车生态驾驶涉及的多目标权衡问题，从而在提升驾驶和动力性能的同时缩短开发周期。

本发明授权基于多目标深度强化学习的混合动力汽车生态驾驶方法在权利要求书中公布了：1.一种基于多目标深度强化学习的混合动力汽车生态驾驶方法，其特征在于，包括如下步骤： S1、构建混合动力汽车自适应巡航系统模型与动力系统模型； S2、利用多目标深度强化学习算法，建立基于多目标深度强化学习算法的混合动力汽车跟驰场景下的能耗优化方法； S3、基于神经网络，构建基于目标相对权重输入的条件网络； S4、将多目标深度强化学习算法应用于自适应巡航与能量管理协同优化，结合奖励权重抽样机制，建立基于多目标深度强化学习的混合动力汽车生态驾驶策略，提升车辆跟驰场景下能量管理的优化性能；步骤S4中，基于多目标深度强化学习的混合动力汽车生态驾驶策略包括以下步骤： S41、离线训练；通过多目标深度强化学习算法对模型进行训练，学习控制策略即输入状态与动作参数之间的映射关系； S42、将各个训练完成后的条件网络的参数读取出来，并将控制策略下载到整车控制器VCU中； S43、在线学习；获取当前时刻有关车辆状态及电池状态的有关信息，共同作用于已训练完成的条件网络，通过在线实时调节，完成对跟驰模型选择和功率分配决策的更新；步骤S41中通过多目标深度强化学习算法对模型进行训练，学习输入状态与动作参数之间的映射关系，具体包括以下步骤： S411、初始化多样经验回放缓冲区D；去重权重向量经验池W； S412、初始化条件网络价值函数；获得当前时刻的权重向量wt并将其添加入W； S413、agent以概率ε随机选择一个动作at，下达给environment执行该at；否则执行动作 S414、environment执行该at,返回rewardrt和新的状态st+1； S415、agent将这个状态转换过程transition:st,at,rt,st+1保存到多样经验回放缓冲区D； S416、从多样经验回放缓冲区D中随机选取部分样本，用sj,aj,rj,sj+1表示；从权重向量经验池W中随机选取wj；然后训练更新target神经网络，学习过程为：上式中,yj和y′j为标签；rj为学习过程中的奖励；λ为折扣因子； S417、定义TDerror，用于网络更新，TDerror为： S418、每经过N-回合，将online网络参数复制给target网络； S419、当训练步数完成后，条件网络训练完成。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人东南大学，其通讯地址为：210096 江苏省南京市江宁区东南大学路2号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

东南大学彭剑坤获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务