Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京航空航天大学唐鑫获国家专利权

南京航空航天大学唐鑫获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京航空航天大学申请的专利一种基于PPO算法及考虑充电电费的电池快速充电控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115447431B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211100593.X,技术领域涉及:G06F30/27;该发明授权一种基于PPO算法及考虑充电电费的电池快速充电控制方法是由唐鑫;欧阳权;王志胜设计研发完成,并于2022-09-09向国家知识产权局提交的专利申请。

一种基于PPO算法及考虑充电电费的电池快速充电控制方法在说明书摘要公布了:本发明公开了一种基于PPO算法及考虑充电电费的电池快速充电控制方法,构建锂离子电池电热耦合模型和充电电费优化模型,确定其关键状态变量,归一化后归入强化学习状态空间,定义动作空间和奖励函数;基于近端策略优化算法对构建的充电策略网络、策略评估网络进行训练;直至充电策略网络和策略评估网络收敛,导出充电策略网络作为电池快速充电策略;采集实时数据输入训练成熟的充电策略网络,决策出当前时刻的最优充电动作;每个充电周期结束后重新采集状态量并决策充电电流,直至充电完成。本发明能实现具有安全与健康主动意识的、低充电成本的快速充电,将多约束、多目标最优化求解导致的复杂计算迁移到离线训练环节,显著降低了在线充电决策的计算复杂度。

本发明授权一种基于PPO算法及考虑充电电费的电池快速充电控制方法在权利要求书中公布了:1.一种基于PPO算法及考虑充电电费的电池快速充电控制方法,其特征在于,包括以下步骤: 1构建锂离子电池电热耦合模型和充电电费优化模型,并根据构建的两个模型建立离线训练场景,确定其关键状态变量; 2将步骤1中确定的关键状态变量归一化后归入强化学习状态空间,定义动作空间和奖励函数; 3基于近端策略优化算法对构建的充电策略网络、策略评估网络进行训练;所述充电策略网络根据获取到的状态变量产生充电动作,依据步骤1中锂离子电池电热耦合模型更新电池状态,并将充电动作、电池状态、奖励值记录于经验池,通过经验池信息进行充电策略网络和策略评估网络的同步更新; 4循环执行步骤3,直至充电策略网络和策略评估网络收敛,导出充电策略网络作为电池快速充电策略; 5实时采集电池当前电量、端电压、环境温度、电池表面温度、当前时刻电价,并进行归一化处理,输入步骤4中训练成熟的充电策略网络,决策出当前时刻的最优充电动作; 6每个充电周期结束后重新采集状态量并决策充电电流,直至充电完成; 步骤1所述锂离子电池电热耦合模型构建过程如下: 电压源VOC和电阻R0分别用于模拟电池的储能和充放电能量损失,RC网络R1,C1和R2,C2表征了电池的短期和长期瞬态响应;根据基尔霍夫电流和电压定律,电池的动态特性描述为: 式中,SOCk、Cn、IBk、VBk分别表示电池的SOC状态、标称容量、充电电流和电压;电池开路电压VOCk是SOCk的非线性函数:VOCk=gSOCk;V1k和V2k分别表示电容C1和C2两端的电压;R0为恒定电阻;TC、TS表示电池核心温度和表面温度,根据能量守恒原理计算为: 式中,Tamb为电池的环境温度;RC、Ru分别表示热传导电阻和对流电阻;CC、CS分别表示电池的内部热容和表面热容;电池的温度定义为TS和TC的平均值: 步骤1所述充电电费优化模型构建过程如下: 最小化电池从任意初始电量SOC0到充至期望电量SOCd所花费的时间,充电速度对应的目标函数为: minJ1=NT5 式中,T表示采样周期,N是SOCN=SOCd所对应的采样步数; 充电成本受电池的充电电流和当前时刻的电价影响,充电成本优化的目标函数为: 式中,pk是在充电采样周期k时电力的分时电价;J2为电池充电过程中总的电费支出; 充电安全约束为: 0≤IBk≤Imax7 式中,Imax是电池的最大允许充电电流;防止电池的SOC、电压和温度超过其允许的限值: 式中,SOCmax、Vmax和Tmax分别代表电池SOC、电压和温度的上限; 步骤3所述充电策略网络和策略评估网络实现过程如下: 充电策略网络和策略评估网络的隐藏层均为全连接层,充电策略网络第一层为relu函数,第二层包含电池充电策略分布的期望和方差两部分,期望值部分的激活函数为tanh函数,方差部分的激活函数为softplus函数;策略评估网络共包含两层网络,第一层的激活函数为relu函数;第二层的激活函数为tanh函数;充电策略网络为: 策略评估网络为: 式中,wa1、wa2、wa3、wc1、wc2分别为神经网络中的权重系数,ba1、ba2、ba3、bc1、bc2为神经网络中的偏置,充电策略网络参数统称为θ,策略评估网络参数统称为δ,θ和δ随神经网络的训练过程不断更新; 步骤3所述基于PPO算法的锂电池快速充电策略环境与算法的交互训练过程如下: 训练阶段采用动作-评价训练框架,该训练框架包含充电策略网络和策略评估网络两部分;其中充电策略网络接受锂电池充电环境的状态空间信息sk=[k,SOCk,VBk,Tak,pk]T,输出充电电流动作ak;策略评估网络接收经验池中的经验信息,评估得到当前策略网络θ所对应的状态价值函数Vθsk,用于评价当前策略网络充电策略的优劣性; 充电策略网络更新部分,首先定义了电池的充电目标: 式中,表示对区间[0,k]求均值,θ表示当前回合动作网络参数,θold表示上一更新回合充电策略网络参数;πθ代表当前回合电池充电策略,代表上一回合电池充电策略,为估计了电池充电电流ak在电池状态sk下的优势函数,由策略评估网络估计的状态价值函数计算所得; 在动作-评价网络训练框架下,策略评估网络输出状态价值函数Vθsk,并通过下式计算优势函数: 式中,表示经验池中随机抽取的第n回合中第k充电阶段的充电环境状态s,rk表示第k个充电周期获得的充电奖励,γ为奖励折扣因子;N为一个充电回合的总步数; 采用PPO算法对电池充电目标进行了裁剪: 式中: 其中,LCLIPθ实现了一种与随机梯度下降兼容的信赖域修正方法,并通过消除KL损失来简化算法以及减小适应性修正的需求;充电策略网络通过实现该目标来更新自身网络参数θ;策略评估网络部分,采用传统时间差分误差TD-error方式更新网络参数δ。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。