北京交通大学刘曌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京交通大学申请的专利面向电网电量平衡与新能源消纳的光储充一体站运行方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115940289B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211625303.3,技术领域涉及:H02J3/46;该发明授权面向电网电量平衡与新能源消纳的光储充一体站运行方法是由刘曌;段玉戈;许寅;孙庆凯;王希豪;王小君;和敬涵;王颖设计研发完成,并于2022-12-16向国家知识产权局提交的专利申请。
本面向电网电量平衡与新能源消纳的光储充一体站运行方法在说明书摘要公布了:本发明提供了一种面向电网电量平衡与新能源消纳的光储充一体站运行方法,包括:基于光储充一体站的综合服务场景,以光储充一体站运行成本最小化为目标,以功率平衡约束、主电网交互功率约束和设备运行约束为约束条件,以储能单元的实时出力为决策变量,建立光储充一体站的联合运行优化模型;运用马尔可夫决策过程方法转化为策略决策问题的的强化学习网络;采用历史系统状态数据,基于DDPG算法离线训练强化学习网络,结合分时电价机制对光储充一体站的联合运行优化模型进行调度成本最低经济性优化计算,得到光储充一体站内储能系统的实时自趋优运行出力结果,进而实现光储充一体站的动态优化运行,还可以有效避免计算中的维数灾难。
本发明授权面向电网电量平衡与新能源消纳的光储充一体站运行方法在权利要求书中公布了:1.一种面向电网电量平衡与新能源消纳的光储充一体站运行方法,其特征在于,包括: S1基于光储充一体站的综合服务场景,以光储充一体站运行成本最小化为目标,以功率平衡约束、主电网交互功率约束和设备运行约束为约束条件,以储能单元的实时出力为决策变量,建立光储充一体站的联合运行优化模型;包括: 目标函数如下式1所示: F=minCE+CBES1 其中,F为光储充一体站运行成本,CE为光储充一体站从电网购电的成本,Pgridt为时段t系统与主电网进行电力交换的功率,数值为正表示系统向主电网购电,数值为负表示系统进行余电上网;εet为时段t的电价;Δt为时间间隙长度;CBES为电储能的充放电折旧成本,PBESt为电储能在时段t的充电或放电功率,数值为正表示电储能处于放电状态,数值为负表示处于充电状态;ρBES为电储能折旧成本系数; 约束条件如下所示: 1功率平衡约束: 在时段t,电功率平衡约束如下式2所示: Pgridt+Ppvt+PBESt=Ploadt2 其中,Ppvt为光伏发电功率;Ploadt为时段t的用户电负荷需求量; 2主电网交互功率约束如下式3所示: 其中,和分别为系统与主电网交互功率的下限和上限; 3设备运行约束如下式2-3所示: 其中,和分别为电储能充放电功率的下限和上限; 对于电储能设备,约束如下式3-4所示: 其中,和分别为电储能荷电状态的下限和上限;CSOCt为电储能在时段t的荷电状态;QBES为电储能的容量;为电储能初始时的荷电状态;ηBES为电储能充放电系数;ch和ηdis分别为电储能的充电效率和放电效率; S2将所述的联合运行优化模型中的动态调度问题运用马尔可夫决策过程方法转化为策略决策问题的强化学习网络;包括: 将光储充一体电站运行成本最小化问题转化成智能体的奖励最大化形式,如下式5所示: 其中,rs,a为智能体在调度时段t获得的总奖励值,s为光储充一体电站在调度时段t的观测状态,s={Ploadt,Ppvt,Csoct-1,t},Ploadt,Ppvt,Csoct-1,t分别为用户电负荷需求量、光伏发电功率、电储能荷电状态以及所处的调度时段;a为光储充一体电站的储能系统的动态经济调度动作,在时段t,一体电站中的动作可以由设备的出力情况PBESt表示,a={PBESt};是对成本值进行缩放的比例,Cs,a为智能体在状态s下,时段t的光储充一体站从电网购电的成本;CBESs,a为智能体在状态S下,时段t的电储能的充放电折旧成本; 使用下式6的动作-值函数Qs,a对光储充一体电站的储能系统在状态S时的动态经济调度动作al进行评估,动作-值函数Qπs,a越大,al越优: 其中,Eπ.为最优目标策略π下的期望;γk∈[0,1],为折扣因子,表示未来某一时刻的奖励在累积奖励中所占的影响比重,γk越大,则越重视对未来的奖励;rt+k为智能体在时段t+k获得的总奖励值;st+k为光储充一体站在时段t+k的状态;at+k为光储充一体站在时段t+k执行的动作, k∈N*,表示智能体循环学习的代次; 根据下式7得到最优目标策略π以最大化动作-值函数: 其中,A为智能体动作的动作集合; S3采用历史系统状态数据,基于深度确定性策略梯度DDPG,DeepDeterministicpolicygradient算法离线训练所述强化学习网络,得到训练好的强化学习网络;包括: 所述的历史系统状态数据为光储充一体电站的观测状态,包括光储充一体站的系统电负荷需求量、光伏发电功率、电储能荷电状态及调度时段; 所述的强化学习网络包括值网络和策略网络,通过策略网络πs|θπ和值网络Qs,a|θQ分别创建两个独立的目标网络π's|θπ'和Q's,a|θQ',如下式8和9所示: 策略网络 值网络 设定循环优化周期T,将历史系统状态数据输入策略网络和值网络的目标网络,在训练完一个批量的数据后,DDPG算法通过梯度上升或梯度下降算法更新策略网络和值网络的当前网络的参数,然后再通过软更新方法更新策略网络和值网络的目标网络的参数;在循环T次后,完成DDPG算法的离线学习,得到训练好的强化学习网络;具体包括: 通过最小化损失函数LθQ式 LθQ=Eyt-Qst,at|θQ214 优化参数;其中,θQ为值网络中当前网络的参数;E.为期望函数;yt为目标Q值,通过式 yt=rt+γQ'st+1,π'st+1|θπ'|θQ'15 计算获得;式15中,rt为智能体在时段t获得的总奖励值;γ∈[0,1],为折扣因子;Q'为更新前的目标Q值;π'为目标策略;θπ'为策略网络中目标网络的参数;θQ'为价值网络中目标网络的参数; 通过LθQ关于θQ的梯度式 和 更新网络;式17中,μQ为值网络学习率; 通过采样策略梯度式 更新策略网络; 通过式 θQ'←τθQ+1-τθQ'20 θπ'←τθπ+1-τθπ'21 更新策略网络参数θπ;其中,μπ为策略网络学习率;τ为软更新系数,τ<<1; S4根据训练好的强化学习网络,结合分时电价机制对所述光储充一体站的联合运行优化模型进行调度成本最低经济性优化计算,得到光储充一体站内储能系统的实时自趋优运行出力结果,进而实现光储充一体站的最优运行;包括: 当接到调度任务时,在每个时段,根据系统当前状态st,利用训练好的强化学习网络选择调度动作at; 执行动作at并进入下一个环境状态,同时获得奖励rt; 继而采集时段t+1一体站内的状态信息st+1及分时电价信息作为新的样本,并进行该时段的动态调度决策,即光储充一体站内储能系统的实时自趋优运行出力结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京交通大学,其通讯地址为:100044 北京市海淀区西直门外上园村3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励