重庆大学任洲洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119863051B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411636803.6,技术领域涉及:G06Q10/0631;该发明授权一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法是由任洲洋;冯健冰设计研发完成,并于2024-11-15向国家知识产权局提交的专利申请。
本一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法在说明书摘要公布了:本发明公开一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法,包括以下步骤:1考虑电解槽法拉第效率损失效应,构建电氢混合储能动态运行模型;2计及风电不确定性,建立计及电氢混合储能动态运行的电氢耦合系统风险调度模型;3构建鲁棒约束马尔可夫决策架构;4利用柔性行动器‑评判器基线算法对鲁棒约束马尔可夫决策架构进行参数化;5利用参数化后的鲁棒约束马尔可夫决策过程架构求解电氢耦合系统风险调度模型,得到电氢耦合系统风险调度方案。本发明面向能源低碳绿色转型和能源安全的重大需求,提出基于新的安全深度强化学习算法,实现电氢耦合系统风险的高效和严格管控,保障系统运行的可靠性和安全性。
本发明授权一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法在权利要求书中公布了:1.一种基于鲁棒安全深度强化学习的电氢耦合系统风险调度方法,其特征在于,包括以下步骤: 1考虑电解槽法拉第效率损失效应,构建电氢混合储能动态运行模型; 2计及风电不确定性,建立计及电氢混合储能动态运行的电氢耦合系统风险调度模型; 3构建鲁棒约束马尔可夫决策架构; 4利用柔性行动器-评判器基线算法对鲁棒约束马尔可夫决策架构进行参数化; 5利用参数化后的鲁棒约束马尔可夫决策过程架构求解电氢耦合系统风险调度模型,得到电氢耦合系统风险调度方案; 电氢耦合系统风险调度模型如下所示: s.t.hx,y,ζ=09 Ax+Dy+Mζ+e≤010 gx,y,ζ≤011 ux,y,ζ≤012 式中,t表示调度间隔;T为调度周期;向量x代表包括调度策略在内的决策变量;向量y表示电氢耦合系统HEES中的其他状态变量;向量ζ表示不确定的预测误差;A、D和M分别为系数矩阵,e为系数向量;下标l表示第l条支路;l表示支路集合;符号‘-’代表各变量的上限;·+表示max{·,0};代表支路过载程度;dB为支路过载的风险阈值;Pr{x}=1-Fx表示x的概率,F为累积分布函数;Pl,t表示支路潮流;dB表示风险阈值;ftx表示运行成本函数;hx,y,ζ=0表示交流功率流方程和能量平衡方程;ρ为不确定预测误差分布; 鲁棒约束马尔可夫决策架构包括动作网络、奖励评判网络、安全评判网络、拉格朗日乘子、目标网络;代表状态空间,表示动作空间,为状态转移函数,r表示在状态st下执行动作at所获得的奖励,c表示在状态st下执行动作at所获得的安全探索成本,d为越限阈值,γ为折扣因子;γ∈[0,1]; 所述动作网络以神经网络参数θ封装动作策略分布π,建立状态空间到动作空间的映射 奖励评判网络用于评估电氢耦合系统HEES运行状态st下调控决策at的奖励软Q函数 安全评判网络用于评估电氢耦合系统HEES运行状态st下调控决策at的安全评估函数Γπst,at,β; 拉格朗日乘子用于在对偶更新过程调整熵值和越限成本权重相关的对偶乘子; 目标网络用于增强奖励价值判别网络与成本价值判别网络模块的训练稳定性; 利用柔性行动器-评判器基线算法对鲁棒约束马尔可夫决策架构进行参数化时,目标函数和约束条件分别如下所示: 式中,表示熵阈值;β为置信水平。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励