Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 河海大学;雅砻江流域水电开发有限公司潘学萍获国家专利权

河海大学;雅砻江流域水电开发有限公司潘学萍获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉河海大学;雅砻江流域水电开发有限公司申请的专利梯级水电站长期调度决策方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118691128B

龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411199246.6,技术领域涉及:G06Q10/0637;该发明授权梯级水电站长期调度决策方法、系统、设备及存储介质是由潘学萍;何胜明;孙晓荣;缪益平;丁仁山;蹇德平;周洁炀;谢洲设计研发完成,并于2024-08-29向国家知识产权局提交的专利申请。

梯级水电站长期调度决策方法、系统、设备及存储介质在说明书摘要公布了:本发明涉及水电站调度技术领域,尤其涉及一种梯级水电站长期调度决策方法、系统、设备及存储介质,方法包括:获取梯级水电站的基础数据和运行情况,构建梯级水电站的长期优化调度模型;将梯级水电站的长期优化调度问题转化为马尔科夫算法决策过程;利用深度确定性策略梯度DDPG深度强化学习算法对马尔科夫决策过程进行求解,得到梯级水电站中各电站的长期调度决策方案;基于实际梯级水电站,输出长期调度决策结果。本发明中,可有效解决现有基于数学模型方法存在的建模困难、易陷入局部最优解以及策略灵活差的问题;同时与现有深度强化学习算法相比,其连续动作策略可使得调度策略更加精细化,可有效提升梯级水电站的发电效益。

本发明授权梯级水电站长期调度决策方法、系统、设备及存储介质在权利要求书中公布了:1.一种梯级水电站长期调度决策方法,其特征在于,包括如下步骤: 获取梯级水电站的基础数据和运行情况,构建梯级水电站的长期优化调度模型; 将梯级水电站的长期优化调度问题转化为马尔科夫算法决策过程; 利用深度确定性策略梯度DDPG深度强化学习算法对所述马尔科夫决策过程进行求解,得到梯级水电站中各电站的长期调度决策方案; 基于实际梯级水电站,输出长期调度决策结果; 所述将梯级水电站的长期优化调度问题转化为马尔科夫算法决策过程,包括如下步骤: 根据梯级水电站的长期调度问题特征,定义强化学习中的状态、动作、状态转移函数以及奖励函数,构建一个学习过程,其中, 状态St:用来描述当前时刻梯级水电站的状态信息,定义为: 式中,St为t时刻的状态量,其中包含时刻t,以及该时刻水电站i的入库流量库容Vi,t以及水位高度Hi,t; 动作at:动作at为各水电站的发电引用流量,表示为: 式中,为水电站i在t时段的平均发电引用流量; 状态转移函数:当本时刻上游来水确定的情况下,通过控制该时刻发电流量则可确定下一时刻的库容和水位,因此梯级水电站运行环境也是确定的,马尔科夫过程的状态转移概率为1,即: ps′|s,a=1; 式中,智能体在状态s下执行动作a后,可以得到一个确定的下一时刻环境状态s′,且该状态转移过程满足设定的各种约束条件; 奖励函数rtst,at:在梯级水电站长期优化调度中,利用奖励值反映某时间段的目标函数值,进一步利用调度周期内所有奖励值总和来表示梯级水电站调度周期内目标函数,表示为: 式中,N为梯级流域中水电站的数量,Pi,t为水电站i在t时段的平均发电功率,单位为kW;ki为水电站i的出力系数;梯级水电站在调度过程中,每一时间段的奖励值为各个水电站在这一时间段的发电量之和,当确定梯级水电站的环境状态Hi,t以及动作值后,就能够产生相应的环境奖励值进行优化调度的学习; 所述利用深度确定性策略梯度DDPG深度强化学习算法对所述马尔科夫决策过程进行求解,包括如下步骤: 步骤1:随机初始化预测策略网络μθs和预测价值网络Qws,a的网络参数w和θ; 步骤2:利用预测网络参数w和θ来初始化目标预测网络和目标价值网络的权重参数w′和θ′; 步骤3:初始化经验池容量D; 步骤4:初始化环境中梯级水电站的初始时刻状态s0; 步骤5:将初始时刻状态s0输入预测策略网络a=μθs中,并利用探索噪声N产生相对应的动作a0=μθs0+N;其中,μθs为网络参数为θ的预测策略网络,用于输出相应策略动作; 步骤6:将产生的执行动作a0输入梯级水电站环境中,得到奖励r0和下一时刻状态s1数据,将s0,a0,r0,s1作为一组数据存入经验池中; 步骤7:利用下一时刻的状态量,循环步骤5和步骤6,产生一系列数据组保存于经验池; 步骤8:当数据组达到设定数量后,从经验池中随机采样n个多维数据组st,at,rt,st+1作为训练数据,代入目标网络中计算目标值:y=r+γQw′s′,μθ′s′;其中,r为对应时刻调度动作产生的奖励值,在梯级水电站优化调度中代表一个时刻梯级水电站的发电量大小,γ为折扣系数,用于削弱未来奖励对当前状态奖励总和的影响; 步骤9:利用最小化损失函数来更新预测价值网络参数w:Lw=MSE[Qws,a,r+γQw′s′,μθ′s′];其中MSE表示均方误差,用于计算衡量目标值和预测值之间存在的误差大小; 步骤10:利用最大化目标函数Qws,a来更新预测策略网络参数θ:Loss=-Qws,a; 步骤11:软更新目标策略网络和目标价值网络参数:其中τ是一个远小于1的超参数; 步骤12:利用更新后的网络参数继续循环步骤5和步骤6,更新经验池中的数据组; 步骤13:利用更新的经验池数据继续采取步骤8到11更新网络参数; 步骤14:循环步骤12和步骤13,直到网络参数满足要求,能够达到最终调度决策要求; 所述获取梯级水电站的基础数据和运行情况,包括:各水电站的最高、最低水位,最大、最小库容,最大发电流量以及最大出力;利用各个时刻的库容和水位数据拟合各水电站的库容-水位曲线; 所述梯级水电站的长期优化调度模型中,以梯级水电站调度周期内的总发电量最高为目标函数,以水量平衡、水库库容、出库流量、发电流量、机组出力、水位限制、水库库容水位关系和初始水位为约束; 所述梯级水电站的长期优化调度模型的目标函数包括: 式中,E为梯级水电站调度周期内的总发电量,单位为kWh;N为梯级流域中水电站的数量;T为一个调度周期内的时段数,这里为一年共365天;Δt为一个时间尺度的小时数,单位为h;i为水电站编号;t为时间段编号;Pi,t为水电站i在t时段的平均发电功率,单位为kW;ki为水电站i的出力系数,这里取值为8.5;为水电站i在t时段的平均发电引用流量,单位为m3s;Hi,t为水电站i在t时段的平均发电净水头,单位为m; 所述梯级水电站的长期优化调度模型的约束包括: 水量平衡约束: 式中,Vi,t和Vi,t+1分别为水电站i在t时段的初始和末期库容,单位为m3;和分别为水电站i在t时段的平均入库流量和平均出库流量,单位为m3s; 两水电站之间的水量平衡约束为: 式中,为上一级水电站在t时段的出库流量,单位为m3s;qi,t为水电站i和上一级水电站i-1之间在t时段的自然径流; 水库库容约束: 式中,和分别为水电站i在t时段水库库容的最小值和最大值,单位为m3; 出库流量约束: 式中,和分别为水电站i在t时段出库流量的最小值和最大值,单位为m3s; 发电流量约束: 式中,和分别为水电站i在t时段发电引用流量的最小值和最大值,单位为m3s; 机组出力约束: 式中,为水电站i在t时段允许出力的最大值,单位为kW; 水位限制约束: 式中,和分别为水电站i在t时段发电净水头的最低和最高值,单位为m; 水库库容水位关系约束: Hi,t=fVi,t; 库容水位曲线反映了水电站i在t时段中水库库容与水头之间的函数对应关系; 初始水位约束: 式中,为水电站i的初始水头,单位为m。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学;雅砻江流域水电开发有限公司,其通讯地址为:210024 江苏省南京市西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。