Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学邱高获国家专利权

四川大学邱高获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利基于多目标可迁移强化学习的多断面输电限额计算方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119691331B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411705909.7,技术领域涉及:G06F17/11;该发明授权基于多目标可迁移强化学习的多断面输电限额计算方法是由邱高;张嘉豪;彭浩晋;刘友波;刘俊勇设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。

基于多目标可迁移强化学习的多断面输电限额计算方法在说明书摘要公布了:本发明涉及电气工程技术领域,具体公开来了基于多目标可迁移强化学习的多断面输电限额计算方法,该方法包括以下步骤:考虑暂态功角及电压稳定约束,建立输电限额计算的逆向搜索模型;采用分解策略将逆向搜索模型的多断面耦合限额计算问题分解成子问题模型;将不同子问题模型转化为马尔科夫决策过程,结合基于邻域的参数迁移策略与改进的DDPG算法进行求解;通过对模型的训练实现端对端输出多断面耦合限额的帕累托前沿。本发明的优点是相比于传统的多目标元启发式算法具有更好收敛性与多样性。

本发明授权基于多目标可迁移强化学习的多断面输电限额计算方法在权利要求书中公布了:1.基于多目标可迁移强化学习的多断面输电限额计算方法,其特征在于:该方法包括以下步骤: 步骤S1、考虑暂态功角及电压稳定约束,建立输电限额计算的逆向搜索模型; 步骤S2、采用分解策略将逆向搜索模型的多断面耦合限额计算问题分解成子问题模型; 步骤S3、将不同子问题模型转化为马尔科夫决策过程,结合基于邻域的参数迁移策略与改进的DDPG算法进行求解; 步骤S4、通过对子问题模型的训练实现端对端输出多断面耦合限额的帕累托前沿; 所述输电限额计算的逆向搜索模型以最小化断面失稳的外送功率为目标函数,其表达式为: 1 其中,为联络线上沿指定方向的输送功率;为联络线的集合; 所述输电限额计算的逆向搜索模型的系统潮流方程为: 2 其中,,为所有节点的集合;、分别为发电机输出有功功率与无功功率;为无功补偿装置注入功率;、分别为节点有功和无功负荷;、为节点电压幅值和相角;、为节点导纳矩阵的幅值和相角; 所述输电限额计算的逆向搜索模型的同步机转子运动方程为: 3 其中,,为所有发电机集合;与分别为时刻的转子转速与转子额定转速;为转子角;和分别是发电机电压的轴和轴分量;为惯性常数;为输出机械功率;为阻尼转矩系数;和分别是发电机电流的轴和轴分量;与为同步电抗;和为暂态电抗;与分别为轴和轴的开路时间常数;为励磁输出电压; 所述输电限额计算的逆向搜索模型的约束条件包括稳态运行约束和暂态失稳约束,所述稳态运行约束表示为: 4 其中,、分别为发电机输出有功功率与无功功率;为节点电压幅值;为线路发生故障后电流;为线路电流上限值;表示发电机集合;表示节点集合;表示联络线集合; 所述暂态失稳约束为: 5 其中,为状态变量;为代数变量;为控制变量;、表示初始运行方式;为仿真时步;表示暂态过程时间段;、暂态功角失稳约束和暂态电压失稳约束; 暂态功角稳定评估指标: 6 其中,时系统暂态失稳,且越大系统越稳定; 电压稳定评估指标: 7 系统中枢点母线电压低于0.75pu且持续时间在1s以内判定为电压稳定,其中持续时间在0.8~1s范围内为临界电压稳定;而中枢点母线电压小于0.75pu且持续时间大于1s为电压不稳定;其中,;为清除故障后暂态过程节点电压最小值;为节点的电压阈值,取0.75pu;为允许的持续时间,取1s;为节点电压低于的总持续时间;表示第次的时间步;为节点恢复正常时的电压;为临界电压偏移因子,取0.75;当时,判定母线暂态电压失稳; 所述暂态失稳约束满足暂态功角失稳约束或电压失稳约束,采用Big-M法对暂态失稳约束进行处理,通过将式5改写为以下式子使得模型便于求解: 8 其中,和为实数;为0-1决策变量,当时,第条约束被满足; 所述多断面耦合输电限额进行计算时,同时对多个断面同时进行优化,具体定义如下: 9 其中,包含电力系统的状态、代数以及控制变量;包括个不同的独立断面限额计算的目标函数构成;、分别代表系统等式约束与不等式约束,包括稳定运行约束以及暂态失稳约束; 所述步骤S2中将多断面耦合限额计算问题通过加权和的方式转化为个标量优化的子问题,转化后的标量目标函数表示为: 10 其中,表示第个子问题的目标函数,为权重向量,为求解断面的数量; 所述马尔科夫决策过程由五元组构成,具体描述如下: 状态空间: 11 其中,为发电机有功出力;为节点电压;为负荷有功;为负荷无功;为选取断面内所有联络线的传输潮流之和;为暂态功角稳定评估指标,为暂态电压稳定评估指标; 动作空间包括发电机动作空间和总负荷动作空间,为发电机有功调整量,其调整范围为,、分别表示发电机最大有功和RL每回合的训练步数;为负荷有功调整量,其调整范围为,表示总负荷波动的最大有功; 奖励函数r表示为: 12 13 14 15 其中,为智能体探索运行方式满足暂态失稳约束的奖励值,为连续奖励;为奖励函数计算条件,和为实数;为0-1决策变量,当时,第条约束被满足;为子问题的最终奖励值;为子问题的标量目标函数归一化后的奖励值;,为奖励项的权重系数;为潮流不收敛线路过载潮流反向发电机越限时给的惩罚; 折扣因子,表示对未来奖励的折扣; 状态转移矩阵由交互环境确定; 步骤S3中结合多目标计算问题的分解方法与参数迁移策略通过MORL方法将限额计算子问题建模为神经网络,以代表第个子问题的网络模型参数,定义为尚未进行优化的网络参数,为优化后的神经网络参数,假定第个限额计算子问题已经求解完成,其网络参数已经达到最优或接近最优,则在训练第个子问题时可借助子问题的经验知识进行快速求解,将后者的最优网络参数作为前者神经网络的起始参数; 采用改进的深度确定性策略梯度方法对子问题的MDP模型进行训练,原始DDPG含有4个神经网络,分别是Actor网络、Critic网络以及拷贝后的目标网络和;为了让智能体充分与环境交互,增加随机探索能力,考虑为动作添加随机噪声: 16 其中,表示随机噪声; 执行动作后得到即时奖励和下一状态,形成四元组存放于经验回放池中,从中随机抽取Batch_size个四元组作为当前Actor网络和Critic网络的输入,计算真实值: 17 其中,为折扣因子; 通过最小化损失函数和计算策略梯度分别更新Critic网络参数和Actor网络参数: 18 19 其中,L为Critic网络更新时的损失值,通过最小化损失函数使得Critic网络的Q值更加接近目标Q值;W为每次训练从经验回放池中采样的样本数量;为Actor网络的梯度,基于Critic网络的Q值进行计算,更新Actor网络的权重;为Critic网络Q值对于动作的梯度,反映了动作选择对Q值的影响; 最后,将得到的通过较为平稳的软更新的方式更新目标网络参数: 20 其中,为发散因子,通过反复迭代式16~式20,不断更新网络参数,算法最终趋于收敛。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。