国网山西省电力公司晋城供电公司姬玉泽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网山西省电力公司晋城供电公司申请的专利一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120296542B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510754653.7,技术领域涉及:G06F18/2411;该发明授权一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备是由姬玉泽;陈文刚;田瑞敏;董建军;李海燕;张凯;原亚飞;王新瑞;马伟天;许泳涛设计研发完成,并于2025-06-06向国家知识产权局提交的专利申请。
本一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备在说明书摘要公布了:本申请提供了一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备,其中,该方法包括:构建配电网馈线开关邻接矩阵和配电网馈线开关特征矩阵,采用动态图卷积神经网络对配电网馈线开关邻接矩阵和配电网馈线开关特征矩阵进行处理,得到状态信息特征量;基于故障线路选拉顺序,生成故障线路选拉策略;根据状态信息特征量和故障线路选拉策略,基于深度强化学习构建配电网单相接地故障线路选拉决策模型,用于实现故障线路选拉分析,确定配电网单相接地故障选线;该方法提供了科学高效辅助决策,实现了专家经验和技术分析的高效融合,提高了配电网单相接地故障线路选拉效率和配电网的恢复能力;适用于电力系统研究技术领域。
本发明授权一种基于深度强化学习的配电网单相接地故障线路选拉决策方法、系统及相关设备在权利要求书中公布了:1.一种基于深度强化学习的配电网单相接地故障线路选拉决策方法,用于选出配电网发生单相接地故障的线路,其特征在于:包括: 获取配电网单相接地故障运行期间各时刻各馈线开关的拓扑连接关系,构建配电网馈线开关邻接矩阵G; 根据采集的配电网单相接地故障运行期间各时刻各馈线开关的电气量信息特征数据,构建配电网馈线开关特征矩阵;其中,电气量信息特征数据包括:有功功率突变量、无功功率突变量、电流突变量和零序电流; 采用动态图卷积神经网络对配电网馈线开关邻接矩阵G和配电网馈线开关特征矩阵进行处理,得到状态信息特征量; 基于故障线路选拉顺序,生成故障线路选拉策略; 根据状态信息特征量和故障线路选拉策略,基于深度强化学习构建配电网单相接地故障线路选拉决策模型,用于实现配电网单相接地故障线路选拉的分析,并根据分析结果确定配电网单相接地故障选线;具体包括: 构建深度强化学习网络和经验池;其中,深度强化学习网络包括训练Q网络和目标Q网络; 初始化训练Q网络和目标Q网络,并为训练Q网络和目标Q网络中的参数赋值; 根据提取出的状态信息特征量,构建初始状态空间变量s t ,且每周期进行一次初始状态空间变量s t 的观测更新;其中,所述周期为选拉控制周期,,I t 为每周期t时刻的状态信息特征量; 根据每周期各馈线开关的开断状态,得到相应的动作a t ,并基于得到的每个动作a t ,根据故障线路选拉策略形成相应的动作集合A;其中,,,a t 为每周期t时刻的动作,为每周期t时刻第i个馈线开关的开断状态,n为配电网馈线开关数目; 构建奖励函数r;所述的奖励函数的计算公式为: ; 式中,r 1 为故障相电压惩罚项,r 2 为变电站负荷损失惩罚项,r 3 为无功不平衡惩罚项; 其中,r 1 的表达式为: ; 式中,为阈值电压,为配电网单相接地故障时的故障相电压,d为惩罚项; r 2 的表达式为: ; 式中,为一般用户变电站负荷损失,为一般公用变电站负荷损失,为高危用户变电站负荷损失,为关键公用变电站负荷损失,m 1 ~m 4 分别为一般用户变电站、一般公用变电站、高危用户变电站和关键公用变电站,k 1 ~k 4 分别为相应变电站的负荷权重参数,且k 4 k 3 k 2 k 1 ,l 1 ~l 4 分别为相应变电站或相应用户的数目之和; r 3 的表达式为: ; 式中,、分别为配电网系统正常运行状态下的无功功率的上限值和下限值;为t时刻配电网系统的无功功率,c为惩罚值; 将每周期的初始状态空间变量s t 输入训练Q网络中,并迭代执行以下步骤:根据ε- greedy策略,从相应的动作集合A中选取一个动作a t ,生成初始状态对应的动作价值Q's t ,a t ;θ t ,并将选择的动作a t 输入故障线路选拉策略中执行选拉,得到更新后的各馈线开关的拓扑连接关系和电气量信息特征数据,然后根据奖励函数r计算该动作a t 的即时奖励值r t ;其中,θt为训练Q网络的神经网络权值; 基于SCADA系统,根据更新后的各馈线开关的拓扑连接关系和电气量信息特征数据,获取新的状态信息特征量,并更新计算相应周期下一时刻的状态空间变量s t+1 ; 构建经验数据集s t ,a t ,r t ,s t+1 ,并将其存放入经验池中; 从经验池中随机抽取d组经验数据集,并将其分别输入到训练Q网络和目标Q网络中,计算得到训练Q网络的价值和目标Q网络的目标值;其中,ddm,dm为经验池数据容量; 所述的目标Q网络计算公式为: ; 式中,y h 为目标Q网络的目标值,h为当前迭代次数,T为最大迭代次数,γ为折扣系数,argmaxQ'a h ,s h 为当前迭代下选择的最优动作对应的最大Q'值; 根据损失函数,采用目标Q网络的目标值对训练Q网络的神经网络权值进行更新,使得训练Q网络的价值更加接近于目标Q网络的目标值; 所述的训练Q网络的神经网络权值的更新公式为: ; 式中,为损失函数,θ h 为迭代第h次的更新后的训练Q网络的神经网络权值;Q'a h ,s h ;θ h 为迭代第h次的训练Q网络的价值; 判断当前迭代次数是否等于最大迭代次数; 若等于,则得到训练好的配电网单相接地故障线路选拉策略模型; 若不等于,则继续执行下一次迭代。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网山西省电力公司晋城供电公司,其通讯地址为:048026 山西省晋城市新市东街1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。