国网江苏省电力有限公司营销服务中心吴伟将获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网江苏省电力有限公司营销服务中心申请的专利一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116089405B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211223795.3,技术领域涉及:G06F16/215;该发明授权一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法是由吴伟将;张轩城;钱旭盛;许高俊;缪猛;陈可;何玮;俞阳;翟千惠设计研发完成,并于2022-10-09向国家知识产权局提交的专利申请。
本一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法在说明书摘要公布了:本发明公开了一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法,包括:对用电数据的空缺值进行预填充;预填充之后的用电数据分别进行单维数据的离群点检测以及基于改进的DBSCAN聚类算法的多维数据离群点检测,以确定异常离群数值,同时将异常离群数值按置空处理;然后利用数理统计和数据挖掘规则,对上述用电数据进行再清洗;基于改进的KNN近邻填补算法对空缺值填补:对排除离群点修正后的数据,采用主成分分析将特征属性影响并入到KNN的计算过程中,得到最终估算数值;最后再利用均方根误差对清洗后的数据进行评定。本发明实现了对用户用电数据离群点检测和清洗,提升了低压用户用电数据质量,保障后续针对低压用户异常用电行为研究结果的可靠性。
本发明授权一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法在权利要求书中公布了:1.一种基于DBSCAN和KNN算法的用电数据离群点检测与清洗方法,其特征在于,包括: 对用电数据的空缺值进行预填充; 对预填充之后的用电数据分别进行单维数据的离群点检测以及基于改进的DBSCAN聚类算法的多维数据离群点检测,采用核概率密度估计DBSCAN参数,以确定异常离群数值,同时将异常离群数值按置空处理; 然后利用数理统计和数据挖掘规则,对上述用电数据进行再清洗; 基于改进的KNN近邻填补算法对空缺值填补:对排除离群点修正后的数据,采用主成分分析将特征属性影响并入到KNN的计算过程中,得到最终估算数值; 改进的KNN填补算法过程如下: Step1:构造数据的相关性系数矩阵: 首先对数据矩阵进行初始化,构建完整的数据矩阵Xm×n,m表示有m条数据记录,n表示数据维数,将排除掉离群点的缺失数据标记,再将数据进行标准化处理,计算数据不同属性维度的协方差,得到一个n维的协方差矩阵; 两随机变量的协方差公式如下: ; n维协方差矩阵: ; Step2:计算KNN算法的估计值: 首先计算完备数据集的欧式距离,由于存在数据集中存在缺失值,在计算欧氏距离时先暂时不考虑缺失值对应的维数,距离的大小决定后续的KNN的填补准确度,用Xi表示第i条数据记录,构造欧式距离矩阵: ; 从原始数据的第一行第一列开始遍历寻找缺失值xij,那么它所在的行数就是i,第i行所对应的距离矩阵即是dis的第i行,然后确定要使用的近邻的个数K,选取dis对应行的最小的K个数值构成向量: d=dj×1,dj×2,...,dj×k; 最后通过加权计算求得替代值x0: ; Xpj是最近邻相应位置的数值,p是距离矩阵的列数对应原数据矩阵的行数; Step3:计算维度相关值得到最终填补值: 首先计算每一个数值的偏差,即每一个数值减去该属性下的统计值的均值: ; m0是这个属性中未缺失的个数,xij就是对应的统计值; 其次求出缺失值所对应的属性所在维度的影响力大小,对除缺失值外的K个近邻中数据的观测值做同样操作,然后相加取均值,得到完备数据的属性和缺失值数据所对应属性维度的影响值大小: ; r是数据项中这一行中未缺失的数据个数,也是现实条件下能统计到的对缺失值产生影响的维度数目,Coeff是对应的协方差数值;最后将原先估计的替代值x0与维度相关量相加,即为最终的缺失值填补值: 。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网江苏省电力有限公司营销服务中心,其通讯地址为:210019 江苏省南京市建邺区奥体大街9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励