河海大学李旭杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河海大学申请的专利一种基于多元回归和随机森林的水质监测指标预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116108941B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111323326.4,技术领域涉及:G06Q10/04;该发明授权一种基于多元回归和随机森林的水质监测指标预测方法是由李旭杰;史灵;李浩天;穆营利;徐缘;汤静;刘春燕设计研发完成,并于2021-11-09向国家知识产权局提交的专利申请。
本一种基于多元回归和随机森林的水质监测指标预测方法在说明书摘要公布了:本发明公开了一种基于多元回归和随机森林的水质监测指标预测方法。该发明首先基于水质监测的各类监测指标,利用Pearson相关系数对监测指标间的相关程度进行分析,从而得到各监测指标间的相关系数,进一步通过多元线性回归算法得到高度相关的参数指标间的统计关系,利用回归方程的形式表示监测变量间的因果关系,最后通过随机森林算法利用水质监测中的自变量指标实现对因变量指标的预测,达到减少监测项目从而降低监测成本的目的。本发明能有效提高水质监测的效率以及降低监测指标项目成本,且具有预测准确度高、泛化能力强的特点。
本发明授权一种基于多元回归和随机森林的水质监测指标预测方法在权利要求书中公布了:1.一种基于多元回归和随机森林的水质监测指标预测方法,其特征在于,所述方法包括如下步骤: 1获取水质监测项目监测过程中所用的各类监测指标数据; 2对水质监测的各类监测指标数据进行清洗,剔除无效、异常数据; 3利用Pearson相关系数对清洗后的水质监测指标数据进行各类监测指标变量间的相关程度分析,得到各个水质监测指标间的相关系数,对影响水质的主导因素进行识别; Pearson相关系数的公式表达为: 式中,n为样本量,xi和yi分别为两监测指标的变量值,和分别为xi和yi样本的平均值; 4采用显著性检验的方法对Pearson相关系数进行检验,验证各监测指标间的相关性非偶然因素引起,所得结果能够代表总体指标数据上的相关程度,所述的显著性检验根据得到的P值是否小于选定的显著性水平0.05来验证指标变量间的相关性程度是否都通过检验; 5采用构建多元线性回归方程的方法进一步得到监测指标间相关程度的具体形式;通过回归方程的形式,进一步分析水质指标间的统计关系; 6对步骤5得到的多元线性回归方程,剔除回归系数异常以及不显著的自变量,所述的回归系数反映的是回归方程中表示自变量x对因变量y影响大小的参数,异常回归系数为回归系数的正负号与Pearson相关系数相反的数值,不显著的回归系数是指不符合回归系数检验的数值,重复步骤5至6,直至回归系数均符合要求,此时的多元线性回归方程得以成立; 7对整个数据集进行拆分,得到训练集和测试集;其中训练集用于训练随机森林回归模型,测试集用于模型预测效果的评估; 8建立随机森林回归模型,采用5折交叉验证方法利用训练集对模型进行训练,所述的5折交叉验证方法是指:不重复抽样将原始数据随机分成5份;每次挑选其中1份作为测试集,剩余4份作为训练集用作模型训练;重复该步骤5次,使得每个子集拥有一次作为测试集的机会,其余机会作为训练集;计算5组测试结果的平均值作为模型的准确率; 9利用测试集对随机森林回归模型进行预测效果评价,模型的评价指标采用均方根误差RMSE、平均绝对误差MAE和确定系数R2这三种指标; 确定系数的公式表达为: 式中,n为样本量,y为待拟合数值,为yi样本的平均值,为拟合值; 10不断调整随机森林回归模型中的超参数决策树的数量以及树的最大深度以获取最佳模型;重复步骤8至10,使得随机森林回归模型的确定系数R2的值满足于最接近于1的标准; 11根据训练得到的最佳随机森林回归模型,利用水质监测指标中自变量监测指标对因变量指标进行预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河海大学,其通讯地址为:210098 江苏省南京市鼓楼区西康路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励