西安理工大学孟海宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安理工大学申请的专利基于KNN和AdaBoost的铁路事故类型预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114444765B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111550459.5,技术领域涉及:G06F18/2413;该发明授权基于KNN和AdaBoost的铁路事故类型预测方法是由孟海宁;郑毅;童新宇;姬文江;李维;张嘉薇;黑新宏设计研发完成,并于2021-12-17向国家知识产权局提交的专利申请。
本基于KNN和AdaBoost的铁路事故类型预测方法在说明书摘要公布了:本发明公开一种基于KNN和AdaBoost的铁路事故类型预测方法,具体涉及,计算铁路事故历史数据集属性的稀疏度,根据稀疏度阈值删除部分属性列;对铁路事故数据中的字符型数据进行编码;使用KNN算法对铁路事故数据进行缺失值填补;对铁路事故数据进行归一化,归一化后的数据随机划分为训练集和测试集;使用AdaBoost方法,构造铁路事故类型预测分类器,在测试集上检验分类器性能。本发明公开的方法对铁路事故数据进行了有效的预处理,并使用集成学习方法AdaBoost来缓解原始数据的类不平衡问题,提升了事故类型预测的性能。
本发明授权基于KNN和AdaBoost的铁路事故类型预测方法在权利要求书中公布了:1.基于KNN和AdaBoost的铁路事故类型预测方法,其特征在于,包括以下步骤: 步骤1,对原始的铁路事故历史数据集进行稀疏性分析,根据稀疏性阈值删除部分冗余属性,稀疏性阈值为85%; 步骤2,对步骤1处理后的铁路事故历史数据集中的字符型属性,进行硬编码,将字符型属性转换为数值型属性; 步骤3,对步骤2处理后的铁路事故历史数据集,进行基于KNN算法的数据填补,填补原数据中的缺失值; 步骤4,对步骤3处理完成的铁路事故历史数据集,进行归一化操作,并按照一定比例随机划分训练集和测试集; 步骤5,将步骤4中归一化后的铁路事故历史数据集,随机划分成训练集和测试集,使用AdaBoost算法在训练集数据上训练分类器,在测试集上验证分类器性能; 步骤3中使用KNN算法对铁路事故数据进行缺失值补全,通过计算缺失型样本和其他完整样本的样本间距离,取前k最为接近的完整样本,加权平均后作为当前缺失型样本补全后的数值; 所述步骤3的具体步骤为: 步骤3.1,对每一条包含缺失值的事故记录,计算到所有完整事故记录的样本间距离d,利用KNN算法对该样本间距离进行排序,保留距离最近的前k个样本记录,作为当前缺失样本填补的依据;其中完整事故记录表示一条没有缺失值的记录,样本间距离d的计算方式如公式1所示: 1 其中和分别表示第i条记录和第j条记录,在该公式中,默认左边的记录为含缺失值型记录,右边记录为完整记录,则从含缺失值记录到完整记录的样本间距离如式1所示,表示了两个记录在样本空间上的相似性,该距离越小则二者越为接近; 步骤3.2,根据与含缺失值记录在样本空间最近的前k个事故记录,对缺失记录进行数据填补;其中,由k个事故记录,计算得到当前缺失记录的公式如式2所示: 2 其中为第i个含缺失值的事故记录,为第j个在样本空间距离上距最近的记录,如式2所示,经过如上计算,得到了缺失值填补后的; 所述步骤4中数据归一化公式为式3, 3 其中表示经过步骤1~3处理后的铁路事故数据集,和分别表示以列为主序计算的均值和标准差,经过式3的运算得到按列进行归一化后的铁路事故数据集,数据的分布符合均值为0,标准差为1的正态分布; 所述步骤5中使用AdaBoost集成学习方法建立铁路事故类型分类器,包括使用M个相同的决策树弱分类器作为弱学习器,经过加权平均得到最终的软件缺陷强分类器; 所述步骤5的训练过程具体为: 步骤5.1,将步骤4中重采样后训练集,进行十折交叉验证的划分,整个训练数据集划分成10份,每一份都将被作为验证集,在训练时使用9份数据进行训练,使用剩余的1份作为验证集检验分类器性能,重复这个过程10次,加权平均作为分类器的最终性能指标,至训练过程结束,得到训练完成的铁路事故类型分类器C,采用AdaBoost学习方法训练得到最终分类器的过程,见公式4、5、6: 4 5 6 其中,为第m个决策树弱分类器的权重,为第m个决策树弱分类器,为集成学习得到的强分类器,函数用来取m个弱分类器结果加权后的正负,为第m个决策树弱分类器分类的错误率; 步骤5.2,使用步骤5.1训练完成的强分类器C,采用精确率、正确率、召回率和F1-score性能指标,在测试集上对训练完成的软件缺陷分类器进行性能检验。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安理工大学,其通讯地址为:710048 陕西省西安市碑林区金花南路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。