恭喜东南大学;国网浙江省电力有限公司电力科学研究院秦中元获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜东南大学;国网浙江省电力有限公司电力科学研究院申请的专利一种基于串行集成学习的定向漏洞挖掘方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115510455B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211251160.4,技术领域涉及:G06F21/57;该发明授权一种基于串行集成学习的定向漏洞挖掘方法及系统是由秦中元;周稳;曾国强;张群芳;陈玉清;孙歆;舒鹏;韩嘉佳;汪自翔设计研发完成,并于2022-10-13向国家知识产权局提交的专利申请。
本一种基于串行集成学习的定向漏洞挖掘方法及系统在说明书摘要公布了:本发明公开了一种基于串行集成学习的定向漏洞挖掘方法及系统,对代码训练集进行标签化后形成带有标签的训练集,抽取其中漏洞代码训练集做数据预处理,对预处理后的漏洞代码做敏感函数定位,得到包含敏感函数的语句;利用程序控制流图CFG获取与该语句相关的程序切片,基于漏洞训练集代码的数量,利用无敏感语句的代码训练集与其混合形成均匀的训练集模块;将赋予初始权重的训练集样本送入到CART决策树的弱分类器中进行训练,通过计算得到分类误差率和迭代次数是否满足要求来调整权重系数并重新学习,按照加权集成的方式形成最终强分类器,实现测试样本分类,完成漏洞挖掘。本方法考虑了代码的上下文依赖关系,降低了传统漏洞挖掘的误报率和漏报率。
本发明授权一种基于串行集成学习的定向漏洞挖掘方法及系统在权利要求书中公布了:1.一种基于串行集成学习的定向漏洞挖掘方法,其特征在于,包括以下步骤:S1,源代码训练集确定:获取批量的CWE漏洞源代码,并按照编号整理成CWE漏洞源代码训练集;S2,数据预处理:对步骤S1获得的CWE漏洞源代码训练集进行数据预处理,得到可提取敏感词的漏洞代码训练集;S3,敏感词定位:对预处理后的漏洞代码训练集做敏感词定位,获取该漏洞代码训练集的所有敏感词及其所在行数;S4,漏洞代码切片获取:对步骤S3得到的漏洞代码得到整段函数代码的控制流图,并依据控制流图提取出与敏感词相关的控制流信息和数据流信息,组合后得到基于CFG控制流图的代码切片;S5,待处理数据集获取:根据步骤S4得到的CFG控制流图的代码切片,将与具有漏洞代码训练集数目相似的无漏洞代码训练集与CFG控制流图形成的代码切片做混合,形成被串行集成学习模块待处理的数据集;S6,串行集成学习模块处理:将步骤S5得到的混合切片送入串行集成学习模块中进行训练处理,经过训练得到弱分类器并计算分类误差率,根据检查迭代次数和误差率是否满足要求来调整训练集的权重进而进行加权求和,通过串行学习形成强分类器,将测试源码数据通过敏感词定位和敏感词所在程序语句的控制流程序切片提取,经过分词和向量化操作后,送入到强分类器中实现测试源码的漏洞分类判别,完成漏洞的挖掘;本步骤具体包括:S61:为数据集分配权重,初始样本权重均相等,每个样本权值为1m,即M1i=1m,其中i=1…m;S62:将整个数据集送入串行集成学习模块中进行训练,得到CART决策树弱分类器;S63:计算弱分类器的分类误差率及权重系数,同时设定最大迭代次数和最小分类误差率,所述分类误差率其中,Gnxi为分类的结果,yi为标签值,M为样本权重系数;所述弱分类器的权重系数A取值[0,1];S64:若分类器分类误差率大于最小分类误差率或模型迭代次数未达到最大迭代阈值时,则修改样本的权重系数,再次送入串行集成学习模块中训练,计算更新样本权重后的分类器误差计算率,直到满足分类器分类误差率小于最小分类误差率或模型迭代次数达到最大迭代阈值,流程结束;S65:综合各个弱分类器的权重系数,利用加权求和的方式得到最终的强分类器,所述求和公式为其中Gnxi的输出值为{1,-1}。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;国网浙江省电力有限公司电力科学研究院,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。