广东技术师范大学刘兰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东技术师范大学申请的专利一种源代码漏洞预测方法、装置、电子设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118981773B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411083393.7,技术领域涉及:G06F21/57;该发明授权一种源代码漏洞预测方法、装置、电子设备和介质是由刘兰;惠占发;蔡廷丰;郭丰玮;唐煜桐;苏琪设计研发完成,并于2024-08-08向国家知识产权局提交的专利申请。
本一种源代码漏洞预测方法、装置、电子设备和介质在说明书摘要公布了:本发明提供了一种源代码漏洞预测方法、装置、电子设备和介质,所述方法包括:获取待预测源代码数据集,对待测源代码数据集进行文本标记化处理得到多个源代码标记单元,根据源代码标记单元中的源代码文本建立词频排序词汇表,根据词频排序词汇表将源代码标记单元转换为独热编码格式的源代码特征向量,将独热编码格式的源代码特征向量输入源代码漏洞预测模型,输出漏洞类别预测结果。本发明通过对待预测源代码数据集的预处理以及通过训练好的源代码漏洞预测模型对经过预处理的待预测源代码数据集进行处理得到漏洞类别预测结果,实现对漏洞类别的准确预测,帮助开发人员和安全团队准确、高效地发现系统中的漏洞,减少潜在的安全风险。
本发明授权一种源代码漏洞预测方法、装置、电子设备和介质在权利要求书中公布了:1.一种源代码漏洞预测方法,其特征在于,所述方法包括: 获取待预测源代码数据集; 对所述待预测源代码数据集进行文本标记化处理,得到多个源代码标记单元; 根据源代码标记单元中的源代码文本建立词频排序词汇表; 根据所述词频排序词汇表将源代码标记单元转换为独热编码格式的源代码特征向量; 将所述独热编码格式的源代码特征向量输入源代码漏洞预测模型,输出漏洞类别预测结果; 所述源代码漏洞预测模型的生成,包括: 获取源代码公开数据集;所述源代码公开数据集包含携带CWE漏洞标签的数据和未携带CWE漏洞标签的数据; 识别所述源代码公开数据集中未携带CWE漏洞标签的数据,并从未携带CWE漏洞标签的数据中随机抽取预设数量的数据,以及将抽取的预设数量的数据与携带CWE漏洞标签的数据进行重组,生成欠采样后的源代码子集; 将欠采样后的源代码子集按照预设比例分割为训练数据集、验证数据集和测试数据集; 对训练数据集、验证数据集和测试数据集进行文本标记化处理,分别得到对应的多个源代码标记单元; 根据源代码标记单元中的源代码文本建立对应的词频排序词汇表; 根据源代码标记单元将训练数据集、验证数据集和测试数据集转化为等长的输入矩阵; 根据词频排序词汇表将训练数据集、验证数据集和测试数据集的输入矩阵转换为独热编码格式的源代码特征向量; 构建源代码漏洞预测模型网络; 采用表示为独热编码格式的源代码特征向量的训练数据集对所述源代码漏洞预测模型网络进行训练,并采用基于动态权重的损失函数计算总损失,以及基于总损失更新源代码漏洞预测模型网络参数; 在训练迭代过程中,当验证数据集上损失函数的变化趋势由上一次迭代相比于下一次迭代呈现下降转为上升时,记录一次状态变化,若记录的次数超过预设的早停阈值,则停止训练,保存当前训练过程中最后一次损失函数呈下降趋势时的模型参数,得到所述源代码漏洞预测模型; 基于动态权重的损失函数Lt的定义如下: 其中,Li为每个任务的损失函数,每个任务在每次迭代结束时的交叉熵损失为Mi,N为任务数量,S是用于控制权重平滑程度的参数,S∈0,5]。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东技术师范大学,其通讯地址为:510630 广东省广州市天河区中山大道西293号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。