南京航空航天大学黄志球获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119621563B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411700250.6,技术领域涉及:G06F11/3668;该发明授权一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法是由黄志球;李春奇;李伟湋设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法在说明书摘要公布了:本发明提出了一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法。所述方法在训练阶段,提取每行训练用代码的特征并组合为向量,多行向量合并为矩阵然后将其转换为像素图,用于卷积神经网络训练,训练数据包括来自不同编译器版本的能够揭示错误的代码;调度阶段使用相同方法将待排序代码转换为图片,输入训练好的模型中获取代码排序结果,它预测新测试代码揭示错误的潜力,从而确定其优先级。本发明使用基于token生成行级别文本向量的方法相比于使用基于树或者图的方法对代码的特征提取速度快,硬件要求低,而且并非依赖于模糊测试生成器生成的测试代码内部的信息,适用于各种来源和各种长度的C语言测试代码。
本发明授权一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法在权利要求书中公布了:1.一种基于文本向量和卷积神经网络的编译器测试用例优先级排序方法,其特征在于,包括以下步骤: 获取训练代码,所述训练代码包括来自不同编译器版本的能触发bug的代码和不能触发bug的正常代码; 对训练代码进行代码像素化处理,包括:从每行训练代码中提取代码特征并组合为向量,将多行向量拼接为矩阵,将矩阵转换为灰度图并进行裁切,使图片长宽保持一致,不足部分用黑色补全,得到训练用的图片; 将训练用的图片输入卷积神经网络进行有监督的神经网络模型训练,并对神经网络模型进行微调后保存,得到重训练后的神经网络模型; 使用与训练代码同样的代码像素化处理方法,对待排序的测试用例代码进行代码像素化处理,得到测试用例图片,将测试用例图片输入重训练后的神经网络模型,模型输出每个部分的图片能触发bug的概率; 将模型输出的概率进行排序,对于属于同一个代码的多个裁切图片,每个图片可能会有不同的排名,取排名最高的图片作为完整代码触发bug概率的代表排名,得到一个代码排序的概率,作为测试代码优先级排序结果; 其中,从每行训练代码中提取代码特征并组合为向量,将多行向量拼接为矩阵,将矩阵转换为灰度图,包括: 提取训练代码每行的N个特征,将这N个特征转变为一个N维的向量,一个特征对应向量中的一个维度,每一维的值大小为特征出现的次数,将每一行的行向量拼接为一个矩阵,将矩阵中的元素转换为对应的灰度图像素,灰度值等于矩阵中元素值的大小; 提取训练代码每行的N个特征,包括: 对每行训练代码,识别所有语句关键词作为语句特征,识别类型关键词和修饰符关键词作为类型和修饰符特征,识别运算符作为运算符特征,识别函数声明、调用关系作为函数特征,识别每行训练代码的所有特征; 对各种代码特征的具体识别方法如下:预先定义各类代码特征的关键词和短语,使用正则表达式匹配对应的代码元素,提取与定义的关键词和短语匹配的字符串,作为代码特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励