北京北大软件工程股份有限公司张世琨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京北大软件工程股份有限公司申请的专利代码克隆检测方法、系统、设备、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119960825B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510449628.8,技术领域涉及:G06F8/75;该发明授权代码克隆检测方法、系统、设备、介质及产品是由张世琨;高庆;李海洋;潘克峰设计研发完成,并于2025-04-11向国家知识产权局提交的专利申请。
本代码克隆检测方法、系统、设备、介质及产品在说明书摘要公布了:本申请公开了一种代码克隆检测方法、系统、设备、介质及产品,涉及软件工程领域,该方法包括从待检测代码仓库获取待检测代码段,并将所有待检测代码段输入训练好的克隆代码检测模型中,输出与待检测代码段相对应的第一代码表示向量;任意选择两个第一代码表示向量作为代码对,将语义距离小于预设阈值的代码对标记为克隆代码。本申请可提升代码克隆检测的准确度。
本发明授权代码克隆检测方法、系统、设备、介质及产品在权利要求书中公布了:1.一种代码克隆检测方法,其特征在于,所述代码克隆检测方法包括: 从待检测代码仓库获取待检测代码段,并将所有所述待检测代码段输入训练好的克隆代码检测模型中,输出与所述待检测代码段相对应的第一代码表示向量; 任意选择两个所述第一代码表示向量作为代码对,将语义距离小于预设阈值的所述代码对标记为克隆代码; 其中,所述克隆代码检测模型通过如下方式训练得到: 从代码克隆检测数据集中随机采样,得到数量相同且存在唯一对应关系的源代码段和第一目标代码段,每对存在所述唯一对应关系的所述源代码段与所述第一目标代码段互为克隆代码,所述唯一对应关系指语义等价或语法不同功能相同; 将所有所述源代码段与所述第一目标代码段输入初始克隆代码检测模型,并通过多任务学习损失函数对所述初始克隆代码检测模型进行训练,得到克隆代码检测模型,所述多任务学习损失函数包括对比学习损失函数和翻译增强学习损失函数; 所述初始克隆代码检测模型包括编码器和解码器; 所述通过多任务学习损失函数对所述初始克隆代码检测模型进行训练,得到克隆代码检测模型,包括: 将所述源代码段经过编码器的编码处理,输出与所述源代码段相对应的第二代码表示向量,每个所述源代码段和相对应的所述第二代码表示向量均附有相同标签,所述标签用于表征所述源代码段的功能; 将所有所述源代码段进行两两配对,得到多个代码对,根据所述源代码段的所述标签的匹配情况判断所述代码对是否为克隆代码对,如果所述标签匹配,则将所述代码对标记为克隆代码对,否则,将所述代码对标记为非克隆代码对; 根据所述对比学习损失函数计算所述克隆代码对的对比学习损失; 将所有所述第二代码表示向量经过解码器的解码处理,输出与所述第二代码表示向量相对应的第二目标代码段,并通过翻译增强学习损失函数计算所述第二目标代码段相对所述第一目标代码段的翻译增强损失; 通过所述对比学习损失和所述翻译增强学习损失得到多任务学习损失,通过所述多任务学习损失不断迭代所述初始克隆代码检测模型的模型参数,使模型不断学习如何捕获所述源代码段的语义,从而得到所述克隆代码检测模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京北大软件工程股份有限公司,其通讯地址为:100080 北京市海淀区北四环西路67号中关村国际创新大厦11层1101-1103、1106-1108室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。