中国科学院信息工程研究所孟国柱获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院信息工程研究所申请的专利一种针对大模型代码生成能力的安全评测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119089411B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411071578.6,技术领域涉及:G06F21/12;该发明授权一种针对大模型代码生成能力的安全评测方法及系统是由孟国柱;李雪扬;孙堃;陈恺设计研发完成,并于2024-08-06向国家知识产权局提交的专利申请。
本一种针对大模型代码生成能力的安全评测方法及系统在说明书摘要公布了:本发明公开了一种针对大模型代码生成能力的安全评测方法及系统。本发明首先提取实际的漏洞代码,对其进行清理和注释以构建数据集,然后选择目标大模型即代码生成模型的数据补充安全结果作为搜索对抗性样本的输入;然后使用梯度信息计算提示中每个token的重要性得分,以识别提示中对模型输出的代码影响最大的部分;最后选择重要性得分高的token并应用语义保留突变来生成修改后的提示。新的提示与原提示语义类似,目的是潜在地触发大模型不安全的代码生成。本发明能够生成与原始输入非常相似的对抗性代码样本来诱导大模型生成具有漏洞的代码,能够更好地评估代码生成模型的安全性,为开发防御机制以防止对抗性攻击铺平道路。
本发明授权一种针对大模型代码生成能力的安全评测方法及系统在权利要求书中公布了:1.一种针对大模型代码生成能力的安全评测方法,其步骤包括: 1从漏洞数据库中获取多个漏洞代码实例,获取每一所述漏洞代码实例对应的两个版本的代码片段,其中一个是修补前的不安全代码,另一个是修补后的安全代码,形成一漏洞实例代码对,得到一漏洞实例代码对集合;使用CWE分类法对每一所述漏洞代码实例所属漏洞进行分类,得到每一所述漏洞代码实例的漏洞类别; 2从每一所述漏洞实例代码对中提取一三元组p,v,s,构建用于目标大模型评测的验证集;其中p是所述不安全代码中漏洞点之前的一段代码,作为目标大模型代码完成的提示;v是所述漏洞点对应的漏洞代码;s是从所述安全代码中提取的对所述漏洞点修补后的代码; 3根据所提取的三元组构建长度为n的输入序列w=[w1,w2,...,wn]并将其输入所述目标大模型,得到对应的输入序列嵌入集合e=[e1,e2,...,en]和每个单词的输出概率p,其中,wn为第n个单词,单词输出为安全标签lsec的概率表示为psec,单词输出为易受攻击标签lvul的概率表示为pvul;然后计算得到归因矩阵B=[B1,B2,...,Bn]表示归因矩阵,其中归因矩阵B中第i个元素Bi对应于第i个单词的输出概率差相对于输入序列嵌入集合e中第i个元素ei的偏导数;计算Bi的范数si=||Bi||作为输入序列w中第i个元素wi的重要性得分,i=1~n; 4针对每一所述漏洞代码实例对应的漏洞实例代码对构建一抽象语法树,对所述抽象语法树中每一语法节点所包含的各单词的重要性得分进行聚合作为对应语法节点的标记; 5所述目标大模型根据设定的突变策略对三元组样本的输入提示依照重要性分数由高到低的顺序进行突变,得到对抗性提示样本;然后根据所述目标大模型生成的对抗性提示样本中不安全代码的比例评估所述目标大模型的代码生成能力安全性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院信息工程研究所,其通讯地址为:100085 北京市海淀区树村路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励