电子科技大学;四川省数字经济研究院(宜宾)曹晟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学;四川省数字经济研究院(宜宾)申请的专利一种针对大模型提示注入攻击的攻防一体化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120434064B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510941601.0,技术领域涉及:H04L9/40;该发明授权一种针对大模型提示注入攻击的攻防一体化方法是由曹晟;程翔;任嘉怡;赵丰阳;张淋;陈洁;陈厅;李雄;张小松设计研发完成,并于2025-07-09向国家知识产权局提交的专利申请。
本一种针对大模型提示注入攻击的攻防一体化方法在说明书摘要公布了:本发明提供了一种针对大模型提示注入攻击的攻防一体化方法,方法包括:使用基于情感强化和控制输出的攻击策略对用户指令进行大模型提示注入攻击,形成恶意内容;然后将预防策略Sandwich,Instruction和检测方法Knownanswer进行融合,构建协同工作的多层次防御策略UnD对上述恶意内容进行提示注入防御,得到输出结果,最后使用攻击干扰率、攻击误导率、METEOR得分、防御成功率、已知答案匹配率进行效果评估。本发明在攻击方面实现了攻击效率更高的提示注入攻击,在防御方面实现了检测和预防的协同,提高了大模型在面对提示注入攻击时的安全性,确保大语言模型在各种应用场景中安全可靠运行。
本发明授权一种针对大模型提示注入攻击的攻防一体化方法在权利要求书中公布了:1.一种针对大模型提示注入攻击的攻防一体化方法,其特征在于,所述方法包括: 步骤S1,获取用户指令,随机选取问答文本数据集的问题,将其作为用户在大模型上的用户指令; 步骤S2,对用户指令进行提示注入攻击,基于目标攻击意图,结合大模型的行为特性,构建具有双重功能的攻击方法CoA,通过嵌入情感强化词汇和控制输出词汇,构建攻击提示词,然后将攻击提示词与用户指令进行结合形成恶意内容; 步骤S3,对恶意内容进行提示注入防御,将预防策略Sandwich,Instruction和检测方法Knownanswer进行融合,构建防御提示词,组成协同工作的多层次防御机制UnD,首先在步骤S2生成的恶意内容首部嵌入Instruction防御字段,引导模型优先执行用户指令,然后在恶意内容尾部加入Sandwich防御字段,形成语义保护层,阻断攻击提示词对大模型的影响,最后嵌入Knownanswer的检测字段形成防御内容,便于后续预防时同步实现检测功能; 步骤S4,对不同输出结果进行对比验证,分别将步骤S1的用户指令、步骤S2的恶意内容和步骤S3的防御内容输入到大模型中得到对应的输出结果,在攻击方面通过METEOR得分计算攻击结果与原输出结果的语义相似度,并结合METEOR得分情况和攻击结果的具体内容构建攻击干扰率AIR和攻击误导率AMR,以对攻击效率进行评估,在防御方面,选择一种大模型作为专家,判断防御结果和原输出结果是否一致,从而得到防御成功率DSR,再统计含有已知答案的防御结果占总样本的比例得到已知答案匹配率KMR,结合KMR与DSR对预防和检测效果进行综合评估。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学;四川省数字经济研究院(宜宾),其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。