Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学罗文骏获国家专利权

电子科技大学罗文骏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学申请的专利一种针对对抗性攻击的人工智能模型安全防御方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120429874B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510889159.1,技术领域涉及:G06F21/57;该发明授权一种针对对抗性攻击的人工智能模型安全防御方法是由罗文骏;文红;王永丰;侯文静;茅俊涛;陈宇政设计研发完成,并于2025-06-30向国家知识产权局提交的专利申请。

一种针对对抗性攻击的人工智能模型安全防御方法在说明书摘要公布了:本发明公开一种针对对抗性攻击的人工智能模型安全防御方法,属于人工智能安全领域。该方法利用过滤器、归纳模型和安全分类器层层过滤,提升在对抗性攻击下人工智能模型的安全性。先将提示输入样本模型生成预回答。然后过滤器对预回答进行过滤,拒绝普通的有害提示和样本模型无法识别的对抗性攻击,保留高质量的预回答。接着把预回答输入归纳模型输出总结,归纳模型能够把回答转换成对应问题。最后让安全分类器对总结进行判别,若输出为有害则拒绝提示,若输出为无害则允许被保护的人工智能模型处理提示。本发明通过多层处理,实现对对抗性攻击的解析和拒绝,在保持受保护的人工智能模型的性能的同时,有效增强了模型的对对抗性攻击的防护能力。

本发明授权一种针对对抗性攻击的人工智能模型安全防御方法在权利要求书中公布了:1.一种针对对抗性攻击的人工智能模型安全防御方法,其特征在于,包括以下步骤: 步骤S1:在提示输入被保护的人工智能模型前,将提示输入样本模型,形成预回答并传输至过滤器; 步骤S2:过滤器接收样本模型的预回答,并对预回答进行初步过滤;判断样本模型的安全护栏是否阻拦了提示,若没有阻拦将预回答传输至归纳模型,若阻拦则拒绝输出; 步骤S3:微调BART为归纳模型,归纳模型接收过滤器传输的预回答,并对预回答进行处理,生成总结,并将总结传输至安全分类器; 步骤S4:将BERT微调成安全分类器;安全分类器接收总结并对总结进行判别,若判定为有害则拒绝输出,判定为无害则允许受保护的人工智能模型处理提示; 步骤S4包括如下步骤: 步骤S41:将BERT微调成安全分类器; 步骤S411:随机选取的条良性提示和有害提示作为训练集,并对训练集进行标注,得到标注后的训练集; 步骤S412:将训练集输入BERT,得到经过BERT编码后的特征向量; 步骤S413:在BERT的输出基础上,添加一个分类器层,用于将特征向量映射到无害分数; 步骤S414:正向传播过程中使用安全分类器损失函数来优化模型参数; 步骤S415:在反向传播阶段首先初始化参数:随机初始化权重矩阵和偏置向量;然后计算安全分类器损失函数关于权重矩阵的梯度和关于的梯度,更新模型参数; 步骤S416:通过安全分类器损失函数优化模型参数,并利用反向传播进行参数更新,得到微调好的安全分类器; 步骤S42:安全分类器接收总结并对总结进行判别,若判定为有害则拒绝输出,判定为无害则允许受保护的模型处理提示。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。