中国科学院软件研究所王承杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院软件研究所申请的专利面向人工智能模型迁移安全的后门攻击对抗方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116702832B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310705688.2,技术领域涉及:G06N3/0455;该发明授权面向人工智能模型迁移安全的后门攻击对抗方法及系统是由王承杰;赵琛;武延军;吴敬征;郑森文;罗天悦设计研发完成,并于2023-06-14向国家知识产权局提交的专利申请。
本面向人工智能模型迁移安全的后门攻击对抗方法及系统在说明书摘要公布了:本发明公开了一种面向人工智能模型迁移安全的后门攻击对抗方法及系统。本发明基于对知识蒸馏迁移范式进行优化,来抵抗后门攻击触发器模式的转移;其中学生模型不直接模仿教师模型的输出,而是在利用Transformer对学生模型输出进行层间融合后以全局交互信息模式对教师模型输出进行匹配学习,教师模型的信息被融合信息分散拆解到学生模型各阶段的参数权重内,可避免学生模型受到教师模型内包含的基于局部信息的攻击后门的影响,同时全局信息融合可以提高学生模型所学习的语义,从而提高精度。本发明提供的方法可在迁移不可信来源的人工智能模型能力时,获得可去除基于局部信息攻击后门的安全学生模型。
本发明授权面向人工智能模型迁移安全的后门攻击对抗方法及系统在权利要求书中公布了:1.一种面向人工智能模型迁移安全的后门攻击对抗方法,其步骤包括: 1挑选并初始化目标应用任务所属上级应用任务对应的一模型作为教师模型Mtea,获取所述教师模型Mtea的预训练模型权重对所述教师模型Mtea的参数权值进行覆盖;挑选并初始化一模型作为学生模型Mstu; 2将图像分类领域数据集的一样本分别输入到教师模型和学生模型当中,得到教师模型的各中间层级输出的特征图构成的特征图集合Featstea以及教师模型最后一层输出的概率分布Logitstea,得到学生模型的各中间层级输出的特征图构成的特征图集合Featsstu以及得到学生模型最后一层输出的概率分布Logitsstu; 3将Featsstu中的每一特征图分别处理为设定尺寸的特征小块,对概率分布Logitsstu处理使其通道与所述特征小块的通道一致,然后将处理后的概率分布Logitsstu与各所述特征小块组合在一起输入到TransformerEncoder模型中,所述TransformerEncoder模型利用自注意力机制对所输入的不同层级的信息进行交互融合,输出全局层级信息融合后特征图集合Featsmerge与融合特征图信息之后的概率分布Logitsmerge; 4将Featsmerge与Logitsmerge共同输入到TransformerDecoder模型中进行解码,得到各所述特征小块对应的特征图与概率分布;然后将解码所得特征图逐一恢复到Featsstu中特征图的尺寸和通道数,将解码所得概率分布恢复到Logitsstu的通道数,从而获得全局语义加权的特征图集合Featsdec与特征图加权融合概率分布Logitsdec; 5对于学生模型Mstu的每一中间阶层l,利用特征图集合Featsdec内中间阶层l对应的特征图与Featstea内中间阶层l对应的特征图进行损失计算,对概率分布Logitsdec与概率分布Logitstea进行损失计算得到概率分布损失值Logitsloss,根据各中间阶层对应的损失值Featsloss与概率分布损失值Logitsloss求和计算得到蒸馏损失值Distillloss; 根据每一样本对应的Logitsstu与该样本的真实标签计算损失值Customloss; 6根据蒸馏损失值Distillloss和损失值Customloss计算得到的总损失Totalloss优化所述学生模型Mstu; 7迭代重复步骤2-6直至所述学生模型Mstu收敛,得到去除潜在后门的安全模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院软件研究所,其通讯地址为:100190 北京市海淀区中关村南四街4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。