广州大学顾钊铨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大学申请的专利一种基于扰动敏感性差异的对抗样本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115408516B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210807194.0,技术领域涉及:G06F16/35;该发明授权一种基于扰动敏感性差异的对抗样本检测方法是由顾钊铨;张欢;王乐;谭昊;朱斌;朱梓萁;谢禹舜;朱东;方滨兴设计研发完成,并于2022-07-11向国家知识产权局提交的专利申请。
本一种基于扰动敏感性差异的对抗样本检测方法在说明书摘要公布了:本发明公开了一种基于扰动敏感性差异的对抗样本检测方法,包括以下步骤:步骤1:利用攻击算法生成对抗样本;步骤2:利用梯度估计确定重要单词;步骤3:扰动重要单词,提取对抗特征;步骤4:对抗特征作为训练数据,训练二分类对抗检测器;步骤5:将待测文本输入对抗检测器,输出结果。本发明利用扰动敏感性差异提取对抗特征,较现有技术中通过复杂的表征向量构建方法,大大提升提取效率。本发明的对抗特征提取方法是建立在对抗样本的普遍性特定上,通用性强。较现有技术只能检测针对某种或者某类攻击手段生成的对抗样本,具有普适应和可推广性。
本发明授权一种基于扰动敏感性差异的对抗样本检测方法在权利要求书中公布了:1.基于扰动敏感性差异的对抗样本检测方法,其特征在于,包括以下步骤:步骤1:利用攻击算法生成对抗样本;步骤2:利用梯度估计确定重要单词;步骤3:扰动重要单词,提取对抗特征;步骤4:对抗特征作为训练数据,训练二分类对抗检测器;步骤5:将待测文本输入对抗检测器,输出结果;所述步骤2中,从数据集T中的所有文本x中,包括对抗样本和干净样本,选取最重要的k个单词,并对其进行排序,记为Cx;所述步骤3中,对于Cx中的每个单词,通过访问深度神经网络模型得到该单词被删除前后的预测标签,将删除单词前后的预测标签不一致的词定义为敏感词,反之则为非敏感词;所述敏感词的信号集用于衡量文本x对F的敏感性,表示为Sx,fx,其公式化表示为: 其中表示单词敏感性的数学表达: 其中是文本x去除单词wi的表示,fx表示深度神经网络模型F输出函数;通过JSD散度来计算概率分布之间的相似性,JSD散度的值越大表示越相似,分布越接近,反之则表示分布发生了很大的变化: 其中fsx表示softmax层概率分布,KL表示为Kullback-Leibler散度;对于Cx中每个词,计算JSD散度的值后并将这些值作为x的分布方差特征,表示为: 对抗检测器的输入特征Ex,fx由敏感信号JSD值组成,表示为:Ex,fx=Sx,fx*Jx,fx因此,对抗检测器的输入特征是一组大小为k的连续向量,标签是二进制的,0代表干净样本,1代表对抗样本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学,其通讯地址为:510006 广东省广州市大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励