北京邮电大学张华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利一种硬标签黑盒场景下自然对抗文本生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115329836B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210777660.5,技术领域涉及:G06F16/35;该发明授权一种硬标签黑盒场景下自然对抗文本生成方法及装置是由张华;王稼慧;涂腾飞;李文敏;高浩然;张欣设计研发完成,并于2022-07-04向国家知识产权局提交的专利申请。
本一种硬标签黑盒场景下自然对抗文本生成方法及装置在说明书摘要公布了:本发明公开一种硬标签黑盒场景下自然对抗文本生成方法及装置,该方法通过获取数据集中的离散文本X,通过重要单词鉴别器识别所述离散文本X中的重要单词,根据重要单词鉴别器的重要单词识别结果生成重要单词集合I;采用掩语言模型对重要单词集合I的每个重要单词生成候选单词集合,对重要单词集合I中的指定重要单词采用对应的候选单词集合中的词进行替换,以生成初始化的对抗文本X*;最终利用遗传算法对生成的对抗样本X*迭代的进行变异、选择及交叉操作,得到具有指定语义相似度的优化的对抗样本Xadv。本申请攻击成功率高,具有较好的流畅性和语法正确性。
本发明授权一种硬标签黑盒场景下自然对抗文本生成方法及装置在权利要求书中公布了:1.一种硬标签黑盒场景下自然对抗文本生成方法,包括: 获取数据集中的离散文本X,通过重要单词鉴别器识别所述离散文本X中的重要单词,根据重要单词鉴别器的重要单词识别结果生成重要单词集合I; 采用掩语言模型对重要单词集合I的每个重要单词生成候选单词集合,对重要单词集合I中的指定重要单词采用对应的候选单词集合中的词进行替换,以生成初始化的对抗文本; 利用遗传算法对生成的对抗样本迭代的进行变异、选择及交叉操作,得到具有指定语义相似度的优化的对抗样本Xadv; 获取数据集中的离散文本X过程中,将输入文本按照单词进行划分,获得由单词组成的文本序列,对文本序列进行截断与补全并转换为token编码; 重要单词鉴别器识别所述离散文本X中的重要单词时,将离散文本X输入到BERT模型中,通过BERT模型对每个单词生成包含上下文语义的向量; 将生成的向量输入到二元分类器中,依据二元分类器的输出判别当前单词是否为重要单词; 对每个重要单词生成候选单词集合过程中,获取重要单词对应位置掩语言模型预测概率从高到低的预设数量的候选单词预测结果; 对每个重要单词的候选单词集合进行筛选,从候选单词集合中筛除原始重要单词、子词级别的候选词及词性不一致的候选词; 采用的重要单词鉴别器的结构为:BERT模型和二元分类器f级联;其中BERT模型含有768个隐藏单元,层数为12,每层有12个头,参数量为110M;二元分类器f的输入维度为512, 输出维度为2; 离散文本X中每个单词的预测结果表示为: 式中,fi是二元分类器的逻辑输出;,如果ci=1表示当前单词为重要单词; BERT模型为每个单词wi生成包含上下文语义的向量Ei; w和b是二元分类器的权重和偏置值; 对于离散文本的所有单词,根据重要单词鉴别器的鉴别结果,将识别结果为重要的单词存入集合I;离散文本X的重要单词集合I的构建表示为: ; 对于离散文本X的重要单词集合中的每个重要单词,生成对应的候选词集合,并随机从其候选单词集合中选择单词进行替换,对重要单词逐个进行替换操作,生成愚弄目标模型的对抗文本; 对抗文本所有替换词的位置都存在集合pos中;对于集合pos中的每个位置idx,变异操作将对抗文本中的对应位置的扰动词tidx用原始单词widx替换,如果替换后的能愚弄目标模型,将作为初始代P0中的一个文本;否则,用替换词集合Cwidx中每个词进行替换操作,并选择与原始文本之间有着最高语义相似度的; 计算当前代中的每个样本Xi与原始离散文本X之间的语义相似度SimX,Xi,并将语义相似度最高的文本视为当前代的最优样本Xfinal;如果Xfinal能够攻击目标模型,将Xfinal视为最终的对抗样本Xadv;否则,将Xfinal直接作为下一代的样本; 从当前代中随机抽取一对样本作为下一代的父辈,其中抽取的概率与语义相似度Sim正相关;利用均匀分布从两个父辈中独立抽样,合成一个新的句子;对于每个新合成的句子,随机从替换词索引pos中抽取一个索引idx,如果child中对应位置的单词是原始单词,将新合成的句子作为下一代的样本;否则,对新合成的句子进行一次变异操作,将变异操作的结果作为下一代样本;上述交叉、变异操作需要进行K‑1次,即可获得下一代的所有样本; 变异操作为:首先将对抗文本中第idx处的替换单词tidx换成其对应的原始单词widx; 判断更新后的对抗文本是否能成功愚弄目标模型,如果满足该条件,将视为当前变异操作最终结果;如果更新后的文本不满足上述条件,用单词widx的替换词集合Cwidx中的每个词对widx进行替换,生成对应文本,对满足条件的计算其与原文本之间的语义相似度,选择相似性最高的作为变异操作结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励