广东工业大学黎坚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利一种基于参数敏感性量化的敏感提示词生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120911454B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511046967.8,技术领域涉及:G06F40/284;该发明授权一种基于参数敏感性量化的敏感提示词生成方法及系统是由黎坚;郑春涛;陈子尧;陈康;陈毅博设计研发完成,并于2025-07-29向国家知识产权局提交的专利申请。
本一种基于参数敏感性量化的敏感提示词生成方法及系统在说明书摘要公布了:本发明公开了一种基于参数敏感性量化的敏感提示词生成方法及系统,涉及人工智能安全技术领域,旨在解决黑盒大语言模型完整性验证中敏感测试样本生成困难的问题。该方法包括:获取原始大语言模型;构建综合参数敏感度指标,其融合了用以表征参数微小修改的微观敏感度,以及用以表征参数量化、剪枝等大幅修改的宏观敏感度,从而全面量化提示词的敏感性;在连续嵌入空间中,采用梯度优化算法以最大化该综合指标为目标进行迭代优化,并施加语义合理性等约束来保证生成提示词的自然流畅;最后,将优化后的嵌入向量映射回离散词元序列,获得最终的敏感提示词。本发明实现了低成本、自动化的测试样本生成,显著提升了云端模型完整性验证的准确性、效率与隐蔽性。
本发明授权一种基于参数敏感性量化的敏感提示词生成方法及系统在权利要求书中公布了:1.一种基于参数敏感性量化的敏感提示词生成方法,其特征在于,包括: 获取预设的原始大语言模型,所述原始大语言模型具有确定的模型参数; 确定一综合参数敏感度指标,所述综合参数敏感度指标用于量化输入提示词对于所述模型参数修改的敏感程度; 在连续嵌入空间中,以最大化所述综合参数敏感度指标为目标,对一初始提示词的嵌入向量进行迭代优化,得到一优化后的嵌入向量;以及 将所述优化后的嵌入向量映射回一离散的词元序列,以生成所述敏感提示词; S100:获取待生成敏感提示词的原始大语言模型,该原始大语言模型具有确定的模型参数和模型结构; S200:确定一个综合参数敏感度指标,该指标用于量化输入提示词对于模型参数修改的敏感程度;该综合参数敏感度指标包括: 1微观敏感度:用于表征当模型参数发生微小扰动时,模型输出的变化程度; 2宏观敏感度:用于表征当模型参数发生大幅修改时,模型输出的变化程度; S300:在连续的嵌入空间中,通过预设的优化算法,以最大化所述综合参数敏感度指标为目标,对初始提示词的嵌入向量进行迭代优化,得到优化后的嵌入向量; S400:将所述优化后的嵌入向量映射回离散的词元序列,生成最终的敏感提示词; 进一步地,在步骤S200中,所述微观敏感度通过计算模型输出对模型参数的梯度的范数来确定;具体地,其计算公式为: 其中,是模型对输入的输出,表示矩阵的弗罗贝尼乌斯范数; 进一步地,在步骤S200中,所述宏观敏感度通过对预设的多种参数修改类型进行采样来估计;具体地,其计算公式为: 其中,是参数修改的分布集合,是从中采样的一个具体的参数修改实例,表示期望。所述参数修改类型至少包括模型量化、模型剪枝和模型微调中的一种或多种; 进一步地,在步骤S200中,所述综合参数敏感度指标通过对微观敏感度和宏观敏感度进行加权求和得到: 其中,是预设的或自适应调整的平衡因子; 进一步地,在步骤S300中,所述优化算法为梯度上升法;迭代优化的过程包括: 1将初始提示词通过模型的嵌入层映射为初始嵌入向量; 2在每次迭代中,计算综合参数敏感度指标对当前嵌入向量的梯度; 3沿梯度方向更新嵌入向量:,其中是学习率; 进一步地,在步骤S300的迭代优化过程中,还施加至少一种约束条件,所述约束条件包括: ①语义合理性约束:确保生成的提示词在语义上是流畅和有意义的,通过限制其在另一个预训练语言模型下的困惑度低于预设阈值; ②小扰动约束:确保生成的提示词与自然语言文本在形式上相似,通过限制其嵌入向量与初始提示词嵌入向量的距离在预设范围内; 进一步地,在步骤S400中,将优化后的嵌入向量映射回离散的词元序列的方法为:对嵌入向量序列中的每一个位置的向量,在模型的词汇表嵌入空间中寻找与其最相似的词元嵌入,并将对应的词元作为该位置的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510006 广东省广州市番禺区小谷围街道;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励