浪潮智慧科技有限公司;浪潮智慧科技(武汉)有限公司;浪潮智慧科技(南京)有限公司管鹏伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮智慧科技有限公司;浪潮智慧科技(武汉)有限公司;浪潮智慧科技(南京)有限公司申请的专利大语言模型提示词攻击的防御方法、系统、终端及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121262016B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511821183.8,技术领域涉及:H04L9/40;该发明授权大语言模型提示词攻击的防御方法、系统、终端及介质是由管鹏伟;付金涛;张再胜;周冬设计研发完成,并于2025-12-05向国家知识产权局提交的专利申请。
本大语言模型提示词攻击的防御方法、系统、终端及介质在说明书摘要公布了:本发明属于大语言模型安全技术领域,具体公开大语言模型提示词攻击的防御方法、系统、终端及介质。包括:接收用户输入的信息内容,并基于预设规则生成多个检测输入副本;将所述副本并行输入至相互独立的检测流程以获得多个风险评分;基于风险评分构建综合风险评分,并据此确定输入内容的风险等级;当风险等级落入防御触发区间时,执行主动防御策略,实施指令混淆、语义稀释及结构隔离处理,以生成第一输出内容;当风险等级低于通过阈值时,基于用户原始输入生成第二输出内容。本发明能够在不影响正常交互体验的前提下,对多类型提示词攻击进行细粒度、可控且动态的安全防护,提升大语言模型的整体安全性和可用性。
本发明授权大语言模型提示词攻击的防御方法、系统、终端及介质在权利要求书中公布了:1.大语言模型提示词攻击的防御方法,其特征在于,包括以下步骤: 步骤S1、接收用户输入的信息内容,并基于预设的输入复制规则生成多个检测输入副本; 步骤S2、将多个检测输入副本并行输入至相互独立的检测流程,输出对应的风险评分; 针对每一个检测输入副本分别分配独立执行上下文、独立语义解析空间及独立特征抽取线程,各检测流程在同一时间窗口内以异步调度方式并发执行; 在并发执行过程中,各检测流程在不共享状态、不复用缓存、不依赖共用语义嵌入的前提下分别生成对应的风险特征向量; 当全部检测流程完成风险特征计算后,再将各风险特征向量提交至融合层用于生成风险评分; 在相互独立的检测流程中分别执行权限越狱检测、提示词注入检测、上下文诱导攻击检测以及思维链劫持检测; 权限越狱检测通过基于访问意图解析、指令角色映射及调用链关系比对,识别输入中是否包含越权操作、未授权指令或模拟系统命令格式的表达; 提示词注入检测通过构建结构化操控语句模板、控制关键词依赖关系图及跨句法层级的操控语义匹配树,识别输入中是否存在试图反向操控模型行为的提示注入内容; 上下文诱导攻击检测通过生成语义迁移向量、轮次一致性矩阵及约束衰减曲线,识别输入是否存在跨轮次逐步削弱系统约束的诱导趋势; 思维链劫持检测通过构建推理步骤序列、知识一致性向量及候选推理路径评分模型,识别输入中是否插入异常中间步骤或伪造推理链条; 步骤S3、基于多个风险评分构建综合风险评分,将各检测流程的风险评分按预设权重进行加权融合,依据融合后的综合风险评分确定输入内容的风险等级; 步骤S4、当风险等级落入预设的防御触发区间时,执行主动防御策略,根据处理后的输入内容生成第一输出内容; 当风险等级低于通过阈值时,基于用户输入生成第二输出内容; 主动防御策略包括: 对用户输入中经检测流程识别为具有攻击倾向的语句片段、语义单元或句法结构进行针对性干预,按照预设的干预优先级依次或组合实施指令混淆处理、语义稀释处理及结构隔离处理; 在指令混淆处理中,对输入内容的指令触发词、控制短语及关键语法节点进行替代、重排或弱化; 在稀释处理中,对被识别为高风险的语义单元增加语义背景信息、插入语义中性表达或调整语义焦点分布; 在结构隔离处理中,识别输入内容中的高风险语义片段、指令链片段或可能引导模型偏移任务目标的语义节点,将其与模型核心推理语义、系统角色设定及任务意图表达之间建立逻辑隔离; 对指令混淆处理、语义稀释处理及结构隔离处理的执行顺序与处理强度基于动态干预控制机制进行确定,动态干预控制机制包括: 在触发主动防御策略后,对用户输入进行干预优先级评估,通过分析风险片段的类型、所处语义位置以及与周边语义的依存关系,确定各干预策略的初始执行顺序; 基于风险等级对应的干预强度档位,从预设的干预策略库中选择与当前档位匹配的干预模板,根据风险片段的语义结构为各干预模板分配不同的处理强度参数; 在多策略联合执行时,通过建立策略之间的冲突检测规则和处理次序调度规则使混淆、稀释与隔离策略按序列执行、并行执行或按预设组合方式执行; 在干预执行过程中,记录每轮处理后的输入结构变化与语义分布变化,对后续策略的处理强度与执行顺序进行调整; 步骤S5、根据综合风险评分输出第一输出内容或第二输出内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮智慧科技有限公司;浪潮智慧科技(武汉)有限公司;浪潮智慧科技(南京)有限公司,其通讯地址为:250000 山东省济南市中国(山东)自由贸易试验区济南片区浪潮路1036号S01楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励