Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 国网浙江省电力有限公司信息通信分公司郑诗雨获国家专利权

国网浙江省电力有限公司信息通信分公司郑诗雨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉国网浙江省电力有限公司信息通信分公司申请的专利大语言模型越狱攻击的防御方法、系统、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120408608B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510906950.9,技术领域涉及:G06F21/55;该发明授权大语言模型越狱攻击的防御方法、系统、设备和存储介质是由郑诗雨;王以良;徐子超;周鹏;戚伟强;卢新岱;陈逍潇;钱经玮;胡云龙;陈婧楠;王臻;陈超;王嘉琦;陈昭昀;江昊设计研发完成,并于2025-07-02向国家知识产权局提交的专利申请。

大语言模型越狱攻击的防御方法、系统、设备和存储介质在说明书摘要公布了:本发明涉及模型防御技术领域,公开了一种大语言模型越狱攻击的防御方法、系统、设备和存储介质,包括通过探针采集模型采集各个解码器层输出的高维中间特征并进行降维,得到低维中间特征;计算低维中间特征与有害特征中心之间的第一距离,以及与安全特征中心之间的第二距离,根据第一距离与第二距离之间的差值,得到向量距离差异,判断是否存在越狱攻击风险;响应于存在风险,以关键层的向量距离差异的最大化为目标函数,构建扰动优化模型,得到最优扰动项,并添加至对应的高维中间特征,得到安全中间特征。本发明提高了电力系统中大语言模型的实时动态防御能力、可解释性和计算效率,实现了大语言模型的对抗调整与稳定性之间的有效平衡。

本发明授权大语言模型越狱攻击的防御方法、系统、设备和存储介质在权利要求书中公布了:1.一种大语言模型越狱攻击的防御方法,其特征在于,包括: 将文本数据输入大语言模型,通过预先构建的探针采集模型采集大语言模型的各个解码器层输出的高维中间特征并进行降维,得到多个低维中间特征,所述探针采集模型包括若干个特征提取模块,所述大语言模型基于转换器模型构建得到; 计算所述低维中间特征与预设的有害特征中心之间的第一距离,以及所述低维中间特征与预设的安全特征中心之间的第二距离,根据所述第一距离与所述第二距离之间的差值,得到向量距离差异,并根据所述向量距离差异与预设的差异阈值之间的比较结果,判断是否存在越狱攻击风险; 响应于存在越狱攻击风险,将大语言模型中的最后若干个解码器层作为关键层,以所述关键层的向量距离差异的最大化为目标函数,构建扰动优化模型,对所述扰动优化模型进行迭代求解,得到最优扰动项,并将所述最优扰动项添加至对应的所述高维中间特征,得到安全中间特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网浙江省电力有限公司信息通信分公司,其通讯地址为:310007 浙江省杭州市西湖区黄龙路8号641室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。