Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中科南京人工智能创新研究院;中国科学院自动化研究所孙乾获国家专利权

中科南京人工智能创新研究院;中国科学院自动化研究所孙乾获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中科南京人工智能创新研究院;中国科学院自动化研究所申请的专利面向自回归语言模型训练过程的数据泄露风险量化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120541866B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511040035.2,技术领域涉及:G06F21/60;该发明授权面向自回归语言模型训练过程的数据泄露风险量化方法是由孙乾;张希设计研发完成,并于2025-07-28向国家知识产权局提交的专利申请。

面向自回归语言模型训练过程的数据泄露风险量化方法在说明书摘要公布了:本发明公开了一种面向自回归语言模型训练过程的数据泄露风险量化方法,包括:对原始训练文本集执行增强成员数据划分处理,通过优化函数生成包含成员、非成员及关键的边界文本的三元分区文本集;针对每个文本,利用目标模型从前向推理、反向传播和状态演化三个通道提取成员属性,并融合成成员属性向量;将成员属性向量输入分层对比嵌入网络,通过包含同类聚类、异类分离和边界定位的对比学习,将其映射为优化后的嵌入表征向量;将嵌入表征向量输入能够感知训练阶段的动态推理分类器,判定其风险隶属度,生成数据泄露风险量化结果。本发明能够对泄露风险进行实时、细粒度的动态量化,为模型训练提供及时预警。

本发明授权面向自回归语言模型训练过程的数据泄露风险量化方法在权利要求书中公布了:1.一种面向自回归语言模型训练过程的数据泄露风险量化方法,其特征在于,包括: 对包含预定个训练文本的原始训练文本集执行增强成员数据划分,生成由成员、非成员及边界文本构成的三元分区文本集;其中获得边界文本的过程为:基于原始训练文本集,计算数据分布特征,据此构建包含语义相似度损失、结构合理性损失与频率平衡损失的多目标优化函数;求解多目标优化函数,获得使损失的加权组合达到最小化的文本,得到边界文本; 针对三元分区文本集中的每个文本,利用目标模型进行三通道成员属性提取,为每个文本生成对应的成员属性向量;其中三通道成员属性分别为前向和反向通道属性以及时序通道属性; 将每个文本对应的成员属性向量输入分层对比嵌入网络,通过对比学习映射为优化后的嵌入表征向量; 将优化后的嵌入表征向量输入动态推理分类器,判定对应文本的风险隶属度,生成含各文本风险评分的数据泄露风险量化结果; 其中,映射为优化后的嵌入表征向量,包括: 通过最小化多目标损失函数来训练分层对比嵌入网络;其中多目标损失函数包含:用于促使同类样本在嵌入空间中聚集的同类样本聚类损失;用于推离异类样本的异类样本分离损失;以及用于调控边界样本位置的边界样本定位损失; 利用训练完成的分层对比嵌入网络,接收成员属性向量,输出优化后的嵌入表征向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科南京人工智能创新研究院;中国科学院自动化研究所,其通讯地址为:211135 江苏省南京市江宁区创研路266号麒麟人工智能产业园3号楼3楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。