数据空间研究院张佳佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉数据空间研究院申请的专利基于代理模型引导的AI生成文本检测方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121365306B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511936843.7,技术领域涉及:G06F18/2415;该发明授权基于代理模型引导的AI生成文本检测方法、系统及介质是由张佳佳;余海阳;陈爱华;谢宏华;杭松;张凯;余志富;胡家武;潘李伟;魏凌波设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本基于代理模型引导的AI生成文本检测方法、系统及介质在说明书摘要公布了:本发明涉及人工智能生成内容和信息鉴伪技术领域,公开了基于代理模型引导的AI生成文本检测方法、系统及介质,该方法使用开源大语言模型作为代理模型,将待检测文本输入代理模型,计算文本中各个位置的词元在上下文条件下出现的概率分布信息;根据概率分布信息,结合文本各位置的局部熵、置信度及语言特性的综合评分筛选关键词元。随后构建上下文模板,利用目标模型进行黑盒重采样以生成概率特征向量。最后将概率特征与语义特征融合,通过分类网络判定文本是由AI生成还是人类创作。本发明的AI生成文本检测高效、准确且具有普适性。
本发明授权基于代理模型引导的AI生成文本检测方法、系统及介质在权利要求书中公布了:1.基于代理模型引导的AI生成文本检测方法,其特征在于,包括步骤: S1.使用开源大语言模型作为代理模型,将待检测文本输入代理模型,计算文本中各个位置的词元在上下文条件下出现的概率分布信息; S2.基于概率分布信息,通过多维评估框架计算用于表征待检测文本中每个词元判别价值的综合评分,并按综合评分由高到低的优先级排序筛选出关键词元集合;其中,所述综合评分是基于待检测文本中每个位置的局部熵比值指标、预测置信度指标以及语言学特性指标进行的加权求和;所述局部熵比值指标用于表征词元在局部上下文环境中的不确定性差异,所述语言学特性指标用于表征词元在多种语言学维度上对于文本检测任务的判别价值; S3.构建关键词元集合中每个词元的上下文保持模板,利用目标语言模型对该模板进行黑盒重采样,根据采样结果统计候选词频率并构建伪概率分布,进而生成概率特征向量; S4.提取待检测文本的上下文语义特征向量,将其与所述概率特征向量进行融合,通过分类网络输出待检测文本是由目标语言模型生成还是人类创作的检测结果; 步骤S3具体包括: 针对关键词元集合中每个词元所在的关键位置,保持文本其余部分的上下文不变,将该关键位置替换为掩码标记,构建上下文保持模板; 将上下文保持模板输入目标语言模型,利用带有温度参数的随机采样策略进行多轮重复采样,获取关键位置在不同采样轮次中输出的候选词集合; 计算所述候选词集合中各个候选词的出现频率,并对频率统计结果应用加权平滑处理算法避免零概率问题并提升伪概率分布的稳定性,从而构建反映目标语言模型在黑盒状态下词汇选择倾向的伪概率分布; 基于所述伪概率分布,分别提取基础频率特征和概率分布特征;其中,所述基础频率特征由出现频率最高的若干个候选词的伪概率分布组成;所述概率分布特征由用于量化分布特性的统计指标组成; 将关键词元集合中所有词元对应的基础频率特征和概率分布特征按顺序进行拼接,形成原始特征向量;随后对该原始特征向量进行特征标准化处理,得到文本级别的概率特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:230000 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励