Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安电子科技大学高海昌获国家专利权

西安电子科技大学高海昌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安电子科技大学申请的专利基于预训练模型的AI文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118734124B

龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410717863.4,技术领域涉及:G06F18/24;该发明授权基于预训练模型的AI文本检测方法是由高海昌;罗嘉诚;常国沁设计研发完成,并于2024-06-04向国家知识产权局提交的专利申请。

基于预训练模型的AI文本检测方法在说明书摘要公布了:本申请的实施例涉及AI文本检测技术领域,特别涉及一种基于预训练模型的AI文本检测方法,包括:基于获取到的人类文本数据、AI文本数据和AI润色文本数据,构建原始数据集,并划分为训练数据集和验证数据集,原始数据集中的每个样本数据上均标注有表征文本类型的第一标签和表征使用的AI大语言模型的第二标签;在预训练模型的末尾添加分类层得到分类模型;将训练数据集输入至分类模型中,利用第一标签和分类模型的输出对分类模型进行训练,得到文本分类模型;将训练数据集输入至文本分类模型中,利用第二标签和文本分类模型的输出对文本分类模型进行训练,得到细粒度文本分类模型,该模型能够很好地进行细粒度、低成本、高效的文本检测。

本发明授权基于预训练模型的AI文本检测方法在权利要求书中公布了:1.一种基于预训练模型的AI文本检测方法,其特征在于,包括: 基于获取到的人类文本数据、AI文本数据和AI润色文本数据,构建原始数据集,并将原始数据集按照预设比例划分为训练数据集和验证数据集;其中,原始数据集中的每个样本数据上均标注有表征文本类型的第一标签和表征所使用的AI大语言模型的第二标签; 在预训练的大语言模型的末尾添加分类层,得到分类模型; 将训练数据集中的样本数据输入至分类模型中,利用第一标签和分类模型的输出,对分类模型进行迭代训练,并利用验证数据集确定每一次训练后的分类模型的分类准确率,当分类准确率大于第一预设阈值时停止训练,得到文本分类模型; 将训练数据集中的样本数据输入至文本分类模型中,利用第二标签和文本分类模型的输出,对文本分类模型进行迭代训练,并利用验证数据集确定每一次训练后的文本分类模型的分类准确率,当迭代次数达到第二预设阈值时停止训练,将分类准确率最高的基础分类模型作为最终训练得到的细粒度文本分类模型; 将获取到的待测文本数据输入至细粒度文本分类模型中,得到细粒度文本分类模型输出的对待测文本数据的分类结果; 所述基于获取到的人类文本数据、AI文本数据和AI润色文本数据,构建原始数据集,包括: 收集问题数据集,召集志愿者对问题数据集中的问题进行回答,将志愿者的回答作为人类文本数据,生成人类文本数据集; 将问题数据集输入到各AI大语言模型中进行回答,将各AI大语言模型的回答作为AI文本数据,生成AI文本数据集; 将人类文本数据集输入至各AI大语言模型中进行润色,得到各AI大语言模型输出的AI润色文本数据,生成AI润色文本数据集; 为人类文本数据集、AI文本数据集和AI润色文本数据集中的各文本数据标注第一标签和第二标签,打乱顺序后按照1:1:1的比例进行混合,构成原始数据集; 所述细粒度文本分类模型输出的对待测文本数据的分类结果为:待测文本数据的文本类型和生成文本数据所使用的AI大语言模型,当待测文本数据的文本类型为人类文本时,其生成文本数据所使用的AI大语言模型为空。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。