Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海人工智能创新中心张文蔚获国家专利权

上海人工智能创新中心张文蔚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海人工智能创新中心申请的专利一种细粒度的大语言模型幻觉检测方法、设备、存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118364065B

龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410316997.5,技术领域涉及:G06F16/3329;该发明授权一种细粒度的大语言模型幻觉检测方法、设备、存储介质是由张文蔚;季紫薇;顾宇喆;吕成器;林达华;陈恺设计研发完成,并于2024-03-20向国家知识产权局提交的专利申请。

一种细粒度的大语言模型幻觉检测方法、设备、存储介质在说明书摘要公布了:本发明涉及一种细粒度的大语言模型幻觉检测方法、设备、存储介质,方法包括:基于幻觉检测训练数据对幻觉检测模型进行训练,基于训练后幻觉检测模型对目标大语言模型的答复进行幻觉检测,其中,所述幻觉检测训练数据的获取过程包括如下步骤:获取主题数据,通过检索得到对应的参考文献数据;基于所述参考文献数据,使用不同于所述目标大语言模型的语言模型生成多个问题数据并对问题数据进行筛选;将筛选后的问题数据输入语言模型中,得到对应的答复数据,通过以句子为单位进行细粒度的标注,形成幻觉检测训练数据。与现有技术相比,本发明具有检测能力强、准确性高等优点。

本发明授权一种细粒度的大语言模型幻觉检测方法、设备、存储介质在权利要求书中公布了:1.一种细粒度的大语言模型幻觉检测方法,其特征在于,基于幻觉检测训练数据对幻觉检测模型进行训练,基于训练后幻觉检测模型对目标大语言模型的答复进行幻觉检测,其中,所述幻觉检测训练数据的获取过程包括如下步骤: 获取主题数据,通过检索得到对应的参考文献数据; 基于所述参考文献数据,使用不同于所述目标大语言模型的语言模型生成多个问题数据并对问题数据进行筛选; 将筛选后的问题数据输入语言模型中,得到对应的答复数据; 针对所述答复数据,通过以句子为单位进行细粒度的标注,形成幻觉检测训练数据, 其中,以InternLM系列作为基座大语言模型进行训练,得到幻觉检测器,分别采用两种训练范式进行训练: 使用语言模型的范式进行训练,通过提示词构造,使用语言对话的方式令模型进行幻觉判断; 使用分类模型的范式进行训练,将语言模型的最后一层替换为一个线性分类层,在输入问题和回复后,模型直接幻觉类型的判定, 其中,通过检索得到对应的参考文献数据的过程包括: 对条目进行精确匹配,然后,根据句子语义的相似性对候选词条进行排序,使用InternLM对其进行判断,从而选出词条,在判断时,从两个方面进行判断,一个是该词条是独一无二还是存在某些近义词,另一个是该词条是否著名或重要,保证选择的词条是独特且重要的, 其中,生成问题数据的过程包括: 使用GPT4重新生成问题,生成完问题后,再次使用GPT4,以真实性、可回答性、难度和多样性指标对问题进行挑选,得到最终的高质量问题, 其中,进行细粒度的标注的过程包括: 若句子包含事实信息且与参考信息一致,则其类型为无幻觉,指出原始文件中的具体参考片段; 如果句子与参考文献相矛盾,则其类型为矛盾的幻觉,提供具体的参考文献片段和更正建议; 如果句子缺乏支持性证据且无法核实,则其类型为无法验证的幻觉,提出修改建议; 如果该句子不包含任何可供评估的事实信息,则属于无事实类别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海人工智能创新中心,其通讯地址为:200232 上海市徐汇区云锦路701号37、38层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。