北京大学;北京大学重庆大数据研究院黄晶获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学;北京大学重庆大数据研究院申请的专利政务问答系统的一种微调方法、装置、终端设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120067682B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510121461.2,技术领域涉及:G06F18/214;该发明授权政务问答系统的一种微调方法、装置、终端设备及介质是由黄晶;吴迪;宋洁;张平文设计研发完成,并于2025-01-26向国家知识产权局提交的专利申请。
本政务问答系统的一种微调方法、装置、终端设备及介质在说明书摘要公布了:本发明公开了政务问答系统的一种微调方法、装置、终端设备及介质,包括:基于场景中用户的提问与工作人员的回答,构建原始问答数据集D1;在原始问答数据集D1中加入噪音数据,得到第二问答数据集D2;在第二问答数据集D2中加入逻辑推理过程,生成第三问答数据集D3;根据第三问答数据集D3构建微调后的大语言模型。显著减少了在检索结果不相关时大语言模型产生幻觉的现象。在训练数据中融入逻辑推理,有效降低了大语言模型训练过程中的过拟合风险。
本发明授权政务问答系统的一种微调方法、装置、终端设备及介质在权利要求书中公布了:1.政务问答系统的一种微调方法,其特征在于,包括: S101:基于场景中用户的提问与工作人员的回答,构建原始问答数据集D1; S102:在原始问答数据集D1中加入噪音数据,得到第二问答数据集D2; S103:在第二问答数据集D2中加入逻辑推理过程,生成第三问答数据集D3; S104:根据第三问答数据集D3构建微调后的大语言模型; S101步骤包括: S1011:收集真实场景中的用户提问与工作人员回答,获取原始问答数据; S1012:对原始问答数据中的每个用户问题Question和工作人员的回答response进行详细标注和分类,标注内容包括: Policyi,k表示工作人员针对第i个问题引用的第k个政策名称;Contenti,k表示工作人员引用的第k个政策中的相关内容;Answeri表示工作人员对第i个问题给出的直接答案; S1013:通过对原始问答数据标注和分类,形成标准化的原始问答数据集D1={Questioni,responsei}; S103步骤包括: S1031:从第二问答数据集D2中抽取M个问题Questionm,以及对应的政策名称Policym,k和政策内容Contentm,k,并撰写逻辑推理过程,获取推理结果logici; S1032:撰写逻辑推理过程中,对于第二问答数据集D2中的每个问题questioni和每一条政策policyi,k,contenti,k,按照以下两种情况生成logici: 情况1,若policyi,k和contenti,k是噪音数据,则logici=“政策内容和用户问题无关”; 情况2,若policyi,k和contenti,k不是噪音数据,则利用大语言模型生成,大语言模型的生成是以构建的提示语作为输入,获得大语言模型的输出,logici=大语言模型的输出; 其中,构建的提示语包括: 已知用户问题Questioni; 已知政策Policyi,k,Contenti,k; 请结合政策和内容,进行逻辑推理并输出结果; S1033:基于推理结果logici,生成第三问答数据集D3,其中,D3={Questioni,responsei},responsei={{policyi,k,contenti,k},logici,answeri}。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学;北京大学重庆大数据研究院,其通讯地址为:100871 北京市海淀区颐和园路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。