南京信息工程大学荣欢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京信息工程大学申请的专利针对事实一致性的生成式摘要纠错方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115358215B 。
龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210474905.7,技术领域涉及:G06F40/226;该发明授权针对事实一致性的生成式摘要纠错方法是由荣欢;陈共驰设计研发完成,并于2022-04-29向国家知识产权局提交的专利申请。
本针对事实一致性的生成式摘要纠错方法在说明书摘要公布了:本申请实施例提供了一种针对事实一致性的生成式摘要纠错方法,其技术要点是,建立检索模块与纠错模块,将待纠错的摘要及对应源文本进行数据预处理后,成对输入至所述检索模块,所述检索模块以三分类任务的形式,针对所述待纠错摘要的各句内容,从所述对应源文本中检索证据信息与之匹配获取匹配集合;纠错模块通过所述编码器、掩码器和解码器对掩码特征进行解码以生成纠错文本;从内容和事实性两方面评估所述纠错文本,计算纠错文本收益后,生成一条记录加入到样本池中;从样本池中选取样本收益最大的N条记录以计算策略梯度损失,指导纠错模块参数学习,使用学习完毕的检索模块与纠错模块对目标数据中的待纠错摘要进行纠错。
本发明授权针对事实一致性的生成式摘要纠错方法在权利要求书中公布了:1.一种针对事实一致性的生成式摘要文本纠错方法,其特征在于,所述方法包括: 建立检索模块,所述检索模块为通过数据集三分类任务进行微调后的预训练模型; 建立纠错模块,所述纠错模块配置为通过编码器、掩码器和解码器构建; 将待纠错的摘要及对应源文本进行数据预处理后,成对输入至所述检索模块,所述检索模块以三分类任务的形式,针对待纠错摘要的各句内容,从所述对应源文本中检索证据信息与之匹配,从而获取匹配集合; 所述纠错模块通过所述编码器将所述匹配集合映射为特征向量E,通过所述掩码器在特征空间对特征向量E进行掩码,得到掩码特征E’,所述解码器对掩码特征E’进行解码以生成纠错文本; 从内容和事实性两方面评估所述纠错文本,计算纠错文本收益后,生成一条记录加入到样本池中; 从样本池中选取样本收益最大的N条记录以计算策略梯度损失,指导所述纠错模块参数学习,之后,清空样本池; 使用学习完毕的检索模块与纠错模块对目标数据中的待纠错摘要进行纠错;其中, 所述检索模块以“摘要语句——源文本语句”对的三分类任务形式从源文本中检索证据信息; 所述特征向量E=[n,m,sq_len,e_dim],其中,待修正摘要文本Sum=[c1,c2,…,cn],共有n条句子,即n表示待修正摘要语句数及对应源文本Doc=[e1,e2,…,em]共有m条句子,即m表示对应源文本语句数,e_dim表示向量表示的隐层维度大小,sq_len表示输入数据中每个组合的分词后的token序列长度; 通过切片操作,取出特征向量E中每个组合首部的[CLS]标识符的对应的隐层表示,得到E cls=[n,m,e_dim];接着,将Ecls输入进行n*m三分类,分类结果包含支持S、中立N和矛盾C; 将目标数据中的摘要文本的每条分句依次作为目标语句,对其所在组合的分类结果进行统计,若目标语句所在的所有组合分类结果均为S,则该句无需纠错,若目标语句所在的所有组合分类结果中存在N或C,则该句需要纠错。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210032 江苏省南京市宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。