中国科学院计算技术研究所郭嘉丰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院计算技术研究所申请的专利基于因果关系的序列到序列文本摘要生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115658881B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211215316.3,技术领域涉及:G06F16/34;该发明授权基于因果关系的序列到序列文本摘要生成方法及系统是由郭嘉丰;陈薇;张儒清;陈璐;范意兴;程学旗设计研发完成,并于2022-09-30向国家知识产权局提交的专利申请。
本基于因果关系的序列到序列文本摘要生成方法及系统在说明书摘要公布了:本发明提出一种基于因果关系的序列到序列文本摘要生成方法和系统,属于自然语言处理和自动文本摘要生成领域。本方法受到因果理论的启发,从数据生成的角度研究了摘要任务中各要素的因果关系。该方法首先引入两个不可观测变量,得出摘要任务的结构因果模型;然后根据结构因果模型得出相应的序列到序列生成框架,用于建模原文和摘要的生成过程。该框架包含三个核心模块:双隐变量变分编码器、原文重构解码器和摘要预测解码器。此方法不仅比现有的端到端深度文本摘要方法具备更强的可解释性,还具备更好的摘要性能和更强的泛化能力。该方法是一个具备强适用性的序列到序列框架,因此可以迁移到更多模型主体、生成任务和不同数据集上。
本发明授权基于因果关系的序列到序列文本摘要生成方法及系统在权利要求书中公布了:1.一种基于因果关系的序列到序列文本摘要生成方法,其特征在于,包括: 步骤1、将原文档输入基于神经网络的双隐变量变分编码器,该双隐变量变分编码器对该原文档进行多次采样提取该原文档中摘要相关特征和摘要无关特征,包括: 通过文档编码器得到文档的编码表示向量,该双隐变量变分编码器中的文档编码器对该原文档进行编码,得到文档的编码表示向量; 双隐变量变分编码器模块中的变分编码器对文档的编码表示向量进行编码及采样,分别得到隐变量表示和; 将和输入原文重构解码器,得到每个位置上的输出;叠加和和,输入语言模型输出层生成重构的原文档;根据和计算重构损失;存储最小时对应的隐变量表示和分别作为该摘要相关特征和该摘要无关特征; 步骤2、拼接该摘要相关特征和摘要无关特征,得到摘要综合特征,基于该摘要综合特征对原文档进行重构,得到重构文档,并以该原文档为训练目标,基于该重构文档和该训练目标构建损失函数,训练双隐变量变分编码器; 步骤3、采用训练完成后的双隐变量变分编码器提取该原文档的摘要相关特征作为目标特征,基于该目标特征,得到该原文档的文本摘要,包括: 摘要预测解码器根据该目标特征,计算每个位置上的输出;叠加该目标特征和,输入语言模型输出层,得到词表分布概率,以生成对应的词语组成该文本摘要。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励