中央民族大学刘征获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中央民族大学申请的专利一种多文档摘要生成方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116775858B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310768305.6,技术领域涉及:G06F16/34;该发明授权一种多文档摘要生成方法、系统及设备是由刘征;翁彧;超木日力格;唐湘云;刘轩;彭路尧;董书敏;李乙萌;许瑞洋;张瑜设计研发完成,并于2023-06-27向国家知识产权局提交的专利申请。
本一种多文档摘要生成方法、系统及设备在说明书摘要公布了:本发明提供了一种多文档摘要生成方法、系统及设备,涉及计算机技术领域,该方法包括:采用改进的孪生神经网络评估多文档情况下文档段落与标题的关联度得分;结合基于关联度的层次聚类去重方法,根据所述关联度得分抽取出文档段落集合中重要程度大于设定重要程度且冗余度低于设定冗余度的段落子集;基于多层次Transformer的摘要生成装置对所述段落子集进行处理,生成多文档摘要文本;所述多层次Transformer的摘要生成装置具有跨文档学习能力。本发明能够生成简洁、高质量的多文档摘要文本。
本发明授权一种多文档摘要生成方法、系统及设备在权利要求书中公布了:1.一种多文档摘要生成方法,其特征在于,包括: 采用改进的孪生神经网络评估多文档情况下文档段落与标题的关联度得分,具体包括: 获取包括多个文档的文档簇;每个所述文档包括标题和正文; 将每个所述文档簇中多个所述文档的正文按照换行符拆分成多个文档段落集合; 将所述文档段落集合输入至所述改进的孪生神经网络,生成每个所述文档段落与对应的所述标题对于最终生成的摘要文本的重要程度; 按照所述关联度得分对所述文档段落集合重新排序,生成排序后的文档段落集合; 选取所述排序后的文档段落集合中前K个段落作为包含关键信息的数据子集;K为大于等于1的正整数;所述重要程度为所述文档段落与标题的关联度得分;所述改进的孪生神经网络中改进的结构,具体包括:编码层结构、注意力层结构以及输出层结构; 所述编码层结构为: {,…,}=Bi-LSTMt{,…,} {,…,}=Bi-LSTMp{,…,} 其中,为标题的第n个词编码结果,为段落的第m个词的编码结果;编码后,将、输入Bi-LSTM层进行编码,为标题编码后的结果,为段落编码后的结果;n为标题token数量;m为段落token数量; 所述注意力层结构为: {,…,}=self-attt{,…,} {,…,}=self-attp{,…,} 其中,为将输入到注意力层层经过自注意力机制计算得到的向量表示;为将输入到注意力层层经过自注意力机制计算得到的向量表示;为将和输入到全连接层连接得到的向量表示; 所述输出层结构为: r=sigmoidWstanhWt+bt+bs 其中,Ws为激活函数的第一权重参数;Wt为激活函数的第二权重参数,bt为激活函数的第一偏移量参数;bs为激活函数的第二偏移量参数;r为标题与段落集合之间的关联得分; 结合基于关联度的层次聚类去重方法,根据所述关联度得分抽取出文档段落集合中重要程度大于设定重要程度且冗余度低于设定冗余度的段落子集,具体包括: 获取关联度得分集合,并根据所述关联度得分集合建立关联度邻接矩阵; 以所述关联度邻接矩阵作为输入,结合基于关联度的层次聚类去重方法生成聚类结果集合; 利用基尼不纯度计算所述聚类结果集合中所有聚类结果的概率分布,选取分布最均匀的聚类结果; 将所述分布最均匀的聚类结果中每个聚类中心作为关联度得分聚类数据子集; 根据所述包含关键信息的数据子集确定所述关联度得分聚类数据子集对应的段落子集;所述段落子集为文档段落集合中重要程度大于设定重要程度且冗余度低于设定冗余度的段落子集; 基于多层次Transformer的摘要生成装置对所述段落子集进行处理,生成多文档摘要文本;所述多层次Transformer的摘要生成装置具有跨文档学习能力。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中央民族大学,其通讯地址为:100089 北京市海淀区中关村南大街27号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励