东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于图形增强的问题驱动抽象式多文本答案摘要方法与装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521857B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310346860.X,技术领域涉及:G06F16/34;该发明授权基于图形增强的问题驱动抽象式多文本答案摘要方法与装置是由杨鹏;李冰;赵翰林;孙元康;易梦设计研发完成,并于2023-04-03向国家知识产权局提交的专利申请。
本基于图形增强的问题驱动抽象式多文本答案摘要方法与装置在说明书摘要公布了:本发明公开了基于图形增强的问题驱动抽象式多文本答案摘要方法,所述方法包括以下步骤:步骤1:社区型问答数据采集与清洗;步骤2:数据规范化;步骤3:模型构建;步骤4:模型测试与答案摘要生成,本发明能够改善传统的多文本答案摘要生成方法中缺少问题约束,难以捕捉答案之间的建模关系等问题,同时利用图编码信息进而提升生成摘要的可读性、流畅性和简洁性。
本发明授权基于图形增强的问题驱动抽象式多文本答案摘要方法与装置在权利要求书中公布了:1.基于图形增强的问题驱动抽象式多文本答案摘要方法,其特征在于,所述方法包括以下步骤: 步骤1:社区型问答数据采集与清洗; 步骤2:数据规范化; 步骤3:模型构建; 步骤4:模型测试与答案摘要生成; 其中,步骤3:模型构建,具体如下: 子步骤3-1,构建模型输入层,利用预训练的RoBERTa对规范化后的问题和所对应的多个正确答案中的每个单词序列转化为词向量表示, 子步骤3-2,构建文本编码表示层,采用一个多层Transformer编码器分别对问题词向量序列EQ和每个答案词向量序列进行语义编码提取, 子步骤3-3,构建图编码表示层,设G表示输入文档的图形表示矩阵,其中G[i][j]表示段落Ai和Aj之间的关系权重,MA是基于文本编码表示的输出,图形编码表示由多头池化注意力机制和图形编码模块组成,对于多头池化注意力机制, 对于每个头部首先计算输入的注意力得分和值得分并且对于每个头部,计算段落中所有字符的注意力概率分布, 能够获得最终所有答案的段落表示 图形编码模块由多个图形编码层组成,其中每个图形编码层由图形多头注意力机制和两层前馈网络组成,让答案段落表示和段落之间的相似图形表示矩阵G作为图形编码层的输入,是图形编码层Gl-1∈1,GL的输出;然后,如下计算Gl的输出 其中是通过图编码机制所获得的最终表示,而dG=dmodelGh,θ是表示图结构的关系的标准差,成对的图形相似性矩阵系数G被加入计算段落之间的权重关系,以建立答案之间的潜在依赖关系,并识别冗余信息,从而使模型能够改善信息的学习情况段落之间的代表, 子步骤3-4,构建解码层,将文本编码表示和图形编码表示显式地集成到端到端解码过程中,并利用多头部分层注意力机制来指导摘要生成过程, 子步骤3-5,训练模型损失,采用随机初始化的方式对所有的参数进行初始化,采用Adam优化器进行梯度反向传播更新模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励