北京理工大学孙新获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于共指消歧的文档级事件抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116861996B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310701623.0,技术领域涉及:G06N5/02;该发明授权一种基于共指消歧的文档级事件抽取方法是由孙新;李帆;姜景虎设计研发完成,并于2023-06-14向国家知识产权局提交的专利申请。
本一种基于共指消歧的文档级事件抽取方法在说明书摘要公布了:本发明涉及自然语言处理和深度学习技术领域,特别涉及一种基于共指消歧的文档级事件抽取方法。本发明的主要技术方案包括:通过命名实体识别得到文档中的全部命名实体;通过共指消歧将表示同一事物的实体集合在一起,得到共指实体集合;利用实体交互、句子交互和共指关系对文档进行处理,得到一个以句子为结点的同构图;将具有相似语义或主题的句子集合在一起,并采用句子级注意力机制进行降噪处理,得到句子团体;对句子团体进行分类,得到事件类型,进一步得到对应的论元。通过本发明的抽取方法,能够有效处理现有文档级事件抽取方法没有考虑共指消歧和句子团体内噪声影响的问题。
本发明授权一种基于共指消歧的文档级事件抽取方法在权利要求书中公布了:1.一种基于共指消歧的文档级事件抽取方法,其特征在于,所述方法包括: S1、对于输入的文档,通过命名实体识别获取文档中的所有命名实体,组成命名实体集合; S2、对于输入的文档,通过共指消歧方法获取若干共指实体集合; S3、利用命名实体集合、句子交互和共指实体集合,将文档转化成以句子为结点的同构图; S4、提取句子内部的特征,获得句子结点si的特征向量vi; S5、在同构图上对每个句子结点的特征向量使用注意力机制,将具有相似语义或主题的句子集合在一起,生成句子团体; S6、对句子团体进行分类,获得事件类型,确定论元角色和论元; 所述步骤S2包括: S21、对文档中的每个句子进行分词处理,然后编码生成单词表示; S22、利用句法依存树和成分树为文档构建基于单词和成分的异构图; S23、将异构图输入卷积神经网络,获得融合局部句法信息和全局的文档特征的单词的融合表示; S24、根据单词的融合表示,得到文档的所有跨度表示; S25、枚举每个跨度表示,根据共指得分得到当前跨度表示对应的先行词,将表示同一事物的实体划分在一起,得到共指实体集合序列; 所述步骤S5包括: S51、图注意力机制的输入包括同构图的邻接矩阵Auv,结点特征向量v=[v1,v2,…,vn],在图注意力机制中,计算邻居结点j对当前结点i的重要性,用注意力分数αij表示,公式为: 其中,σ表示LeakyReLU激活函数,f表示注意力机制中的全连接层,Ni表示结点i的全部邻居结点; S52、为了捕获更多的信息,采用K个头的多头注意力机制: 其中,||表示拼接操作,表示第k个图注意力下结点j对当前结点i的得分; 将K头图注意力的输出v′i,i=1,2,…,n叠加,得到一个预测矩阵Z,接着将其放入一个多层感知机MLP中,最后对其进行归一化操作,得到结点vi属于第j个句子团体的预测概率: 若结点vi对应第j个句子团体的概率大于预定值,则将结点vi赋给该句子团体; 重复上述步骤,具有相似语义或信息的句子会被划分在同一个句子团体内,最后输出m个句子团体,一个句子团体代表一个事件; S53、为文档构造隶属矩阵F={0,1}n×m,如果第i个句子在第j个句子团体内部,就设置Fi,j=1,否则为0。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励