中国人民解放军国防科技大学刘姗姗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利基于端到端机器阅读理解的联合事件检测抽取方法、装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116662505B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310626411.0,技术领域涉及:G06F16/3329;该发明授权基于端到端机器阅读理解的联合事件检测抽取方法、装置是由刘姗姗;张胜;丁鲲;刘浏;刘茗;张慧;蒋国权;张骁雄设计研发完成,并于2023-05-30向国家知识产权局提交的专利申请。
本基于端到端机器阅读理解的联合事件检测抽取方法、装置在说明书摘要公布了:本申请公开了一种基于端到端机器阅读理解的联合事件检测抽取方法、装置,属于信息抽取和自然语言处理技术领域。基于端到端机器阅读理解的联合事件检测抽取方法包括,S1:数据预处理,对数据集进行分析,遍历其中所包含的所有论元角色,构成论元角色集合;针对不同的论元,设计不同的问题模板;S2:问答对的生成,将事件抽取转化为机器阅读理解,根据S1步骤中设计好的模板生成问题;S3:将给定的句子和生成的问题输入到基于端到端机器阅读理解的联合事件检测抽取的模型中;S4:启发式后处理。本申请解决了现有基于机器阅读理解的事件抽取方法主要是管道式,容易导致误差传递,且不能有效利用事件类型和论元之间的关联关系的技术问题。
本发明授权基于端到端机器阅读理解的联合事件检测抽取方法、装置在权利要求书中公布了:1.一种基于端到端机器阅读理解的联合事件检测抽取方法,其特征在于: S1:数据预处理,对数据集进行分析,遍历其中所包含的所有论元角色,构成论元角色集合;针对不同的论元,设计不同的问题模板; S2:问答对的生成,将事件抽取转化为机器阅读理解,根据S1步骤中设计好的模板生成问题; S3:将给定的句子和生成的问题输入到基于端到端机器阅读理解的联合事件检测抽取的模型中;所述模型包括四个部分:编码、事件分类器、机器阅读器和联合训练; S4:启发式后处理; 所述步骤S3具体包括以下步骤: S3.1:将输入到模型中的句子、问题进行拼接,并进行嵌入式编码; S3.2:通过事件分类器预测给定句子的事件类型; S3.3:在机器阅读器中,利用由粗粒度到细粒度的注意力机制计算事件类型和论元角色之间的关联关系,基于关联关系的计算结果对答案进行预测,之后将答案转化为抽取出的论元; S3.4:状态感知的联合训练,即将事件分类器和机器阅读器进行联合训练; 所述步骤S3.3具体包含以下步骤: S3.3.1:利用由粗到细的注意力机制来抽取事件类型和论元角色之间的关联关系; 其中,粗粒度的注意力机制作用于步骤S3.2中事件分类器输出的结果,以使模型能够关注特定的事件类型,粗粒度的注意力机制通过一个线性层实现,作为事件分类器的输出,粗粒度的注意力计算如下: 式中,和是可训练参数; 接着,将粗粒度的注意力的输出结果和BERT编码的语义表示,输入到细粒度的注意力机制中,计算事件类型和输入句子中每个词向量的相似度: 其中,是可训练参数,是由注意力机制计算的权重参数,是句子中词的数量,是激活函数,是通过BERT编码器编码的第个词的词向量 所述步骤S3.3还包含以下步骤: S3.3.2:将事件抽取转化为机器阅读理解任务后,通过回答问题的方式来抽取句子中的论元,机器阅读理解模型的答案预测方式为预测答案开始和结束位置的概率,其中,答案预测器采用Softmax来计算最终输出,选用交叉熵损失作为机器阅读器的损失函数,机器阅读理解的损失计算如下: 其中,是训练样本的数量,分别代表样本正确的开始和结束位置,表示开始位置的概率,表示结束位置的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:210007 江苏省南京市秦淮区后标营18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励