中国科学院上海高等研究院黄俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院上海高等研究院申请的专利实体和关系联合抽取方法及装置、存储介质和终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115374786B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211056456.0,技术领域涉及:G06F40/295;该发明授权实体和关系联合抽取方法及装置、存储介质和终端是由黄俊;吴慧妍;朱智聪设计研发完成,并于2022-08-30向国家知识产权局提交的专利申请。
本实体和关系联合抽取方法及装置、存储介质和终端在说明书摘要公布了:本发明公开了一种实体和关系联合提取方法及装置、存储介质和终端,其中方法使用了训练完成的联合抽取模型,其包括的词向量表示构建模块用于获取文本数据的最终词向量表示;候选实体表示构建模块用于获取最终候选实体表示集;实体分类模块用于获取最终候选实体表示集中每个最终候选实体表示所属实体类型的后验信息;关系表示构建模块用于基于每对实体对所对应的关系表示向量;关系分类模块用于获取每对实体对所属关系类型的后验信息。本发明对显式语义信息和隐式语义信息进行了充分挖掘,有助于模型深度理解实体语义并建立实体间关系,在关系抽取中考虑了全局语义信息和局部上下文长度信息,提升了模型的准确性。
本发明授权实体和关系联合抽取方法及装置、存储介质和终端在权利要求书中公布了:1.一种实体和关系联合提取方法,包括: 获取文本数据集,所述文本数据集包括多个文本数据; 基于训练完成的联合抽取模型,对所述文本数据集中每个所述文本数据进行联合抽取,以获取每个所述文本数据中的实体以及实体间的关系; 其中,所述联合抽取模型包括词向量表示构建模块、候选实体表示构建模块、实体分类模块、关系表示构建模块和关系分类模块; 所述词向量表示构建模块,用于基于预训练模型获取文本数据的第一词向量表示和实体全局语义表示,基于语义角色标注获取所述文本数据的第二词向量表示,并将所述第一词向量表示和第二词向量表示进行拼接,以获取所述文本数据的最终词向量表示; 所述候选实体表示构建模块,用于基于所述最终词向量表示获取增强实体隐式语义信息,基于所述增强实体隐式语义信息获取包含任意跨度的初步候选实体集,对所述初步候选实体集中所有所述初步候选实体分别进行最大池化操作,以获取聚合候选实体集,基于所述聚合候选实体集中聚合候选实体、聚合候选实体所属初步候选实体序列长度以及实体全局语义表示,获取最终候选实体表示集; 所述实体分类模块,用于基于所述最终候选实体表示集,通过分类函数获取所述最终候选实体表示集中每个所述最终候选实体表示所属实体类型的后验信息; 所述关系表示构建模块,用于将所述聚合候选实体集中所对应最终候选实体表示所属实体分类为非空的聚合候选实体表示两两进行组合,以形成实体对集,获取每对实体对的全局语义表示和局部语义表示,并基于每对实体对的全局语义表示、局部语义表示、局部序列长度以及实体对本体获取对应关系表示向量; 所述关系分类模块,用于基于每对实体对的关系表示向量,通过分类函数获取每对实体对所属关系类型的后验信息; 其中,所述局部序列长度为所述局部语义表示的序列长度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院上海高等研究院,其通讯地址为:201210 上海市浦东新区海科路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。