Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 厦门市美亚柏科信息股份有限公司涂自龙获国家专利权

厦门市美亚柏科信息股份有限公司涂自龙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉厦门市美亚柏科信息股份有限公司申请的专利一种五元组实体关系抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114297400B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111485360.1,技术领域涉及:G06F16/36;该发明授权一种五元组实体关系抽取方法及装置是由涂自龙;段思欣;许剑峰设计研发完成,并于2021-12-07向国家知识产权局提交的专利申请。

一种五元组实体关系抽取方法及装置在说明书摘要公布了:本发明公开一种五元组实体关系抽取方法,通过将文本语料进行实体关系标注得到标注数据,再将标注数据进行五元组化预处理,得到含有主体、主体类型、关系、客体和客体类形的五元组训练数据集,而后再通过含有五元组的训练数据集对深度学习模型进行训练得到关系抽取模型,从而当需要抽取文本数据内的信息时,能够通过关系抽取模型对文本数据进行抽取并得到对应的五元组数据,可以极大的提高实体关系抽取的召回率,同时也能保证较高的准确率,并且抽取出的数据更加多元化,从而提高文本关系提取的效果。

本发明授权一种五元组实体关系抽取方法及装置在权利要求书中公布了:1.一种五元组实体关系抽取方法,其特征在于,包括步骤: 获取文本语料; 对所述文本语料进行实体关系标注,得到标注数据; 对所述标注数据进行五元组化预处理,得到训练数据集;所述五元组包括主体、主体类型、关系、客体和客体类型; 通过所述训练数据集对深度学习模型进行训练,得到关系抽取模型; 获取待抽取文本数据; 根据所述关系抽取模型对所述待抽取文本数据进行抽取,得到所述待抽取文本的实体关系五元组; 通过所述训练数据集对深度学习模型进行训练,包括: 通过目标函数对所述训练数据集进行训练,所述目标函数为: ; 其中,Tj表示所述训练数据集中第j个句子的五元组,Tj={s,st,r,o,ot};D表示所述训练数据集,xj表示所述训练数据集中第j个句子;s表示所述主体、st表示所述主体类型、r表示所述关系、o表示所述客体、ot表示所述客体类型;通过上述目标函数对训练集进行训练,从五元组的级别进行优化,能够直接抽取实体关系五元组,并且通过s,st与r的映射函数来预测o,ot,通过级联二元指针标注框架来解决重叠实体与关系五元组的问题; 通过损失函数对所述训练数据集进行训练,所述损失函数为: LOSS=Lsub_heads+Lsub_tails+Lsub_type_heads +Lsub_type_tails+Lobj_heads+Lobj_tails +Lobj_type_heads+Lobj_type_tails; 其中,sub表示所述主体,obj表示所述客体,heads表示首位置,tails表示尾位置,L为二元交叉熵损失函数: ; 所述通过所述训练数据集对深度学习模型进行训练,得到关系抽取模型之前,还包括: 对所述训练数据集中带有实体关系的语句进行数据增强,得到新关系语句; 将所述新关系语句添加至所述训练数据集中; 所述对所述训练数据集中带有实体关系的语句进行数据增强,得到新关系语句包括: 将所述训练数据集中多组带有实体关系的语句进行组合合并,得到所述新关系语句; 所述对所述训练数据集中带有实体关系的语句进行数据增强,得到新关系语句还包括; 对多组所述带有实体关系的语句或多组所述新关系语句中相同类型的实体进行替换; 对多组所述带有实体关系的语句或多组所述新关系语句中的非实体部分进行同义词替换; 所述将所述新关系语句添加至所述训练数据集中包括; 设置阈值语句长度; 判断所述新关系语句是否小于所述阈值语句长度,若是,则将所述新关系语句添加至所述训练数据集中; 识别所述训练数据集中的每一语句的所述主体和主体类型; 根据所述主体和主体类型识别每一所述语句中与所述主体和主体类型对应的所述关系以及所述客体和客体类型;通过先识别训练数据集中的每一语句的主体和主体类型,再根据主体与主体类型识别与语句中与主体和主体类型对应的客体和客体类型,最后再根据识别到的主体和主体类型以及客体和客体类型识别所有主体和主体类型与客体和客体类型之间可能的关系,层层递进识别; 通过多步长的动态学习率衰减对所述训练数据集进行训练优化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门市美亚柏科信息股份有限公司,其通讯地址为:361000 福建省厦门市软件园二期观日路12号美亚柏科大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。