成都数之联科技股份有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都数之联科技股份有限公司申请的专利一种基于实体替换和悬浮标记的关系抽取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115935952B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211679832.1,技术领域涉及:G06F40/216;该发明授权一种基于实体替换和悬浮标记的关系抽取方法及系统是由请求不公布姓名;请求不公布姓名;请求不公布姓名;请求不公布姓名设计研发完成,并于2022-12-27向国家知识产权局提交的专利申请。
本一种基于实体替换和悬浮标记的关系抽取方法及系统在说明书摘要公布了:本发明提供一种基于实体替换和悬浮标记的关系抽取方法及系统,涉及自然语言处理领域,所述方法包括:对原始文本进行实体替换和悬浮标记处理,以得到检测文本;对检测文本进行语言特征提取处理,以得到特征向量;对特征向量进行向量拼接处理和语言特征提取处理,以得到实体关系得分向量;对实体关系得分向量进行关系标签的概率分布预测处理,以得到类别概率分布图;对类别概率分布图进行解码处理。本发明将待抽取关系的实体对替换为固定标记,使得关系的表达更加通用,解决了因实体对名称干扰引起的关系分类错误;同时,对实体对前后添加特殊表征,悬浮标记于句尾,解决了关系抽取过程中实体信息表征不够充分,导致的模型泛化性能差的问题。
本发明授权一种基于实体替换和悬浮标记的关系抽取方法及系统在权利要求书中公布了:1.一种基于实体替换和悬浮标记的关系抽取方法,其特征在于,所述方法包括以下步骤: 1对原始文本进行实体替换和悬浮标记处理,以得到检测文本; 其中,对原始文本进行实体替换和悬浮标记处理,以得到检测文本的流程如下: 1.1将原始文本输入实体识别模型,以得到所有的实体; 1.2将两个实体组成实体对,并且对实体对进行实体替换处理,即将实体对替换为实体类型标记的形式; 1.3对实体对进行悬浮标记处理,即在实体对前后添加特殊表征,并且将特殊表征悬浮标记于实体对的句尾,以得到检测文本; 2将检测文本输入预训练模型进行语言特征提取处理,以得到特殊标签的特征向量;其中,特殊标签包括实体替换和悬浮标记处理获得的标签; 其中,将检测文本输入预训练模型进行语言特征提取处理,以得到特殊标签的特征向量的流程如下: 2.1将检测文本从语义空间映射到向量空间; 2.2将向量空间的检测文本输入预训练模型进行语言特征提取处理,以得到特殊标签的特征向量; 3对特征向量进行向量拼接处理,以得到特征拼接向量,并且将特征拼接向量输入全连接神经网络进行语言特征提取处理,以得到实体关系得分向量; 其中,将特征拼接向量输入全连接神经网络进行语义特征提取处理,以得到实体关系得分向量的流程如下: 3.1将所有特殊标签的特征向量进行拼接处理,以得到一个特征拼接向量; 3.2将特征拼接向量输入全连接神经网络进行语义特征提取处理,以得到实体关系得分向量; 4将实体关系得分向量输入归一化指数函数进行关系标签的概率分布预测处理,以得到类别概率分布图; 其中,将实体关系得分向量输入归一化指数函数进行关系标签的概率分布预测处理,以得到类别概率分布的流程如下: 4.1将实体关系得分向量输入归一化指数函数,通过归一化指数函数预测关系类别标签的概率,并且基于关系类别标签的概率得到类别概率分布图; 4.2基于人工标注数据计算类别概率分布图的损失函数; 5对类别概率分布图进行解码处理,以得到关系类别标签; 其中,对类别概率分布图进行解码处理,以得到关系类别标签的流程如下: 5.1基于类别的概率分布图获取概率最大值位置,其中,概率最大值位置对应的关系类别标签即为预测的关系类别标签; 5.2对预测的关系类别标签解码处理,以得到关系类别标签,即实体对的关系。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都数之联科技股份有限公司,其通讯地址为:610000 四川省成都市武侯区锦绣街8号2层270号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励