浪潮电子信息产业股份有限公司赵雅倩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮电子信息产业股份有限公司申请的专利一种实体链接方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114841164B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210466937.2,技术领域涉及:G06F40/295;该发明授权一种实体链接方法、装置、设备及存储介质是由赵雅倩;徐聪;郭振华;范宝余;金良;刘璐;闫瑞栋设计研发完成,并于2022-04-29向国家知识产权局提交的专利申请。
本一种实体链接方法、装置、设备及存储介质在说明书摘要公布了:本申请涉及自然语言处理技术领域,公开了一种实体链接方法、装置、设备及存储介质,包括:获取与输入文本对应的实体提及、候选实体以及实体描述;构建包含实体提及与实体描述的第一融合序列和包含候选实体与输入文本的第二融合序列;利用第一模型计算实体提及的第一融合序列与第二融合序列的相似度,并根据相似度从候选实体中确定出实体提及的链接实体;第三模型为利用训练文本的实体提及训练样本的正样本和负样本通过对比学习的方式对采用对比损失函数的预训练模型进行训练得到。本申请在实体链接中融入实体描述信息,同时通过正负样本对比学习的方式训练模型来实现实体消歧,提高实体链接准确度以及在开放知识图谱上进行实体链接的性能。
本发明授权一种实体链接方法、装置、设备及存储介质在权利要求书中公布了:1.一种实体链接方法,其特征在于,包括: 将获取实体提及的第二模型、获取候选实体的第三模型和第一模型集成至一个模型,以得到对应的端到端整合模型;在进行模型训练时,通过对采用交叉熵损失函数的所述第二模型进行训练,并以训练后的所述第二模型的输出作为所述第一模型的输入对所述第一模型进行训练; 将输入文本输入至所述端到端整合模型,所述端到端整合模型依次经过所述第二模型、所述第三模型和所述第一模型处理后输出相应的相似度的过程包括: 通过第二模型获取与输入文本对应的实体提及、通过所述第三模型获取所述实体提及的候选实体以及所述候选实体的实体描述;构建包含所述实体提及与所述实体描述的第一融合序列和包含所述候选实体与所述输入文本的第二融合序列利用第一模型计算所述实体提及的所述第一融合序列与所述第二融合序列的相似度,并根据所述相似度从所述候选实体中确定出所述实体提及的链接实体; 其中,所述第一模型为利用训练文本的实体提及训练样本的正样本和负样本通过对比学习的方式对采用对比损失函数的预训练模型进行训练得到: 获取所述训练文本; 利用第二模型对所述训练文本进行实体提取得到与所述训练文本对应的所述实体提及训练样本,并通过第三模型确定出与所述实体提及训练样本对应的候选实体训练样本; 从所述候选实体训练样本中确定出正确实体和非正确实体以及相应的实体描述训练样本; 将由所述实体提及训练样本与正确实体的实体描述训练样本组成的序列确定为第一正样本序列并将由正确实体与所述训练文本组成的序列确定为第二正样本序列,以及将由所述实体提及训练样本与非正确实体的实体描述训练样本组成的序列确定为第一负样本序列并将由非正确实体与所述训练文本组成的序列确定为第二负样本序列; 利用所述第一正样本序列、所述第二正样本序列、所述第一负样本序列和所述第二负样本序列通过对比学习的方式对采用对比损失函数的预训练模型进行训练得到所述第一模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮电子信息产业股份有限公司,其通讯地址为:250101 山东省济南市高新区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。