讯飞智元信息科技有限公司;科大讯飞股份有限公司倪修峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉讯飞智元信息科技有限公司;科大讯飞股份有限公司申请的专利实体识别模型训练方法、实体识别方法、装置及相关设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114936558B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210799507.2,技术领域涉及:G06N3/0985;该发明授权实体识别模型训练方法、实体识别方法、装置及相关设备是由倪修峰;曹伟灿;范磊;施昀;张友国;刘江;吕军;胡少云设计研发完成,并于2022-07-08向国家知识产权局提交的专利申请。
本实体识别模型训练方法、实体识别方法、装置及相关设备在说明书摘要公布了:本申请公开了一种实体识别模型训练方法、实体识别方法、装置及相关设备,通过从知识图谱中进行游走采样,得到由五元组序列组成的至少一条游走路径,可以基于游走路径中的五元组序列生成对应的训练语句。对训练语句中的实体、关系名和或概念进行掩码,得到掩码语句,以预测掩码语句中被掩码的字符为目标训练语言模型。进一步可以对训练语句中的实体位置进行标注,并以标注有实体位置的训练语句作为训练数据,由此可以在不依赖人工标注的情况下,得到大量的领域标注数据,同时能够减少错标、漏标等噪声,进而利用训练数据对语言模型进行微调,得到调整后的实体识别模型,用于处理目标领域下的实体识别任务,实现了实体识别任务的冷启动。
本发明授权实体识别模型训练方法、实体识别方法、装置及相关设备在权利要求书中公布了:1.一种实体识别模型训练方法,其特征在于,包括: 获取目标领域的知识图谱; 在所述知识图谱中选择至少一个节点,作为起始节点;对于每一起始节点,按照采样策略,在所述知识图谱的节点间沿有向边以不同概率进行转移,节点每经过一次转移,根据转移前后的两个节点及有向边生成一个五元组,每次转移时,由当前节点转移至任一邻居节点的概率,根据当前节点之前游走过节点与所述邻居节点间的距离,和当前节点与所述邻居节点间的语义关系确定;其中,根据当前节点之前游走过节点与所述邻居节点间的距离,和当前节点与所述邻居节点间的语义关系,确定由当前节点转移至任一邻居节点的概率,包括:根据当前节点的上一节点与所述邻居节点间的距离,确定当前节点转移至所述邻居节点的第一转移得分;对于当前节点的任一目标邻居节点:确定当前节点与所述目标邻居节点的语义关系,得到目标关系名,统计当前节点的所有邻居节点中,与当前节点具备所述目标关系名的邻居节点的总个数,基于所述总个数、所述当前节点的所有邻居节点的个数及第三超参数,确定当前节点转移至目标邻居节点的第二转移得分,其中,所述总个数越大,所述第二转移得分越小,保证节点沿着语义明确的关系进行转移,第三超参数越大,游走路径越倾向于沿着语义明确的关系转移;根据所述第一转移得分,和第二转移得分,确定当前节点转移至所述邻居节点的总转移得分;基于所述总转移得分,确定由当前节点转移至任一邻居节点的概率; 将生成的五元组添加到与起始节点对应的游走路径中,直至游走路径的长度达到设定长度为止,得到与每一起始节点对应的游走路径,每一游走路径中包含五元组序列,序列中的每一五元组包括头实体及其概念、尾实体及其概念、头实体和尾实体间的关系名; 对于每一条游走路径,基于其中包含的五元组序列生成对应的训练语句; 对所述训练语句中的实体、关系名和或概念进行掩码,得到掩码语句,以预测所述掩码语句中被掩码的字符为目标,训练语言模型; 对所述训练语句中的实体位置进行标注,并以标注有实体位置的训练语句作为训练数据,对训练后的语言模型的网络参数进行微调,得到调整后的实体识别模型,用于处理所述目标领域下的实体识别任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人讯飞智元信息科技有限公司;科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号讯飞大厦8层-10层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励