Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学雷建军获国家专利权

重庆邮电大学雷建军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利命名实体识别模型的双级对比学习训练方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119599020B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411774763.1,技术领域涉及:G06F40/295;该发明授权命名实体识别模型的双级对比学习训练方法及相关装置是由雷建军;陈颖辉设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。

命名实体识别模型的双级对比学习训练方法及相关装置在说明书摘要公布了:本发明属于自然语言处理领域,涉及一种命名实体识别模型的双级对比学习训练方法及相关装置;所述方法包括获取第一训练文本语句;通过预训练后的第一命名实体识别模型处理,得到是否为实体向量的分类结果;对具有实体向量的第一训练文本语句打标,得到第二训练文本语句;通过预训练后的第二命名实体识别模型处理,得到第二训练文本语句的实体类型;通过每个实体类别标签的原型向量与相应第二训练单词特征之间的对比距离,以及各个第二训练单词特征之间的对比距离,计算得到双级对比学习损失;基于双级对比学习损失对命名实体识别模型的参数调整后继续进行训练,得到训练完成的第二命名实体识别模型;本发明通过两阶段的命名实体识别模型降低了每一步的分类难度。本发明的双级对比学习,减轻模型分类时误判率。

本发明授权命名实体识别模型的双级对比学习训练方法及相关装置在权利要求书中公布了:1.一种命名实体识别模型的双级对比学习训练方法,其特征在于,所述方法包括: 获取第一训练文本语句; 通过预训练后的第一命名实体识别模型对所述第一训练文本语句处理,得到第一训练单词特征是否为实体向量的分类结果;所述第一命名实体识别模型包括第一编码器和第一分类器; 通过对具有实体向量的所述第一训练文本语句打标,得到第二训练文本语句;所述第二训练文本语句具有第二实体类别标签,所述第二实体类别标签用于指示所述第二训练文本语句的训练单词的类别; 通过预训练后的第二命名实体识别模型对所述第二训练文本语句处理,得到所述第二训练文本语句的实体类型;所述第二命名实体识别模型包括第二编码器和softmax层;通过所述第二编码器提取每个第二实体类别标签的原型向量以及所述第二训练文本语句的第二训练单词特征;通过所述softmax层计算每个第二训练单词特征与相应第二实体类别标签的原型向量之间的距离,得到第二训练文本语句的每个第二训练单词特征的实体类型; 通过每个实体类别标签的原型向量与相应第二训练单词特征之间的对比距离,以及各个第二训练单词特征之间的对比距离,计算得到双级对比学习损失; 基于所述双级对比学习损失对所述命名实体识别模型的参数调整后继续进行训练,直至模型训练结束,得到训练完成的第二命名实体识别模型; 得到每个第二实体类别标签的原型向量的过程包括: 通过大语言模型或者词典去检索所述第二实体类别标签的近义词或和子领域词; 将每个所述第二实体类别标签及其近义词或和子领域词分别构成相应的自然语言词语集合; 将所述自然语言词语集合中的每个词语分别作为所述第二实体类别标签的扩充实体类别标签; 将所述第二实体类别标签的扩充实体类别标签分别通过所述第二编码器,得到所述第二实体类别标签的原型向量; 得到每个第二实体类别标签的原型向量的过程还包括: 获取多个携带第四实体类别标签的第四训练文本语句;所述第四实体类别标签用于指示所述第四训练文本语句的第四训练单词的类别; 将所述第四训练文本语句通过第二编码器,得到所述第四训练文本语句的第四训练单词特征; 若所述第二实体类别标签与所述第四实体类别标签相同,则将所述第四训练单词特征与所述第二实体类别标签的原型向量叠加,得到更新后的每个第二实体类别标签的原型向量; 更新后的每个第二实体类别标签的原型向量的计算方式表示为: 其中,表示更新后的第j个类别的第二实体类别标签的原型向量,λ1是一个超参数,n表示第二实体类别标签的自然语言词语集合中词语数量,wi表示第二实体类别标签的自然语言词语集合中第i个词语;表示第二编码器,Zj是指第四训练文本语句的第j个类别的第四实体类别标签与第二实体类别标签相同的词语,z表示Zj中的词; 所述通过所述softmax层计算每个第二训练单词特征与相应第二实体类别标签的原型向量之间的距离,得到第二训练文本语句的每个第二训练单词特征的实体类型所采用的计算公式表示为: 其中,ypred表示第二训练文本语句的每个第二训练单词特征的实体类型,hi表示第二单词训练单词特征,T表示所有类别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。