北京邮电大学刘雅琼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京邮电大学申请的专利基于提示的实体级自回归关系三元组抽取模型训练方法、抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120216981B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510198000.5,技术领域涉及:G06F18/214;该发明授权基于提示的实体级自回归关系三元组抽取模型训练方法、抽取方法及装置是由刘雅琼;蒋元禛;王西点;吕哲;李周原设计研发完成,并于2025-02-21向国家知识产权局提交的专利申请。
本基于提示的实体级自回归关系三元组抽取模型训练方法、抽取方法及装置在说明书摘要公布了:本发明提供一种基于提示的实体级自回归关系三元组抽取模型训练方法、抽取方法及装置,针对单实体重叠、实体对重叠和分段实体等复杂场景,采用扩展BIO标签机制构建训练样本集,对句子中的多个实体段按不同实体类型添加标签,区分起始token、内部token和非实体token。利用BERT编码器与分类器构建初始神经网络模型,在单步自回归抽取中,模型输入句子、关系类型及已提取实体对,针对不同关系类型通过多轮自回归逐个预测实体对及其关系。训练时采用标签平滑技术,结合交叉熵损失函数更新参数,优化抽取性能。该方法可高效标注分段实体,基于多轮自回归预测实体,有效解决分段实体复杂情况下的关系三元组提取问题。
本发明授权基于提示的实体级自回归关系三元组抽取模型训练方法、抽取方法及装置在权利要求书中公布了:1.一种基于提示的实体级自回归关系三元组抽取模型训练方法,其特征在于,该方法包括以下步骤: 获取多个样本,各样本为源于目标主题环境的句子,所述句子表示为一个token序列;各样本中包含多个关系三元组,所述关系三元组包含主体、客体及其之间的关系,所述主体和所述客体作为实体由一个或多个实体段组成,所述实体段是句子中含有一个或多个连续token的子序列;一个样本中所述关系三元组之间或之内存在单实体重叠、实体对重叠、分段实体三种情况;所述单实体重叠表示两个关系三元组之间存在一个实体相同,所述实体对重叠表示两个关系三元组之间实体相同关系不同,所述分段实体表示关系三元组内存在由多个相互不连续且不重叠的实体段组成的实体; 对各样本中句子的每个token添加标签构建训练样本集,所述标签区分实体段起始token、实体段内部token和其他非实体token; 获取初始神经网络模型,包括BERT编码器和分类器;所述初始神经网络模型在单步抽取过程中,以所述句子,以及添加在句尾的关系类型和已提取到的实体对为输入并输出下一个实体对,所述初始神经网络模型按多个所述关系类型实施多轮自回归逐个提取实体对的预测结果;根据所述预测结果和所述标签在执行标签平滑的基础上构建交叉熵损失函数,利用训练样本集对所述初始神经网络模型进行参数更新,得到目标关系三元组抽取模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励