浙江工业大学之江学院黄玉娇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学之江学院申请的专利一种用于低标注工业语料的知识图谱构建的关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120688598B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510779151.X,技术领域涉及:G06N5/022;该发明授权一种用于低标注工业语料的知识图谱构建的关系抽取方法是由黄玉娇;郑滋辉;杨旭华设计研发完成,并于2025-06-12向国家知识产权局提交的专利申请。
本一种用于低标注工业语料的知识图谱构建的关系抽取方法在说明书摘要公布了:一种用于低标注工业语料的知识图谱构建的关系抽取方法,首先,结合工业文本数据的上下文信息构建动态提示模板,引入语义协同机制增强模板标记间的语义关联;其次,结合特征对齐机制和分阶段课程学习,使模型能够逐步适应难度递增的多任务设置以及增强模型对语义差异的判别能力;最后,计算关系表征与标签表示的匹配概率,并通过交叉熵损失优化模型,预测最可能的关系类型。本发明充分利用了工业文本数据上下文的语义,结合分阶段的课程学习策略,使模型能够逐步适应关系抽取任务的复杂性,对标注数据规模要求低,关系抽取准确性高。
本发明授权一种用于低标注工业语料的知识图谱构建的关系抽取方法在权利要求书中公布了:1.一种用于低标注工业语料的知识图谱构建的关系抽取方法,其特征在于,首先,引入语义协同机制优化结合上下文信息构建的动态提示模板,其次,结合特征对齐与分阶段课程学习策略,使模型逐步适应任务难度并提升对语义差异的判别能力,最后,通过联合损失动态调整模型参数,利用收敛后的模型推理实体间关系; 所述关系抽取方法包括以下步骤: 步骤1、结合工业领域专业术语构建实体标注集,利用工业领域已有的术语词典构建实体识别模板,通过精确匹配的方式,从文本中提取出对应的头实体和尾实体,利用可训练的连续标识替代传统提示中的固定词构建动态提示,其中、代表已识别工业实体,,表示预训练模型词汇表,为可训练标记的个数,表示工业实体在工业文本数据上下文中可能存在的复杂语义关系; 步骤2、利用Word2Vec模型对工业实体进行词向量训练,获取与目标实体在语义上相近的词语,将前k个相关词的嵌入向量以及头实体嵌入、尾实体嵌入的均值初始化模板中的可训练标记的嵌入表示, ; 步骤3、将原始关系标签集合中的关系去除符号、释义为自然语言表述形式,得到关系描述集,与手工构建的提示构成新的关系标签序列,,将掩码位置嵌入作为答案词来构建连续答案空间, ; 步骤4、将动态提示与工业领域文本数据合并,为每个batch中样本数量,将合并后的序列通过编码器得到对应的词嵌入表示输入到预训练模型中,在掩码位置可得到掩码词的输出嵌入和分类前输出向量, ; ; 其中,是模型的输出投影矩阵,为偏置变量,为词汇表大小; 步骤5、将输入序列中随机掩盖一个标记得到掩码后序列,在提示模板掩码位置使用真实标签对应的答案词替换,构建新的输入序列,利用预训练语言模型去预测被掩盖的标记词,通过交叉熵损失最大化条件概率, ; ; 其中,是所有被遮盖位置的集合,表示二元交叉熵损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学之江学院,其通讯地址为:312030 浙江省绍兴市柯桥区越州大道958号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励