匀熵智能科技(无锡)有限公司孙俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉匀熵智能科技(无锡)有限公司申请的专利基于正负向联合学习和原型表示的远程监督关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115630164B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211258264.8,技术领域涉及:G06F16/36;该发明授权基于正负向联合学习和原型表示的远程监督关系抽取方法是由孙俊设计研发完成,并于2022-10-14向国家知识产权局提交的专利申请。
本基于正负向联合学习和原型表示的远程监督关系抽取方法在说明书摘要公布了:基于正负向联合学习和原型表示的远程监督关系抽取方法,属于关系提取领域。该方法通过正负向联合学习训练句子级别的远程监督关系抽取模型,在分离噪声数据的同时加快收敛。此外,本发明将关系标签和实体类型之间的语义依赖关系构造为约束图,并使用面向关系原型的辅助损失进行优化,促进不同关系之间的信息传递,使得模型可以学习本质的、可解释的句子表示。除了识别噪声数据,本发明还对噪声数据的关系标签进行修正,在迭代中改进数据集的质量,进一步提高模型性能。实验结果表明,该方法在句子级关系抽取和降噪方面都比之前的方法有显著的改进。
本发明授权基于正负向联合学习和原型表示的远程监督关系抽取方法在权利要求书中公布了:1.基于正负向联合学习和原型表示的远程监督关系抽取方法,其特征在于,构建PNPRE模型,首先初始化句子编码器、约束图编码器和关系分类器,然后使用正负向联合学习和面向关系原型的学习进行训练,再使用噪声过滤策略和重新标记策略修正原始数据集;具体步骤如下: 1统计训练集中的关系和实体类型对应关系,构建约束图; 2向模型中输入数据集,记为D,数据集中的每个实例包含句子、实体对和实体类型以及远程监督标签y,设输入的句子为s={w1,w2, …, wn},头实体位置为p1,尾实体位置为p2,头实体类型为t1,尾实体类型为t2; 3对单词进行Embedding编码; 4对单词与头尾实体的相对位置进行Embedding编码; 5将步骤3和步骤4的Embedding编码进行拼接得到句子Embedding编码; 6将步骤5得到的句子Embedding作为输入,使用PCNN提取句子特征,得到句子表示; 7使用两层GCN对步骤1中的约束图进行编码,得到约束图Embedding,约束图节点的Embedding即为关系和实体类型的Embedding; 8根据约束图Embedding得到头尾实体类型的Embedding,并使用ReLU激活; 9将步骤6的句子表示和步骤8的实体类型表示进行拼接; 10将步骤9得到的表示输入两层全连接层和最后的softmax函数,得到各个类别的概率分布预测,最大概率对应的类别即为分类结果; 11使用正负向联合学习损失函数对步骤10的预测值与真实值计算损失; 12根据约束图Embedding得到标签y对应的关系的 Embedding,对步骤6得到的句子表示,以及标签y对应的关系的 Embedding,通过面向关系原型的学习损失函数计算损失; 13通过Adam优化器,使用步骤11和步骤12计算的损失训练模型; 14使用噪声过滤策略将数据集中可能的噪声实例过滤出来,组成噪声实例集合,记为N,其余实例组成可靠实例集合D‑N; 15使用重新标注策略对步骤14过滤出的噪声实例重新分配标签,记为N’; 16步骤14中的D‑N与步骤15中的N’共同组成新的数据集D’; 17将步骤16得到的新数据集作为输入,重复步骤2~步骤16,直至达到训练停止条件;所述的面向关系原型的学习:关系原型抽取了关系最本质的语义,并且的嵌入与表达了该关系的句子的嵌入处于同样的语义空间;在远程监督关系抽取方法中,关系原型的嵌入由对关系进行编码后通过一个线性映射得到: ;同样地,由句子编码器输出的句子嵌入也通过一个线性变换映射到与一致的空间: ;表达了关系的句子也被称为关系的陈述,基于“关系的陈述应该尽可能地靠近的原型,并且尽可能地远离其他关系原型”这样的观点,在训练过程中,远程监督关系抽取方法中向式7中加入了一个辅助损失来训练面向原型的模型: ; 其中和反映了陈述和原型之间的偏差,通过下式计算: ; 式12中的相似性度量定义为: ; 远程监督关系抽取方法中在原型级别使用了一个额外的分类器,其参数通过下式优化: ; 总体而言,最终的损失函数由两部分组成: ; 其中决定了的比重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人匀熵智能科技(无锡)有限公司,其通讯地址为:江苏省无锡市经济开发区金融二街8号1603-12室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励