燕山大学宫继兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉燕山大学申请的专利一种基于解耦表征和异构图软硬注意力网络的消歧方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115455971B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211128279.2,技术领域涉及:G06F40/295;该发明授权一种基于解耦表征和异构图软硬注意力网络的消歧方法是由宫继兵;彭吉全;房小涵;赵金烨;林宇庭设计研发完成,并于2022-09-16向国家知识产权局提交的专利申请。
本一种基于解耦表征和异构图软硬注意力网络的消歧方法在说明书摘要公布了:本发明涉及一种基于解耦表征和异构图软硬注意力网络的消歧方法,属于学术数据库构建的实体消歧技术领域,包括以下步骤:S1、数据清洗及预处理;S2、论文实体表征学习,使用语言预训练模型OAG_BERT获得论文的初步表征;S3、解耦表征,使用变分自编码模型加正则化项的方式对论文表征进行特征解耦;S4、论文初始化聚类;S5、异构图实体对齐,构建论文和作者信息异构图,采用软、硬注意力网络对异构图进行实体对齐;S6、获得论文消歧结果。本发明解决了传统消岐方法在实际应用过程中产生的错误分配问题,提高了实体表征能力,提高了消岐算法的性能。
本发明授权一种基于解耦表征和异构图软硬注意力网络的消歧方法在权利要求书中公布了:1.一种基于解耦表征和异构图软硬注意力网络的消歧方法,其特征在于,包括以下步骤: S1、数据清洗及预处理,将论文数据存入非结构化数据库MongoDB,删除数据中的重复值,按照一定规则对缺失值进行补全,同时对命名不一致的属性进行一致化处理; S2、论文实体表征学习,使用语言预训练模型OAG_BERT获得论文的初步表征; S3、解耦表征,使用变分自编码模型加正则化项的方式对论文表征进行特征解耦; S4、以准确率为原则,对论文进行初始化聚类; S5、异构图实体对齐,构建论文和作者信息异构图,采用软、硬注意力网络对异构图进行实体对齐; 所述S5包括: S51、为名称相同的作者实体生成候选对; S52、对于每一个作者实体,构建异构图,如果候选对之间的机构、合著者名称相同或者论文相似,则相互连接,得到异构图GV,E; S53、利用异构图软硬注意力网络确定作者实体匹配; 所述S53包括: S531、通过S3得到每一个论文实体的语义嵌入,构建异构图进行训练,得到每个实体的结构嵌入; S532、将语义嵌入和结构嵌入两种嵌入合并在一起作为输入特征f,通过self_attention求出不同作者实体e之间的重要性,此过程描述为: tij=self_attentionWfi,Wfj 其中,W为共享的权重矩阵,对于每一个为ei的所有邻居节点;其中归一化注意力系数如下: 为可训练参数; S533、实体e的最终表示是其聚合邻居特征的结果,此过程表示为: 其中,σ为激活函数,为ei的邻居节点; S534、为了解决注意力值的非零问题,提出结合硬注意力的方式聚合特征: 其中,是实体e的邻居节点个数,|E1|是簇1中所有的实体,是含有临边hi,ri的实体数量; S54、最终实体及损失函数为: efinal=LeakReluWeHGAT||ehard 其中,eHGAT为异构图自注意力网络聚合的实体e的表示,ehard为异构图硬注意力机制聚合的实体e的表示; 其中,d为欧式距离,η为margin值以保证loss值大于0; S6、获得论文消歧结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人燕山大学,其通讯地址为:066004 河北省秦皇岛市海港区河北大街438号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励