重庆邮电大学耿道渠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利基于BERT和图对比学习的异构本体匹配方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119719802B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411877818.1,技术领域涉及:G06F18/22;该发明授权基于BERT和图对比学习的异构本体匹配方法及系统是由耿道渠;罗杰;魏旻;王平设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本基于BERT和图对比学习的异构本体匹配方法及系统在说明书摘要公布了:本发明涉及一种基于BERT和图对比学习的异构本体匹配方法及系统,属于语义web和深度学习相结合的领域。本发明通过语义特征提取模块提取本体内部三元组信息构建语料库,将语料库输入BERT模型微调参数,利用微调后的BERT模型生成实体的语义特征向量;再通过图对比学习模块依据本体图的拓扑结构执行图采样,产生两个视图。通过选定正负样本并设定损失函数实施训练,生成实体综合特征向量;最后采用相似度计算模块计算不同实体对的最终相似度得分。本发明能够有效地利用本体图的拓扑结构来提取结构特征,克服了传统结构特征无法充分表达实体间复杂结构关系的问题,提升了匹配的准确性。
本发明授权基于BERT和图对比学习的异构本体匹配方法及系统在权利要求书中公布了:1.一种基于BERT和图对比学习的异构本体匹配方法,其特征在于:所述方法包括以下步骤: S1、读取本体文件,将本体文件中的资源描述框架RDF转换为有向无环图,遍历每个节点以构建本体语料库; S2、根据本体语料库对BERT模型进行微调优化,通过微调优化后的BERT模型输出实体语义特征向量; S3、将语义特征向量作为节点特征向量,通过图采样策略和图编码方式,得到最终结构嵌入; S4、构建两种视图,选择正负样本对两种视图进行损失函数计算,通过最小损失函数优化编码器参数最终输出每个节点的综合向量表征; S5、使用余弦相似度距离公式计算实体对的相似度,得到最终相似度得分; 在步骤S2中,将微调优化后的BERT模型作为编码器,输入实体名称得到固定长度的向量,该向量即为实体语义特征;其中,对BERT模型进行微调优化的过程包括以下步骤: S21、对语料库中的句子序列进行预处理,预处理包括移除无关字符、文本分词; S22、对每个句子进行序列标记,表示为Q{q1,q2,...qN},同时为每个句子序列添加标签,标签包括[CLS]、[SEP]、[MASK]; S23、标记后的句子序列嵌入至预设长度的向量中,然后经过BERT模型中的若干个Transformer编码器进行转换,得到最终输出其中,L表示BERT的总层数,N表示元素的总个数; S24、通过遮盖训练MLM和下一句预测NSP的训练方式,对参数进行调整,得到微调优化后的BERT模型; 在步骤S3中,包括以下步骤: S31、将构建的有向无环图结构作为输入,同时将语义特征向量作为实体节点的特征向量; S32、通过随机破坏图的拓扑结构或节点特征来生成对比对象,以进行图采样,其中,图采样策略包括随机删除边策略以及属性遮罩策略; S33、采用Highway-GCN作为图编码器,通过不断聚集邻居节点信息来更新节点表示,进而得到最终结构嵌入; 在步骤S4中,将得到的两个视图表示为: 式中,表示原始本体图,分别表示随机删除边函数、随机属性遮掩函数,分别为第一个视图中的所有节点和第二个视图中的所有节点,分别为第一个视图和第二个视图中的节点之间的关系集,分别为第一个视图和第二个视图的特征矩阵; 随后,建立对比对象,包括正样本和负样本,其中,正样本包括:中的每个节点νi与在中与之对应的锚节点ui,视图中νi的邻居节点,以及视图中锚节点ui的邻居节点;负样本包括:同一视图中νi的非邻居节点以及,另一视图中ui的非邻居节点; 定义对比损失: 其中表示vi的邻居节点个数,表示ui的邻居节点个数,θ·表示向量内积,τ表示温度系数,i,j分别表示不同的节点下标; 以总体对比损失最小化为目标,其中,总体对比损失定义为所有正样本对的平均值,如下式: 通过最小化等式损失目标来更新编码器的参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励