东南大学靳鸿祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于预训练语言模型的零样本知识图谱补全方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117273134B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311275705.X,技术领域涉及:G06N5/022;该发明授权一种基于预训练语言模型的零样本知识图谱补全方法是由靳鸿祥;伍家松;孔佑勇;杨冠羽;杨淳沨;董志芳;舒华忠设计研发完成,并于2023-09-28向国家知识产权局提交的专利申请。
本一种基于预训练语言模型的零样本知识图谱补全方法在说明书摘要公布了:本发明公开了一种基于预训练语言模型的零样本知识图谱补全方法,具体包括以下步骤:1、知识图谱数据预处理,从知识图谱中采样零样本知识图谱补全数据集,进一步获取关系的描述语句以及关系的所有三元组中实体和关系文本信息组成的三元组文本语句;2、利用预训练语言模型Sentence‑BERT进行微调,学习关系描述语句的向量表示以及三元组文本语句的向量表示;3、利用零样本知识图谱验证集进行验证,调整到最佳网络参数;4、利用零样本知识图谱测试集进行测试,统计模型效果;该方案充分发挥预训练语言模型的能力,能够达到需要额外利用邻居实体信息的方法相同的效果。
本发明授权一种基于预训练语言模型的零样本知识图谱补全方法在权利要求书中公布了:1.一种基于预训练语言模型的零样本知识图谱补全方法,其特征在于,具体步骤如下: 步骤1:首先将不同领域的知识图谱预处理为八个文件,所述处理后的文件包括知识图谱关系训练集、知识图谱关系验证集、知识图谱关系测试集、知识图谱三元组文件、实体文本文件、关系文本文件、关系描述文本文件以及关系候选实体文件, 步骤2:将步骤1得到的知识图谱关系训练集、知识图谱关系验证集和知识图谱关系测试集构建对应的文本文件,通过步骤1得到的关系候选实体文件,为知识图谱关系训练集、验证集和测试集中各自所包含关系对应的三元组构建候选三元组,遍历步骤1得到的知识图谱三元组文件保证候选三元组没有在知识图谱中出现过,最终将知识图谱关系训练集、验证集和测试集所包含的关系描述语句和候选三元组文本语句构建成对应的文本语句对, 步骤3:将步骤2得到的知识图谱关系训练集的文本语句对输入到Sentence-BERT模型,直接将语句对输入到Tokenizer层,采用BertTokenizer将文本语句分成若干个子词,获取InputEmbedding,送入BertModel模型,将输出的词向量送入池化层,采用平均池化策略,获取向量维度为384的句向量,进行L2归一化,输出归一化后的句向量, 步骤4:计算步骤3模型输出的正样本语句对和负样本语句对的句向量之间的余弦距离,按照选择相对困难判定语句对标签的策略选择每个批次中用于训练的语句对,通过损失函数计算损失,使用每个批次数据的损失来进行迭代优化, 步骤5:用知识图谱验证集进行校验,调整到最佳网络参数, 步骤6:对知识图谱测试集进行测试,统计测试结果,通过利用MRR,HIT1,HIT5,HIT10评价指标对模型进行评估。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。