昆明理工大学相艳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于prompt打分的实体链接方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117272107B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311233705.3,技术领域涉及:G06F18/24;该发明授权一种基于prompt打分的实体链接方法是由相艳;郭俊辰;线岩团设计研发完成,并于2023-09-22向国家知识产权局提交的专利申请。
本一种基于prompt打分的实体链接方法在说明书摘要公布了:本发明涉及一种基于prompt打分的实体链接方法,属于语言处理技术领域。实体链接任务通常采用两阶段方法进行,在不同领域进行实体链接任务时,由于数据来源的特殊性,通常只能利用文本表征的相似度进行计算,忽略了提及词中上下文信息与知识库实体的相关性对实体链接任务的帮助。在此提出了一种基于Prompt打分的实体链接方法,该方法利用prompt句式将实体链接任务转化为一个二分类任务,使用自注意力机制融合上下文信息,并通过两阶段分数和选取链接实体的方法,在NCBI数据集,以及BC5CDR数据集上的实验结果表明,本发明提出的基于Prompt打分的实体链接方法是有效的。
本发明授权一种基于prompt打分的实体链接方法在权利要求书中公布了:1.一种基于prompt打分的实体链接方法,其特征在于,包括: 将提及词进行数据清洗,消除词汇缩写,以及拼写错误; 将知识库中实体E与文本中的提及词M向量化,并进行内积计算并获取分数最高的前20个知识库中实体作为候选实体; 再将候选实体与提及词进行prompt句式的构建,并拼接上下文信息作为模型输入送入到Bert模型中经过注意力机制后,获得输入序列中token最终的向量表示hi∈Rh,其中包含了该token与其他位置token的相互作用信息; 将位置标签cls处的向量hi∈Rh送入分类器模型获取prompt的正负概率,并获取预测为正的概率p作为概率分数最后将和通过调节超参α的大小进行加和计算得到最终的排序分数Sm,e,将分数Sm,e最高的实体作为最终的链接结果; 所述基于prompt打分的实体链接方法的具体步骤如下: Step1、进行了拼写检查,解决提及词中的拼写错误问题;同时,使用了Ab3P缩写解析;对于复合提及词,将复合提及词拆分为单独的提及词; Step2、在候选实体发现阶段,将TF-IDF稀疏表征和基于预训练语言模型的稠密表征相结合来计算提及词和实体的相似性;令提及词M与某个实体E的稀疏表征分别为和稠密表征分别为和 Step3、计算稀疏向量表征和的内积以及稠密表征和的内积并对两个内积值进行加和运算,获取第一阶段分数和并将分数从高到低排列获取前20个实体及其分数作为候选实体; Step4、利用从步骤Step3中获得的候选实体构建prompt句式并且拼接上下文信息作为Bert模型输入;将输入序列送入bert模型中达成向量化的目的,并通过自注意力机制,将输入序列的信息融合,经过多轮注意力机制处理后,获得输入序列中token最终的向量表示hi∈Rh; Step5、提取向量hi∈Rh中位置标签cls处的向量hc∈Rh,将hc送入到分类器中获取类别概率p,并使用交叉熵损失函数训练分类器模型,待完成prompt分类器训练,类别概率p作为第二阶段的相似性打分 Step6、将步骤Step3中的第一阶段分数和步骤Step5中的第二阶段分数进行加权求和,确定最终的排序,根据分值排序的高低确定与提及词M相链接的实体; 所述步骤Step4中包括如下内容: 采用prompt的思想将文本中的提及词M和实体库中的候选实体E结合起来构建提问句式,具体形式为: prompt:isthementionMsimilartotheentityE? 然后将提及词M、提及词的上下文context_left、context_right以及所构建的prompt组合为完整的输入序列;使用特殊字符cls来表示输入序列的开始,特殊字符sep来表示序列的分隔,以便将三部分信息拼接在一起;输入序列的形式如下:input:clscontextleftsepMsepcontextrightsepprompt。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励