山西大学陈千获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山西大学申请的专利一种基于双图的层次特征融合的文档级命名实体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115906846B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211406499.7,技术领域涉及:G06F40/295;该发明授权一种基于双图的层次特征融合的文档级命名实体识别方法是由陈千;关春祥;王素格;郭鑫设计研发完成,并于2022-11-10向国家知识产权局提交的专利申请。
本一种基于双图的层次特征融合的文档级命名实体识别方法在说明书摘要公布了:本发明属于自然语言处理技术领域,公开了一种基于双图的层次特征融合的文档级命名实体识别方法。该方法首先从文档的不同层次出发构建词级图和句子级图;接着采用不同的节点更新策略对图节点进行更新,分别获得融合文档全局信息的词节点向量表示和句子节点向量表示;然后将词节点向量表示和其对应的句子节点向量表示进行拼接,得到最终的词向量表示;最后将最终的词向量表示输入序列标注模型中预测实体标签。通过与现有文档级命名实体识别方法进行对比,本发明从不同层次提取了文档的全局信息,进一步提高了命名实体识别的准确率。
本发明授权一种基于双图的层次特征融合的文档级命名实体识别方法在权利要求书中公布了:1.一种基于双图的层次特征融合的文档级命名实体识别方法,其特征在于,所述方法包括以下步骤: 步骤1,将文档数据利用不同的方法分别得到字符向量表示和词向量表示; 步骤2,通过双向长短期记忆网络获取词的上下文信息表示; 步骤3,根据文档结构分别构建词级图和句子级图; 步骤4,根据不同的图节点更新策略对构建的双图进行更新,分别获得融合文档全局信息的词节点向量表示和句子节点向量表示; 步骤5,融合句子节点和词节点的信息,生成具有多个层次文档特征的词向量表示; 步骤6,根据序列标注的原理,首先通过双向长短期记忆网络对融合后的词向量进行编码,充分获取文档信息,然后使用条件随机场获得最佳的标签序列,完成文档级命名实体识别任务; 所述步骤4的具体过程为: 步骤4.1,相邻句子之间存在关系的概率较大,因此句子级图采用图卷积神经网络更新节点,图卷积神经网络可以通过聚合邻居节点更新节点信息,对于第l层句子节点,第l+1层句子节点更新方式定义为: 5 式5中为句子级图的邻接矩阵,为第l层可训练的参数,表示sigmoid函数,是一种非线性激活函数; 步骤4.2,由于相同的实体可能出现在文档的任何位置,需要词节点学习远距离的节点信息,因此词级图通过重复混合不同距离的邻居节点特征表示学习远距离节点信息,对于第l层词节点,第l+1层词节点更新方式定义为: 6 7 8 9 式6-8中表示词级图的邻接矩阵,表示两个词级图的邻接矩阵相乘,表示三个词级图的邻接矩阵相乘,为第l层可训练的参数,表示更新后的一阶词节点矩阵表示,表示更新后的二阶词节点矩阵表示,表示更新后的三阶词节点矩阵表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励