复旦大学邱锡鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉复旦大学申请的专利基于不确定成分的中文命名实体识别检索增强框架获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116663559B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210147274.8,技术领域涉及:G06F40/295;该发明授权基于不确定成分的中文命名实体识别检索增强框架是由邱锡鹏;耿志超;颜航设计研发完成,并于2022-02-17向国家知识产权局提交的专利申请。
本基于不确定成分的中文命名实体识别检索增强框架在说明书摘要公布了:本发明提供一种基于不确定成分的中文命名实体识别检索增强框架,由于包括命名实体识别模型,能够对输入的中文序列进行不确定成分采样,并基于采样得到的实体集不确定成分进行检索,因此相较于传统的依赖于词典的方法,能够有效地检索得到所需的知识序列,且无需花费高昂的代价进行高质量词典的构建以及动态维护,节省了大量算力,进一步,由于包括知识融合模型,能够基于检索得到的知识序列进行中文命名实体的识别预测,因此能够通过知识序列消除识别过程中的歧义,得到更为准确的预测结果,且相较于传统的采用遍历策略进行检测的方法,效率更高。综上所述,通过本发明的增强框架,能高效地得到准确的中文命名实体识别结果,且能节省大量算力。
本发明授权基于不确定成分的中文命名实体识别检索增强框架在权利要求书中公布了:1.一种基于不确定成分的中文命名实体识别检索增强方法,其特征在于,包括: 通过命名实体识别模型对输入序列进行不确定成分采样,得到实体集不确定成分,并基于所述实体集不确定成分进行检索,得到知识序列;以及 通过知识融合模型基于所述知识序列对所述输入序列进行预测,得到实体识别结果,该实体识别结果为若干个中文命名的集合, 其中,所述命名实体识别模型采用基于蒙特卡洛dropout的方法进行所述不确定成分采样,包括以下步骤: 步骤S1-1,将所述输入序列输入所述命名实体识别模型进行预测,并进行维特比解码,得到预测标签序列Lp,所述预测标签序列Lp为预测的实体集合; 步骤S1-2,开启dropout,再将所述输入序列输入所述命名实体识别模型进行预测,并进行维特比解码,得到候选序列Lc,所述候选序列Lc为预测的所述实体集合的差; 步骤S1-3,将所述实体集合和所述实体集合的差均计作不确定实体,合并所有交叠或临接的所述不确定实体,得到所述实体集不确定成分, 所述命名实体识别模型采用基于Top-K标签序列的方法进行所述不确定成分采样,包括以下步骤: 步骤S2-1,所述命名实体识别模型对所述输入序列进行预测,得到标签概率分布; 步骤S2-2,对所述标签概率分布采用维特比解码变体,得到所述Top-K标签序列,作为所述预测标签序列Lp,将所述输入序列中的其余部分作为所述候选序列Lc,所述预测标签序列Lp为预测的实体集合,所述候选序列Lc为预测的所述实体集合的差; 步骤S2-3,将所述预测标签序列Lp中和所述候选序列Lc的差异在一个标签内的序列过滤去除; 步骤S2-4,将所述实体集合和所述实体集合的差均计作不确定实体,合并所有交叠或临接的所述不确定实体,得到所述实体集不确定成分, 将所述知识序列与所述输入序列拼接得到融合知识的输入序列,并将所述融合知识的输入序列与所述预测标签序列Lp嵌入为稠密向量并相加后输入所述知识融合模型,从而得到所述实体识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励