中国科学院大学;中国科学院科技战略咨询研究院李建平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院大学;中国科学院科技战略咨询研究院申请的专利一种支持文本交叉覆盖的信息抽取方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114792086B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110105562.2,技术领域涉及:G06F40/12;该发明授权一种支持文本交叉覆盖的信息抽取方法、装置、设备和介质是由李建平;朱晓谦;吴登生设计研发完成,并于2021-01-26向国家知识产权局提交的专利申请。
本一种支持文本交叉覆盖的信息抽取方法、装置、设备和介质在说明书摘要公布了:本公开的实施例公开了信息抽取方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取目标文本;对目标文本中的每个字进行编码以生成字向量,得到字向量序列;确定字向量序列中的每个字向量对应的目标概率值组,得到目标概率值组序列;基于目标概率值组序列和标签组集,生成对象向量序列集;基于对象向量序列集和对象转移矩阵集,生成标签序列集;从目标文本中抽取出与标签序列集中的每个标签序列对应的对象信息,得到对象信息集。该实施方式实现了对有交叉信息的文本的信息抽取,为文本分析等应用场景提供了便利。
本发明授权一种支持文本交叉覆盖的信息抽取方法、装置、设备和介质在权利要求书中公布了:1.一种信息抽取方法,包括: 获取目标文本; 对所述目标文本中的每个字进行编码以生成字向量,得到字向量序列; 确定所述字向量序列中的每个字向量对应的目标概率值组,得到目标概率值组序列,其中,所述确定所述字向量序列中的每个字向量对应的目标概率值组,得到目标概率值组序列,包括:将所述字向量序列依次输入一个全连接层,得到初步降维的字向量序列;将所述初步降维的字向量序列输入一个下采样层,得到第二次降维后的字向量序列;将第二次降维后的字向量序列输入一个全连接层,得到第三次降维后的字向量序列;对第三次降维后的字向量序列中的每个字向量进行归一化处理以生成目标概率值组,得到目标概率值组序列,目标概率值表示字向量对应的字被赋予对应标签的概率; 基于所述目标概率值组序列和标签组集,生成对象向量序列集,包括:所述目标文本中的每个字对应一个目标概率值组,每个目标概率值对应一个标签,其中,目标概率值表示该字被判定为当前标签的概率,依次从目标概率值组序列中的每个目标概率值组中,选出目标标签组中的每个标签对应的目标概率值,得到目标标签组中的每个标签对应目标概率值序列,依次取标签对应的序列中的同样位置的目标概率值,组成一个三元组,将该三元组作为对象向量,由目标标签组的三个标签对应的三个序列,得到对象向量序列,其中,目标标签组为标签组集中的标签组,将所得到的对应所述标签组集中的各个标签组的对象向量序列确定为对象向量序列集; 基于所述对象向量序列集和对象转移矩阵集,生成标签序列集; 从所述目标文本中抽取出与所述标签序列集中的每个标签序列对应的对象信息,得到对象信息集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院大学;中国科学院科技战略咨询研究院,其通讯地址为:100049 北京市石景山区玉泉路(甲)19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励