合肥工业大学李永瑞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利一种面向多语种自然场景文本图像的结构化信息抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119516563B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411631527.4,技术领域涉及:G06V30/41;该发明授权一种面向多语种自然场景文本图像的结构化信息抽取方法是由李永瑞;高骏杰;吴慕遥;洪日昌设计研发完成,并于2024-11-15向国家知识产权局提交的专利申请。
本一种面向多语种自然场景文本图像的结构化信息抽取方法在说明书摘要公布了:本发明公开了一种面向多语种自然场景文本图像的结构化信息抽取方法,其步骤包括:1构建面向多语种自然场景文本图像信息抽取的数据集;2构建面向自然场景文本图像的多语种多模态信息抽取网络;3在多语种文本信息抽取数据集上,对多模态信息抽取网络的文本分支进行预训练;4训练面向自然场景文本图像的多语种多模态信息抽取网络;5利用训练好的多模态信息抽取网络对任意输入的多语种文本图像进行信息抽取,得到文本图像内视觉与语言信息的结构化知识表示。本发明可以在多语种的场景下,对输入的多语种自然场景文本图像进行信息抽取,深度理解文本图像内不同语种不同模态的信息,输出文本图像的结构化知识表示。
本发明授权一种面向多语种自然场景文本图像的结构化信息抽取方法在权利要求书中公布了:1.一种面向多语种自然场景文本图像的结构化信息抽取方法,其特征在于,包括以下步骤: 步骤1:获取多语种文本信息抽取数据集,其中,表示第i个多语种文本,表示结构化知识的语种,表示对应的结构化知识,表示中多语种文本的个数; 获取带标注的多语种自然场景文本图像集,其中,表示第j个多语种自然场景文本图像,表示结构化知识标注的语种,表示的结构化知识标注,表示中多语种自然场景文本图像的个数; 步骤2:构建面向多语种自然场景文本图像的结构化信息抽取网络,包括:一个文本分支,一个视觉分支,一个图像描述器,一个多模态信息抽取器; 所述文本分支,包括:1个多语种文本信息编码模块、1个Transformer模块,1个文本信息抽取模块; 所述视觉分支,包括:1个多语种图文检测与识别模块、1个多语种视觉信息编码模块、1个多语种文本信息编码模块、1个预训练的多模态Transformer模块; 所述多模态信息抽取器,包含:1个多模态信息融合模块、1个解码模块; 步骤3:将输入对结构化信息抽取网络中的文本分支进行预训练,得到预训练后的文本分支; 步骤4:将输入结构化信息抽取网络中进行训练,得到训练后的结构化信息抽取模型; 步骤5:使用训练后的结构化信息抽取模型对任意输入的多语种文本图像进行信息抽取,得到预测的结构化的知识表示,并作为信息抽取结果输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。