优顶特技术有限公司苏治获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉优顶特技术有限公司申请的专利基于OCR的票据信息识别方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118397642B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410653641.0,技术领域涉及:G06V30/412;该发明授权基于OCR的票据信息识别方法、装置、设备及存储介质是由苏治;丁军;张煜;陶旭光;喻祥;范耀军设计研发完成,并于2024-05-24向国家知识产权局提交的专利申请。
本基于OCR的票据信息识别方法、装置、设备及存储介质在说明书摘要公布了:本申请涉及文字识别技术领域,公开了一种基于OCR的票据信息识别方法、装置、设备及存储介质。所述方法包括:获取多个初始样本票据图像并进行信息标注,得到多个目标样本票据图像;通过初始OCR模型进行字符识别训练,得到多个样本票据文本数据和目标OCR模型;通过多个LayoutLMv3模型进行票据分类训练,得到票据信息分类模型;获取第一待识别票据图像并进行预处理,得到第二待识别票据图像;将第二待识别票据图像输入目标OCR模型进行文字识别,得到目标票据文本数据;将目标票据文本数据输入票据信息分类模型进行票据信息分类,得到票据信息分类结果,本申请采用OCR技术和LayoutLMv3模型,提高了票据信息识别和分类的准确率。
本发明授权基于OCR的票据信息识别方法、装置、设备及存储介质在权利要求书中公布了:1.一种基于OCR的票据信息识别方法,其特征在于,所述基于OCR的票据信息识别方法包括: 获取多个初始样本票据图像,并通过label-studio数据标注工具分别对所述多个初始样本票据图像进行字段信息拆分标注,得到多个目标样本票据图像;具体包括:获取多个初始样本票据图像,并按照预设比例对所述多个初始样本票据图像进行数据集划分,得到融合训练集、统计数据集和微调数据集;调用label-studio数据标注工具中的多个目标模型,并将所述融合训练集输入所述多个目标模型;分别通过所述多个目标模型对所述融合训练集进行数据集标签预测,得到每个目标模型对应的初始标签预测结果;获取预置的多个候选融合策略,其中,所述多个候选融合策略包括:加权平均融合策略、线性回归融合策略和多层感知机融合策略;分别按照所述加权平均融合策略、所述线性回归融合策略和所述多层感知机融合策略对每个目标模型对应的初始标签预测结果进行融合处理,得到每个候选融合策略对应的目标标签融合结果;根据每个候选融合策略对应的目标标签融合结果,对所述多个候选融合策略进行融合策略训练,得到多个训练完成的融合策略;从所述多个训练完成的融合策略中选取目标融合策略,并计算所述目标融合策略的置信区间,以及根据所述多个目标模型生成带有所述目标融合策略的标注模型;通过所述带有目标融合策略的标注模型进行字段信息拆分标注,并根据预置的模糊监督学习策略得到多个目标样本票据图像; 将所述多个目标样本票据图像输入预置的初始OCR模型进行字符识别训练,得到多个样本票据文本数据和目标OCR模型;具体包括:创建票据关键词集合,其中,所述票据关键词集合包括多个预设关键词;对所述多个目标样本票据图像进行灰度化和二值化处理,得到多个二值化样本票据图像;对所述多个二值化样本票据图像进行噪声去除和角度矫正,得到多个标准化样本票据图像;对所述多个标准化样本票据图像进行行切分和字符切分,得到多个切分后的样本票据图像,并对所述多个切分后的样本票据图像进行文字识别,得到初始票据文本数据;对所述初始票据文本数据进行预处理,得到所述初始票据文本数据对应的标准票据文本数据;对所述标准票据文本数据和所述票据关键词集合进行关键词相似度计算,得到所述标准票据文本数据中每个关键词对应的目标相似度;对所述每个关键词对应的目标相似度和预置的相似度阈值进行比较,并将目标相似度大于所述相似度阈值时所述目标相似度对应的关键词作为每个目标样本票据图像的票据关键词;对所述票据关键词进行关键词整合,得到多个样本票据文本数据;通过所述多个样本票据文本数据对所述初始OCR模型进行模型训练,得到目标OCR模型; 将所述多个样本票据文本数据输入预置的多个LayoutLMv3模型进行票据分类训练,得到票据信息分类模型;具体包括:获取预置的多个LayoutLMv3模型,其中,每个LayoutLMv3模型包括:编码器、多模态Transformer网络、解码器以及策略决策网络;分别对所述多个样本票据文本数据与所述多个LayoutLMv3模型进行对应关系匹配,得到每个样本票据文本数据对应的LayoutLMv3模型;分别将每个样本票据文本数据输入对应的LayoutLMv3模型,并通过所述编码器中的第一嵌入层对每个样本票据文本数据进行向量转换,得到对应的第一样本编码向量;通过所述编码器中的第一位置编码层对所述第一样本编码向量进行位置编码,得到第二样本编码向量;通过所述编码器中的第一多层卷积层对所述第二样本编码向量进行向量多层特征处理,得到样本卷积编码特征向量;将所述样本卷积编码特征向量输入所述多模态Transformer网络进行注意力特征增强,得到样本注意力特征向量;通过所述解码器中的第二多层卷积层对所述样本注意力特征向量进行多层卷积处理,得到样本卷积特征解码向量;通过所述解码器中的第二位置编码层对所述样本卷积特征解码向量进行位置解码,得到第一样本解码向量;通过所述解码器中的第二嵌入层对所述第一样本解码向量进行向量转换,得到对应的第二样本解码向量;通过所述策略决策网络中的多个决策树对所述第二样本解码向量进行票据分类,得到每个LayoutLMv3模型的样本票据分类信息;通过预置的交叉熵函数,对所述样本票据分类信息进行损失计算,得到每个LayoutLMv3模型的损失值;根据所述损失值,分别对每个LayoutLMv3模型进行梯度下降更新,得到多个第一票据分类模型;分别对所述多个第一票据分类模型中的策略决策网络进行网络决策执行策略分析,得到初始网络决策执行策略;对所述策略决策网络进行执行策略学习,得到目标执行策略搜索空间;基于所述目标执行策略搜索空间对所述初始网络决策执行策略进行奖励反馈数据计算,得到奖励反馈参数;基于所述奖励反馈参数对每个第一票据分类模型中的策略决策网络进行策略更新,生成每个第一票据分类模型中策略决策网络对应的目标网络决策执行策略;根据所述目标网络决策执行策略对所述多个第一票据分类模型进行决策策略优化,得到多个第二票据分类模型;分别计算每个第二票据分类模型的模型权重数据,并根据所述模型权重数据对所述多个第二票据分类模型进行模型集成,得到票据信息分类模型; 获取第一待识别票据图像,并对所述第一待识别票据图像进行预处理,得到第二待识别票据图像; 将所述第二待识别票据图像输入所述目标OCR模型进行文字识别,得到目标票据文本数据; 将所述目标票据文本数据输入所述票据信息分类模型进行票据信息分类,得到票据信息分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人优顶特技术有限公司,其通讯地址为:518000 广东省深圳市罗湖区桂园街道深南东路5002号信兴广场主楼905-3;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。