慧择(成都)网络科技有限公司曹智获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉慧择(成都)网络科技有限公司申请的专利OCR识别模型训练方法、OCR识别方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114565751B 。
龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210192272.0,技术领域涉及:G06V10/22;该发明授权OCR识别模型训练方法、OCR识别方法及相关装置是由曹智设计研发完成,并于2022-02-28向国家知识产权局提交的专利申请。
本OCR识别模型训练方法、OCR识别方法及相关装置在说明书摘要公布了:本申请提供了OCR识别模型训练方法、OCR识别方法及相关装置,OCR识别模型训练方法包括:将无标注数据的第一图像样本切分为多个第一图像块,随机选取部分第一图像块进行遮挡,得到遮挡图像块和未遮挡图像块;利用遮挡图像块和未遮挡图像块,以重构第一图像样本的预设特征为目标,对预先构建包含编码器和第一解码器的初始特征识别模型进行预训练;基于预训练特征识别模型中的编码器和第二解码器构建任务处理模型;将有标注数据的第二图像样本切分为多个第二图像块;采用多个第二图像块和第二图像样本包含的词片序列对任务处理模型进行训练,得到OCR识别模型。本申请无需大量标注数据,模型训练效率高,同时,训练方法使得OCR识别模型的识别能力高。
本发明授权OCR识别模型训练方法、OCR识别方法及相关装置在权利要求书中公布了:1.一种OCR识别模型训练方法,其特征在于,包括: 将无标注数据的第一图像样本切分为多个第一图像块,并从所述多个第一图像块中随机选取部分第一图像块进行遮挡,得到遮挡图像块和未遮挡图像块,其中,所述遮挡图像块的数量大于所述未遮挡图像块的数量;利用所述遮挡图像块和所述未遮挡图像块,以重构所述第一图像样本的预设特征为目标,对预先构建的包含编码器和第一解码器的初始特征识别模型进行预训练,得到预训练特征识别模型;基于所述预训练特征识别模型中的编码器和第二解码器构建任务处理模型; 将有标注数据的第二图像样本切分为多个第二图像块; 采用所述多个第二图像块和所述第二图像样本包含的词片序列对所述任务处理模型进行训练,得到的模型作为OCR识别模型; 所述利用所述遮挡图像块和所述未遮挡图像块,以重构所述第一图像样本的预设特征为目标,对预先构建的包含编码器和第一解码器的初始特征识别模型进行预训练,得到预训练特征识别模型,包括:将所述未遮挡图像块输入到所述初始特征识别模型包含的编码器中,得到所述未遮挡图像块的视觉语义信息;将所述未遮挡图像块的视觉语义信息和所述遮挡图像块输入到所述初始特征识别模型包含的第一解码器中,得到重构出的所述未遮挡图像块和所述遮挡图像块分别对应的预设特征;根据重构出的所述未遮挡图像块和所述遮挡图像块分别对应的预设特征,以及,从所述第一图像样本提取的预设特征,对所述初始特征识别模型的参数进行预训练,得到所述预训练特征识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人慧择(成都)网络科技有限公司,其通讯地址为:614000 四川省成都市高新区锦云东三巷1号B3;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。