浪潮通用软件有限公司孙佳鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮通用软件有限公司申请的专利基于OCR的图像预处理方法、系统、设备、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120236285B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510702890.9,技术领域涉及:G06V30/16;该发明授权基于OCR的图像预处理方法、系统、设备、介质及产品是由孙佳鹏;郑伟波;李伟龙;勇喜;申朝然;赵国博;丁宁设计研发完成,并于2025-05-29向国家知识产权局提交的专利申请。
本基于OCR的图像预处理方法、系统、设备、介质及产品在说明书摘要公布了:本发明涉及图像处理领域,尤其涉及一种基于OCR的图像预处理方法、系统、设备、介质及产品。基于OCR的图像预处理方法包括,对旋转矫正后的OCR图像依次进行分辨率增强、颜色空间转换、边缘模糊处理和形态学优化,得到融合图像;基于融合图像,采用OCR模型提取文本块,若文本块大于设定阈值,则输出处理后的OCR图像;否则,基于融合图像,采用TDSR模型,进行图像扩散、文字识别以及融合处理;图像扩散在文本的条件下进行,生成符合文本图像结构的图像特征向量;文字识别以图像扩散的图像特征向量为条件,得到文本特征;融合处理将图像特征向量与文本特征融合,增强文本图像超分辨率,得到处理后的OCR图像。提高了识别精度。
本发明授权基于OCR的图像预处理方法、系统、设备、介质及产品在权利要求书中公布了:1.基于OCR的图像预处理方法,其特征在于,包括: 获取待处理的OCR图像,并进行标准化,对标准化后的OCR图像进行旋转矫正; 对旋转矫正后的OCR图像依次进行分辨率增强、颜色空间转换、边缘模糊处理和形态学优化,再与分辨率增强的图像和颜色空间转换的图像,进行加权融合,得到融合图像; 基于融合图像,采用OCR模型提取文本块,若文本块大于设定阈值,则输出处理后的OCR图像;否则,基于融合图像,采用TDSR模型,进行图像扩散、文字识别以及融合处理;其中,图像扩散在文本的条件下进行,生成符合文本图像结构的图像特征向量;文字识别以图像扩散的图像特征向量为条件,得到文本特征;融合处理将图像特征向量与文本特征融合,增强文本图像超分辨率,得到处理后的OCR图像; 采用TDSR模型的方法包括:分别对融合图像采用文本编码器和变分自编码器进行编码,得到第一文本特征和第一图像特征;采用自注意力编码器对第一文本特征进行编码,得到第二文本特征;采用扩散模型,对第二文本特征与第一图像特征进行跨注意力计算,得到第一图像特征向量;基于第一图像特征向量,采用自注意力解码器,对第一文本特征进行多层级解码,得到每层的文本特征;采用自注意力编码器对上一层的文本特征进行编码,再与上一层的图像特征向量,进行跨注意力计算,直到倒数第二层处理完成,得到最终图像特征向量,经解码,得到处理后的OCR图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮通用软件有限公司,其通讯地址为:250000 山东省济南市历下区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。