浙江齐安信息科技有限公司彭涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江齐安信息科技有限公司申请的专利一种基于OCR的工作票识别方法、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117409429B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310801234.5,技术领域涉及:G06V30/413;该发明授权一种基于OCR的工作票识别方法、电子设备及存储介质是由彭涛;郦建新;黄佳;阮涛设计研发完成,并于2023-06-30向国家知识产权局提交的专利申请。
本一种基于OCR的工作票识别方法、电子设备及存储介质在说明书摘要公布了:本发明实施例公开了一种基于OCR的工作票识别方法、电子设备及存储介质,可以将OCR识别后的杂乱内容数据,通过坐标算法二次处理,将杂乱内容数据根据坐标重新排版并合并,分解成一个个页对象、行对象和块对象,再根据正则思想去匹配所需要的文本标题,最终根据需要取所需要的文本内容。即,本发明可以自动地将OCR识别出的内容填充至对应位置,无需人为手动选择、筛选自己想要的数据,从而提高了识别效率,减少了工作量。
本发明授权一种基于OCR的工作票识别方法、电子设备及存储介质在权利要求书中公布了:1.一种基于OCR的工作票识别方法,其特征在于,包括: 采用OCR对工作票进行识别,得到识别数据;所述识别数据为杂乱的内容数据; 采用二维坐标算法对所述识别数据进行二次处理,得到填充数据; 对工作票模板进行识别以获取目标位置; 采用正则匹配方式将所述填充数据填充至所述目标位置; 其中,正则匹配方法具体为: 针对单行数据,若正则匹配内容的末尾下标等于当前块对象数据长度,则取行对象的下一个块对象数据,反之,则取去除正则匹配结果的该块对象数据; 针对多行数据,将文本标题所在行到结束行的所有内容拼接,去除文本标题部分,得到完整的文本内容; 针对表格数据,从开始行到结束行,若正则匹配到的是表头则跳过,反之则根据需要逻辑处理内容;所述表格数据由标题、表头和内容; 其中,得到填充数据,具体为: 获取识别数据的X轴坐标和Y轴坐标; 根据X轴坐标和Y轴坐标对所述识别数据进行重新排版、合并,并根据划分规则将所述识别数据划分为页对象、行对象和块对象; 对工作票模板进行识别以获取目标位置,具体为: 根据工作票格式,并根据划分规则将其划分为多个页对象、行对象和块对象;所述划分规则为: 二维坐标算法根据纵向Y轴值计算文本可信度,将在误差允许范围内的块对象认定组成一个行对象; 二维坐标算法根据横向X轴值计算文本中心点,根据中心点X轴值将行对象里的块对象从左到右排列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江齐安信息科技有限公司,其通讯地址为:315332 浙江省宁波市慈溪市白沙路街道商务二路38号2601室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励