南湖实验室王峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南湖实验室申请的专利一种提升精度和效率的文献数字化加工辅助方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120564201B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511049790.7,技术领域涉及:G06V30/148;该发明授权一种提升精度和效率的文献数字化加工辅助方法及装置是由王峰;朱方昊;张天意;蔡韵音;陈志凌设计研发完成,并于2025-07-29向国家知识产权局提交的专利申请。
本一种提升精度和效率的文献数字化加工辅助方法及装置在说明书摘要公布了:本发明公开了一种提升精度和效率的文献数字化加工辅助方法及装置,该方法包括:对经过用户标注的图像数据进行标注结果预处理;图像数据包含若干图片字;对经过预处理的图像数据进行OCR识别,每一图片字得到对应的识别字;基于识别字和图片字的像素分布判断每个字的错误识别可能性;响应于可能错误识别的判断结果,将相应图片字从图像数据中截取得到目标截图字;基于目标截图字从文字库查找目标预存截图字使用目标预存截图字对应的文字替换相应识别字。本方案在OCR转文本过程中设计自我纠错机制,通过像素分布判断可能识别错误的结果,并利用截图字去寻找可替换的准确性更高的文字,能够明显减少错误识别字,提高校对效率和准确率。
本发明授权一种提升精度和效率的文献数字化加工辅助方法及装置在权利要求书中公布了:1.一种提升精度和效率的文献数字化加工辅助方法,其特征在于,该方法包括: 对经过用户标注的图像数据进行标注结果预处理; 所述的图像数据包含若干图片字; 对经过预处理的图像数据进行OCR识别,每一图片字得到对应的识别字; 基于识别字和图片字的像素分布判断每个字的错误识别可能性,将识别字与图片字的像素分布相似度低于预设值的识别结果判断为可能错误识别; 响应于可能错误识别的判断结果,将相应图片字从图像数据中截取得到目标截图字; 基于所述目标截图字从文字库查找目标预存截图字,文字库中预存有若干纠错文字对,每一对纠错文字对包括一预存截图字和其对应的文字,查找目标预存截图字的方法包括: 比对目标截图字与若干预存截图字像素分布; 提取像素分布相似程度最高且高于程度阈值的预存截图字为目标预存截图字; 响应于查找到目标预存截图字,使用目标预存截图字对应的文字替换相应识别字; 响应于未查找到预存截图字,标记相应识别字,同时保存其对应的目标截图字,并建立识别字与目标截图字的关联关系; 响应于用户基于目标截图字的入库操作,将目标截图字与用户所提供的文字作为新一对纠错文字对存入所述的文字库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南湖实验室,其通讯地址为:314001 浙江省嘉兴市南湖区七星街道香湖别墅29幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励