广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司赵佳鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司申请的专利文本识别方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116612489B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210121337.2,技术领域涉及:G06V30/416;该发明授权文本识别方法、装置、设备和介质是由赵佳鹏设计研发完成,并于2022-02-09向国家知识产权局提交的专利申请。
本文本识别方法、装置、设备和介质在说明书摘要公布了:本申请的一种文本识别方法,包括:获取包含待识别文本的目标图片;通过预设的字符检测模型,对目标图片中的每一个待识别字符分别生成一个字符检测框;按照预设的矩阵行列数,选取若干个字符检测框组成字符矩阵;在字符矩阵中,读取字符检测框内的待识别字符作为矩阵字符,并基于不同的文本读取方向,对矩阵字符组合形成若干个检测词组;将检测词组分别输入预设的语言模型中,并通过语言模型对每一个检测词组进行语义识别,得到语义参数;根据语义参数得到不同文本读取方向对应的文本概率参数,将文本概率参数最大的文本读取方向作为目标读取方向,并根据目标读取方向对待识别文本进行文本识别,从而提高文本识别的准确度。
本发明授权文本识别方法、装置、设备和介质在权利要求书中公布了:1.一种文本识别方法,其中,包括: 获取包含待识别文本的目标图片,其中,所述待识别文本包括若干个待识别字符; 通过预设的字符检测模型,对所述目标图片中的每一个待识别字符分别生成一个字符检测框; 按照预设的矩阵行列数,选取若干个字符检测框组成字符矩阵;包括:根据所述字符检测框的排列位置,对每一个所述字符检测框分别生成一个坐标信息;基于所述坐标信息,按照所述矩阵行列数,选取若干个坐标信息连续的字符检测框组成字符矩阵,其中,所述矩阵行列数为超参数;坐标信息连续是指字符矩阵中的相邻的两个字符检测框必须是坐标信息连续的字符检测框; 在所述字符矩阵中,读取所述字符检测框内的待识别字符作为矩阵字符,并基于不同的文本读取方向,对所述矩阵字符组合形成若干个检测词组; 将所述检测词组分别输入预设的语言模型中,并通过所述语言模型对每一个所述检测词组进行语义识别,得到语义参数; 根据所述语义参数得到不同所述文本读取方向对应的文本概率参数,将所述文本概率参数最大的文本读取方向作为目标读取方向,并根据所述目标读取方向对所述待识别文本进行文本识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,其通讯地址为:510530 广东省广州市黄埔区云埔四路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励