联通沃悦读科技文化有限公司彭鸣达获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉联通沃悦读科技文化有限公司申请的专利一种电子图书中的文字识别方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120599633B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511113111.8,技术领域涉及:G06V30/19;该发明授权一种电子图书中的文字识别方法、系统、设备及介质是由彭鸣达;王振波;何玄;何熠;彭宇飞;李勇刚设计研发完成,并于2025-08-11向国家知识产权局提交的专利申请。
本一种电子图书中的文字识别方法、系统、设备及介质在说明书摘要公布了:本申请涉及了一种电子图书中的文字识别方法、系统、设备及介质,通过Transformer与CNN的协同工作,同时保留整体结构和细节特征,能够准确分割复杂形状轮廓内的文字区域,消除背景图案对文字识别的干扰。通过形状分割框定精确的识别范围,避免传统方法因文本框定位偏差导致的文字漏检或错误识别,提升电子书插图文字提取的准确率。
本发明授权一种电子图书中的文字识别方法、系统、设备及介质在权利要求书中公布了:1.一种电子图书中的文字识别方法,其特征在于,所述方法包括: 响应于电子图书的第一插图中的文字识别指令,将所述第一插图转换成第二插图;其中,所述第一插图为可见光图像,所述第二插图为梯度图像; 基于卷积神经网络提取所述第一插图的第一特征,以及基于Transformer网络提取所述第二插图的第二特征;其中,所述基于Transformer网络提取所述第二插图的第二特征包括:对所述第二插图进行特征嵌入和位置编码,得到输入特征矩阵;将所述输入特征矩阵线性变换生成查询矩阵、值矩阵和键矩阵;将所述查询矩阵进行列主元的LU分解,得到单位下三角矩阵和上三角矩阵;基于所述单位下三角矩阵和所述上三角矩阵,计算注意力系数矩阵;基于所述注意力系数矩阵和所述值矩阵,计算输出特征矩阵;根据所述键矩阵和输出特征矩阵输入至前馈神经网络中,得到所述前馈神经网络输出的第二特征;所述Transformer网络包括N个Transformer子网络;且,每一个所述Transformer子网络均提取对应的第二特征,前一个所述Transformer子网络提取的对应第二特征作为后一个所述Transformer子网络的输入特征; 所述卷积神经网络包括N个卷积块,且,每一个所述卷积块均提取对应的第一特征,前一个所述卷积块提取的对应第一特征与对应一个所述Transformer子网络提取的对应第二特征之间的逐元素相乘结果,作为后一个所述卷积块的输入特征; N为大于1的正整数; 基于所述第一特征和所述第二特征的融合结果分割出所述第一插图中的形状轮廓; 在所述形状轮廓上设置文本框,并从所述文本框中识别出文字; 所述基于所述第一特征和所述第二特征的融合结果分割出所述第一插图中的形状轮廓,包括: 将所述N个Transformer子网络中的最后一个所述Transformer子网络输出的第二特征与所述N个卷积块中的最后一个所述卷积块输出的第一特征融合,得到第三特征; 基于所述第三特征分割出所述第一插图中的形状轮廓。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人联通沃悦读科技文化有限公司,其通讯地址为:410011 湖南省长沙市长沙县黄花镇长沙临空经济示范区人民东路与小康路交汇处西南角房屋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励