电子科技大学李宏亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学申请的专利一种基于字符特征摘要的端到端文本提取识别头方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117292385B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311241140.3,技术领域涉及:G06V30/18;该发明授权一种基于字符特征摘要的端到端文本提取识别头方法是由李宏亮;龚传阳;郝昕鹏;唐世渊;矫健;邱荷茜;王岚晓;许林峰设计研发完成,并于2023-09-25向国家知识产权局提交的专利申请。
本一种基于字符特征摘要的端到端文本提取识别头方法在说明书摘要公布了:该发明公开了一种基于字符特征摘要的端到端文本提取识别头方法,属于深度学习、计算机视觉、端到端文本提取领域。通过多阶段逐步提取字符全局特征,并在每个阶段进行历史特征摘要的方法,更好的进行了字符特征的提取。并通过在每个阶段都进行文本识别结果预测,在增加较少计算量的前提下,更好的收敛了网络、提升了最终结果准确率,具有简单且快速准确的特点。
本发明授权一种基于字符特征摘要的端到端文本提取识别头方法在权利要求书中公布了:1.一种基于字符特征摘要的端到端文本提取识别头方法,该方法中包括主干网络检测头特性形状对齐模块、特征下采样模块、N个字符特征摘要模块、N个字符预测模块、结果选择模块,方法步骤包括: 步骤1:特征下采样; 首先对输入的图像进行主干网络检测头特征形状对齐,对齐后得到形状为C1×h×w的文本特征Ft,其中C1为特征通道数,h为高度,w为宽度;然后级联M+1个由卷积层、批归一化层和ReLU激活函数组成的ConvBN模块,其中第1个ConvBN模块用于进行通道下采样,将特征通道数下采样为C2,后M个ConvBN模块用于进行高度下采样,将高度下采样为1,具体过程如下: 其中,表示卷积核大小为kh×kw,步长为sh×sw的卷积层,BN·为批归一化层,ReLU·为ReLU激活层,除此之外,将最后一个ConvBN模块的输出重命名为Fr,作为该模块的输出,Fr的形状为C2×1×w; 步骤2:级联字符特征摘要; 由于通道高度下采样后的文本特征Fr为文本图像的局部特征,难以表征字符的全局特征,该模块通过级联N个字符特征摘要模块,分N个阶段逐步从文本的局部特征提取字符的全局摘要特征;字符特征摘要模块包含全局特征提取支路和历史字符特征摘要支路;对于第k个模块,输入为第k-1个模块的字符全局特征提取结果和历史字符摘要特征首先,将对进一步提取当前阶段的全局字符特征随后,为了充分利用前面模块所提取的特征,还将把和进行摘要融合,分别生成两个当前阶段的历史字符特征摘要结果和其中用于作为下一个模块的历史字符摘要特征输入,用于进行字符预测;具体过程如下,对于第k个阶段: 其中,为第k阶段的字符全局特征提取结果,为第k阶段用于下一阶段历史字符特征摘要的历史字符摘要特征,为用于当前阶段字符预测的历史字符摘要特征,Attn·为多头自注意力层,MLP·为多层感知机层,Concat·,·为按通道级联操作; 对于第1个阶段,字符特征摘要模块的输入和均为通道高度下采样文本特征Fr; 步骤3:字符预测; 所述字符预测模块以级联字符特征摘要模块N个阶段中每个阶段用于进行字符预测的历史字符摘要特征为输入,对于每一个历史字符摘要特征使用全连接网络进行字符的分类预测,得到N个长度为w的字符串;在训练阶段,这N个预测结果将分别使用CTC损失函数计算识别损失,以进行网络的迭代训练;在测试阶段,这N个预测结果将分别使用CTC解码器进行解码,得到N个文本预测结果以及每个结果的置信度;具体过程如下,对于第k个历史字符摘要特征 其中,FC·为全连接层,用于进行字符的分类预测,为第k阶段第i个位置的字符特征,形状为C2×1×1,为第k个阶段第i个字符的分类预测结果,该字符的置信度记为Tk为第k阶段所有预测字符的集合,CTCLoss·为CTC损失计算函数,Lreck为第k阶段的文本识别损失值,Lrec为整个识别头的识别损失值,CTCDecode·为CTC解码器,为解码后去除重复字符的文本预测结果; 步骤4:结果选择; 经过字符预测模块,得到N个文本预测结果k=1,…,N;为了更好的从中选择一个结果作为最终的文本识别结果,结果选择模块选取置信度最大的结果最为最终结果,具体过程如下: 其中,Confk为第k个识别结果的置信度,TF为最终的文本识别结果,为这k个阶段文本识别结果中置信度最大的结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励