中国科学院合肥物质科学研究院汪增福获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院合肥物质科学研究院申请的专利一种基于增强视觉变换器网络的印地语图文识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115984883B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310032987.4,技术领域涉及:G06V30/41;该发明授权一种基于增强视觉变换器网络的印地语图文识别方法是由汪增福;李永瑞设计研发完成,并于2023-01-10向国家知识产权局提交的专利申请。
本一种基于增强视觉变换器网络的印地语图文识别方法在说明书摘要公布了:本发明公开了一种基于增强视觉变换器网络的印地语图文识别方法,其步骤包括:1合成印地语文本图像,建立印地语图文识别训练数据集;2构建印地语图文识别网络;3计算每一张输入图片对应的损失函数并训练印地语图文识别网络;4利用训练后的印地语图文识别网络对任意输入的待识别图片进行文本识别。本发明的印地语图文识别网络在训练好之后,可对训练数据中没有出现过的印地语文本图像进行文本识别,具有较高的实用价值。
本发明授权一种基于增强视觉变换器网络的印地语图文识别方法在权利要求书中公布了:1.一种基于增强视觉变换器网络的印地语图文识别方法,其特征在于,包括以下步骤: 步骤1:构建印地语图文识别训练数据集; 用无文字的背景图像和印地语文字内容合成印地语文本图像,并将印地语文字内容作为相应印地语文本图像的文字标签,从而得到文本图像集合及其对应的标签集合;其中,表示第i张印地语文本图像,表示第i张印地语文本图像对应的文字标签,表示图像的高度,表示图像的宽度,为通道数; 步骤2:构建文本图像识别网络,包括一个编码器和一个解码器,并用于得到第i张印地语文本图像的预测概率; 所述编码器由R个堆叠的ViTAEv2基础模块组成,其中,第r个ViTAEv2基础编码模块包括:一个主分支、一个旁路分支和一个带有残差连接的前馈编码层; 所述第r个ViTAEv2基础编码模块的主分支包括多尺度卷积操作层、层归一化操作层、多头注意力操作层; 所述第r个ViTAEv2基础编码模块的旁路分支包括卷积操作层、批量归一化操作层和Sigmoid 加权线性单元; 当r=1时,所述第i张印地语文本图像输入所述文本图像识别网络中,并经过编码器中第r个ViTAEv2基础编码模块的主分支的多尺度卷积操作层进行特征提取,输出一个多通道的特征图并通过形状变化后转化为特征序列,再经过多头注意力操作层的处理后,得到特征序列;所述编码器中第r个ViTAEv2基础编码模块的旁路分支对所述第i张印地语文本图像进行处理,得到特征图,并通过形状变化后转化为特征序列; 将和的对应位置元素相加后,得到融合后的序列并输入到第r个ViTAEv2基础编码模块的前馈编码层中,并依次经过层归一化操作、带有线性整流激活函数的两个全连接层的处理后,输出第r个视觉特征序列; 当r=2,3,…,R时,第r‑1个视觉特征序列输入编码器的第r个ViTAEv2基础编码模块中进行处理,相应得到第r个视觉特征序列;从而由第R个ViTAEv2基础编码模块输出的第R个视觉特征序列作为所述编码器模块输出的视觉特征序列[,, …, , …,],其中,表示第i张印地语文本图像的第j个视觉特征向量;n表示视觉特征向量的总数; 步骤3:加载ViTAEv2基础模块在图像分类任务中预训练好的参数,并用于对所述文本图像识别网络中的编码器参数进行初始化; 根据文字标签和预测概率构建交叉熵损失函数后,利用反向传播算法训练初始化后的文本图像识别网络,直至交叉熵损失函数收敛为止,从而得到训练后的文本图像识别网络; 步骤4:利用训练后的文本图像识别网络对任意输入的待识别印地语文本图片进行识别,得到待识别图片每个位置字符的预测概率向量,再选择预测概率向中最大概率所对应的类别,作为待识别图片的文本识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院合肥物质科学研究院,其通讯地址为:230031 安徽省合肥市蜀山区蜀山湖路350号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励