广州大学彭绍湖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大学申请的专利基于深度学习的光学字符分割方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116597448B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310556314.9,技术领域涉及:G06V30/148;该发明授权基于深度学习的光学字符分割方法及装置是由彭绍湖;冼咏炘;吴树贤;谭敏聪设计研发完成,并于2023-05-16向国家知识产权局提交的专利申请。
本基于深度学习的光学字符分割方法及装置在说明书摘要公布了:本发明公开了一种基于深度学习的光学字符分割方法及装置,其中,该方法包括:获得训练数据集和调试数据集;使用Pytorch深度学习框架建立一个基于注意力机制的多尺度分割网络;使用训练数据集对所述多尺度分割网络进行训练,并使用调试数据集对训练后的多尺度分割网络进行微调;根据评价指标对多尺度分割网络的字符分割结果进行评价。
本发明授权基于深度学习的光学字符分割方法及装置在权利要求书中公布了:1.一种基于深度学习的光学字符分割方法,其特征在于,包括: 获得训练数据集和调试数据集; 使用Pytorch深度学习框架建立一个基于注意力机制的多尺度分割网络;具体包括: 对自注意力机制和CBAM注意力机制进行融合,得到针对文字检测的注意力机制,并在多尺度分割网络的不同编码子模块中引入注意力机制,在多尺度分割网络的编码部分和解码部分之间插入改进RFB模块来增大多尺度分割网络的感受野,将所述多尺度分割网络设置为多尺度输出,使得在不同层次提取的特征进行合并来提高语义信息,所述多尺度分割网络具有抑制与分割任务无关的背景区域,且具有增加目标区域权重的能力,从而对字符进行精确分割; 在多尺度分割网络的原CRAFT网络的左边VGG16_bn编码的不同子模块中引入注意力机制,其中,所述注意力机制为自注意力机制和CBAM注意力机制的融合:自注意力机制通过1×1卷积得到的K和Q特征矩阵相乘得出各个单词之间的相关联程度得分,并将得分通过softmax分类器之后与矩阵V相乘,得到矩阵V的权重分布,得到每个单词之间的关联程度,将K和Q分支的两个1×1卷积核替换成CBAM中的通道和空间注意力模块; 在多尺度分割网络的编码网络和解码网络之间增加RFB模块,当前一层输出特征图进入RFB模块后,通过1×1卷积降低特征图的通道数,然后分别使用尺寸为1×1、1×3、3×1和3×3的卷积核来获取多尺度特征,最后用空洞扩张率分别为1、3、5的空洞卷积来扩大网络的感受野,最后合并不同卷积核的输出; 通过多尺度分割网络进行多尺度输出,将解码模块的三个特征图和最后一层的输出特征图进行特征融合,使用反卷积分别对三个特征图进行两倍、四倍和八倍上采样操作,最后再使用一个的1×1卷积对其进行降维; 使用训练数据集对所述多尺度分割网络进行训练,并使用调试数据集对训练后的多尺度分割网络进行微调; 根据评价指标对多尺度分割网络的字符分割结果进行评价。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学,其通讯地址为:510006 广东省广州市番禺区大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励