Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学任永坚获国家专利权

杭州电子科技大学任永坚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种基于压缩与激励神经网络的场景文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116110055B

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211610577.5,技术领域涉及:G06V30/18;该发明授权一种基于压缩与激励神经网络的场景文本识别方法是由任永坚;路子恒;周仁杰;张纪林;万健;邓飞;杨畅;马强;姚越设计研发完成,并于2022-12-12向国家知识产权局提交的专利申请。

一种基于压缩与激励神经网络的场景文本识别方法在说明书摘要公布了:本发明公开一种基于压缩与激励神经网络的场景文本识别方法。该方法通过在输入层对包含文字的自然场景图像进行预处理得到文本块图像,然后通过压缩与激励神经网络组成的特征提取层对文本块图像进行特征提取,然后把提取到的特征图经过特征变换为多个特征序列,此时每个特征序列对应原始图像一个感受野,再把特征序列送入时序信息学习层,时序信息学习层使用双层双向门控循环神经网络提取特征图时序信息,最后使用连接时间分类网络CTC进行转录翻译得到预测文本。本发明不仅识别准确度高,并且模型的尺寸小,可移植和可应用性高,也具有很好的泛化能力。

本发明授权一种基于压缩与激励神经网络的场景文本识别方法在权利要求书中公布了:1.一种基于压缩与激励神经网络的场景文本识别方法,其特征在于所述方法包括以下步骤: 步骤一、获取包含文字的自然场景图像,并对其进行预处理,得到文本块图像; 步骤二、通过特征提取层,实现对文本块图像的特征提取; 特征提取模块包括依次级联的第一压缩与激励网络SECNN1、第一最大池化层1、第二压缩与激励网络SECNN2、第二最大池化层2、第三压缩与激励网络SECNN3、第四压缩与激励网络SECNN4、第三最大池化层3、第五压缩与激励网络SECNN5、第六压缩与激励网络SECNN6、第四最大池化层4和第七压缩与激励网络SECNN7;其输入为尺寸为H,W,1的图片,输出为1,W4,512特征图; 每个压缩与激励网络包括卷积层、GlobalPooling层、两个全连接层FC、Sigmoid函数、融合层;所述卷积层接收预处理后文本块图像H0,W0,C0,经过卷积变为H,W,C;GlobalPooling层接收所述卷积层输出的特征图H,W,C,把每个特征通道训练为一个当前特征通道全局信息的数,并且每个通道对应一个数,因此得到尺寸为1,1,C的特征图;两个全连接层FC将特征图从1,1,C变为压缩到1,1,Cr,再变为1,1,C,其中r为常数;Sigmoid函数用于计算1,1,C特征图的通道权重;融合层让通道权重乘卷积后的特征图H,W,C,得到压缩激励后的特征图; 步骤三、特征提取模块提取到的特征图经过特征变换为多个按顺序排列的特征序列;具体是: 把特征提取层输出的1,W4,512特征图,经过一个特征变换,变换为W4个特征序列,并且每个特征序列长为512,宽和高都为1,每个特征向量对应原图一个感受野,并按顺序排列; 步骤四、构建时序信息学习层,提取特征图时序信息;具体是: 所述时序信息学习层包括双层双向门控循环神经网络GRU、Softmax激活函数; 所述双层双向门控循环神经网络GRU采用分别进行前向传播和后向传播的两个GRU网络组合成一个双向GRU网络; 所述双层双向门控循环神经网络GRU的输入为T个特征序列,并且每个特征序列的长度为m,则输入为公式1所示: e=e1,e2,…,eT1 其中每个et长度为m,它包含了m维信息,et如公式2所示: 在所述双层双向门控循环神经网络GRU的输出端接入一个Softmax激活函数,则输出x是一个概率矩阵,其表达式定义为公式3所示: x=x1,x2,…,xt,…,xT3 其中x的每一列包含n个值,xt为公式4所示: n为分类字符的类别数,每一个代表此输入特征为分类字符表中i位置所在字符的概率为故服从概率假设:其中k从1到n; 步骤五、使用连接时间分类网络CTC进行转录翻译,得到预测文本;具体是通过从时序信息学习层输出的概率矩阵的每帧预测中找出具有最高概率组合的标签序列,计算各序列的概率,取概率最大序列作为推理结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。