Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华中科技大学陈铭锐获国家专利权

华中科技大学陈铭锐获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华中科技大学申请的专利基于深度学习的多语种马赛克图像文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116682120B

龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310524256.1,技术领域涉及:G06V30/19;该发明授权基于深度学习的多语种马赛克图像文本识别方法是由陈铭锐;刘禹良;余文文;刘明宇;陆昊;白翔设计研发完成,并于2023-05-08向国家知识产权局提交的专利申请。

基于深度学习的多语种马赛克图像文本识别方法在说明书摘要公布了:本发明受人类视觉皮层观察‑练习‑完善的识别过程,提出了一种马赛克文字识别方法:采用合成数据以及公开基准数据集构造原始图像‑马赛克图像数据对;首先将马赛克图像数据送入“观察”模块的图像编码器中层次化提取特征;然后通过重建模块对图像初步恢复;受掩码自回归编码器的启发使用自监督学习来模仿人类的“练习”过程,由视觉自注意力模块预测像素值;最后“完善”模块的去噪扩散概率模型训练U型神经网络预测每一步的噪声实现迭代优化;通过反向传播优化权重参数;由开源识别网络或云服务API识别字符序列。本发明为多语种马赛克文本图像识别难题贡献了一种思路和可行方案。

本发明授权基于深度学习的多语种马赛克图像文本识别方法在权利要求书中公布了:1.一种基于深度学习的多语种马赛克图像文本识别方法,其特征在于,所述方法包括如下步骤: 步骤一:数据获取:采用合成文本图像数据以及公开真实场景文字基准数据集作为原始训练数据,构成原始图像-马赛克图像数据对; 步骤二:数据预处理和数据增强:首先将输入图像调整为统一的大小和分辨率;接下来对调整后的图像进行数据增强来提高模型对不同输入数据的泛化能力; 步骤三:“观察Observation”模块由图像编码器和重建模块组成,首先将马赛克图像数据送入图像编码器中进而层次化地利用卷积层与基于移动窗口的视觉自注意力模型提取图像特征和文本特征;然后通过重建模块的子像素卷积进一步对图像上采样以去除马赛克和提高图像质量与分辨率; 步骤四:受掩码自回归图像编码器的启发使用大量的图像数据进行自监督学习来模仿人类的“练习Practice”过程,“练习Practice”模块由与“观察Observation”模块同一个共享参数的图像编码器与一系列视觉自注意力模块组成的解码器组成,来预测掩码图像补丁块的像素值;具体包括: 为保证参数优化的连续性,“练习Practice”模块由与“观察Observation”模块同一个共享参数的图像编码器与一系列视觉自注意力模块组成的解码器组成,将图像分割为大小为2×2的非重叠图像补丁块,并随机采样得到一个图像补丁子集,将采样到的可见补丁子集经过一层线性映射后从而以指定的维度输入图像编码器,而其余的图像补丁将被掩码遮盖并且移去从而大大减少计算需求和存储内存,其中和分别表示可见与不可见两种补丁块的个数,利用大量的数据进行自监督学习来模仿人类的“练习Practice”过程,之后将编码的可见补丁和共享且可学习的掩码图像补丁拼接得到并输入由一系列视觉自注意力模块组成的解码器来预测掩码图像补丁块的像素值,其中,为编码器参数,并且解码器的最后一层为一个线性映射层使得输出满足;为解码器参数,最后仅利用输出中的掩码补丁部分来计算均方误差用于优化参数和; 步骤五:“完善Refinement”模块由去噪扩散概率模型组成,有前向加噪和反向去噪两个步骤:前向加噪过程视为一个马尔可夫链模型不断对原始图像添加高斯噪声直至成为纯噪声图像,而反向去噪过程则利用原始图像和噪声图像训练U型神经网络预测每一步的噪声从而实现图像恢复; 步骤六:由“观察Observation”模块和“完善Refinement”模块利用二者的预测复原图像计算与原始图像的像素损失与峰值信噪比;而“练习Practice”模块利用预测掩码图像补丁块像素计算与真实像素的均方误差辅助并加速训练,通过反向传播优化识别网络权重参数; 步骤七:在推理阶段将恢复的图像送入识别网络或云服务API完成马赛克多语种文字图像的识别并输出预测的字符序列,使用预测准确率和标准化编辑距离作为衡量评价指标。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。