Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学王琦获国家专利权

西北工业大学王琦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利基于双向信息传递的实时任意形状文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116092067B

龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310026346.8,技术领域涉及:G06V20/62;该发明授权基于双向信息传递的实时任意形状文本检测方法是由王琦;韩旭;袁媛设计研发完成,并于2023-01-09向国家知识产权局提交的专利申请。

基于双向信息传递的实时任意形状文本检测方法在说明书摘要公布了:本发明提供了一种基于双向信息传递的实时任意形状文本检测方法。首先,构建训练数据集,利用文本区域标签生成内核区域标签和间隙区域标签,并对训练集中的样本图像进行数据增强和归一化处理;然后,构建文本检测网络并进行网络训练,训练中监督文本区域和文本内核区域,利用两个预测结果计算间隙预测值来实现信息流动;最后,利用预测的文本内核区域重建文本实例。本发明能够解决文本内核语义不完整导致难以学习的问题,可以在保持高处理速度的同时获得高的检测准确率。

本发明授权基于双向信息传递的实时任意形状文本检测方法在权利要求书中公布了:1.一种基于双向信息传递的实时任意形状文本检测方法,其特征在于步骤如下: 步骤1:选用公开的CTW1500行级弯曲文本标注数据集作为训练数据集,利用公开的文本区域标签生成内核区域标签,文本区域标签与内核区域标签相减生成间隙区域标签; 步骤2:按照1:3的比例由训练数据集中选定正负样本,其中正样本指属于前景部分的像素,负样本指属于背景部分的像素;然后,对所有样本图像进行数据增强处理并进行归一化操作,所述的数据增强处理包括随机旋转、随机裁切以及随机放缩操作,使数据集中的图像大小统一为3×H×W,H表示图像高度,W表示图像宽度,二者在训练时均设置为640; 步骤3:将步骤2处理后的样本图像输入文本检测网络进行网络训练,得到训练好的网络,训练时采用SGD优化器,学习率衰减采用下式计算: 其中,l表示当前训练轮次的学习率,lini为初始学习率,epoch为当前训练轮次,max_epoch为训练总轮次数; 训练中设置文本内核预测概率图损失函数Lk如下: Lk=∑i∈S[-yi*logxi-1-yi*log1-xi]2 其中,i表示第i个像素样本,S表示按照正负样本比例为1:3选定的样本集合,xi为文本内核概率预测值,yi为文本内核的标签; 训练中设置文本区域预测概率图的损失函数Lt和间隙预测概率图的损失函数Lg如下: 其中,S′为图像中所有的像素集合,ε为避免分母为0的极小值,设置ε为0.000001;pgt表示像素的真实标签,ppre表示像素的预测值; 训练中采用的总损失函数L为: 其中,μ为文本内核预测概率图损失项的系数,为文本区域预测概率图损失项的系数,ω为间隙预测概率图损失项的系数,分别设置μ=6,ω=1; 所述的文本检测网络的具体处理过程如下: 步骤a:将图像输入带有可变形卷积的ResNet18网络进行特征提取,输出四组不同分辨率的特征,分辨率分别为 步骤b:利用卷积核为1×1的卷积层将步骤a获得的四组特征的分辨率分别调整为 步骤c:将分辨率为的特征上采样2倍再与分辨率为的特征相加,将新得到的分辨率为的特征上采样2倍再与分辨率为的特征相加,将新得到的分辨率为的特征上采样2倍再与分辨率为的特征相加,与步骤b中分辨率为的特征组成四组新的特征; 步骤d:用3×3卷积层将步骤c得到的四组特征的通道数由256下降到64,然后利用上采样将这四组特征调整到同一分辨率再进行拼接,得到分辨率为 的特征图F; 步骤e:利用带归一化和ReLU激活函数的3×3的卷积层对特征图F进行处理,得到分辨率为的特征图F1;利用带归一化和ReLU激活函数的1×1的转置卷积层对特征图F1进行处理,得到分辨率为的特征图F2;最后通过1×1的转置卷积层以及Sigmoid函数对特征图F2进行处理,得到大小为1×H×W的文本内核区域预测概率图PK; 步骤f:利用一组新的带归一化和ReLU激活函数的3×3的卷积层对特征图F进行处理,得到分辨率为的特征图F3;利用带归一化和ReLU激活函数的1×1的转置卷积层对特征图F3进行处理,得到分辨率为的特征图F4;最后通过1×1的转置卷积层以及Sigmoid函数对特征图F4进行处理,得到大小为1×H×W的文本区域预测概率图Pt; 步骤g:将步骤e得到的文本内核区域预测概率图PK和步骤f得到的文本区域预测概率图Pt输入双向信息传递模块,输出得到大小为1×H×W的间隙区域预测概率图Pg; 所述的双向信息传递模块按以下函数进行处理: 其中,α为需要学习的网络超参数一,β为需要学习的网络超参数二; 步骤4:将待处理的文本图像数据集输入到步骤3训练好的文本检测网络,对网络输出的文本内核区域预测概率图进行二值化处理,再利用opencv库中的函数进行扩张处理,得到最终的检测结果图。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。