同济大学张冬冬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉同济大学申请的专利一种基于改进PP-OCRv3的厂站接线图文本自动检测和识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117152784B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311000952.9,技术领域涉及:G06V30/422;该发明授权一种基于改进PP-OCRv3的厂站接线图文本自动检测和识别方法是由张冬冬;赵宇倩设计研发完成,并于2023-08-09向国家知识产权局提交的专利申请。
本一种基于改进PP-OCRv3的厂站接线图文本自动检测和识别方法在说明书摘要公布了:本发明公开了一种基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。本发明针对现有基于深度学习的电网图纸文本检测识别方法在处理多尺度、多方向、形状不规则的紧凑文本方面的局限性问题,提出了基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。利用基于像素行聚类的区域重分割模块,纠正了包含垂直和水平字符的不规则形状文本的检测错误。通过BiFPN模块中引入通道注意力机制和深度可分卷积,提高了识别模型对不同尺度输入图像的鲁棒性。利用基于区域扩展和切割的字符重识别模块,减少了简单字符和密集文本对模型的不利影响。实验结果表明,本发明通过对PP‑OCRv3的一系列改进,可以显著提高厂站接线图中文本的检测和识别精度。
本发明授权一种基于改进PP-OCRv3的厂站接线图文本自动检测和识别方法在权利要求书中公布了:1.一种基于改进PP-OCRv3的厂站接线图文本自动检测和识别方法,其特征在于,包括如下步骤: 步骤1:将电网厂站接线图纸数据集分为训练集和测试集,分别用于文本检测和识别两个模型的训练和测试; 步骤2:对输入图像进行文本位置检测,并构建区域重分割模块,用于对文本检测结果进行调整,解决对于同时包含横向和纵向文字的不规则文本的精确检测,据此得到文本候选框; 步骤3:构建基于改进BiFPN的特征提取和融合网络,对经裁剪的文本图像提取特征信息,得到序列特征;所述基于改进BiFPN的特征提取和融合网络是在PP-OCRv3的MobileNetv1的基础上设计的;在MobileNetv1之后,引入了一种改进BiFPN特征融合模块,用于提取厂站接线图中不同形状文本的多尺度特征;在BiFPN的末端增加一个通道注意力模块,增强高级特征映射中的信息,提高全局特征拟合能力;采用深度可分离卷积代替网络中的所有卷积以克服参数增加所导致的效率降低问题;使用Hardswish作为激活函数; 步骤4:对序列特征进行编码和解码,并构建字符重识别模块,通过对简单中文字符和多行数字文本的识别结果进行微调,改善整体精度,据此得到文本识别结果; 步骤5:将文本候选框和文本识别结果分别与相应真值计算得到检测和识别两个网络模型的损失; 步骤6:根据损失,使用Adam优化器分别优化检测和识别两个网络模型; 步骤7:循环执行步骤2-6至两个网络模型均收敛,保存两个模型文件; 步骤8:将测试图纸输入检测模型中预测得到文本候选框,再将裁剪后的文本图像输入识别模型预测得到文本识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同济大学,其通讯地址为:200092 上海市杨浦区四平路1239号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。