济南大学张文砚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉济南大学申请的专利一种基于深度学习的病案文字识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117218672B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311243479.7,技术领域涉及:G06V30/414;该发明授权一种基于深度学习的病案文字识别方法及系统是由张文砚;彭京亮;苏洁设计研发完成,并于2023-09-26向国家知识产权局提交的专利申请。
本一种基于深度学习的病案文字识别方法及系统在说明书摘要公布了:本申请公开了一种基于深度学习的病案文字识别方法及系统,对原始病案图像进行预处理,分别使用Canny边缘检测算法和Hough直线检测算法对图像进行边缘检测和角度校正;对预处理后图像的文本区域进行标注,得到文本检测训练数据集;使用DBNet网络对图片进行检测,获取图片中文本区域的边界框位置坐标;构建改进的SVTR模型,对文本检测到的区域提取特征,训练文字识别模型,对图片进行识别获得病案图片中的字符内容。确定待进行文字识别的图像后,对病案图像进行预处理,对预处理后的图像进行文本检测,将检测后的图像根据检测框进行分割,对单行文本进行识别,获得文字识别结果,对图像文字进行预测得到准确率极高的识别文字。
本发明授权一种基于深度学习的病案文字识别方法及系统在权利要求书中公布了:1.一种基于深度学习的病案文字识别方法,其特征在于,包括: 对原始病案图像进行预处理,分别使用Canny边缘检测算法和Hough直线检测算法对图像进行边缘检测和角度校正; 对预处理后图像的文本区域进行标注,得到文本检测训练数据集; 使用DBNet网络对图片进行检测,获取图片中文本区域的边界框位置坐标; 构建改进的SVTR模型,对文本检测到的区域提取特征,训练文字识别模型,包括: 输入文本检测后的数据集,根据检测标签切分图像; 将新的图像按照9:1的比例生成训练集和测试集,data_dir设置为新的数据集路径,label_file_list指向新的数据集标注文件; 将图像输入SVTR骨干网络中,输入图像尺寸为,使用两个连续3×3卷积和批量归一化来实现改进补丁嵌入得到大小的字符组件,这些字符组件用于表示字符笔画; 进入到第一阶段,将重塑到大小,然后将应用了层归一化LN,送入到全局混合或局部混合中,全局混合和局部混合模块使用根据应用场景不同设置也不同; 接下来,依次应用层归一化和一个多层感知机进行特征融合,将混合块重塑到的嵌入,然后,在高度维度上使用步长为2的3×3卷积,在宽度维度上使用步长为1的卷积,随后进行层归一化,生成尺寸为; 第一阶段出来后的字符组件尺寸为,第二阶段重复第一阶段的操作,出来后的字符组件尺寸为,在最后一个阶段,合并操作被合并操作所取代,先将高度维度池化为1,然后经过一个全连接层、非线性激活和dropout,将字符组件压缩为一个尺寸为特征序列; 最后,对进行并行线性预测并进行去重操作,得到字符序列; 采用文字识别模型对图片进行识别,获得病案图片中的字符内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人济南大学,其通讯地址为:250002 山东省济南市市中区南辛庄西路336号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。