Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 晓葆科技(上海)有限公司刘斌获国家专利权

晓葆科技(上海)有限公司刘斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉晓葆科技(上海)有限公司申请的专利基于OCR的医疗文档智能识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121095967B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511650707.1,技术领域涉及:G06V30/41;该发明授权基于OCR的医疗文档智能识别方法及系统是由刘斌;余彪;张圣煜;谢玲;徐佳怡设计研发完成,并于2025-11-12向国家知识产权局提交的专利申请。

基于OCR的医疗文档智能识别方法及系统在说明书摘要公布了:本发明公开了基于OCR的医疗文档智能识别方法及系统,涉及文档识别技术领域,包括通过移动终端采集医疗文档图像,基于采集图像,通过U‑Net结合多尺度特征融合与注意力机制生成二值图,并进行剪裁;基于剪裁二值图像,通过OCR模型提取文本信息,并根据医疗文档的排版规律和几何分布,提取结构化字段;对结构化数据执行确定性规则判断与风险评估。本发明通过标准灰度化处理降低图像计算复杂度,通过融合CBAM注意力机制的U‑Net结构提升文本区域特征提取精度,并结合AttentionGate实现多尺度特征的有效融合与噪声抑制,结合霍夫变换实现文本方向校正,提升了文本检测鲁棒性与识别准确率。

本发明授权基于OCR的医疗文档智能识别方法及系统在权利要求书中公布了:1.基于OCR的医疗文档智能识别方法,其特征在于:包括,通过移动终端采集医疗文档图像,基于采集图像,通过U‑Net结合多尺度特征融合与注意力机制生成二值图,并进行剪裁; 基于剪裁二值图像,通过OCR模型提取文本信息,并根据医疗文档的排版规律和几何分布,提取结构化字段; 对结构化数据执行确定性规则判断与风险评估,根据风险评估结果生成图文报告; 采用ITU‑R BT.601标准灰度转换公式将RGB彩色图像转换为单通道灰度图,将灰度图输入至U‑Net结构,并采用ResNet50作为编码器主干网络,当ResNet50编码器输出特征图后,通过CBAM模块对特征图分别进行通道与空间注意力增强,获得增强后的特征图,将增强后的特征图作为编码器输出,传递至对应分辨率的解码器分支进行上采样获得上采样后的特征图,在网络的跳跃连接处,通过1×1卷积将增强后的特征图和上采样后的特征图分别映射至相同通道维度,并使用Attention Gate机制计算空间注意力掩码; 通过空间注意力掩码生成融合特征图,通过Sigmoid激活函数将融合特征图转化为二值概率图,并采用Dice损失和BCE损失的加权组合获得损失函数,采用链式法则计算损失对每个权重的梯度,并根据梯度调整网络中的所有可学习参数,使损失函数值减小,进行重复迭代直到达到最大迭代次数,基于训练好的网络获得最终二值概率图,设定阈值,当像素点x,y的概率值大于等于阈值时,输出白色,否则为黑色,生成二值图像,对二值图像进行霍夫直线变换获得旋转校正后的二值图像,并进行轮廓检测获得裁剪后的二值图像; 对裁剪后的二值图像使用单尺度Retinex算法进行对比度增强,将初步增强后的图像依次进行自适应直方图均衡化、形态学闭运算、中值滤波、Sobel边缘增强与背景抑制获得最终增强图像,将最终增强图像输入至PP‑OCRv3模型,模型通过卷积主干网络提取多尺度特征,提取后的特征输入至两个并行的输出分支,分别获得文本得分图S与四点偏移回归图,并计算文本检测损失函数,对文本得分图S使用可微分二值化函数计算每个像素点属于文本区域的概率; 通过每个像素点的文本概率获得连续概率图P,对连续概率图P进行阈值化处理获得文本区域掩码,并通过8‑连通域分析方法对文本区域掩码进行分析,找出所有相互连接的区域,即文本实例区域,将每个文本实例区域中像素对应的四点偏移回归图,解码得到文本实例区域的四点坐标,并计算最小外接矩形的高度和宽度,设定阈值,当最小外接矩形的高度小于阈值时,则认为该区域过小,不是有效的文本块进行丢弃,对于每个有效的文本块进行透视变换生成标准化后的矩形图像块,将每个标准化图像块输入SVTR识别网络输出每个文本块的字符序列,并计算文本识别输出损失函数,结合文本检测损失函数计算总损失函数,通过反向传播算法计算梯度,使总损失函数最小化更新所有可学习参数,输出最终每个文本块的字符序列,并计算每个文本块的平均置信度,设定阈值,当平均置信度大于等于阈值时,则认为识别结果可靠,否则记录为低置信度文本,将检测与识别结果按空间顺序组合,形成完整的结构化文本序列; 将结构化文本序列按每个文本块的上边界升序排列,并计算相邻文本块之间的垂直间距,设定阈值,当垂直间距小于阈值时,则认为二者属于同一逻辑行,对同一逻辑行内的文本块,计算相邻框的水平间距,设定阈值,当水平间距小于阈值时,则将相邻文本块内容拼接为一个完整文本,最终得到逻辑行集合,从每个逻辑行中提取所有文本块的左边界坐标和右边界坐标,分别对所有左边界坐标和右边界坐标进行一维高斯平滑获得左、右平滑曲线、; 检测左、右平滑曲线、的局部最大值,取最大峰位置为“项目列中心”、“结果列中心”,根据医疗检验单三栏对称分布的几何先验,计算参考范围列中心,计算每个逻辑行内文本块的左边界与三个列中心的距离,将文本块分配至距离最小的列确定字段类型,将项目列文本与医学指标词典匹配,统一指标命名,从结果列文本中提取数值与单位,将参考范围列文本中的区间转为数值区间,将每行信息组合为标准化结构。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人晓葆科技(上海)有限公司,其通讯地址为:200335 上海市长宁区金钟路968号3号楼708室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。