华南理工大学;广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院)黄双萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学;广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院)申请的专利一种用于医疗文档OCR识别的噪声鲁棒主动学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116563867B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310533619.8,技术领域涉及:G06V30/41;该发明授权一种用于医疗文档OCR识别的噪声鲁棒主动学习方法是由黄双萍;罗钰;黄森;侯宇;王穗林;林方政;林定坤设计研发完成,并于2023-05-12向国家知识产权局提交的专利申请。
本一种用于医疗文档OCR识别的噪声鲁棒主动学习方法在说明书摘要公布了:本发明公开了一种用于医疗文档OCR识别的噪声鲁棒主动学习方法,包括:在主动学习样本筛选阶段,该算法首先采用基于最小置信度的筛选方法,通过累乘得到序列整体置信度作为指标,筛选出一批高度不确定的有价值样本;然后,在迭代训练阶段,设计动态噪声标签校正损失函数,该算法在原识别损失基础上引入正则项用以鼓励样本预测概率分布朝着低熵的方向变化,获得一个确信的预测用于校正噪声标签;进一步,算法设计一个动态调控函数控制正则项,在前期分配给使用真实标签的识别损失项更高的权重,而后期则将权重更多地分配到熵最小化项上,鼓励信任低熵预测概率分布,以达到动态校正噪声标签目的。
本发明授权一种用于医疗文档OCR识别的噪声鲁棒主动学习方法在权利要求书中公布了:1.一种用于医疗文档OCR识别的噪声鲁棒主动学习方法,其特征在于,包括以下步骤: 步骤1,构建基于深度学习的医疗文档OCR识别模型,在初始标注数据集基础上训练医疗文档OCR识别模型θ0; 步骤2,使用训练得到的识别模型对未标注样本池中的每一个样本进行预测,并计算样本对应的置信度,根据置信度分数进行降序排序,筛选出置信度最小的前a%的样本; 步骤3,将筛选出的样本交给人工进行标注; 步骤4,将标注后的样本加入标注数据集,同时将标注后的样本数据从未标注样本池中移除; 步骤5,使用更新后的标注数据集迭代训练识别模型,并且在训练过程中使用动态噪声标签校正损失函数,指导对噪声标签的概率分布的隐式校正,并使用校正后的概率分布作为训练监督信号; 步骤6,迭代训练识别模型θn; 步骤7,将步骤2‑步骤6重复N次,直至识别模型达到预定准确率或者标注成本达到上限,停止主动学习,输出最终识别模型θN。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学;广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院),其通讯地址为:510000 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励