上海高德威智能交通系统有限公司徐博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海高德威智能交通系统有限公司申请的专利字符识别模型训练方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112241749B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:201910645222.1,技术领域涉及:G06V30/148;该发明授权字符识别模型训练方法、装置及设备是由徐博设计研发完成,并于2019-07-17向国家知识产权局提交的专利申请。
本字符识别模型训练方法、装置及设备在说明书摘要公布了:本发明提供一种字符识别模型训练方法、装置及设备,该方法包括:从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。可提升标注效率,进而提升模型训练效率。
本发明授权字符识别模型训练方法、装置及设备在权利要求书中公布了:1.一种字符识别模型训练方法,其特征在于,包括: 获取从指定场景中采集的图像,所述指定场景中字符的风格为指定风格; 从采集的每一图像中截取出字符区域,所述字符区域包含至少一个字符; 根据截取出的所有字符区域确定图像样本集; 从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;其中,当首次从图像样本集中选择未标注图像时,图像样本集中已标注图像的数量少于未标注图像的数量; 将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的; 针对输入至所述字符识别模型的每一未标注图像,依据该未标注图像的预测字符识别结果中的预测字符信息确定该未标注图像中各字符被预测的字符标签;其中,所述预测字符信息包括被预测的字符位置信息、以及字符内容;字符被预测的字符标签用来描述该字符的预测字符信息; 针对该未标注图像中每一字符,从该未标注图像中截取字符被预测出的字符标签中的字符位置信息对应的区域; 从各未标注图像中截取与字符被预测出的字符标签中的字符位置信息对应的区域,将截取出的区域按照预测出的字符内容分类显示给用户,每次显示同一字符内容的区域,以使用户查看显示的区域来判断该字符是否被预测出正确的字符标签; 若接收外部输入的指令携带的指示信息未指示该字符未被预测出正确的字符标签,则确定该字符标签为该字符的目标标签;若所述指令携带的指示信息指示该字符未被预测出正确的字符标签,则从所述指令携带的候选标签中选择一个候选标签,将选择的候选标签确定为该字符的目标标签; 依据该未标注图像中各字符的目标标签,对所述图像样本集中的该未标注图像进行标注,得到已标注图像; 根据所述图像样本集中的已标注图像训练所述字符识别模型; 检查当前是否满足设定的训练结束条件,若否,返回从图像样本集中选择未标注图像的操作,以进行迭代训练,若是,结束迭代训练,并将所述字符识别模型确定为目标字符识别模型; 其中,在经过若干次迭代训练之后,在迭代过程中标注出的已标注图像中被预测错误率较高的字符,再利用包含预测错误率较高的字符的图像对所述字符识别模型进行优化,以得到所述目标字符识别模型; 其中,从所述图像样本集中选择未标注图像,包括: 如果所述图像样本集中未标注图像的数量大于等于设定数量,从所述图像样本集中选择设定数量个未标注图像; 如果所述图像样本集中未标注图像的数量小于设定数量,从所述图像样本集中选择剩余所有未标注图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海高德威智能交通系统有限公司,其通讯地址为:201203 上海市浦东新区中国(上海)自由贸易试验区张东路1388号12幢102室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。