上海高德威智能交通系统有限公司郭大山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海高德威智能交通系统有限公司申请的专利一种序列识别模型训练方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114254706B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111577279.6,技术领域涉及:G06F18/214;该发明授权一种序列识别模型训练方法、装置、电子设备及存储介质是由郭大山设计研发完成,并于2021-12-22向国家知识产权局提交的专利申请。
本一种序列识别模型训练方法、装置、电子设备及存储介质在说明书摘要公布了:本申请实施例提供了一种序列识别模型训练方法、装置、电子设备及存储介质。方案如下:获取多个无标签信息的第一样本数据;针对每一第一样本数据,基于预设学生模型得到第一预测序列;基于预设教师模型得到第一伪标签序列;基于预设可信度学习模型,确定第一伪标签序列中每一字符的第一可信度值;计算预设学生模型的第一损失值;基于第一损失值进行多次迭代,直至预设学生模型收敛,得到用于进行序列识别的序列识别模型。通过本申请实施例提供的技术方案,提高了确定出的伪标签序列中各字符的准确性,从而提高了训练得到的序列识别模型的准确性。
本发明授权一种序列识别模型训练方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种序列识别模型训练方法,其特征在于,所述方法包括: 从预设训练集中获取多个无标签信息的样本数据,作为第一样本数据; 针对每一第一样本数据,基于预设学生模型对该第一样本数据包含的文本进行识别,得到该第一样本数据的第一预测序列; 基于预设教师模型对该第一样本数据包含的文本进行识别,得到该第一样本数据的第一伪标签序列; 基于预设可信度学习模型,确定该第一样本数据的第一伪标签序列中每一字符的第一可信度值,其中,一个字符的第一可信度值用于指示该字符为识别正确的字符的概率; 针对每一第一样本数据,基于该第一样本数据的第一预测序列与该第一样本数据的第一伪标签序列中各字符间的编辑距离,对该第一样本数据的第一伪标签序列中的字符进行错位矫正,得到该第一样本数据的第二伪标签序列; 根据每一第一样本数据的第一预测序列和第二伪标签序列,以及每一第一样本数据的第二伪标签序列中各字符的第二可信度值,计算所述预设学生模型的第一损失值;其中,每一第一样本数据的第二伪标签序列中各字符的第二可信度值,与该第一样本数据的伪标签序列中各字符的第一可信度值相同; 基于所述第一损失值进行多次迭代,直至所述预设学生模型收敛,得到用于进行序列识别的序列识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海高德威智能交通系统有限公司,其通讯地址为:201821 上海市嘉定区云谷路599弄6号620室J1452;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。