网易有道信息技术(北京)有限公司白志奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉网易有道信息技术(北京)有限公司申请的专利一种图像处理模型的训练方法及其相关产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114743208B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210348810.0,技术领域涉及:G06V30/413;该发明授权一种图像处理模型的训练方法及其相关产品是由白志奇;姜威;许彬;林辉;段亦涛设计研发完成,并于2022-04-01向国家知识产权局提交的专利申请。
本一种图像处理模型的训练方法及其相关产品在说明书摘要公布了:本发明的实施方式提供了一种图像处理模型的训练方法及其相关产品。所述图像处理模型包括识别模型,所述训练方法包括:获取训练图片,其中所述训练图片包括已标注的纯文本图片、纯公式图片和文本公式混排图片,所述标注包括根据适用于公式和文本的分词规则的分词;将所述训练图片输入到所述识别模型进行训练,以得到输出结果;根据所述训练图片中的所述标注和所述输出结果计算损失函数,以在反向传播中更新所述识别模型的参数。本发明的实施方式仅使用了一个模型,降低了资源消耗,提高了识别质量。此外,还提供了使用图像处理模型进行图像处理的方法,以及一种计算装置和计算机可读存储介质。
本发明授权一种图像处理模型的训练方法及其相关产品在权利要求书中公布了:1.一种图像处理模型的训练方法,其特征在于,所述图像处理模型包括识别模型,所述训练方法包括: 获取训练图片,其中所述训练图片包括已标注的纯文本图片、纯公式图片和文本公式混排图片,所述标注包括根据适用于公式和文本的分词规则的分词; 将所述训练图片输入到所述识别模型进行训练,以得到输出结果,其中所述识别模型包括特征提取器、编码器和解码器,所述编码器使用基于注意力机制的模型中的编码器部分,所述解码器采用全连接结构; 根据所述训练图片中的所述标注和所述输出结果计算损失函数,以在反向传播中更新所述识别模型的参数; 所述识别模型还包括分块模块和合并模块;所述训练方法还包括: 利用所述分块模块对所述训练图片进行分块,得到具有重叠部分的至少两张子图片,并且利用所述特征提取器和编码器对每张子图片分别进行处理;以及 利用所述合并模块对所述每张子图片进行处理得到的特征进行合并以得到第二特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人网易有道信息技术(北京)有限公司,其通讯地址为:100094 北京市海淀区西北旺东路10号院中关村软件园西区7号楼A座1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。