上海弘玑信息技术有限公司王雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海弘玑信息技术有限公司申请的专利文档分类方法、训练方法、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114782973B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210471751.6,技术领域涉及:G06V30/413;该发明授权文档分类方法、训练方法、设备和存储介质是由王雷;宋祺;张睿;燕鹏举;周健设计研发完成,并于2022-04-29向国家知识产权局提交的专利申请。
本文档分类方法、训练方法、设备和存储介质在说明书摘要公布了:本申请提供一种文档分类方法、训练方法、设备和存储介质,该方法包括:获取待处理文档图片的文本识别结果;根据所述文本识别结果和预设的模板库对所述待处理文档图片进行分类,输出所述待处理文档图片的分类结果,其中所述模板库中包括至少一种类型的文档模板。本申请实现了基于文本识别结果和模板库自动识别出文档图片所属的类型,解决了常规图片分类方法无法处理文档图片的弊端,提升了文档图片归类处理的业务场景自动化程度。
本发明授权文档分类方法、训练方法、设备和存储介质在权利要求书中公布了:1.一种文档模板的训练方法,其特征在于,包括:获取多个样本文档图片的样本文本识别结果和当前模板,其中,所述多个样本文档图片的文档类别相同,所述当前模板与所述多个样本文档图片的文档类别相同; 针对所述多个样本文档图片中的每一个样本文档图片,计算当前样本文档图片中的第k个样本文本行与所述当前模板中每个文本行之间的重叠度,并判断最大重叠度是否大于第一阈值,其中k为正整数; 当所述最大重叠度大于所述第一阈值时,计算第k个样本文本行与最大重叠度文本行之间的文本相似度,所述最大重叠度文本行为所述最大重叠度对应的所述当前模板中的文本行; 判断所述文本相似度是否大于第二阈值; 当所述文本相似度大于所述第二阈值时,根据第k个样本文本行和所述最大重叠度文本行,更新所述当前模板,包括: 将所述第k个样本文本行与所述最大重叠度文本行进行加权求和,得到新的文本行,将新的所述文本行存放入所述当前模板中,以更新所述当前模板。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海弘玑信息技术有限公司,其通讯地址为:201240 上海市闵行区紫星路588号2幢13层055室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。