南京吾道知信信息技术有限公司王俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京吾道知信信息技术有限公司申请的专利一种富格式文档的图形识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114724165B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210477699.5,技术领域涉及:G06V30/414;该发明授权一种富格式文档的图形识别方法和系统是由王俊;乔美萱;向俊夫;侯启予设计研发完成,并于2022-05-05向国家知识产权局提交的专利申请。
本一种富格式文档的图形识别方法和系统在说明书摘要公布了:本发明公开了一种富格式文档的图形识别方法和系统,属于图形识别技术领域,所述方法包括:识别文档页面中图形的区域和类别;基于所述图形类别,获得图形区域中的对象,所述对象包括:形状对象、文本块和连线;根据文本块所在的位置,建立文本块与形状对象或连线的关联;根据连线的端点,找到连线的邻近对象;根据连线的类别,将相邻连线进行整合,获得整合连线;建立所述整合连线、邻近形状对象和文本块的关联,并获得结构化信息。图形类别不同,对象的形式和连接形式不同,基于图形类别的图形识别,可以有效提高识别的准确性;根据连线的类别,将连线的各个连线进行整合,获得整合连线,利于识别复杂图形中对象之间连接关系。
本发明授权一种富格式文档的图形识别方法和系统在权利要求书中公布了:1.一种富格式文档的图形识别方法,其特征在于,所述方法包括: 识别文档页面中图形的区域和类别; 基于所述图形类别,获得图形区域中的对象,所述对象包括:形状对象、文本块和连线; 根据文本块所在的位置,建立文本块与形状对象或连线的关联; 根据连线的端点,找到连线的邻近对象,所述邻近对象包括邻近连线和邻近形状对象; 根据连线的类别,将相邻连线进行整合,获得整合连线; 建立所述整合连线、邻近形状对象和文本块的关联,并获得结构化信息; 其中,通过机器学习的方法识别图形类别,包括: 识别文档页面的视觉特征; 获取页面中对象在视觉特征中的候选框; 所述候选框池化后,通过神经网络获得边框和粗分类; 根据所述粗分类,获得图形的边框或对象; 所述图形的视觉特征上采样或多尺度视觉特征融合后上采样,获得第二特征图; 获得所述边框相应的精细特征; 针对所述精细特征,在图形的相应范围内提取文本特征; 根据所述精细特征和文本特征,分别获得视觉向量和文本向量; 将所述视觉向量和文本向量拼接后,通过多层感知机进行分类,获得图形类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京吾道知信信息技术有限公司,其通讯地址为:211100 江苏省南京市江宁区东麒路33号东山国际企业总部园E座307;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。