湖南大学林红利获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南大学申请的专利一种自顶向下和自底向上相结合的复杂表结构识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116110063B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211310147.1,技术领域涉及:G06V30/412;该发明授权一种自顶向下和自底向上相结合的复杂表结构识别方法是由林红利;陈佩佩设计研发完成,并于2022-10-25向国家知识产权局提交的专利申请。
本一种自顶向下和自底向上相结合的复杂表结构识别方法在说明书摘要公布了:本发明公开了一种复杂表结构识别方法,包括自顶向下的网格检测和自底向上的网格合并。方法由骨干网络、分割网络、RoIAlign和图注意力网络四个部分组成。表结构识别是文档自动化的核心问题,现有的表结构识别方法普遍存在对大表识别效果差、推理速度慢等问题。本发明通过卷积神经网络提取任意尺寸表格图像的特征;图注意力网络使得网格的合并变得高效简单;边界分隔符的引入有效降低了模型学习的难度。
本发明授权一种自顶向下和自底向上相结合的复杂表结构识别方法在权利要求书中公布了:1.一种复杂表结构识别方法,包括自顶向下的网格检测和自底向上的网格合并,其特征在于,包括以下步骤: 1图像预处理; 2获取图像的特征表达:将预处理后的图像送入在ImageNet上预训练过的全卷积神经网络进行特征提取,取32倍上采样后和原图大小相同的特征图作为图像的特征表达,记作P; 3分隔符检测:首先将步骤2中获取的特征向量送入多分支感受野块;然后,计算注意力系数并对特征进行加权求和;接着,对加权后的特征图进行行投影池化;最后激活和二值化,高于阈值的激活值被视为分隔符,置为1; 4后处理:将连续的分隔符像素聚集在一起,得到若干个分隔符段; 5初始图构建:对于M行N列的表格,存在|V|=M*N个顶点以及|E|=2M*N-M+N条边,顶点从左至右、从上到下的顺序编号,并根据顶点顺序依次给水平边和垂直边编号: 其中,V和E分别表示顶点集和边集,incidence用于记录顶点和边的关系,inci,j表示第i个顶点和第j条边的关系; 6提取顶点和边的特征:根据步骤2得到的表格图像特征表达P,使用RoIAlign分别对顶点和边提取R×R固定大小的对齐特征,记作node_features和edge_features: 其中,p是骨干网络提取的表格图像特征表达,node_rois和edge_rois分别是所有顶点和边构成的感兴趣区域集合; 7线性变换:将顶点和边的特征图转换为图网络所需要的特征向量的形式: 8信息交互:计算边到顶点图注意力和顶点到边图注意力来聚合更新顶点和边的特征: 9关系预测:根据上一步得到的边的特征向量edges,进行顶点间的关系预测,即边的分类,具体为: 10后处理:当合并后的单元格中存在L型时,删除非法单元格中的分数最低的边,直到不含L型单元格;当一行中大多数相邻的网格单元都存在边时,在该行断开的网格单元间添加合并边。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路1号湖南大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励